VI3NR: การเริ่มต้นแบบคำนึงถึงความแปรปรวนสำหรับการแทนด้วยประสาทเทียมแบบแฝง

Share

Author

ชามิน เฮวา โคเนปูทูโกดาจ (มหาวิทยาลัยแห่งชาติออสเตรเลีย), ยิซัค เบน-ชาบัต (มหาวิทยาลัยแห่งชาติออสเตรเลียและ Roblox), สามีรา รามาสิงเฮ (Pluralis AI), สตีเฟน กูลด์ (มหาวิทยาลัยแห่งชาติออสเตรเลีย)

Venue

CVPR 2025

Abstract

การแทนค่าด้วยระบบประสาทแบบแฝง (Implicit Neural Representations หรือ INRs) เป็นเครื่องมือที่หลากหลายและทรงพลังสำหรับการเข้ารหัสข้อมูลในรูปแบบต่างๆ รวมถึงภาพ วิดีโอ เสียง และรูปทรงสามมิติ ปัจจัยสำคัญต่อความสำเร็จของ INRs คือการเริ่มต้นเครือข่าย ซึ่งสามารถส่งผลกระทบอย่างมีนัยสำคัญต่อการบรรจบกันและความแม่นยำของโมเดลที่เรียนรู้ น่าเสียดายที่การเริ่มต้นเครือข่ายประสาทเทียมที่ใช้กันทั่วไปไม่สามารถนำไปใช้ได้กับฟังก์ชันการกระตุ้นหลายประเภท โดยเฉพาะอย่างยิ่งที่ใช้โดย INRs ในบทความนี้ เราได้ปรับปรุงวิธีการเริ่มต้นก่อนหน้าโดยการหาค่าเริ่มต้นที่มีความแปรปรวนคงที่ในแต่ละชั้น และสามารถใช้ได้กับฟังก์ชันการกระตุ้นใด ๆ เราแสดงให้เห็นว่าวิธีนี้สามารถนำไปใช้ได้กับวิธีการเริ่มต้นก่อนหน้าหลายวิธี และมีความเสถียรที่ดีกว่าสำหรับฟังก์ชันการกระตุ้นที่ได้รับการศึกษาอย่างดี เรายังแสดงให้เห็นว่าการเริ่มต้นของเราส่งผลให้ผลลัพธ์ดีขึ้นเมื่อใช้ฟังก์ชันการกระตุ้น INR ในหลายรูปแบบของสัญญาณ วิธีการของเรามีประสิทธิภาพเป็นพิเศษสำหรับ INR แบบ Gaussian ซึ่งเราแสดงให้เห็นว่าทฤษฎีของการเริ่มต้นของเราสอดคล้องกับประสิทธิภาพของงานในการทดลองหลายครั้ง ทำให้เราสามารถปรับปรุงการสร้างภาพ เสียง และการสร้างพื้นผิว 3 มิติได้

มาร่วมกับเราในการสร้างอนาคต

ดูงานทั้งหมด

ล่าสุด

ผลลัพธ์เพิ่มเติม

VI3NR: การเริ่มต้นแบบคำนึงถึงความแปรปรวนสำหรับการแทนด้วยประสาทเทียมแบบแฝง

Author

Venue

Abstract

มาร่วมกับเราในการสร้างอนาคต

VI3NR: การเริ่มต้นแบบคำนึงถึงความแปรปรวนสำหรับการแทนด้วยประสาทเทียมแบบแฝง

Author

Venue

Abstract

Related Publications

CubePart: เครื่องสร้าง 3 มิติแบบควบคุมส่วนด้วยคำศัพท์เปิด

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

Catalog-Native LLM: การพูดภาษาถิ่นของรหัสไอเท็มด้วยการพันกันน้อยลงเพื่อการแนะนำ

มาร่วมกับเราในการสร้างอนาคต