เนื้อหาในเว็บไซต์นี้ได้รับการแปลโดยใช้ปัญญาประดิษฐ์ (AI) หรือเทคโนโลยีการแปลด้วยเครื่อง และอาจมีข้อผิดพลาด

Skip to content
3D
Artificial Intelligence
Computer Vision

VI3NR: การเริ่มต้นแบบคำนึงถึงความแปรปรวนสำหรับการแทนด้วยประสาทเทียมแบบแฝง

View Publication

Author

ชามิน เฮวา โคเนปูทูโกดาจ (มหาวิทยาลัยแห่งชาติออสเตรเลีย), ยิซัค เบน-ชาบัต (มหาวิทยาลัยแห่งชาติออสเตรเลียและ Roblox), สามีรา รามาสิงเฮ (Pluralis AI), สตีเฟน กูลด์ (มหาวิทยาลัยแห่งชาติออสเตรเลีย)

Venue

CVPR 2025

Abstract

การแทนค่าด้วยระบบประสาทแบบแฝง (Implicit Neural Representations หรือ INRs) เป็นเครื่องมือที่หลากหลายและทรงพลังสำหรับการเข้ารหัสข้อมูลในรูปแบบต่างๆ รวมถึงภาพ วิดีโอ เสียง และรูปทรงสามมิติ ปัจจัยสำคัญต่อความสำเร็จของ INRs คือการเริ่มต้นเครือข่าย ซึ่งสามารถส่งผลกระทบอย่างมีนัยสำคัญต่อการบรรจบกันและความแม่นยำของโมเดลที่เรียนรู้ น่าเสียดายที่การเริ่มต้นเครือข่ายประสาทเทียมที่ใช้กันทั่วไปไม่สามารถนำไปใช้ได้กับฟังก์ชันการกระตุ้นหลายประเภท โดยเฉพาะอย่างยิ่งที่ใช้โดย INRs ในบทความนี้ เราได้ปรับปรุงวิธีการเริ่มต้นก่อนหน้าโดยการหาค่าเริ่มต้นที่มีความแปรปรวนคงที่ในแต่ละชั้น และสามารถใช้ได้กับฟังก์ชันการกระตุ้นใด ๆ เราแสดงให้เห็นว่าวิธีนี้สามารถนำไปใช้ได้กับวิธีการเริ่มต้นก่อนหน้าหลายวิธี และมีความเสถียรที่ดีกว่าสำหรับฟังก์ชันการกระตุ้นที่ได้รับการศึกษาอย่างดี เรายังแสดงให้เห็นว่าการเริ่มต้นของเราส่งผลให้ผลลัพธ์ดีขึ้นเมื่อใช้ฟังก์ชันการกระตุ้น INR ในหลายรูปแบบของสัญญาณ วิธีการของเรามีประสิทธิภาพเป็นพิเศษสำหรับ INR แบบ Gaussian ซึ่งเราแสดงให้เห็นว่าทฤษฎีของการเริ่มต้นของเราสอดคล้องกับประสิทธิภาพของงานในการทดลองหลายครั้ง ทำให้เราสามารถปรับปรุงการสร้างภาพ เสียง และการสร้างพื้นผิว 3 มิติได้