VI3NR: การเริ่มต้นแบบคำนึงถึงความแปรปรวนสำหรับการแทนด้วยประสาทเทียมแบบแฝง
Author
Venue
CVPR 2025
Abstract
การแทนค่าด้วยระบบประสาทแบบแฝง (Implicit Neural Representations หรือ INRs) เป็นเครื่องมือที่หลากหลายและทรงพลังสำหรับการเข้ารหัสข้อมูลในรูปแบบต่างๆ รวมถึงภาพ วิดีโอ เสียง และรูปทรงสามมิติ ปัจจัยสำคัญต่อความสำเร็จของ INRs คือการเริ่มต้นเครือข่าย ซึ่งสามารถส่งผลกระทบอย่างมีนัยสำคัญต่อการบรรจบกันและความแม่นยำของโมเดลที่เรียนรู้ น่าเสียดายที่การเริ่มต้นเครือข่ายประสาทเทียมที่ใช้กันทั่วไปไม่สามารถนำไปใช้ได้กับฟังก์ชันการกระตุ้นหลายประเภท โดยเฉพาะอย่างยิ่งที่ใช้โดย INRs ในบทความนี้ เราได้ปรับปรุงวิธีการเริ่มต้นก่อนหน้าโดยการหาค่าเริ่มต้นที่มีความแปรปรวนคงที่ในแต่ละชั้น และสามารถใช้ได้กับฟังก์ชันการกระตุ้นใด ๆ เราแสดงให้เห็นว่าวิธีนี้สามารถนำไปใช้ได้กับวิธีการเริ่มต้นก่อนหน้าหลายวิธี และมีความเสถียรที่ดีกว่าสำหรับฟังก์ชันการกระตุ้นที่ได้รับการศึกษาอย่างดี เรายังแสดงให้เห็นว่าการเริ่มต้นของเราส่งผลให้ผลลัพธ์ดีขึ้นเมื่อใช้ฟังก์ชันการกระตุ้น INR ในหลายรูปแบบของสัญญาณ วิธีการของเรามีประสิทธิภาพเป็นพิเศษสำหรับ INR แบบ Gaussian ซึ่งเราแสดงให้เห็นว่าทฤษฎีของการเริ่มต้นของเราสอดคล้องกับประสิทธิภาพของงานในการทดลองหลายครั้ง ทำให้เราสามารถปรับปรุงการสร้างภาพ เสียง และการสร้างพื้นผิว 3 มิติได้
