Konten di situs ini telah diterjemahkan menggunakan kecerdasan buatan (AI) atau teknologi penerjemahan mesin, dan mungkin terdapat kesalahan.

Skip to content
3D
Artificial Intelligence
Computer Vision

VI3NR: Inisialisasi Berbasis Varian untuk Representasi Neural Implisit

View Publication

Author

Chamin Hewa Koneputugodage (Universitas Nasional Australia), Yizhak Ben-Shabat (Universitas Nasional Australia dan Roblox), Sameera Ramasinghe (Pluralis AI), Stephen Gould (Universitas Nasional Australia)

Venue

CVPR 2025

Abstract

Representasi Neural Implisit (INR) adalah alat yang serbaguna dan kuat untuk mengkodekan berbagai bentuk data, termasuk gambar, video, suara, dan bentuk 3D. Faktor penting dalam keberhasilan INR adalah inisialisasi jaringan, yang dapat secara signifikan memengaruhi konvergensi dan akurasi model yang dipelajari. Sayangnya, inisialisasi jaringan saraf yang umum digunakan tidak dapat diterapkan secara luas untuk banyak fungsi aktivasi, terutama yang digunakan oleh INRs. Dalam makalah ini, kami memperbaiki metode inisialisasi sebelumnya dengan mengembangkan inisialisasi yang memiliki varians stabil di seluruh lapisan, dan berlaku untuk fungsi aktivasi apa pun. Kami menunjukkan bahwa ini menggeneralisasi banyak metode inisialisasi sebelumnya, dan memiliki stabilitas yang lebih baik untuk fungsi aktivasi yang telah banyak diteliti. Kami juga menunjukkan bahwa inisialisasi kami menghasilkan hasil yang lebih baik dengan fungsi aktivasi INR dalam berbagai modalitas sinyal. Pendekatan kami sangat efektif untuk INR Gaussian, di mana kami menunjukkan bahwa teori inisialisasi kami sesuai dengan kinerja tugas dalam berbagai eksperimen, sehingga memungkinkan kami mencapai peningkatan dalam rekonstruksi gambar, audio, dan permukaan 3D.