VI3NR: निहित न्यूरल प्रतिनिधित्वांसाठी विचलनाधारित प्रारंभिकीकरण
Author
Venue
CVPR 2025
Abstract
Implicit Neural Representations (INRs) ही प्रतिमा, व्हिडिओ, ध्वनी आणि 3D आकार यांसारख्या विविध प्रकारच्या डेटाचे एन्कोडिंग करण्यासाठी एक बहुपयोगी आणि सामर्थ्यवान साधन आहे. INRs च्या यशात नेटवर्कच्या आरंभीकरण (initialization) हा एक महत्त्वाचा घटक आहे, ज्याचा शिकलेल्या मॉडेलच्या अभिसरण (convergence) आणि अचूकतेवर लक्षणीय परिणाम होतो. दुर्दैवाने, सामान्यतः वापरल्या जाणाऱ्या न्यूरल नेटवर्कच्या आरंभीकरण पद्धती अनेक सक्रियण कार्यांसाठी, विशेषतः INR मध्ये वापरल्या जाणाऱ्या कार्यांसाठी, व्यापकपणे लागू होत नाहीत. या पेपरमध्ये, आम्ही पूर्वीच्या आरंभीकरण पद्धतींमध्ये सुधारणा करून अशी आरंभीकरण पद्धत मांडतो जी थरांमध्ये स्थिर विचलन (stable variance) राखते आणि कोणत्याही सक्रियण कार्यावर लागू होते. आम्ही दाखवतो की ही पद्धत अनेक पूर्वीच्या आरंभीकरण पद्धतींना सामान्य स्वरूप देते, आणि चांगल्या प्रकारे अभ्यासलेल्या सक्रियण कार्यांसाठी तर आणखी चांगली स्थिरता प्रदान करते. आम्ही असेही दाखवतो की आमच्या प्रारंभीकरणामुळे अनेक सिग्नल माध्यमांमध्ये INR सक्रियण कार्यांसह सुधारित निकाल मिळतात. आमचा दृष्टिकोन विशेषतः गॉसियन INR साठी प्रभावी आहे, जिथे आम्ही दाखवतो की आमच्या प्रारंभीकरणाचा सिद्धांत अनेक प्रयोगांमध्ये कार्यप्रदर्शनाशी जुळतो, ज्यामुळे आम्हाला प्रतिमा, ऑडिओ आणि 3D पृष्ठभाग पुनर्रचनेत सुधारणा साध्य करता येतात.
