या साइटवरील सामग्री कृत्रिम बुद्धिमत्ता (AI) किंवा मशीन भाषांतर तंत्रज्ञानाचा वापर करून भाषांतरित केली आहे आणि त्यात त्रुटी असू शकतात.

Skip to content
3D
Artificial Intelligence
Computer Vision

VI3NR: निहित न्यूरल प्रतिनिधित्वांसाठी विचलनाधारित प्रारंभिकीकरण

View Publication

Author

चामिन हेवा कोनेपुतुगोडागे (द ऑस्ट्रेलियन नॅशनल युनिव्हर्सिटी), यिझाक बेन-शबात (द ऑस्ट्रेलियन नॅशनल युनिव्हर्सिटी आणि रॉब्लॉक्स), समीरा रामासिंघे (प्लुरालिस एआय), स्टीफन गोल्ड (द ऑस्ट्रेलियन नॅशनल युनिव्हर्सिटी)

Venue

CVPR 2025

Abstract

Implicit Neural Representations (INRs) ही प्रतिमा, व्हिडिओ, ध्वनी आणि 3D आकार यांसारख्या विविध प्रकारच्या डेटाचे एन्कोडिंग करण्यासाठी एक बहुपयोगी आणि सामर्थ्यवान साधन आहे. INRs च्या यशात नेटवर्कच्या आरंभीकरण (initialization) हा एक महत्त्वाचा घटक आहे, ज्याचा शिकलेल्या मॉडेलच्या अभिसरण (convergence) आणि अचूकतेवर लक्षणीय परिणाम होतो. दुर्दैवाने, सामान्यतः वापरल्या जाणाऱ्या न्यूरल नेटवर्कच्या आरंभीकरण पद्धती अनेक सक्रियण कार्यांसाठी, विशेषतः INR मध्ये वापरल्या जाणाऱ्या कार्यांसाठी, व्यापकपणे लागू होत नाहीत. या पेपरमध्ये, आम्ही पूर्वीच्या आरंभीकरण पद्धतींमध्ये सुधारणा करून अशी आरंभीकरण पद्धत मांडतो जी थरांमध्ये स्थिर विचलन (stable variance) राखते आणि कोणत्याही सक्रियण कार्यावर लागू होते. आम्ही दाखवतो की ही पद्धत अनेक पूर्वीच्या आरंभीकरण पद्धतींना सामान्य स्वरूप देते, आणि चांगल्या प्रकारे अभ्यासलेल्या सक्रियण कार्यांसाठी तर आणखी चांगली स्थिरता प्रदान करते. आम्ही असेही दाखवतो की आमच्या प्रारंभीकरणामुळे अनेक सिग्नल माध्यमांमध्ये INR सक्रियण कार्यांसह सुधारित निकाल मिळतात. आमचा दृष्टिकोन विशेषतः गॉसियन INR साठी प्रभावी आहे, जिथे आम्ही दाखवतो की आमच्या प्रारंभीकरणाचा सिद्धांत अनेक प्रयोगांमध्ये कार्यप्रदर्शनाशी जुळतो, ज्यामुळे आम्हाला प्रतिमा, ऑडिओ आणि 3D पृष्ठभाग पुनर्रचनेत सुधारणा साध्य करता येतात.