VI3NR: Inizializzazione informata sulla varianza per rappresentazioni neurali implicite

Share

Author

Chamin Hewa Koneputugodage (Università Nazionale Australiana), Yizhak Ben-Shabat (Università Nazionale Australiana e Roblox), Sameera Ramasinghe (Pluralis AI), Stephen Gould (Università Nazionale Australiana)

Venue

CVPR 2025

Abstract

Le rappresentazioni neurali implicite (INR) sono uno strumento versatile e potente per la codifica di varie forme di dati, tra cui immagini, video, suoni e forme 3D. Un fattore critico per il successo delle INR è l'inizializzazione della rete, che può influire in modo significativo sulla convergenza e sull'accuratezza del modello appreso. Sfortunatamente, le inizializzazioni delle reti neurali comunemente utilizzate non sono ampiamente applicabili a molte funzioni di attivazione, specialmente quelle utilizzate dalle INR. In questo articolo, miglioriamo i precedenti metodi di inizializzazione derivando un'inizializzazione che presenta una varianza stabile tra i livelli e si applica a qualsiasi funzione di attivazione. Dimostriamo che ciò generalizza molti metodi di inizializzazione precedenti e offre una stabilità ancora maggiore per le attivazioni ben studiate. Dimostriamo inoltre che la nostra inizializzazione porta a risultati migliori con le funzioni di attivazione INR in diverse modalità di segnale. Il nostro approccio è particolarmente efficace per le INR gaussiane, dove dimostriamo che la teoria della nostra inizializzazione corrisponde alle prestazioni del compito in diversi esperimenti, consentendoci di ottenere miglioramenti nella ricostruzione di immagini, audio e superfici 3D.

Unisciti a noi per plasmare il futuro

Visualizza tutti i lavori

Recenti

Altri risultati

VI3NR: Inizializzazione informata sulla varianza per rappresentazioni neurali implicite

Author

Venue

Abstract

Unisciti a noi per plasmare il futuro

VI3NR: Inizializzazione informata sulla varianza per rappresentazioni neurali implicite

Author

Venue

Abstract

Related Publications

CubePart: un generatore 3D a vocabolario aperto e controllabile per parti

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

Catalog-Native LLM: Dialetto ID elemento vocale con minore intrico per la raccomandazione

Unisciti a noi per plasmare il futuro