या साइटवरील सामग्री कृत्रिम बुद्धिमत्ता (AI) किंवा मशीन भाषांतर तंत्रज्ञानाचा वापर करून भाषांतरित केली आहे आणि त्यात त्रुटी असू शकतात.

Skip to content
Speech & Audio

समकालीन भाषण अनुवादासाठी कालातीत-जागरूक नेटवर्कसह नियमित एन्ट्रॉपी माहिती अनुकूलन

View Publication

Author

जोसेफ लियू, नामीर हर्शकिंड, शियाओ यु, महेश कुमार नंदवाना

Venue

इंटरस्पीच २०२६

Abstract

समवर्ती भाषण अनुवाद (SimulST) उच्च अनुवाद गुणवत्ता आणि कमी विलंब यात संतुलन साधण्याची मागणी करतो. अलीकडील कामात REINA सादर करण्यात आली, ही पद्धत अधिक ऑडिओ वाचल्यावर मिळणाऱ्या माहितीच्या वाढीचा अंदाज लावून Read/Write धोरण तयार करते. तथापि, आम्हाला आढळले की माहिती-आधारित धोरणांमध्ये अनेकदा कालांतरातील संदर्भाचा अभाव असतो, ज्यामुळे धोरण लिहिण्यास सुरुवात करण्यापूर्वी बहुतेक ऑडिओ वाचण्याकडे कल धरते. आम्ही REINA ला दोन भिन्न धोरणांचा वापर करून सुधारित करतो: एक पर्यवेक्षित संरेखन नेटवर्क (REINA-SAN) आणि एक टाइमस्टेप-वर्धित नेटवर्क (REINA-TAN). आमच्या निकालांनुसार, दोन्ही पद्धती बेसलाइनपेक्षा लक्षणीयरीत्या चांगली कामगिरी करतात आणि स्थिरतेच्या समस्यांचे निराकरण करतात, परंतु REINA-TAN स्ट्रीमिंग कार्यक्षमतेसाठी किंचित श्रेष्ठ पॅरेटो फ्रंटियर प्रदान करते, तर REINA-SAN 'रीड लूप्स' विरुद्ध अधिक दृढता प्रदान करते. व्हिस्परवर लागू केल्यावर, दोन्ही पद्धतींनी विद्यमान स्पर्धात्मक बेसलाइनच्या तुलनेत सामान्यीकृत स्ट्रीमिंग कार्यक्षमता (NoSE) गुणांद्वारे मोजल्या जाणाऱ्या स्ट्रीमिंग कार्यक्षमतेच्या पॅरेटो फ्रंटियरमध्ये 7.1% पर्यंत सुधारणा केली आहे.