समकालीन भाषण अनुवादासाठी कालातीत-जागरूक नेटवर्कसह नियमित एन्ट्रॉपी माहिती अनुकूलन
Author
Venue
इंटरस्पीच २०२६
Abstract
समवर्ती भाषण अनुवाद (SimulST) उच्च अनुवाद गुणवत्ता आणि कमी विलंब यात संतुलन साधण्याची मागणी करतो. अलीकडील कामात REINA सादर करण्यात आली, ही पद्धत अधिक ऑडिओ वाचल्यावर मिळणाऱ्या माहितीच्या वाढीचा अंदाज लावून Read/Write धोरण तयार करते. तथापि, आम्हाला आढळले की माहिती-आधारित धोरणांमध्ये अनेकदा कालांतरातील संदर्भाचा अभाव असतो, ज्यामुळे धोरण लिहिण्यास सुरुवात करण्यापूर्वी बहुतेक ऑडिओ वाचण्याकडे कल धरते. आम्ही REINA ला दोन भिन्न धोरणांचा वापर करून सुधारित करतो: एक पर्यवेक्षित संरेखन नेटवर्क (REINA-SAN) आणि एक टाइमस्टेप-वर्धित नेटवर्क (REINA-TAN). आमच्या निकालांनुसार, दोन्ही पद्धती बेसलाइनपेक्षा लक्षणीयरीत्या चांगली कामगिरी करतात आणि स्थिरतेच्या समस्यांचे निराकरण करतात, परंतु REINA-TAN स्ट्रीमिंग कार्यक्षमतेसाठी किंचित श्रेष्ठ पॅरेटो फ्रंटियर प्रदान करते, तर REINA-SAN 'रीड लूप्स' विरुद्ध अधिक दृढता प्रदान करते. व्हिस्परवर लागू केल्यावर, दोन्ही पद्धतींनी विद्यमान स्पर्धात्मक बेसलाइनच्या तुलनेत सामान्यीकृत स्ट्रीमिंग कार्यक्षमता (NoSE) गुणांद्वारे मोजल्या जाणाऱ्या स्ट्रीमिंग कार्यक्षमतेच्या पॅरेटो फ्रंटियरमध्ये 7.1% पर्यंत सुधारणा केली आहे.
