समवर्ती भाषण अनुवाद के लिए समय-जागरूक नेटवर्कों के साथ नियमितीकृत एंट्रॉपी सूचना अनुकूलन
Author
Venue
इंटरस्पीच 2026
Abstract
समानांतर भाषण अनुवाद (SimulST) में उच्च अनुवाद गुणवत्ता और कम विलंबता के बीच संतुलन आवश्यक है। हाल के कार्य में REINA पेश किया गया, एक ऐसी विधि जो अधिक ऑडियो पढ़ने से होने वाले सूचना लाभ का अनुमान लगाकर एक रीड/राइट नीति को प्रशिक्षित करती है। हालांकि, हमने पाया कि सूचना-आधारित नीतियों में अक्सर समयगत संदर्भ की कमी होती है, जिससे नीति लिखना शुरू करने से पहले अधिकांश ऑडियो पढ़ने की ओर झुक जाती है। हम दो अलग-अलग रणनीतियों का उपयोग करके REINA में सुधार करते हैं: एक सुपरवाइज्ड एलाइनमेंट नेटवर्क (REINA-SAN) और एक टाइमस्टेप-ऑगमेंटेड नेटवर्क (REINA-TAN)। हमारे परिणाम दर्शाते हैं कि जबकि दोनों विधियाँ बेसलाइन से काफी बेहतर प्रदर्शन करती हैं और स्थिरता के मुद्दों को हल करती हैं, REINA-TAN स्ट्रीमिंग दक्षता के लिए थोड़ा बेहतर पेरेटो फ्रंटियर प्रदान करता है, जबकि REINA-SAN 'रीड लूप्स' के खिलाफ अधिक मजबूती प्रदान करता है। व्हिस्पर पर लागू करने पर, दोनों विधियाँ मौजूदा प्रतिस्पर्धी बेसलाइनों की तुलना में सामान्यीकृत स्ट्रीमिंग दक्षता (NoSE) स्कोर द्वारा मापी गई स्ट्रीमिंग दक्षता के पेरेटो फ्रंटियर को 7.1% तक बेहतर करती हैं।
