इस साइट की सामग्री का अनुवाद कृत्रिम बुद्धिमत्ता (AI) या मशीन अनुवाद तकनीक का उपयोग करके किया गया है, और इसमें त्रुटियाँ हो सकती हैं.

Skip to content
Speech & Audio

समवर्ती भाषण अनुवाद के लिए समय-जागरूक नेटवर्कों के साथ नियमितीकृत एंट्रॉपी सूचना अनुकूलन

View Publication

Author

जोसेफ लियू, नामीर हर्शकिंड, शियाओ यू, महेश कुमार नंदवाना

Venue

इंटरस्पीच 2026

Abstract

समानांतर भाषण अनुवाद (SimulST) में उच्च अनुवाद गुणवत्ता और कम विलंबता के बीच संतुलन आवश्यक है। हाल के कार्य में REINA पेश किया गया, एक ऐसी विधि जो अधिक ऑडियो पढ़ने से होने वाले सूचना लाभ का अनुमान लगाकर एक रीड/राइट नीति को प्रशिक्षित करती है। हालांकि, हमने पाया कि सूचना-आधारित नीतियों में अक्सर समयगत संदर्भ की कमी होती है, जिससे नीति लिखना शुरू करने से पहले अधिकांश ऑडियो पढ़ने की ओर झुक जाती है। हम दो अलग-अलग रणनीतियों का उपयोग करके REINA में सुधार करते हैं: एक सुपरवाइज्ड एलाइनमेंट नेटवर्क (REINA-SAN) और एक टाइमस्टेप-ऑगमेंटेड नेटवर्क (REINA-TAN)। हमारे परिणाम दर्शाते हैं कि जबकि दोनों विधियाँ बेसलाइन से काफी बेहतर प्रदर्शन करती हैं और स्थिरता के मुद्दों को हल करती हैं, REINA-TAN स्ट्रीमिंग दक्षता के लिए थोड़ा बेहतर पेरेटो फ्रंटियर प्रदान करता है, जबकि REINA-SAN 'रीड लूप्स' के खिलाफ अधिक मजबूती प्रदान करता है। व्हिस्पर पर लागू करने पर, दोनों विधियाँ मौजूदा प्रतिस्पर्धी बेसलाइनों की तुलना में सामान्यीकृत स्ट्रीमिंग दक्षता (NoSE) स्कोर द्वारा मापी गई स्ट्रीमिंग दक्षता के पेरेटो फ्रंटियर को 7.1% तक बेहतर करती हैं।