இந்த தளத்தின் உள்ளடக்கம் செயற்கை நுண்ணறிவு (AI) அல்லது இயந்திர மொழிபெயர்ப்பு தொழில்நுட்பம் மூலம் மொழிபெயர்க்கப்பட்டுள்ளது; பிழைகள் இருக்கலாம்.

Skip to content
Speech & Audio

ஒரே நேரத்தில் பேச்சு மொழிபெயர்ப்பிற்காக, கால உணர்வு வலையமைப்புகளுடன் சீரமைக்கப்பட்ட என்ட்ராபி தகவல் ஏற்பு

View Publication

Author

ஜோசப் லியு, நமீர் ஹிர்ஷ்கிண்ட், ஷியாவோ யூ, மகேஷ் குமார் நந்தவனா

Venue

இன்டர்ஸ்பீச் 2026

Abstract

ஒரே நேரத்தில் பேச்சு மொழிபெயர்ப்பு (SimulST) என்பது உயர் மொழிபெயர்ப்புத் தரம் மற்றும் குறைந்த தாமதம் ஆகியவற்றைச் சமநிலைப்படுத்துவதைக் கோருகிறது. சமீபத்திய ஆய்வானது REINA-ஐ அறிமுகப்படுத்தியது, இது அதிக ஆடியோவைக் கேட்பதன் தகவல் ஆதாயத்தை மதிப்பிடுவதை அடிப்படையாகக் கொண்டு ஒரு படிக்க/எழுத (Read/Write) கொள்கையைப் பயிற்றுவிக்கும் ஒரு முறையாகும். இருப்பினும், தகவல் அடிப்படையிலான கொள்கைகளுக்கு பெரும்பாலும் கால இடைவெளிச் சூழல் இருப்பதில்லை என்பதை நாங்கள் கண்டறிந்தோம், இது எழுதத் தொடங்குவதற்கு முன்பு பெரும்பாலான ஆடியோவைக் கேட்கும் பட்சத்தில் கொள்கையைத் தன்னைத்தானே சார்புபடுத்த வழிவகுக்கிறது. இரண்டு தனித்துவமான உத்திகளைப் பயன்படுத்தி நாங்கள் REINA-வை மேம்படுத்துகிறோம்: ஒரு மேற்பார்வையிடப்பட்ட சீரமைப்பு வலையமைப்பு (REINA-SAN) மற்றும் ஒரு நேரடிப்படியை-அதிகப்படுத்தப்பட்ட வலையமைப்பு (REINA-TAN). எங்கள் முடிவுகள், இரண்டு முறைகளும் அடிப்படை முறையைக் கணிசமாக மிஞ்சி, நிலைத்தன்மை சிக்கல்களைத் தீர்த்தாலும், REINA-TAN ஸ்ட்ரீமிங் செயல்திறனுக்காக சற்றே சிறந்த பாரெட்டோ எல்லைக்கோட்டை வழங்குகிறது, அதேசமயம் REINA-SAN 'வாசிப்பு சுற்றுகளுக்கு' எதிராக அதிக வலுவூட்டலை வழங்குகிறது என்பதை நிரூபிக்கின்றன. விஸ்பர் (Whisper) மீது பயன்படுத்தும்போது, இரண்டு முறைகளும் நார்மலைஸ்டு ஸ்ட்ரீமிங் செயல்திறன் (NoSE) மதிப்பெண்களால் அளவிடப்பட்ட ஸ்ட்ரீமிங் செயல்திறனின் பாரெட்டோ எல்லைக்கோட்டை, தற்போதுள்ள போட்டி அடிப்படை முறைகளை விட 7.1% வரை மேம்படுத்துகின்றன.