இந்த தளத்தின் உள்ளடக்கம் செயற்கை நுண்ணறிவு (AI) அல்லது இயந்திர மொழிபெயர்ப்பு தொழில்நுட்பம் மூலம் மொழிபெயர்க்கப்பட்டுள்ளது; பிழைகள் இருக்கலாம்.

Skip to content
Safety & Civility
Artificial Intelligence
Speech & Audio

பேச்சு-எழுத்து சீரமைப்பின் மூலம் பலமொழி குரல் நச்சுத்தன்மை கண்டறிதலை மேம்படுத்துதல்

View Publication

Author

ஜோசப் லியு (ராப்ளாக்ஸ்), மகேஷ் குமார் நந்தவனா (ராப்ளாக்ஸ்), ஜான்னே பில்க்கியோனென் (ராப்ளாக்ஸ்), ஹன்னஸ் ஹைகினெய்மோ (ராப்ளாக்ஸ்), மோர்கன் மெக்கைர் (ராப்ளாக்ஸ்)

Venue

இன்டர்ஸ்பீச் 2024

Abstract

குரல் நச்சுத்தன்மை வகைப்பாடு என்பது பேச்சின் சொற்பொருள் உள்ளடக்கத்தை பெரிதும் சார்ந்துள்ளது. பயிற்சியின் போது, உரையின் சொற்பொருள் உட்பொதிவை ஒரு பல-லேபிள் பேச்சு நச்சுத்தன்மை வகைப்படுத்தியில் ஒருங்கிணைக்க, குறுக்கு-ஊடக கற்றலைப் பயன்படுத்தும் ஒரு புதிய கட்டமைப்பை நாங்கள் முன்மொழிகிறோம். இது பயிற்சியின் போது உரைத் தகவலை இணைக்க எங்களை அனுமதிக்கிறது, அதே நேரத்தில் அனுமானத்தின் போது ஆடியோவை மட்டும் தேவைப்படுத்துகிறது. இந்த கட்டமைப்பின் செயல்திறனைச் சரிபார்க்க, உண்மையான உலகப் பண்புகளைக் கொண்ட பெரிய அளவிலான தரவுத்தொகுப்புகளில் இந்த வகைப்படுத்தியை நாங்கள் மதிப்பீடு செய்கிறோம். அப்லேஷன் ஆய்வுகள் மூலம், பொது நோக்கத்திற்கான செமான்டிக் உரை உட்பொதிப்புகள் நச்சுத்தன்மை வகைப்பாட்டு நோக்கங்களுக்காக வளமானவை மற்றும் பேச்சுடன் சீரானவை என்பதை நாங்கள் நிரூபிக்கிறோம். பல மொழிகளில் பெரிய அளவில் சோதனைகளை நடத்தி, ஐந்து மொழிகள் மற்றும் வெவ்வேறு நச்சுத்தன்மை வகைகளில் குரல் நச்சுத்தன்மை வகைப்பாட்டில் முன்னேற்றங்களைக் காட்டுகிறோம்.