मल्टी-टास्क लर्निंग का उपयोग करके वॉयस टॉक्सिसिटी का पता लगाना

Share

Author

महेश कुमार नंदवाना (Roblox), यिफान हे (Roblox + कार्नेगी मेलन विश्वविद्यालय), जोसेफ लियू (Roblox), शियाओ यू (Roblox), चार्ल्स शान (Roblox), एलोई डू बॉइस (Roblox), मॉर्गन मैकग्वायर (Roblox), और किरण भट्ट (Roblox)

Venue

आईईईई आईसीएएसपीपी '24

Abstract

सामाजिक संचार प्रणालियों को अपने समुदायों की सुरक्षा और सभ्यता की रक्षा के लिए मध्यस्थता में सहायता हेतु विषाक्त वॉयस ऑडियो की पहचान करनी चाहिए। वॉयस के लिए विषाक्तता वर्गीकरण ऑडियो शैली (जैसे वॉल्यूम और टोन) और सामग्री (जैसे भाषण में शब्दों को व्यक्तिगत रूप से और संदर्भ में) दोनों पर निर्भर करता है। हम ऑडियो-आधारित विषाक्तता का पता लगाने के लिए एक नवीन एंड-टू-एंड मल्टी-टास्क लर्निंग (MTL) प्रतिमान पेश करते हैं, जो मौजूदा स्वचालित भाषण मान्यता (ASR) और टेक्स्ट-आधारित प्रणालियों से जुड़ी चुनौतियों का समाधान करता है। एक हार्ड पैरामीटर-शेयरिंग बैकबोन और लचीले सॉफ्ट-अटेंशन टास्क एडॉप्टर्स को नियोजित करके, हमारा मॉडल दो कार्य करता है: एक मल्टी-लेबल टॉक्सिसिटी क्लासिफिकेशन कार्य जो विषाक्त व्यवहार की विशिष्ट श्रेणियों को लक्षित करता है, और एक सहायक ऑडियो टू कीवर्ड डिटेक्शन कार्य जो केवल विषाक्त कीवर्ड का ट्रांसक्रिप्शन करने पर ध्यान केंद्रित करता है, इस प्रकार संगणकीय दक्षता को बढ़ाता है और क्लासिफिकेशन आउटपुट को पूरक करता है। हम देखते हैं कि क्लासिफायर कीवर्ड डिटेक्शन की गुणवत्ता में काफी सुधार करता है। हम प्रशिक्षण सेटों के स्वचालित ऑफ़लाइन लेबलिंग के लिए एक डेटा पाइपलाइन भी प्रस्तुत करते हैं।

भविष्य को आकार देने में हमारे साथ जुड़ें

सभी नौकरियाँ देखें

नवीनतम

अधिक परिणाम

मल्टी-टास्क लर्निंग का उपयोग करके वॉयस टॉक्सिसिटी का पता लगाना

Author

Venue

Abstract

भविष्य को आकार देने में हमारे साथ जुड़ें

मल्टी-टास्क लर्निंग का उपयोग करके वॉयस टॉक्सिसिटी का पता लगाना

Author

Venue

Abstract

Related Publications

क्यूबपार्ट: एक खुली शब्दावली वाला, भाग-नियंत्रणीय 3D जनरेटर

समवर्ती भाषण अनुवाद के लिए समय-जागरूक नेटवर्कों के साथ नियमितीकृत एंट्रॉपी सूचना अनुकूलन

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

भविष्य को आकार देने में हमारे साथ जुड़ें