इस साइट की सामग्री का अनुवाद कृत्रिम बुद्धिमत्ता (AI) या मशीन अनुवाद तकनीक का उपयोग करके किया गया है, और इसमें त्रुटियाँ हो सकती हैं.

Skip to content
Safety & Civility
Speech & Audio
Artificial Intelligence

मल्टी-टास्क लर्निंग का उपयोग करके वॉयस टॉक्सिसिटी का पता लगाना

View Publication

Author

महेश कुमार नंदवाना (Roblox), यिफान हे (Roblox + कार्नेगी मेलन विश्वविद्यालय), जोसेफ लियू (Roblox), शियाओ यू (Roblox), चार्ल्स शान (Roblox), एलोई डू बॉइस (Roblox), मॉर्गन मैकग्वायर (Roblox), और किरण भट्ट (Roblox)

Venue

आईईईई आईसीएएसपीपी '24

Abstract

सामाजिक संचार प्रणालियों को अपने समुदायों की सुरक्षा और सभ्यता की रक्षा के लिए मध्यस्थता में सहायता हेतु विषाक्त वॉयस ऑडियो की पहचान करनी चाहिए। वॉयस के लिए विषाक्तता वर्गीकरण ऑडियो शैली (जैसे वॉल्यूम और टोन) और सामग्री (जैसे भाषण में शब्दों को व्यक्तिगत रूप से और संदर्भ में) दोनों पर निर्भर करता है। हम ऑडियो-आधारित विषाक्तता का पता लगाने के लिए एक नवीन एंड-टू-एंड मल्टी-टास्क लर्निंग (MTL) प्रतिमान पेश करते हैं, जो मौजूदा स्वचालित भाषण मान्यता (ASR) और टेक्स्ट-आधारित प्रणालियों से जुड़ी चुनौतियों का समाधान करता है। एक हार्ड पैरामीटर-शेयरिंग बैकबोन और लचीले सॉफ्ट-अटेंशन टास्क एडॉप्टर्स को नियोजित करके, हमारा मॉडल दो कार्य करता है: एक मल्टी-लेबल टॉक्सिसिटी क्लासिफिकेशन कार्य जो विषाक्त व्यवहार की विशिष्ट श्रेणियों को लक्षित करता है, और एक सहायक ऑडियो टू कीवर्ड डिटेक्शन कार्य जो केवल विषाक्त कीवर्ड का ट्रांसक्रिप्शन करने पर ध्यान केंद्रित करता है, इस प्रकार संगणकीय दक्षता को बढ़ाता है और क्लासिफिकेशन आउटपुट को पूरक करता है। हम देखते हैं कि क्लासिफायर कीवर्ड डिटेक्शन की गुणवत्ता में काफी सुधार करता है। हम प्रशिक्षण सेटों के स्वचालित ऑफ़लाइन लेबलिंग के लिए एक डेटा पाइपलाइन भी प्रस्तुत करते हैं।