मल्टी-टास्क लर्निंग का उपयोग करके वॉयस टॉक्सिसिटी का पता लगाना
Author
Venue
आईईईई आईसीएएसपीपी '24
Abstract
सामाजिक संचार प्रणालियों को अपने समुदायों की सुरक्षा और सभ्यता की रक्षा के लिए मध्यस्थता में सहायता हेतु विषाक्त वॉयस ऑडियो की पहचान करनी चाहिए। वॉयस के लिए विषाक्तता वर्गीकरण ऑडियो शैली (जैसे वॉल्यूम और टोन) और सामग्री (जैसे भाषण में शब्दों को व्यक्तिगत रूप से और संदर्भ में) दोनों पर निर्भर करता है। हम ऑडियो-आधारित विषाक्तता का पता लगाने के लिए एक नवीन एंड-टू-एंड मल्टी-टास्क लर्निंग (MTL) प्रतिमान पेश करते हैं, जो मौजूदा स्वचालित भाषण मान्यता (ASR) और टेक्स्ट-आधारित प्रणालियों से जुड़ी चुनौतियों का समाधान करता है। एक हार्ड पैरामीटर-शेयरिंग बैकबोन और लचीले सॉफ्ट-अटेंशन टास्क एडॉप्टर्स को नियोजित करके, हमारा मॉडल दो कार्य करता है: एक मल्टी-लेबल टॉक्सिसिटी क्लासिफिकेशन कार्य जो विषाक्त व्यवहार की विशिष्ट श्रेणियों को लक्षित करता है, और एक सहायक ऑडियो टू कीवर्ड डिटेक्शन कार्य जो केवल विषाक्त कीवर्ड का ट्रांसक्रिप्शन करने पर ध्यान केंद्रित करता है, इस प्रकार संगणकीय दक्षता को बढ़ाता है और क्लासिफिकेशन आउटपुट को पूरक करता है। हम देखते हैं कि क्लासिफायर कीवर्ड डिटेक्शन की गुणवत्ता में काफी सुधार करता है। हम प्रशिक्षण सेटों के स्वचालित ऑफ़लाइन लेबलिंग के लिए एक डेटा पाइपलाइन भी प्रस्तुत करते हैं।
