การตรวจจับความเป็นพิษของเสียงพูดโดยใช้การเรียนรู้หลายภารกิจ

Share

Author

มาเฮช กุมาร นันดวานา (Roblox), อี้ฟาน เหอ (Roblox + มหาวิทยาลัยคาร์เนกีเมลลอน), โจเซฟ หลิว (Roblox), เซียว หยู (Roblox), ชาร์ลส์ ชาง (Roblox), เอโลอิ ดู บูแอส (Roblox), มอร์แกน แมคไกวร์ (Roblox), และ คิราน ภัท (Roblox)

Venue

IEEE ICASSP '24

Abstract

ระบบการสื่อสารทางสังคมต้องสามารถระบุเสียงที่เป็นพิษได้เพื่อสนับสนุนการควบคุมเนื้อหาที่คุ้มครองความปลอดภัยและความสุภาพของชุมชนของตน การจำแนกความเป็นพิษของเสียงขึ้นอยู่ทั้งสไตล์ของเสียง เช่น ความดังและน้ำเสียง และเนื้อหา เช่น คำพูดในคำพูดแต่ละคำและในบริบท เราแนะนำแนวคิดใหม่ของการเรียนรู้หลายภารกิจแบบครบวงจร (MTL) สำหรับการตรวจจับความเป็นพิษจากเสียง โดยมุ่งเน้นการแก้ไขปัญหาที่พบในระบบตรวจจับอัตโนมัติด้วยเสียง (ASR) และระบบที่ใช้ข้อความในปัจจุบัน โดยการใช้โครงสร้างหลักที่แบ่งปันพารามิเตอร์อย่างเข้มงวดและตัวปรับงานแบบซอฟต์-แอทเทนชันที่ยืดหยุ่น โมเดลของเราสามารถทำงานสองอย่างได้: งานจำแนกความเป็นพิษแบบหลายป้ายกำกับที่มุ่งเป้าไปที่หมวดหมู่พฤติกรรมที่เป็นพิษเฉพาะ และงานเสริมในการตรวจจับเสียงเป็นคำสำคัญที่เน้นการถอดเสียงเฉพาะคำสำคัญที่เป็นพิษเท่านั้น ซึ่งช่วยเพิ่มประสิทธิภาพการคำนวณและเสริมผลลัพธ์การจำแนก เราพบว่าตัวจำแนกสามารถปรับปรุงคุณภาพของการตรวจจับคำสำคัญได้อย่างมีนัยสำคัญ นอกจากนี้ เรายังได้นำเสนอระบบจัดการข้อมูลสำหรับการติดป้ายกำกับชุดข้อมูลฝึกฝนแบบออฟไลน์โดยอัตโนมัติ

มาร่วมกับเราในการสร้างอนาคต

ดูงานทั้งหมด

ล่าสุด

ผลลัพธ์เพิ่มเติม

การตรวจจับความเป็นพิษของเสียงพูดโดยใช้การเรียนรู้หลายภารกิจ

Author

Venue

Abstract

มาร่วมกับเราในการสร้างอนาคต

การตรวจจับความเป็นพิษของเสียงพูดโดยใช้การเรียนรู้หลายภารกิจ

Author

Venue

Abstract

Related Publications

CubePart: เครื่องสร้าง 3 มิติแบบควบคุมส่วนด้วยคำศัพท์เปิด

การปรับตัวของข้อมูลเอนโทรปีแบบปกติด้วยเครือข่ายที่มีความตระหนักในเชิงเวลาสำหรับการแปลเสียงพร้อมกัน

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

มาร่วมกับเราในการสร้างอนาคต