Bu sitedeki içerik yapay zeka (AI) veya makine çeviri teknolojisi kullanılarak çevrilmiştir ve hatalar içerebilir.

Skip to content
Safety & Civility
Speech & Audio
Artificial Intelligence

Çoklu görev öğrenmesini kullanarak ses toksisitesi tespiti

View Publication

Author

Mahesh Kumar Nandwana (Roblox), Yifan He (Roblox + Carnegie Mellon Üniversitesi), Joseph Liu (Roblox), Xiao Yu (Roblox), Charles Shang (Roblox), Eloi Du Bois (Roblox), Morgan McGuire (Roblox) ve Kiran Bhat (Roblox)

Venue

IEEE ICASSP '24

Abstract

Sosyal iletişim sistemleri, topluluklarının güvenliğini ve nezaketini koruyan moderasyonu desteklemek için zehirli ses kayıtlarını tespit etmelidir. Sesin zehirli olup olmadığına dair sınıflandırma, sesin yüksekliği ve tonu gibi ses stiline ve konuşmadaki kelimelerin tek tek ve bağlam içindeki anlamı gibi içeriğe bağlıdır. Ses tabanlı toksisite tespiti için, mevcut otomatik konuşma tanıma (ASR) ve metin tabanlı sistemlerle ilgili zorlukları ele alan yeni bir uçtan uca çoklu görev öğrenme (MTL) paradigması sunuyoruz. Sert parametre paylaşımı omurgası ve esnek yumuşak dikkat görev adaptörleri kullanarak, modelimiz iki görevi yerine getirir: belirli zehirli davranış kategorilerini hedefleyen çok etiketli zehirli içerik sınıflandırma görevi ve yalnızca zehirli anahtar kelimeleri transkribe etmeye odaklanan yardımcı Ses-Anahtar Kelime algılama görevi; böylece hesaplama verimliliğini artırır ve sınıflandırma çıktısını tamamlar. Sınıflandırıcının anahtar kelime algılama kalitesini önemli ölçüde iyileştirdiğini gözlemliyoruz. Ayrıca, eğitim kümelerinin otomatik çevrimdışı etiketlenmesi için bir veri boru hattı da sunuyoruz.