Çoklu görev öğrenmesini kullanarak ses toksisitesi tespiti
Author
Venue
IEEE ICASSP '24
Abstract
Sosyal iletişim sistemleri, topluluklarının güvenliğini ve nezaketini koruyan moderasyonu desteklemek için zehirli ses kayıtlarını tespit etmelidir. Sesin zehirli olup olmadığına dair sınıflandırma, sesin yüksekliği ve tonu gibi ses stiline ve konuşmadaki kelimelerin tek tek ve bağlam içindeki anlamı gibi içeriğe bağlıdır. Ses tabanlı toksisite tespiti için, mevcut otomatik konuşma tanıma (ASR) ve metin tabanlı sistemlerle ilgili zorlukları ele alan yeni bir uçtan uca çoklu görev öğrenme (MTL) paradigması sunuyoruz. Sert parametre paylaşımı omurgası ve esnek yumuşak dikkat görev adaptörleri kullanarak, modelimiz iki görevi yerine getirir: belirli zehirli davranış kategorilerini hedefleyen çok etiketli zehirli içerik sınıflandırma görevi ve yalnızca zehirli anahtar kelimeleri transkribe etmeye odaklanan yardımcı Ses-Anahtar Kelime algılama görevi; böylece hesaplama verimliliğini artırır ve sınıflandırma çıktısını tamamlar. Sınıflandırıcının anahtar kelime algılama kalitesini önemli ölçüde iyileştirdiğini gözlemliyoruz. Ayrıca, eğitim kümelerinin otomatik çevrimdışı etiketlenmesi için bir veri boru hattı da sunuyoruz.
