マルチタスク学習を用いた音声毒性検出

Share

Author

マヘシュ・クマール・ナンドワナ（Roblox）、イファン・ヘ（Roblox + カーネギーメロン大学）、ジョセフ・リウ（Roblox）、シャオ・ユー（Roblox）、チャールズ・シャン（Roblox）、エロイ・デュ・ボア（Roblox）、モーガン・マクガイア（Roblox）、およびキラン・バット（Roblox）

Venue

IEEE ICASSP '24

Abstract

ソーシャルコミュニケーションシステムは、コミュニティの安全性と健全性を守るためのモデレーションを支援するため、有害な音声コンテンツを特定する必要があります。音声の有害性分類は、音量やトーンといった音声のスタイルと、個々の単語や文脈における発話内容といったコンテンツの両方に依存します。本研究では、音声ベースの有害性検出に向けた新たなエンドツーエンドのマルチタスク学習（MTL）パラダイムを提案し、既存の自動音声認識（ASR）やテキストベースのシステムに伴う課題に対処する。ハードなパラメータ共有バックボーンと柔軟なソフトアテンションタスクアダプタを採用することで、本モデルは2つのタスクを実行する。1つは特定の有害行為カテゴリを対象とするマルチラベル有害性分類タスクであり、もう1つは有害なキーワードのみを転写することに焦点を当てた補助的な「音声からキーワード」検出タスクである。これにより、計算効率が向上し、分類出力を補完する。分類器がキーワード検出の品質を大幅に向上させることを確認した。また、トレーニングセットの自動オフラインラベリングのためのデータパイプラインも提案する。

함께 미래를 만들어 갑시다

모든 채용 정보 보기

最新

その他の結果

マルチタスク学習を用いた音声毒性検出

Author

Venue

Abstract

함께 미래를 만들어 갑시다

マルチタスク学習を用いた音声毒性検出

Author

Venue

Abstract

Related Publications

CubePart：オープンボキャブラリー対応のパーツ制御型3Dジェネレーター

同時音声翻訳のための時系列認識ネットワークを用いた正規化エントロピー情報の適応

Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels

함께 미래를 만들어 갑시다