重新思考聊天功能:兼顧娛樂性、遊戲體驗與文明互動
即時改寫以保持遊戲流程的流暢性

- 對於團隊或社群共同遊玩的遊戲而言,自然流暢的聊天互動至關重要。
- 當不當用語被封鎖後出現的 ##### 字串,不僅會打斷聊天流程、難以跟上對話,更會干擾遊戲體驗。
- 為維持聊天流暢且保持尊重,我們正強化聊天過濾機制,並將不雅用語轉換為符合我們準則的詞彙。
- 這是我們為減少 ##### 並打造更自然聊天體驗所採取的長期措施的第一步。我們將持續學習、迭代並優化工具,以協助維護安全且文明的聊天環境,包括為使用者提供更多控制選項。
每天,數百萬人透過 Roblox 建立連結並進行遊戲,而即時溝通對於使用者表達自我及協調遊戲玩法至關重要。運用 AI 過濾器來阻擋問題文字(使用者所見的 #####)向來是我們維護安全與提升文明程度的核心策略。這些井號是即時生成的,有助於使用者了解自己輸入的內容是否被禁止。 當然,當用戶屢次違反規則時,他們將面臨的後果不僅僅是文字被標記為 ###。
2025 年 5 月,我們推出了主動式的即時警告機制,以協助用戶理解我們的政策。此機制現已同時適用於文字與語音聊天。這些通知會在用戶違反規則時提醒他們,並引導他們下次重新考量用詞,進而協助他們成為更優秀的數位公民。 根據去年的實驗結果,我們發現透過在應用程式內發送文字聊天通知及實施暫停功能,成功使被過濾的聊天訊息減少 5%,並使因濫用行為舉報所導致的處置減少 6%。
今日,我們新增了一項功能,以協助維持遊戲內文字聊天環境的文明:我們正運用人工智慧自動重新措辭訊息,首先針對粗俗用語。隨著這些系統的擴展,它們將形成文明的正向循環,透過即時回饋協助使用者學習並遵循我們的《社群準則》。 所有使用者(不僅是訊息發送者)都能看到 Roblox 上允許使用的語言(而發送者則會看到不允許的內容)。這為可能不了解規則的使用者提供了更多反饋,並在我們的過濾與即時警告基礎上進一步強化,以協助維持 Roblox 上安全、文明且有趣的對話。
即時聊天語句重構:從「禁止標誌」邁向「指引」
對許多使用者而言,一串 ##### 可能導致對話陷入僵局,且無法獲得如何調整措辭以符合《社群準則》的指引。這往往會造成混淆,並使遊戲內的團隊更難進行協作。 試想有人想告訴朋友身後有怪物,卻輸入了「小心!你身後有個該死的怪物啊啊啊!」來警告對方。朋友只看到「###########」。這實在幫不上什麼忙。
從今天起,被過濾的文字將被轉換為更得體的措辭,同時仍能讓 Roblox 用戶感到自然。在推出初期,這項即時改寫功能將著重於髒話。例如,「快點他媽的!」可能會變成「快點!」,這比 ##### 更貼近原意。 需要明確的是,當我們將違反髒話政策的訊息重新表述時——這仍然是違規行為,且原有規則依然適用。若使用者持續試圖在聊天中使用髒話,仍將因反覆違反政策而面臨相同後果。
請將此系統視為方向盤,而非停止標誌:若訊息違反我們的政策,聊天室中的所有人都會收到通知,告知該文字已遭重新措辭以維持文明對話。透過將受限詞彙與使用者日常聊天中實際使用的短語進行對應,我們在維持聊天室尊重氛圍的同時,亦能保留真實的對話感受與流暢性。藉由將這些「停止標誌」替換為即時引導,我們得以減少部分摩擦——同時仍能強化我們對髒話的管制規則。
在文字遭封鎖時,我們仍處於重新措辭並為使用者提供更多上下文的初期階段。隨著時間推移,如同任何 AI 翻譯工具,它在保留使用者原始語氣或上下文方面的準確性與細膩度將日益提升。我們的首要任務仍是建立一種安全且文明的 Roblox 溝通方式,持續優先考量在使用者學習我們標準的過程中,向其傳達資訊、進行教育與提供指引。
雖然改寫功能能減輕聊天中的部分干擾,但針對更嚴重的行為,我們多層級的安全系統仍持續生效。改寫功能僅限於「體驗內聊天」使用,且僅開放給經過年齡驗證、年齡相近的用戶及其「可信聯絡人」之間使用。目前透過我們的自動翻譯工具提供的所有語言皆支援改寫功能。 我們的目標是達到足夠的準確度,藉此逐步減少「###」的出現,直至最終完全淘汰該機制,讓數位溝通能像面對面交談般自然且清晰。
在開發此功能時,我們諮詢了青少年諮詢委員會的成員,以建立一個能反映青少年實際聊天方式的系統。委員會成員索菲亞告訴我們:「邁向即時重新措辭的功能,既能維持對話的流暢性,同時也能幫助確保所有人的安全。它能溫和地引導互動回到正軌,並讓人們感到受歡迎。」
青少年諮詢委員會成員喬丹也表示贊同。「這項轉變教導玩家思考自己的溝通方式,並透過建立友善的連結來強化互動,」喬丹說道。「改用重新措辭機制,能在玩家需求與必要的安全標準之間取得平衡。」
升級的文字過濾器:從模式識別邁向語境分析
我們的安全功能持續進化,以貼近使用者在 Roblox 上的聊天方式。我們的文字過濾系統經過訓練,能偵測並阻擋任何違反《社群準則》的內容。這項工作必須在全球範圍內,並在使用者聊天時即時進行。
最初,此系統包含兩個組成部分:1) 基於規則的系統,旨在當現實世界發生事件時,於數分鐘內偵測並封鎖違反規則的內容;2) 一組從大型模型訓練而來的專用模型,這些模型基於持續更新的模擬與真實樣本,以涵蓋不斷演變的語言類型。
這些專用模型在特定任務上表現優異,例如識別我們禁止的詞彙清單,但它們的推理能力有限,因此不擅長辨識不斷演變的用語。極大規模的模型無法即時運作,且「幻覺」(或錯誤分類)往往會增加誤判率。
在本次更新中,我們為文字過濾系統引入了第三個新組件。現在,當專用模型無法確定某內容是否違反規則時,系統會將其轉交給更擅長推理並能評估更多上下文的大型模型。這些大型模型能夠做出更複雜的判斷。
實驗結果顯示,這種結合式方法顯著提升了過濾器的效能。過濾器現在能更有效地偵測「極客語」(即用數字或符號替換字母)以及更複雜的規避過濾嘗試。雖然沒有任何系統是完美的,但我們很高興這項最新創新讓我們將分享或索取個人資訊(如社群帳號或電話號碼)的漏報率降低了 20 倍。
這是一項大膽的新嘗試,我們未必每次都能完美地重新表述內容。但我們將在持續前進的過程中不斷學習與實驗,並致力於減少用戶在聊天中看到的 ##### 數量,長期目標是徹底淘汰這些標記。我們的最終目標是賦予用戶能力,讓他們能以既有趣又相互尊重的方式進行協作與交流。



