本網站內容使用人工智慧(AI)或機器翻譯技術翻譯,可能存在錯誤。

Skip to content
3D

AdaptNet:基於物理的角色的政策適應

Author

徐培(美國克萊姆森大學 + 美國 Roblox)、謝凱祥(加拿大麥吉爾大學)、謝爾登·安德魯斯(加拿大高等技術學院 + 美國 Roblox)、保羅·G·克里(加拿大麥吉爾大學), 邁克爾·內夫(美國加州大學戴維斯分校)、摩根·麥奎爾(美國 Roblox 公司 + 加拿大滑鐵盧大學)、約安尼斯·卡拉穆扎斯(美國加州大學河濱分校)、維克多·佐丹(美國 Roblox 公司 + 美國克萊姆森大學)

Venue

SIGGRAPH Asia 2023

Abstract

受人類在學習新技能時具備適應能力之啟發,本文提出 AdaptNet,這是一種透過修改現有策略的潛在空間,使系統能從類似任務中快速學習新行為的方法,相較於從頭開始學習,此法更具效率。AdaptNet 基於既定的強化學習控制器,採用兩層級的層次結構:首先擴充原始狀態嵌入以支援行為的微調,並進一步修改策略網路層以實現更實質的變革。 研究顯示,此技術能有效將現有的物理基礎控制器適應於多種新的移動風格、新的任務目標、角色形態的變化以及環境的廣泛變動。此外,相較於從頭開始訓練或使用其他修改現有策略的方法,其訓練時間大幅縮短,顯示出顯著的學習效率提升。原始碼可於 https://motion-lab.github.io/AdaptNet 取得。