3D
AdaptNet:基於物理的角色的政策適應
Author
Venue
SIGGRAPH Asia 2023
Abstract
受人類在學習新技能時具備適應能力之啟發,本文提出 AdaptNet,這是一種透過修改現有策略的潛在空間,使系統能從類似任務中快速學習新行為的方法,相較於從頭開始學習,此法更具效率。AdaptNet 基於既定的強化學習控制器,採用兩層級的層次結構:首先擴充原始狀態嵌入以支援行為的微調,並進一步修改策略網路層以實現更實質的變革。 研究顯示,此技術能有效將現有的物理基礎控制器適應於多種新的移動風格、新的任務目標、角色形態的變化以及環境的廣泛變動。此外,相較於從頭開始訓練或使用其他修改現有策略的方法,其訓練時間大幅縮短,顯示出顯著的學習效率提升。原始碼可於 https://motion-lab.github.io/AdaptNet 取得。
