このサイトのコンテンツは、人工知能(AI)または機械翻訳技術を使用して翻訳されており、誤りが含まれている場合があります。

Skip to content
3D

AdaptNet:物理ベースのキャラクター制御のためのポリシー適応

Author

PEI XU(クレムソン大学、米国 + Roblox、米国)、KAIXIANG XIE(マギル大学、カナダ)、SHELDON ANDREWS(エコール・ド・テクノロジー・シュペリウール、カナダ + Roblox、米国)、PAUL G. KRY(マギル大学、カナダ)、 マイケル・ネフ(カリフォルニア大学デービス校、米国)、モーガン・マクガイア(Roblox、米国 + ウォータールー大学、カナダ)、イオアニス・カラムーザス(カリフォルニア大学リバーサイド校、米国)、ビクター・ゾーダン(Roblox、米国 + クレムソン大学、米国)

Venue

SIGGRAPH Asia 2023

Abstract

人間が新しいスキルを習得する際に既存のスキルを適応させる能力に着想を得て、本論文ではAdaptNetを提案する。これは、既存のポリシーの潜在空間を修正することで、ゼロから学習する場合と比較して、類似したタスクから新しい行動を迅速に学習できるようにする手法である。AdaptNetは、与えられた強化学習コントローラを基盤とし、2段階の階層構造を用いて、行動の軽微な変更をサポートするために元の状態埋め込みを拡張し、さらに実質的な変更を行うためにポリシーネットワーク層を修正する。 本手法は、既存の物理ベースのコントローラを、多様な新しい移動様式、新しいタスク目標、キャラクターの形態変化、および環境の大幅な変化に適応させる上で有効であることが示されている。さらに、ゼロから学習する場合や、既存ポリシーを修正する他の手法と比較して、トレーニング時間が大幅に短縮されることから、学習効率が大幅に向上することが示されている。コードは https://motion-lab.github.io/AdaptNet で公開されている。