Le contenu de ce site a été traduit à l'aide de l'intelligence artificielle (IA) ou d'une technologie de traduction automatique, et peut contenir des erreurs.

Skip to content
3D

AdaptNet : Adaptation des politiques pour le contrôle des personnages basé sur la physique

Author

PEI XU (Université Clemson, États-Unis + Roblox, États-Unis), KAIXIANG XIE (Université McGill, Canada), SHELDON ANDREWS (École de technologie supérieure, Canada + Roblox, États-Unis), PAUL G. KRY (Université McGill, Canada), MICHAEL NEFF (Université de Californie, Davis, États-Unis), MORGAN MCGUIRE (Roblox, États-Unis + Université de Waterloo, Canada), IOANNIS KARAMOUZAS (Université de Californie, Riverside, États-Unis), VICTOR ZORDAN (Roblox, États-Unis + Université Clemson, États-Unis)

Venue

SIGGRAPH Asia 2023

Abstract

S'inspirant de la capacité des humains à adapter leurs compétences lors de l'apprentissage de nouvelles aptitudes, cet article présente AdaptNet, une approche visant à modifier l'espace latent des politiques existantes afin de permettre l'apprentissage rapide de nouveaux comportements à partir de tâches similaires, plutôt que de partir de zéro. S'appuyant sur un contrôleur d'apprentissage par renforcement donné, AdaptNet utilise une hiérarchie à deux niveaux qui enrichit l'intégration d'état d'origine pour prendre en charge des changements modestes dans un comportement et modifie davantage les couches du réseau de politiques pour apporter des changements plus substantiels. Cette technique s'avère efficace pour adapter des contrôleurs basés sur la physique existants à un large éventail de nouveaux styles de locomotion, de nouveaux objectifs de tâches, de changements dans la morphologie des personnages et de modifications importantes de l'environnement. De plus, elle présente une augmentation significative de l'efficacité d'apprentissage, comme l'indique la réduction considérable des temps d'entraînement par rapport à un apprentissage à partir de zéro ou à l'utilisation d'autres approches modifiant les politiques existantes. Le code est disponible à l'adresse https://motion-lab.github.io/AdaptNet.