AdaptNet: Dostosowanie zasad sterowania postaciami opartego na fizyce
Author
Venue
SIGGRAPH Asia 2023
Abstract
Zainspirowani zdolnością ludzi do dostosowywania umiejętności podczas uczenia się nowych, w niniejszym artykule przedstawiamy AdaptNet, podejście do modyfikacji przestrzeni ukrytej istniejących polityk, które pozwala na szybkie uczenie się nowych zachowań na podstawie podobnych zadań w porównaniu z uczeniem się od podstaw. Opierając się na danym kontrolerze uczenia się przez wzmocnienie, AdaptNet wykorzystuje dwupoziomową hierarchię, która rozszerza oryginalne osadzenie stanu w celu wsparcia niewielkich zmian w zachowaniu, a także modyfikuje warstwy sieci polityk, aby wprowadzić bardziej istotne zmiany. Technika ta okazała się skuteczna w dostosowywaniu istniejących kontrolerów opartych na fizyce do szerokiego zakresu nowych stylów poruszania się, nowych celów zadań, zmian w morfologii postaci oraz znacznych zmian w otoczeniu. Ponadto wykazuje ona znaczny wzrost wydajności uczenia się, na co wskazuje znacznie skrócony czas szkolenia w porównaniu ze szkoleniem od podstaw lub przy użyciu innych podejść modyfikujących istniejące polityki. Kod jest dostępny pod adresem https://motion-lab.github.io/AdaptNet.
