Composietbewegingsleren met taakcontrole
Author
Venue
SIGGRAPH 2023
Abstract
We presenteren een deep learning-methode voor samengestelde en taakgestuurde bewegingscontrole voor fysiek gesimuleerde personages. In tegenstelling tot bestaande datagestuurde benaderingen die gebruikmaken van reinforcement learning om bewegingen van het hele lichaam na te bootsen, leren we ontkoppelde bewegingen voor specifieke lichaamsdelen uit meerdere referentiebewegingen tegelijk en direct door gebruik te maken van meerdere discriminators in een GAN-achtige opstelling. In dit proces is er geen handmatig werk nodig om samengestelde referentiebewegingen voor het leren te produceren. In plaats daarvan onderzoekt het besturingsbeleid zelf hoe de samengestelde bewegingen automatisch kunnen worden gecombineerd. We houden verder rekening met meerdere taakspecifieke beloningen en trainen één enkel, multi-objectief besturingsbeleid. Daartoe stellen we een nieuw raamwerk voor multi-objectief leren voor dat op adaptieve wijze een evenwicht vindt tussen het leren van uiteenlopende bewegingen uit meerdere bronnen en meerdere doelgerichte besturingsdoelstellingen. Aangezien samengestelde bewegingen doorgaans uitbreidingen zijn van eenvoudiger gedragingen, introduceren we bovendien een sample-efficiënte methode voor het op incrementele wijze trainen van samengestelde besturingsbeleidsregels, waarbij we een vooraf getraind beleid hergebruiken als metabeleid en een coöperatief beleid trainen dat het metabeleid aanpast voor nieuwe samengestelde taken. We tonen de toepasbaarheid van onze aanpak aan op een verscheidenheid aan uitdagende multi-objectieve taken waarbij zowel imitatie van samengestelde bewegingen als meervoudige doelgerichte besturing betrokken zijn.
