అడాప్ట్నెట్: భౌతిక శాస్త్ర ఆధారిత పాత్ర నియంత్రణ కోసం విధాన అనుసరణ
Author
Venue
సిగ్గ్రాఫ్ ఆసియా 2023
Abstract
కొత్త నైపుణ్యాలను నేర్చుకునే క్రమంలో, ఇప్పటికే ఉన్న నైపుణ్యాలను మలచుకునే మానవ సామర్థ్యం నుండి స్ఫూర్తి పొంది, ఈ పత్రం 'అడాప్ట్నెట్' (AdaptNet) అనే ఒక విధానాన్ని ప్రవేశపెడుతుంది. ఇది, మొదటి నుండి నేర్చుకోవడంతో పోలిస్తే, ఒకే రకమైన పనుల నుండి కొత్త ప్రవర్తనలను వేగంగా నేర్చుకునేందుకు వీలుగా, ఇప్పటికే ఉన్న పాలసీల (policies) లాటెంట్ స్పేస్ను (latent space) సవరించే ఒక పద్ధతి. ఇచ్చిన రీఇన్ఫోర్స్మెంట్ లెర్నింగ్ కంట్రోలర్ (reinforcement learning controller) ఆధారంగా, అడాప్ట్నెట్ ఒక ద్వి-స్థాయి హైరార్కీని (two-tier hierarchy) ఉపయోగిస్తుంది. ఇది ఒక ప్రవర్తనలో చిన్నపాటి మార్పులకు మద్దతు ఇవ్వడానికి అసలు స్టేట్ ఎంబెడింగ్ను (state embedding) పెంచుతుంది మరియు మరింత గణనీయమైన మార్పులు చేయడానికి పాలసీ నెట్వర్క్ లేయర్లను (policy network layers) తదుపరి సవరిస్తుంది. ఈ పద్ధతి, ఇప్పటికే ఉన్న ఫిజిక్స్-ఆధారిత కంట్రోలర్లను కదలికల కోసం అనేక రకాల కొత్త శైలులు, కొత్త టాస్క్ లక్ష్యాలు, పాత్ర రూపంలో మార్పులు మరియు పర్యావరణంలో విస్తృతమైన మార్పులకు అనుగుణంగా మార్చడానికి ప్రభావవంతంగా పనిచేస్తుందని నిరూపించబడింది. అంతేకాకుండా, మొదటి నుండి శిక్షణ ఇవ్వడం లేదా ఇప్పటికే ఉన్న పాలసీలను సవరించే ఇతర పద్ధతులతో పోలిస్తే శిక్షణ సమయం గణనీయంగా తగ్గినట్లుగా, ఇది అభ్యాస సామర్థ్యంలో కూడా గణనీయమైన పెరుగుదలను ప్రదర్శిస్తుంది. కోడ్ https://motion-lab.github.io/AdaptNet వద్ద అందుబాటులో ఉంది.
