ఈ సైట్‌లోని విషయాలు కృత్రిమ మేధస్సు (AI) లేదా యంత్ర అనువాద సాంకేతికత ఉపయోగించి అనువదించబడ్డాయి మరియు లోపాలు ఉండవచ్చు.

Skip to content
3D

అడాప్ట్‌నెట్: భౌతిక శాస్త్ర ఆధారిత పాత్ర నియంత్రణ కోసం విధాన అనుసరణ

Author

PEI XU (క్లెమ్సన్ విశ్వవిద్యాలయం, USA + రాబ్లాక్స్, USA), KAIXIANG XIE (మెక్‌గిల్ విశ్వవిద్యాలయం, కెనడా), SHELDON ANDREWS (École de Technologie Supérieure, కెనడా + రాబ్లాక్స్, USA), PAUL G. KRY (మెక్‌గిల్ విశ్వవిద్యాలయం, కెనడా), మైఖేల్ నెఫ్ (యూనివర్సిటీ ఆఫ్ కాలిఫోర్నియా, డేవిస్, USA), మోర్గాన్ మెక్‌గియర్ (రాబ్లాక్స్, USA + యూనివర్సిటీ ఆఫ్ వాటర్లూ, కెనడా), ఇయోన్నీస్ కరమౌజాస్ (యూనివర్సిటీ ఆఫ్ కాలిఫోర్నియా, రివర్‌సైడ్, USA), విక్టర్ జోర్డాన్ (రాబ్లాక్స్, USA + క్లెమ్సన్ యూనివర్సిటీ, USA)

Venue

సిగ్గ్రాఫ్ ఆసియా 2023

Abstract

కొత్త నైపుణ్యాలను నేర్చుకునే క్రమంలో, ఇప్పటికే ఉన్న నైపుణ్యాలను మలచుకునే మానవ సామర్థ్యం నుండి స్ఫూర్తి పొంది, ఈ పత్రం 'అడాప్ట్‌నెట్' (AdaptNet) అనే ఒక విధానాన్ని ప్రవేశపెడుతుంది. ఇది, మొదటి నుండి నేర్చుకోవడంతో పోలిస్తే, ఒకే రకమైన పనుల నుండి కొత్త ప్రవర్తనలను వేగంగా నేర్చుకునేందుకు వీలుగా, ఇప్పటికే ఉన్న పాలసీల (policies) లాటెంట్ స్పేస్‌ను (latent space) సవరించే ఒక పద్ధతి. ఇచ్చిన రీఇన్ఫోర్స్‌మెంట్ లెర్నింగ్ కంట్రోలర్ (reinforcement learning controller) ఆధారంగా, అడాప్ట్‌నెట్ ఒక ద్వి-స్థాయి హైరార్కీని (two-tier hierarchy) ఉపయోగిస్తుంది. ఇది ఒక ప్రవర్తనలో చిన్నపాటి మార్పులకు మద్దతు ఇవ్వడానికి అసలు స్టేట్ ఎంబెడింగ్‌ను (state embedding) పెంచుతుంది మరియు మరింత గణనీయమైన మార్పులు చేయడానికి పాలసీ నెట్‌వర్క్ లేయర్‌లను (policy network layers) తదుపరి సవరిస్తుంది. ఈ పద్ధతి, ఇప్పటికే ఉన్న ఫిజిక్స్-ఆధారిత కంట్రోలర్‌లను కదలికల కోసం అనేక రకాల కొత్త శైలులు, కొత్త టాస్క్ లక్ష్యాలు, పాత్ర రూపంలో మార్పులు మరియు పర్యావరణంలో విస్తృతమైన మార్పులకు అనుగుణంగా మార్చడానికి ప్రభావవంతంగా పనిచేస్తుందని నిరూపించబడింది. అంతేకాకుండా, మొదటి నుండి శిక్షణ ఇవ్వడం లేదా ఇప్పటికే ఉన్న పాలసీలను సవరించే ఇతర పద్ధతులతో పోలిస్తే శిక్షణ సమయం గణనీయంగా తగ్గినట్లుగా, ఇది అభ్యాస సామర్థ్యంలో కూడా గణనీయమైన పెరుగుదలను ప్రదర్శిస్తుంది. కోడ్ https://motion-lab.github.io/AdaptNet వద్ద అందుబాటులో ఉంది.