या साइटवरील सामग्री कृत्रिम बुद्धिमत्ता (AI) किंवा मशीन भाषांतर तंत्रज्ञानाचा वापर करून भाषांतरित केली आहे आणि त्यात त्रुटी असू शकतात.

Skip to content
3D

AdaptNet: भौतिक-आधारित पात्र नियंत्रणासाठी धोरण अनुकूलन

Author

PEI XU (क्लेम्सन विद्यापीठ, यूएसए + रॉब्लॉक्स, यूएसए), KAIXIANG XIE (मॅकगिल विद्यापीठ, कॅनडा), SHELDON ANDREWS (École de Technologie Supérieure, कॅनडा + रॉब्लॉक्स, यूएसए), PAUL G. KRY (मॅकगिल विद्यापीठ, कॅनडा), मायकेल नेफ (कॅलिफोर्निया विद्यापीठ, डेव्हिस, यूएसए), मॉर्गन मॅकग्वायर (रॉब्लॉक्स, यूएसए + वॉटरलू विद्यापीठ, कॅनडा), इओआनिस करामुझास (कॅलिफोर्निया विद्यापीठ, रिव्हरसाइड, यूएसए), व्हिक्टर झोर्डन (रॉब्लॉक्स, यूएसए + क्लेम्सन विद्यापीठ, यूएसए)

Venue

सिगग्राफ एशिया २०२३

Abstract

नवीन कौशल्ये शिकताना विद्यमान कौशल्यांना अनुकूल करण्याच्या मानवी क्षमतेने प्रेरित होऊन, या पेपरमध्ये AdaptNet सादर केले आहे, जी विद्यमान धोरणांच्या अंतर्निहित अवकाशात बदल करून शून्यापासून शिकण्याच्या तुलनेत समान कार्यांमधून नवीन वर्तन जलद शिकण्यास अनुमती देते. दिलेल्या पुनर्बलन शिक्षण नियंत्रकावर आधारित, AdaptNet दोन-स्तरीय पदानुक्रम वापरते जे मूळ स्थिती एम्बेडिंगमध्ये वर्तनात किरकोळ बदल करण्यासाठी समर्थन वाढवते आणि अधिक महत्त्वपूर्ण बदल करण्यासाठी धोरण नेटवर्कच्या थरांमध्ये पुढील बदल करते. ही तंत्रे विद्यमान भौतिकशास्त्र-आधारित नियंत्रकांना हालचालींच्या नवीन शैली, नवीन कार्य उद्दिष्टे, पात्र रचनेतील बदल आणि पर्यावरणातील व्यापक बदलांसाठी अनुकूल करण्यासाठी प्रभावी ठरलेली आहेत. याव्यतिरिक्त, शून्यापासून प्रशिक्षण देण्याच्या किंवा विद्यमान धोरणांमध्ये बदल करणाऱ्या इतर पद्धतींच्या तुलनेत प्रशिक्षणाचा वेळ मोठ्या प्रमाणात कमी झाल्याने, शिकण्याची कार्यक्षमता लक्षणीयरीत्या वाढलेली दिसून येते. कोड https://motion-lab.github.io/AdaptNet येथे उपलब्ध आहे.