AdaptNet: भौतिक-आधारित पात्र नियंत्रणासाठी धोरण अनुकूलन
Author
Venue
सिगग्राफ एशिया २०२३
Abstract
नवीन कौशल्ये शिकताना विद्यमान कौशल्यांना अनुकूल करण्याच्या मानवी क्षमतेने प्रेरित होऊन, या पेपरमध्ये AdaptNet सादर केले आहे, जी विद्यमान धोरणांच्या अंतर्निहित अवकाशात बदल करून शून्यापासून शिकण्याच्या तुलनेत समान कार्यांमधून नवीन वर्तन जलद शिकण्यास अनुमती देते. दिलेल्या पुनर्बलन शिक्षण नियंत्रकावर आधारित, AdaptNet दोन-स्तरीय पदानुक्रम वापरते जे मूळ स्थिती एम्बेडिंगमध्ये वर्तनात किरकोळ बदल करण्यासाठी समर्थन वाढवते आणि अधिक महत्त्वपूर्ण बदल करण्यासाठी धोरण नेटवर्कच्या थरांमध्ये पुढील बदल करते. ही तंत्रे विद्यमान भौतिकशास्त्र-आधारित नियंत्रकांना हालचालींच्या नवीन शैली, नवीन कार्य उद्दिष्टे, पात्र रचनेतील बदल आणि पर्यावरणातील व्यापक बदलांसाठी अनुकूल करण्यासाठी प्रभावी ठरलेली आहेत. याव्यतिरिक्त, शून्यापासून प्रशिक्षण देण्याच्या किंवा विद्यमान धोरणांमध्ये बदल करणाऱ्या इतर पद्धतींच्या तुलनेत प्रशिक्षणाचा वेळ मोठ्या प्रमाणात कमी झाल्याने, शिकण्याची कार्यक्षमता लक्षणीयरीत्या वाढलेली दिसून येते. कोड https://motion-lab.github.io/AdaptNet येथे उपलब्ध आहे.
