कार्य नियंत्रणासह संमिश्र गतिक शिकवण
Author
Venue
सिगग्राफ २०२३
Abstract
आम्ही भौतिकदृष्ट्या सिम्युलेट केलेल्या पात्रांसाठी संमिश्र आणि कार्य-चालित हालचाल नियंत्रणासाठी एक डीप लर्निंग पद्धत सादर करतो. पूर्ण-शरीर हालचालींची नक्कल करणाऱ्या पुनर्बळ शिकवणुकीवर आधारित विद्यमान डेटा-चालित पद्धतींच्या तुलनेत, आम्ही एकाच वेळी आणि थेट एका GAN-सारख्या सेटअपमध्ये अनेक विभेदकांचा वापर करून विशिष्ट शरीराच्या भागांसाठी स्वतंत्र हालचाली शिकतो. या प्रक्रियेत, शिकण्यासाठी संयुक्त संदर्भ हालचाली तयार करण्यासाठी कोणत्याही मॅन्युअल कामाची आवश्यकता नाही. त्याऐवजी, नियंत्रण धोरण स्वतःच शोधते की संयुक्त हालचाली स्वयंचलितपणे कशा संयोजित केल्या जाऊ शकतात. आम्ही पुढे अनेक कार्य-विशिष्ट बक्षिसे विचारात घेतो आणि एकच, बहु-उद्देशीय नियंत्रण धोरण प्रशिक्षित करतो. यासाठी, आम्ही बहु-उद्देशीय शिकण्यासाठी एक नवीन चौकट प्रस्तावित करतो जी अनेक स्रोतांमधून विविध हालचाली आणि अनेक उद्दिष्ट-निर्देशित नियंत्रण उद्दिष्टांचे शिकणे अनुकूलीपणे संतुलित करते. याव्यतिरिक्त, चूंकी संमिश्र हालचाली सामान्यतः सोप्या वर्तनांचे विस्तार असतात, आम्ही संमिश्र नियंत्रण धोरणे क्रमिक पद्धतीने प्रशिक्षित करण्यासाठी एक नमुना-कार्यक्षम पद्धत मांडतो, ज्यात आम्ही पूर्व-प्रशिक्षित धोरणाला मेटा धोरण म्हणून पुनर्वापर करतो आणि नवीन संमिश्र कार्यांसाठी मेटा धोरणाला अनुकूल करणारे सहकारी धोरण प्रशिक्षित करतो. आम्ही संमिश्र हालचालींचे अनुकरण आणि एकापेक्षा जास्त लक्ष्य-निर्देशित नियंत्रणाचा समावेश असलेल्या विविध आव्हानात्मक बहु-उद्देशीय कार्यांवर आमच्या पद्धतीची उपयुक्तता दाखवतो.
