कार्य नियंत्रणासह संमिश्र गतिक शिकवण

Share

Author

पेई शू (क्लेम्सन), शुईमिन शांग (यूसी मर्सिड), व्हिक्टर झोर्डन, इओआनिस करामुझास (क्लेम्सन)

Venue

सिगग्राफ २०२३

Abstract

आम्ही भौतिकदृष्ट्या सिम्युलेट केलेल्या पात्रांसाठी संमिश्र आणि कार्य-चालित हालचाल नियंत्रणासाठी एक डीप लर्निंग पद्धत सादर करतो. पूर्ण-शरीर हालचालींची नक्कल करणाऱ्या पुनर्बळ शिकवणुकीवर आधारित विद्यमान डेटा-चालित पद्धतींच्या तुलनेत, आम्ही एकाच वेळी आणि थेट एका GAN-सारख्या सेटअपमध्ये अनेक विभेदकांचा वापर करून विशिष्ट शरीराच्या भागांसाठी स्वतंत्र हालचाली शिकतो. या प्रक्रियेत, शिकण्यासाठी संयुक्त संदर्भ हालचाली तयार करण्यासाठी कोणत्याही मॅन्युअल कामाची आवश्यकता नाही. त्याऐवजी, नियंत्रण धोरण स्वतःच शोधते की संयुक्त हालचाली स्वयंचलितपणे कशा संयोजित केल्या जाऊ शकतात. आम्ही पुढे अनेक कार्य-विशिष्ट बक्षिसे विचारात घेतो आणि एकच, बहु-उद्देशीय नियंत्रण धोरण प्रशिक्षित करतो. यासाठी, आम्ही बहु-उद्देशीय शिकण्यासाठी एक नवीन चौकट प्रस्तावित करतो जी अनेक स्रोतांमधून विविध हालचाली आणि अनेक उद्दिष्ट-निर्देशित नियंत्रण उद्दिष्टांचे शिकणे अनुकूलीपणे संतुलित करते. याव्यतिरिक्त, चूंकी संमिश्र हालचाली सामान्यतः सोप्या वर्तनांचे विस्तार असतात, आम्ही संमिश्र नियंत्रण धोरणे क्रमिक पद्धतीने प्रशिक्षित करण्यासाठी एक नमुना-कार्यक्षम पद्धत मांडतो, ज्यात आम्ही पूर्व-प्रशिक्षित धोरणाला मेटा धोरण म्हणून पुनर्वापर करतो आणि नवीन संमिश्र कार्यांसाठी मेटा धोरणाला अनुकूल करणारे सहकारी धोरण प्रशिक्षित करतो. आम्ही संमिश्र हालचालींचे अनुकरण आणि एकापेक्षा जास्त लक्ष्य-निर्देशित नियंत्रणाचा समावेश असलेल्या विविध आव्हानात्मक बहु-उद्देशीय कार्यांवर आमच्या पद्धतीची उपयुक्तता दाखवतो.

भविष्य घडवण्यात आमच्यासोबत सहभागी व्हा

सर्व नोकऱ्या पहा

नवीनतम

अधिक निकाल

कार्य नियंत्रणासह संमिश्र गतिक शिकवण

Author

Venue

Abstract

भविष्य घडवण्यात आमच्यासोबत सहभागी व्हा

कार्य नियंत्रणासह संमिश्र गतिक शिकवण

Author

Venue

Abstract

Related Publications

VI3NR: निहित न्यूरल प्रतिनिधित्वांसाठी विचलनाधारित प्रारंभिकीकरण

रेषीय चतुर्भुजिक द्वारे चतुर्भुजिक त्रुटी सरलीकरणाचे नियंत्रण

क्यूब: 3D बुद्धिमत्तेचा Roblox दृश्य

भविष्य घडवण्यात आमच्यासोबत सहभागी व्हा