कार्य नियंत्रण के साथ संयुक्त गति सीखना

Share

Author

पेई शू (क्लेम्सन), शूइमिन शान (यूसी मर्केड), विक्टर ज़ोर्डन, इओआनिस करामुज़ास (क्लेम्सन)

Venue

सिग्राफ 2023

Abstract

हम भौतिक रूप से सिमुलेटेड पात्रों के लिए संयुक्त और कार्य-संचालित गति नियंत्रण हेतु एक डीप लर्निंग विधि प्रस्तुत करते हैं। पूर्ण-शरीर की गति की नकल करने वाले, पुनर्बलन शिक्षण (reinforcement learning) का उपयोग करने वाले मौजूदा डेटा-संचालित दृष्टिकोणों के विपरीत, हम एक GAN-जैसे सेटअप में कई विभेदकों (discriminators) के उपयोग का लाभ उठाकर, एक साथ और सीधे कई संदर्भ गति से विशिष्ट शरीर के अंगों के लिए पृथक गति सीखते हैं। इस प्रक्रिया में, सीखने के लिए संयुक्त संदर्भ गति (composite reference motions) बनाने के लिए किसी भी मैन्युअल कार्य की आवश्यकता नहीं होती है। इसके बजाय, नियंत्रण नीति स्वयं यह पता लगाती है कि संयुक्त गति को स्वचालित रूप से कैसे जोड़ा जा सकता है। हम आगे कई कार्य-विशिष्ट पुरस्कारों (task-specific rewards) को ध्यान में रखते हैं और एक एकल, बहु-उद्देश्यीय नियंत्रण नीति (single, multi-objective control policy) को प्रशिक्षित करते हैं। इस उद्देश्य के लिए, हम बहु-उद्देश्यीय सीखने के लिए एक नया ढांचा प्रस्तावित करते हैं जो कई स्रोतों से विभिन्न गति और कई लक्ष्य-निर्देशित नियंत्रण उद्देश्यों के सीखने को अनुकूली रूप से संतुलित करता है। इसके अतिरिक्त, चूँकि संयुक्त गतिविधियाँ आमतौर पर सरल व्यवहारों का विस्तार होती हैं, हम क्रमिक तरीके से संयुक्त नियंत्रण नीतियों को प्रशिक्षित करने के लिए एक नमूना-कुशल विधि पेश करते हैं, जहाँ हम एक पूर्व-प्रशिक्षित नीति को मेटा नीति के रूप में पुन: उपयोग करते हैं और एक सहकारी नीति को प्रशिक्षित करते हैं जो नई संयुक्त गतिविधियों के लिए मेटा नीति को अनुकूलित करती है। हम अपनी पद्धति की प्रयोज्यता को विभिन्न चुनौतीपूर्ण बहु-उद्देश्यीय कार्यों पर प्रदर्शित करते हैं, जिनमें संयुक्त गति की नकल और कई लक्ष्य-निर्देशित नियंत्रण, दोनों शामिल हैं।

भविष्य को आकार देने में हमारे साथ जुड़ें

सभी नौकरियाँ देखें

नवीनतम

अधिक परिणाम

कार्य नियंत्रण के साथ संयुक्त गति सीखना

Author

Venue

Abstract

भविष्य को आकार देने में हमारे साथ जुड़ें

कार्य नियंत्रण के साथ संयुक्त गति सीखना

Author

Venue

Abstract

Related Publications

VI3NR: निहित तंत्रिका निरूपणों के लिए विचलन-सूचित आरंभिकीकरण

रेखा चतुर्भुजों के साथ चतुर्भुज त्रुटि सरलीकरण को नियंत्रित करना

क्यूब: 3डी बुद्धिमत्ता का एक रॉब्लॉक्स दृष्टिकोण

भविष्य को आकार देने में हमारे साथ जुड़ें