इस साइट की सामग्री का अनुवाद कृत्रिम बुद्धिमत्ता (AI) या मशीन अनुवाद तकनीक का उपयोग करके किया गया है, और इसमें त्रुटियाँ हो सकती हैं.

Skip to content
3D
SIGGRAPH 2023

कार्य नियंत्रण के साथ संयुक्त गति सीखना

Author

पेई शू (क्लेम्सन), शूइमिन शान (यूसी मर्केड), विक्टर ज़ोर्डन, इओआनिस करामुज़ास (क्लेम्सन)

Venue

सिग्राफ 2023

Abstract

हम भौतिक रूप से सिमुलेटेड पात्रों के लिए संयुक्त और कार्य-संचालित गति नियंत्रण हेतु एक डीप लर्निंग विधि प्रस्तुत करते हैं। पूर्ण-शरीर की गति की नकल करने वाले, पुनर्बलन शिक्षण (reinforcement learning) का उपयोग करने वाले मौजूदा डेटा-संचालित दृष्टिकोणों के विपरीत, हम एक GAN-जैसे सेटअप में कई विभेदकों (discriminators) के उपयोग का लाभ उठाकर, एक साथ और सीधे कई संदर्भ गति से विशिष्ट शरीर के अंगों के लिए पृथक गति सीखते हैं। इस प्रक्रिया में, सीखने के लिए संयुक्त संदर्भ गति (composite reference motions) बनाने के लिए किसी भी मैन्युअल कार्य की आवश्यकता नहीं होती है। इसके बजाय, नियंत्रण नीति स्वयं यह पता लगाती है कि संयुक्त गति को स्वचालित रूप से कैसे जोड़ा जा सकता है। हम आगे कई कार्य-विशिष्ट पुरस्कारों (task-specific rewards) को ध्यान में रखते हैं और एक एकल, बहु-उद्देश्यीय नियंत्रण नीति (single, multi-objective control policy) को प्रशिक्षित करते हैं। इस उद्देश्य के लिए, हम बहु-उद्देश्यीय सीखने के लिए एक नया ढांचा प्रस्तावित करते हैं जो कई स्रोतों से विभिन्न गति और कई लक्ष्य-निर्देशित नियंत्रण उद्देश्यों के सीखने को अनुकूली रूप से संतुलित करता है। इसके अतिरिक्त, चूँकि संयुक्त गतिविधियाँ आमतौर पर सरल व्यवहारों का विस्तार होती हैं, हम क्रमिक तरीके से संयुक्त नियंत्रण नीतियों को प्रशिक्षित करने के लिए एक नमूना-कुशल विधि पेश करते हैं, जहाँ हम एक पूर्व-प्रशिक्षित नीति को मेटा नीति के रूप में पुन: उपयोग करते हैं और एक सहकारी नीति को प्रशिक्षित करते हैं जो नई संयुक्त गतिविधियों के लिए मेटा नीति को अनुकूलित करती है। हम अपनी पद्धति की प्रयोज्यता को विभिन्न चुनौतीपूर्ण बहु-उद्देश्यीय कार्यों पर प्रदर्शित करते हैं, जिनमें संयुक्त गति की नकल और कई लक्ष्य-निर्देशित नियंत्रण, दोनों शामिल हैं।