本网站内容使用人工智能(AI)或机器翻译技术翻译,可能存在错误。

Skip to content
3D

过于僵化、过于强硬、过于聪明:评估运动控制政策的根本性问题

Author

谢开祥(麦吉尔大学)、徐佩(克莱姆森大学)、谢尔顿·安德鲁斯(ETS + Roblox)、维克多·佐丹、保罗·克里(麦吉尔大学)

Venue

SCA 2023

Abstract

深度强化学习(DRL)方法在基于物理的角色的熟练动作合成方面展现出了令人印象深刻的成果。尽管这些方法在追踪参考动作或完成复杂任务方面表现优异,但在评估动作的自然度时仍存在若干问题。 本文针对DRL控制策略生成的动作,在视觉外观之外,针对衡量其自然度的具体定量指标开展了一项初步研究。具体而言,我们首先提出研究控制策略的刚度,预期其将影响角色在受到外部扰动时的行为表现。其次,我们建立了两个强度基准,用于评估关节扭矩的使用情况并与人类表现进行比较。 第三,我们提出研究变异性,以揭示控制策略中不自然的精确度及其与真实人类动作的对比。总而言之,我们的目标是建立可重复的度量标准,用于评估DRL方法生成的控制策略的自然度,并展示了一组来自最先进系统的对比结果。最后,我们针对这些维度提出了简单的改进方案以提升其真实感。