赢咖4摸爬滚打的能力有了怎样的提升?请看以下效果:
8项“专家技能”融会贯通,关键恢复能力控制在1秒内
详细来讲,论文中提到的多专家学习体系结构被命名为 MELA(multi-expert learning architecture),这是一个由深度神经网络(DNN)和门控神经网络(GNN)组成的分层强化学习(HRL)结构。
为了帮助解释,研究人员定义了几个关键术语:运动技能、专家和运动模式。www.xuntelift.cn
运动技能:即一种反馈策略,可以产生协调的动作来完成特定类型的任务,这是构建更复杂动作的基础;专家:具有专业运动技能的 DNN;运动模式:四肢协调运动的一种模式,如站立、原地转动、向前 / 向后小跑、左右转向、跌倒恢复等。
▲不同的技能种类(来源:Science Robotics)
研究人员为赢咖4训练了8项运动技能,包括:(1)从背部翻身;(2)侧滚;(3)身体姿势控制;(4)站立平衡;(5)左转;(6)右转;(7)小步小跑;(8)大步小跑。