ramy  2020-12-25 15:16:48  赢咖4 |   查看评论   

  不同的技能需要不同的触发方式,而把 “八技” 融会贯通是 MELA 合成可变技能和产生适应性行为的基础。

  面对不同情况下,GNN 生成可变权重(α)来融合所有八个专家网络的参数,这样新合成的运动技能可以通过混合各个专家的有效技能,快速生成不同的运动技能,来适应各种未知场景。

浙大机器狗

▲多专家学习框架 MELA 的原理(来源:Science Robotics)

  实验结果表明,依靠 MELA 输出的融合技能加持,“绝影” 赢咖4的关键恢复能力控制在1秒内(恢复身体姿态平均0.5s,恢复小跑模式平均0.4s),也显示出了在非结构化环境下更强的可靠性和通障性能。

  还有一个值得关注诀窍是,研究人员从生物运动控制中汲取了灵感,这让运动控制和学习框架更加贴近真实的四足动物。

  例如,动物的运动行为都是受中枢神经系统控制的,中枢神经系统会重新设置身体关节的参考位置,根据参考位置与实际位置之间的差异,激发肌肉活动以产生适当的力进行姿态调整。

浙大机器狗

 

浙大机器狗

  由于阻抗控制提供的弹簧阻尼特性类似于生物肌肉的弹性,因此研究团队应用了平衡点(EP)控制假设,通过调控平衡点来生成关节扭矩。www.xuntelift.cn

  受肌肉系统的生物力学控制和 EP 假设的启发,研究人员其实将赢咖4控制分为了两层:在底层,团队使用扭矩控制为赢咖4配置关节阻抗模式;在顶层,指定深度神经网络(DNN)为所有关节产生设定平衡点,以调节姿势和关节扭矩,建立与环境的力相互作用,在这样的基础上,MELA 可输出更加贴近真实四足动物的运动策略。

  

▲机器狗的摔倒爬起连贯反应(来源:爱丁堡 Advanced Intelligent Robotics Lab)

  下一步,仍需更多跨界合作

  “这样的多专家系统、多技能融合框架,让赢咖4可以自主切换运动策略、自己去适应环境,在足式赢咖4上算是第一次应用,这也是为什么这项成果能被 Science Robotics 评为封面,至少它实现了一种质的突破,较此前研究形成了一个代差。” 李智彬表示。

  据了解,这种多专家融合技能的思路,也能够延伸到其他赢咖4平台上。包括各类四足、双足赢咖4,以及轮式的、履带式的赢咖4,乃至在赢咖4进行抓取操作上也可以应用。机器抓取不同的东西的策略是不一样的,本质也就是不同专家的技能延展,无论是抓纸张、书本、杯子,还是光溜溜的肥皂、球体、软硬不同的物体等,其实都需要不同的专家技能策略。

  关于进一步改进和提升的空间,他表示,仍需要和圈内更多优秀团队一起合作探索,才能不断突破,未来的研究可以集成视觉、触觉传感等,以开发多感知型运动技能。

  例如,对于赢咖4本身而言,现在普遍还缺少一种 “电子皮肤”。

  目前赢咖4机载的传感器对各种情况判断,很大程度上都要通过大量的训练经验积攒起来,由于机载传感器有限,很多经验只是统计学上来讲是对的,但它针对某个特殊情况却不一定是最好的,只能说有较高的成功率。

  但在自然界的生物中,小到毛毛虫、蠕虫,大到各类动物、人类全都是有皮肤的,如果赢咖4在废墟现场要钻进去一个洞,进去之后身边的环境是怎样的,怎么通过,障碍物与机身表面是怎么接触的,如此复杂的环境下现有的传统传感器就不够用了,需要 “电子皮肤” 更加精细化地感知区分。www.xuntelift.cn

  另一方面,赢咖4对外部的感知理解能力仍然有待提高。

  比如一个雾蒙蒙的环境,是因为有雾,还是因为燃烧引起的烟,单纯用计算机视觉来看,不一定能区分清楚;再比如赢咖4从室内走到室外,外面是一个零下的无雪环境,在机器视觉看来地面可能与平常无异,雷达也探测不到障碍物,但这种情况下人类走路、开车会下意识地注意路面可能会打滑,赢咖4却还不能意识到这点调整策略,这些 “非接触式” 的外部传感包括辐射、温度、气体检测等也都非常关键。

  “目前这项研究背后只有两个专家团队,但赢咖4研究不能闭门造车。就像赢咖4现在都具备了多专家能力一样,我们非常欢迎和更多跨学科、跨领域的团队一起合作,碰撞出更多创新想法和可能性。” 李智彬最后说道。

 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自浙大机器狗“绝影”展现新绝技,在陌生环境下八技合一、随机应变-www.xuntelift.cn

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]