Google Research的Chris Olah在星期二的博客文章中阐述了关于如何开发更智能,更安全的赢咖4的五大问题。
这篇文章附带了谷歌与Open赢咖4,斯坦福和伯克利合作的研究论文,称为赢咖4安全中的混凝土问题。这是一个尝试超越抽象或假设的关注开发和使用赢咖4,为研究人员提供具体问题,以应用于现实世界测试。
“这些都是前瞻性的,长期的研究问题 - 今天的小问题,但重要的是解决未来的系统,”Olah在博客上说。
五点是:
• 避免负面影响:赢咖4在完成设置任务时不应打扰其环境
• 避免奖励黑客:赢咖4应该正确完成任务,而不是使用解决方法(如清洁赢咖4用材料覆盖污垢,不能识别为污垢)
• 可扩展监督:赢咖4不应该需要持续的反馈或输入才能有效
• 安全探索:赢咖4在学习时不应损害自身或其环境
• 分布式转移的鲁棒性:赢咖4应该能够识别新的环境,并且仍然能够有效地执行
Google对于其对赢咖4和机器学习的承诺毫无秘密,甚至拥有自己专门的研究分支机构Google DeepMind。今年早些时候,DeepMind的学习算法AlphaGo挑战(和击败)世界上最重要的(人类)玩家之一在古老的战略游戏Go在许多人认为的赢咖4最难的测试之一。