Human vs AI，人类和机器的学习究竟谁更胜一筹？游易德-赢咖4注册

ramy 2021-01-17 14:36:13 机器学习 | 查看评论

Agent 刚刚获得了一个积极的奖励，用圆圈与向上的箭头显示。图中还显示 Agent 位于第 3 单元格，Evil 和 Good 分别放在第 2 和第 3 单元格。Agent 可以移动到单元格 1 和单元格 3。单元格 3 被高亮显示，因为鼠标指针在它上面游易德

作者分别对人类和 Q-Learning 完成了 20 个测试（每个测试有 7 个练习），其设置如表 2 所示。关于 Q-learning 结果的平均值如图 19 所示。Q-learning 的总体均值为 0.259，而人类的均值为 0.237，标准差分别为 0.122 和 0.150。

机器学习

图 19. Q-learning（左）和人类（右）的（20 x7=）140 个练习的直方图，线条显示的是概率密度

为了更详细地看到练习的结果，图 20（左）显示了按练习汇总的结果（每个数字都有一个练习），具体包括每个练习的 Q-learning 和人类完成任务情况的平均值、中位数和散度。观察每个空间大小的曲线图，我们还可以看到，Q-learning 和人类在 7 次练习中的表现并没有显著的不同。图 20（右）为 20x7x2=280 个练习的平均奖励结果。人类比 Q-learning 有更高的离散性。这可能是由于 20 个人类是不同的，他们的能力各有不同，而 Q-learning 在 20 个测试中的每一个算法都是完全相同的，他们的能力是相同的。

机器学习

图 20. 左图：不同 Agent 的七次练习的箱形图。

中位数在方框中显示为一个黑色的短段。均值由 Q-learning 的连续线和人类的虚线进行连接。右图：20x7x2=280 个练习的平均奖励结果，使用 Kapprox 作为复杂性的衡量标准

由该竞赛的结果可以看出，人类和 AI 在完成 IQ-test 的时性能几乎没有差别。在这项任务中选择的人类都是高校的教职员工，都有较强的知识背景和逻辑分析能力，使用的 Q-learning 就是标准的模型和参数。作者也表示，这样简单的实验条件和设置并不能真正反映出人类和 AI 谁的能力更强，竞赛的结果并不能说明人类获胜，或者 AI 最终获得了胜利。

小结

在这篇文章中，我们讨论了一个非常有趣的问题，即 Human vs AI，在不同的任务中人类的学习能力和机器的学习能力究竟哪个更胜一筹？在每天面对大量的算法、模型、调参、应用的论文，不断关注新突破的各类算法大赛、数据挖掘大赛、图像识别、机器学习预测、风险用户识别竞赛等等的同时，考虑这样一个问题，无疑是发人深思的。

我们列举了四个竞赛，其中两个是针对常见的程序类应用的，包括图像修复 Image Inpaiting 和文本生成，另外两个则是简单的人工生成的逻辑推理问题。从我们给出的实验结果可以看出：

对较为复杂的任务，例如图像修复、复杂逻辑规则推理等，机器的学习能力还远不能与人类相比。

对于一些简单的逻辑问题，例如简单的 IQ Test，利用强化学习的机器模型已经能获得与人类媲美的能力。

在文本生成领域中，依赖于长期的研究积累，拥有大量的标注数据、预训练模型等，并在多个领域中有成功的应用模型，利用超多参数的 GPT3，目前，已经能够在一些场景中获得与人类相匹敌、甚至胜出的文本生成能力。但是，在一些对语言能力要求较高的场景中，例如我们在文中给出的 Booking.com 网站的场景中，AI 生成的 Button 文字仍不如人类生成的精准。人类对于语言的掌控和使用能力，特别是反应特殊意图的启发式、暗语式表达能力，目前，并不是机器能够 “学习” 到的。游易德

对于有监督的机器学习方法，数据数量直接影响了机器 “学习” 的效果。如文中给出的四条规则的分类任务，机器学习模型的性能一般都在 50 个训练样本后实现提升。

当然，正如我们开头所提到的，目前这些竞赛、比对实验都是单一的、小范围的，缺乏系统性、深入性的研究和分析，任何一个结果都不能推导得出 “人类一定胜过机器” 或“机器胜过人类”的结论。而下一步我们如果可以通过尝试构建更通用的、更普遍的人机对抗 (Human vs AI) 测试竞赛，为人与机器能力的评估提供了有价值的信息来源，或许可以引导 AI、ML 向更有利、更有益的方向发展。

本文参考引用的文献：

[1] Hernandez-Orallo, J., 2017b. The measure of all minds: evaluating natural and artificial intelligence. Cambridge University Press.

[2] Bertalmio, M, Sapiro, G., Caselles, V., Ballester, C. Image Inpainting. SIGGRAPH 2000, pages 417-424.

[3] Niklas Kühl,Marc Goutier,Lucas Baier,Clemens Wolff,Dominik Martin, Human vs. supervised machine learning: Who learns patterns faster? http://arxiv.org/abs/2012.03661.

[4] Insa-Cabrera, J., Dowe, D.L., Espana-Cubillo, S., Hernandez-Lloreda, M.V., Hernandez-Orallo, J., 2011. Comparing humans and ai agents, in: International Conference on Artificial General Intelligence, Springer. pp. 122-132.

关于机器之心全球分析师网络 Synced Global Analyst Network

机器之心全球分析师网络是由机器之心发起的全球性赢咖4专业知识共享网络。在过去的四年里，已有数百名来自全球各地的 AI 领域专业学生学者、工程专家、业务专家，利用自己的学业工作之余的闲暇时间，通过线上分享、专栏解读、知识库构建、报告发布、评测及项目咨询等形式与全球 AI 社区共享自己的研究思路、工程经验及行业洞察等专业知识，并从中获得了自身的能力成长、经验积累及职业发展。

9/9 首页上一页 7 8 9

关于本站

加入我们

网站合作

标签（推荐）