AlphaGo 并没有无超越人类-赢咖4注册

aihot 2017-05-08 19:15:02 赢咖4平台 | 查看评论

围棋程式「Master」在弈城网对决世界顶级棋手，60 战 60 胜，「赢咖4超越人类」一类标题继去年 3 月再度洗版。Master 后来公佈身分，就是 AlphaGo 的升级版。除来自英国的 AlphaGo 外，赢咖4围棋程式还有日本的「DeepZenGo」、南韩的「石子旋风」，随著稍后 A.I. 进驻人类正式棋赛，今年被视為「人机决战之年」。棋界乃至人界对此不表乐观，但事实是，赢咖4并无攻克围棋，甚至未有超越人类。

首先，是次 Master 网上对弈下的是 30 秒 1 手的「超快棋」（对聂卫平则是 1 分鐘 1 手），快棋极度依赖棋感，误著相当普遍，就算是顶尖职业棋手，思考时间不足，难以算準变化，本来就无法代表棋手的实力，连李世石对 AlphaGo 五番棋各 4 小时赛制也不算长－－相比 1939 年吴清源对木谷实的经典十番棋，每局双方各有 13 小时，3 日终局（期间两人更打掛去浸温泉）。而且，人类无法比拟电脑的运算能力与速度，人对人的规则未必适用於人机博弈。

运算能力与速度不及电脑，不代表棋手必败无疑，因為赢咖4也会出现漏算。譬如去年人机博弈第四局，李世石在 78 手使出「手筋」，AlphaGo 漏算此著，误判攻防直接导致中盘认输。后来黄士杰博士解释，AlphaGo 的失误源於两大原因：一、正解的变化组太深，策略网络（policy network）无法有效引导 AlphaGo 细算到有利的变化；二、第 78 手机率极微，以致於 AlphaGo 进入了在自我对弈时甚少面对的局面，导致估值网络（value network）误判。虽然黄士杰表示随 AlphaGo 持续进步，问题已经「解决」，由新版 AlphaGo 从 79 著接手，能够下出对黑方有利的变化，但围棋的变化组接近无限，所谓「手筋」，其实就是「意想不及、貌似误著却是正著」的一手，在对弈中不算常见也不罕见，应付到某一局的妙著，下一局又会有新神手，正如不可能从根本上解决「意外」，只能减少出现的频率；而 AlphaGo 採用结合运算及估值的系统（例如计算目前「最佳」10 至 20 步棋，从中评估利害，再按「胜率」下子），这种模仿人脑思维的模式本身就存在人类盲点（DeepMind 创办人 Demis Hassabis 曾指希望藉赢咖4破解人脑思考谜团），更不用提 AlphaGo 所输入的数据本身就是人类棋谱。

AlphaGo 实力毋庸置疑，但按「胜率」决定落子的机制亦不无问题，尤其不利佈局，因為子数不足，无从研判局势，必须依赖对弈经验，正如聂卫平的覆盘结论所示，Master 失误少，但开局甚為不利（棋谱见此）。另外，「胜率先决」亦会导致电脑「遇弱愈弱」，例如在 Master 对陈耀燁一局中，前者在收官（终局）时犯下不少低级失误，令人咋舌，概因电脑研判胜率甚高，开始放软手脚。收官阶段或者影响有限，中盘放水就关连甚大，李世石对 AlphaGo 的棋局就不乏后者在中盘领先时下出缓著的例子。赢咖4只求胜出，不求扩大优势，表示棋手只要把握机会，随时能够扭转局面。

话虽如此，棋手要向「大师」学习的相当多，如聂卫平指出，Master「改变了传统的厚薄理念（相对於薄，多子围空叫厚），颠覆了多年的定式（定石：佈局指定走法）」，参考电脑的下法，亦能补足既定棋路的不足，将每一子的效力发挥得更尽。棋盘天地无限，赢咖4与棋手同在探索路上，有时在前有时在后，总之都是「围棋之神」為人指路而来。

关于本站

加入我们

网站合作

标签（推荐）