aihot  2017-05-08 19:15:02  赢咖4平台 |   查看评论   
AlphaGo 并没有无超越人类
围棋程式「Master」在弈城网对决世界顶级棋手,60 战 60 胜,「赢咖4超越人类」一类标题继去年 3 月再度洗版。Master 后来公佈身分,就是 AlphaGo 的升级版。除来自英国的 AlphaGo 外,赢咖4围棋程式还有日本的「DeepZenGo」、南韩的「石子旋风」,随著稍后 A.I. 进驻人类正式棋赛,今年被视為「人机决战之年」。棋界乃至人界对此不表乐观,但事实是,赢咖4并无攻克围棋,甚至未有超越人类。
 
首先,是次 Master 网上对弈下的是 30 秒 1 手的「超快棋」(对聂卫平则是 1 分鐘 1 手),快棋极度依赖棋感,误著相当普遍,就算是顶尖职业棋手,思考时间不足,难以算準变化,本来就无法代表棋手的实力,连李世石对 AlphaGo 五番棋各 4 小时赛制也不算长--相比 1939 年吴清源对木谷实的经典十番棋,每局双方各有 13 小时,3 日终局(期间两人更打掛去浸温泉)。而且,人类无法比拟电脑的运算能力与速度,人对人的规则未必适用於人机博弈。
 
运算能力与速度不及电脑,不代表棋手必败无疑,因為赢咖4也会出现漏算。譬如去年人机博弈第四局,李世石在 78 手使出「手筋」,AlphaGo 漏算此著,误判攻防直接导致中盘认输。后来黄士杰博士解释,AlphaGo 的失误源於两大原因:一、正解的变化组太深,策略网络(policy network)无法有效引导 AlphaGo 细算到有利的变化;二、第 78 手机率极微,以致於 AlphaGo 进入了在自我对弈时甚少面对的局面,导致估值网络(value network)误判。虽然黄士杰表示随 AlphaGo 持续进步,问题已经「解决」,由新版 AlphaGo 从 79 著接手,能够下出对黑方有利的变化,但围棋的变化组接近无限,所谓「手筋」,其实就是「意想不及、貌似误著却是正著」的一手,在对弈中不算常见也不罕见,应付到某一局的妙著,下一局又会有新神手,正如不可能从根本上解决「意外」,只能减少出现的频率;而 AlphaGo 採用结合运算及估值的系统(例如计算目前「最佳」10 至 20 步棋,从中评估利害,再按「胜率」下子),这种模仿人脑思维的模式本身就存在人类盲点(DeepMind 创办人 Demis Hassabis 曾指希望藉赢咖4破解人脑思考谜团),更不用提 AlphaGo 所输入的数据本身就是人类棋谱。
 
AlphaGo 实力毋庸置疑,但按「胜率」决定落子的机制亦不无问题,尤其不利佈局,因為子数不足,无从研判局势,必须依赖对弈经验,正如聂卫平的覆盘结论所示,Master 失误少,但开局甚為不利(棋谱见此)。另外,「胜率先决」亦会导致电脑「遇弱愈弱」,例如在 Master 对陈耀燁一局中,前者在收官(终局)时犯下不少低级失误,令人咋舌,概因电脑研判胜率甚高,开始放软手脚。收官阶段或者影响有限,中盘放水就关连甚大,李世石对 AlphaGo 的棋局就不乏后者在中盘领先时下出缓著的例子。赢咖4只求胜出,不求扩大优势,表示棋手只要把握机会,随时能够扭转局面。
 
话虽如此,棋手要向「大师」学习的相当多,如聂卫平指出,Master「改变了传统的厚薄理念(相对於薄,多子围空叫厚),颠覆了多年的定式(定石:佈局指定走法)」,参考电脑的下法,亦能补足既定棋路的不足,将每一子的效力发挥得更尽。棋盘天地无限,赢咖4与棋手同在探索路上,有时在前有时在后,总之都是「围棋之神」為人指路而来。
 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自AlphaGo 并没有无超越人类

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]