aihot  2017-05-14 11:22:07  智能硬件 |   查看评论   

 

事实上,Tesauro的工作对于波拉克和他的领域中的其他人来说是非常有趣和令人兴奋的,因为它表明从最小的规范开始的学习机可以成为非常复杂。问题是这是怎么回事?在分配权重时有些聪明,在他使用的学习技术中有些微妙的,或者是关于游戏的东西?嗯,游戏的性质使它特别适合一个自我播放网。不像棋,西洋双陆棋不能以平局结束,骰子卷插入一个随机性的游戏,迫使人工玩家探索更广泛的战略比在一个确定性游戏的情况。除此之外,Pollack怀疑真正的关键在于球员的竞争的共生性质。
 
为了测试这个理论,他和他的团队决定,他们将通过提供他们最原始的可能的算法或学习规则,让他们的初始两个球员真的,真的愚蠢。在认知科学家中,这被称为登山。想象一个程序如此愚蠢,蚯蚓看起来像约翰·冯·诺伊曼比较。这种生物只有一个目标在生活中:爬到山顶,留在那里。它只有一个规则:采取一个步骤,如果该步骤是向上的方向,采取另一个步骤,在这个方向;如果方向是向下的,不要在那里 - 改变方向,然后重试。在一个完美光滑的锥形山上没有问题 - 事情到达高峰没有问题。但是如果山上有一个小峰呢?疙瘩?这个生物不可避免地爬到疙瘩的顶部并停留在那里,因为它从疙瘩的峰顶下来的每一步都下降了。行为远没有趣。
 
在步步高的爬坡,这个简单的第一条规则是“做一个合法的举动。初始数字竞争者在其网络中以零权重开始,这等于随机游戏,并且被设置为与略微变异的挑战者竞争。获胜者有权复制。所得到的一代在下一个周期中针对新的突变挑战者竞争。如果这个军备竞赛过程成功,获胜的网络变得更加复杂,在步步高更进化适合。波拉克决定使用登山,因为,他说,“这是那么简单,没有人会赋予一些令人惊讶的强大的内部结构单独登山,事实上,它工作这么好是一个指示军备竞赛方面真正的重要性。
 
军备竞赛避免了在进化计算领域常见的某些问题,部分原因是它与所谓的遗传算法一起工作。这些算法被称为“遗传”,因为它们模仿基因在自然选择中的行为。该技术从由1和0的随机串构成的人工群体开始,其由一组分类器规则评定。例如,我们可能需要一个识别cats的分类器规则。在这种情况下,我们可以确定在字符串的某些地方的1s指定cat属性,例如“purrs”,“捕捉老鼠”,“毛茸茸的”,“有爪子”等等。 0可能代表noncat属性:“metallic”,“winged”,“votes Republican”。一组这些分类器规则或测试可以被写成使得当组合时,它们解决特定的真实世界问题。完整的测试集被称为适应度函数 - 一个建议促进生物生存和物种进化的适应度的术语。在实践中,代码串的群体受到适应度函数的拟合。那些包括由该功能喜欢的位的位存活并且“配合”,其他人灭亡。这些实体可以交换一小部分代码,而不是像微生物交换DNA条带,以制造新的 - 也许更适合的 - 基因组。经过许多代,弦将越来越接近问题所提出的良好解决方案。
 
这种遗传方法可以创建具有不能以传统方式容易地编程的功能的程序。由John Holland在密歇根大学独立发明,并且在60年代末由Lawrence Fogel(作为“进化规划”或“自然选择规划”),该领域最近取得了新的蒸汽,John Koza证明遗传算法如何依赖编码表达式(通常以Lisp编写)的能力实际上可以用于解决许多困难的问题,在商业中,在计算游戏回报中,在喷气发动机设计中等等。
 
Pollack说,这种程序的问题在于写适应度函数。

“Koza和许多其他人在这个领域基本上是工程师在短期内搜索有用的产品事实上,Koza想要称为现场基因工程,但这个术语,当然已经被真正的生物学家声称,所以这些工程师用于编写相当复杂的适应函数以驱动遗传原语的种群,以产生在合理数目的循环中可用的东西,但是,当然,一旦你开始这样做,你倾向于遇到与象征主义者相同的问题 - 健身功能开始变得像常规AI程序一样复杂和笨拙,它是一个shell游戏:你只是把你的知识工程能量投资在不同的地方。
 
我们回到实验室再看看西洋双陆棋玩家和一个演示日本游戏的程序的演示,这是臭名昭着的难以编程,没有准备好黄金时间。在路上,我们经过一个老式的机器车间,一个炮塔车床和研磨机的地方,与实验室的其余部分形成鲜明对比。 “我们计划制造赢咖4,”Pollack独自地说。 “我想尝试在虚拟世界中发展逼真的行为,然后将它们下载到现实世界中,这当然是未来的。
 
使用coevolution?
 
“可能的,真正有趣的是,没有必要生成一个绝对适合度函数,因为它是基于竞争单位的相对适应性 - 竞争的”遗传“线 - 就像它在自然界中一样。你可以捕捉自然选择的原始无与伦比的力量,随着玩家 - 遗传基元 - 变得越来越好,适应度函数随着人口的变化而变化,我的意思是,健身动态变化,就像环境变化和变得更丰富,随着其中的个体生物的进化而产生更多的和变异的生命形式。
 
他有一点:在这个星球上肆虐超过20亿年的类型的进化武器竞赛是我们知道的唯一能够产生身体,大脑和最终的头脑的过程。现代联系主义者的真正问题是,任何可构建的网络是否将具有做现在只有大脑可以做的事情所必需的能力和控制。波拉克和其他任何人都不能指定如何形成这样的网络,但波拉克指出,连接主义将扫描AI进入当前的思想革命,改变物理和生物科学的可能性 - 这是基于新的欣赏的革命分形几何,复杂性和混沌理论。另一方面,它可能全部破产,就像它在60年代一样。波拉克承认这种可能性,但补充说,如果它不会在10年内崩溃,连接主义将克服其目前的局限性,并成为一个蓬勃发展的领域。
 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自在寻找电子大脑

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]