aihot  2017-06-07 06:46:01  智能硬件 |   查看评论   

  本月,MIT出版社出版了Stork的书“HAL的遗产:2001年的计算机作为梦想和现实”,一组由计算机科学领域的当今顶尖研究人员撰写的文章。 HAL的Legacy大部分都是用电影猜测游戏:Clarke和Kubrick有多接近得到这项技术?例如,苹果研究院(Apple Fellow)和苹果高级技术组副总裁唐纳德·诺曼(Donald Norman)对探索公司的控制面板缺乏良好的人体工程学进行了惩罚性研究。

 

  但翻转问题,游戏可以更有趣。不要问,2001年是怎么接近是正确的。询问今天的电脑是如何接近实现HAL的承诺。我们什么时候能够与类似HAL的计算机交谈,并认为它几乎是平等的? 2001年的梦想何时成为现实?也许最简单的方法来回答这个问题是逐步看看它是什么意思是HAL。

 

最终的chatterbot

 

  与今天的计算机不同,HAL与Discovery的船员通信的主要方式是通过口头的话。鲍曼和普尔说话; HAL听和理解。我们从一台能够理解主人声音的电脑有多远?

 

  语音识别是一个困难但很大程度上解决的问题。五年多来,波士顿地区的两家公司 - Dragon Systems和Kurzweil应用智能 - 已经出售了一些程序,让您使用自己的声音命令个人计算机。这些程序得到更好的每次PC得到更快。今天,他们可以识别超过6万字,并控制各种各样的PC赢咖4平台,包括字处理程序和电子表格。龙和Kurzweil程序被广泛使用的人谁不能输入,因为身体残疾。他们越来越多地在一个没有学会输入或没有学会拼写的人中找到一个市场。

 

  但是Dragon和Kurzweil系统可能很难使用。与HAL不同,HAL可以听到连续流中的人说话,今天的系统要求你在每个单词之间暂停。程序使用暂停来找到每个单词的开始和结束。然后计算机在语音字典中查找该单词,创建可能的匹配列表。语法的基本知识帮助这些程序选择正确的词,并解决同义词之间的差异,如“写”和“正确”。

 

  连续语音系统使用与当今逐字系统相同种类的算法,但是增加了计算每个单词在哪里开始和停止的负担。做出这些决定需要更多的计算能力。

 

  Dragon Systems公司总裁兼联合创始人Janet Baker和Kurzweil应用智能公司的创始人兼首席技术官Ray Kurzweil表示他们在各自的实验室都拥有不需要演讲者暂停演讲的系统。 “我们展示了几年前的第一台连续识别机”,Baker说,她坚持她的连续语音系统可以处理5000字的词汇。同时,Kurzweil的实验室构建了一个系统,可以识别Microsoft Word使用的一千个不同的命令。 “你可以说,”去下一页的第二段,并强调句子中的每一个字,“Kurzweil说。

 

  Baker和Kurzweil都认为,商业上可行的连续语音识别系统就在拐角处 - 比如说,再过两三年。已经,他们的两个商业产品允许数字的连续语音识别。例如,您可以说一个电话号码,而不要在数字之间暂停。但两家公司都不会为记者证明其连续的发言系统。大概,他们还没有准备好黄金时间。

 

  底线:我们接近达到HAL的语音识别水平,进步正在加快。到2001年,我们应该有。

 

读我的唇语

 

  HAL可以做的不仅仅是理解口语 - 计算机也可以阅读嘴唇。在这部电影的关键场景之一,鲍曼和普尔撤退到一个发现的密封pods有一个私人谈话。 HAL通过窗户看着他们的嘴唇,意识到两个人可能试图断开他的大脑。

 

  计算机化的可能吗? Arthur C. Clarke没有这么认为 - 不是在2001年,没有。 “他认为在谈话者的形象中没有足够的信息,”Stork说,他在克拉克在HAL的遗产工作。克拉克甚至不想把这个场景放在电影里。它只是插入在库布里克坚持的戏剧效果。

 

  三十年后,关于纯粹脂肪分解的效力 - 甚至在人类 - 的争论仍然在很大程度上未决定。罗切斯特理工学院哲学教授韦德·罗宾逊(Wade Robison)说,学校的9000名本科生中有1000人深陷聋哑,因此人类智力可以掌握它。罗宾逊特别记得一个学生:“我没有一个线索她聋,直到有一天我碰巧在我的办公室和她一对一地说话,我完成了一句话,因为我转过来接听电话,她不得不请我重复句子,当我转身时,我几乎开玩笑地说:“你能听到我在说什么吗?她说,“是的,但我在读你的嘴唇。

 

  其他研究人员不同意说话者的形象是足够的。加利福尼亚大学圣克鲁斯分校心理学系教授Dominic Massaro说:“我们已经测试了除了可见的言语之外没有任何其他东西的人。 “不幸的是,他们中的很多人并没有真正地得到一切。

 

  在任何情况下,计算机解密工作 - 或者说是语音解析,因为计算机看着人的下巴,舌头,牙齿以及嘴唇 - 已经稳定地进行了六年多。 David Stork是该领域的主要研究人员之一。

 

  为什么要语音读?为了帮助语音识别,Stork解释说。事实证明,结合视觉与声音可以帮助程序消除两个单词的声音相似,但看起来不同,当他们说话,如“我”和“膝盖”。他解释说:“语音识别有助于那些声音识别最需要的话语。

 

  但是即使辅助的语音解码仍处于起步阶段。研究人员估计,商业语音识别系统使用摄像机来提高其准确性将超过10年。

 

  底线:Clarke可能是正确的语音编码可能是不现实的。在10年内,计算机可能会进步到他们可以通过语音识别获得谈话的要点。

 

跟我讲话

 

  从HAL发表他的第一句话,电影观众清楚的是,9000系列是一个优越的架构:HAL的声音是非机械的。

 

  对于库布里克来说,创造HAL的声音很容易。库布里克简单地把一个包含HAL的话的脚本交给加拿大安大略省的一个莎士比亚演员Douglass Rain,并要求他把这些话翻译成录音机。雨了一天半。 (三十年后,HAL仍然是Rain最令人难忘的角色,也许因为这个原因,演员拒绝与媒体讨论HAL或电影。)

 

 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自HAL 9000计算机

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]