aihot  2017-05-10 06:46:43  赢咖4平台 |   查看评论   

 智能搜索引擎

虽然大多数人都同意Google已经设置了当前的网络搜索标准,但一些技术人员表示,由于人工智能的进步,更好的工具正在发展。
搜索就像许多人现在的氧气,考虑到谷歌在Web文档分析,超级计算和互联网广告的突破,它很容易认为这是好的。但是一些赢咖4(AI)的企业家说,谷歌不是历史的结束。相反,它的技术是我们下一步的基础。
 
AI技术的支持者说,有一天人们将能够搜索小说的阴谋,或列出所有在过去五年里对环境负面的政治家,或者找到在哪里买一只刚刚发现的伞街道。 AI中的技术如自然语言,对象识别和统计机器学习将再次开始引起Web搜索者的想象力。
 
Medstory公司首席执行官兼创始人Alain Rappaport说,“这是Web为您开展工作的聪明方式的开始,”Medstory的首席执行官兼创始人Alain Rappaport表示,七月。
 
“网络和信息量正在以这样的速度增长,因此建立一个利用知识并为人们有效利用知识的智能系统是至关重要的,”他补充说。
 
Medstory不是单独的。其他年轻公司,如隐形创业公司Powerset和图像专家Riya也在寻求将奥术计算技术转化为商业成功案例。
 
取消学习“keywordese”
在搜索引擎的眼中,Web本质上是几十亿页上的单词的主体,以及连接单词的超链接。 Google的重大突破之一是有效地链接这些词,通过网页上的字词外观来衡量相关性,指向该网页的超链接数量或其受欢迎程度。
 
通常,搜索引擎不理解这些词 - 它们仅仅被为匹配在页面上更重要的关键词,更靠近在一起或者更频繁地与其他页面链接。因此,实质上,当有人输入“猛ly猛oth象”时,他或她会在搜索引擎上发送搜索引擎,而不是动物。
 
因此,搜索引擎错过了人类语言的细微差别。例如,Google可以通过搜索包含单词“books”和“children”的网页来简单搜索“children by children”,但它会消除所谓的停止词 - 在这种情况下,“by by” “ - 因为停用词几乎在每一页上出现。然而,那些停止词经常发生,因为它们对短语的意义很重要。 “儿童书”不同于“关于儿童的书”,不同于“儿童书”。

Barney Pell
尚未推出的AI搜索引擎的创始人Barney Pell称之为搜索引擎“keywordese”的限制性语言。
 
Pell说,“搜索引擎试图培训我们成为一个好的关键字搜索者,我们沮丧的智能,所以它是自然的计算机,”Pell,其公司,总部设在加利福尼亚州帕洛阿尔托说。
 
“在社会中发生的巨大转变是,不是将人类表达和交互移动到计算机的容易的地方,我们将移动计算机的能力来处理对人类自然的表达式,”他说。
 
Powerset,还没有透露其发布日期,正在使用AI来训练计算机,不仅仅是在页面上读的话,而是在这些词之间的连接,并作出推断的语言。这样,搜索引擎可以考虑并重新定义超出最流行的页面或在搜索框中输入的关键字最多的网站的相关性。
 
“下一步将是能够识别和找到世界上不是网页上的话的一切,例如识别事件的概念或描述,如一个男孩遇到女孩的故事情节如果你放入“现在你结束了许多其他的东西,”埃斯特·戴森,版本0.9的博客,由ZDNet出版并由CNET网络拥有的说。 CNET Networks是News.com的发行商,Dyson已经亲自投资Powerset。
 
为什么是时候试验AI和搜索?将AI构建到搜索引擎中的最大障碍之一是其在大规模上是不切实际的。批评者说,有效计算结果所需的计算能力可能非常昂贵。但是摩尔定律的效果正在推低计算机,CPU和带宽的价格,机会也成熟。搜索也是一个有利可图的业务。毕竟,由于与其结果相关的定位广告,Google每年的价值为60亿美元。
 
大多数搜索社区认为,来自Google和其他人的Web搜索的进步将逐步增加,通过从Google的Pagerank挤压一点,或通过调整相关性,或索引很难找到文件。但为了下一次飞跃,像Pell这样的高管说,必须建立一个新的架构。
 
采取搜索的脉搏
例如,Medstory正在将赢咖4技术应用于一个知识领域,医疗保健,这是一个快速变化的行业,人们如何获得最新的信息效率低下。 Rappaport说,处理一个特定的知识体系更经济和高效。但Medstory为消费者和专业人士从医学中提取更多知识的技巧可以应用于其他行业,如金融或娱乐。

 

Alain Rappaport
“我们的工作是摆脱噪音,所以信息量小于Web,”他说。 “另一方面,我们必须计算的东西,而不仅仅是排名和链接,这是计算强度。
 
Rappaport说,AI最近的进展之一是从依靠人类到编目各种数据到编程计算机之间的连接以完成工作,或者他所说的知识结构的自动化。卡内基梅隆大学机器学习主席汤姆·米切尔(Tom Mitchell)称之为用于统计语言处理的机器学习或允许计算机阅读文本的学习算法。
 
Rappaport不会透露公司技术的秘密;然而,他说,这是一个24/7的计算过程,连接有价值的信息在一起,如将一个解释疾病的症状的文档链接到另一个文档与该疾病的治疗药物的分析。
 
“它不断地提取信息,然后可以建立自己,”Rappaport说。
 
这些技术在Medstory中表现为偶然的知识,否则会使Web搜索者花费数小时或数天来获取。
 
例如,关于术语“低胆固醇”的搜索返回一组详细的结果,其潜入主题的主题,例如药物,症状和营养信息。在每个子主题内,列出了与降低胆固醇最相关的药物,症状或营养补充剂。以“营养”为例,最相关的链接是橄榄油。将光标指向橄榄油,一个页面弹出橄榄油对高胆固醇患者的健康益处。除非有人已经知道,否则信息可能需要很长时间才能在Google等搜索引擎中找到。
 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自智能搜索引擎

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]