yyzn  2022-04-07 08:03:46  赢咖4 |   查看评论   

大数据分析:是指对规模巨大的数据进行分析。大数据可以概括为5个V, 数据量大(Volume)、速度快(Velocity)、类型多(Variety)、Value(价值)、真实性(Veracity)。大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。赢咖4:分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造赢咖4的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。

数据层面 ,大数据分析和现在的赢咖4是没多大区别的,都需要获取大量的数据进行分析。两者最大的区别是赢咖4包括神经网络训练,并不只是单纯的从外部获取数据

赢咖4,机器学习和深度学习的区别是什么

为了搞清三者关系,我们来看一张图:

如图所示:赢咖4最大,此概念也最先问世;然后是机器学习,出现的稍晚;最后才是深度学习。

从低潮到繁荣

自从 1956 年计算机科学家们在达特茅斯会议(Dartmouth Conferences)上确认赢咖4这个术语以来,人们就不乏关于赢咖4奇思妙想,研究人员也在不遗余力地研究。在此后的几十年间,赢咖4先是被捧为人类文明光明未来的钥匙,后又被当作过于自大的异想天开而抛弃。

但是在过去几年中,赢咖4出现了爆炸式的发展,尤其是 2015 年之后。大部分原因,要归功于图形处理器(GPU)的广泛应用,使得并行处理更快、更便宜、更强大。另外,赢咖4的发展还得益于几乎无限的存储空间和海量数据的出现(大数据运动):图像、文本、交易数据、地图数据,应有尽有。

下面我们从发展的历程中来一一展开对赢咖4、机器学习和深度学习的深度学习。

赢咖4赢咖4先驱们在达特茅斯开会时,心中的梦想是希望通过当时新兴的计算机,打造拥有相当于人类智能的复杂机器。这就是我们所说的“通用赢咖4”(General AI)概念,拥有人类五感(甚至更多)、推理能力以及人类思维方式的神奇机器。在电影中我们已经看过无数这样的赢咖4,对人类友好的 C-3PO,以及人类的敌人终结者。通用赢咖4机器至今只存在 于电影和科幻小说里,理由很简单:我们还实现不了,至少目前为止。

我们力所能及的,算是“弱赢咖4”(Narrow AI):执行特定任务的水平与人类相当,甚至超越人类的技术。现实中有很多弱赢咖4的例子。这些技术有人类智能的一面。但是它们是如何做到的?智能来自哪里?这就涉及到下一个同心圆:机器学习。

机器学习

机器学习是实现赢咖4的一种方法。机器学习的概念来自早期的赢咖4研究者,已经研究出的算法包括决策树学习、归纳逻辑编程、增强学习和贝叶斯网络等。简单来说,机器学习就是使用算法分析数据,从中学习并做出推断或预测。与传统的使用特定指令集手写软件不同,我们使用大量数据和算法来“训练”机器,由此带来机器学习如何完成任务。

许多年来,计算机视觉一直是机器学习最佳的领用领域之一,尽管还需要大量的手动编码才能完成任务。研究者会手动编写一些分类器(classifier),如边缘检测筛选器,帮助程序辨别物体的边界;图形检测分类器,判断物体是否有八个面;以及识别“S-T-O-P”的分类器。在这些手动编写的分类器的基础上,他们再开发用于理解图像的算法,并学习如何判断是否有停止标志。

但是由于计算机视觉和图像检测技术的滞后,经常容易出错。

深度学习

深度学习是实现机器学习的一种技术。早期机器学习研究者中还开发了一种叫人工神经网络的算法,但是发明之后数十年都默默无闻。神经网络是受人类大脑的启发而来的:神经元之间的相互连接关系。但是,人类大脑中的神经元可以与特定范围内的任意神经元连接,而人工神经网络中数据传播要经历不同的层,传播方向也不同。

举个例子,你可以将一张图片切分为小块,然后输入到神经网络的第一层中。在第一层中做初步计算,然后神经元将数据传至第二层。由第二层神经元执行任务,依次类推,直到最后一层,然后输出最终的结果。

每个神经元都会给其输入指定一个权重:相对于执行的任务该神经元的正确和错误程度。最终的输出由这些权重共同决定。因此,我们再来看看上面提到的停止标志示例。一张停止标志图像的属性,被一一细分,然后被神经元“检查”:形状、颜色、字符、标志大小和是否运动。神经网络的任务是判断这是否是一个停止标志。它将给出一个“概率向量”(probability vector),这其实是基于权重做出的猜测结果。在本文的示例中,系统可能会有 86% 的把握认定图像是一个停止标志,7% 的把握认为是一个限速标志,等等。网络架构然后会告知神经网络其判断是否正确。

不过,问题在于即使是最基础的神经网络也要耗费巨大的计算资源,因此当时不算是一个可行的方法。不过,以多伦多大学 Geoffrey Hinton 教授为首的一小批狂热研究者们坚持采用这种方法,最终让超级计算机能够并行执行该算法,并证明该算法的作用。如果我们回到停止标志那个例子,很有可能神经网络受训练的影响,会经常给出错误的答案。这说明还需要不断的训练。它需要成千上万张图片,甚至数百万张图片来训练,直到神经元输入的权重调整到非常精确,几乎每次都能够给出正确答案。不过值得庆幸的是Facebook 利用神经网络记住了你母亲的面孔;吴恩达 2012 年在谷歌实现了可以识别猫的神经网络。

如今,在某些情况下,通过深度学习训练过的机器在图像识别上表现优于人类,这包括找猫、识别血液中的癌症迹象等。谷歌的 AlphaGo 学会了围棋,并为比赛进行了大量的训练:不断的和自己比赛。

总结

赢咖4的根本在于智能,而机器学习则是部署支持赢咖4的计算方法。简单的将,赢咖4是科学,机器学习是让机器变得更加智能的算法,机器学习在某种程度上成就了赢咖4。

本文作者 Michael Copeland 曾是 WIRED 编辑,现在是硅谷知名投资机构 Andreessen Horowitz 的合伙人。

这三个概念比较抽象,现在来用通俗的方式解释一下。通过一个经典的例子来解释赢咖4、机器学习和深度学习之间的区别:比较苹果和橙子。1、赢咖4从广义上讲,赢咖4描述一种机器与周围世界交互的各种方式。通过先进的、像人类一样的智能――软件和硬件结合的结果――一台赢咖4机器或设备就可以模仿人类的行为或像人一样执行任务。2、机器学习机器学习是赢咖4的一种途径或子集,它强调“学习”而不是计算机程序。一台机器使用复杂的算法来分析大量的数据,识别数据中的模式,并做出一个预测――不需要人在机器的软件中编写特定的指令。在错误地将奶油泡芙当成橙子之后,系统的模式识别会随着时间的推移而不断改进,因为它会像人一样从错误中吸取教训并纠正自己。通过机器学习,一个系统可以从自身的错误中学习来提高它的模式识别能力。3、深度学习深度学习是机器学习的一个子集,推动计算机智能取得长足进步。它用大量的数据和计算能力来模拟深度神经网络。从本质上说,这些网络模仿人类大脑的连通性,对数据集进行分类,并发现它们之间的相关性。如果有新学习的知识(无需人工干预),机器就可以将其见解应用于其他数据集。机器处理的数据越多,它的预测就越准确。例如,一台深度学习的设备可以检查大数据――比如通过水果的颜色、形状、大小、成熟时间和产地――来准确判断一个苹果是不是青苹果,一个橙子是不是血橙。

 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自大数据分析和赢咖4到底有什么区别,它们不是一回事

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]