首页
学习
活动
专区
工具
TVP
发布

误区解读:ML和DL之间的区别和使用情况

【IT168 资讯】深度学习是机器学习的一个子集,都是人工智能的子集。机器学习与深度学习不完全属于一个拳击淘汰赛中,深度学习是机器学习的一个子集,而它们都是人工智能(AI)的子集。但是,在机器学习和深度学习的定义和用例方面,市场上存在很多混淆,现在让我们来澄清一下混淆。

·人工智能(AI)是模拟和模仿计算机系统和机器中的智能人类行为的研究。

·机器学习是AI的一个子领域,它使用算法将AI概念应用到计算系统中。计算机识别并根据数据模式采取行动,随着时间的推移学习提高其准确性,无需明确的编程机器学习背后的分析,如预测编码、集群和视觉热图。

·深度学习是机器学习的一个子领域,是人工神经网络的另一个名称。深度学习计算机网络模拟人类大脑感知、组织和从数据输入的方式。撇开天网,深度学习今天依然是存在的。

机器学习与深度学习

通常人们对于机器学习与深度学习的想法可能会忽略一点,如前所述,深度学习是机器学习的一个子集。在这一点上,你更有可能在应用程序中使用机器学习,而不是深度学习,但它仍然是一个发展中的技术,而且部署起来很昂贵。现在有些产品已经上市了,随着时间的推移,人们会发现深度学习将变得更加普遍。

我们来看两者之间的区别和使用情况。

机器学习

作为人工智能的一个子集,机器学习使用算法来解析数据,从结果中学习,并运用学习来做出决定或预测。示例包括聚类、贝叶斯网络和可视化数据映射。例如,在电子档案资料查询和合规性调查中,热图和视觉集群可以将图形搜索结果呈现给人类,他们可以使用结果深入到其他模糊的数据中。

机器学习技术分为两类:监督机器学习和无监督机器学习。监督式学习取决于人为生成的种子集合,教导软件如何定义数据。预测编码就是一个很好的例子。该软件指的是将数据模式匹配到相关度百分比的种子集。随着时间的推移,预测编码工具从持续进行的审阅反馈中学习。

无监督机器学习取决于识别数据中包含的模式并将其与其他数据或搜索查询进行比较。机器学习算法随着数据集的增长和更多模式的出现而随时间学习。无监督机器学习包括集群、概念搜索和接近重复数据删除。

例如,聚类匹配文档之间相似的文本和元数据,并将数据呈现在可视化集群中。概念搜索通过识别和匹配概念来扩展基于文本的查询。近似重复数据删除比较类似的数据,并根据相似程度排除文档,而电子邮件线程将孤立的电子邮件链接到相应的线程。这些分析中的每一个都从其行动中学习,以提高性能和准确性。

机器学习基础设施差异很大,单个系统可以实现有限的集群或网络流量报告,而大型系统则包含数十台服务器和大规模并行处理(MPP)架构,用于跨多个数据源的海量数据。

深度学习

深度学习(也称为人工神经网络)基于所有机器学习算法。但是,它不使用数据分类等任务特定的算法。相反,它通过识别来自非结构化输入的代表性数据,并输出准确的行动和决定来模拟人类的大脑结构和功能。

学习可以被监督或不受监督,这意味着大的神经网络可以接受标记的输入,但不需要它。学习程序教会神经网络如何构建不同的处理层,当网络处理输入时,他们根据数据输入和输出创建自己的层。这种深度学习的水平允许神经网络自动从原始数据中提取特征而无需额外的人力输入。

神经网络由多个简单连接的处理器(称为神经元)组成,这些神经元是为模仿人脑中的神经元而创建的数学函数。这些人造神经元组成了神经网络的单元。

简单地说,每个神经元接收两个或更多的输入,处理它们,并输出一个结果。一些神经元接收来自外部传感器的输入,而另一些神经元则被来自其他活动神经元的输入激活。神经元可能激活额外的神经元,或者可能通过触发动作影响外部环境。所有活动都是在自创的隐藏层中进行的,每个连续的图层都会输入前一层的输出。

实际上,神经网络摄取非结构化数据:声音、文本、视频和图像。网络将数据分成数据块并发送给单独的神经元和层进行处理。一旦这个离散的处理完成,网络产生最后的输出层。

大规模的可扩展性是神经网络的关键。神经网络的性能取决于它可以摄取、训练和处理多少数据;数据越多意味着效果越好。这是另一个区别于更基本的机器学习,其算法通常在一定水平上平稳。深度学习只是通过其计算资源来限制其性能。因此,神经网络的“深层”部分:计算资源越多,层次越深,产出越广泛。尽管深度学习不是那么快捷和容易,但更低的计算处理能力使研发工作发生了革命性的变化。

机器学习和深度学习的常用用例

重要的是要记住机器学习的用例已经在市场上了。深度学习的用例主要是现阶段的发展目标,商业化程度有限。一些用例是相似的:区别在于神经网络可以增长到接近无限的学习和输出规模。机器学习更受约束,适合具体的实际计算任务。另外请记住,它们两个不是相互排斥的。

展望机器学习和深度学习的未来

你不会在每个街角都找到深度学习/人工神经网络的身影。他们普遍需要大量的标记数据进行监督学习,或大量的非结构化数据进行无监督学习。深度学习技术开发人员需要花费大量的时间标记和向神经网络输入数据,或者需要输入数以百万计的非结构化对象来实现无监督学习。

在今天的数据密集型世界中,拥有足够的数据不是问题。标记足够的数据,或将足够的未标记数据引入神经网络是一个挑战。尽管处理能力不断增加,价格也有所下降,但密集计算仍然需要对系统和支持进行大量的投资。

尽管如此,深度学习在许多不同的业务垂直领域都有很好的用例。像谷歌和Facebook这样的公司正在投入深度学习来开发这些实际的应用程序,而其他开发者也在跟风。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180111C0RINC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券