详解数据挖掘与机器学习的区别与联系

0、为什么写这篇博文

  最近有很多刚入门AI领域的小伙伴问我:数据挖掘与机器学习之间的区别与联系。为了不每次都给他们长篇大论的解释,故此在网上整理了一些资料,整理成此篇文章,下次谁问我直接就给他发个链接就好了。

  本篇文章主要阐述我个人在数据挖掘、机器学习等方面的学习心得,并搜集了网上的一些权威解释,或许不太全面,但应该会对绝大多数入门者有一个直观地解释。

  本文主要参照周志华老师的:机器学习与数据挖掘 一文。有兴趣的可以自行百度,其文对人工智能、数据挖掘、机器学习等演变历程,有详细介绍。

1、概念定义

首先,第一步,我们对机器学习和数据挖掘的定义做一下总结,看看大家有没有一点体会:

机器学习:广泛的定义为 “利用经验来改善计算机系统的自身性能。”,事实上,由于“经验”在计算机系统中主要是以数据的形式存在的,因此机器学习需要设法对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且为此而受到越来越多的关注。

数据挖掘:一种解释是“识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程”,顾名思义,数据挖掘就是试图从海量数据中找出有用的知识。

2、关系与区别

2.1 关系

   数据挖掘可以认为是数据库技术与机器学习的交叉,它利用数据库技术来管理海量的数据,并利用机器学习和统计分析来进行数据分析。其关系如下图:

  数据挖掘受到了很多学科领域的影响,其中数据库、机器学习、统计学无疑影响最大。粗糙地说,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。由于统计学界往往醉心于理论的优美而忽视实际的效用,因此,统计学界提供的很多技术通常都要在机器学习界进一步研究,变成有效的机器学习算法之后才能再进入数据挖掘领域。从这个意义上说,统计学主要是通过机器学习来对数据挖掘发挥影响,而机器学习和数据库则是数据挖掘的两大支撑技术。

2.2 区别

   数据挖掘并非只是机器学习在工业上的简单应用,他们之间至少包含如下两点重要区别:

  1. 传统的机器学习研究并不把海量数据作为处理对象,因此,数据挖掘必须对这些技术和算法进行专门的、不简单的改造。
  2. 作为一个独立的学科,数据挖掘也有其独特的东西,即:关联分析。简单地说,关联分析就是希望从数据中找出“买尿布的人很可能会买啤酒”这样看起来匪夷所思但可能很有意义的模式。

原文发布于微信公众号 - 机器学习算法全栈工程师(Jeemy110)

原文发表时间:2017-07-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯技术工程官方号的专栏

从研究到应用:腾讯AI Lab的自然语言理解和生成

腾讯AI Lab高级研究员李菁博士介绍了如何理解和生成自然语言,并介绍了实验室的相关研究和应用成果。

6.5K11
来自专栏新智元

【AI 工厂】Facebook 计算机视觉 Lumos平台,内容理解之上的图像技术

【新智元导读】Facebook 官方博客最新发表文章,详细介绍其 AI 平台 FBLearner Flow 及建立在上面的专用于图像和视频理解任务的 Lumos...

2689
来自专栏PPV课数据科学社区

五类受自然启发的AI算法

摘要: 本文主要讲解了受自然启发的五类AI算法以及各自的实际用例:神经网络、遗传算法、群集集体智慧、强化学习、人体免疫。 ? 搜索/寻路算法 搜索算法...

3054
来自专栏AI科技评论

【业界】谷歌 DeepMind 的可微分神经计算机 DNC 怎么样?看 Facebook AI 研究员田渊栋、贾扬清怎么说

田渊栋,卡耐基梅隆大学机器人系博士学位、上海交通大学硕士学位和学士学位,前谷歌无人车项目组成员,现任 Facebook 人工智能组研究员,主要负责 Facebo...

3435
来自专栏鸿的学习笔记

机器学习/机器智能/人工智能/深度学习这些都是些啥?

我们经常被问到我们如何区分我们与其他人的技术。这个任务由于没有公认的词汇而变得困难; 每个人都不同地使用上述术语(和其他相关术语)。此外,这些术语中的一些的一般...

741
来自专栏CDA数据分析师

机器学习领域的突破性进展(附视频中字)

机器学习的发展涉及到各个方面,从语音识别到智能回复。但这些系统中的“智能”实际上是如何工作的呢?还存在什么主要挑战?在本次讲座中将一一解答。 Google I/...

17710
来自专栏数据科学与人工智能

【数据可视化】读图时代可视化及其技术分析

一、可视化的涵义 1、可视化的由来 “可视化”一词源于英文“Visualization”,译为“形象化”、“成就展现”等。事实上,将任何抽象的事物、过程变成图形...

2288
来自专栏月色的自留地

从锅炉工到AI专家(1)

1475
来自专栏机器学习算法与Python学习

如何准备机器学习工程师的面试?

我之前面试一些公司的机器学习或者数据挖掘工程师的职位。感觉自己准备的不够充分。想了解下一般会问哪些问题,考察哪些方面的东西?? 周开拓 ~~~~~~~~~~~~...

2567
来自专栏机器之心

专访 | 分子科学中的机器学习:不会燎原的星星之火?

机器之心原创 作者:邱陆陆 继计算机视觉、语音识别、自然语言处理之后,谁是下一个迎来深度学习的浪潮冲击的领域?聚集了世界上最聪明头脑的自然科学领域会不会「首当其...

2716

扫描关注云+社区