如何理解数据挖掘?

一、数据挖掘边界

数据挖掘的定义和边界不够明确,一般通过与其他概念对比进行理解。

目前流行的是AI、机器学习、深度学习,它们之间的包含关系参考下图。可以看到深度学习是机器学习的一个方向,机器学习又是AI的一个方向。

图1 AI、ML、DL

数据挖掘更多是从实际的数据出发,利用机器学习中频繁模式、分类和聚类的技术来分析、挖掘、预测一些对实际有用的结果。数据挖掘与其他领域的边界关系参考下图。

图2 Border of DM

下图进一步展示了这些领域之间的相互作用。事实上,界限仍然不明显。然而界定这些名词或者领域的边界不是最重要的,从一个比较高的维度来看,这些领域综合起来都是利用数据实现人工智能的目的。

图3 Relation between DM and AI、ML etc.

人工智能的研究领域至少可以按照如下分类:一种是类人的,用来实现人类的功能,如行动、图像识别、自然语言处理、语音处理等;一种是超人的,用来扩展人类的功能,如记忆、搜索、翻译、自动驾驶、决策等;一种是非人的,用来补充人类的功能。

二、数据挖掘思维导图

学术上的数据挖掘研究方向比较传统,主要是处理数据,挖掘数据,评估模型。随着互联网和大数据的发展,数据挖掘的应用领域却越来越广。我们大可不必拘泥于数据挖掘、数据分析、机器学习的边界和区别,或许这些边界和区别都是人为设置的。毕竟不管哪种技术,能解决实际问题的都是好技术。

图4 数据挖掘思维导图

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180525G0XX3400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券