前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >论数据分析、数据挖掘、数据统计、OLAP 之间的差异是什么?谁的观点你最赞同?

论数据分析、数据挖掘、数据统计、OLAP 之间的差异是什么?谁的观点你最赞同?

作者头像
小莹莹
发布2018-04-20 18:22:47
6200
发布2018-04-20 18:22:47
举报

Han Hsiao 观点:

简单说:数据挖掘就是从海量数据中找到隐藏的规则,数据分析一般要分析的目标比较明确,数据统计则是单纯的使用样本来推断总体。 主要区别: “数据分析”的重点是观察数据,“数据挖掘”的重点是从数据中发现“知识规则”KDD(Knowledge Discover in Database),数据统计的重点是参数估计和假设检验。

1. “数据分析、数据统计”得出的结论是人的智力活动结果,“数据挖掘”得出的结论是机器从学习集(或训练集、样本集)发现的知识规则。

2. “数据分析”需要人工建模,“数据挖掘”自动完成数学建模,“数据统计”则是把模糊估计变得准确而定量。可以通过机器学习自动建立输入与输出的函数关系,根据KDD得出的“规则”,给定一组输入参数,就可以得出一组输出量。

举个简单的例子: 有一些人总是不及时向电信运营商缴费,如何发现它们? 数据分析:通过对附近人口的生活习惯、业余爱好、教育背景、收入分布、家庭组成等进行全方面分析,发现很多人都习惯在收到欠费通知以后再缴费。结论就是提前发放短信提醒。 数据挖掘:通过编写机器学习聚类算法发现无法通过观察图表得出的深层次原因。发现家住在五环以外的人,由于居住环境偏远没有时间上营业厅缴费。结论就需要多设立一些营业厅或者自助缴费点。 数据统计:通过统计学推理方法组成样本的试验单元进行参数估计和假设检验,我们发现不及时缴钱人群里的贫困人口占82%。所以结论是收入低的人往往会缴费不及时。结论就需要降低资费。


孟京朝观点:

数据分析是面对具体的应用需求从现有的数据中分析出统计数据,是对数据更深层次的整理。

数据挖掘从数理统计,数据库,统计学中发展来的综合交叉学科,运用各种方法从各种数据源中获取知识的过程,数据源可以来自关系数据库,文件,web数据,文本,流数据等,挖掘的方法也有很多种,应用最多的有关联规则,聚类,分类,以及离群点检测,高级的应用如航空航天,智慧城市等。

OLAP是联机分析处理,与OLTP(联机事务处理)相对应的,主要是基于不同物理分布的数据库进行针对分析的处理技术,而不是面相具体事务的,面相具体事务的应用主要涉及终端用户,比如铁路的售票人员的售票行为。联机分析处理是将不同物理分布的数据进行整合分析得到汇总,统计信息,基于数据仓库。


张丰寸观点:

首先是数据分析、数据挖掘、数理统计这三者。其实这都属于数据分析。 数据分析就是从一堆信息中提取有用的信息(数据是描述信息的最精确的方式,所以一般叫数据分析)来支持你的决策。

数据分析是比较广义的,数据挖掘、数理统计一般都从分析的复杂度或者模型的特点来区分出来的一部分数理统计基本就是利用统计学的知识构建模型,来提取有用关键的信息,来支持决策;数据挖掘,顾名思义,关键信息埋藏的很深,我们必须使用很高明的工具和方法、模型才能把有用的信息挖出来,包括很多统计学模型、机器学习等等。

有了专门的数据挖掘,剩下的一般称成为数据分析(狭义的)。然后呢,说起OLAP,就要从数据分析的步骤来说了。

数据分析基本分为几个步骤:数据采集->数据整理->数据分析(广义的)->数据展现(支持决策)

OLAP主要说的从数据整理到分析的部分,如何有效的组织数据,让数据分析(或者数据挖掘)能够更快更好的进行。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-01-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
短信
腾讯云短信(Short Message Service,SMS)可为广大企业级用户提供稳定可靠,安全合规的短信触达服务。用户可快速接入,调用 API / SDK 或者通过控制台即可发送,支持发送验证码、通知类短信和营销短信。国内验证短信秒级触达,99%到达率;国际/港澳台短信覆盖全球200+国家/地区,全球多服务站点,稳定可靠。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档