• 回答 (9)
  • 关注 (1)
  • 查看 (487)

大数据是最近两年提出的,而数据挖掘上世纪就提出来了。我想知道的是,现在大数据的背景下,采用的数据挖掘算法跟之前传统的数据挖掘算法有什么本质上的不同?如果没有不同,那又是什么关系呢?

你想要的ccc你想要的ccc提问于
成都加米谷大数据回答于

大数据和数据挖掘,从概念上来说,其实是两个东西,但是同时两者之间又确实存在着紧密的联系。

大数据,是指用现有的计算机软硬件设施难以采集、存储、管理、分析和使用的超大规模的数据集。大数据具有规模大、种类杂、快速化、价值密度低等特点(4V特性)。大数据的“大”是一个相对概念,没有具体标准,如果一定要给一个标准,那么10-100TB通常称为大数据的门槛。

从应用的角度来说,目前绝大多数的大数据应用产品,都还只停留在数据统计和报表分析的阶段,能够实现有效的OLAP分析与数据挖掘的还很少,而且目前来说,除了行业头部企业,很多企业的数据也还达不到这样的量级,自然也都谈不上应用了。

而数据挖掘,是指从海量数据中找到人们未知的、可能有用的、隐藏的规则,可以通过关联分析、聚类分析、时序分析等各种算法发现一些无法通过观察图表得出的深层次原因。

大数据背景下的数据挖掘所使用的算法,包括一般的统计分析方法,也有机器学习、神经网络方面的算法,其实是涉及到的东西更加广阔,复合多个学科了。

回答过的其他问题

我 想好好学精通一门技术,大家用的走过的路,帮我指点指点呗  让我少走了弯路和坑的苦 ?

谢邀,就讲讲大数据的学习吧! 大数据在国内市场上,经过这些年的发展,其实已经可以说是进入了比较平稳发展的时期了,头部的互联网公司,都已经基于自家的数据优势,获得了行业竞争优势。百度的搜索数据,腾讯的社交数据,阿里的电商数据,对于企业自身来说,都是巨大的财富,自然基于大数据,相关的...... 展开详请

NoSQL和Hadoop之间的关系是什么?

简单来说,NoSQL数据库,是与传统的关系型数据库相对应的一个说法,因为在大数据到来之后,数据特征发生了很大的变化,从传统的结构化数据为主,转变为了半结构化数据、非结构化数据占主要,所以相对应地,对数据存储管理也提出了新的需求,于是NoSQL就迎合市场需求出现了。 NoSQL数据...... 展开详请

使用python或hadoop进行数据分析?

所谓大数据分析,其实是大数据处理当中非常关键的一个环节,而企业搭建大数据系统平台,负责大数据计算的框架不少,从Hadoop的原生MapReduce到Spark,Storm,Flink,这些年一直在不断更新迭代,各自更能适应的场景也并不相同。 Hadoop是当前大数据管理标准之一,...... 展开详请

Hadoop有哪些不同的发行版?

目前来说,提供Hadoop发行版的主要有三家公司, Cloudera、Hortonworks 和 MapR,这三家公司提供的发行版,在商业策略上是不同的。 Cloudera 主要是发布 Hadoop 商业版和商用工具,其核心组件 CDH 开源免费,与 Apache 社区同步;而数...... 展开详请

什么是hadoop和Spark?它们是大数据生态圈的哪一环?

简单点来说,Hadoop和Spark都是大数据计算框架。Hadoop有狭义和广义之分,狭义的Hadoop,是指核心的三组件,及MapReduce、HDFS和Yarn,而通常拿来与Spark相提并论做比较的,准确来说应该是核心计算引擎——MapReduce。所以如果一定要说属于大数...... 展开详请

大数据技术是如何帮助企业运营供应链?

大数据对于供应链管理优化来说,是有非常大的提升空间的。这里例举几个比较典型的场景—— 1、情境智能 目前,由供应链产生的数据的规模、广度和深度都在加速增长,为情景智能驱动的供应链提供了充足的数据基础。 2、产品质量追踪 产品追踪和召回本质上都是数据密集型的,大数据在这方面的潜在贡...... 展开详请

关于作者

成都加米谷大数据

所属标签

扫码关注云+社区

领取腾讯云代金券