大数据分析与数据分析的根本区别在哪里

大数据分析与数据分析这几年一直都是个高频词, 很多人都开始纷纷转行到这个领域, 也有不少人开始跃跃欲试, 想找准时机进到大数据或数据分析领域。如今大数据分析和数据分析火爆, 要说时机, 可谓处处都是时机, 关键要明了的一点是, 大数据分析和数据分析两者的根本区别在哪里, 只有真正了解了, 才会知晓更加适合自己的领域是大数据分析师还是数据分析师。毕竟职场如战场, 时间就是生活, 不容儿戏, 更不容怠慢。下面我来好好告诉大家两者的本质区别到底是什么! 大数据分析:指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据分析指不用随机分析法(抽样调查)这样的捷径, 而采用所有数据进行分析处理, 因此不用考虑数据的分布状态(抽样数据是需要考虑样本分布是否有偏, 是否与总体一致)也不用考虑假设检验, 这点也是大数据分析与一般数据分析的一个区别。 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析, 提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 大数据分析与数据分析最核心的区别是处理的数据规模不同, 由此导致两个方向从业者的技能也是不同的。在CDA人才能力标准中从理论基础、软件工具、分析方法、业务分析、可视化五个方面对数据分析师与大数据分析师进行了定义。

【数据分析师的要求】 数据分析师的理论要求:统计学、概率论和数理统计、多元统计分析、时间序列、数据挖掘。 工具要求:必要:Excel、SQL可选:SPSS MODELER、R、Python、SAS等 分析方法要求:除掌握基本数据处理及分析方法以外, 还应掌握高级数据分析及数据挖掘方法(多元线性回归法, 贝叶斯, 神经网络, 决策树, 聚类分析法, 关联规则, 时间序列, 支持向量机, 集成学习等)和可视化技术。 业务分析能力:可以将业务目标转化为数据分析目标;熟悉常用算法和数据结构, 熟悉企业数据库构架建设;针对不同分析主体, 可以熟练的进行维度分析, 能够从海量数据中搜集并提取信息;通过相关数据分析方法, 结合一个或多个数据分析软件完成对海量数据的处理和分析。 结果展现能力:报告体现数据挖掘的整体流程, 层层阐述信息的收集、模型的构建、结果的验证和解读, 对行业进行评估, 优化和决策。

【大数据分析师的要求】 理论要求:统计学、概率论和数据库、数据挖掘、JAVA基础、Linux基础。 工具要求:必要: SQL、Hadoop、HDFS、Mapreduce、Mahout、Hive、Spark可选:RHadoop、Hbase、ZooKeeper等 分析方法要求:熟练掌握hadoop集群搭建;熟悉nosql数据库的原理及特征, 并会运用在相关的场景;熟练运用mahout、spark提供的进行大数据分析的数据挖掘算法, 包括聚类(kmeans算法、canopy算法)、分类(贝叶斯算法、随机森林算法)、主题推荐(基于物品的推荐、基于用户的推荐)等算法的原理和使用范围。 业务分析能力:熟悉hadoop hive spark进行大数据分析的架构设计, 并能针对不同的业务提出大数据架构的解决思路。掌握hadoop hive Spark tableau平台上Spark MLlib、SparkSQL的功能与应用场景, 根据不同的数据业务需求选择合适的组件进行分析与处理。并对基于Spark框架提出的模型进行对比分析与完善。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181107A1M2BS00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券