自学,自己摸索 白白浪费大把时光

一是,自我学习的总结。

二是,降低他人的学习成本。

三是,别人对自己学习结果的审核。

人工智能君人工智能君提问于
成都加米谷大数据回答于

谢邀,就讲讲大数据的学习吧!

大数据在国内市场上,经过这些年的发展,其实已经可以说是进入了比较平稳发展的时期了,头部的互联网公司,都已经基于自家的数据优势,获得了行业竞争优势。百度的搜索数据,腾讯的社交数据,阿里的电商数据,对于企业自身来说,都是巨大的财富,自然基于大数据,相关的岗位需求也在不断释放出来。

大数据的学习,从基础来说,仍然是Java为主,Java是目前大数据开发的主力语言,开源的Hadoop、Spark生态圈,各个组件框架也都是基于JVM,所以首先打好Java基础,是入门大数据的关键。

其次是主流的大数据技术框架,最基本的要掌握Hadoop和Spark,而主打流计算的Storm和Flink,尤其是Flink,这几年也势头正劲,基于大数据处理的实时性需求,对于流计算引擎的学习,不可忽视。

具备基本的大数据技能之后,接下来要针对性地进行实战项目练习,能够基于前期所学,设计项目需求与规划解决方案,实现一个数据处理相关的项目,才算是前期的学习学有所成。

回答过的其他问题

大数据和「数据挖掘」是何关系?

大数据和数据挖掘,从概念上来说,其实是两个东西,但是同时两者之间又确实存在着紧密的联系。 大数据,是指用现有的计算机软硬件设施难以采集、存储、管理、分析和使用的超大规模的数据集。大数据具有规模大、种类杂、快速化、价值密度低等特点(4V特性)。大数据的“大”是一个相对概念,没有具体...... 展开详请

NoSQL和Hadoop之间的关系是什么?

简单来说,NoSQL数据库,是与传统的关系型数据库相对应的一个说法,因为在大数据到来之后,数据特征发生了很大的变化,从传统的结构化数据为主,转变为了半结构化数据、非结构化数据占主要,所以相对应地,对数据存储管理也提出了新的需求,于是NoSQL就迎合市场需求出现了。 NoSQL数据...... 展开详请

使用python或hadoop进行数据分析?

所谓大数据分析,其实是大数据处理当中非常关键的一个环节,而企业搭建大数据系统平台,负责大数据计算的框架不少,从Hadoop的原生MapReduce到Spark,Storm,Flink,这些年一直在不断更新迭代,各自更能适应的场景也并不相同。 Hadoop是当前大数据管理标准之一,...... 展开详请

Hadoop有哪些不同的发行版?

目前来说,提供Hadoop发行版的主要有三家公司, Cloudera、Hortonworks 和 MapR,这三家公司提供的发行版,在商业策略上是不同的。 Cloudera 主要是发布 Hadoop 商业版和商用工具,其核心组件 CDH 开源免费,与 Apache 社区同步;而数...... 展开详请

什么是hadoop和Spark?它们是大数据生态圈的哪一环?

简单点来说,Hadoop和Spark都是大数据计算框架。Hadoop有狭义和广义之分,狭义的Hadoop,是指核心的三组件,及MapReduce、HDFS和Yarn,而通常拿来与Spark相提并论做比较的,准确来说应该是核心计算引擎——MapReduce。所以如果一定要说属于大数...... 展开详请

大数据技术是如何帮助企业运营供应链?

大数据对于供应链管理优化来说,是有非常大的提升空间的。这里例举几个比较典型的场景—— 1、情境智能 目前,由供应链产生的数据的规模、广度和深度都在加速增长,为情景智能驱动的供应链提供了充足的数据基础。 2、产品质量追踪 产品追踪和召回本质上都是数据密集型的,大数据在这方面的潜在贡...... 展开详请

关于作者

成都加米谷大数据

所属标签

扫码关注云+社区

领取腾讯云代金券