成都加米谷大数据

LV1
发表了文章

大数据进阶之Spark运行流程

在大数据的诸多技术框架当中,Spark发展至今,已经得到了广泛的认可。Hadoop与Spark可以说是企业级数据平台的主流选择,基于不同的应用场景,来搭建符合需...

成都加米谷大数据
发表了文章

大数据核心技术之分布式基础入门

大数据技术的核心,离不开分布式理论。大数据从概念走向落地,也是因为大数据技术的成熟,换句话说,就是大数据技术使得大规模数据处理成为可能,而大数据技术背后的核心,...

成都加米谷大数据
大数据大数据处理套件Hadoop
发表了文章

大数据平台搭建:大数据基础架构选型

大数据越来越受到重视的今天,企业级数据平台搭建,也成为更加普遍的需求。而要搭建起符合自身需求以及提供稳定支持的数据平台系统,基础架构的选型是非常重要的。今天我们...

成都加米谷大数据
发表了文章

大数据和分布式入门:主流分布式缓存组件

在大数据处理当中,核心指导思想始终是分布式,基于分布式思想,我们有了Hadoop等开源技术框架,能够以更低的成本完成企业大数据系统平台搭建,支持业务进展。今天大...

成都加米谷大数据
发表了文章

Hadoop核心学习之MapReduce编程入门

在IT技术领域,大数据是热点,大数据技术也是热点,以Hadoop为例,作为主流的第一代大数据技术框架,可以说是入门必学。而学习Hadoop,通常从核心框架HDF...

成都加米谷大数据
发表了文章

大数据概念解析:分布式存储与数据库

大数据技术当中,在海量数据的存储环节,涉及到两个重要的概念,就是分布式数据存储与数据库,稳定高效安全的数据存储,才能为后续的计算分析环节,提供稳固的支持。今天的...

成都加米谷大数据
发表了文章

大数据计算模式:批处理&流处理

大数据要实现业务落地的前提,是企业需要搭建起自身的大数据平台,去实现对数据价值的挖掘和应用。根据实际的业务场景需求,不同类型的数据,需要不同的计算处理模式。今天...

成都加米谷大数据
回答了问题

NoSQL和Hadoop之间的关系是什么?

成都加米谷大数据回答于
简单来说,NoSQL数据库,是与传统的关系型数据库相对应的一个说法,因为在大数据到来之后,数据特征发生了很大的变化,从传统的结构化数据为主,转变为了半结构化数据、非结构化数据占主要,所以相对应地,对数据存储管理也提出了新的需求,于是NoSQL就迎合市场需求出现了。 NoSQL数据...... 展开详请
发表了文章

大数据平台架构:数据平台建设的几种方案

随着大数据在越来越多的企业当中落地,企业要开展大数据相关的业务,那么首先要搭建起自身的数据平台。而企业搭建大数据平台,往往需要结合成本、业务、人员等各方面的因素...

成都加米谷大数据
回答了问题

我 想好好学精通一门技术,大家用的走过的路,帮我指点指点呗  让我少走了弯路和坑的苦 ?

成都加米谷大数据回答于
谢邀,就讲讲大数据的学习吧! 大数据在国内市场上,经过这些年的发展,其实已经可以说是进入了比较平稳发展的时期了,头部的互联网公司,都已经基于自家的数据优势,获得了行业竞争优势。百度的搜索数据,腾讯的社交数据,阿里的电商数据,对于企业自身来说,都是巨大的财富,自然基于大数据,相关的...... 展开详请
发表了文章

大数据概念解析:分布式计算与服务器集群

进入大数据学习当中,相关的专业词汇很多,尤其是涉及到技术概念,对于概念词汇的理解,对于后续的技术学习和掌握,也是有好处的。今天我们来着重讲解大数据当中的两个重要...

成都加米谷大数据
回答了问题

使用python或hadoop进行数据分析?

成都加米谷大数据回答于
所谓大数据分析,其实是大数据处理当中非常关键的一个环节,而企业搭建大数据系统平台,负责大数据计算的框架不少,从Hadoop的原生MapReduce到Spark,Storm,Flink,这些年一直在不断更新迭代,各自更能适应的场景也并不相同。 Hadoop是当前大数据管理标准之一,...... 展开详请
发表了文章

从Hadoop到Spark,大数据技术发展概况

大数据从概念走向落地,得益于大数据技术的成熟,尤其是以Hadoop为代表的第一代大数据系统框架,为大数据在企业当中的现实落地,提供了稳固的技术支持,而随着大数据...

成都加米谷大数据
大数据大数据解决方案Hadoopspark
发表了文章

大数据平台搭建:基于Hadoop的数据分析平台

互联网的发展,带来了各种数据的爆发式增长,所有接入互联网的相关操作行为,都化为虚拟的数据被记录了下来。大数据时代的带来,一个明显的变化就是全样本数据分析,面对T...

成都加米谷大数据
大数据大数据解决方案Hadoop
回答了问题

Hadoop有哪些不同的发行版?

成都加米谷大数据回答于
目前来说,提供Hadoop发行版的主要有三家公司, Cloudera、Hortonworks 和 MapR,这三家公司提供的发行版,在商业策略上是不同的。 Cloudera 主要是发布 Hadoop 商业版和商用工具,其核心组件 CDH 开源免费,与 Apache 社区同步;而数...... 展开详请
回答了问题

什么是hadoop和Spark?它们是大数据生态圈的哪一环?

成都加米谷大数据回答于
简单点来说,Hadoop和Spark都是大数据计算框架。Hadoop有狭义和广义之分,狭义的Hadoop,是指核心的三组件,及MapReduce、HDFS和Yarn,而通常拿来与Spark相提并论做比较的,准确来说应该是核心计算引擎——MapReduce。所以如果一定要说属于大数...... 展开详请
发表了文章

分布式消息系统之Kafka入门

在大数据学习当中,重点之一就是大数据技术框架,针对于大数据处理的不同环节,需要不同的技术框架来解决问题。以Kafka来说,主要就是针对于实时消息处理,在大数据平...

成都加米谷大数据
回答了问题

大数据技术是如何帮助企业运营供应链?

成都加米谷大数据回答于
大数据对于供应链管理优化来说,是有非常大的提升空间的。这里例举几个比较典型的场景—— 1、情境智能 目前,由供应链产生的数据的规模、广度和深度都在加速增长,为情景智能驱动的供应链提供了充足的数据基础。 2、产品质量追踪 产品追踪和召回本质上都是数据密集型的,大数据在这方面的潜在贡...... 展开详请
发表了文章

大数据平台架构:分布式技术架构简介

不可否认,大数据在这些年的发展当中,实现大数据处理的核心技术,始终是分布式。基于分布式技术架构,有分布式存储、分布式计算等相应的技术框架组件,形成了完善的技术生...

成都加米谷大数据
回答了问题

如何用大数据构建用户画像?

成都加米谷大数据回答于
从开发的角度来说,搭建一套用户画像体系,是涉及到多个模块的,根据具体的需求,来进行方案的规划。需要了解、明确用户画像是什么,包含哪些模块,数据仓库架构是什么样子,开发流程,表结构设计,ETL设计等。 1、数据指标体系:根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维...... 展开详请

个人简介

个人成就

  • 获得 77 次赞同
  • 文章被阅读 2K 次

扫码关注云+社区

领取腾讯云代金券