首页标签大数据

#大数据

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

大数据开发:Spark MLlib组件学习入门

成都加米谷大数据

在Spark生态圈当中,MLlib组件,作为机器学习库而存在,在大数据分析、数据挖掘等数据处理操作上,提供重要的支持。学习Spark,对于MLlib组件的学习,...

400

DAMA认证|浅谈数据治理该如何真正落地?

深圳弘德PMP

所谓“无规矩不成方圆”,因历史原因企业在发展过程中已经形成了系统林立的情况,汇集到数据平台的数据都各具特色,缺乏标准、规范、治理的数据已经失去了使用的价值。为了...

300

【赵强老师】HBase的体系架构

赵强老师

京东大学 · 大数据学院院长 (已认证)

HBase是一个基于HDFS之上的分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“BigTable大表”,即:把所有的...

2000

1分钟快速生成可视化图:Tableau

猴子数据分析

什么是商业智能BI? 什么是Tableau? 如何安装Tableau? 如何使用Tableau? 实操案例

800

如何赚钱?

猴子数据分析

从个人层面来说,在现在人工智能,大数据时代,你选择学习python和r的技能,就是在改变自己的出身环境,从而提高你的赚钱能力,比其他人的条件概率高。

8500

大数据开发:Spark Structured Streaming特性

成都加米谷大数据

在Spark框架当中,早期的设计由Spark Streaming来负责实现流计算,但是随着现实需求的发展变化,Spark streaming的局限也显露了出来,...

5410

如何用Tableau对数据建模?

猴子数据分析

这是免费系列教程《7天学会商业智能(BI)-Tableau》的第4天,前面我们介绍了如何用Tableau获取数据?,今天介绍如何用Tableau获取数据。你将学...

5900

大数据开发:Spark运行原理

成都加米谷大数据

在大数据的诸多技术框架当中,Spark发展至今,已经得到了广泛的认可。Hadoop与Spark可以说是大部分企业级数据平台的主流选择,基于不同的应用场景,结合实...

5920

大数据开发:Spark核心概念RDD入门

成都加米谷大数据

Spark在大数据处理上的优势,很大一部分来自数据处理速度的提升,这使得Spark在面对大规模实时计算的数据任务时,能够更快地完成大批量数据的处理,提升大数据处...

9610

有哪些让人惊艳的数据可视化工具?

猴子数据分析

这是腾讯旗下的产品,里面有多种图标,选择适合的图标定制数据,做完后可以发手机上看。操作快捷方便,最重要是免费。

9400

Flink会取代Spark吗?谈谈大数据框架之间的竞争

成都加米谷大数据

在大数据计算领域,先后出现了Hadoop、Spark、Storm、Flink等多个计算框架,并且每每当一个新兴计算引擎出现,大家就忍不住拿来与早期的计算引擎进行...

12430

大数据开发:Spark数据处理核心架构

成都加米谷大数据

作为大数据领域主流运用的大数据计算框架之一,Spark这几年的发展态势也越来越好了。一方面是由于Spark在不断地完善,更适用于现阶段的大数据处理;另一方面则是...

8010

为什么面试官很看重你的松弛感?

猴子数据分析

经过半年的震荡,拿到了数据分析工作的offer,我是去年12月份从上家公司离职后开始着手准备转行数据分析。

5800

大数据开发:Hadoop技术原理简介

成都加米谷大数据

在大数据技术体系当中,Hadoop技术框架无疑是重点当中的重点,目前主流的大数据开发任务,都是基于Hadoop来进行的。对于很多初入门或者想要学习大数据的同学们...

6220

大数据开发:Hadoop数据分析应用场景

成都加米谷大数据

对于海量数据价值的挖掘,需要通过大数据分析来实现,而这些数据由于具有不同于传统数据的新特征,传统的数据分析技术和工具都不能高效的进行处理,因而才有了基于大数据技...

7620

大数据开发:大数据Hadoop好学吗?

成都加米谷大数据

想要成为Hadoop数据工程师,那么掌握Hadoop相关的大数据技术是基础,很多人会问大数据Hadoop技术好学吗,从企业对大数据工程师的招聘需求来说,掌握Ha...

9530

Flink 模拟心跳数据推动事件时间watermark方法

perayb

Flink支持以下三种时间语义:事件时间(event time), 摄取时间(ingestion time), 处理时间(processing time)。其中...

12040

yarn任务简单的python钉钉告警

平常心

开通钉钉群自定义告警机器人,主要是否要加签和关键词,本次使用告警的关键词是Flink任务。

6940

大数据开发:Hadoop数据可视化展示

成都加米谷大数据

在大数据时代,数据价值的挖掘非常重要,而挖掘出来的数据价值成果,需要展示出来,尤其是展示给相关业务人员,才能得到理解和下一步的运用,这也就是大家所说的数据可视化...

7720

大数据开发:Hadoop架构如何提高数据吞吐量?

成都加米谷大数据

Hadoop架构在目前的大数据处理上,具有极大的优势,其中主要的一个原因就是Hadoop解决了系统进行数据处理的数据吞吐量的问题。海量的大数据通过Hadoop架...

9320

扫码关注云+社区

领取腾讯云代金券