首页标签大数据处理套件

#大数据处理套件

腾讯大数据处理套件(Tencent Big Data Suite,TBDS)是基于腾讯多年海量数据处理经验,对外提供的可靠、安全、易用的大数据处理平台。

留存和流失指标

平常心

关注产品对应用户的黏性,评判APP初期能否留下用户,以及活跃用户规模增长的情况,尤其在在AARRR模型,留存被单独说明为一个用户运营数据指标。

9630

【赵强老师】利用Python完成数据分布特征的分析

赵强老师

京东大学 · 大数据学院院长 (已认证)

在对数据的质量进行分析后,接下来就可以对数据的特征进行分析和计算,也可以通过绘制图表对数据的特征进行展示。数据的特征分析通过有以下几种方式:分布分析、对比分析、...

9810

链藏“万亿金矿”的新能源,汽车企业如何抓住客户体验数字化新机遇?

八爪鱼大数据

2021年9月,首届慕尼黑车展正式开幕,这是自新冠肺炎疫情爆发以来德国首个线下举行的大型展会。慕尼黑车展前身是世界五大车展之一的法兰克福车展,作为世界汽车工业发...

7740

Hadoop伪分布式如何配置Namenode集群?

Kami米雅

1、配置 配置文件(一): vi etc/hadoop/core-site.xml

7210

用可视化报告拿到30W年终奖的时候,才知道数据可视化的重要

NBI大数据

数据分析是当今企业的必备需求和应当拥有的核心能力,如何让企业能快速掌握和拥有这项能力是NBI可视化一直在思考,一直在努力的方向,NBI可视化团队拥有多年的B端服...

12800

NBI可视化解锁一天完成几十张数据可视化报告的秘密

NBI大数据

随着国内信息化的快速发展,各行各业的信息化建设程度越来越高,随之而来对信息化和智能化提出了更高的要求,从信息化的管理阶段上升到以数据驱动,数据洞察,数据价值为核...

18160

Excelize 开源五周年 🎉

xuri

阿里巴巴 · 技术专家 (已认证)

Excelize (github.com/xuri/excelize) 基础库自 2016 年开源以来已成为云原生应用尤其是 Go 语言开发者在处理电子表格办公...

8450

疫情之下,一套支持私有化部署的新闻采集系统需要具备什么?

八爪鱼大数据

从2020年年初以来,疫情已经变成了生活中常见的名词,疫情常态化之下,人们对于网络的依赖性越来越大,互联网产业飞速发展。

11120

Flink Mysql CDC 统计处理

平常心

说明: 该依赖已经内置了debezium进行处理mysql 变更数据并发送了,所以我们不需要额外的方式,简化了异常 mysql → debezium → kaf...

19830

数仓数据处理DB基本概念解析与理解 OLAP OLTP HATP 异同 MPP架构

大鹅

腾讯 · 后台开发 (已认证)

学习数仓的时候,可能一开始总是被一些英文缩写名字迷惑,OLAP MPP架构 KAPPA架构 ODS等等,这篇文章就来梳理一下这些基本概念。

38530

大数据开发:Spark SQL数据处理模块

成都加米谷大数据

Spark SQL作为Spark当中的结构化数据处理模块,在数据价值挖掘的环节上,备受重用。自Spark SQL出现之后,坊间甚至时有传言,Spark SQL将...

11420

大数据开发:Spark MLlib组件学习入门

成都加米谷大数据

在Spark生态圈当中,MLlib组件,作为机器学习库而存在,在大数据分析、数据挖掘等数据处理操作上,提供重要的支持。学习Spark,对于MLlib组件的学习,...

9540

大数据开发:Spark Structured Streaming特性

成都加米谷大数据

在Spark框架当中,早期的设计由Spark Streaming来负责实现流计算,但是随着现实需求的发展变化,Spark streaming的局限也显露了出来,...

9010

大数据开发:Spark运行原理

成都加米谷大数据

在大数据的诸多技术框架当中,Spark发展至今,已经得到了广泛的认可。Hadoop与Spark可以说是大部分企业级数据平台的主流选择,基于不同的应用场景,结合实...

8820

大数据开发:Spark核心概念RDD入门

成都加米谷大数据

Spark在大数据处理上的优势,很大一部分来自数据处理速度的提升,这使得Spark在面对大规模实时计算的数据任务时,能够更快地完成大批量数据的处理,提升大数据处...

12110

Flink会取代Spark吗?谈谈大数据框架之间的竞争

成都加米谷大数据

在大数据计算领域,先后出现了Hadoop、Spark、Storm、Flink等多个计算框架,并且每每当一个新兴计算引擎出现,大家就忍不住拿来与早期的计算引擎进行...

19530

大数据开发:Spark数据处理核心架构

成都加米谷大数据

作为大数据领域主流运用的大数据计算框架之一,Spark这几年的发展态势也越来越好了。一方面是由于Spark在不断地完善,更适用于现阶段的大数据处理;另一方面则是...

12010

NBI可视化集成clickhouse,实现百亿级数据分析能力

NBI大数据

ClickHouse是一款MPP架构的列式存储数据库,并允许使用SQL查询实时生成分析报告,也是一个新的开源列式数据库。

22630

大数据开发:Hadoop数据分析应用场景

成都加米谷大数据

对于海量数据价值的挖掘,需要通过大数据分析来实现,而这些数据由于具有不同于传统数据的新特征,传统的数据分析技术和工具都不能高效的进行处理,因而才有了基于大数据技...

9920

大数据开发:大数据Hadoop好学吗?

成都加米谷大数据

在大数据技术体系当中,Hadoop无疑是占据着非常重要的位置。从2005年Hadoop项目诞生开始,到如今发展到相对成熟稳定的阶段,Hadoop技术在大数据处理...

14330

扫码关注云+社区

领取腾讯云代金券