首页标签大数据处理套件

#大数据处理套件

腾讯大数据处理套件(Tencent Big Data Suite,TBDS)是基于腾讯多年海量数据处理经验,对外提供的可靠、安全、易用的大数据处理平台。

客快物流大数据项目(六十五):仓库主题

Lanson

腾云先锋 · 腾云先锋(TDP)成员 (已认证)

从2005年开始,网购快递每年以倍增的速度增长。重大节日前是快递爆仓发生的时段。如五一节前夕、国庆节前夕、圣诞节前夕、元旦前夕、春节前夕。新兴的光棍节,网购日,...

14670

数据中台建设(八):数据服务体系建设

Lanson

腾云先锋 · 腾云先锋(TDP)成员 (已认证)

数据服务是数据中台能力的出口,是支撑数据应用的重要支撑。数据资产只要形成数据服务被企业使用,才能体现价值,传统做法是根据某个应用产品的需求,独立构建非常多的数据...

9850

EasyRecovery15全新版一键数据恢复功能

用户7442547

EasyRecovery15数据恢复软件的主要由“误删除恢复,误格式化硬盘,U盘手机相机卡恢复、误清空回收站、硬盘分区丢失/损坏、万能恢复”六大功能模块构成。每...

6600

数据治理(十):Atlas案例演示

Lanson

腾云先锋 · 腾云先锋(TDP)成员 (已认证)

由于Atlas目前版本对Hive元数据监控比较好,这里我们改写了数仓“商户营收业务”业务,只使用Hive Shell脚本实现,后期来演示Atlas对元数据的管理...

9130

PySpark任务依赖第三方python包的解决方案

house.zhang

货拉拉 · 资深大数据开发工程师 (已认证)

在使用大数据spark做计算时,scala开发门槛比较高,一般多会去使用Spark Sql 和PySpark,而PySpark进行个性化开发时,需要引入第三方p...

27850

【大数据】回顾踩过的 Scala & Spark学习资料

onephone

腾讯 · 工程师 (已认证)

527420

大数据Ambari自定义服务详细介绍

house.zhang

货拉拉 · 资深大数据开发工程师 (已认证)

四年多前,入职一家大厂大数据部门主要工作就是从ambari集成大数据组件服务开始做起,当时需要把机器学习平台集成到大数据平台,当时把ambari进行了大量的修改...

22330

留存和流失指标

平常心

关注产品对应用户的黏性,评判APP初期能否留下用户,以及活跃用户规模增长的情况,尤其在在AARRR模型,留存被单独说明为一个用户运营数据指标。

20930

【赵渝强老师】利用Python完成数据分布特征的分析

赵渝强老师

京东大学 · 大数据学院院长 (已认证)

在对数据的质量进行分析后,接下来就可以对数据的特征进行分析和计算,也可以通过绘制图表对数据的特征进行展示。数据的特征分析通过有以下几种方式:分布分析、对比分析、...

15310

链藏“万亿金矿”的新能源,汽车企业如何抓住客户体验数字化新机遇?

八爪鱼大数据

2021年9月,首届慕尼黑车展正式开幕,这是自新冠肺炎疫情爆发以来德国首个线下举行的大型展会。慕尼黑车展前身是世界五大车展之一的法兰克福车展,作为世界汽车工业发...

10440

Hadoop伪分布式如何配置Namenode集群?

Kami米雅

1、配置 配置文件(一): vi etc/hadoop/core-site.xml

9410

用可视化报告拿到30W年终奖的时候,才知道数据可视化的重要

NBI大数据

数据分析是当今企业的必备需求和应当拥有的核心能力,如何让企业能快速掌握和拥有这项能力是NBI可视化一直在思考,一直在努力的方向,NBI可视化团队拥有多年的B端服...

16600

NBI可视化解锁一天完成几十张数据可视化报告的秘密

NBI大数据

随着国内信息化的快速发展,各行各业的信息化建设程度越来越高,随之而来对信息化和智能化提出了更高的要求,从信息化的管理阶段上升到以数据驱动,数据洞察,数据价值为核...

22060

Excelize 开源五周年 🎉

xuri

阿里巴巴 · 技术专家 (已认证)

Excelize (github.com/xuri/excelize) 基础库自 2016 年开源以来已成为云原生应用尤其是 Go 语言开发者在处理电子表格办公...

10450

疫情之下,一套支持私有化部署的新闻采集系统需要具备什么?

八爪鱼大数据

从2020年年初以来,疫情已经变成了生活中常见的名词,疫情常态化之下,人们对于网络的依赖性越来越大,互联网产业飞速发展。

15020

Flink Mysql CDC 统计处理

平常心

说明: 该依赖已经内置了debezium进行处理mysql 变更数据并发送了,所以我们不需要额外的方式,简化了异常 mysql → debezium → kaf...

64731

数仓数据处理DB基本概念解析与理解 OLAP OLTP HATP 异同 MPP架构

大鹅

腾讯 · 后台开发 (已认证)

学习数仓的时候,可能一开始总是被一些英文缩写名字迷惑,OLAP MPP架构 KAPPA架构 ODS等等,这篇文章就来梳理一下这些基本概念。

90740

大数据开发:Spark SQL数据处理模块

成都加米谷大数据

Spark SQL作为Spark当中的结构化数据处理模块,在数据价值挖掘的环节上,备受重用。自Spark SQL出现之后,坊间甚至时有传言,Spark SQL将...

18120

大数据开发:Spark MLlib组件学习入门

成都加米谷大数据

在Spark生态圈当中,MLlib组件,作为机器学习库而存在,在大数据分析、数据挖掘等数据处理操作上,提供重要的支持。学习Spark,对于MLlib组件的学习,...

17540

大数据开发:Spark Structured Streaming特性

成都加米谷大数据

在Spark框架当中,早期的设计由Spark Streaming来负责实现流计算,但是随着现实需求的发展变化,Spark streaming的局限也显露了出来,...

13110

扫码关注云+社区

领取腾讯云代金券