学习
实践
活动
工具
TVP
写文章

小晨说数据

LV0
举报
发表了文章

原创|Spark千亿级数据去重,性能优化踩坑之路

大家好,我是狗哥,今天给大家写一点干货,这次咱们就从0-1把思路给大家讲一下,这也是我同事在数据开发中踩过的坑,希望能帮助到大家。

小晨说数据
编程算法
发表了文章

DorisSQL与MySQL函数与语法对照差异篇

doris执行异常:[Err] 1064 - errCode = 2, detailMessage = cannot combine SELECT DISTIN...

小晨说数据
编程算法PythonJSON数据库云数据库 SQL Server
发表了文章

Hbase使用Coprocessor构建二级索引

Hbase默认只支持对行键的索引,那么如果需要针对其它的列来进行查询,就只能全表扫描了。表如果较大的话,代价是不可接受的,所以要提出二级索引的方案。网上的实现方...

小晨说数据
JARHBaseTDSQL MySQL 版XML数据库
发表了文章

浅谈数据仓库建设中的数据建模方法

2、为什么需要数据模型:数据模型不是必需的,建模的目的是为了改进业务流程、消灭信息孤岛和数据差异及提升业务支撑的灵活性。

小晨说数据
UML数据库SQL
发表了文章

数据治理宝典!从0-1搭建企业级数据治理体系

好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。

小晨说数据
大数据数据安全企业
发表了文章

实时数仓方案五花八门,实际落地如何选型和构建!

著有:《图解 Spark 大数据快速分析实战》;《offer 来了:Java 面试核心知识点精讲(原理篇)》;《offer 来了:Java 面试核心知识点精讲(...

小晨说数据
数据湖数据库数据分析数据处理SQL
发表了文章

数据治理到底在做什么,从0搭建企业级数据治理体系

好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。

小晨说数据
大数据数据安全企业
发表了文章

发现了一款面试利器,绝了!!!

各位小伙伴大家好,最近互联网裁员,好多粉丝收了到了毕业通知书,有的直接在家呆了一周多了,还没有找工作,感觉不好找,自己心情也比较低落

小晨说数据
发表了文章

EMQ X + ClickHouse 实现物联网数据接入与分析

物联网数据采集涉及到大量设备接入、海量的数据传输,EMQ X 物联网消息中间件 与 ClickHouse 联机分析 (OLAP) 数据库的组合技术栈完全能够胜任...

小晨说数据
物联网SQL数据库数据分析数据可视化
发表了文章

Doris建表注意事项,实时数仓的同学记得收藏

一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。

小晨说数据
存储
发表了文章

附43页PPT下载|腾讯云ClickHouse性能调优及实践

小晨说数据
发表了文章

附39页PPT下载|clickhouse知识讲解

小晨说数据
发表了文章

附PPT下载|智能金融在客服机器人中台的落地实践

小晨说数据
发表了文章

附PPT下载|Doris在用户画像人群业务的应用实践

小晨说数据
发表了文章

Flink流量控制与反压机制完全总结

笔者最近回顾自己对Flink技术栈细节的理解,发现对Flink的网络栈、流控与反压这一套机制存在比较大的盲区。虽然平时多次处理过作业反压的问题,但是不完全理解背...

小晨说数据
缓存Flink大数据JavaSocket编程
发表了文章

浅谈Doris和Flink在广告实时数仓中的实践

Apache Doris是一个现代化的MPP分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris的分布式架构非...

小晨说数据
Flink大数据ES数据分析Apache
发表了文章

附代码|Flink实时计算TopN

在上一章代码中使用了timeWindow,使得我们可以操作Flink流中的一个时间段内的数据,这就引出了Flink中的"窗口"概念:在大多数场景下,数据流都是"...

小晨说数据
Flink大数据Processing网站Windows
发表了文章

ClickHouse表引擎之MergeTree

小晨说数据
存储
发表了文章

Doris源码解析[一、负载均衡]

## 优先级 TC 在检查 tablet 状态的同时,也会对非 HEALTHY 状态的 tablet 分配一个初始优先级。该优先级决定了在 TS 中的处理优先级...

小晨说数据
访问管理数据分析
发表了文章

ClickHouse实战留存、路径、漏斗、session

关于用户留存模型是各大商业数据分析平台必不可少的功能,企业一般用该模型衡量用户的活跃情况,也是能直接反应产品功能价值的直接指标;如,boss想要了解商城改版后,...

小晨说数据
jQuery数据分析编程算法

个人简介

个人成就

扫码关注腾讯云开发者

领取腾讯云代金券