首页
学习
活动
专区
工具
TVP
发布

小晨讲Flink

专栏作者
69
文章
86784
阅读量
18
订阅数
阿里巴巴和字节跳动面试题整理
4. 详细介绍下MapReduce的工作机制?我重点回答了切片原理和Shuffle机制
小晨说数据
2023-03-08
3600
原创|Spark千亿级数据去重,性能优化踩坑之路
大家好,我是狗哥,今天给大家写一点干货,这次咱们就从0-1把思路给大家讲一下,这也是我同事在数据开发中踩过的坑,希望能帮助到大家。
小晨说数据
2022-11-18
8230
DorisSQL与MySQL函数与语法对照差异篇
doris执行异常:[Err] 1064 - errCode = 2, detailMessage = cannot combine SELECT DISTINCT with aggregate functions or GROUP BY
小晨说数据
2022-11-18
4.4K0
Hbase使用Coprocessor构建二级索引
Hbase默认只支持对行键的索引,那么如果需要针对其它的列来进行查询,就只能全表扫描了。表如果较大的话,代价是不可接受的,所以要提出二级索引的方案。网上的实现方法很多,华为,360等公司都有自己的方案,其中华为的已经开源,但是貌似对源码改动较大,新手不容易接受,所以没有选择它们。而其它的像利用Phoenix,solr等外部框架构建索引对Hbase的学习并没有太大的帮助。综上所述,我使用了Hbase自带的Cprocessor(协处理器)来实现。
小晨说数据
2022-11-18
4530
浅谈数据仓库建设中的数据建模方法
2、为什么需要数据模型:数据模型不是必需的,建模的目的是为了改进业务流程、消灭信息孤岛和数据差异及提升业务支撑的灵活性。
小晨说数据
2022-11-18
5500
数据治理宝典!从0-1搭建企业级数据治理体系
好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。
小晨说数据
2022-11-18
9900
实时数仓方案五花八门,实际落地如何选型和构建!
著有:《图解 Spark 大数据快速分析实战》;《offer 来了:Java 面试核心知识点精讲(原理篇)》;《offer 来了:Java 面试核心知识点精讲(架构篇)》。
小晨说数据
2022-11-18
2.8K0
数据治理到底在做什么,从0搭建企业级数据治理体系
好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。
小晨说数据
2022-11-18
9490
发现了一款面试利器,绝了!!!
各位小伙伴大家好,最近互联网裁员,好多粉丝收了到了毕业通知书,有的直接在家呆了一周多了,还没有找工作,感觉不好找,自己心情也比较低落
小晨说数据
2022-08-30
3940
EMQ X + ClickHouse 实现物联网数据接入与分析
物联网数据采集涉及到大量设备接入、海量的数据传输,EMQ X 物联网消息中间件 与 ClickHouse 联机分析 (OLAP) 数据库的组合技术栈完全能够胜任物联网数据采集传输与存储、分析处理业务。
小晨说数据
2022-03-10
1.6K0
Doris建表注意事项,实时数仓的同学记得收藏
一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。
小晨说数据
2022-03-10
1.3K0
附43页PPT下载|腾讯云ClickHouse性能调优及实践
01 PPT预览 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
小晨说数据
2022-03-10
1.2K0
附39页PPT下载|clickhouse知识讲解
01 PPT预览 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
小晨说数据
2022-03-10
6931
附PPT下载|智能金融在客服机器人中台的落地实践
01 PPT预览 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
小晨说数据
2022-03-10
8890
附PPT下载|Doris在用户画像人群业务的应用实践
01 PPT预览 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
小晨说数据
2022-03-10
7460
Flink流量控制与反压机制完全总结
笔者最近回顾自己对Flink技术栈细节的理解,发现对Flink的网络栈、流控与反压这一套机制存在比较大的盲区。虽然平时多次处理过作业反压的问题,但是不完全理解背后的实现显然说不过去。于是专门写一篇总结,站在大佬们的肩膀上彻底搞清楚Flink是怎么做流控与处理反压的。
小晨说数据
2022-03-10
5890
浅谈Doris和Flink在广告实时数仓中的实践
Apache Doris是一个现代化的MPP分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris的分布式架构非常简洁,易于运维,并且可以支持10PB以上的超大数据集。
小晨说数据
2022-03-10
1.6K0
附代码|Flink实时计算TopN
在上一章代码中使用了timeWindow,使得我们可以操作Flink流中的一个时间段内的数据,这就引出了Flink中的"窗口"概念:在大多数场景下,数据流都是"无限的",因引我们无法等待数据流终止后才进行一些统计计算,而通常的需求是对一段时间或是一定范围内的数据进行分析。
小晨说数据
2022-03-10
1.2K0
ClickHouse表引擎之MergeTree
📷 1. ClickHource 建表引擎的功能 1. 数据的存储方式 2. 是否可以使用索引 3. 数据的存储位置 4. 并发数据的访问 5. 是否可以使用分区 6. 是否支持数据的副本 2.ClickHouse 的表引擎分为四大类 1. MergeTree 系列引擎 2. Log 系列引擎 3. 与其他存储/处理系统集成的引擎 4.特定功能的引擎 每个引擎都包含了多个具体的引擎,每个引擎均都有使用的场景。 3. 详细来说说MergeTree 系列引擎 3.1M
小晨说数据
2022-03-10
6870
Doris源码解析[一、负载均衡]
## 优先级 TC 在检查 tablet 状态的同时,也会对非 HEALTHY 状态的 tablet 分配一个初始优先级。该优先级决定了在 TS 中的处理优先级。
小晨说数据
2022-03-10
1.1K0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档