首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据湖构建 dlf

#数据湖构建 dlf

数据湖构建服务

湖仓一体电商项目(二十四):合并Iceberg小文件

Lansonli

Iceberg表每次commit都会生成一个parquet数据文件,有可能一张Iceberg表对应的数据文件非常多,那么我们通过Java Api 方式对Iceb...

1.7K101

湖仓一体电商项目(二十三):离线业务统计每天用户商品浏览所获积分

Lansonli

使用Iceberg构建湖仓一体架构进行数据仓库分层,通过Flink操作各层数据同步到Iceberg中做到的离线与实时数据一致,当项目中有一些离线临时性的需求时,...

29040

湖仓一体电商项目(二十二):实时任务执行流程

Lansonli

这里默认HDFS、Hive、HBase、Kafka环境已经准备,启动maxwell组件监控mysql业务库数据:

320100

湖仓一体电商项目(二十一):数据发布接口和数据可视化

Lansonli

通过Flink实时把结果数据写入Clickhouse-DM层中后,我们需要编写数据发布接口方便数据使用方调用数据结果进行可视化,数据发布接口项目为SpringB...

30690

湖仓一体电商项目(二十):业务实现之编写写入DM层业务代码

Lansonli

DM层主要是报表数据,针对实时业务将DM层设置在Clickhouse中,在此业务中DM层主要存储的是通过Flink读取Kafka “KAFKA-DWS-BROW...

30550

湖仓一体电商项目(十六):业务实现之编写写入ODS层业务代码

Lansonli

由于本业务涉及到MySQL业务数据和用户日志数据,两类数据是分别采集存储在不同的Kafka Topic中的,所以这里写入ODS层代码由两个代码组成。

396120

湖仓一体电商项目(十五):实时统计商品及一级种类、二级种类访问排行业务需求和分层设计及流程图

Lansonli

用户登录系统后会浏览商品,浏览日志通过日志采集接口采集到Kafka “KAFKA-USER-LOG-DATA”topic中,每个用户浏览商品的日志信息中都有浏览...

27370
领券