首页
学习
活动
专区
工具
TVP
发布

Spark学习技巧

本公众号主要分享Spark使用及源码,spark 机器学习,图计算,同时会涉及到hadoop家族。
专栏作者
810
文章
1229288
阅读量
247
订阅数
4000字读懂实时数仓的过去现在和未来(建议收藏)
1991年,比尔·恩门(Bill Inmon)出版了他的第一本关于数据仓库的书《Building the Data Warehouse》,标志着数据仓库概念的确立。
Spark学习技巧
2024-02-01
2300
Flink+Clickhouse在广投集团实时数仓的最佳实践
由于历史原因,大型集团企业往往多个帐套系统共存,包括国内知名ERP厂商浪潮、用友、金蝶、速达所提供的财务系统,集团财务共享中心的财务人员在核对财务凭证数据时经常需要跨多个系统查询且每个系统使用方式不一,同时因为系统累计数据庞大,制单和查询操作经常出现卡顿,工作效率非常低。
Spark学习技巧
2023-03-21
7370
2021年总结实时数仓最新架构图
1 基于Flink的滴滴实时数仓实践 分享嘉宾:潘澄,滴滴基础平台 资深研发工程师 分享大纲: 整体概况 业务实践 平台&引擎 总结反思 未来规划 📷 📷 2 实时OLAP,从0到1 分享嘉宾:高正炎,比特大陆 分享大纲: 业务背景 机遇挑战 架构演进 架构优化 未来展望 📷 📷 3 腾讯基于Flink + Iceberg 全场景实时数仓的建设实践 分享嘉宾:苏舒,腾讯平台 高级研发工程师 分享大纲: 背景及痛点 数据胡技术apache iceberg flink+ iceberg构建实时数仓 未来规划
Spark学习技巧
2022-01-13
1.8K0
Flink 助力美团数仓增量生产
摘要:本文由美团研究员、实时计算负责人鞠大升分享,主要介绍 Flink 助力美团数仓增量生产的应用实践。内容包括:
Spark学习技巧
2021-03-05
5720
实时数仓|基于Flink1.11的SQL构建实时数仓探索实践
实时数仓主要是为了解决传统数仓数据时效性低的问题,实时数仓通常会用在实时的OLAP分析、实时的数据看板、业务指标实时监控等场景。虽然关于实时数仓的架构及技术选型与传统的离线数仓会存在差异,但是关于数仓建设的基本方法论是一致的。本文会分享基于Flink SQL从0到1搭建一个实时数仓的demo,涉及数据采集、存储、计算、可视化整个处理流程。通过本文你可以了解到:
Spark学习技巧
2020-09-08
1.7K0
知乎实时数仓实践及架构演进
转自知乎技术专栏:https://zhuanlan.zhihu.com/p/56807637
Spark学习技巧
2019-05-17
1.7K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档