前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Apache Flink 在快手的应用与实践

Apache Flink 在快手的应用与实践

作者头像
大数据真好玩
发布2019-09-10 16:52:34
6110
发布2019-09-10 16:52:34
举报
文章被收录于专栏:暴走大数据

一.Flink 在快手应用场景与规模

1. Flink 在快手应用场景
2.Flink 集群规模
1.场景优化
1.1 Interval Join 应用场景
1.2 Interval Join 场景优化
1.2.1 Interval Join 原理:
1.2.2 状态存储策略选择

1.2.3 RocksDB 访问性能问题

1.2.5 RocksDB 磁盘压力问题
2.稳定性改进
2.1 数据源控速

Source 控速策略

Source 控速策略详细细节

SourceTask 共享状态

Source 控速结果

拿线上作业,使用 Kafka 从最早位置(2 days ago)开始消费。如上图,不限速情况下State 持续增大,最终作业挂掉。使用限速策略后,最开始 State 有缓慢上升,但是 State 大小可控,最终能平稳追上最新数据,并 State 持续在 40 G 左右。

2.2 JobManager 稳定性
2.3 作业频繁失败
3.平台化建设
3.1 平台建设:
3.2 问题定位流程优化:
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据真好玩 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一.Flink 在快手应用场景与规模
    • 1. Flink 在快手应用场景
      • 2.Flink 集群规模
        • 1.场景优化
          • 1.1 Interval Join 应用场景
            • 1.2 Interval Join 场景优化
              • 1.2.1 Interval Join 原理:
              • 1.2.2 状态存储策略选择
              • 1.2.5 RocksDB 磁盘压力问题
            • 2.稳定性改进
              • 2.1 数据源控速
                • 2.2 JobManager 稳定性
                  • 2.3 作业频繁失败
                    • 3.平台化建设
                      • 3.1 平台建设:
                        • 3.2 问题定位流程优化:
                        相关产品与服务
                        大数据
                        全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
                        领券
                        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档