CoreDao
2021_03_28
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
圈层
工具
MCP广场
返回腾讯云官网
CoreDao
首页
学习
活动
专区
圈层
工具
MCP广场
返回腾讯云官网
社区首页
>
专栏
>
2021_03_28
2021_03_28
CoreDao
关注
发布于 2021-04-12 15:51:59
发布于 2021-04-12 15:51:59
374
0
举报
文章被收录于专栏:
BigData_Flink
BigData_Flink
A 问题
A1 背压机制
Spark 1.5以前版本,用户如果要限制 Receiver的数据接收速率,可以通过设置静态配制参数 “spark.streaming.receiver.maxRate”的值来实现,此举虽然可以通过限制接收速率,来适配当前的处理能力,防止内存溢出,但也会引入其它问题。比如: producer数据生产高于 maxRate,当前集群处理能力也高于 maxRate,这就会造成资源利用率下降等问题。
为了更好的协调数据接收速率与资源处理能力,1.5版本开始 Spark Streaming可以动态控制数据接收速率来适配集群数据处理能力。 背压 机制(即 Spark Streaming Backpressure)): 根据JobScheduler反馈作业的执行信息来动态调整 Receiver数据接收率。通过属性“spark.streaming.backpressure.enabled”来控制是否启用 backpressure机制,默认值false,即不启用。
把spark.streaming.backpressure.enabled参数设置为ture,开启背压机制后Spark Streaming会根据延迟动态去kafka消费数据,上限由spark.streaming.kafka.maxRatePerPartition参数控制,所以两个参数一般会一起使用。
其作用就是为了让拉取和处理速度相对稳定。
B sql
B1
本文参与
腾讯云自媒体同步曝光计划
,分享自作者个人站点/博客。
原始发表:2021/03/28 ,如有侵权请联系
cloudcommunity@tencent.com
删除
前往查看
spark
kafka
本文分享自
作者个人站点/博客
前往查看
如有侵权,请联系
cloudcommunity@tencent.com
删除。
本文参与
腾讯云自媒体同步曝光计划
,欢迎热爱写作的你一起参与!
spark
kafka
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
A 问题
A1 背压机制
B sql
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐