Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >来自单个JavaStreamingContext(JavaReceiverInputDStream)的多个JavaPairDStream

来自单个JavaStreamingContext(JavaReceiverInputDStream)的多个JavaPairDStream
EN

Stack Overflow用户
提问于 2016-09-07 23:08:46
回答 1查看 214关注 0票数 0

我有一个队列,我正在使用Spark Streaming从队列中读取数据。我需要将这些数据(在一些计算之后)写入2个不同的表(两个表的计算是不同的)。我注意到我的代码只执行第一个JavaPairDStream,而不执行另一个。我在两个PairStreams上都有输出操作。

我还注意到,如果队列中的数据很小-比方说只有一条消息,那么它会被插入到两个表中,但当队列中的数据很大时就不是这样了

我的代码如下所示-

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public static void main(String ar[]) {
   JavaReceiverInputDStream<String> receiverStream = RabbitMQUtils.createJavaStream(streamCtx, String.class, rabbitMqConParams, messageHandler);

//this is first pair stream
JavaPairDStream<String, Integer> map1 = receiverStream.flatMapToPair(new PairFlatMapFunction<String, String, Integer>() {...}
JavaPairDStream<String, Integer> red1  = map1.reduceByKey(new Function2<Integer, Integer, Integer>() {...}
red1.foreachRDD(new VoidFunction<JavaPairRDD<String, Integer>>() {
 //i write to hbase from here to "x" table
}

//this is second pair stream
JavaPairDStream<String, Integer> map2 = receiverStream.flatMapToPair(new PairFlatMapFunction<String, String, Integer>() {...}
JavaPairDStream<String, Integer> red2  = map2.reduceByKey(new Function2<Integer, Integer, Integer>() {...}
red2.foreachRDD(new VoidFunction<JavaPairRDD<String, Integer>>() {
 //i write to hbase from here to "y" table
}
}

这有可能吗?

EN

回答 1

Stack Overflow用户

发布于 2016-09-08 03:30:08

上面的代码没有问题。对于我的一个用例,我也在做同样的事情。

可能的情况是,在HBase中写入数据的代码需要花费一些时间。

您能否尝试在SparkConf中设置以下属性以控制流输入速率。它将帮助您调试该问题。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
// In case if reading from Kafka
conf.set("spark.streaming.kafka.maxRatePerPartition", 100);

// In case of other streams
conf.set("spark.streaming.receiver.maxRate", 100);

上述属性控制每个接收器将接收数据的接收器的最大输入速率(每秒的记录数)。实际上,每个流每秒最多只能使用100记录。有关流配置的更多详细信息,请参阅http://spark.apache.org/docs/latest/configuration.html#spark-streaming

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39380295

复制
相关文章
我的第一篇文章
五年前,我申请了这个订阅号,到今天,公众号的名字已经修改了几次,但始终没有更新内容。没更新的原因有很多,例如:自己的知识深度不够,没想明白要写什么,没准备好如何开始,总觉得有更重要的事情要做。直到本周,新人培训中+2提到一个词:完美主义。
abin
2023/03/21
2460
我的第一篇文章
这是我的第一篇文章
新人小白,初来乍到,各位大佬,多多包涵!!! 这是我的第一篇文章,测试用,主要是为了熟悉文档编辑页面的使用。 ---- 假如我,年少有为,不自卑。 假如我,年少有为,不自卑。 假如我,年少有为,不自卑。 婚礼上多喝几杯 婚礼上多和几杯 婚礼上多喝几杯 搏到了却好想退回 搏到了却好想退回 搏到了却好想退回 搏到了却好想退回 搏到了却好想退回 搏到了却好想退回 假如我年少有为不自卑 假如我年少有为不自卑 ---- 这里可以输入代码 # 代码高亮3600 // 这是我的第一篇文章 // 测试 hello
lovingwork
2020/10/16
3740
这是我的第一篇文章
我去了,一篇文章,看懂锁???
Lock和synchronized,是最常见的锁,都可以达到线程安全的目的,功能常见不同
Joseph_青椒
2023/08/28
2070
我去了,一篇文章,看懂锁???
一篇文章搞懂JS中的 ??、??=、?.、?:
ES:ECMAScript;随后的数字表示版本,ES6表示ES5之后的版本。 为什么使用ES6:越高版本的标准代表着js语言更加完善,本身功能更加强大。 比如ES6之前js本身的一些问题:
Java学术趴
2022/11/16
6290
一篇文章搞懂JS中的 ??、??=、?.、?:
SEO如何从搜索引挚的角度来写一篇文章
   搜索的关键字是“seo写作”,其指数为128。这篇文章的主题是“SEOer是如何从搜索引擎的角度撰写文章的”,因此“seo写作”这个关键字满足了我的商业需求。现在我的博客还是新站,在pc端有2个关键词排名,在移动端有4个关键词排名,搜索品牌词“乐”。
幻影龙王
2021/09/08
3640
SEO如何从搜索引挚的角度来写一篇文章
一篇文章上手Vue3中新增的API
作者:liulongbin http://www.liulongbin.top:8085/#/?id=_3-setup 1. 初始化项目 // ① npm i -g @vue/cli // ② vue
Nealyang
2020/10/26
1.1K0
一篇文章带你了解Android 最新Camera框架
这篇文章主要分下面几点来展开讲解: 1)Android 最新Camera 整体框架; 2)Android Camera2 和HAL3 的基本了解; 3)Camera2 介绍; (本文所写的内容基于Android 9.0)
小驰行动派
2021/04/01
1.8K0
一篇文章带你了解Android 最新Camera框架
Android Camera整体框架主要包括三个进程:app进程、camera server进程、hal进程(provider进程)。进程之间的通信都是通过binder实现,其中app和camera server通信使用 AIDL(Android Interface Definition Language) ,camera server和hal(provider进程)通信使用HIDL(HAL interface definition language) 。
小驰行动派
2021/04/30
3.6K0
我们从1400篇机器学习文章中挑出了Top 10
在过去的一个月中,Medium上机器学习深度爱好者必关注的账号Mybridge从近 1400 篇有关机器学习的文章中挑选了最有可能帮助职业生涯发展的 10 篇推荐给你( 0.7% 的比率入选)。
AI科技大本营
2018/07/23
3210
我们从1400篇机器学习文章中挑出了Top 10
一篇文章从了解到入门shell
shell 俗称叫做壳,计算机的壳层,和内核是相对的,用于和用户交互,接收用户指令,调用相应的程序。
软件测试君
2019/08/13
2.1K0
一篇文章从了解到入门shell
我们从1400篇机器学习文章中挑出了Top 10
译者 | Serene 出品 | 人工智能头条(公众号ID:AI_Thinker) 在过去的一个月中,Medium上机器学习深度爱好者必关注的账号Mybridge从近 1400 篇有关机器学习的文章中挑选了最有可能帮助职业生涯发展的 10 篇推荐给你( 0.7% 的比率入选)。 此列表中有关的话题包括机器学习的作用、机器学习在论文中的应用、虚拟替身、可塑性、医学图像数据集、循环神经网络/长短期记忆网络、Keras、卷积神经网络、Pytorch 以及音频处理。 作为一篇为专业人士提供论文排名的文章,我们严格把
用户1737318
2018/06/05
3350
一篇文章了解如何使用Docker
本文先简单介绍Docker,并利用一个例子演示如何使用,然后介绍几种分享Docker的方式。
J_J
2018/10/14
2.1K0
一篇文章了解如何使用Docker
git笔记,一篇文章从入门到精通
git 会了clone,pull,push,建分支,合并,暂存,commit,,rollback,merge就可以了,配合idea软件使用,就超级棒了
一写代码就开心
2022/05/09
2430
git笔记,一篇文章从入门到精通
一篇文章带你搞懂Python中的类
今天我们要说的是面向对象的核心-----类,类能帮我们把复杂的事情变得有条理,有顺序,希望大家通过学习类能改善自己的编码风格,使代码变得更为好看,更加通俗易懂。
Python进阶者
2021/05/20
3980
一篇文章搞懂 Spark 3.x 的 CacheManager
CacheManager 是 Spark SQL 中内存缓存的管理者,在 Spark SQL 中提供对缓存查询结果的支持,并在执行后续查询时自动使用这些缓存结果。
王知无-import_bigdata
2023/04/07
7640
一篇文章搞懂 Spark 3.x 的 CacheManager
一篇文章踩遍Python中的坑
这个问题是变量作用域问题,在gen=(x for _ in xrange(10))中gen是一个generator,在generator中变量有自己的一套作用域,与其余作用域空间相互隔离。因此,将会出现这样的 NameError: name ‘x’ is not defined的问题,那么解决方案是什么呢?答案是:用lambda 。
sergiojune
2018/12/12
3760
从NIPS'22的3篇文章看Vision Transformer最新研究进展
NIPS 2022不乏Vision Transformer相关的文章,今天从其中选择3篇典型的文章分享给大家。这三篇文章是对Vision Transformer三个不同方向的改进:模型结构的改进、数据层面的改进、训练方式上的改进。通过这三篇文章、三个方面的文章,了解目前Vision Transformer的业内最新进展。
圆圆的算法笔记
2022/12/19
1.4K0
从NIPS'22的3篇文章看Vision Transformer最新研究进展
WordPress 如何判断一篇文章是否存在
一直以来子凡都计划为泪雪网添加一个文章的收藏功能,直到现在也依旧也还只是在计划中,最近几天子凡在研究微信小程序,试图折腾用守望轩开源的WordPress微信小程序来接入一下我的泪雪博客和泪雪网,其中想要判断具体某篇文章是否存在。
墨渊
2018/05/09
1.3K0
WordPress 如何判断一篇文章是否存在
一篇文章教你如何捕获前端错误
JavaScript代码在用户浏览器中执行时,由于一些边界情况、本地环境的不可控等因素,可能会存在js运行时错误。
2020labs小助手
2019/07/10
3.3K0
WordPress 如何判断一篇文章是否存在
由于WordPress本身并没有提供相关的函数可以检测,但是我们可以转个弯用现有的一些函数来判断,主要有一下两种方式。 get_permalink() 函数判断 get_permalink()函数是用于获取当前文章或者通过指定文章ID来获取文章链接的函数,如果没有获取到链接,函数就会返回false,也就间接的表示出文章不存在,所以就可以利用这个方法来判断文章是否存在了。 //通过get_permalink()函数判断文章是否存在 if(get_permalink($post_id)===fa
用户1456630
2018/05/25
7480

相似问题

弹性搜索-巢布尔场映射

14

弹性搜索-动态场模板映射

12

JSON层次结构中的弹性搜索动态场

13

弹性搜索-多场支持的动态映射

12

循环结构的弹性搜索映射

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文