腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
构建
Kafka
流
,将
不同
的
ids
列表
返回
到
时间
间隔
、
我有一个对象事件
的
kafka
流
: KStream<String, VehicleEventTO> stream = builder.stream("mytopic", Consumed.with(Serdes.String我需要建立一个
流
,
返回
不同
的
idTypes到
时间
间隔
(例如: 10分钟)。使用KafkaStream数字用户线是可能
的
吗?我找不到解决办法。
浏览 17
提问于2019-06-29
得票数 0
回答已采纳
3
回答
如何
构建
高效
的
Kafka
broker健康检查?
、
、
在我
的
应用程序中,我将对我
的
Kafka
集群执行某种健康检查。目前,我创建了一个TopicMetadataRequest来检测死掉
的
代理: // this will fail if
Kafka
is unavailable } 不幸
的
是,由于集群拓扑/设置<em
浏览 1
提问于2015-07-17
得票数 10
回答已采纳
2
回答
Flink
间隔
加入DataStream与KafkaSource删除所有记录
、
电流配置 应用程序运行在应用程序中
的
Flink 1.14.4上,数据
流
(由长链操作符产生)
间隔
连接到一个
Kafka
源。事件时戳每个分区严格上升。卡夫卡上
的
每分区水印策略
将
水印设置
到
它迄今看到
的
最大
时间
戳(有界无序=1秒)。默认情况下,
Kafka
源(
间隔
连接
的
右侧)比其他数据
流
(
kafka
> source )每1分钟生成一次数据,因此它<
浏览 12
提问于2022-06-17
得票数 0
回答已采纳
1
回答
如何
将
Kafka
流
/
Kafka
配置为事件间
间隔
较长
的
间歇性事件
流
?
我正在用Java/Python
构建
一个使用
kafka
和
Kafka
流
的
产品。 该产品
将
处理来自几个
不同
外部数据源
的
数据,这些数据源包括实时事件和每小时批处理事件。可能会有很长
的
差距,几个小时在一起,没有任何事件将来自外部来源。其中一些来自
不同
来源
的
事件需要进行关联和聚合,为此我计划使用
Kafka
流
。鉴于
Kafka
/
Kaf
浏览 1
提问于2019-05-16
得票数 1
2
回答
理解
Kafka
流
groupBy与窗口
、
、
、
我无法理解
kafka
流
中
的
groupBy/groupById和窗口
的
概念。我
的
目标是在一段
时间
内(例如5秒)对流数据进行聚合。}下面是我正在尝试
的
代码,但我似乎无法让它工作。 builder.TimeVal tv = gson.fromJson(val, TimeVal.
浏览 0
提问于2018-08-10
得票数 7
1
回答
卡夫卡
的
溪流与国家商店
的
写作
、
、
我正在开发一个用
构建
的
Kafka
应用程序。在这个应用程序中,我需要:time.Materialize
将
传入<
浏览 4
提问于2020-06-23
得票数 0
1
回答
如何设置最佳配置值-触发
时间
,maxOffsetsPerTrigger -火花结构化
流
读取从卡夫卡消息?
、
、
、
我有一个结构化
的
流媒体应用程序读取来自
Kafka
的
消息。每天
的
信息总数约为180亿条,每分钟
的
峰值信息计数为12,500,000条。最大消息大小为2KB。如何确保我
的
结构化
流
应用程序能够处理如此大
的
数据量和速度?基本上,我只想知道如何设置最佳触发
时间
、maxOffsetsPerTrigger或任何其他配置,从而使作业顺利进行,并能够处理故障和重新启动。
浏览 2
提问于2019-06-17
得票数 5
2
回答
Task Scheduler :安排多个任务在单个调度器中运行
、
、
、
、
在我
的
WindowsMVC4项目中,我需要创建
不同
的
作业进程来在
不同
的
时间
间隔
执行。我计划使用ASP.NET Task Scheduler来实现这一点。 因为我是新手,所以我需要一些帮助。我
的
场景是我需要以特定
的
时间
间隔
向客户
列表
发送电子邮件。为了获取客户详细信息
列表
,我提供了web服务(它将提供选定客户
的
所有电子邮件i).These web服务
浏览 0
提问于2014-02-10
得票数 1
1
回答
kafka
flink
时间
戳事件
时间
和水印
、
我正在用Apache阅读“
流
处理”一书,其中说:“从0.10.0版开始,
Kafka
支持消息
时间
戳。当从
Kafka
版本0.10或更高版本读取时,如果应用程序以事件
时间
模式运行,使用者将自动提取消息
时间
戳作为事件
时间
戳*“那么在processElement函数中,调用context.timestamp()
将
默认
返回
kafka
消息
时间
戳吗?请提供一个简单
的
示例,说明如何实现基于使用的卡夫
浏览 4
提问于2020-08-30
得票数 2
回答已采纳
2
回答
如何从星火
流
DirectAPI中
的
每个
Kafka
分区中并发读取
、
、
、
、
如果我是正确
的
,默认情况下,星火
流
1.6.1使用单个线程从每个
Kafka
分区读取数据,假设我
的
Kafka
主题分区为50,这意味着每个50个分区中
的
消息
将
按顺序读取或可能以循环方式读取。创建多个KafkaUtils.createDirectStream是唯一
的
解决方案吗?案例2: -If --我的卡夫卡分区每秒收到5条消息--那么,在这种情况下,"--conf spark.streaming.
kafka
.m
浏览 4
提问于2016-12-12
得票数 2
1
回答
Kafka
中
的
数据
流
是什么?
为什么你用卡夫卡来谈论数据
流
。也许有人能告诉我术语数据流在
Kafka
中
的
真正含义。顺便说一句,我知道在
Kafka
中有生产者和消费者。生产者
将
数据发送到代理,然后代理将其发送给消费者。
浏览 0
提问于2021-05-02
得票数 1
1
回答
如何避免火花
流
中批量排队
、
、
、
我有直接
流
的
火花
流
,我使用下面的配置 spark.streaming.
kafka
.maxRatePerPartition 42 我看到,最初
的</
浏览 2
提问于2021-03-16
得票数 1
回答已采纳
1
回答
Spark Streaming中驱动使用直接
Kafka
API查询分区偏移量
的
频率是多少?
、
是针对每个批处理
间隔
查询偏移量还是以
不同
的
频率查询偏移量?
浏览 1
提问于2015-11-17
得票数 1
2
回答
卡夫卡
的
火花
流
-从检查点重新启动
、
我们正在
构建
一个使用火花
流
和
Kafka
的
容错系统,并且正在测试检查点火花
流
,如果火花作业因任何原因崩溃,我们可以选择重新启动它。下面是我们
的
火花过程: 卡夫卡每秒收到大约80条信息。我们想要实现
的
是一个设置,在这里我们可以降低火花
流
作业(以模拟故障),然后重新启动它,并仍然确保我们处理来自
Kafka
的</e
浏览 1
提问于2016-10-06
得票数 2
2
回答
卡夫卡有很多话题吗?
我正在考虑
Kafka
从后端
到
前端应用程序
的
更新。数据
流
是特定于用户请求
的
,因此每个请求都会在后端生成一个
流
。-每个用户将有多个并发请求。一对多
的
关系,即用户和
流
在网上阅读时,我看到了一些帖子,其中提到了在userid上分区
的
一个主题。如果对userid进行分区是可行
浏览 1
提问于2018-02-19
得票数 1
回答已采纳
1
回答
强迫汇流s3水槽冲洗
、
、
、
我设置了
kafka
连接s3接收器,持续
时间
设置为1小时,还设置了一个相当大
的
冲洗计数,比如10,000次。现在,如果卡夫卡通道中没有多少消息,s3接收器
将
尝试在内存中缓冲它们,然后等待它们累积到刷新计数,然后将它们一起上传,并将偏移量提交给自己
的
使用者组。 但想想这种情况。然后,经过很长一段
时间
,这5,000条信息最终将被驱逐出卡夫卡,因为保留
时间
。但是这些消息仍然存在于s3接收器
的
内存中,而不是在s3中。这是非常危险
的
,例如,如果我
浏览 3
提问于2018-06-08
得票数 4
回答已采纳
1
回答
卡夫卡分区与蒙戈切分哪个是更好
的
吞吐量
、
、
我在我
的
网站上注册网页浏览。我们已经对切分键进行了散列,以便在多个碎片中平均分配数据。然后,我们
的
聚合查询在
间隔
时间
范围内运行,以聚合这些数据并提供站点上
的
趋势。我们遇到了
Kafka
,因为它是为重载和这种
流
编写发行
的
。 我对这两个系统进行了比较,并在主题中提供了分区上
的
分布,并采用了领导跟随方法。
Kafka
在具有分区复制
的
不同
代理上使用多个分区,而Mongo则使用具有副本集<em
浏览 0
提问于2018-03-21
得票数 2
回答已采纳
1
回答
扩展
Kafka
Connect以处理10K S3存储桶
、
、
、
我想从各种S3存储桶(超过10,000个存储桶,每个文件大约20-50MB)加载数据
到
Apache
Kafka
。存储桶
列表
是动态
的
-在运行时添加和删除存储桶。理想情况下,每个存储桶配置都应该有自己
的
轮询
间隔
(扫描新文件
的
频率-至少60秒,但可能更长)和优先级(正在处理
的
并发文件
的
数量)。请注意,由于每个存储桶所有者
的
组织中存在各种IT策略,因此无法设置从每个S3存储桶
到
SQS/ in
浏览 49
提问于2021-07-28
得票数 2
1
回答
卡夫卡
流
中计数操作后
的
意外键。
我在
kafka
流
中有以下逻辑
流
:3 1508068728 11:58:48 4 150
浏览 4
提问于2017-10-15
得票数 0
回答已采纳
1
回答
在卡夫卡星火
流
的
情况下,spark.streaming.
kafka
.maxRatePerPartition和spark.streaming.backpressure.enabled有什么关系?
、
、
、
、
我正在尝试
将
数据写入一个卡夫卡主题后,阅读了一个蜂巢表如下。("spark.streaming.backpressure.enabled",”true”) 启用或禁用火花
流
的
内部背压机制(自1.5起)。这使得火花
流
能够根据当前批处理调度延迟和处理
时间
来控制接收速率,以便系统接收到
的
速度仅限于系统所能处理
的
速度。在内部,这动态地设置接收器
的
最大接收速率。此速率是由spark.stre
浏览 0
提问于2021-09-13
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark Streaming和Kafka集成深入浅出
Kafka 1.0.1案例详解之Kafka Connect
简谈Spark Streaming的实时计算整合
Kafka streams概览
在线等,Kafka如果丢了消息怎么办?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券