腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(258)
视频
沙龙
1
回答
波束
/
云
数据流
:
如何将
Kafka
(
或
PubSub
)
主题
添加到
运行
流
中
、
、
、
(如何)可以将
主题
动态添加
或
删除到作为源
或
宿(
Kafka
或
PubSub
)的
运行
管道
中
?或者使用动态模式作为接收器,就像使用BigQuery表名称一样。一些背景知识:我们有不同的
主题
,每个客户一个
主题
,以更好地促进下游聚合,并在
运行
中
清理/添加它们。
Kafka
用于能够在比
PubSub
更长的时间内回填计算。我现在脑海中的选择要么是扩展Kaf
浏览 6
提问于2017-06-23
得票数 2
回答已采纳
0
回答
Google Dataflow -调度
、
、
在谷歌
云
平台-
数据流
中
,当流式传输未绑定的PCollection (比如使用PubSubIO的
PubSub
主题
)时,有没有一种有效的方法来启动和停止
数据流
中
的
波束
管道?(示例在一天开始时
运行
,在一天结束时结束)是让调度程序拥有Cron App engine服务并启动上面的管道作业然后停止该作业的唯一方法吗?只是看看有没有其他的选择。另外,如果我为无界PCollection选择窗口(比如从
PubSub
),有没有办法把文
浏览 8
提问于2018-07-14
得票数 3
回答已采纳
2
回答
如何将
数据从Google
PubSub
主题
流到PySpark ( Google上)
、
、
、
我在Google
PubSub
中有一个
主题
的
数据流
。message.ack() future.result() 上面的python代码从Google
PubSub
主题
(使用订阅服务器subscriber_name)接收数据,并按照预期将其写入终端。我希望将来自
主题
的相同
数据流
到PySpark (RDD
或
dataframe)
中<
浏览 1
提问于2018-09-17
得票数 1
3
回答
我正在评估Google Pub/Sub和
Kafka
。有什么不同?
、
我在
kafka
上的工作并不多,但我想在GCE
中
构建数据管道。所以我们想知道
Kafka
vs PUB/Sub。基本上,我想知道在
Kafka
和Pub/sub
中
是如何维护消息一致性、消息可用性和消息可靠性的 谢谢
浏览 0
提问于2016-07-25
得票数 101
2
回答
用于NRT数据应用的Google
、
、
、
、
Kafka
、Spark和HDFS可以通过亚马逊EC2 (
或
Google使用连接器)进行可选部署。 我读到了谷歌
云
DataFlow,
云
存储,BigQuery和Pub。
数据流
提供了实时监测数据管道的自动缩放和工具,这是非常有用的。理想情况下,Google
云
上最好的设置是
运行
TCP客户端,连接到部署在GCE上的外部网关,GCE使用pub-sub将数据推送到桌面消费应用程序。此外,它还将利用DataFlow管道进行分析和
云
存储,并使用cloudera火花连接器
浏览 2
提问于2016-02-16
得票数 0
1
回答
是否可以使用
数据流
将重复的
pubsub
消息删除回
pubsub
?
、
、
、
我有一个将数据写入Google Cloud
pubsub
的应用程序,根据
pubsub
的文档,由于重试机制而导致的重复是偶尔会发生的事情。还有失序消息的问题,这在
pubsub
中
也没有保证。我想让这些消息在消息队列(即
云
pubsub
)
中
可用,以供服务使用,并且
云
数据流
似乎确实有一个pubsubio编写器,然而,您不会回到写入
pubsub
可能会创建重复的完全相同的问题吗?如何使用
pubsub
(
或
浏览 46
提问于2019-03-12
得票数 2
1
回答
Google文件打包问题与FileSystemRefistrar
、
、
、
我在IntelliJ
中
测试了我的
数据流
java应用程序,它
运行
得非常好。但是,当在linux系统
中
运行
数据流
jar文件时,出现了以下问题: 这是我用于
数据流
的选项:--project=myproject --stagingLocation=gs://mybucket/要做到这一点,我必须将这两个库按以下顺序排列: 光束-sdks
浏览 0
提问于2018-03-21
得票数 0
回答已采纳
1
回答
数据流
作业GCS到Pub/sub最大批次大小
、
、
、
我将默认的
数据流
模板GCS用于Pub/Sub。
云
存储
中
的输入文件大小为300 of,每一行有2-3百万行。启动
数据流
批处理作业时,会引发以下错误 来自工作人员的错误消息: org.apache.beam.sdk.io.gcp.
pubsub
.PubsubIO$Write$PubsubBoundedWriter.processElementPubsubIO.java:1160):javax.naming.SizeLimitExceededException: Pub/Sub消息大小(10
浏览 6
提问于2020-08-26
得票数 1
1
回答
使用来自不同管道的数据
、
我有两条管道,"gameEngineEvents“和"userEvents”,它们使用等价的
pubsub
主题
。一个userEvent可能有一个
或
多个gameEngineEvents。当gameEngineEvent发生时,我想检查是否有一个userEvent引用了该gameEngineEvent,
运行
一些逻辑,然后将新消息发布到第三个
pubsub
主题
。那么,只在
数据流
中
做这样的事情是可能的吗?
浏览 5
提问于2017-08-09
得票数 0
回答已采纳
3
回答
如何在
数据流
作业成功后执行
云
功能?
、
、
、
只有当
数据流
作业执行成功完成时,我才想触发
云
函数。我使用
数据流
模板(jdbc到BigQuery)从Dataflow UI
运行
数据流
作业。作业执行后,没有任何选项触发任何
云
函数
或
其他东西。另外,我不能修改模板代码。触发
云
功能的方法是什么?
浏览 4
提问于2020-11-25
得票数 0
回答已采纳
1
回答
在CREATE
中
为
Pubsub
源指定不支持的架构
、
、
、
、
继我在谷歌中找到的之后,我尝试做一个示例设置,在
pubsub
中发布消息,并使用dataflow sql将其加载到bigquery表
中
。但是,当我创建
数据流
作业时,会出现以下错误: 请帮助我解决这个问题,并澄清我以下的疑虑
浏览 11
提问于2022-07-07
得票数 0
4
回答
调度作业的最简单方法
我只需要每天
运行
数据流
管道,但在我看来,像这样需要构建整个web应用程序的解决方案似乎有点过了。我正考虑在Compute引擎Linux
中
运行
来自cron作业的管道,但这可能太简单了:)。
浏览 11
提问于2017-05-06
得票数 18
回答已采纳
1
回答
如何为群集nifi设计模板
FROM | | MERGE | | PUT HDFS |我有3个节点的集群..当系统
运行
时,我检查“集群”菜单,看到只有主节点在使用资源,其他集群节点似乎空闲...问题是,在这样的集群
中
,我应该根据集群设计模板,还是应该由
浏览 11
提问于2017-07-07
得票数 2
回答已采纳
2
回答
从
云
函数启动
数据流
作业- ModuleNotFoundError:没有名为“google.cloud.functions”的模块
、
、
、
、
这就是我所执行的逻辑:每当一个新文件上传到桶
中
时,
PubSub
主题
就会发布消息然后,CloudFunction侦听有关该
主题
的订阅,并启动一个读取文件的DataFlow作业,执行数据处理并将其保存到同一桶上的一个新文件
中
。
浏览 14
提问于2021-06-25
得票数 0
回答已采纳
1
回答
使用Google /Apache并行化图像处理
或
爬行任务是否有意义?
、
、
、
、
我正在考虑将Google DataFlow作为
运行
管道的一种选择,该管道涉及以下步骤: 处理图像。我喜欢DataFlow管理完成任务所需的VM的生命周期,所以我不需要自己启动
或
停止它们,但是我遇到的所有示例都将它用于数据挖掘类的任务。
浏览 4
提问于2017-06-19
得票数 5
回答已采纳
1
回答
从Spark日志
中
获取数据谱系
、
、
、
我正在探索从Spark日志
中
为Spark程序获取数据谱系信息的方法。感谢您的帮助。 谢谢&致以问候。
浏览 3
提问于2017-11-13
得票数 0
1
回答
从HTTP端点提取数据时与Cloud的利弊
、
、
、
、
传统上,我们使用谷歌
数据流
( Google )实现类似的功能,其中的源是谷歌存储桶
中
的文件
或
谷歌
PubSub
中
的消息,等等。在这些情况下,数据以“推”的方式到达,因此使用
流
数据流
作业更有意义。但是,在新的需求
中
,由于数据是定期从HTTP端点获取的,因此按计划使用
云
运行
看起来是合理的。 所以我想收集这两种方法的优缺点,这样我们就可以对此做出合理的设计。
浏览 5
提问于2022-11-10
得票数 0
3
回答
如何将
传感器数据(如来自DHT11传感器的温度数据)发送到Google Core并进行存储
、
、
、
、
我正在努力连接一个覆盆子Pi (3B+)到Google,并将传感器的数据发送到谷歌IoT核心。但我在这件事上找不到任何内容。如果有人能帮我处理同样的事情,我会非常感激的。谢谢
浏览 1
提问于2019-07-22
得票数 0
回答已采纳
1
回答
跨GCP项目重新发布Google消息
、
、
、
、
上下文 如果
云
PubSub
本机
浏览 2
提问于2021-11-19
得票数 0
1
回答
Android传感器数据到
云
发布
、
、
、
、
我需要什么有什么问题?应用引擎将接收数据并通过发布/订阅和
数据流
发送到Bigtable。我知道了,但现在我有两个子问题- 我可以
浏览 2
提问于2020-04-02
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券