首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何跟踪从Google BigQuery发布到Pub/Sub的行?

如何跟踪从Google BigQuery发布到Pub/Sub的行?
EN

Stack Overflow用户
提问于 2018-04-10 12:03:28
回答 1查看 916关注 0票数 0

我正在使用cron作业编写从google (googles SQL datawarehouse)到mysql的数据。我们使用google /sub作为中介(从bigquery读取,发布到pub/Sub,然后从pub/Sub订阅,然后写到mysql(在cloudsql上))。我们在bigquery表的每一行上放置一个published_flag布尔值,以表示某一行何时已成功发布。这方面的问题是,bigquery每个表每天都有数量有限的更新/插入/删除语句。此外,我们正在处理数十亿行数据。解决这一问题的替代办法是什么?是否有任何GCP服务或web服务能够更优雅地处理这个问题?

我们目前的选择是:

  1. 购买更多bigQuery配额(不可伸缩)
  2. 从bigquery直接写入mysql (不健壮和解耦)
  3. 在另一个服务中有另一个表,比如google,它可以跟踪已发布的行(看起来不优雅,也增加了复杂性)。
  4. 批量更新发布标志(也不可伸缩)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-05-08 11:02:38

结合cronjob和Pub/SUb可能不是这个用例的好选择。最合适的产品应该是Cloud Dataflow,因为它是为ETL设计的。在这种特殊情况下,您可以使用BigqueryIOBigqueryJdbcIO读取数据,将其写入SQL数据库。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49753160

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档