令人困惑的是,每个关于数据流的谷歌文档都说它现在是基于Apache光束的,并将我引导到光束网站。此外,如果我查找github项目,我会发现googledataflow项目是空的,并且所有的项目都转到apache see repo。假设我现在需要创建一个管道,根据我从Apache光束中读到的,我会这样做:from apache_
我有一个简单的管道,它从PubSub接收数据,打印数据,然后每隔10秒向GroupByKey发出一个窗口,并再次打印该消息。 然而,这个窗口似乎有时会延迟。这是google的限制,还是我的代码有问题: with beam.Pipeline(options=pipeline_options) as pipe:
messages = (编辑最新的代码。
收到以下消息:The Dataflow appears to be stuck.Please reach out to the Dataflow team at http://stackoverflow.com/questions/tagged/google-cloud-dataflow我意识到还有关于同一错误消息的其他问题,但每个错误消息的上下文似乎不同,并且消息相当通用,所以我再次发布。编辑:在从2.0.0更新到用于Python 2.