SDK: ApacheBeam SDK for Go 0.5.0 我们在Google Cloud数据流中运行ApacheBeam Go SDK作业。它们一直工作得很好,直到最近才间歇性地停止工作(没有对代码或配置进行任何更改)。., want ; (注意:它似乎在错误消息中缺少第二个散列值。) 据我所知,worker可能出了问题--它似乎试图比较worker的md5哈希值,但缺少其中一个值?不过,我不知道它到底比什么。有没有人知道
我正在尝试在Apache光束中运行一个非常简单的程序来测试它是如何工作的。import apache_beam as beam
def process(self, element):
return element(Split())) 在运行这段代码时,我得到以下错误 .... some more stack....File "/home/rahee
令人困惑的是,每个关于数据流的谷歌文档都说它现在是基于Apache光束的,并将我引导到光束网站。此外,如果我查找github项目,我会发现google dataflow项目是空的,并且所有的项目都转到apache see repo。假设我现在需要创建一个管道,根据我从Apache光束中读到的,我会这样做:from apache_beam.options.pipeline_options然而,如果我使用google-cloud-dataflow,我会得到错误:no module named 'op
当在本地运行我的Beam管道时,它完全按预期工作,但是当尝试在DataflowRunner上运行它时,我突然得到下面的错误。老实说,我甚至不知道从哪里开始评估它,因为DataflowRunner似乎是一个黑匣子。(BeamUrns.java:27)
at org.apache.beam.runners.core.construction.PTransformTranslation.at org.apache.beam.sdk.runne