因此,这是一个有点奇怪的问题,因为它与如何使用该工具无关,但更多的是关于为什么要使用它。 我正在部署一个模型,并考虑使用Apache-beam的python API来运行特征处理任务。文档非常庞大和复杂,但我经历了大部分,甚至建立了一个小的工作管道,仍然不清楚这是否是适合我的工具。下面是我需要的一个示例: Input data structure: ID | Ti
令人困惑的是,每个关于数据流的谷歌文档都说它现在是基于Apache光束的,并将我引导到光束网站。此外,如果我查找github项目,我会发现google dataflow项目是空的,并且所有的项目都转到apache see repo。假设我现在需要创建一个管道,根据我从Apache光束中读到的,我会这样做:fro