我有两个表A和B。它们都有字段session_id和cookie_id。如何在session_id上创建一个连接A与B连接的表输出,如何在Dataflow管道的帮助下创建cookie_id?CoGroupByKey方法允许您在一个键上连接。在文档中也找不到任何有用的东西。
发布于 2018-05-07 02:47:39
在这种情况下,我遵循的一种方法是创建一个特殊的键,它是两个键的组合。在将读取数据转换为键值对时,我会将session_id$cookie_id输出为一个连接字符串。这里,$可以是任何不构成两个键的字符集的分隔符。分隔符也可以忽略。
https://stackoverflow.com/questions/50175971
复制相似问题