我有一张镶木镶木桌上有一根柱子
、array>
可以使用横向视图语法在配置单元中对此表运行查询。
如何将该表读入RDD,更重要的是如何过滤、映射等Spark中的嵌套集合?
在Spark文档中找不到任何与此相关的引用。提前感谢您提供的任何信息!
ps。我觉得在谈判桌上提供一些统计数据可能会有所帮助。主表中的列数约为600。行数~200m。嵌套集合中的“列”数~10。嵌套集合中的平均记录数~35。
https://stackoverflow.com/questions/30008127
复制相似问题