问提取列值并将其存储在数组中
EN

Stack Overflow用户

提问于 2019-05-16 11:55:29

回答 1查看 255关注 0票数 0

我需要从spark dataframe中收集列n值并以数组的形式存储它。就像我们使用.values函数处理pandas数据框一样

我尝试过使用.select().collect()，但是它给我提供了空行

X = XVAr.values
Y = DF.loc[:,'LTR'].values

以上是针对pandas dataframe的，我需要在spark dataframe中执行相同的操作。

我希望得到一个数组[[5,6,4,3],[3,4,6,5]]形式的输出

发布于 2019-05-16 14:49:42

没有任何样本数据很难判断。但你的解决方案应该行得通，

arr = numpy.array(df.select('LTR').collect())

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56160607

复制

相似问题

问提取列值并将其存储在数组中EN