首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何选择火花源中的特定列?

如何选择火花源中的特定列?
EN

Data Science用户
提问于 2016-01-03 02:10:10
回答 4查看 97.3K关注 0票数 8

testPassengerId = test.select('PassengerId').map(lambda x: x.PassengerId)

我希望选择PassengerId列并对其进行RDD。但是.select不起作用。它说'RDD‘对象没有属性'select’

EN

回答 4

Data Science用户

发布于 2016-10-20 02:25:42

你可以试试下面的方法,

代码语言:javascript
运行
复制
testPassengerID = test.select('PassengerID').rdd

这将选择列PassengerID并将其转换为rdd

票数 4
EN

Data Science用户

发布于 2016-05-18 09:52:39

'RDD' object has no attribute 'select'

这意味着test实际上是一个RDD,而不是一个dataframe (您假设它是这样的)。要么将其转换为数据格式,然后应用select,要么在RDD上执行map操作。

如果你需要帮助的话请告诉我。

票数 3
EN

Data Science用户

发布于 2016-05-18 11:11:41

假设您有一个RDD,其中的每一行都是(passenger_ID, passenger_name)格式的,那么您可以执行rdd.map(lambda x: x[0])。这是一个基本的RDD

如果使用Spark,则有要按列名选择的函数。

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/9588

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档