问正向填充Spark/Python中的缺失值
EN

Stack Overflow用户

提问于 2016-07-01 03:46:58

回答 1查看 8.4K关注 0票数 8

我正在尝试用以前的非空值(如果存在)填充我的Spark dataframe中缺少的值。我在Python/Pandas中做过这种事情，但是我的数据对于Pandas (在一个小集群上)来说太大了，我是Spark noob。这是Spark可以做到的吗？它可以对多个列执行此操作吗？如果是这样的话，是怎么做的？如果没有，在谁的Hadoop工具套件中有任何替代方法的建议吗？

谢谢!

hadoop

apache-spark

pyspark

spark-dataframe

apache-spark-mllib

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/38131982

复制

相似问题

问正向填充Spark/Python中的缺失值
EN

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问正向填充Spark/Python中的缺失值EN

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问正向填充Spark/Python中的缺失值
EN