首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >用值PySparkDataFrame填充整数类型的空列?

用值PySparkDataFrame填充整数类型的空列?
EN

Stack Overflow用户
提问于 2018-08-22 08:16:35
回答 1查看 0关注 0票数 0

我有一个包含StringType和IntegerType列的数据框。 我的目标是检查IntegerType列是否为空,如果它为空或null,请使用StringType列的散列填充它。

这是我的DataFrame,其中Column1为StringType,Column2为IntegerType:

代码语言:txt
复制
+--------------+-----------+
|Column1       |Column2    |
+--------------+-----------+
| abcdefghij   |   null    |
| s675klm@     |   675     |
+--------------+-----------+

我正在尝试这样的事情:

代码语言:txt
复制
from pyspark.context import SparkContext
from pyspark.sql import functions as f

df = df.withColumn('Column2', f.when((f.trim(df['Column2']).isNotNull()), df['Column2']).otherwise(f.md5(df['Column1'])))

我收到错误“'Nonetype'对象没有属性'withcolumn'”

我在这里错过了什么吗? 这有可能吗?

EN

回答 1

Stack Overflow用户

发布于 2018-08-22 18:01:50

正如@pault提到的,我在运行withColumn之前确实做了df = df.show()

一旦它被删除,一切正常。 我的DataFrame现在看起来像这样:

代码语言:txt
复制
+--------------+-----------+
|Column1       |Column2    |
+--------------+-----------+
| abcdefghij   |   d7d0a2a |
| s675klm@     |   675     |
+--------------+-----------+

谢谢@pault

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/-100002364

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档