Pyspark:如果其他列为空，则在pyspark列中填充固定值_使用pyspark在dataframe中动态填充空列_根据列的数据类型在pyspark dataframe中填充空值 - 腾讯云开发者社区

python、pyspark

我有一个有两列的pyspark dataframe。如果另一列中的行值为空，我想用固定值填充一列。因此，在customer_df中，如果customer_address为null，则将城市列填充为“unknown” 我在试这个 customer_df = customer_df.withColumn

浏览 172提问于2020-09-26得票数 0

回答已采纳

2回答

Pyspark中的填充

pyspark、spark-dataframe

我有一个具有以下数据(所有列都有字符串数据类型)的Pyspark (原始数据)： 1 103我需要在value列中创建一个新的带有填充的修改的dataframe，这样该列的长度应该是4字符。如果长度小于4个字符，则在数据中添加0，如下所示： id Valu

浏览 2提问于2017-07-30得票数 11

1回答

将拼花文件复制到具有逗号分隔数据的Redshift中的错误

sql、amazon-web-services、amazon-s3、amazon-redshift

我试图将位于S3中的拼花文件复制到Redshift，但由于一列中有逗号分隔的数据，它失败了。有谁知道如何在地板文件中处理这样的场景吗？文件中的Parquet数据示例"column_2" : "data2"特定列中的数据以逗号分隔为"test1，tes

浏览 10提问于2022-11-29得票数 0

1回答

如何将所有的日期格式转换为日期列的时间戳？

apache-spark、datetime、pyspark、apache-spark-sql

我使用的是PySpark版本3.0.1。我正在将csv文件读取为具有2个日期列的PySpark数据帧。但是，当我尝试打印模式时，两列都被填充为字符串类型。 ? ? 如何使用pyspark将date列中的行值转换为时间戳格式？我已经尝试了很多东西，但所有的代码都需要当前的格式，但如何转换为正确的时间戳，如果我不知道什么格式的csv文件。我也尝试过下面的代码，但这是在创建一个空值的新列

浏览 16提问于2020-12-30得票数 2

1回答

Pyspark使用.filter()过滤掉空列表

python-2.7、filter、pyspark、pyspark-sql

我有一个pyspark dataframe，其中一列填充了列表，要么包含条目，要么只包含空列表。我想高效地过滤掉所有包含空列表的行。import pyspark.sql.functions as sf也许为了清楚起见，我有多个列

浏览 17提问于2017-02-24得票数 7

回答已采纳

1回答

使用pyspark将数据插入到另一个cassandra表

apache-spark、pyspark、cassandra、spark-cassandra-connector

---+---------+---------++----+---------+---------++---------+--------------+---------+ 如何根据ids将测试表中的数据插入到主表中，使用py

浏览 2提问于2020-04-21得票数 2

回答已采纳

2回答

对列列表应用条件的数据帧过滤

pyspark、databricks

如果列表中的任何字符串列为空，我想过滤一个pyspark dataframe。 df = df.where(all([col(x)!

浏览 16提问于2019-09-08得票数 3

回答已采纳

1回答

我在PySpark中有数据(列：“排名”、“歌曲”、“艺术家”、“年份”、“歌词”、“源”)。“歌词”列包含字符串值，应按单词划分。我已经计算了“歌词”列中每一行的所有单词数。我还将字符串转换为列表，将结果保存在新列"uniqWords_count“中。不幸的是，我无法弄清楚如何奉献和计算不同的价值。下面是代码，如果有用的话： billdf = billdf.withColumn('allWords_count'

浏览 2提问于2020-04-13得票数 1

回答已采纳

1回答

检查火花数据中的行值是否为空。

apache-spark、pyspark、user-defined-functions、spark-dataframe、isnull

我正在使用pyspark中的自定义函数来检查星火数据true中每一行的条件，如果条件为true，则添加列。守则如下：from pyspark.sql.functions import *sdf.show()AttributeError：'un

浏览 3提问于2016-08-19得票数 7

5回答

DataFrame对象没有属性“col”

apache-spark

在“火花:最终指南”中，它说： df.col("count")这本书是错的，还是我该怎么做呢？我上的是星火

浏览 2提问于2018-08-12得票数 9

2回答

如果A列不为空，则在B列上使用

sql

例如，如果给予：结果：解释：您将如何在SQL中使其工作

浏览 5提问于2017-03-30得票数 0

4回答

电火花approxQuantile函数

apache-spark、pyspark、apache-spark-sql

我有这些列为id、price、timestamp的数据。我正在使用这个代码来找到它，但是它给了我这个错误。from pyspark.sql import DataFrameStatFunctions as statFuncmedian.over(windowSpec) 难道不能使用DataFrameStatFunctions来<em

浏览 20提问于2017-07-24得票数 12

回答已采纳

1回答

将两列串接在pyspark中&在两者之间添加一个文本

apache-spark、pyspark、apache-spark-sql

嗨，我在Databricks中使用了3.0.1中的火花。我的pyspark df包含一个列年份，其值类似于2012，另一个列季度的编号为1,2,3和4。我想加入year_qtr并创建另一列2012 Quarter-1 &它应该包含类似于下面代码的2012 Quarter-1值col_list

浏览 2提问于2021-01-27得票数 0

回答已采纳

3回答

如何在PySpark中绑定？

apache-spark、pyspark

如何在PySpark中执行此操作

浏览 0提问于2017-09-15得票数 33

回答已采纳

1回答

如何检查CSV文件中的列是否为空或未通过shell脚本

csv、unix

我有一个CSV文件，如下所示#45ghf|123|laiej||||如何判断列是否为空如果有列为空，则在result.txt文件中打印重新填充CSV上方以竖线分隔有人能帮忙吗?？

浏览 0提问于2016-11-09得票数 0

1回答

dataframe pyspark从前一行更新行

python、dataframe、pyspark

我使用的是pyspark，我有一个数据框架，看起来像这样：A | 1 | | B | 5 | |我解释说，这个数据帧是按“代码”分组的，并按“位置”排序，我需要一个组“代码”，当我填充"COL2“时(本例中位置=2 )，获取值"AAA”并将其放在下面的位置3和4(而COL1是填充的) 我

浏览 1提问于2020-09-24得票数 0

1回答

PYSPARK:-在不丢失null值的情况下分解dataframe中的数组：“DataFrame”对象没有属性“_get_object_id”

python、python-3.x、pyspark、pyspark-sql

调用下面的对象时出错是在不丢失空值的情况下分解dataframe中的数组，但在调用列时我得到错误，说对象没有属性‘_ code.This _ object _id’。需要帮助，在其他方式调用列，可以工作。from pyspark.sql import SparkSessionfrom pyspark.sql import Row frompyspark.sql.ty

浏览 2提问于2018-07-05得票数 2

3回答

当一些值为null时，如何将DataFrame中的多个列连接到另一个列中？

pyspark、spark-dataframe

searches_df.withColumn('unique_id',reduce(column_concat,(searches_df[col] for col in search_parameters))) 除非列包含空值，否则整个级联字符串为空。

浏览 3提问于2016-09-08得票数 6

回答已采纳

2回答

检查三列中是否存在空值，并在PySpark中创建一个新列

apache-spark、pyspark

因此，目前，我有一个带有三列的星火DataFrame，我希望根据其他三列是否包含空值来添加第四列，名为target。null| null| null| PASS |如果column_1、column_2、column_2都为null，我希望传递目标列中的值，否则失败。最初，我认为UDF或Pandas会起作用，但据我

浏览 9提问于2022-06-06得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云