要删除pyspark dataframe中引号之间的空格,可以使用pyspark的内置函数和表达式来实现。以下是一种可能的解决方案:
from pyspark.sql.functions import regexp_replace
from pyspark.sql.types import StringType
def remove_spaces_between_quotes(value):
pattern = r'(?<=")\s+(?=")'
return regexp_replace(value, pattern, "")
spark.udf.register("remove_spaces_between_quotes", remove_spaces_between_quotes, StringType())
df = df.withColumn("column_name", remove_spaces_between_quotes(df["column_name"]))
请注意,将上述代码中的"column_name"替换为实际的列名。
这样,pyspark dataframe中引号之间的空格就会被删除。
领取专属 10元无门槛券
手把手带您无忧上云