我有pyspark数据框架,其中我有一个类似这样的列。我想从字符串中删除/ccc。 我在pyspark中尝试了几件事,但都不起作用。我需要为此使用UDF吗?但是,它会生成null from pyspark.sql.functions import concat_ws, udf, col "/".join(str.split
假设我有dataframe,其中包含列中的值,如:ABC93890380380XYZ3898302MGE8983_ABZ我想要修剪这些值,例如,删除前3个字符和删除最后3个字符,如果它以ABZ结尾。from pyspark.sql import functions as f
new_df = df.withColumn("new_column", f.when((condition o