我有一个pyspark dataframe,其中一列填充了列表,要么包含条目,要么只包含空列表。我想高效地过滤掉所有包含空列表的行。import pyspark.sql.functions as sf: java.lang.RuntimeException: Unsupported literal type class
也许我可以检查列表的长度,并强制它应该大于0(参
我正在使用OpenFoodFacts数据集使用PySpark。有相当多的列完全由缺失的值组成,我想删除这些列。我一直在查找检索每一列中缺失值的数量的方法,但它们以表格格式显示,而不是实际给出总空值的数值。下面的代码显示列中缺少的值的数,但以表格式显示它
from pyspark.sql.functions im