我正在尝试将新的记录时区添加到我的pysaprk数据帧中 from timezonefinder import TimezoneFinderdf = df.withColumnCannot convert column into bool: please use '&' for 'and', '|' for 'or', '~' for 'not' when buildi
我有一个dataframe,它在一个列中存储一个JSON对象。我希望处理JSON对象来创建一个新的dataframe (列的数目和类型不同,每行将从JSON对象生成n个新行)。我在下面编写了这样的逻辑:在迭代原始数据集时,将字典(行)附加到列表中。for item in row.json_object['obj']:
# create a dictionary to represent each r