我有一个dataframe,它在一个列中存储一个JSON对象。我希望处理JSON对象来创建一个新的dataframe (列的数目和类型不同,每行将从JSON对象生成n个新行)。我在下面编写了这样的逻辑:在迭代原始数据集时,将字典(行)附加到列表中。'zyx':item.zyx}
df.apply(lambda row: process_row_data(row), axis=1)# create the new dat
我将一个df从pyspark导出到BigQuery。df包含包含数组元素的列,如何将数组转换为连接字符串?每当我尝试查询导出的BigQuery表的数组列时,都会得到以下错误。Error: Cannot access field element on a value with type ARRAY<STRUCT<element STRING>>
下面是导出到BigQuery的pyspark中的df</e