我试图在现有的数据框架上创建一个新列,但总是遇到"KeyError“问题。在我的数据框中,我有一个包含出生日期的列,我想使用该列来获取客户的年龄。/anaconda3/lib/python3.7/site-packages/pandas/core/indexes/base.py", line 2659, in get_loc
return_eng
我在数据框中有一列,其中每一行都有一个用逗号分隔的日期列表。我想创建一个名为date_count的新列,其中包含每行的日期数。我试过使用pandas,但我想在pyspark中实现它,而且我也是spark的新手。df['date_count'] = 0 for i in (df.loc[[index],'date']):date_list = i