我有一个数据集,其中日期的值要么看起来像是“更新的2022年4月11日”,要么是“11-4月22日”。无论如何,统一日期,并使它们完全相同的格式?
我知道我可以用regex删除“更新”,但如何将“2022年4月11日”转换为"11 -4月22日“,反之亦然?
发布于 2022-04-21 06:50:09
IIUC,您可以使用pandas.to_datetime
和str.replace
结合使用。
df['col'] = (pd.to_datetime(df['col'].replace(r'updated\s*', '', regex=True))
.dt.strftime('%d-%b-%y')
)
对于11 April 2022
,使用%d %B %Y
作为strftime
格式输出:
0 11-Apr-22
1 11-Apr-22
Name: col, dtype: object
输入数据:
df = pd.DataFrame({'col': ["updated 11 April 2022", "11-Apr-22"]})
https://stackoverflow.com/questions/71950024
复制相似问题