我得到了一组格式不佳的数据来清理,有几列数据包含多条信息,每条信息都需要分成多列。一个例子是一个名为DaysOfWeek的列,它包含一个人可以工作的天数,以及一个自由文本字段。我想创建8列,一列表示一周中的每一天,另一列表示不是一周中某一天的任何内容(可能包含一周中某一天的名称,如下面的示例所示)。我已经将数据导入到Pandas中,并尝试使用"in“列表功能来扫描一周中的几天,但我得到的所有信息都是错误的。下面是重现我的问题的代码:
import pandas as pd
# First example - Testing it in regular code:
x = 'M
要将多个变量传递给一个普通的python函数,您只需编写如下代码:
def a_function(date,string,float):
do something....
convert string to int,
date = date + (float * int) days
return date
在使用Pandas DataFrames时,我知道您可以基于一个列的内容创建一个新列,如下所示:
df['new_col']) = df['column_A'].map(a_function)
# This m