因此,我有一个多个数据帧的列表,并将它们连接在一个大的数据帧中。现在,我想要向最后一个大型数据帧添加一列,但我希望该列的值根据每行首先所属的数据帧的名称而改变。这是一个示例: list_of_df = [march_01, march_02, march_03]
big_df = pd.concat([march_01, march_02, march_03], ignore_index=True)
big_df['new_column'] = # i want this column to adopt the value '01' for those ro
我有一个dataframe,其中包含如下所示的列
Name
A
A
B
B
C
我想在这个dataframe中附加一个列,其中包含名称中的项的出现号。
Name New_Column
A 1
A 2
B 1
B 2
C 1
到目前为止,我只需将Name列转换为一个列表,然后遍历它并创建new_column,但是在熊猫中有更直接的方法吗?
我有一个,其中一些列的uniqueidentifier设置为“是”,而对于其余的列,则为空白。
使用,我使用以下命令获得在uniqueidentifier中没有值的数据:
df=pandas.read_excel("sample.xlsx")
df=df[df.uniqueidentifier != "yes"]
然后,每当我遍历excel文件中的索引时,我都想对uniqueidenfier列写"yes“。
list=[]
for i in df.index
list.append(df['Subject'][i])
# do s
我有多索引数据帧,如下所示:
value
year name
1921 Ah 40
1921 Ai 90
1922 Ah 100
1922 Ai 7
其中year和name是索引。我要选择出现名称Ai的每一行。我尝试过df.loc[(:,'Ai')]和df.loc['Ai'],但两者都给出了错误。如何仅使用name列进行索引?