考虑以下csv文件,其中" name“列中有一个重复的名称:
ID,Name,T,CA,I,C,IP
129,K1,1.2,64,386,5522,0.07
6,K1,1.1,3072,28800,6485,4.44
157,K2,1.1,512,1204,3257,0.37我想按名称对行进行分组,并记录如下I和C列
K1:
0 I 386 28800
1 C 5522 6485
K2:
0 I 1204
1 C 3257我已经编写了这段代码,它根据名称列对行进行分组,并构建一个字典。
data = {'Value':[0,1]}
kernel_df = pd.DataFrame(data, index=['C','I'])
my_dict = {'dummy':kernel_df}
df = pd.read_csv('test.csv', usecols=['Name', 'I', 'C'])
for name, df_group in df.groupby('Name'):
my_dict[name] = pd.DataFrame(df_group)
print(my_dict)但输出是
{'dummy': Value
C 0
I 1, 'K1': Name I C
0 K1 386 5522
1 K1 28800 6485, 'K2': Name I C
2 K2 1204 3257}如您所见,I和C是用列编写的,因此每个键的行都会增加。这与我想要的正好相反。我怎么才能解决呢?
发布于 2022-02-03 10:59:51
我想你需要选择带有转置的列。我不使用dict理解,因为在您的代码中将新的DataFrame添加到现有的dict中:
data = {'Value':[0,1]}
kernel_df = pd.DataFrame(data, index=['C','I'])
my_dict = {'dummy':kernel_df}
for name, df_group in df.groupby('Name'):
my_dict[name] = df_group[[ 'I', 'C']].T
print(my_dict['K1'])
0 1
I 386 28800
C 5522 6485如果有必要增加新列:
data = {'Value':[0,1]}
kernel_df = pd.DataFrame(data, index=['C','I'])
my_dict = {'dummy':kernel_df}
for name, df_group in df.groupby('Name'):
my_dict[name] = df_group[[ 'I', 'C']].T.rename_axis('g').reset_index()
print(my_dict['K1'])
g 0 1
0 I 386 28800
1 C 5522 6485https://stackoverflow.com/questions/70970021
复制相似问题