我有这样的名字和列表的数据:
| Name | value |
|:-----|------:|
| A |[1,4,7]|
| A |[9,2,5]|
| A |[6,9,3]|
| A |[1,4,7]|
| A |[9,2,5]|
| B |[6,9,3]|
| B |[1,4,7]|
| B |[9,2,5]|
| B |[6,9,3]|
| B |[1,4,7]|
我想把这个数据重新组合成另一个数据格式,因为所有的名字都会有3个这样的列表:
| Name | value |
|:-----|----------:|
| A |[1,9,6,1,9]|
| A |[4,2,9,4,2]|
| A |[7,5,3,7,5]|
| B |[6,1,9,6,1]|
| B |[9,4,2,9,4]|
| B |[3,7,5,3,7]|
有什么更简单的方法可以用熊猫来做吗?
发布于 2018-11-13 14:43:06
使用groupby
+pd.Series
+melt
df2 = df.groupby('Name').apply(lambda s: pd.Series([s['value'].str[k].agg(list) for k
in range(3)])).T.melt()
dataframe如下所示:
Name value
0 A [1, 9, 6, 1, 9]
1 A [4, 2, 9, 4, 2]
2 A [7, 5, 3, 7, 5]
3 B [6, 1, 9, 6, 1]
4 B [9, 4, 2, 9, 4]
5 B [3, 7, 5, 3, 7]
发布于 2018-11-13 14:43:17
可以,但更好的方法是将列表分成不同的系列:
res = pd.concat((pd.DataFrame(np.array(grp['value'].tolist()).T.reshape(3, -1))\
.assign(Name=key) for key, grp in df.groupby('Name')),
ignore_index=True)
print(res)
0 1 2 3 4 Name
0 1 9 6 1 9 A
1 4 2 9 4 2 A
2 7 5 3 7 5 A
3 6 1 9 6 1 B
4 9 4 2 9 4 B
5 3 7 5 3 7 B
https://stackoverflow.com/questions/53283340
复制相似问题