首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >从字典到多索引数据帧的嵌套字典,其中字典键是列标签

从字典到多索引数据帧的嵌套字典,其中字典键是列标签
EN

Stack Overflow用户
提问于 2014-07-28 11:43:02
回答 5查看 47.2K关注 0票数 71

假设我有一个字典,如下所示:

dictionary = {'A' : {'a': [1,2,3,4,5],
                     'b': [6,7,8,9,1]},

              'B' : {'a': [2,3,4,5,6],
                     'b': [7,8,9,1,2]}}

我想要一个看起来像这样的数据帧:

A   B
     a b a b
  0  1 6 2 7
  1  2 7 3 8
  2  3 8 4 9
  3  4 9 5 1
  4  5 1 6 2

有什么方便的方法可以做到这一点吗?如果我尝试:

In [99]:

DataFrame(dictionary)

Out[99]:
     A               B
a   [1, 2, 3, 4, 5] [2, 3, 4, 5, 6]
b   [6, 7, 8, 9, 1] [7, 8, 9, 1, 2]

我得到一个数据帧,其中每个元素都是一个列表。我需要的是一个多索引,其中每个级别对应于嵌套字典中的键,行对应于列表中的每个元素,如上所示。我想我可以做一个非常粗糙的解决方案,但我希望有更简单的解决方案。

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2014-07-28 11:58:45

Pandas希望将MultiIndex值作为元组,而不是嵌套的字典。最简单的做法是在尝试将字典传递给DataFrame之前将其转换为正确的格式:

>>> reform = {(outerKey, innerKey): values for outerKey, innerDict in dictionary.iteritems() for innerKey, values in innerDict.iteritems()}
>>> reform
{('A', 'a'): [1, 2, 3, 4, 5],
 ('A', 'b'): [6, 7, 8, 9, 1],
 ('B', 'a'): [2, 3, 4, 5, 6],
 ('B', 'b'): [7, 8, 9, 1, 2]}
>>> pandas.DataFrame(reform)
   A     B   
   a  b  a  b
0  1  6  2  7
1  2  7  3  8
2  3  8  4  9
3  4  9  5  1
4  5  1  6  2

[5 rows x 4 columns]
票数 83
EN

Stack Overflow用户

发布于 2017-06-29 02:35:32

dict_of_df = {k: pd.DataFrame(v) for k,v in dictionary.items()}
df = pd.concat(dict_of_df, axis=1)

请注意,对于低于3.6的python,列的顺序会丢失

票数 22
EN

Stack Overflow用户

发布于 2020-04-08 04:49:41

这个答案有点晚了,但是...

您正在寻找的功能是.stack

df = pandas.DataFrame.from_dict(dictionary, orient="index").stack().to_frame()
# to break out the lists into columns
df = pd.DataFrame(df[0].values.tolist(), index=df.index)
票数 20
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24988131

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档