如何将数据从DataFrame排序为使用MultiIndex作为索引和列的DataFrame?
例如,从这里转换:
0 1 2 3 4
0 foo two A 2.30 0.01
1 foo one A 4.12 0.13
2 bar two B 9.89 3.66
3 foo one A 2.11 9.48
4 bar two A 1.07 5.55
对此:
A B
1 2 1 2
foo one 2.1
我有一个带熊猫MultiIndex的Dataframe:
In [1]: import pandas as pd
In [2]: multi_index = pd.MultiIndex.from_product([['CAN','USA'],['total']],names=['country','sex'])
In [3]: df = pd.DataFrame({'pop':[35,318]},index=multi_index)
In [4]: df
Out[4]:
在从DataFrame创建多索引DataFrame时,我对数据定向有点困惑。我使用read_excel()导入数据,并从以下内容开始: import pandas as pd
df = pd.DataFrame([['A', 'B', 'A', 'B'], [1, 2, 3, 4]],
columns=['k', 'k', 'm', 'm'])
df
Out[3]:
k k m m
0 A B A B
1 1 2 3 4 我想要对此进
我成功地用熊猫制作了一个DataFrame df。但是,df.set_index('Time')抛出ValueError: Index data must be 1-dimensional,不能继续下去。
df=pd.DataFrame(lst, columns=['Time dtime Open Close High Low Volume'.split()])
df = df.astype({'Time':'datetime64[ms]', 'Open':float, 'High':float,
我将串联对象连在一起,将现有的列名连接到Pandas中的DataFrame。结果如下:
pd.concat([x, y, z], axis=1)
X | Y | Z
-------------------
data | data | data
现在,我想在整个DataFrame的列名X、Y、Z前面插入另一个列名A。最后这个应该是这样的:
A # New Column Name
-------------------
X | Y | Z # Old Column Names
--------
在我的任务中,我需要将棒球工资数据导入熊猫DataFrame。
从那时起,我的目标之一是获得所有球队的年薪。
我很成功,但是为了完成下一个任务,我需要一个熊猫DataFrame。sumofSalaries.dtype正在返回int64。
问题:
1. How do I convert the data in the code following into a DataFrame?
2. How do I delete the indexes in `sumofSalaries`?
代码:
import pandas as pd
salariesData = pd.read_csv(
所以我有一个数据框:
df = pd.DataFrame([["foo","fizz",1],["foo","fizz",2],["foo","buzz",3],["foo","buzz",4],["bar","fizz",6],["bar","buzz",8]],columns=["a","b","c"])
a b c
我以dataframes的形式从不同的来源下载数据,并希望将它们合并到一个最终的DataFrame中。让我们用下面的例子来说明这一点:
dataframe 1 (已经有多个索引列)
index stockA stockB ...
O L H C O L H C
1/1/19 10 15 20 17 35 30 39 37
2/1/19 ... ...
...
dataframe 2 (非多索引列)
index stockA stockB
1/1/19 1.5 3.2
2/1
我有一个数据帧,它在索引中有列名,在它旁边的列中有值,如下所示: column
col1 a
col2 b
col3 c
col1 d
col2 e
col3 f 如何像这样将索引翻转并合并到列中? col1 col2 col3
a b c
d e f 我试过了: new_df = pd.DataFrame(df).transpose() new_df看起来像这样: col1 col2 col3 col1 col2 col3
a
我有嵌套的字典,我尝试导出到excel我有生成正确数据帧的代码,想法是在excel中生成它,但我在excel中只得到了列的一部分,这是我做错的地方。 user_ids = []
frames = []
for user_id, d in res_duplicate.items():
for item in d:
user_ids.append(user_id)
frames.append(pd.DataFrame.from_dict(item, orient='index'))
df = pd.concat(frames, keys
我有一个小数据集,如下所示:
和一个元组,如:(Timestamp('2009-02-27 09:45:00'), 'bloomberg', 'Chicago PMI')
我想在DataFrame上创建一个多个索引,以便它读起来类似于:
当试图构造MultiIndex时:
MI=pd.MultiIndex(index, (0,0,0))
我遇到以下错误:
TypeError: Index(...) must be called with a collection of some kind, Timestamp('200