使用多索引pandas df的子集，索引的意外行为

、、、

我将来自特定数据流的多个重复的数据组织为多索引数据帧(其中每个重复标记为['rep1', 'rep2', .., 'repN'])。我经常需要在这些重复的范围内获取较大数据帧的子集(例如df.loc['rep5':'rep50', :])。但是，如果后续子集的索引仍然保留较大数据名(即['r

浏览 2提问于2017-06-27得票数 2

回答已采纳

4回答

HDF + pandas:如何在multindex中使用where掩码？

、、、

我想每天从一个巨大的hdf5中选择数据的一个子集。使用将是完美的，但我不能让它与多索引一起工作(因为我必须有一个带有两个条件的where )。不能将where掩码与多索引一起使用：import pandas as pda = ('A', 'B') i = (0, 1,index=idx

浏览 1提问于2015-07-11得票数 4

1回答

将数据文件重复合并为dataframe的单个列的优雅而有效的方法

、、

问题是，当我在更大的df数据中使用此方案时，结果是值列被设置为NaNs (在Pandas 0.13 &0.14上)# read data - both pre-sorted更新：正如@Jeff所指出的，这不是Pandas的bug，而是预期的行为。在我上面的例子中，RHS有一个简单的整数顺序索引行号，而LHS索引</em

浏览 0提问于2014-06-05得票数 1

回答已采纳

1回答

将数据帧的标头设置为.csv导出的首行

、

我希望excel文件的第一行是数据帧的标题。我现在正在尝试将第0行设置为df1并将其与df连接，但我得到了一个‘第一个参数必须是可迭代的pandas对象，你传递了一个类型为“Series”的对象。’有谁能提供一些关于如何实现这一点的见解，或者是否有更简单的方法？import pandas as pd data = pd.read_excel (r'C:\Users\dusti\Desktop\bulk e

浏览 2提问于2021-11-09得票数 2

1回答

熊猫DataFrame.loc中不同的括号

、

使用loc[x,y]与loc[x][y]与loc[[x]][y]有什么不同？乍一看，它们似乎很相似。df = pd.DataFrame(np.arange(6).reshape(3, 2),print(df)# First

浏览 1提问于2018-05-24得票数 1

回答已采纳

1回答

如何获取pandas数据框中列的子集？

、、

我得到了一个具有多列的pandas数据帧和一个具有列索引(0，1，...，n)的列表，该列表索引数据帧的列的子集。如何创建恰好包含这个列子集的新数据框？

浏览 3提问于2021-11-30得票数 0

1回答

熊猫索引行为出人意料: df[df.index[0]] => KeyError

、、

我使用了一个数据have (初始索引为0.9999)，并按年份进行了分区：和往常一样，每个子帧保留自己的索引顺序。然后，在尝试对其中一个孤立帧(df_yr = requests_df[2015])进行<em

浏览 1提问于2017-02-21得票数 1

回答已采纳

1回答

无法使用pandas复合索引访问数据

、

我正在尝试使用熊猫数据帧来组织数据。给定数据的结构，使用复合索引似乎是合乎逻辑的；'league_id‘和'fixture_id’。我相信我已经根据文档中的示例实现了这一点，但是我无法使用索引访问数据。我的代码可以在这里找到；https://repl.it/repls/OldCorruptRadius **我对熊猫和编程是非常陌生的，所以任何建议都会非常感

浏览 14提问于2020-01-12得票数 1

1回答

Pandas Dataframe:如何基于索引子集执行drop_duplicates()？

、、、

不知道有没有人能帮我这个忙：有一个pandas df有相当多的列(超过50列)。我想根据子集(第2列到第50列)删除重复项。我一直在尝试使用df.drop_duplicates(subset="col1"，"col2"，...)，但是想知道是否有一种方法可以传递列索引，这样我就不必实际写出所有列标题来考虑删除，而是可以按照df.drop_duplicates(subset = 2:)的

浏览 5提问于2021-02-23得票数 1

回答已采纳

1回答

熊猫用其他数据帧替换数据帧中的行

、

我有一个pandas数据帧，我想使用两个条件索引一个行子集，然后用我创建的新数据帧替换这个子集。但是，正如您在下面看到的，它只替换具有相同索引的行。我如何对齐数据帧的索引，以便替换对所有行都有效？df = pd.DataFrame({'A': [-4, 9, 6, -3], 'B': ['y&#

浏览 8提问于2020-02-12得票数 3

回答已采纳

1回答

在pandas* DataFrame上调用dropna()后，是否应该更新多索引级别？*

、、

在多索引dataframe上调用dropna后，索引中的级别元数据似乎没有更新。这是一个bug吗？0.10.1 In [3]: df_multi = pandas.DataFrame(index=[[1, 2],['a', 'b',]],我的变通办法是用一个“干净的</em

浏览 4提问于2013-02-28得票数 3

回答已采纳

2回答

通过列号设置Pandas* dataframe子集*

、

当我想从熊猫数据帧的列中检索jth+1值时，我可以这样写：df["column_name"].ix[j]type(df["column_name"].ix[i])#str但是，当我检查类型时，我得到：pandas.core.series.Series 我如何为<em

浏览 1提问于2016-02-18得票数 3

1回答

从熊猫数据帧中提取子集以确保没有重叠？

、、、、

假设我有2个Pandas数据帧，df维度为297232 x 122维度，df_raw维度为840380x122维度。df已经是df_raw的一个子集。两个数据帧的索引都是DateTime。我想从df中取值的70%，从df_raw中取值的30% (如果需要，可以随机采样)，同时确保采样的数据帧子集在索引方面没有重

浏览 20提问于2019-11-22得票数 2

回答已采纳

3回答

在Pandas中删除行/获取与大型DataFrame不同的子集的最快方法

、、

问题在我的数据集上花费了115秒

浏览 1提问于2018-11-20得票数 6

回答已采纳

1回答

通过值更改pandas.MultiIndex值

、

我有一个包含多索引列名的时间历史数据的pandas.DataFrame。多索引的一个级别是列的单位。我希望能够更改列的单位，这是相当简单的。不过，更改多索引来显示新的单元会让我感到困惑。def units_change(df, current = 'mm', new = 'm', conv

浏览 0提问于2020-02-13得票数 0

2回答

大熊猫drop_duplicates法DataFrame中重复指数的考虑

、、

Pandas的drop_duplicates方法考虑删除重复行时的所有列(默认)或列子集(可选)，并且不能考虑重复索引。 A Bb 0 0c 0 0df.drop_duplicates()a0 1如

浏览 1提问于2018-08-30得票数 6

回答已采纳

1回答

如何根据索引与另一个dataframe的列名匹配来子集dataframe？

如果df的列名与df2的索引匹配，我希望保留它的列。下面的代码只返回df.index，但我想返回熊猫数据的整个子集。import pandas as pd df = df[df.columns.intersection(df2.index)]

浏览 4提问于2022-10-23得票数 0

1回答

如何将多指标与布尔索引结合起来？

、、、

我有一个多索引的数据，我希望提取一个基于索引值和布尔标准的子集。我希望使用多索引键和布尔索引器覆盖特定新值的值，以选择要修改的记录。import pandas as pd householdIDs = [ id for id in4

浏览 1提问于2017-02-12得票数 3

回答已采纳

1回答

使用pandas连接多索引列

、、、

如何连接两个pandas数据帧，其中一个数据帧具有多个索引列？我需要在最终的数据帧中保留多索引。import numpy as npdf1_vals = np.random.randint(1, 10, [2,2]) df1 = pd.DataFrame(data=df1_vals, col

浏览 15提问于2021-07-14得票数 1

回答已采纳

3回答

Pandas dropna在特定行上

、

import pandas as pd 'bid':[1,2,np.nan,2,np.nan]}) 使用pandas .dropna()是否可以从指定的索引范围或数据子集中删除行？例如，在上面的

浏览 0提问于2019-10-01得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

HDF + pandas:如何在multindex中使用where掩码？

将数据文件重复合并为dataframe的单个列的优雅而有效的方法

将数据帧的标头设置为.csv导出的首行

熊猫DataFrame.loc中不同的括号

如何获取pandas数据框中列的子集？

熊猫索引行为出人意料: df[df.index[0]] => KeyError

无法使用pandas复合索引访问数据

Pandas Dataframe:如何基于索引子集执行drop_duplicates()？

熊猫用其他数据帧替换数据帧中的行

在pandas* DataFrame上调用dropna()后，是否应该更新多索引级别？*

通过列号设置Pandas* dataframe子集*

从熊猫数据帧中提取子集以确保没有重叠？

在Pandas中删除行/获取与大型DataFrame不同的子集的最快方法

通过值更改pandas.MultiIndex值

大熊猫drop_duplicates法DataFrame中重复指数的考虑

如何根据索引与另一个dataframe的列名匹配来子集dataframe？

如何将多指标与布尔索引结合起来？

使用pandas连接多索引列

Pandas dropna在特定行上

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐