如何使用基于整数位置的索引访问MultiIndex数据帧中的行_使用包含NaNs的MultiIndex索引从数据帧中获取值_如何访问pandas多索引数据帧中的特定行 - 腾讯云开发者社区

、、、、

我正在从excel导入一个表，并将其转换为pandas数据帧。由于某些原因，即使我没有header命令，它也会继续将第一行数据计数为header。 df2=pd.DataFrame(pd.read_excel(r"/path/to/File.xlsx", sheet_name="Sheet2")) print(df2) 这将返回 +-+--+--+ |1|20|70| +-+--+--+ 0|4|27|50| +-+--+--+ 1|2|25|30| +-+--+--+ 2|7|23|80| ... 但我需要它回来 0 1 2 +-+--+

浏览 61提问于2021-03-29得票数 0

回答已采纳

2回答

熊猫的整数切片不同的行和列？

、

来自R，我试着让我的头为熊猫数据切片整数。令我困惑的是，使用相同的整数/切片表达式对行和列进行不同的切片行为。 import pandas as pd x = pd.DataFrame({'a': range(0,6), 'b': range(7,13), 'c': range(14, 20)}) x.ix[0:2, 0:2] # Why 3 x 2 and not 3 x 3 or 2 x 2? a b 0 0 7 1 1 8 2 2 9 我

浏览 2提问于2015-12-28得票数 3

回答已采纳

2回答

切片/重置索引后对Pandas DF使用iterrows()时出现的问题

、、

我从CSV文件中读取了数千行数据，其中包含用于计算不同输出的数据。我读入此CSV文件并将输入存储在Pandas数据帧中。然后，我使用itterrows()遍历数据帧。有时我的代码会失败，这时我希望读入原始文件，但在失败后从一行开始处理。因此，当这种情况发生时，设置我的代码，以便在进入itterrows() for循环之前取消注释两行，并将原始数据帧分割成一定大小： # slicing it and re-indexing when a restart is needed df_slice = df.iloc[1292:,] for index,row in df_slice.iterrows(

浏览 0提问于2015-12-22得票数 1

1回答

以一种不危险的方式基于布尔值选择行

、、

这是一个简单的问题，因为它是如此基本。请看-在R中，当您想要根据某个条件从数据帧中切片行时，您只需编写条件，它就会选择相应的行。例如，如果您有一个条件，即只有dataframe中的第三行满足该条件，则它将返回第三行。很简单。在python中，你必须使用loc。如果索引与行号匹配，那么一切都很好。如果您出于任何原因一直在删除行或重新排序它们，您必须记住这一点-因为loc是基于索引而不是行位置的。因此，如果在您当前的数据帧中，第三行与loc语句中的布尔条件匹配-那么它将检索数字为3的索引-这可能是第50行，而不是您当前的第三行。这似乎是一种非常危险的选择行的方式，所以我知道我做错了什么。那么

浏览 13提问于2021-07-23得票数 1

1回答

重新索引数据帧多索引

、、、

我有一个具有行和列多索引的数据帧，如下所示 BLUB BLA A B C D sample 0 blub ... ... 1 blub ... 2 blub 3 blub 4 blub 0 blub 1 blub 2 blub ... ... 我想重新编入这个索引 BLUB BLA A B C D sample 0 blub

浏览 9提问于2020-06-18得票数 1

回答已采纳

1回答

Python Pandas DataFrame数据标识

、、、

我从.xlsx文件中提取数据并将其存储在数据帧中。数据帧称为df，数据帧的大小为(51,3)。51行。3列。列是未命名的，编号为0、1、2。行的索引从0到50。在python中，我将使用什么语法从带有pandas的数据帧中提取数据并将其放入csv？我知道我会使用DataFrame.to_csv("outputFile.csv" )，但是我不确定如何识别特定的数据(行/列对)，所以我可以将它放在csv表中的新位置，而不是旧的excel表。

浏览 1提问于2016-03-09得票数 0

2回答

列重置索引

、

我有这样的数据： index 1 2 Species AGRALB AGRCRI Count 2 3 但我不希望第一行出现在那里，我只想让数据帧看起来像这样： Species AGRALB AGRCRI Count 2 3 我知道您可以使用df.reset_index()重置索引，但我只想对第1行中的运行索引进行重置。

浏览 7提问于2015-07-30得票数 1

回答已采纳

1回答

pandas列多索引中缺少值

、、、

我正在阅读像这样的熊猫excel表格： ? 使用 df = pd.read_excel('./question.xlsx', sheet_name = None, header = [0,1]) 这导致具有多索引的多索引数据帧。 ? 这里的问题是，空字段默认使用'Title'填充，而我更喜欢使用不同的标签。我不能跳过第一行，因为我正在处理更大的数据帧，其中第一行和第二行包含重复的标签(因此使用了multiindex)。您的帮助我们将不胜感激。

浏览 11提问于2020-06-30得票数 0

回答已采纳

4回答

编辑pandas数据框中的特定单元格？

、、

我正在尝试编写一个函数，使用户能够轻松地选择pandas数据帧中的特定单元格并更改其值。例如，在下面的数据框中，我希望用户能够按日期和操作选择一个单元格，即"2018-03-02“和"Manure"，并将值更改为"1”。我在2018-03-02已经做到了这一点，通过使用这个代码“剪切”(数据帧被命名为q)： q.iat[1,1]=1 但是，我希望能够使用像q.iat["2018-03-02", "Cutting"]=1这样的东西来更改单元格，但不确定如何做到这一点，因为它说.iat只能识别整数位置。除了.iat之外，还有什么我

浏览 0提问于2019-01-14得票数 2

1回答

在从DataFrame的第一行创建的新列下对pandas列进行分组

、、、

我有一个从excel文件中读取的数据帧，如下所示： |Unnamed: 0 |Unnamed: 1 |Unnamed: 3 | Unnamed: 4| |-----------|-----------|-----------|-----------| row0 |A |NaN |B |NaN | row1 |Option 1 |Option 2 |Option 3 |Option 4 | row2 |data |data |data |data

浏览 6提问于2020-10-28得票数 0

回答已采纳

2回答

pandas:使用ix的索引越界，但我可以看到列

、、、

我不知道为什么pandas会在这个数据框上抛出一个索引： SC7a 2009 2010 2011 2012 2013 2014 Region 10 10.1 10.6 11.1 11.6 9.7 10.8 Georgia 7.5 7.4 7.8 7.6 7.2 7.1 我要做的就是打电话给你： df.ix[:, 2014] 我得到了这个错误： IndexError: index 2014 is out of bounds for axis 0 with size 6

浏览 0提问于2016-03-18得票数 3

回答已采纳

2回答

iloc使用的是索引还是行的位置

、

我已经从一个数据帧中提取了几行数据到一个新的数据帧。在这个新的数据帧中，旧的索引仍然存在。然而，当我想从这个新的数据帧中指定范围时，我就像使用新索引一样使用它，从零开始。为什么它会起作用？每当我尝试使用旧的索引时，它都会给出错误。 germany_cases = virus_df_2[virus_df_2['location'] == 'Germany'] germany_cases = germany_cases.iloc[:190] 这就是代码。我从dataframe virus_df_2中提取的行的索引在16100到16590之间。我想要取前190行。在

浏览 16提问于2020-10-18得票数 0

2回答

‘标签[0]不在[索引]中’

、、

当我在python中发出以下代码时，其中myfun是我的函数的名称，B是Panda数据帧： myfun(B,10) 它会在函数的这一行给出错误 A=(data.loc[ii]>=A1) & (data.loc[ii]<A2) 其中B和数据相同，A1和A2是数字。错误如下： 'the label [0] is not in the [index]' 我阅读了你网站上的所有内容，但这并不适用于我的情况。因为没有人解释这个错误指的是什么。谁能告诉我哪里可能会有问题，以及我如何解决它？说标签不在索引里是什么意思？在我的案例中，什么是标签。

浏览 1提问于2018-06-23得票数 3

回答已采纳

3回答

查找pandas数据帧索引的最大值

、、

我有一个熊猫MultiIndexed熊猫数据帧。我想找出一个(数字，整数)索引的最大值。也就是说，索引的范围从1到5844。我希望能够找到标量值5844。我意识到我可以只设置标量变量，因为我知道索引需要的值，但我希望能够在我不知道的情况下找到最大值。

浏览 49提问于2020-04-18得票数 0

4回答

在索引数据帧之后更新Pandas MultiIndex

、、、

假设我有以下数据帧： arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']] tuples = list(zip(*arrays))

浏览 0提问于2015-06-19得票数 3

2回答

在pandas中迭代创建多索引和多列数据帧

、、、

假设我想创建一个多索引和多列的数据帧： X Y Planet Continent Country A B C D Earth Europe England 0.3 0.5 0.6 0.8 Europe Italy 0.1 0.2 0.4 1.2 Mars Tempe Sirtys 3.2 4.5 2.3 4.2 我想通过迭代收集数据帧的每一行来做到这一点， row1 = np.array(['Earth'

浏览 14提问于2020-04-29得票数 0

回答已采纳

1回答

检查并更改dataframe中的每个单元格

、

我有一个带有索引和列的dataframe，比如'a'，'b'，'c‘，所以它现在看起来像这样： a b c a 0 0 0 b 0 0 0 c 0 0 0 etc 然后我有另一个数据帧，它有有序的对，然后是一个值，比如： pair val (a, b) 0.9 (b, c) 12 etc 是否可以迭代或创建一个函数，为行a和列b中的单元格分配来自具有该特定对的其他数据帧的值？基本上，在第一个数据帧的行a和列b中，它不是0，而是0.9？我知道我不应该遍历dataframe，但我不确定在这种情况下如何使用apply()

浏览 32提问于2020-07-15得票数 1

1回答

我如何基于一个公共的列，研究站点“名称”来组合2个熊猫数据帧？

、

我是Python和一般编程的新手。我正在尝试用python自动化一些地下水模型输出数据的处理。一个pandas数据帧测量了具有不同类型的多个列的数据流(左)，另一个对数据流进行了建模(右)。我尝试在列"Name“上使用pd.merge，以便将正确的建模输出值链接到相应的测量站点值。当我使用下面的脚本时，我得到相应的错误： left = measured_df right = modeled_df combined_df = pd.merge(left, right, on= 'Name') ValueError:列标签'Name‘不是唯一的。对于多索引，标签

浏览 8提问于2020-03-31得票数 2

回答已采纳

、、、、

我有一个数据帧"moment_f“。我必须从moment_f中删除一些包含名称"AH“的行。但是，我不会删除每个"AH“行，所以我创建了一个包含要删除的"AH”的新数据帧。 ah1 = moment_f[moment_f["TextGridLabel"] == "AH"] ah_d = ah1.iloc[::2] # got the odd rows of "AH" which is what I need to get rid of from the original dataframe "moment

浏览 0提问于2018-10-16得票数 1

1回答

将单级DataFrame与三级DataFrame合并

、、

单级DataFrame： data1 = {'Sr.No.': Sr_no, 'CompanyNames': Company_Names, 'YourChoice1': Your_Choice, 'YourChoice2': Your_Choice} df1 = pd.DataFrame(data1, columns = pd.Index(['Sr.No.', 'CompanyNames','YourChoice1','YourCh

浏览 1提问于2019-01-07得票数 0

1回答

如何在应用函数上连接sum，并将数据帧打印为文件中的表格式

、、

我正在尝试将'count‘值连接到我的数据帧的顶行。以下是我的起始数据示例： <code>A0</code> 如果我打印df_new，这将产生以下输出： <code>A1</code> 正如您所看到的，计数已被正确计算，对于Tom，它已将5与10相加，得到的输出为15。但是，这显示在组的每一行上。有没有办法像下面这样得到输出--这样计数就只出现在组的第一行： <code>A2</code> 有没有办法把<code>D3</code>写成这种漂亮格式的文件呢？我希望输出看起来像一个表格，几

浏览 14提问于2019-03-29得票数 1

1回答

通过模块化删除行来收缩熊猫Df

、、

我需要减少(或选择)，例如，4个索引的倍数。我有一个2MS的数据，我想得到更少的数据，为未来的阴谋。所以我们的想法是处理1/4的数据。如果有人知道的话，只留下4-8- 16 - 20 - 4*n (或者可能相同，但5*n)的行，我会感激的。

浏览 5提问于2016-09-02得票数 1

2回答

如何通过位置或标签从数据框的单元格中获取值？

、、

我读了问题和。我对2018年从熊猫数据帧的单元格中获取值的可接受方法有点困惑，因为已经被弃用，关于的文档也有些稀疏。我想按标签选择行，按位置/整数选择列。我在下面使用的方法是2018年被接受的方法吗？我有这样的代码： import pandas as pd import random import string import csv import io ## Make a table with random column labels and rows in random order. s = '\n'.join(( ## Separate columns by co

浏览 0提问于2018-01-14得票数 2

回答已采纳

15回答

如何从数据帧的单元格中获取值？

、、

我构造了一个条件，从我的数据框中恰好提取一行： d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] 现在我想从一个特定的列中获取一个值： val = d2['col_name'] 但结果是我得到了一个包含一行和一列(即一个单元格)的数据帧。这不是我需要的。我需要一个值(一个浮点数)。我怎么才能在熊猫身上做到这一点呢？

浏览 42提问于2013-05-24得票数 540

回答已采纳

2回答

在数据帧上使用熊猫的再索引方法时，为什么原始值会丢失？

、、、

这是原始的Dataframetols：我想要的:，我想把上面的数据帧转换成这个多索引的列数据框架：我通过这段代码成功地做到了这一点： # tols : original dataframe cols = pd.MultiIndex.from_product([['A','B'],['Y','X'] ['P','Q']]) tols.set_axis(cols, axis = 1, inplace = False) 我尝试了什么:，我尝试用reindex方法这样做： cols = pd

浏览 1提问于2019-08-27得票数 2

回答已采纳

1回答

选择多层索引数据框架的行，其索引值等于另一个数据帧中的列。

、、、

有两个数据帧，其中一个作为列在另一个列中表示多个级别的索引，其思想是从第一个数据帧中选择索引值与相应列值相同的行。示例具有以下两个数据帧：df1和df2 df1 = pd.DataFrame({'i1': ['a1', 'a2', 'a3'], 'i2': ['b1', 'b2', 'b3'], 'c': [1, 2, 3]}) df1 = df1.set_index(['i1', 'i2']) c

浏览 0提问于2018-09-19得票数 2

回答已采纳

1回答

如何从单个数据中分割和创建多个熊猫数据

、、、

我正在用熊猫阅读一个excel文件。我想从原始数据帧创建多个数据帧。每个数据帧名都应该是第1行标题。此外，如何跳过每个事务之间的一列。预期结果： transaction_1: name id available capacity completed all transaction_2: name id available capacity completed all transaction_3: name id available capacity completed all 我试过的是： import pandas as pd import pprint as pp pd.option

浏览 1提问于2020-11-12得票数 0

回答已采纳

5回答

索引Pandas数据框:整数行，命名列

、、

说是一个熊猫数据帧。只接受名字只接受整数(实际位置) 同时接受名称和整数：当引用行时，只想知道他的名字。例如： df = pd.DataFrame({'a' : ['one', 'two', 'three','four', 'five', 'six'], '1' : np.arange(6)}) df = df.ix[2:6] print(df) 1 a 2 2 three 3 3 four

浏览 48提问于2015-02-27得票数 68

回答已采纳

1回答

Pandas将数据帧的行转换为对角线数据帧

、、

我有一个数据帧，我想把每一行转换成一个对角数据帧，并将所有产生的数据帧绑定到一个大的数据帧中。输入： a b c 2021-11-06 1 2 3 2021-11-07 4 5 6 所需输出： a b c Date 2021-11-06 a 1 0 0 b 0 2 0 c 0 0 3 2021-11-07 a 4 0 0

浏览 16提问于2021-11-08得票数 3

回答已采纳

1回答

为pandas dataframe中的行和列设置"meta name“

、

我正在尝试“漂亮的”熊猫混淆矩阵，它只返回一个2D-numpy数组。我想要的是添加"legends"；一个在"Pred“列的上方，一个在"Actual”的行上。像这样的东西 pred 0 1 -------- 0|123 2 Actual | 1|17 200 (如果"actual“被旋转就很完美了，但这只是一件小事)。我有以下几行代码用于创建不带元标头的数据帧 conf_mat = confusion_matrix(y_true = y_true,y_

浏览 22提问于2020-12-21得票数 0

4回答

pandas:转换多索引数据帧中的索引类型

、、、

您好，我有一个多索引数据帧： tuples = [('YTA_Q3', 1), ('YTA_Q3', 2), ('YTA_Q3', 3), ('YTA_Q3', 4), ('YTA_Q3', 99), ('YTA_Q3', 96)] # Index index = pd.MultiIndex.from_tuples(tuples, names=['Questions', 'Values']) # Columns columns = pd.MultiIndex.from

浏览 4提问于2015-12-22得票数 23

回答已采纳

1回答

熊猫Python迭代或mod

、

例如，我尝试使用Pandas或任何内置函数进行迭代，以显示10行的多个行。例如，有50条记录，我想显示10条记录的倍数，这将是记录ID 0,10,20,30,40,50。

浏览 1提问于2020-06-06得票数 0

1回答

只保留一个数据帧的行，其中某些列的值也显示在另一个数据帧中

、、

我有两个数据帧，它们共享几个公共列，如下所示：第一个df1 第二个是df2 我希望将列"TG_ID"，"ORG_NO“and "DATA_DATE"中的值也存在于df1中的行保留在df2中。例如，df2的第27行的列"TG_ID"，"ORG_NO“and "DATA_DATE"的值为"1646176"，"134010901”and "20200801"，这些值并不都出现在df1中(因为df1的列“ORG_NO”只有值"134010902" )，所以应该过滤

浏览 29提问于2021-02-27得票数 1

回答已采纳