使用xs对多索引pandas数据帧进行切片

是指使用pandas库中的xs方法来对具有多层索引的数据帧进行切片操作。

xs方法是pandas库中用于获取数据的多层索引的专用方法。它可以在多层索引中选择特定的数据，并且可以通过设置参数来指定要选择的索引层级。

在多索引pandas数据帧中，可以使用xs方法按照以下方式进行切片：

切片单个索引层级：通过设置level参数指定要选择的索引层级，然后通过key参数指定要选择的具体索引值。例如，df.xs('A', level=1)将选择索引层级为1，并且值为'A'的所有数据。
切片多个索引层级：通过设置多个level参数，依次指定要选择的索引层级，然后通过key参数依次指定要选择的具体索引值。例如，df.xs(('A', 'X'), level=(0, 1))将选择索引层级为0和1，并且值分别为'A'和'X'的所有数据。
切片行和列：xs方法还支持同时切片行和列。通过设置axis参数为0来选择行，设置axis参数为1来选择列。例如，df.xs('A', level=1, axis=0)将选择索引层级为1，并且值为'A'的所有行数据。

使用xs方法对多索引pandas数据帧进行切片的优势在于灵活性和可读性。它允许以一种直观且易于理解的方式选择特定的索引层级和索引值，使得数据的提取和处理更加简便和高效。

适用场景：适用于多层次索引的数据集，例如金融数据、时间序列数据等。在这些场景下，使用xs方法可以方便地选择特定的索引层级和索引值，以满足不同的数据分析和处理需求。

腾讯云相关产品和产品介绍链接地址：

腾讯云数据库TencentDB：https://cloud.tencent.com/product/tcdb
腾讯云计算引擎Tencent CVM：https://cloud.tencent.com/product/cvm
腾讯云云服务器Serverless Cloud Function：https://cloud.tencent.com/product/scf
腾讯云人工智能AI Lab：https://cloud.tencent.com/product/ailab
腾讯云物联网IoT Hub：https://cloud.tencent.com/product/iothub
腾讯云存储COS：https://cloud.tencent.com/product/cos
腾讯云区块链Tencent Blockchain as a Service：https://cloud.tencent.com/product/baas
腾讯云云原生容器服务Tencent Cloud Native Container Service：https://cloud.tencent.com/product/tke
腾讯云云原生应用引擎Tencent Cloud Native Application Engine：https://cloud.tencent.com/product/tcae

请注意，以上链接仅为示例，具体的产品选择应根据实际需求进行评估和决策。

切片/重置索引后对Pandas DF使用iterrows()时出现的问题

、、

我从CSV文件中读取了数千行数据，其中包含用于计算不同输出的数据。我读入此CSV文件并将输入存储在Pandas数据帧中。然后，我使用itterrows()遍历数据帧。有时我的代码会失败，这时我希望读入原始文件，但在失败后从一行开始处理。因此，当这种情况发生时，设置我的代码，以便在进入itterrows() for循环之前取消注释两行，并将原始数据帧分割成一定大小： # slicing it and re-indexing when a restart is needed df_slice = df.iloc[1292:,] for index,row in df_slice.iterrows(

浏览 0提问于2015-12-22得票数 1

2回答

pandas -多索引切片未按预期调整索引值

、、、

在Pandas中，我试图过滤出数据帧中具有特定日期(设置为多索引的第一级)的行。过滤后，我想检查第一级的最后一个索引值是否与我的最新日期匹配。但是，我不能让Pandas返回正确的值。举个例子可能会有所帮助。我首先使用multiindex创建原始的df： index = pd.date_range('2016-01-01', freq='B', periods=10), ["AAPL", "GOOG"] df = pd.DataFrame(index=pd.MultiIndex.from_product(index)) prin

浏览 11提问于2017-01-09得票数 3

回答已采纳

3回答

按行的绝对值对数据帧进行排序

、、

我有以下数据帧： import pandas as pd data = {0: [-1, -14], 1: [-3, 2], 2: [7, 10], 4: [-10, 15]} df = pd.DataFrame(data) 我知道如何对特定行进行排序： df.sort_values(by=0, ascending=False, axis=1) 如何根据第一行的绝对值对数据帧进行排序？在本例中，我将拥有类似如下的内容： sorted_data = {0: [-10, 15], 1: [7, 10], 2: [-3, 2], 4: [-1, -14]}

浏览 12提问于2020-08-19得票数 2

1回答

熊猫索引行为出人意料: df[df.index[0]] => KeyError

、、

我使用了一个数据have (初始索引为0.9999)，并按年份进行了分区： requests_df = {year : df[df['req_year'] == year] for year in df['req_year'].unique()} 和往常一样，每个子帧保留自己的索引顺序。然后，在尝试对其中一个孤立帧(df_yr = requests_df[2015])进行索引时，我得到了一个非常出乎意料的行为： for idx in df_year.index: qty = frame[idx]['qty_tickets'] 原因

浏览 1提问于2017-02-21得票数 1

回答已采纳

2回答

如何从数据帧中删除任何行中包含特定值的列

、、、

在pandas数据帧中，我需要找到任意行中包含零的列，并删除整个列。例如，如果我的数据帧看起来像这样： A B C D E F G H 0 1 0 1 0 1 1 1 1 1 0 1 1 1 1 0 1 1 我需要删除列A、B、D和F。我知道如何删除这些列，但是以编程方式识别带有零的一列让我摸不着头脑。

浏览 17提问于2018-12-27得票数 2

回答已采纳

1回答

可以使用SQL操作通过Pandas创建的数据帧吗？

、、、

因此，我正在尝试创建一个python脚本，该脚本允许我在使用pandas创建的数据帧(masterfile)上执行SQL操作。数据帧从特定文件夹中找到的csv文件中提取其内容。我能够成功地创建其他所有内容，但我在SQL操作部分遇到了麻烦。我正在尝试使用数据帧作为“数据库”，在这里我将使用我的SQL查询来拉取数据，但是我得到了一个"AttributeError：' dataframe‘object has no attribute 'cursor’“错误。我没有看到很多pandas.read_sql_query()的例子，所以我很难理解我将如何在其中使用我的数据帧。

浏览 12提问于2020-06-28得票数 0

1回答

Pandas优化

、、

我写了一个函数来处理pandas的数据。使用我的函数的%prun的分析日志张贴在底部(只有几行)。我想优化我的代码，因为我需要调用这个我写了超过4000次的函数。运行此函数一次需要37.7s。似乎最耗时的部分是numpy.ndarray的nonzero。因为我几乎所有的操作都是基于pandas的，所以我想知道pandas中的哪个函数严重依赖于这种方法？我的操作主要包括使用df.ix[]的基于datetimeindex的数据帧切片和使用pandas.merge()的数据帧合并。我知道不发布实际的脚本很难判断，但是脚本太长了，没有意义，而且大多数操作都是临时的，所以我不能把它重写成小脚本在这

浏览 2提问于2014-06-24得票数 0

2回答

Pandas数据帧每第n行重新采样一次

我有一个脚本，可以将系统日志文件读取到pandas数据帧中，并从这些数据帧生成图表。图表适用于较小的数据集。但当我面对更大的数据集时，由于更长的数据收集时间框架，图表变得太拥挤而无法辨别。我计划对数据帧进行重采样，以便如果数据集超过一定大小，我将对其进行重采样，以便最终只有SIZE_LIMIT行数。这意味着我需要过滤数据帧，这样每个n= actual_size/SIZE_LIMIT行都会聚集到新数据帧中的一行。agregation可以是平均值，也可以是第n行。我对熊猫不是很熟悉，所以可能错过了一些明显的方法。

浏览 2提问于2013-01-30得票数 4

回答已采纳

3回答

获取列与特定值匹配的dataframe中的整数行索引

、、、、

给定一个Pandas数据帧，其中一列如下所示： Date 2016-04-15 2016-04-14 2016-04-13 2016-04-12 2016-04-11 2016-04-08 假设值是唯一的，我如何获得特定值的行索引？例如，"2016-04-13“将返回2

浏览 0提问于2016-05-29得票数 5

回答已采纳

1回答

Pandas:子索引数据帧:副本与视图

、、

假设我有一个数据帧 import pandas as pd import numpy as np foo = pd.DataFrame(np.random.random((10,5))) 我从我的数据子集创建了另一个数据帧： bar = foo.iloc[3:5,1:4] bar是否拥有来自foo的这些元素的副本？有没有办法为这些数据创建一个view？如果是这样，如果我尝试修改此视图中的数据，会发生什么情况？Pandas是否提供了任何类型的机制？

浏览 2提问于2013-07-31得票数 27

回答已采纳

1回答

熊猫-访问SparseDataFrame的行

、

我有一个非常低密度的大型SparseDataFrame (例如，20k索引x10k列)(设置了0.1%的条目)。我正在尝试访问数据帧的特定行，但我似乎无法这样做。不过，访问列是可以的。下面是一个小例子，说明了这个问题： import numpy as np import pandas as pd df = pd.DataFrame(np.arange(15).reshape(5,3), index=list('abcde')) df.loc['b',1] = np.nan # for good measure... sparse = df.to_sparse

浏览 3提问于2014-01-24得票数 4

1回答

如何为pandas中的多索引切片赋值

、

import pandas as pd import numpy as np df = pd.DataFrame(np.zeros([4,1]), index=pd.MultiIndex.from_product([[0,1], ['a','b']])) df.loc[(slice(None), 'a'), 0] = pd.Series({1:2, 0:3}) df 给出我找到了几个建议将.values添加到右侧的地方，但这给出了错误的结果(它切换了2和3，因为我故意将右侧的序列放在“错误”的顺序中)，因为我确实需要pandas为我

浏览 0提问于2021-02-01得票数 0

1回答

试图访问熊猫df中的指数列。dataframe由value.counts()函数创建。不起作用

、、

我试图使用iloc访问Pandas数据帧中的一个列的索引号： new = df_new.iloc[:,0] 抛出错误： IndexingError:太多索引器 iloc上的其他帖子显示他们工作得很好。不明白为什么在我身上发生这种事。救命啊!！数据框架是：游戏3862娱乐535教育453图片与视频349公用事业248健康与健身180生产力178社交网络167 144音乐138购物122体育114书112财务104旅游81新闻75天气72参考64食品饮料63商业57导航46医疗23目录10 并由代码创建： df_new=obj_df["prime_genre"

浏览 0提问于2018-07-11得票数 0

回答已采纳

11回答

如何在pandas中获取数据帧的列切片

、、、、

我从CSV文件加载一些机器学习数据。前2列是观测值，其余列是特征。目前，我做了以下工作： data = pandas.read_csv('mydata.csv') 这给出了一些类似的东西： data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 我想将这个数据帧分成两个数据帧:一个包含列a和b，另一个包含列c、d和e。不可能写出像这样的东西 observations = data[:'c'] features = data['c':] 我不确

浏览 4提问于2012-05-19得票数 304

回答已采纳

2回答

Pandas iloc复杂切片每第n行

、、、、

我有一个周期为14行的数据帧，即每条记录有14行数据(means，sdev等)。我想要提取第二、第四、第七和第九行，对每条记录(14行)重复提取。我的代码是： Mean_df = df.iloc[[1,3,6,8]::14,:].copy() 这不起作用 TypeError: cannot do slice indexing on <class 'pandas.core.indexes.range.RangeIndex'> with these indexers [[1, 3, 6, 8]] of <class 'list'> 我从这里获

浏览 2提问于2018-08-17得票数 3

回答已采纳

1回答

在jupyter笔记本中从熊猫数据中选择单行时发生的Python键错误

、、、

我成功地用StackOverflow解决了许多问题，但这是我第一次在其他地方找不到问题，自己也解决不了. 我在jupyter笔记本上工作，里面有熊猫的数据，包括文字评论和亚马逊产品的评分。下面是我的代码： import pandas as pd data = pd.read_csv("AmazonSampleForStudentOffice.csv") reviews = data[['reviewText', 'score', 'len_text']] reviews.head(5) 其结果是： reviewText scor

浏览 0提问于2020-03-31得票数 1

回答已采纳

2回答

pandas数据透视表-更改非索引列的顺序

、

我使用以下命令创建了一个数据透视表： table2 = pandas.pivot_table(df, index=['Salesperson'], values=['Gross Sales', 'Gross Profit'], aggfunc=numpy.sum) table2['Profit Margin'] = table2['Gross Profit'] / table2['Gross Sales'] table2_rounded = table2.round({'Gross Prof

浏览 2提问于2016-04-01得票数 8

回答已采纳

1回答

是什么改变了这个pandas代码中的日期类型？

、、

我在Pandas中有一个数据框，其中包含日期和其他一些数据。日期是显式的datetime.date类型。在本例中，我手动强制执行此操作。在实际问题中，框架是从已经设置好的外部源导入的。在操作索引之后，我发现我的dates属于pandas._libs.tslib.Timestamp类，这会导致与后面的代码不兼容。是什么导致了类型/类的变化？最小工作示例(注意第3行和第7行之间的区别)： In [1]: df = pd.DataFrame({'date' : ['02/20/2015','01/15/2016','08/21/2015

浏览 9提问于2019-07-10得票数 1

回答已采纳

1回答

Pandas Groupby没有对单个结果进行聚合

、、、

我在Pandas有一个数据帧，它显示了一个城市/州的男性所占的百分比。数据帧df如下所示(请注意，这不是我的实际使用情况/数据，但我的数据类型类似) STATE CITY PERC_MEN ALABAMA ABBEVILLE 41.3% ALABAMA ADAMSVILLE 53.5% .... WYOMING WRIGHT 46.6% 每个State/percentage of men组合将恰好返回一个值。如何显示给定州的城市/人口值？我的代码如下所示(我需要按STATE分组的第一行，因为我对数据做了其他事情) for state

浏览 4提问于2021-09-08得票数 0

2回答

在切片两个不同级别的multiIndex时出错

、、

当我试图分割两个级别的multiIndex...Any帮助时，我收到了一条意外的错误消息。请看附的密码..。我正在运行Python3.7.1和Pandas 0.23.4 我有这个数据： import pandas as pd import itertools index = list(itertools.product(['Ada','Quinn','Violet','Juan'],['Physics', 'Chemistry','Math','English&#

浏览 2提问于2018-12-27得票数 1

回答已采纳

1回答

将每一对列彼此分开

、、

我希望对每一对连续列进行除法，并重新填充计算值。例如，下面有下面的DataFrame。在下面的数据帧中，我要将B/A和D/C分开，然后B/A的结果应该在B列中重新填充，D列中应该填充D/C的结果。请注意，我的实际DataFrame非常大。它有86列。我更希望有一个自动的方案，要么循环遍历所有列(即86列)来改变43列中的值，要么使用内置的Pandas函数执行此操作。 A B C D 0 2.056494 -3.002088 0.516822 -1.338846 1 0.082295 1.

浏览 2提问于2017-06-13得票数 1

回答已采纳

1回答

MultiIndexing行与DataFrame中的列

、、、

我正在处理熊猫中的多重索引数据，我想知道是应该多索引行还是列。我的数据如下所示：代码： import numpy as np import pandas as pd arrays = pd.tools.util.cartesian_product([['condition1', 'condition2'], ['patient1', 'patient2'],

浏览 2提问于2014-02-27得票数 5

1回答

处理附加到数据帧的抽象

、、、、

如果我有一个对dataframe的“引用”，在pandas中似乎没有办法附加到它，因为append和concat都不支持inplace=True参数。一个(过于)简单的例子： chosen_df, chosen_row = (candidate_a_df, candidate_a_row) if some_test else (candidate_b_df, candidate_b_row) chosen_df = chosen_df.append(chosen_row) 现在，因为Python做了类似于按值复制引用的事情，所以chosen_df最初将是对传递给some_test的任何候选

浏览 22提问于2019-08-21得票数 1

回答已采纳

2回答

为什么dataframe对象要转换为TimeSeries对象

、、

假设我有一个数据框架。有多个列(例如：‘，'B')使用以下代码，我希望仅基于一列就生成一个新的数据格式： df2 = df1['A'] 但是，当我这样做时，数据帧突然被转换为TimeSeries。 In [5] print type (df2)<class 'pandas.core.series.Series'> 非常odd...can有人向我解释为什么会发生这种事.？

浏览 3提问于2015-12-14得票数 0

回答已采纳

2回答

pandas多索引选择数据按逻辑数组

、、、、

这里我有一个数据帧 import pandas as pd import numpy as np data = pd.DataFrame(np.arange(100).reshape(20,5), columns=list('abcde')) data = data.set_index(['a', 'b']) print(data.head()) c d e a b 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

浏览 31提问于2017-02-15得票数 2

回答已采纳

2回答

索引到Dask系列可以返回Dask系列

、、

我有Dask系列的Dask数据帧。我想在本系列中建立索引，以获取dask数据帧以供后续工作使用。但是，使用loc[0]会导致另一个dask系列。使用to_frame也不起作用，因为结果是"Dask系列Dask数据帧的Dask数据帧“。下面是一个使用Dask系列Pandas数据帧的最小示例(不完全相同，但说明了问题)： import pandas as pd import dask.dataframe as dd pdf1 = pd.DataFrame({'a': [1,2,3,4], 'b': [4,3,2,1]}) pdf2 = pd.Data

浏览 3提问于2020-02-03得票数 1

2回答

从pandas MultiIndex数据框中选择特定列

、、

我有一个包含200列的MultiIndex数据帧。我想从中选择一个特定的列。假设df是我的数据帧的一部分： df= a b l h l h l h l cold hot hot cold cold hot hot 2009-01-01 01:00:00 0.1 0.9 0.4

浏览 4提问于2016-10-14得票数 1

3回答

在Python中过滤数据帧

、

我有一个包含2列的数据帧，如下所示： Index Year Country 0 2015 US 1 2015 US 2 2015 UK 3 2015 Indonesia 4 2015 US 5 2016 India 6 2016 India 7 2016 UK 我想创建一个新的数据帧，其中包含每年国家的最大计数。新的数据帧将包含3列，如下所示： Index Year Countr

浏览 0提问于2017-08-12得票数 2

2回答

将序列索引设置为具有更多级别的另一个索引

、、

我试图用一个比系列的原始索引包含更多级别的索引( Series，ix)来设置a1的索引。 >>> a = pd.DataFrame({'a': [1, 2, 3], 'b': ['b', 'b', 'b'], 'x': [4, 5, 6]}).set_index(['a', 'b']) >>> a x a b 1 b 4 2 b 5 3 b 6 >>> >>> a1 = a

浏览 1提问于2019-05-15得票数 1

回答已采纳

3回答

熊猫从df中删除了一系列行。

、、

我想从数据帧的底部删除m行。它是整数索引的(带孔)。如何做到这一点？ pandas == 0.10.1 python == 2.7.3

浏览 1提问于2013-03-29得票数 24

回答已采纳

4回答

如何切开一个MultiIndex熊猫的DataFrame？

、

假设您有以下数据帧： In [1]: import pandas as pd In [2]: index = [('California',2000),('California', 2010), ('New York', 2000), ('New York', 2000), ('New York', 2010), ('Texas', 2000), ('Texas',2010)] In [3]: populations = [33871648, 37253956,189765457

浏览 23提问于2021-03-12得票数 1

回答已采纳

1回答

pandas多索引切片“级别类型不匹配”

、、、

我从0.13.1迁移到pandas版本0.17，在切片方面遇到了一些新的错误。 >>> df date int data 0 2014-01-01 0 0 1 2014-01-02 1 -1 2 2014-01-03 2 -2 3 2014-01-04 3 -3 4 2014-01-05 4 -4 5 2014-01-06 5 -5 >>> df.set_index("date").ix[datetime.date(2013,12,30

浏览 0提问于2015-11-19得票数 5

1回答

如何获取python数据帧中的最后n个索引？

、、

我有以下数据帧： volume index 1 65 1 55 2 44 2 56 3 46 3 75 4 64 4 64 当我把代码放入df.iloc[-2:]时，.it只显示我的数据帧的最后两行。示例： volume index 4 64 4 64 我想用下面的结果得到最后两个索引 volume index 3 46 3 75 4 64

浏览 0提问于2020-07-27得票数 2

1回答

使用大列表对多索引pandas数据帧进行切片

、、、

我有一个具有多索引的大型数据框架。我想使用一个相当大的列表来分割这个数据帧。下面是一个示例代码。此操作几乎需要10秒。 import pandas as pd import numpy as np df = pd.DataFrame( { "x": np.repeat(np.arange(10000), 50), "y": np.repeat(np.arange(50), 10000), "val": np.random.rand(50*10000) } ).set_index([

浏览 13提问于2020-03-07得票数 2

回答已采纳

2回答

混合行号和列名的索引Pandas Dataframe

、、

来自R，发现pandas数据帧的索引规则不容易使用。我有一个数据帧，我想通过它们的名字来获取第i行和一些列。我可以清楚地理解使用iloc或loc，如下所示。 df = pd.DataFrame(np.random.randn(8, 4),columns=['A', 'B', 'C', 'D']) df.loc[:,['A', 'B']] df.iloc[0:,0:2] 从概念上讲，我想要的是： df.loc[0:,['A', 'B']] 表示包含这些列的第一行。当然

浏览 269提问于2020-07-06得票数 0

回答已采纳

2回答

如何使用单个索引更新多索引数据帧中的记录

、、、、

我需要将多索引数据帧更新为单索引数据帧。在pandas 0.24.2中，这可以在没有循环、自定义函数、重置索引或创建多索引的情况下以API原生方式完成吗？(如果不能切片和更新，那么使用多索引有什么意义？) 下面是一些代码。 df_old = pd.DataFrame( [['a', 'x', 0, 0, 0], ['a', 'y', 0, 0, 0], ['a', 'z', 0, 0, 0], ['b', 'x', 0, 0, 0], ['

浏览 0提问于2019-06-09得票数 0

2回答

python -使用具有相同索引的另一个dataframe替换dataframe中的值

、

我有一个dataframe，有些列缺少值： a = pd.DataFrame(data = {"name":['bob','sue','dave'],'status':[np.NaN,np.NaN,'A'],'team':['red','blue',np.NaN]},index=[100,101,105]) 数据帧a ? 我有另一个具有相同索引的dataframe，其中一些缺失的值已被替换： b = pd.DataFrame(data = {

浏览 54提问于2020-08-13得票数 1

回答已采纳

2回答

如果引用文件不存在，则有效删除DataFrame中的行

、、

我有一个Pandas DataFrame，df，它有一个path列，其中包含用于分析的图像文件的路径。这个数据集中的一些图像实际上并不存在，因此我需要有选择地删除不存在的图像path的行。目前，我正在遍历整个数据帧并重新分配它，如下所示： for index, sample in df.iterrows(): if not os.path.isfile(sample['path']): df = df.drop(index) 但是，由于我的数据集包含数以万计的图像，所以速度非常慢。我还研究过使用更一般的问题中的方法 df = df.drop(df[n

浏览 0提问于2019-06-30得票数 1

回答已采纳

16回答

如何用NaN替换Pandas Dataframe列中的Zero值？

、、、

我有一个Pandas数据帧，如下所示： itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 20

浏览 4提问于2012-11-09得票数 559

回答已采纳

1回答

如何循环访问特定的行、列

、、

我想遍历xls文件的特定范围。如图所示，你可以看到我在两行之间的一些点上有一些十字。我需要将它们的值放到我的python程序中，以便将它们镜像到一个数组中。所以我想我只需要用pandas遍历数据帧，然后创建一个简单的if函数。到目前为止，我的函数如下所示： import pandas as pd import xlrd df = pd.read_excel('test.xls', sheet_name='Tabelle1') for index, rows in df.iterrows(): if rows[index] == "x&#

浏览 17提问于2020-04-22得票数 1

1回答

从现有数据帧的某些列创建新的pandas数据帧

、、

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是： names = ['A','B','C','D'] dataset = pandas.read_csv('file.csv', names=names) new_dataset = dataset['A','D'] 我想用原始数据帧中的列A和D创建一个新的数据帧。

浏览 1提问于2017-07-11得票数 24

回答已采纳

1回答

Plotly.Express + Pandas多索引列

、、

我是Pandas和Plotly的新手。我将直接提出我想要做的MWE的问题： import pandas import plotly.express as px df = pandas.DataFrame( { 'n': [1,1,1,1,2,2,2,3,3,3,4,4], 'x': [0,0,0,0,1,1,1,2,2,2,3,3], 'y': [1,2,1,1,2,3,3,3,4,3,4,5], } ) mean_df = df.groupby(by=['n']

浏览 2提问于2021-10-26得票数 1

2回答

保留数据帧中的特定列

、

我有一个来自使用pandas的导入csv的数据帧。这个数据帧有160个变量，我只想保留5，9，10，46，89。我试试这个： dataf2 = dataf[[5] + [9] + [10] + [46] + [89]] 但我认为这个错误： KeyError: '[ 5 9 10 46 89] not in index'

浏览 26提问于2018-01-02得票数 3

1回答

如何访问Pandas Dataframe行中的多索引值？

、、、

我有一个具有2级多索引的Pandas Dataframe，我正在尝试将一个函数应用于数据帧，该函数根据该行的多索引值执行某些操作，但我在网上找不到任何解释如何做到这一点的方法。有什么想法吗？

浏览 15提问于2019-11-28得票数 0

1回答

火花数据帧

、、

星火数据帧和Pandas数据帧的区别是什么？我的理解是，Pandas数据框架主要用于将CSV数据读入DF，在DF中，Spark数据帧用于将弹性分布式数据( RDD )加载到数据帧中，并且可以操作数据帧。请分享你的反馈

浏览 6提问于2020-09-01得票数 0

回答已采纳

3回答

开始:停止切割numpy和Pandas之间的不一致？

、、

我对numpy和Pandas之间的以下区别感到有点惊讶/困惑 import numpy as np import pandas as pd a = np.random.randn(10,10) > a[:3,0, newaxis] array([[-1.91687144], [-0.6399471 ], [-0.10005721]]) 但是： b = pd.DataFrame(a) > b.ix[:3,0] 0 -1.916871 1 -0.639947 2 -0.100057 3 0.251988 换句话说，numpy不包含s

浏览 3提问于2013-02-28得票数 5

回答已采纳

1回答

在Pandas MultiIndex数据框中设置值-查看与复制

、

我还有另一个问题，那就是关于Pands是创建一个视图还是数据帧的副本的困惑。下面我有一个非常简单的例子。有人能给我解释一下如何更改熊猫MultiIndex数据框中的一些值的子集吗？ arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],['one', 'two', 'one', 'two', 'one', &#

浏览 1提问于2015-06-27得票数 0

2回答

如何在Pandas中删除transpose()之后的额外行(或列)

、、、

在数据帧上使用转置之后，总是会有额外的一行作为初始数据帧索引的剩余行，例如： import pandas as pd df = pd.DataFrame({'fruit':['apple','banana'],'number':[3,5]}) df fruit number 0 apple 3 1 banana 5 df.transpose() 0 1 fruit apple banana number 3 5 即使我没有索引： df

浏览 0提问于2016-07-01得票数 17

1回答

带有MultiIndex潘达斯面板的切片函数

、、、、

带有MultiIndex潘达斯面板的切片函数我用一个Panel (参见代码)从Pandas创建了一个MultiIndex构造。没有MultiIndex，我可以用简单的命令将Panel分割成一个DataFrame： PanelData.major_xs('A') PanelData.minor_xs('zTwo') 如果我将MultiIndex Panel切片，结果将是一个Panel。我能做些什么来拿回一个DataFrame (切片一个3D Panel => 2D DataFrame)？为什么带有3D Panel的切片的结果也是Panel呢？如果可能的话，

浏览 6提问于2014-04-14得票数 2

回答已采纳