当groupby使用多个列时应用get_group()_使用多个参数应用Groupby_当使用多个列时，如何“删除.().where” - 腾讯云开发者社区

python-2.7、pandas、dataframe

在多列groupby对象上，如何只访问外部列？例如，对于下面的内容，我可以通过：df.get_group(('media', 'entertainment content'))命令访问内部列(娱乐内容)，我希望也能够访问类似于:df.get_group((‘媒体’))之类的内容，但是它会引发一个错误："ValueError:必须向get_group提供一个包含多个分组键“的元组。 [('media', 'entertainment content'),('media', 'internet medi

浏览 8提问于2016-01-29得票数 6

2回答

在多索引的dataframe.groupby之后的columns.levels[1]中，给出整个数据的列。

python、pandas、dataframe、merge

假设我有三个数据帧，在多个索引的帮助下水平连接： df1 = pd.DataFrame(data=np.random.randint(0, 100, (4, 5)), columns=list('ABCDE')) df2 = pd.DataFrame(data=np.random.randint(0, 100, (4, 5)),columns=list('AGHIJ')) df3 = pd.DataFrame(data=np.random.randint(0, 100, (4, 5)),columns=list('ALMNP')) dfs = [

浏览 1提问于2019-05-03得票数 2

回答已采纳

1回答

按数据框架分组和查找组

python-3.x、pandas

我们必须按给定的列名(列名列表)对其进行分组。之后，应打印具有指定列值(值)的组的数据。输入将包含两行。第一行将有一个列列表，第二行将有一个值列表.输出应该有对应组的前五行。我需要使用print命令打印dataframe。样本输入： ['Pclass','Age'] [3,13] 产出： PassengerId Pclass Name Sex Age 154 1046 3 Asplund, Master. Filip Oscar male 13.0

浏览 5提问于2019-10-31得票数 1

回答已采纳

1回答

Pandas lambda函数中的访问组

python、pandas、lambda、apply、multi-index

我有一个多索引的Pandas数据。0级是“毒株”，第1级是“JGI图书馆”。每个“毒株”都有几个与它相关的“JGI库”列。我想使用lambda函数来应用t检验来比较两种不同的菌株。为了排除故障，我一直在使用.iloc命令获取一行数据。 row = pvalDf.iloc[0] parent = 'LL1004' child = 'LL345' ttest_ind(row.groupby(level='Strain').get_group(parent), row.groupby(level='Strain').get_group(

浏览 3提问于2017-05-08得票数 0

回答已采纳

1回答

如何从原始数组创建numpy子数组列表，然后在该列表上应用函数？

python、arrays、list、numpy、matrix

早上好。现在，我正在处理一个数值数据的csv，并将其转换为一个numpy矩阵。CSV相当大(10000x5)，构造如下(列向量arn的首字母缩写，我认为，但我会包括它们)：主题名称、血压、PDAC、GSIC、TDAP 我想要做的是创建一个numpy矩阵列表，这样每个矩阵都包含与唯一主题名称相关联的值，作为一个简单的示例编辑(建议我通过创建从名称到id的映射，将"subject name“列改为"subject id”)。在本例中，carl有id 1，doug有id 2)： Original=np.matrix['1 17 28 32 79; 1 89 72 46 22;

浏览 2提问于2017-06-05得票数 0

回答已采纳

1回答

具有部分字符串的Python / Pandas - get_group

python、pandas

我有这样的数据： name . profession Alex . Data Analyst Markus . Sales Manager Carlos . Credit Analyst Otavio . HR Manager ... 我需要知道在这个dataframe中有多少人在它的职业中有字符串“分析师”。答案应该是2。我正在尝试使用groupby和get_group，但是我没有找到正确的方法将其应用到get_group语法中。现在我在这里： df.groupby('profession').get_group(???).agg('count')

浏览 5提问于2017-11-16得票数 1

回答已采纳

1回答

群函数的系列查询

python、pandas、group-by

我有一个名为active的数据框架，它有10个唯一的POS列值。然后对POS值进行分组，并对OPW列进行平均规范化，然后将规范化值存储为独立列['resid']。如果我对POS值进行分组，那么新的活动数据帧的POS列不应该只包含唯一的POS值吗？？例如： df2 = pd.DataFrame({'X' : ['B', 'B', 'A', 'A'], 'Y' : [1, 2, 3, 4]}) print df2 df2.groupby(['X']).sum(

浏览 3提问于2015-01-21得票数 1

回答已采纳

1回答

当群列是一个类别时如何将get_group应用于熊猫的群数据

pandas

age_cleaned_titanic_df.groupby('Age_group').mean() age_cleaned_titanic_df.groupby('Age_group').get_group((0,10]) get_group函数给出了错误，因为'Age_group‘列的值是半打开的回收箱索引。(0，10)(10，20).(70，80)。然后如何执行get_group()方法？文档和堆栈溢出中的大多数示例都谈到列值，这些值是字符串/数字，在这些值中get_group()变得非常简单。当groupby列是一个类别时，如何执行它？

浏览 0提问于2016-06-01得票数 1

回答已采纳

1回答

Pandas groupby().get_group().size没有返回正确的大小吗？

python、pandas、dataframe、pandas-groupby

我正在对每个国家的人口统计数据进行DataFrame分组。我发现我想要获取每个组的大小有问题，.size或np.size()返回组第一列的总和，而不是行数。我使用的是Python 3.7和Pandas 0.23.4 df.groupby('foo').apply(lambda grp: grp.size) 这将返回一个大得多的数字。 Countries.groupby('foo').apply(lambda grp: grp['some colum'].size) 这将给出正确的计数有人知道为什么.size在每种情况下的工作方式不同吗？谢谢!

浏览 4提问于2019-01-18得票数 1

1回答

熊猫对分组数据进行操作

python、pandas、dataframe

我想对熊猫数据中的分组数据执行一个功能。我有下面的df，迭代地做下面的操作，但是认为这应该由熊猫群来完成。 import pandas as pd import scipy from scipy.stats import mstats df = pd.DataFrame({'cfs': [147248, 94894, 81792, 176011, 208514, 18111, 56742, 154900, 32778, 142333, 45267, 145211, 3429, 1258, 65439], 'Alternatives':['A'

浏览 1提问于2016-11-03得票数 2

回答已采纳

3回答

为什么熊猫的get_group速度这么慢？

python、pandas

我有一个400.000行15列的csv文件。我必须对每一行进行多次过滤操作。因此，我想使用pandas和groupby来尝试提高性能。使用groupby很快，但get_group似乎很慢。 import pandas as pd filepath = 'data.csv' df = pd.read_csv(filepath, sep=',', na_values=['', '-'], parse_dates=True) groups = df.groupby(['Year', 'Team']) t

浏览 1提问于2014-08-14得票数 3

3回答

如何过滤群和

python、pandas

我正在寻找使用groupby函数的总列的总部分。但是，当我使用groupby函数' code‘时，我希望能够通过将它放入一个变量并打印它，将它过滤成一个标称的代码。 subheading_one = df.groupby(['Code'])['Total'].sum() subheading_two = df.groupby(['Code'])['Total'].sum() subheading_three = df.groupby(['Code'])['Total'].sum() pri

浏览 3提问于2022-06-09得票数 0

回答已采纳

1回答

当.count()在熊猫中得到== 0时出错

python、pandas、analytics

我有一列名为Le类型的循环，它可以采用两个值：P: production或S: service，而另一列名为Matricule，用于识别员工，因此，我希望为每个员工计算P<code>E29<//code>的出现次数&Le；//code>：index<code>e 211</code> 我用了这个公式： df.groupby(['Matricule','Le Type Cycle'])['Le Type Cycle'].get_group((index, prod)).count() 当

浏览 3提问于2022-08-16得票数 -1

1回答

Pandas:迭代已排序的列的唯一值

python、group-by、pandas

我已经按排序顺序构建了一个pandas数据框架，并希望遍历具有特定列的相同值的组。在我看来，groupby功能对此很有用，但据我所知，执行groupby并不能保证键的顺序。如何按排序顺序提取unqiue列值。下面是一个数据框示例： Foo,1 Foo,2 Bar,2 Bar,1 我想要一个列表"Foo"，“酒吧”，其中的顺序是由原始数据帧的顺序保证。然后，我可以使用这个列表来提取适当的行。在我的例子中，排序实际上是由数据框中也给出的列定义的(不包括在上面的示例中)，因此如果不能直接提取信息，则可以接受重新排序的解决方案。

浏览 2提问于2013-12-19得票数 5

1回答

stats.mannwhitneyu的奇怪结果

python、scipy、apply

正如标题中所述，我在从stats.mannwhitneyu中估计scipy时遇到了一种奇怪的情况。玩具数据和代码： import numpy as np import pandas as pd from scipy import stats # data np.random.seed(0) df = pd.DataFrame(np.random.randint(0,100,size=(100, 2)), columns=['col_1','col_2']) df['group_l1'] = ['A']*50 + [&#

浏览 7提问于2019-11-21得票数 2

回答已采纳

4回答

具有特定价值的熊猫群列

python、pandas

你好，我在熊猫数据集上工作。假设数据集具有ID、TEST_TYPE、TEST_STATUS、TEST_DATE等我需要对一种列进行分组，所以我首先尝试 data_useless[['TEST_TYPE', 'TEST_STATUS']].groupby('TEST_STATUS').count_values() 它的作用是:用test_status(失败测试和通过测试)显示分组数据的结果，并在数据集上显示该数据的计数值。现在，我想更多地了解和查看通过考试的数据。所以我试着 data_useless.groupby(['TEST_ST

浏览 12提问于2022-08-06得票数 2

回答已采纳

1回答

如何在多个dataframe lambda函数上实现dask映射分区？

python、pandas、dataframe、multiprocessing、dask

我已经使用pandas实现了两个数据帧之间的模糊字符串匹配算法。我的问题是如何将其转换为使用多核的dask操作？我的程序在纯python上运行大约3-4天，我想并行操作以优化时间成本。我已经使用多处理包通过以下代码提取了内核数量： numCores = multiprocessing.cpu_count() fields = ['id','phase','new'] emb = pd.read_csv('my_csv.csv', skipinitialspace=True, usecols=fields) 然后，我必须根据每个字

浏览 3提问于2018-05-19得票数 0

2回答

MultiIndexed群访问密钥

python、pandas

我有一只熊猫，由两把钥匙组成。 gb = df.groupby(['A','B']) 如何访问特定的密钥(例如(2,4) )，如何实现？如果只有一个键，group_by()方法就能很好地工作。有什么想法吗？

浏览 4提问于2013-05-31得票数 2

回答已采纳

2回答

Pandas Group_by使用多个键，但只想指定外键

python、pandas、dataframe、group-by、pandas-groupby

我刚刚开始学习熊猫。我正在做一个视频游戏销售数据的项目。我正在处理的数据框如下所示： Rank Name Platform Year Genre Publisher Global_Sales 0 1 Wii Sports Wii 2006.0 Sports Nintendo 41.49 1 2 Super Mario Bros. NES 1985.0 Platform Nintendo 29.08 2 3 Ma

浏览 0提问于2021-03-12得票数 0

3回答

Python:遍历每个DataFrame组的最快方法

python、pandas、dataframe、pandas-groupby

我有一个数据帧，它可以分成多个组，在上执行功能，然后将这些组重新组合在一起作为单个数据帧。问题是每列中唯一元素的数量是不同的，这意味着，以下面的数据帧为例，我需要一个尝试，except语句，因为对于某些分组，例如a1，b2，c2，d1不存在G。迭代所有这些组的最快方法是什么，而不需要尝试使用except语句？ A B C D a1 b1 c1 d1 a1 b2 c2 d1 a2 b3 c3 d1 a2 b4 c4 d1 As = df.A.unique() Bs = df.B.unique() Cs = df.C.unique() Ds = df.D.unique() for

浏览 15提问于2018-02-26得票数 0

回答已采纳

2回答

熊猫布景

python、pandas、boxplot

这就是我的数据格式： PART METHOD J P AVG STD 0 1 meth1 3 50 0.914482 0.007398 1 1 meth2 3 50 0.925134 0.005738 ... ... ... ... ... ... ... 190 4 meth4 7 150 0.913014 0.006144 191 4 meth4 7 200

浏览 0提问于2018-12-13得票数 5

回答已采纳

2回答

从列表创建N个数据格式

python、pandas、dataframe

我想使用值s来创建n个DataFrames，作为每个DataFrame的名称，但是我只能创建一个充满DataFrames的列表。是否可以在其中的每个DataFrames中更改此列表？ #estacao has something like [ABc,dfg,hil,...,xyz], and this should be the name of each DataFrame estacao = dados.Station.unique() for s,i in zip(estacao,range(126)): estacao[i] = dados.groupby('

浏览 3提问于2022-04-19得票数 0

回答已采纳

1回答

在大熊猫的groupby()中使用list作为参数，并且没有一个关键元素匹配列名或索引名

pandas

因此，我有一个随机值的dataframe如下和一本书，我正在研究使用一个列表是群按键(key_list)。在这种情况下，由于没有一个列表值匹配列名或索引名，所以如何分组数据？所以，最后两行让我感到困惑。 people = pd.DataFrame(np.random.randn(5,5), columns = ['a','b','c','d','e'], index=['Joe','Steve','Wes','Jim','Travis'

浏览 2提问于2020-01-22得票数 2

1回答

得到平均的潘达

python、pandas、dataframe

我正在使用具有以下列的Python/Pandas上的DataFrame： ride_id rideable_type started_at ended_at月日小时length_duration start_station_name start_station_id end_station_name end_station_id start_lat start_lng end_lat end_lng member_casual 我只想得到成员类型的length_duration平均值。我没有得到一个错误，但它只是加载说“执行”，什么都没有发生。我使用以下代码：圆(dfdf[“member_c

浏览 8提问于2022-07-23得票数 0

1回答

DataFrame中的熊猫格式列和添加timedelta错误

python、pandas

我试着用熊猫对一些信息数据做一些分析，并且遇到一些问题，试着准备这些数据。它来自一个我无法控制的数据库，因此在分析它之前，我需要做一些修剪和格式化。这就是我目前所处的位置： #select all the messages in the database. Be careful if you get the whole test data base, may have 5000000 messages. full_set_data = pd.read_sql("Select * from message",con=engine) 在对时间戳进行此更改并将其设置为索引之后，就不

浏览 4提问于2015-06-09得票数 0

回答已采纳

3回答

在pandas中是否有类似GroupBy.get_group的东西，但有一个可选的默认值？

python、pandas

我得到了一个分组的DataFrame df，我正在寻找一个类似于get_group( KeyError )的函数，除了在名称不存在时抛出一个DataFrame，返回一个空的DataFrame(或其他值)，类似于dict.get的工作方式： g = df.groupby('x') # doesn't work, but would be nice: i = g.get_group(1, default=[]) # does work, but is hard to read: i = g.obj.take(g.indices.get(1, []), g.axis) 是

浏览 3提问于2013-11-06得票数 12

1回答

熊猫重复指数仍然显示正确的元素。

python、pandas

我有一只像这样的熊猫DataFrame： test = pd.DataFrame({'score1' : pandas.Series(['a', 'b', 'c', 'd', 'e']), 'score2' : pandas.Series(['b', 'a', 'k', 'n', 'c'])}) 输出： score1 score2 0 a b 1 b a 2 c

浏览 4提问于2016-06-02得票数 0

回答已采纳

2回答

熊猫如何使用群将每一组变成一个数据

python-3.x、pandas、dataframe、group-by

我的数据看起来像， A B 1 2 1 3 1 4 2 5 2 6 3 7 3 8 如果我是df.groupby('A')，如何将每个组转换为子数据格式(Sub)，因此对于A=1，它将是这样的。 A B 1 2 1 3 1 4 对于A=2， A B 2 5 2 6 对于A=3， A B 3 7 3 8

浏览 0提问于2018-03-13得票数 1

回答已采纳

3回答

当Groupby对象可能不包含某个键时，如何避免出现Pandas GroupBy键错误

python、pandas

我正在对一个数据帧进行一些分析，其中一列是一个值为0或1的整数(类似于布尔值，但为整数形式)。它看起来像这样： Nat. | Result -------|------- CA | 1 USA | 0 GB | 1 USA | 1 CA | 0 GB | 1 我根据国籍列对数据进行了分组，其中一个值(上面示例中的GB)产生了-by chance-一个所有成员都只有1的组。这就产生了一个问题，因为我调用了一个包含group_obj.get_group(0)的函数，这会导致运行时错误"KeyError: 0“ 我的问题是:我想创建

浏览 0提问于2016-02-18得票数 5

5回答

按对象从熊猫群中选择多个组

python、pandas

我正在试验熊猫的群居特征，特别是 gb = df.groupby('model') gb.hist() 由于gb有50个组，结果非常混乱，我只想探讨前5个组的结果。我发现了如何使用groups或get_group ()来选择单个组，但没有发现如何直接选择多个组。我所能做的就是： groups = dict(list(gb)) subgroup = pd.concat(groups.values()[:4]) subgroup.groupby('model').hist() 有更直接的方法吗？

浏览 8提问于2015-07-21得票数 16

回答已采纳

2回答

在Bokeh条形图中创建一个遍历学术术语的滑块

python、pandas、bokeh

我在逐个学期记录等级直方图。我想做一个互动的Bokeh条形图与滑块，可以循环通过条款。我有条形图工作在一个单一的条款，但当我试图添加额外的条件，我不能让条形图选择一个单一的项目，然后进行更新和轻微地通过它。我真的需要一些帮助，让groupby对象只选择一个术语。 import os from bokeh.plotting import figure, ColumnDataSource from bokeh.io import curdoc, output_file, show from bokeh.layouts import widgetbox from bokeh.models im

浏览 0提问于2019-09-03得票数 0

回答已采纳

1回答

计算已过滤列属性的百分比

python、python-3.x、pandas

我想要计算每个社区的断水点百分比。到目前为止，我能够获得社区和坏水点的列表。这是我到目前为止的代码： import pandas as pd df = pd.DataFrame((data)) gb = df.groupby(['water_point_condition']) grouped = gb[["communities_villages", "water_point_condition"]].get_group("broken") print(grouped) 结果是：这解决了我的问题，我能够获得每个社

浏览 9提问于2017-01-15得票数 0

2回答

Python从列表中保留最大整数

python、list

我有一个由三个数字组成的整数列表 list1 = [505, 504, 503, 502, 207, 206] 如果我们将子集定义为按第一个数字分类的所有值，我希望比较列表中的元素，并保留每个子集中的最大元素。例如，这里的子集是[505, 504, 503, 502]和[207, 206]。然后，每个子集的最大值的list将为 max_values = [505, 207] 我怎样才能直接从list1到max_values？

浏览 2提问于2015-01-03得票数 0

回答已采纳

2回答

得到至少n个连续行满足特定条件的情况？

python-3.x、pandas、dataframe

我有一个带有二进制列df的dataframe target,，我希望计算(至少是 n连续行)的出现情况，比如df[target] == 1。我找到了很多关于计算(确切地说) n连续行在某些数据列上满足给定条件的结果的答案。但他们解决不了我的问题。我可以利用目标有限的事实来构建以下算法来解决我的问题： target = [0,0,1,1,1,0,0,0,0,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,0,0,1,1,1,1,1,1] df = pd.DataFrame( {"target" : target} ) n = 3 gro

浏览 4提问于2021-12-14得票数 1

回答已采纳

2回答

在python中使用大熊猫的组列表元素

python、pandas

我有一个python列表如下： my_list = [[25, 1, 0.65], [25, 3, 0.63], [25, 2, 0.62], [50, 3, 0.65], [50, 2, 0.63], [50, 1, 0.62]] 我想按照这条规则订购： 1 --> [0.65, 0.62] <--25, 50 2 --> [0.62, 0.63] <--25, 50 3 --> [0.63, 0.65] <--25, 50 因此，预期结果如下： Result = [[0.65, 0.62],[0.62, 0.63],[0.63, 0.6

浏览 1提问于2016-11-27得票数 1

回答已采纳

1回答

避免使用熊猫数据的Python中显式的for-循环

python-3.x、pandas、dataframe、rank

我想找到一种更好的方法来进行以下工作。 #import packages import pandas as pd 我已经给熊猫下了定义。 # Create dataframe data = {'name': ['Jason', 'Jason', 'Tina', 'Tina', 'Tina'], 'reports': [4, 24, 31, 2, 3], 'coverage': [25, 94, 57, 62, 70]} df = pd.

浏览 2提问于2017-08-17得票数 1

回答已采纳

4回答

如何获得多列组中的第一个组？

pandas、pandas-groupby

在我申请groupby之后，我一直在尝试如何返回第一个组。我的代码如下所示： gb = df.groupby(['col1', 'col2', 'col3', 'col4'])['col5'].sum() 我想要的是第一组输出。我一直在尝试get_group方法，但它一直失败(可能是因为我是按多个列分组吗？) 下面是我输出的一个例子： col1 col2 col3 col4 'sum' 1 34 green 10 0.0 yellow 3

浏览 0提问于2018-04-12得票数 12

回答已采纳

1回答

用get_group提取的数据中的第一项

python、python-3.x、pandas、series

import pandas as pd tweets = pd.read_csv("file_name") # Group the data by hashtag to extract books with the hashtag RoeVWade only roevwade = tweets.groupby("hashtags").get_group("['RoeVWade']") # Print the date of the first tweet with only the RoeVWade hashtag prin

浏览 1提问于2022-08-03得票数 0

1回答

根据列值指定直方图的颜色。图表之间的一致性

python-3.x、jupyter-notebook、plotly

我正在尝试使用plotly express绘制直方图。我有一个数据帧，它的值如下所示： env type status success count 0 PROD ABC 403 False 21 1 IMPL HTTP 200 True 64037 2 IMPL HTTP 304 False 9 3 PROD ABC 503 False 1 4 IMPL ABC 200 True 3308 5 PROD HTTP

浏览 0提问于2020-05-16得票数 2

2回答

在Pandas中使用groupby获取行数

python-3.x、numpy、pandas

我的数据集中有两个列，col1和col2。我想显示按col1分组的数据。为此，我编写了如下代码： grouped = df[['col1','col2']].groupby(['col1'], as_index= False) 上面的代码创建了groupby对象。如何使用对象显示按col1**?**分组的数据

浏览 9提问于2014-03-08得票数 3

回答已采纳

3回答

如何在python中使用for循环创建多个数据框

python、pandas、loops、dataframe

我正在尝试创建多个数据帧，这些数据帧是现有数据帧的子集。我有df_list，它实际上是一个数据集列表： df_list = [df1B, df2B, df3B, df4B, df5B, df6B, df7B, df8B, df9B, df10B, df11B, df12B, df13B, df14B, df15B, df16B, df17B, df18B, df19B, df20B, df21B, df22B, df23B, df24B, df25B, df26B, df27B, df28B, df30B, df31B, df32B, df33B, df34B, df35B] 如果我想创建

浏览 102提问于2019-05-29得票数 0

回答已采纳

1回答

Pandas - groupby - get_group，间隔/日期范围

python、python-3.x、pandas、pandas-groupby

我尝试在get_group()方法中使用间隔/日期范围。 ranges = pd.date_range(start='1/1/1900', periods=12, freq='120M') dates = df.groupby(pd.cut(df['dob'], ranges)) 我知道通常你可以使用dates.get_group('groupName')。但是，由于我使用的是日期范围，所以无法使其正常工作。可以将get_group()与日期范围/时间间隔一起使用吗？如果是这样，正确的语法是什么？我的目标是能够从特定的组中选择一

浏览 11提问于2018-08-08得票数 1

回答已采纳

2回答

有条件地连接Pandas数据帧中的字符串

python、pandas、concatenation、conditional-statements

我有一个数据帧，看起来像这样： df： Source Text Agent aa Agent ab Visitor ac Agent ad Visitor ae Visitor ba Visitor bb Agent bc Agent bd Agent be 我想创建一个

浏览 29提问于2019-04-11得票数 1

回答已采纳

1回答

熊猫:将自定义功能应用于组中，并在每个组中存储新列。

python、pandas、dataframe、pandas-groupby

我试图对groupby对象中的每个组应用一个自定义函数，并将结果存储到每个组本身的新列中。函数返回两个值，我希望将这些值分别存储到每个组中的两个列中。我试过这样做： # Returns True if all values in Column1 is different. def is_unique(x): status = True if len(x) > 1: a = x.to_numpy() if (a[0] == a).all(): status = False return status #

浏览 2提问于2021-04-06得票数 3

回答已采纳

1回答

两个熊猫列有相同的值，它们的书写方式不同。

python、pandas

我有一个DataFrame，其中多个列包含相同的数据，存储方式不同。例如，一列中充满了运营商名称(美国航空公司的AA等)，而另一列则充满了承运人ID。如何快速检查这两列是否实际填充了相同的信息(每个运营商确实只有一个ID ?)目标是安全丢弃两列中的一列？到目前为止，我得到了以下信息： #for each carrier for carrier in data.CARRIER.unique(): #print all the different AIRLINE_ID that appear when we subset the data for this carrier p

浏览 0提问于2018-10-02得票数 1

回答已采纳

2回答

过滤Pandas DataFrame中的列的更好方法

python

# Selecting all of the Subscriber & Children Tier People D = df[df['Member Tier'].str[0] == 'D'] CountD =D[D['Relation'].str[0] == 'M'] = len(CountD) 我有一个根据成员层和关系对人员进行分类的数据集，有什么方法可以将这些步骤合并为一个步骤？

浏览 22提问于2020-10-16得票数 0

回答已采纳

2回答

将Pandas DataFrames列表解压到单独的表格DataFrames中

python、python-3.x、pandas、dataframe

我试图通过一个函数将df元组的pandas列表转换为独立DataFrames的len编号。我发现了一个简单的样本DataFrame，它由不同的动物类型组成。我不想创建一个元组格式的DataFrames列表，而是希望将它们推到单独的DataFrames表(不是元组等)中，而不是逐个调用df的位置(即animals[0])，因为我不知道任何给定的列表会有多长。有什么建议吗？ import pandas as pd df = pd.DataFrame({'animal': 'cat dog cat fish dog cat cat'.split(), 's

浏览 43提问于2019-09-02得票数 2

1回答

熊猫分组，平均数的计算

python、loops、pandas

我在和熊猫一起工作。这是我的数据：，其中每一列分别是欧洲大陆(SA，NA，EA，岛屿，海洋，AUS，AF)，状态(灭绝，历史，介绍，或现存)，秩序，家族，属，物种，原木质量，联合质量，和参考。我试图比较每一个大陆的灭绝物种和现存物种。因此，我需要将这些数据按“大陆”和“状态”分组，然后计算出每个物种的平均质量--灭绝的物种和现存的物种。(例如，我需要计算出非洲大陆所有灭绝物种的平均组合质量，然后算出该大陆所有现存物种的平均组合质量(AF..etc.) 我想要创建一个csv文件，其中每一行的第一个条目是大陆，第二个条目是该大陆现存物种的平均质量，第三个条目是该大陆已灭绝物种的平均质量，第四个

浏览 2提问于2016-11-06得票数 0

回答已采纳

1回答

如何最有效地获取大熊猫数据

python、pandas、dataframe、pandas-groupby

我有一个很小的测试数据集，供不同专业的学生使用。 0 35377 female Chemistry False 1 56105 male Physics True 2 31441 female Chemistry False 3 51765 male Physics True 4 53714 female Physics True shape is 500,4 我需要获得女性的录取率，现在以三种不同的方式解决这个问题。他们每一个都返回正确的结果。 DONE 用组 f

浏览 3提问于2020-04-04得票数 3

回答已采纳

2回答

在选择过程中使用大型查询UDF

google-bigquery、user-defined-functions、udf

我有一个表，它包含uuid和用户的一些其他值。此外，我在by中有以下UDF函数，它基于MD5和crc32值，通过给定的uuid计算MD5： function GetGroup(uuid) {... } function getUserGroup(r, emit) { emit ({group: GetGroup(String(r.uuid)), uuid: r.uuid }); } bigquery.defineFunction( 'get_group', ['uuid'], [{'name': 'group',

浏览 7提问于2016-10-05得票数 2

回答已采纳