如何在Pandas Groupby中仅显示带有值的列_如何在groupby列中使用带有NaN值的groupby_选择distinct值pandas中的groupby列 - 腾讯云开发者社区

python、pandas、dataframe、pandasql

我有一个熊猫数据帧"df“，它的列是[Country,Region,Happiness Score,Year]。 df中包含3 years(2015,2016,2017)数据的165国家总数，因此df的长度为165*3=495。 df中总共有10唯一的区域，每个国家/地区在“region”列中都有自己的区域名称。我想要生成一个输出，显示每个唯一地区具有最小和最大幸福度得分的国家。例如，输出应该具有如下列：Region,Min Happiness Score,Max Happiness Score,Country具有该地区的最小幸福得分，国家具有该地区的最高幸福得分。由于有10个独

浏览 28提问于2020-05-11得票数 0

1回答

在两列上执行group by后，获取级别1的组数

pandas、pandas-groupby

我正在对两列执行group by操作，需要计算level-1中值的数量我尝试了以下几种方法： >>> import pandas as pd >>> df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': [1, 2, 0, 4, 3, 4], 'C': [3,3,3,3,4,8]}) >>> pr

浏览 12提问于2019-06-24得票数 1

回答已采纳

1回答

如何获取" value“列的平均值，该列根据另一列的值拆分成组

python、pandas

我想以一个简单的数据帧为例，根据另一列("name“列)中的值，将一列(" value”列)求和成组。在那之后，我想得到"value“列的平均值 In [1]: import pandas In [2]: df = pandas.DataFrame(data = [{'name': 'a', 'val': 1}, {'name': 'b', 'val': 2}, {'name': 'b', 'val': 4}]) In [3

浏览 5提问于2021-03-03得票数 0

回答已采纳

1回答

每个属性的分割

python、pandas、dataframe

我正试着读一个大的CSV。然后根据列team中的唯一值将大CSV拆分为更小的CSV文件。首先，我为每个team创建了新的数据格式。生成的新txt文件，每个team列中的唯一值都有一个。码 import pandas as pd df = pd.read_csv('combined.csv') df = df[df.team == 'RED'] df.to_csv('RED.csv') 但是，我想从一个数据each开始，读取所有唯一的“team”，并为每个团队创建一个带有头文件的.txt文件。有可能吗？

浏览 0提问于2021-02-02得票数 1

回答已采纳

3回答

Pandas丢弃重复项忽略NaN

python、pandas、dataframe、duplicates

在Pandas df中，我尝试跨多个列放置重复项。每行的大量数据是NaN。这只是一个例子，数据好坏参半，所以存在许多不同的组合。 df.drop_duplicates() IDnum name formNumber 1 NaN AP GROUP 028-11964 2 1364615.0 AP GROUP NaN 3 NaN AP GROUP NaN 充满希望的输出： IDnum name formNumber 1

浏览 0提问于2018-07-07得票数 2

1回答

如何在聚合后将pandas数据帧转换为单索引？

pandas、dataframe、pandas-groupby

我一直在玩pandas数据帧中的聚合。考虑以下数据帧： df=pd.DataFrame({'a':[1,2,3,4,5,6,7,8], 'batch':['q','q','q','w','w','w','w','e'], 'c':[4,1,3,4,5,1,3,2]}) 我必须对batch列进行聚合，对列a使用mean，对列c使用min。我使用以下方法进

浏览 21提问于2020-09-05得票数 0

回答已采纳

2回答

使用df.groupby.transform()链接python方法时设置with copy warning

python、pandas、dataframe、group-by

我需要在pandas dataframe中创建一个新列，它是基于分组的count和sum。我使用方法链接，如下所示。 df['total_sum']=df.groupby('column1')['column 2'].transform('sum') df['total_cnt']=df.groupby('column1')['column 2'].transform('count') 但是我得到了带有复制警告的设置。我得到了正确的结果，但我想避免警告。我正在尝试变

浏览 2提问于2018-02-04得票数 1

1回答

如何在pandas中使用条件执行groupby和转换计数

python、pandas

我有以下数据帧： # Import pandas library import pandas as pd import numpy as np # data data = [['tom', 10,2,'c',100,'x'], ['tom',16 ,3,'a',100,'x'], ['tom', 22,2,'a',100,'x'], ['matt', 10,1,'c',100,'x'

浏览 20提问于2020-07-11得票数 0

回答已采纳

2回答

重复属性的Pandas和

python、csv、pandas

我正在使用Pandas操作一个包含多个行和列的csv文件，如下所示 Fullname Amount Date Zip State ..... John Joe 1 1/10/1900 55555 Confusion Betty White 5 . . Alaska Bruce Wayne 10 . . Frustration John Joe 20 .

浏览 0提问于2015-04-12得票数 24

回答已采纳

2回答

如何在熊猫群中输出大量直方图

python、pandas、matplotlib

df是一个带有days列的dataframe。有100天。我想查看100天中每一天的数据列的直方图。问题是，这段代码在一个图表上输出所有的东西，所有的直方图都叠加在一起。两个问题：有什么建议让你每天都得到一个直方图吗？有任何建议将每个直方图保存到一个适当命名的文件中吗？注意:当我将下面代码中的hist替换为describe__时，它完美地为我提供了100个描述系列。另外，grouper.get_group(days)对象的类型是pandas.series__。我的简单代码： grouper = df.groupby('days')['data&#

浏览 3提问于2015-07-30得票数 1

回答已采纳

1回答

pandas -获取重复行的计数(跨多列匹配)

pandas

我有一个类似下面的表-唯一的ID和名称。我想返回任何重复的名字(基于匹配的第一个和最后一个)。 Id First Last 1 Dave Davis 2 Dave Smith 3 Bob Smith 4 Dave Smith 如果我没有ID列，我已经设法返回了所有列的重复计数。 import pandas as pd dict2 = {'First': pd.Series(["Dave", "Dave", "Bob"

浏览 192提问于2019-12-08得票数 1

回答已采纳

3回答

Seaborn groupby pandas系列

matplotlib、pandas、seaborn

我想要将我的数据可视化到箱形图中，这些箱形图按我可怕的图中显示的另一个变量进行分组：所以我要做的是使用pandas系列变量来告诉pandas我有分组的变量，所以这就是我要做的： import pandas as pd import seaborn as sns #example data for reproduciblity a = pd.DataFrame( [ [2, 1], [4, 2], [5, 1], [10, 2], [9, 2], [3, 1] ]) #converting second column to Series a.ix[:,1] = pd.Series

浏览 0提问于2014-08-13得票数 4

回答已采纳

1回答

日期相同的汇总列(和)

python、excel、pandas、xlsx、xlsxwriter

因此，我需要聚合日期相同的行。从现在开始，我的代码返回以下内容： date value source 0 2018-04-08 15:52:26.110 1 ANAPRO 1 2018-04-22 12:14:38.807 1 ANAPRO 2 2018-04-22 12:34:18.403 1 ANAPRO 3 2018-04-22 12:40:35.877 1 ANAPRO 4 2018-04-22 12:53:57.897 1 ANAPRO 5 2018-04-22

浏览 0提问于2018-05-16得票数 2

回答已采纳

2回答

如何在Pandas，Python中的分类列中表示值的计数？

pandas、pivot、aggregation

我有以下Pandas DataFrame： ID CAT 1 A 1 B 1 A 2 A 2 B 2 A 1 B 1 A 我希望有一个表来表示每个ID在不同列中的每个CAT值的出现数，如下所示： ID CAT_A_NUM CAT_B_NUM 1 3 2 2 2 1 我尝试过很多种方法，比如这个带有枢轴表的方法，但没有成功： df.pivot_table(values='CAT', index='ID', columns='CAT', aggfunc='count')

浏览 6提问于2022-11-11得票数 2

回答已采纳

1回答

编辑pandas中的日期以按列仅显示年份

python、pandas

我正在尝试理解如何使用pandas在python中编辑数据帧，这样我就可以删除除年份之外的所有内容。例如:如果日期是2014-01-01，我希望它显示2014并同时删除月份和日期。所有日期都在一列中。谢谢你的建议！

浏览 4提问于2020-03-16得票数 0

1回答

根据另一列的值填充N/A数据

python、pandas、numpy

我有一个带有2列store_name和store_location的csv文件，其中缺少一些store_location。我希望根据另一列中的值，用同一列中的数据填充丢失的数据。下面是我的csv文件： import pandas as pd df = pd.read_csv('https://raw.githubusercontent.com/hoatranobita/app_to_cloud_4/main/store_location.csv') 这里是我的预期输出：我试图找到解决办法，但仍未找到答案。谢谢。

浏览 9提问于2022-09-21得票数 1

回答已采纳

1回答

如何在具有特定值的SSRS中级联参数

reporting-services、ssrs-2008、ssrs-2008-r2、ssrs-tablix、ssrs-grouping

我的报告中有两个参数' Groupby1‘和' Groupby2’，对于第一个参数，我指定了一些值，如A列、B列、C列。现在我需要使第二个参数级联在第一个参数的基础上，如果我在Groupby1参数中选择列A，它应该只显示B列和Groupby2 parameter.Is中的列C。

浏览 0提问于2014-09-17得票数 0

回答已采纳

1回答

如何在pandas中使用条件执行多个groupby和转换计数

python、pandas

这是问题的扩展：here 我正在尝试向grouby中添加一个额外的列： # Import pandas library import pandas as pd import numpy as np # data data = [['tom', 10,2,'c',100,'x'], ['tom',16 ,3,'a',100,'x'], ['tom', 22,2,'a',100,'x'], ['matt', 10,1,

浏览 31提问于2020-07-11得票数 2

回答已采纳

1回答

如何在混合类型数据上实现Pandas GroupBy过滤器？

python、python-2.7、pandas、dataframe、group-by

感谢您的阅读。很抱歉，我相信这是一个简单的问题要回答。我有一些数据 df: Entry Found 0 Dog [1,0] 1 Sheep [0,1] 2 Cow "No Match" 3 Goat "No Match" 我想返回一个新的dataframe，它只包含在No Match列中包含Found的条目(并保持其索引顺序)，即：输出： Entry Found 0 Cow "No Match" 1 Goat "No M

浏览 0提问于2016-12-20得票数 3

回答已采纳

2回答

pandas在执行groupby并保留选择性列后重置索引

python、pandas

我想要取一个pandas数据帧，按列计算唯一元素，并保留其中的2列。但是我在groupby之后得到了一个多索引数据帧，我不能(1)展平(2)只选择相关列。下面是我的代码： import pandas as pd df = pd.DataFrame({ 'ID':[1,2,3,4,5,1], 'Ticker':['AA','BB','CC','DD','CC','BB'], 'Amount':[10,20,30,40,50,60], 'Date_

浏览 1提问于2018-09-14得票数 4

回答已采纳

1回答

如何在等同于SQL中LIKE运算符的pandas数据帧中获取值？

python、pandas、dataframe

我是否可以像SQL like操作符那样在dataframe中获取特定的列值，该操作符可以找到任何值，然后对值进行计数以将其存储在新列中。下面是我的数据帧的代码 import pandas as pd dataku = pd.DataFrame() dataku['CIF'] = ['789', '290', '789', '789','290'] dataku['NAMA'] = ['de','ra','de','de

浏览 20提问于2021-03-06得票数 3

1回答

如何访问Pandas0.15 DataFrame.resample方法中的多列？

pandas

在Pandas0.12中，如果在带有自定义重采样函数的DataFrame上使用重采样方法，它将对自定义函数每一行进行一次调用，从而访问所有列中的值。在Pandas 0.15中，重采样方法在每个dataframe条目中调用我的自定义函数一次，唯一可用的值是该条目(而不是整行)。如何恢复0.12行为并在自定义函数中查看整个行？不同之处在于：初始设置： In [1]: import pandas In [2]: import datetime In [3]: import sys In [4]: dt = datetime.datetime(2014,1,1) In [5]: idx

浏览 5提问于2014-11-06得票数 1

1回答

根据条件删除熊猫群

python、pandas、filter

我有一个包含几个组的pandas数据框，我想排除那些不满足某些条件(在特定列中)的组。例如，删除这里的组B，因为它们在列"crit1“中有一个非数字的值。我可以根据条件df.loc[:, (df >< 0).any(axis=0)]删除特定的列，但不会删除整个组。不知何故，我不能进行下一步，并将其应用于整个团队。 name crit1 crit2 A 0.3 4 A 0.7 6 B inf 4 B 0.4 3 因此，过滤后的结果(只允许浮点数)应该是： A 0.3

浏览 5提问于2016-08-18得票数 6

回答已采纳

1回答

如何在熊猫系列中按多个栏目分组

series

pandas.Series groupby方法使按另一个系列进行分组成为可能，例如： data = {'gender': ['Male', 'Male', 'Female', 'Male'], 'age': [20, 21, 20, 20]} df = pd.DataFrame(data) grade = pd.Series([5, 6, 7, 4]) grade.groupby(df['age']).mean() 但是，通过使用两列，此方法不适用于组： grade.groupby(

浏览 4提问于2019-12-02得票数 0

2回答

如何在groupby()之后找到非唯一行数

python、pandas、dataframe

我有一个数据框架df，它有两个特性：ID_owner，ID_phone，我必须找到：有多少人拥有比n手机更多的手机。多个用户共享手机，ID_phone拥有一个或多个ID_owner。为了回答第一个问题，我尝试： df.groupby('`ID_owner`')['`ID_phone'].nunique().to_frame() 这似乎不起作用，因为我需要计算分组后每个ID_owner重复的行数。我在第二个问题上也遇到过同样的问题。我想知道在pandas中是否存在这类问题的特定方法或函数。对于第一个问题，输出应该是有两列的数据格式:一列显

浏览 0提问于2018-10-27得票数 0

2回答

拆分Dataframe不是基于字符串，而是基于列中的值。

python、pandas、dataframe

我从一个大得多的dataframe中删除了一个数据文件： import pandas as pd data = {'Name': [5, 5, 6, 6, 7, 7], 'Value': [1, 2, 1, 2, 1, 2] } df = pd.DataFrame(data) Name Value 0 5 1 1 5 2 2 6 1 3 6 2 4 7 1 5 7 2 Ideal

浏览 7提问于2021-12-10得票数 1

回答已采纳

4回答

大熊猫按组中位数计算组数

python、pandas

给出一个带有分类列family和数字列score的Pandas数据，我想得到那些在(或低于)该家庭的score中位数的情况下的family的计数。概念上类似的东西？df.groupby('family')['score'].median().filter(lambda x: x>x.median) 有什么帮助吗？

浏览 0提问于2017-10-17得票数 1

回答已采纳

1回答

如何在Pandas中用DataFrame中的逗号分隔重复行的列创建列？

python、pandas、dataframe、duplicates

我有Pandas DataFrame，如下所示(数据类型为"ID“和"COL1”为"object")： ID | COL1 | COL2 | COL3 ----|------|------|---- 123 | ABc | 55 | G4 123 | Abc | 55 | G4 123 | DD | 55 | G4 44 | RoR | 41 | P0 44 | RoR | 41 | P0 55 | XX | 456 | RR 我需要：创建新列"COL1_cum“，其中将是每个ID中由逗号分隔的"C

浏览 3提问于2022-09-12得票数 1

回答已采纳

2回答

如何在多把钥匙上使用熊猫石斑鱼？

datetime、pandas-groupby

我需要通过datetime列和另一个str(object)列来转换一个dataframe，以便按组应用函数，并将结果分配给组的每个行成员。我理解，但不能同时为这两个条件创建一个pandas.Grouper。因此：如何在多列上使用pandas.Grouper？

浏览 6提问于2018-09-05得票数 16

回答已采纳

2回答

确定Pandas数据框行是否具有多个特定值

python、pandas、dataframe

我有一个Pandas数据帧，由下面的数据帧表示： A B C D | 1 1 1 3 | | 1 1 1 2 | | 2 3 4 5 | 我需要遍历这个数据框，查找A、B和C列中的值匹配的行，如果是真的，检查D列中的值是否为这些行，并删除具有较小值的行。所以，在上面的例子中，之后会是这样的。 A B C D | 1 1 1 3 | | 2 3 4 5 | 我写了下面

浏览 32提问于2021-01-09得票数 0

1回答

熊猫用csv逐行成群

python、csv、pandas、group-by、aggregate

我有一个很大的CSV文件，我正在从(月份和取消)中提取两列，并且需要在一个dataframe中显示结果。月份是整数。一月是csv中的1)，需要将其转换为字符串。我遇到的问题是设置正确的指数，并将几个月的数据分组。 import pandas as pd data = pd.read_csv('data.csv', encoding='latin-1', usecols=['Month','Cancelled']) grouped = data.groupby(axis=1) 我要寻找的预期输出大致如下：

浏览 7提问于2015-02-28得票数 0

1回答

如何根据另一列的序列添加新列并填充特定值？

python、pandas

我是Pandas的新手，但多亏了Add column with constant value to pandas dataframe，我可以一次添加不同的列 c = {'new1': 'w', 'new2': 'y', 'new3': 'z'} df.assign(**c) 但是，当我想要向数据帧添加一个新列(当前是120万行* 23列)时，我正在尝试确定应该采用什么路径。让我们稍微简化一下df，并试着让它更清晰： Order Orderline Product 1 0

浏览 28提问于2020-04-22得票数 1

回答已采纳

1回答

如何在Pandas中执行COUNTIFS

python、pandas

有没有办法在pandas数据框中添加一列，以复制excel COUNTIFS公式来计算满足多个条件的行数？我目前有一个基本的2列数据帧，其中有小时列和符号列。我想要一个第三列，它运行数据帧的长度，并计算小时+符号对出现的次数。到目前为止，我已经添加了一张数据帧的图片，在这里我应该期待另一个值为1 1 2 2 1的列 as '08‘和'AD NA’是唯一出现两次的对。 ?

浏览 63提问于2021-10-26得票数 0

回答已采纳

6回答

如何在Pandas DataFrame中获取NaN值时的最大/最小值

python、pandas

因为我的pandas数据帧中有一列的值是错误的，所以当我想要获取该列的最大值时，它只会返回nan。 >>> df.iloc[:, 1].max() 'error:512' 如何跳过nan值并获得该列最大值？

浏览 76提问于2016-07-21得票数 18

回答已采纳

1回答

潘达斯的过滤器-为什么这不起作用？

python、pandas、dataframe、pandas-groupby

这是一个基本的问题，所以事先道歉。我正在使用Pandas，并将数据分组如下： page_serp_df.groupby([page_serp_df.meta_keywords_1_length]).count()['keyword'] 这指的是以下内容：数据帧：page_serp_dfGrouping by列：meta_keywords_1_lengthCounting与过滤器：关键字列我不明白的是，为什么过滤条件必须是‘关键字’，即引号中的字符串？例如，这不起作用，而且对我来说非常违背直觉： page_serp_df.groupby([page_serp_df.meta

浏览 0提问于2020-09-23得票数 0

回答已采纳

1回答

如何用日期时间索引重编大熊猫的数据序列

python、pandas

用日期时间索引对熊猫数据序列进行重采样我对蟒蛇很陌生，我正在研究熊猫。我有一个包含日期、时间和其他列的GW2test.csv文件，每30分钟收集一次数据。我需要重新整理每日平均数的数据。CVS看起来像： Date time P P3W P3W1 P2W 04/18/12 15:00 0 1.334 1.006 04/18/12 15:30 0 1.336 1.003 04/18/12 16:00 0 1.323 0.985 04/18

浏览 4提问于2013-09-19得票数 0

1回答

在python中大小为()的数据帧中输出为零

python、pandas、pandas-groupby

我有一个由三列组成的文件: A、B和C，其中包含一些整数。使用python，假设我想要grouby()列'A‘，并获得列'B’中数字大于4、6和8的每个组的size()。所以我实现了下面的代码： >>> import pandas as pd >>> >>> df = pd.read_csv("test.txt", sep="\t") >>> df A B C 0 1 4 3 1 1 5

浏览 5提问于2019-06-16得票数 2

回答已采纳

2回答

在潘达斯的一个特定城市，如何在十年内显示出每年的平均销售额？

python、pandas、dataframe、jupyter-notebook

怎样才能正确地显示2010-2020年期间卡莱尔市的平均销售量？以下是大数据框架的缩写形式，仅显示与此问题相关的列和行： import pandas as pd df = pd.DataFrame({'Date': ['01/09/2009','01/10/2009','01/11/2009','01/12/2009','01/01/2010','01/02/2010','01/03/2010','01/04/2010','01/05/201

浏览 5提问于2021-06-03得票数 1

回答已采纳

2回答

如何在Pandas中展平groupby操作的结果？

python、pandas

使用Pandas数据帧，有没有一种方法可以扁平化groupby操作的结果，而不必使用临时数据帧，然后将其合并到原始数据帧中？假设我需要创建一个依赖于聚合操作的"result“列，就像这个场景： import pandas as pd df = pd.DataFrame({'box': [1,1,1,2,2,3,3,3,3], 'item': ['apple', 'durian', 'pear', 'orange', 'banana', 'apple',

浏览 82提问于2020-05-04得票数 2

回答已采纳

2回答

如何根据列中的特定值删除一些行？

python、pandas、dataframe

那里!我有以下情况，如有任何帮助，将不胜感激。假设我有下面的dataframe，包含2列和9万行(使其更短，这样就可以很容易地再现)： PRODUCT ID PROBLEM 0 1 OIL LEAK 1 2 FLAT TIRE 2 3 OIL LEAK 3 4 ENGINE ISSUES 4 5 ENGINE ISSUES 5 6 OIL LEAK 6 7 OIL LEAK 7

浏览 2提问于2022-07-02得票数 2

回答已采纳

1回答

如何使用Python数据框基于多个条件进行计算？

python、pandas、dataframe

我有成千上万行和列的excel数据文件。我正在使用python，并且已经开始使用pandas dataframe来分析数据。我想在D列中为每个ID计算C列中的值每年的年度变化。我可以使用excel来执行此操作-如果组织ID与前一行中的ID相同，则计算年度变化(将单元格突出显示为蓝色，因为这是该特定ID的第一个期间)。我不知道如何使用python来做到这一点。有人能帮上忙吗？

浏览 15提问于2018-08-29得票数 1

2回答

基于切片的熊猫数据更新？

python、pandas、dataframe、slice

我见过 --但我无法为我的用例找到答案。考虑一下下面的代码，其中我有一个带有"channel“和"value”列的起始表： import sys if sys.version_info[0] < 3: from StringIO import StringIO else: from io import StringIO import pandas as pd TESTDATA = StringIO("""channel,value A,10 A,11 A,12 A,13 B,20 B,22 B,24 B,26 B,28 C,1

浏览 1提问于2021-11-19得票数 1

回答已采纳

1回答

在火花表中追加聚合状态从循环开始

pyspark

我有下面的电火花代码。在循环中的每一次迭代中，我过滤掉H列中带有特定字符串的所有行，然后计算G列上的一些聚合统计数据(结果为3个值)。我希望将所有的汇总计数保存在一个表中(行: CM、NCM、FP；列: POP、POP N、POP SN、POP QP)。 from pyspark.sql import SparkSession import pandas as pd import numpy as np import pyspark.sql.functions as F spark = SparkSession.builder.master("local").appName(

浏览 0提问于2018-10-28得票数 0

回答已采纳

5回答

如何在Pandas dataframe中选择值多次出现的行

python、pandas

假设我拥有具有不同度量属性的列以及相应的度量值的Pandas数据。 ID Parameter Value 0 'A' 4.3 1 'B' 3.1 2 'C' 8.9 3 'A' 2.1 4 'A' 3.9 . . . . . . . . . 100

浏览 1提问于2018-02-05得票数 25

回答已采纳

1回答

基于pandas中的列值的颜色时间序列

python、pandas、matplotlib

我在pandas DataFrame中有一个时间序列(在本例中为df.data)，并希望根据另一列的值(本例中为df.colors；本例中的值为0、1和2，但如果它也适用于floats，则它将更好/更可移植)为绘图着色。 import pandas as pd n = 10 seed(1) df = pd.DataFrame(data={"data":randn(n), "colors":randint(0,3,n)}, index=pd.date_range(start="2016-01-01", perio

浏览 0提问于2016-08-22得票数 2

回答已采纳

2回答

在python中，与any()函数相反的是什么，例如没有任何函数

python、pandas、filter、group-by、any

假设我有一个如下所示的df： import pandas as pd d = {'group': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C'], 'number': [0, 3, 2, 1, 2, 1, -2

浏览 2提问于2022-06-23得票数 1

回答已采纳

4回答

pandas:如何查看(参数)字符串是否在pandas元素中的字符串列表中(类似于反向isin)

python、pandas

import pandas as pd d = { "tags": pd.Series([["a", "b"], ["a"], ["b", "c"], ["a", "c"], []]), "value": pd.Series([0, 2, 1, 4, 3]), } df = pd.DataFrame(d) 我想选择所有带有"c“的行作为"tag”列中的一个元素(就像在df.loc[INSERT_FUNCTION_HE

浏览 38提问于2020-08-08得票数 2

1回答

基于ID的累计和

python、pandas

问题：我有一个从带有pandas的"csv“文件导入的数据帧，看起来像这样(简化的例子)： id amount 1 50 1 10 1 5 2 10 2 15 2 25 2 40 因此，我们的想法是将金额相加，并将结果添加到具有相同id的所有记录中，如下所示： id amount total 1 50 65 1 10 65 1 5 65 2 10 90 2 15 90 2 25 90 2 4

浏览 11提问于2019-01-25得票数 1

回答已采纳

1回答

如何在不删除其他列的情况下合并Pandas中的行？

python、pandas、dataframe

我有如下代码 import pandas as pd import numpy as np import requests from bs4 import BeautifulSoup res = requests.get("https://en.wikipedia.org/wiki/List_of_postal_codes_of_Canada:_M") soup = BeautifulSoup(res.content,'lxml') table = soup.find_all('table')[0] dfwiki = pd.read_ht

浏览 15提问于2019-11-27得票数 0

回答已采纳

1回答

Python Pandas- Groupby列以获取Pandas dataframe列中的两个峰值

python、pandas

我使用Python Pandas对一个名为"Trace“的列进行分组。对于每个跟踪，都有一个包含两个峰值的"Value“列，我试图将它们传输到不同的数据帧中。第一个问题是，当我使用groupby时，它不会保留我想要选择的值所在行的其余数据。例如，如果一个Pandas数据帧有6列，那么我想在使用groupby之后保留所有6列。第二个问题是，我想要的两个最大值不是列中的两个最大值，而是数据集中的“峰值”。例如，附加的图像显示了我想要其值的两个峰值。我希望将两个峰值中每个峰值的最大值导出到新的数据帧中，并将先前数据帧中其他列的行值导出到新的数据帧中。在下面的代码中，我希望按"

浏览 54提问于2018-08-05得票数 0

回答已采纳