获取超过两列的groupby后第三列的最大值

在云计算领域中，获取超过两列的groupby后第三列的最大值可以通过以下步骤实现：

首先，我们需要明确groupby的概念。groupby是一种数据处理操作，它将数据按照指定的列进行分组，并对每个组进行聚合操作。
在groupby操作中，我们可以使用聚合函数来计算每个组的统计值，例如求和、平均值、最大值等。在这个问题中，我们需要获取第三列的最大值，因此我们将使用max()聚合函数。
在进行groupby操作之前，我们需要确保数据已经加载到内存中，并且以适当的数据结构进行存储，例如关系型数据库、NoSQL数据库或数据框架。
接下来，我们可以使用编程语言中的相关库或框架来实现groupby操作。根据你熟悉的编程语言和技术栈，可以选择使用Python的pandas库、Java的Apache Spark框架、或者其他适合的工具。
在进行groupby操作时，我们需要指定要分组的列，并使用max()函数计算第三列的最大值。具体的代码实现会根据所选的编程语言和工具而有所不同。
最后，根据实际需求，我们可以根据第三列的最大值进行进一步的数据处理或分析。例如，可以将结果保存到数据库中、生成报表、进行可视化展示等。

在腾讯云的产品生态中，可以使用腾讯云数据库（TencentDB）来存储和管理数据，使用腾讯云云函数（SCF）来实现数据处理逻辑，使用腾讯云数据分析（DataWorks）来进行数据分析和可视化展示。具体的产品介绍和链接如下：

腾讯云数据库（TencentDB）：提供多种数据库产品，包括关系型数据库（MySQL、SQL Server等）和NoSQL数据库（MongoDB、Redis等）。详情请参考：腾讯云数据库产品
腾讯云云函数（SCF）：无服务器计算服务，可以实现按需运行的函数计算。详情请参考：腾讯云云函数产品
腾讯云数据分析（DataWorks）：提供数据集成、数据开发、数据分析和数据可视化等功能，帮助用户实现数据驱动的决策。详情请参考：腾讯云数据分析产品

请注意，以上仅为腾讯云的一些产品示例，实际选择和使用的产品应根据具体需求和场景进行评估和决策。

pandas按另一列中的值对列进行排序

、、

我有一个数据集，我想根据它对它进行排序和分配排名。假设它有两列，一列是year，另一列是我想要排序的列。 import pandas as pd data = {'year': pd.Series([2006, 2006, 2007, 2007]), 'value': pd.Series([5, 10, 4, 1])} df = pd.DataFrame(data) 我想按年对“value”列进行排序，然后给它排序。我想要的是 data2= {'year': pd.Series([2006, 2006, 2007, 2007]

浏览 4提问于2015-12-18得票数 6

回答已采纳

1回答

提取大熊猫数据中具有最大值的行

、、

我们可以使用.idxmax获得数据帧(Df)的最大值。我的问题是我有一个有几个列(超过10列)的df，其中一个列具有相同值的标识符。我需要提取具有最大值的标识符： df id值a 0 b 1 b 1 c 0 c 2 c 1 现在，这就是我想要的 df id值a 0 b 1 c 2 我正试图通过使用df.groupy(['id'])来获得它，但它有点棘手： df.groupby(["id"]).ix[df['value'].idxmax()] 当然，这不管用。我担心我没有走上正确的道路，所以我想我应该问问你们！谢谢!

浏览 3提问于2013-10-22得票数 1

回答已采纳

1回答

如何通过pandas从OHLC数据中获得前15分钟的高潮？

这是一个数据帧，其中包含来自2011-2021的OHLC分钟级数据我想创建另一个名为"first15 high"的列，我想在其中设置first 15 minute high，即当天9:15到9:30的最高值。所需的输出(在黄色列中)如下所示。Dataframe有超过10年的数据(即包含超过2000天)。

浏览 0提问于2021-05-26得票数 0

3回答

Python Dataframe根据其中一列中的最大值选择行

、

我有一个python格式的dataframe (多行，2列)。我想根据列2中的最大值，用列1中的唯一值修改DF (如果有帮助，列2将按升序排序)。我可能会写一个循环，但我更喜欢单行或两行的解决方案。谢谢。例如。 ID Value 100 11 100 14 100 16 200 10 200 20 200 30 300 45 400 0 400 25 期望的结果 100 16 200 30 300 45 400 25

浏览 1提问于2017-03-28得票数 5

2回答

数据中最大值的选择

、、、

我有以下数据我想选择与第一列的值相关的第二列的最大值。对于第一栏中的值1，所选值应为5。第一列是“时间”(例如: 06:54:11) 我可以使用matlab，python，excel，bash。

浏览 8提问于2021-12-20得票数 -4

1回答

如何使用python根据列特定值从数据中提取行

、、、

目前，我有一个庞大的数据集和一个非常小的例子如下所示。我想要做的是基于shift列提取行，并为的最后3行从score列中找到最大值，然后将整行提取到一个新的数据帧中。例如:每一天有两班(白天和晚上)，每班我都想为每班最后3行找到最高分数(例如:6月26日，shift>日，我想从last 3 score of the day shift，26 jun )中找到最高分数。我不想取每一个移位最大的分数并提取那一行)，并提取整行并将其设置为新的dataframe。我想每天两班都这么做。预期的dataframe输出如下：我试图使用groupby来解决这个问题。但是，我不

浏览 3提问于2020-10-21得票数 0

1回答

需要df.groupby()修改帮助

、、

这是我的桌子： A B C E 0 1 1 5 4 1 1 1 1 1 2 3 3 8 2 现在，我想按照A和B列对所有行进行分组。C列应该求和，对于E列，我想使用C值为max的值。我完成了A组和B组的第一部分并总结了C。我这样做是用： df = df.groupby(['A', 'B'])['C'].sum() 但在这一点上，我不知道如何判断列E应该取C为max的值。最终结果应该如下所示： A B C E 0 1 1 6 4 1 3 3 8 2 有人能帮我处理这段过去的事吗？谢

浏览 0提问于2018-08-11得票数 4

回答已采纳

3回答

Pandas对列进行排序，但将同一类别的元素放在一起

、

我有一个包含两列的数据帧。一个是数字的，另一个是分类的。例如, c1 c2 0 15 A 1 11 A 2 12 B 3 40 C 我希望按c1排序，但将具有相同c2值的行放在一起(这样所有的A都放在一起)。在有多个条目的类别中，我们按该类别中的最大值进行排序。所以最终结果将是 c1 c2 0 40 C 1 15 A 2 11 A 3 12 B 我该怎么做呢？谢谢

浏览 102提问于2021-08-13得票数 0

回答已采纳

1回答

如何计算火花放电中的搅动

、

有人知道如何在下面的数据集中应用搅动规则吗？其目标是创建一个名为“搅动”的列，并使用它来通知当Id在“使用”列中连续超过30天保持为" false“时，它是否正确或错误。我已经尝试过使用窗口功能，但没有成功。

浏览 3提问于2022-11-25得票数 0

回答已采纳

3回答

按年对数据进行n个最大值的过滤

、、

我有一个每小时有几个列的数据。我希望在我的dataframe中每年提取特定列的10个顶部值的整行(包含所有列)。到目前为止，我运行了以下代码： df = df.groupby([df.index.year])['totaldemand'].apply(lambda grp: grp.nlargest(10))) 这里的问题是，我只得到该特定列的前10个值，而失去了其他列。如何才能执行此操作，并使其他列的对应值与“总需求”列中每年前10个值相对应？

浏览 5提问于2019-12-11得票数 1

回答已采纳

1回答

同时具有group by列和Max table列的MVC Linq查询

、、、

我正在尝试创建一个查询，该查询从同一个表中获取4列的所有唯一记录以及Id列。 var newTSOnly = NewExport.GroupBy(g => new { g.TrainingAttended, g.TrainingLocation, g.Trainer, g.DateOfTrainingSession }).ToList(); 上面得到了我想要的所有唯一记录，但我找不到一种方法同时获得"NewExports“"Id”字段。我的目标是在不同的表中为每个唯一的记录创建一条记录，但之后我需要Id字段用于其他事情。我在一个sql查询中对它进行了测试，发现它可以添

浏览 2提问于2015-05-29得票数 1

2回答

使用前一行中的两列确定pandas数据框中的列值

、

我需要通过将两列与前一行的相同列的值进行比较来计算Pandas数据框中每一行的值。我可以通过使用iloc来做到这一点，但是将它应用于超过100K的行时需要很长的时间。我试过使用lambda，但它一次似乎只返回一行或一列，所以我不能使用它同时比较多列和多行。在本例中，我从当前行的'b‘值中减去前一行的'b’值，但前提是两行的'a‘值相同。这是我一直在使用的代码： import pandas as pd df = pd.DataFrame({'a':['a','a','b','b',

浏览 4提问于2018-02-10得票数 1

回答已采纳

2回答

按列分组，并从pandas数据帧中的其他列中选择特定值

、、、

输入数据帧 +-------------------------------+ |ID Owns_car owns_bike| +-------------------------------+ | 1 1 0 | | 5 1 0 | | 7 0 1 | | 1 1 0 | | 4 1 0 | | 5 0

浏览 15提问于2021-05-21得票数 0

回答已采纳

1回答

用组中的最大值填充NaN

、、

我有如下所示的输入数据： df = pd.DataFrame({"colony" : [22, 22, 22, 33, 33, 33], "measure" : [np.nan, 7, 11, 13, np.nan, 9,], "net/gross" : [np.nan, "gross", "net", "gross", "np.nan", "net"]}) df colony m

浏览 3提问于2022-11-20得票数 0

3回答

使用条件删除数据帧中一列上的重复值

、、、

我有一个有两列ID和工资的数据 data = {'ID':[1,2,3,4,2],'salary':[1e3,1.2e3,1e3,2e3,1.5e3]} +----+--------+ | ID | salary | +----+--------+ | 1 | 1000.0 | +----+--------+ | 2 | 1200.0 | +----+--------+ | 3 | 1000.0 | +----+--------+ | 4 | 2000.0 | +----+--------+

浏览 1提问于2017-01-11得票数 1

回答已采纳

1回答

Pandas按两列分组并获取最大值

、

Pandas按两列分组并获取最大值我已经使用多索引对数据进行了分组 Model VehicleType VehicleType 100 sedan 278 wagon 109 coupe 2 convertible 1 145 small 19 ... ...

浏览 27提问于2020-08-11得票数 1

回答已采纳

2回答

根据第一列的级别和第二列上的条件填充一列

、、、、

我们有一个数据框架df，它有两个列，如下所示。变量A有两个级别，1和2。变量B有三个级别--是，不，和其他。我们希望用df2变量C派生另一个数据框架，如果变量A 中的任何级别至少存在一个YES，则该变量C的值为 "1" ，否则为“0”。 df A B 1 YES 1 YES 1 OTHER 1 NO 1 YES 1 NO 2 YES 2 YES 2 YES 2 NO 2 YES 3 OTHER 3 NO 3 NO 3 NO df2 A C 1 1 2 1 3 0

浏览 4提问于2022-06-04得票数 0

回答已采纳

2回答

scala中每个组的最高值

、、

我有一个id和分数的数组，我想找出每个id的最高分数。 val idAndScore = Array( ("10022 10021", -6.1825), ("10022 10021", -6.477912), ("10022 10021", -7.207875), ("10022 10021", -6.251606), ("10022 10021", -6.343815), ("10022 10021", -6.62864), ("2

浏览 0提问于2016-09-05得票数 0

回答已采纳

5回答

如何在Pandas dataframe中选择值多次出现的行

、

假设我拥有具有不同度量属性的列以及相应的度量值的Pandas数据。 ID Parameter Value 0 'A' 4.3 1 'B' 3.1 2 'C' 8.9 3 'A' 2.1 4 'A' 3.9 . . . . . . . . . 100

浏览 1提问于2018-02-05得票数 25

回答已采纳

1回答

移除具有与其他列相似的子字符串的列Python

、、

我有一个dataframe，其中的列名具有相同的格式：data_sensor，其中日期的格式为yymmdd。下面是它的一个子集： ? 考虑到最后的数据(180722)，我想根据传感器预定义的优先级保留该列。例如，我想定义SN1比SK3更重要。因此，期望的结果将是相同的dataframe，只是没有列180722_SK3。具有相同最后日期的列数可以超过两个。这是我实现的解决方案： sensorsImportance = ['SN1', 'SK3'] #list of importence, first item is the most important s

浏览 16提问于2020-08-02得票数 0

1回答

在做groupby时添加具有特定值的列

、、、

我有一个DataFrame，它看起来像： df date price bool --------------------------------------------- 2022-01-03 22:00:00+01:00 109.65 False 2022-01-03 22:00:00+01:00 80.00 False 2022-01-03 22:00:00+01:00 65.79 True 2022-01-03 22:00:00+01:00 50.00 True 202

浏览 5提问于2022-03-01得票数 1

回答已采纳

2回答

熊猫在单独的列中从值最高的数据中选择行

、、

我正在寻找一种方法来选择在一个单独列中标识的组中具有最高值的数据value的行。 DataFrame： Group Value 0 A 0 1 A 12 2 A 22 3 A 63 4 B 0 5 B 24 6 B 66 7 B 78 期望的DataFrame： Group Value 0 A 63 1 B 78

浏览 4提问于2022-08-04得票数 0

回答已采纳

1回答

Python pandas在group by之后选择行值

、、

按列分组后，如何选择计数数最大的一行数值？示例： STATE COUNTY POPULATION 1 5571 1000 2 3421 2000 3 6781 3000 2 1234 4000 2 3344 6600 1 5566 9900 我想找到县计数最多的州，选择州和县只显示，不显示人口。答案应该是，但我不知道如何在python中编码。感谢你的帮助 STATE COUNTY 2 3

浏览 1提问于2020-11-12得票数 0

2回答

合并DataFrames Python

、、、、

我有3个数据集，每个数据集有3列和超过1000行。数据是关于两种症状组合的计数。例如，疼痛和发烧，计数为2。我想要一个输出，其中这些DataFrames以这样的方式组合在一起，即来自不同DataFrames的常见症状的计数被相加，而非常见的组合恰好以它们的方式结合在一起。我附上了一个样本DataFrame和我想要的结果。我们将非常感谢您的帮助。 #Sample a = pd.DataFrame({'a':['pain','fever','Headache'],'b':['Cancer','H

浏览 24提问于2021-02-15得票数 0

回答已采纳

1回答

如何从pandas dataframe中删除连续的重复行，同时更新列值？

、、

我有以下数据结构： |a |b |start_time |end_time 0 |aaba |d |11:26 | 11:27 1 |aba |c |11:27 | 11:32 2 |aba |c |11:32 | 11:34 3 |cab |ab |11:34 | 11:35 4 |aba |c |11:35 | 11:40 我想合并列a和b上重复的连续行，然后将新行的start_time和en

浏览 16提问于2019-06-14得票数 3

1回答

如何用公用键从三个不同的数据中和列

、

我正在excel电子表格中阅读关于学校的三个表格，如下所示。 import sys import pandas as pd inputfile = sys.argv[1] xl = pd.ExcelFile(inputfile) print xl.sheet_names df1 = xl.parse(xl.sheet_names[0], skiprows=14) df2 = xl.parse(xl.sheet_names[1], skiprows=14) df3 = xl.parse(xl.sheet_names[2], skiprows=14) df1.columns = [chr(65+i

浏览 5提问于2014-02-25得票数 3

回答已采纳

2回答

删除熊猫数据的初始行，这些行满足列值条件，同时保留列中的序列值。

、、

dt = {'id': [120,120,120,120,121,121,121], 'day': [0, 1,2,3,0,1,2], 'value': [[0.5,3.4,2.7],[0.45,3.4,0.7],[0.25,0.4,0.7],[0.15,0.34,0.17],[0.35,3.4,2.7],[0.5,3.44,2.57],[0.5,0.34,0.37]]} df = pd.DataFrame(data=dt) day id value 0 0 120 [0.5, 3.4, 2.7] 1 1 120

浏览 2提问于2018-08-22得票数 2

回答已采纳

3回答

Python Pandas-查找值超过阈值的第一个实例

、

我正在尝试根据另一个Python Pandas数据框列查找超过阈值的值的第一个实例。在下面的代码中，"Trace“列对于多个行具有相同的编号。我想要找到"Value“列超过3的第一个实例，然后，我想从该行获取其余信息，并将其导出到新的Pandas数据框中(如第二个示例所示)。有什么想法吗？ d = {"Trace": [1,1,1,1,2,2,2,2], "Date": [1,2,3,4,1,2,3,4], "Value": [1.5,1.9,3.1,5.5,1.1,3.6,1.9,6.2]} df = pd.DataFrame

浏览 24提问于2018-07-29得票数 3

回答已采纳

4回答

如何在pandas数据帧中仅更改组的最大值

、

我有以下数据集 Item Count A 60 A 20 A 21 B 33 B 33 B 32 要重现的代码： import pandas as pd df = pd.DataFrame([ ['A', 60], ['A', 20], ['A', 21], ['B', 33], ['B', 33], ['B', 32], ], columns=['Item', 'Count

浏览 42提问于2020-06-24得票数 17

回答已采纳

1回答

无法在熊猫中使用群比函数进行数据处理

、、

我有一个带有100+行的dataframe，其中需要使用groupby提取值w.r.t 'High‘列。但我做不到。我的数据样本是： Date Open High ... Volume Date Open High ... Volume 0 24-04-2020 1840.10 1851.60 ... 93384 1 23-04-2020 1786.00 1891.70 ... 453645 2 2

浏览 3提问于2020-05-06得票数 0

2回答

Python pandas -为另一列中的每个不同值显示列中记录数最多的值

、、

我有一个与此类似的表，但大约有60,000行，其中每个数字都是一个字符串的代码。我需要得到最流行的颜色为2个最受欢迎的车辆类型。 data = pd.DataFrame({'Vehicle_type':[1 ,5 ,2 ,5 ,5 ,3 ,5 ,2 ,3 ,1 ,4 ,5 ,4 ,3 ,4 ,1 ,2 ,1], 'Color': [10,11,10,10,11,14,11,10,13,12,14,15,12,13,14,12,11,14]}) 为了找到两种最受欢迎的车辆类型，我使用了以下命令： data[

浏览 16提问于2020-10-23得票数 0

回答已采纳

3回答

在Python中过滤数据帧

、

我有一个包含2列的数据帧，如下所示： Index Year Country 0 2015 US 1 2015 US 2 2015 UK 3 2015 Indonesia 4 2015 US 5 2016 India 6 2016 India 7 2016 UK 我想创建一个新的数据帧，其中包含每年国家的最大计数。新的数据帧将包含3列，如下所示： Index Year Countr

浏览 0提问于2017-08-12得票数 2

3回答

pandas按第一列值分组，并查找剩余列的最大值

、、、、

我有一个熊猫数据框 import pandas as pd country = ['US', 'US', 'US', 'UK', 'UK', 'Canada', 'Canada', "Mexico"] rating = [0, 2, 1, 4, 3, 1, 0, 1] count = [1, 2, 3, 1, 2, 1, 2, 1] df = pd.DataFrame(list(zip(country,rating, count)), columns

浏览 30提问于2021-07-29得票数 0

回答已采纳

1回答

在熊猫数据中，如何将一批大于指定阈值的1 (ON)标志切换到0？

、

熊猫数据栏中的国旗列由1或0填充。问题是如何识别连续的1。假设t是所需的两类转换的天数阈值：(1)如果在一起的时间超过t1s，则将(t+1)th值从1转到0)，如果超过t1s，则将所有1s转换为0。我的方法是创建两个名为result1和result2的列，并使用这些列进行筛选：我没有想到任何这样的东西，所以没有发布任何代码。

浏览 3提问于2019-10-11得票数 1

回答已采纳

1回答

使用python中的窗口比较数据帧中不同频率的2列

、、、、

我想比较两列的数据，有不同的频率。频率较小的列在最大频率期间填充的值相同，例如，如果我们的频率比第2列低14倍： column1 column2 1 4 1 3 1 8 1 6 2 7 2 8 2 5 2 10 3 12 3 7 3 0 3 3 我们可以看到第1列的值是如何重复的。我想做的是使用大小为4的居中窗口进行比较(因为frec2/frec1 = 4)，并在这个比较中得到最大值。所以我们必须得到3个数值，因为在频率最低的列中只有3个不同的值。其结

浏览 3提问于2021-07-06得票数 0

回答已采纳

1回答

如何有效地计算另一列中每个元素的较大元素的数量？

、、、、

我有以下df name created_utc 0 t1_cqug90j 1430438400 1 t1_cqug90k 1430438400 2 t1_cqug90z 1430438400 3 t1_cqug91c 1430438401 4 t1_cqug91e 1430438401 ... ... ... 其中列name中的所有值都是唯一的。我想创建一个字典，它的键与列name中的元素相同。每个此类键的值是列created_utc中的元素数大于键的元素数。我的预期结果是这样的 {'t1_cqug90j':

浏览 4提问于2021-03-15得票数 2

回答已采纳

2回答

获取pandas groupby对象中多个列的最大聚合

、、、

我有一个dataframe，我想按一个列" company“分组，聚合多个列，并找到每个聚合列具有最大值的公司。 Company performed Requests Request_Id Num_of_refunds 0 A 7 60 U9 3 1 A 90 6 U10 2 2 B 89 6 ZX9 10 3 B

浏览 10提问于2019-04-09得票数 0

回答已采纳

3回答

在DataFrame中找到最常见的组合

、

我有一个DataFrame，包含From和To两列，我需要知道最常见的位置组合From和To。示例： From To ------------------ Home Office Home Office Home Office Airport Home Restaurant Office

浏览 4提问于2020-08-03得票数 3

回答已采纳

2回答

Flex Chart超过轴最大值

、、、

我需要弄清楚如何让柱状图中的一列在超过轴最大值的情况下显示100%的高度。例如，我使用一个最大值为2的线性轴，但希望直观地显示该列至少为2或更大，但在轴上显示的值不超过2。目前，如果一个值超过了轴的最大值，flex就不会显示该列。

浏览 4提问于2011-03-11得票数 0

回答已采纳

2回答

如何在保留整行的同时获得单行的最大值？

、、、

我想为每个id获取单行，其中只存在charge列的最大值。输入数据示例： id name charge 11 hg 10 11 mm 20 22 aa 40 22 bb 40 我尝试过的代码： df.agg(max("charge")) 我只得到最大值，如下所示： charge 40 但是，我想保留整个行： id name charge 11 mm 20 22 aa 40 22 bb 40 如何同时保留前两列？对于相同的id，name列可以有不同的值，因此不可能在这两个列上都使用groupBy并聚合结果。如果两行

浏览 2提问于2018-01-31得票数 0

回答已采纳

1回答

Rails会话表属性，了解activerecord-会话存储

、、

我试图理解存储在数据库中的会话表中的特定记录与存储在会话cookie中的会话信息之间的区别。activerecord-session_store文档中有一部分让我感到困惑。文档位于：因此，无论出于什么原因，我都希望有一个会话表，而不是仅仅使用会话cookie。我添加了宝石：gem "activerecord-session_store"。然后，我执行rails generate active_record:session_migration，该迁移创建了在数据库中构建会话表的迁移(一旦我rake db:migrate )。该sessions表包含两个主要列：session_

浏览 3提问于2015-02-24得票数 2

回答已采纳

1回答

-RetentionDays和-MaximumSize参数是如何在PowerShell中的极限事件日志中工作的？

、

我希望使用Powershell来增加Windows的大小，并打算使用Limit-EventLog。我必须保持至少7天的日志，并有足够的磁盘空间(至少达到4GB的限制)。我的问题是，如果我运行这样的命令： Limit-EventLog -LogName "Application" -MaximumSize 4092MB -RetentionDays 7 -OverflowAction "OverwriteOlder" 如果事件日志中有超过7天的事件，并且有大量的空闲空间，Windows是否保存最古老的记录，还是开始覆盖7天以上的事件？如果我已经达到7天的保留期，我

浏览 0提问于2014-05-14得票数 3

回答已采纳

2回答

基于另一个系列的大熊猫有效分组

、、、、

我需要修改一个分组操作，它基于我的DataFrame中的另一个布尔列。在一个示例中可以很容易地看到:我有以下DataFrame b id 0 False 0 1 True 0 2 False 0 3 False 1 4 True 1 5 True 2 6 True 2 7 False 3 8 True 4 9 True 4 10 False 4 如果b列为True，并且是最后一次对给定的id为True

浏览 1提问于2017-03-21得票数 3

回答已采纳

1回答

尝试从优化的groupby方法中获得所需的DataFrames

、、、、

我试图通过调用DataFrames和df.groupby('index_column').min()从这个更大的DataFrame中创建更小的df.groupby('index_column').min()，其中index_column是df的列，现在我希望它成为新的Min和Max DataFrames的索引。在这些Min和Max DataFrames中，我只想有两个简单的列，一个索引列，另一个只包含Max和Min值的列。将我前面所说的话放在上下文中，我将使用我所做的例子：在标准输出中，主DataFrame df如下所示： In [3]: df Out[3]

浏览 2提问于2015-01-26得票数 0

回答已采纳

2回答

Pandas查询-按唯一列值和聚合选择元组

、、

我在Pandas df中有两列，我想对其进行操作。首先，我想从"score“列中删除诸如"High”之类的非数字值，并将剩余的值转换为int (所有数据都以字符串形式输入)。接下来，我想根据唯一的"measure_id“对"score”求和。如何执行这两个功能？ df为： nationwide_measures = pd.read_sql_query("""select state, measure_id, measure_name, score from timely_and_

浏览 2提问于2017-07-17得票数 0

回答已采纳

1回答

熊猫:只为特定的id和日期找到列的最大值。

、、

我正在尝试创建一个新列，并根据“差异”列的最大值分配一个值"x“，具体考虑到契约号和ref_date的特定组合： Dataframe：当合同代码为'1‘且Ref_Date = 28-02-2021时，则取列“difference”的最大值，并针对difference= 3指定一个值'x’(某种标志)，因为对于该特定契约和ref_date，最大值为3。我试过：但以这种方式，所有其他行都在消失。我希望所有行都在那里，例如contract=1和ref_date = 29-02-2021和Difference = -2的行。

浏览 9提问于2021-04-04得票数 1

回答已采纳

2回答

从pandas多索引数据帧获取最大值

、、

我正在尝试从具有多个索引的pandas数据帧中仅检索最大值(包括多个索引值)。我拥有的数据帧是通过groupby和列选择('tOfmAJyI')生成的，如下所示： df.groupby('id')['tOfmAJyI'].value_counts() Out[4]: id tOfmAJyI 3 mlNXN 4 SSvEP 2 hCIpw 2 5 SSvEP 2 hCIpw 1 mlNXN

浏览 8提问于2018-02-24得票数 8

1回答

从groupby创建DataFrame列

、、、

假设我有一个DataFrame import pandas as pd df = pd.DataFrame({ 'Id' : [1,2,3,4,5,6,7,8,9], 'Group' : [1,1,2,2,2,2,3,3,3], 'Value_to_compare' : [2,1,5,8,2,3,10,23,17], 'Other_value' : [0,3,2,6,3,4,2,7,1] }) 我想要创建一个新的列，比如Value_of_Highest，为具有最高Value_to_compar

浏览 1提问于2020-10-14得票数 0

回答已采纳

2回答

在列上翻转Pandas数据并创建字典

、

我有一个有两列的Pandas数据。 name case 0 a 01 1 a 03 2 b 04 3 b 05 4 b 06 5 b 08 6 b 09 7 b 12 8 c 01 9 c 02 10 c 03 11 c 04 我需要的是一本字典： {"a": ["01", "03"], "b": ["04", "05", "06", "08", "09"

浏览 5提问于2016-07-11得票数 4

回答已采纳

1回答

将最大值应用于pandas数据帧的可变维子集

、

对于具有重复索引的索引列的dataframe，我尝试通过索引获取在不同列中找到的最大值，并将其分配给第三列，以便对于任何给定行，我们可以看到在具有相同索引的任何行中找到的最大值。我是在一个非常大的数据集上这样做的，如果可能的话，我希望它被矢量化。现在，我根本不能让它工作 multiindexDF = pd.DataFrame([[1,2,3,3,4,4,4,4],[5,6,7,10,15,11,25,89]]).transpose() multiindexDF.columns = ['theIndex','theValue'] multiindexDF[

浏览 16提问于2019-02-20得票数 1

回答已采纳