Pandas按列中的每个值分组_Pandas按列值分组_Pandas:按多列分组的值计数 - 腾讯云开发者社区

python、pandas、dataframe、pandas-groupby、keyerror

我似乎无法打印以下行：summarydata["Name"].groupby(["Tag"]).size() 不会得到错误： File "C:\Users\rspatel\untitled0.py", line 76, in <module> print(summarydata["Name"].groupby(["Tag"]).size()) File "C:\Users\rspatel\Anaconda3\lib\site-packages\pandas\core\serie

浏览 0提问于2021-09-20得票数 2

1回答

pandas数据帧中的函数，用于复制R中的dplyr group_by(多变量)函数

python、r、pandas、dataframe

考虑一下这种情况：在dplyr中： df = df%>% group_by(a,b) %>% 表示数据帧首先按列a分组，然后按b分组。在我的例子中，我尝试先按group_name列、然后按user_name、再按type_of_work对数据进行分组。有三列以上(这就是我感到困惑的原因)，但我需要根据这三个标题以相同的顺序对数据进行分组。在这个阶段之后，我已经有了一个处理列的算法。我只需要一个算法来创建一个根据这三列分组的数据帧。在我的例子中，像dplyr函数一样保留序列是很重要的。我们在pandas data-frame中有类似的东西吗？

浏览 0提问于2017-06-19得票数 1

3回答

Seaborn groupby pandas系列

matplotlib、pandas、seaborn

我想要将我的数据可视化到箱形图中，这些箱形图按我可怕的图中显示的另一个变量进行分组：所以我要做的是使用pandas系列变量来告诉pandas我有分组的变量，所以这就是我要做的： import pandas as pd import seaborn as sns #example data for reproduciblity a = pd.DataFrame( [ [2, 1], [4, 2], [5, 1], [10, 2], [9, 2], [3, 1] ]) #converting second column to Series a.ix[:,1] = pd.Series

浏览 0提问于2014-08-13得票数 4

回答已采纳

2回答

使用[groupby]时中间列的Python Pandas排序

python、pandas

我正在使用python pandas，并希望根据下表的中间列对输出进行排序(我已经显示了我正在获得的输出和我想要获得的输出)。我在pandas中使用groupby函数来获得输出，但是它是按计数列排序的(参见下面的输出表)，而我想要按YOB列排序(请参见所需的输出表)。另外，我如何计算每个国家的平均出生年份？ import pandas as pd xlpath= "C:/Users/Username/documents/Datafile.xlsx" df = pd.read_excel(eval('xlpath')) y = df.groupby(&

浏览 20提问于2019-10-14得票数 0

回答已采纳

1回答

尝试使用groupby函数两次，然后找到最大值？

python、pandas

我有从1976年到2020年的选举数据，我试图找到每年单独赢得每个州的政党。也就是说，我正在寻找1976年阿拉巴马州的获胜者(如共和党人、民主党人等)。此外，在数据框中，我有候选人的选票和总票数。因此，我试图通过按州分组，按年份分组，然后获得最大票数来找到获胜者并删除其他所有内容来提取每个获胜者。(所以最终的df应该有240个项目)。这有可能吗？到目前为止，这是我的代码:在其中，我得到了键error: state。这不是大小写问题，而且有一列标记为“state”，所以我不确定我做错了什么。 import matplotlib import pandas as pd # import

浏览 10提问于2021-10-12得票数 0

2回答

带有pandas的列中的行内换行符

python-3.x、pandas、linefeed

在pandas中，有没有办法在一列中分隔一行中的数据？行有多个数据，我的意思是，我按col1分组，结果是我有一个这样的df： col1 Col2 0 1 abc,def,ghi 1 2 xyz,asd and desired output would be: Col1 Col2 0 1 abc def ghi 1 2 xyz asd 谢谢

浏览 96提问于2020-07-17得票数 0

1回答

如何将计算的列按多列分组？

python、pandas、dataframe

你好，我有下面列出的这张数据。 import pandas as pd db_docks = pd.DataFrame(db_top_25, columns = ['from_station_id', 'to_station_id', 'hour', 'day','dpcapacity_start', 'dpcapacity_end']) 示例数据的图像，因为我不能直接嵌入它我需要做的是创建一个新的dataframe，它按“小时”、“日”和“从_station_id”分组。之后，我需要计算

浏览 4提问于2020-01-31得票数 1

回答已采纳

1回答

按两列排序，为什么不先分组呢？

python、sql、pandas、sorting、group-by

我有两列，一列是包含客户姓名的字符串字段customer，另一列是表示销售额的数字字段sales。我想要做的是按客户对数据进行分组，然后在组内对销售进行排序。在SQL或Pandas中，这通常是通过表上的order by customer, sales实现的。但我只是对这个实现很好奇。与其先对customer排序，然后对sales排序，为什么不先对customer进行分组，然后对sales进行排序。我真的不关心不同客户的顺序，因为我只关心同一客户被分组在一起的记录。分组本质上是映射，应该比排序运行得更快。为什么在SQL中没有这样的实现？我是不是遗漏了什么？示例数据name,sales

浏览 13提问于2018-01-03得票数 0

1回答

Oracle SQL查询按组并减去？

sql、oracle

如果表中有四列: A、B、C和D，那么Oracle SQL查询组将如何按列D，然后在每个分组中选择C= 'c‘的行，对于选定的行，返回B减去A的值？

浏览 2提问于2017-09-30得票数 1

回答已采纳

1回答

在熊猫和蟒蛇一起使用groupby之后，我如何计算重复数据组的数量？

python、pandas、dataframe、group-by、pandas-groupby

以下是我所做的：用我想要的4列将CSV 导入到dataframe。使用groupby按ID.进行分组。现在我有了一个物体与3列数据with关联的 ID # 这是我的代码： import pandas as pd df = pd.read_csv('chim_work.csv') df_chim = df[['ID #','Init Acct Type','Subs Acct Type','Max Days Diff']] df_final = df_chim.dropna() df_grouped = d

浏览 5提问于2021-12-15得票数 0

1回答

Pandas DataFrame计数函数中重复数据和错误名称的结果

python、pandas、dataframe、count

我有一个关于Pandas DataFrame count函数的问题。我正在编写以下代码： d = {'c1': [1, 1, 1, 1, 1], 'c2': [1, 1, 1, 1, 1], 'c3': [1, 1, 1, 1, 1], 'Animal': ["Cat", "Cat", "Dog", "Cat", "Dog"]} import pandas as pd df = pd.DataFrame(data=d) 最后，我使用了DataFram

浏览 3提问于2020-10-26得票数 0

1回答

基于pyspark的均值漂移聚类

python、pandas、pyspark、pandas-groupby、user-defined-functions

我们正在尝试将一个普通的python代码库迁移到pyspark。议程是对数据帧(以前是pandas，现在是spark)进行一些过滤，然后按user-ids对其进行分组，最后在顶部应用meanshift集群。我在分组数据上使用pandas_udf(df.schema, PandasUDFType.GROUPED_MAP)。但现在，最终输出的表示方式出现了问题。假设我们在输入数据帧中有两列：user-id和location。对于每个用户，我们需要获取所有集群(在location上)，只保留最大的一个，然后返回其属性，这是一个3维向量。让我们假设3元组的列是col-1、col-2和col-3。

浏览 11提问于2019-05-14得票数 0

回答已采纳

2回答

熊猫按习俗分类

python、python-3.x、pandas、group-by、aggregate-functions

这应该很简单。我想要的是根据函数的结果进行分组的能力，就像在SQL中一样，您可以按表达式进行分组： SELECT substr(name, 1) as letter, COUNT(*) as count FROM table GROUP BY substr(name, 1) 这将计算以字母表中的每个字母开头的name列的行数。我希望在python中也这样做，所以我假设我可以将一个函数传递给groupby。但是，这只会将索引列(第一列)传递给函数，例如0、1或2。 import pandas # Return the first letter def first_letter(row):

浏览 6提问于2015-12-09得票数 4

回答已采纳

1回答

按月按数据分组，所选字段不按类别分组

mysql

是否有任何方法按数据按唯一的month分组，但我也需要选择no_inv和date_inv列。 Mysql查询： SELECT no_inv, date_inv, SUM(total_unpaid) AS unpaid, SUM(total_paid) AS paid FROM invoice GROUP BY MONTH(date_inv) LIMIT 3

浏览 0提问于2021-04-03得票数 1

1回答

查找两列中的最大值，并用第三列中的值填充

python、pandas、dataframe、group-by、pandas-groupby

我有一个包含4列的pandas数据帧- A、B、C、D和E。我想按A列创建组，然后找到B列和C列的最大值，然后用D中的相应值填充E，如下面的示例所示。我的预期输出： column A column B column C column D Column E AA 1 a 12 15 AA 2 d 13 15 AA 3 b 14 15 AA

浏览 10提问于2021-07-08得票数 2

回答已采纳

1回答

有没有办法在pandas组框图中设置顺序？

pandas

在pandas中，有没有办法对分组箱形图的x轴进行排序？它似乎是按升序排序的，我希望它是基于其他列值排序的。

浏览 0提问于2014-02-02得票数 2

1回答

如何使用pandas中的公共列查找多个列的平均值

pandas、pandas-groupby、mean

如何使用'count‘列计算所有列的平均值。我在下面的代码中使用随机生成的值创建了一个数据帧。 import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10,10)*100/10).astype(int) df output: A B C D E F G H I J 0 4 3 2 8 5 0 9 9 0 5 1 1 5 8 0 5 9 8 3 9 1 2 9

浏览 10提问于2020-06-05得票数 1

回答已采纳

1回答

按索引分组表或列表列表

list、emacs、org-table

如何用elisp按给定的索引对列表进行分组？这些列表表示表，就像org-table一样，因此每个子列表表示一行，例如。 | a | 1 | 0 | | b | 1 | 1 | | c | 0 | 0 | 会是'((a 1 0) (b 1 1) (c 0 0))。我希望能够将给定的列按另一列分组。因此，例如，将第一列按第三列分组，我希望是'((0 a c) (1 b))，因为第一行和第三行的第三列是0。我尝试了下面的代码，但是它产生了这么多循环。在elisp中是否有分组功能，还是更好的方法？ ;; group column1 by column2 in table (defu

浏览 14提问于2017-04-11得票数 1

回答已采纳

2回答

如何在多把钥匙上使用熊猫石斑鱼？

datetime、pandas-groupby

我需要通过datetime列和另一个str(object)列来转换一个dataframe，以便按组应用函数，并将结果分配给组的每个行成员。我理解，但不能同时为这两个条件创建一个pandas.Grouper。因此：如何在多列上使用pandas.Grouper？

浏览 6提问于2018-09-05得票数 16

回答已采纳

1回答

从熊猫群返回聚合数据

python、group-by、pandas

我正试着用方法把我的头绕在潘达的群里。我想编写一个函数，它执行一些聚合函数，然后返回一个Pandas DataFrame。下面是一个非常简化的使用sum()的例子。我知道有更容易的方法来做简单的和，在现实生活中，我的函数更复杂： import pandas as pd df = pd.DataFrame({'col1': ['A', 'A', 'B', 'B'], 'col2':[1.0, 2, 3, 4]}) In [3]: df Out[3]: col1 col2 0 A

浏览 0提问于2013-02-21得票数 18

2回答

两栏一组，熊猫一栏

pandas

在熊猫中，我想按两栏分组，然后做一次计数。在此之后，我想删除我分组的列，并计算计数的平均值。我知道如何在sql中轻松地做到这一点，但是在Pandas中遇到了一些问题。我不能删除我以前分组的一列。有人知道如何做得好吗？ (只要关心最终结果，如果有更好的结果，程序就不必是这样的) 例： Name, City Anna, New York Carl, New York Carl, New York Steven, London Carl, London Anna, Paris Carl, Paris Carl, Paris 按“名称”和“城市”分组，然后计数： Name, City, Count A

浏览 9提问于2022-10-10得票数 1

回答已采纳

1回答

熊猫的群序与投影

python、pandas

我在Pandas中有一个数据框架，在该数据框架中，我想知道两个特定列中每个值组合发生的次数。下面的代码似乎做了我想做的事情： coupon_test.groupby(['CAPSULE_TEXT', 'GENRE_NAME'])[['CAPSULE_TEXT', 'GENRE_NAME']].count() CAPSULE_TEXT GENRE_NAME CAPSULE_TEXT GENRE_NAME WEBサービスその他のクーポン

浏览 0提问于2015-08-13得票数 1

回答已采纳

1回答

pandas按字符串列表分组

python、pandas、data-analysis

想象一下，如果您有一个字符串列表和一个pandas数据帧，其中有一个列Foo，其中包含可能包含这些字符串的单词： my_list = ['A', 'B', 'C'] df‘’Foo‘包含包含'A’、'B‘或'C’的单词，您可以提取包含by df.Foo.str.contains(my_list[0])等的行，但是否可以按与列表匹配的行进行分组？因此groupby应该是包含'A‘、'B’或'C‘的

浏览 5提问于2016-10-07得票数 0

1回答

使用列中包含的列名构建DataFrame

python、pandas、csv、dataframe

浏览 1提问于2020-03-03得票数 0

1回答

按中的列分组。

python、dataframe

我有一个简单的df。它有两列。我想按a列的值分组。下面是一个简单的例子:任何输入都会非常感谢！ import pandas as pd import numpy as np df = pd.DataFrame() df['a'] = [1, 2, 3, 4, 1, 2] df['b'] = [10, 20, 30,40, 50,60] 期望的产出是： df = pd.DataFrame() df['a'] = [1, 2, 3, 4] df['b'] = [10, 20, 30,40 ] df['b1']

浏览 1提问于2022-08-09得票数 0

回答已采纳

6回答

如何在非唯一列中按日期对pandas DataFrame条目进行分组

python、pandas

Pandas DataFrame包含名为"date"的列，该列包含非唯一的datetime值。我可以使用以下命令对此帧中的线条进行分组： data.groupby(data['date']) 但是，这将按datetime值拆分数据。我想按“日期”列中存储的年份对这些数据进行分组。展示了如何在将时间戳用作索引的情况下按年分组，但在我的例子中并非如此。如何实现此分组？

浏览 1提问于2012-07-09得票数 94

回答已采纳

4回答

在pandas中过滤GroupBy之后的组，同时保留这些组

python、pandas、pandas-groupby

在pandas中，我想要做的是：df.groupby('A').filter(lambda x: x.name > 0) - group by列A，然后过滤名称为non positive的组。但是，当GroupBy.filter返回DataFrame时，这会取消分组，从而丢失分组。我想按这个顺序来做，因为它应该对计算要求较低，因为filter后面跟着groupby会遍历DataFrame两次，不是吗(首先过滤，然后分组)？此外，克隆分组中的组(到字典或其他东西)将失去无缝返回到数据帧的功能(就像在.filter的示例中，您直接获取DataFrame)。谢谢示例：

浏览 3提问于2018-04-14得票数 12

5回答

我可以在一次选择中使用sum()吗？

sql

我有一张这样的表格： A B 1 1.5 1 1.5 2 2.3 2 2.3 2 2.3 3 1.5 3 1.5 我如何计算B列的总和，按1.5，2.3和1.5分组。简而言之，我想先分组，然后生成sum()，但只需一次select。在此表中，如果按A列分组，则结果为： A B 1 1.5 2 2.3 3 1.5 现在我想对B列求和()。

浏览 0提问于2009-12-12得票数 0

1回答

Python Pandas- Groupby列以获取Pandas dataframe列中的两个峰值

python、pandas

我使用Python Pandas对一个名为"Trace“的列进行分组。对于每个跟踪，都有一个包含两个峰值的"Value“列，我试图将它们传输到不同的数据帧中。第一个问题是，当我使用groupby时，它不会保留我想要选择的值所在行的其余数据。例如，如果一个Pandas数据帧有6列，那么我想在使用groupby之后保留所有6列。第二个问题是，我想要的两个最大值不是列中的两个最大值，而是数据集中的“峰值”。例如，附加的图像显示了我想要其值的两个峰值。我希望将两个峰值中每个峰值的最大值导出到新的数据帧中，并将先前数据帧中其他列的行值导出到新的数据帧中。在下面的代码中，我希望按"

浏览 54提问于2018-08-05得票数 0

回答已采纳

1回答

Dask中的基本groupby操作

python、pandas、dask

我正在尝试使用Dask来处理一个大文件(50 gb)。通常，我会将其加载到内存中并使用Pandas。我想按两列"A“和"B”分组，每当"C“列以一个值开头时，我想为那个特定的组重复该列中的值。在熊猫中，我会做以下事情： df['C'] = df.groupby(['A','B'])['C'].fillna(method = 'ffill') Dask中的等价物是什么？此外，我还有点迷惑于如何在Dask中构建问题，而不是在Pandas中，谢谢, 我到目前为止的进展是：第一组索引： df1

浏览 7提问于2016-08-12得票数 3

1回答

如何用层次指数计算大熊猫的平均数

python-3.x、pandas

我有一个具有1mi行和分层索引(国家、州、城市，按此顺序)的pandas数据帧，每行都有一个产品的价格观察。我如何计算每个国家、州和城市的均值和标准差(请记住，由于我的df很大，我正在避免循环)？对于每个级别的均值和标准差，我希望将值保存在此数据框中的新列中，以供将来访问。

浏览 16提问于2017-06-23得票数 1

回答已采纳

1回答

分组和ILOC错误

python、pandas

当我尝试按特定列进行groupby和sum by dataframe时，我会得到以下错误。 ValueError: Grouper for '<class 'pandas.core.frame.DataFrame'>' not 1-dimensional 我检查了其他解决方案，这不是双列名称标题问题。请参阅下面的df3，除最后两列外，我希望对所有列进行分组，我想要sum()。 dfs head显示，如果我只是按列名称分组，它可以正常工作，但不适用于iloc，因为我知道iloc是我想要分组的正确公式。我需要使用ILOC作为最终的dataframe将

浏览 7提问于2022-11-08得票数 1

回答已采纳

1回答

熊猫用字符串和整数按列对数据进行排序

python、sorting、pandas

我有一个包含整数和字符串的列的dataframe： >>> df = pd.DataFrame({'a':[2,'c',1,10], 'b':[5,4,0,6]}) >>> df a b 0 2 5 1 c 4 2 1 0 3 10 6 我希望按a列对数据进行排序，将字符串和整数分开处理，首先使用字符串： >>> df a b 1 c 4 2 1 0 0 2 5 3 10 6 ...but不允许将整数与字符串进行比较。 TypeE

浏览 0提问于2016-10-13得票数 0

回答已采纳

1回答

用组循环通过列

python、pandas、numpy

我有这个数据集 age salary gender 44 3000 M 32 4555 F 45 6000 M 50 4200 F 43 5000 F 23 1700 M 我想循环每一列并使用数字按性别获得年龄/薪资组的最大值/最小值，我这样做了： import pandas as pd import numby as np data = pd.read_excel("file") var = ["age","salary","gender"] dat = data[var] column_li

浏览 9提问于2022-07-06得票数 1

2回答

熊猫群中的例外

python、python-2.7、group-by、pandas、time-series

我刚刚开始学习用python进行网络分析的方法，使用的书，当我做一些groupby的时候，我被一个异常弄糊涂了。这是我的情况。我有一个NetFlow数据的CSV，我已经输入到熊猫。这些数据看起来类似于： dt, srcIP, srcPort, dstIP, dstPort, bytes 2013-06-06 00:00:01.123, 123.123.1.1, 12345, 234.234.1.1, 80, 75 我导入并索引数据如下： df = pd.read_csv('mycsv.csv') df.index = pd.to_datetime(full_set.pop(&

浏览 2提问于2013-09-17得票数 2

回答已采纳

7回答

是否同时对列和索引值对pandas数据帧进行排序？

python、pandas、sorting、dataframe

按列的值和索引对pandas dataframe进行排序是否可行？如果按列的值对pandas数据帧进行排序，则可以得到按列排序的结果数据帧，但不幸的是，您会看到数据帧的索引顺序与排序列的值相同。那么，我是否可以按列对数据帧进行排序，例如名为count的列，但也可以按索引值对其进行排序？按降序对列进行排序也是可行的，但是按升序对索引进行排序是否可行呢？我知道如何对dataframe中的多个列进行排序，也知道通过首先对索引执行reset_index()并对其进行排序，然后再次创建索引，就可以实现这里所要求的结果。但是，这是不是更直观、更有效的方法呢？

浏览 2提问于2013-11-29得票数 59

2回答

如何按月份和另一列pandas数据框分组

pandas、dataframe、datetime

我有一个数据框，如下所示： import pandas as pd df = pd.DataFrame({'Date':[2019-08-06,2019-08-08,2019-08-01,2019-10-12], 'Name':['A','A','B','C'], 'grade':[100,90,69,80]}) 我想按Datetime中的月份和年份对数据进行分组，也可以按名称进行分组。然后对其他列进行汇总。因此，期望的输出将类似于下面的内容 df = pd.DataFrame

浏览 12提问于2020-08-19得票数 0

1回答

如何在熊猫数据帧中查找重复项

python、pandas

我想读取一个文件夹，里面有一些.csv文件，并找到重复的坐标。.csv如下所示： 0 0 0 1 1 0 1 2 1 1 0 0 0 1 2 ... 这里是第0行和第2行的副本，因为前3列(坐标)是相同的。我想也许在比较之前对数据帧进行排序会加快代码的速度。但是我不确定如何在python中正确地对它进行排序(我会按第一列进行排序。然后，对于第一列中相同的元素，第二列中的元素和第三列中的元素相同。因此，数据帧： 0 1 1 1 1 0 1 0 1 2 2 0 1 0 0 0 0 0 1 1 would look like this: 0 0 0 1 1 0 1 0 1 2 0 1 1

浏览 8提问于2019-06-07得票数 0

1回答

合并Pandas Dataframe值，但保留列值

python、pandas、dataframe

我有一个包含多个行的pandas数据框，这些行基于id列是彼此重复的，除了它们各自行中的其余值不是重复的。我的目标是将这些行合并到一行中，而不会丢失其余列中的数据。我希望预期的结果如下所示：

浏览 1提问于2020-03-01得票数 0

1回答

matplotlib中的标杆是否使用平均值？

python、pandas、matplotlib

我有一个数据集df users number user1 1 user2 34 user3 56 user4 45 user5 4 user1 3 user5 11 user1 3 在制作这样的酒桶时： plt.bar(x['users'], x['number'].sort_values(ascending=False), color="blue") 在绘图期间，是否取了number列中每个number的平均值？如果我希望number列中的所有数字

浏览 0提问于2018-09-11得票数 2

回答已采纳

3回答

错误代码: 1055。SELECT list的表达式#1不在GROUP BY子句中，而是包含非聚合列

mysql

试图更多地了解以下错误：错误代码: 1055. SELECT list的表达式#1不是按子句分组，而是包含非聚合列'companydb.e.dno‘，它在功能上不依赖于按子句分组的列；这与sql_mode=only_full_group_by不兼容使用 =>，从员工中选择dno、dnumber、dname、fname、ssn，由dname命令部门dno=dnumber；根据我所理解的，我可以使用select子句中的那些列，这些列对于使用group by和having子句进行筛选的集合是唯一的。这就是我的困惑。以下查询(查找员工人数最少的部门)失败，出现上述错误： sel

浏览 1提问于2018-08-15得票数 3

回答已采纳

1回答

在python中每隔5分钟打印一次流结果

python、pandas

对于每1秒出现的每条记录，都将调用strategy1方法。我试图每5分钟打印一次"ltt“列的5分钟平均值。但是在下面的代码中，每1秒就可以看到打印。有人能给我建议一下怎么做吗。流输入，即记录必须每1秒捕获一次，只有打印必须每5分钟完成一次。 import pandas as pd def strategy1(record): global datalist datalist.append(record) pandas_df = pd.DataFrame(datalist) pandas_df['ltt'] = pd.to_datet

浏览 5提问于2022-11-09得票数 0

1回答

子句并在查询中包含非聚合列。

mysql、sql

我在显示这个查询和按查询分组时遇到了一些问题。不管我用什么方法处理这个组，我都会继续犯同样的错误。任何帮助都是非常感谢的。当前正在获取此错误：错误: SELECT list的表达式#2不按子句分组，包含非聚合列“myData.stateName”，该列在功能上不依赖于逐个子句中的列；这与sql_mode=only_full_group_by不兼容这里是我的sql: SELECT stateAbv, stateName, '' AS cityName, count(*) AS state_count from myData GROUP BY sta

浏览 0提问于2019-05-24得票数 1

回答已采纳

3回答

更改列中的所有第一个值，从其他列分组

python、pandas、dataframe、group-by、pandas-groupby

我有两列-- _a，_b。 import numpy as np import pandas as pd df = pd.DataFrame({'_a':[1,1,1,2,2,3,3],'_b':[3,4,5,3,3,3,9]}) df _a _b 0 1 3 1 1 4 2 1 5 3 2 3 4 2 3 5 3 3 6 3 9 我需要将列_b中的第一个值更改为0，按列_a分组，如下所示： _a _b 0 1 0 1 1 4 2 1 5 3 2 0

浏览 2提问于2018-05-20得票数 1

回答已采纳

1回答

熊猫统计离群点的识别:群和个别栏

python、pandas、pandas-groupby、stdev

我试图了解如何识别统计异常值，我将发送到电子表格。我需要按索引对行进行分组，然后为特定的列查找stdev，任何超过stdev的内容都将用于填充电子表格。 df = pandas.DataFrame({'Sex': ['M','M','M','F','F','F','F'], 'Age': [33,42,19,64,12,30,32], 'Height': ['163','167','184'

浏览 7提问于2017-08-28得票数 4

回答已采纳

1回答

pandas groupby索引值

python、pandas

可以按索引标签(而不是列标签)分组吗？这看起来应该是微不足道的，所以也许我遗漏了什么。 import pandas as pd import numpy as np df = pd.DataFrame([['a', 'b', 'c'], ['a', 'a', 'b'], ['b', 'b', 'c']], index=['q

浏览 0提问于2016-04-30得票数 0

4回答

SQL按1列分组，但包括其他列的前1列。

sql、sql-server、tsql、group-by

我试图构建一个SQL查询，其中我按1列分组，但也包括来自每个组中任意记录的其他列的值。所以，就像 SELECT BoxNo FROM MuffinData WHERE FrostingTimeApplied >= CONVERT(date, GETDATE()) GROUP BY BoxNo 但是在结果中包括来自MuffinType、FrostingType列的一些值(我知道每个框中只有一个MuffinType和FrostingType值)。

浏览 3提问于2015-03-24得票数 0

回答已采纳

2回答

高效地对字形进行分组

algorithm、hash、hashtable、grouping、anagram

我正在尝试写一个程序，它将把所有的字形组合在一个列表中，并且输出必须按字母顺序排序。我已经有了一个按字母顺序对输入进行排序的程序，它使用heapsort在O(nlog(n))时间内完成。我的程序也对字谜进行分组，但是它太慢了。我相信使用散列将提供一个有效的算法，但不太确定如何实现它。有没有人对完成这项任务的有效算法有任何建议？例如：输入： eat tea tan ate nat bat 输出： ate eat tea bat nat tan

浏览 0提问于2015-09-28得票数 1

1回答

Laravel / Postgres -如何按一列分组并选择多列？

php、laravel、postgresql、query-builder

例如，我有： DB::table('users')->select('name', 'phone', 'age')->groupBy('age')->... 如何完成此查询工作？问题是postgres不能只按mysql这样的列进行分组

浏览 7提问于2022-05-19得票数 0

1回答

Pandas DataFrame中的多步聚合

python、python-3.x、pandas

在Pandas中，如何在同一个数据集中进行多步/顺序聚合？好像每个步骤都是下一个步骤的“子查询”。在SQL中，我可以这样想： SELECT x.A, COUNT(x.B) as B_COUNT, SUM(x.C_SUM) as C_SUM FROM ( SELECT df.A, df.B, SUM(df.C) as C_SUM FROM df GROUP BY df.A, df.B ) x GROUP BY x.A 在Python3.4和Pandas0.19.2中工作，我有这样一个数据框架： import pandas import numpy numpy.rand

浏览 0提问于2016-12-30得票数 1

回答已采纳