Pandas按多列分组，多列列表_Pandas -按多列分组并保留多列-_按多列分组 - 腾讯云开发者社区

、、

我正在尝试使用groupby中的两个变量来计算多列的标准差。然而，我的代码抛出了一个错误，我很难找出它。我正在使用https://www.shanelynn.ie/summarising-aggregation-and-grouping-data-in-python-pandas/作为指南。以下是示例数据帧： Book Home Num Pointspread odds A P -135 -2.5 -110.0 B P NaN -3 -101.0 B P NaN -3

浏览 8提问于2019-04-08得票数 1

回答已采纳

15回答

如何在pandas groupby中将数据帧行分组到列表中

、、、、

我有一个熊猫数据框df，如下所示： a b A 1 A 2 B 5 B 5 B 4 C 6 我想按第一列进行分组，并将第二列作为行中的列表 A [1,2] B [5,5,4] C [6] 有没有可能用pandas groupby做这样的事情？

浏览 173提问于2014-03-06得票数 413

回答已采纳

1回答

SQL SELECT，按

如果我开始按一列分组，为什么我必须将所有选定的列分组？例如，为什么我就不能只有两组呢？详情如下： SELECT A, B, C, D FROM MYTB GROUB BY A, B

浏览 3提问于2014-10-30得票数 0

回答已采纳

1回答

Laravel :如何使用模型之外的数据创建groupBy运行和使用where克劳斯

、、

我有以下这些模型: season： public function club() { return $this->hasMany('App\Models\Club'); } 俱乐部： public function season() { return $this->belongsTo('App\Models\Season' ,'season_id'); } public function league() { return $this->be

浏览 7提问于2021-05-24得票数 0

回答已采纳

1回答

熊猫群具有lambda参数

、、

我不明白密码： pivot = pd.pivot_table(subset, values='count', rows=['date'], cols=['sample'], fill_value=0) by = lambda x: lambda y: getattr(y, x) grouped = pivot.groupby([by('year'),by('month')]).sum() 代码中的subset是一个DataFrame，它有一个名为“date”的列(例如，2013-02-04:20:49.6342

浏览 2提问于2016-08-20得票数 0

回答已采纳

2回答

如何在多把钥匙上使用熊猫石斑鱼？

、

我需要通过datetime列和另一个str(object)列来转换一个dataframe，以便按组应用函数，并将结果分配给组的每个行成员。我理解，但不能同时为这两个条件创建一个pandas.Grouper。因此：如何在多列上使用pandas.Grouper？

浏览 6提问于2018-09-05得票数 16

回答已采纳

3回答

根据特定列的值对3列数据帧进行分组，以创建字典列表

、、、

我是Python Pandas的新手，有一个关于使用Pandas、Dataframe、groupby和filters的问题。以下是我的示例数据帧： data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5', 'A6'], 'B': ['B1', 'B2', 'B3', 'B3', 'B4', 'B5'], '

浏览 11提问于2020-12-07得票数 2

1回答

pandas按字符串列表分组

、、

想象一下，如果您有一个字符串列表和一个pandas数据帧，其中有一个列Foo，其中包含可能包含这些字符串的单词： my_list = ['A', 'B', 'C'] df‘’Foo‘包含包含'A’、'B‘或'C’的单词，您可以提取包含by df.Foo.str.contains(my_list[0])等的行，但是否可以按与列表匹配的行进行分组？因此groupby应该是包含'A‘、'B’或'C‘的

浏览 5提问于2016-10-07得票数 0

2回答

是否有一种方法可以对Pandas中的两列进行逻辑比较？

、

我有一个具有以下结构的dataframe： <class 'pandas.core.frame.DataFrame'> Int64Index: 1152 entries, 0 to 143 Data columns: cuepos 1152 non-null values response 1152 non-null values soa 1152 non-null values targetpos 1152 non-null values testorientati

浏览 6提问于2012-11-15得票数 1

回答已采纳

2回答

熊猫按习俗分类

、、、、

这应该很简单。我想要的是根据函数的结果进行分组的能力，就像在SQL中一样，您可以按表达式进行分组： SELECT substr(name, 1) as letter, COUNT(*) as count FROM table GROUP BY substr(name, 1) 这将计算以字母表中的每个字母开头的name列的行数。我希望在python中也这样做，所以我假设我可以将一个函数传递给groupby。但是，这只会将索引列(第一列)传递给函数，例如0、1或2。 import pandas # Return the first letter def first_letter(row):

浏览 6提问于2015-12-09得票数 4

回答已采纳

1回答

分组和ILOC错误

、

当我尝试按特定列进行groupby和sum by dataframe时，我会得到以下错误。 ValueError: Grouper for '<class 'pandas.core.frame.DataFrame'>' not 1-dimensional 我检查了其他解决方案，这不是双列名称标题问题。请参阅下面的df3，除最后两列外，我希望对所有列进行分组，我想要sum()。 dfs head显示，如果我只是按列名称分组，它可以正常工作，但不适用于iloc，因为我知道iloc是我想要分组的正确公式。我需要使用ILOC作为最终的dataframe将

浏览 7提问于2022-11-08得票数 1

回答已采纳

3回答

Seaborn groupby pandas系列

、、

我想要将我的数据可视化到箱形图中，这些箱形图按我可怕的图中显示的另一个变量进行分组：所以我要做的是使用pandas系列变量来告诉pandas我有分组的变量，所以这就是我要做的： import pandas as pd import seaborn as sns #example data for reproduciblity a = pd.DataFrame( [ [2, 1], [4, 2], [5, 1], [10, 2], [9, 2], [3, 1] ]) #converting second column to Series a.ix[:,1] = pd.Series

浏览 0提问于2014-08-13得票数 4

回答已采纳

1回答

如何用groupby方法表示数据的平均值

、、、

我想在一个DataFrame中对我的变量做一个平均值，其中我已经将元素按列'A‘分组了。问题是，当我打印结果时，输出只是第一个变量列的平均值，为什么要这样做呢？ (B)编码； import pandas as pd file = open('C:/Users/Andre/Desktop/Python/introduction-datascience-python-book-master/files/ch03/adult.data', 'r') def chr_int(a): if a.isdigit(): return int(a)

浏览 0提问于2020-05-07得票数 1

回答已采纳

1回答

熊猫按日期分组，有子类别和总数

、

我有一个像这样的数据文件： Date Category1 Cat2 Cat3 Cat4 Value 0 2021-02-02 4310 0 1 0 1082.00 1 2021-02-03 5121 2 0 0 -210.82 2 2021-02-03 4310 0 0 0 238.41 3 2021-02-12 5121 2 2 0 -1489.11 4

浏览 8提问于2022-02-22得票数 0

2回答

使用[groupby]时中间列的Python Pandas排序

、

我正在使用python pandas，并希望根据下表的中间列对输出进行排序(我已经显示了我正在获得的输出和我想要获得的输出)。我在pandas中使用groupby函数来获得输出，但是它是按计数列排序的(参见下面的输出表)，而我想要按YOB列排序(请参见所需的输出表)。另外，我如何计算每个国家的平均出生年份？ import pandas as pd xlpath= "C:/Users/Username/documents/Datafile.xlsx" df = pd.read_excel(eval('xlpath')) y = df.groupby(&

浏览 20提问于2019-10-14得票数 0

回答已采纳

1回答

python中的mean()函数是否创建了一个列表？

、、、

我看到了一段代码，它使用另一列作为groupby()函数的组为列进行groupby()计算。我想知道total_acc_avg[6]是什么意思。 total_acc_avg是一个列表吗？6是列表的索引吗？ import pandas as pd data = pd.DataFrame({'mort_acc':[6, None, 3, None, 2, None, 9, 8], # Create pandas DataFrame 'x2':range(11, 19),

浏览 9提问于2022-12-04得票数 -2

6回答

如何在非唯一列中按日期对pandas DataFrame条目进行分组

、

Pandas DataFrame包含名为"date"的列，该列包含非唯一的datetime值。我可以使用以下命令对此帧中的线条进行分组： data.groupby(data['date']) 但是，这将按datetime值拆分数据。我想按“日期”列中存储的年份对这些数据进行分组。展示了如何在将时间戳用作索引的情况下按年分组，但在我的例子中并非如此。如何实现此分组？

浏览 1提问于2012-07-09得票数 94

回答已采纳

1回答

熊猫群

、、、

我想将数据分组到一个dataframe中，我有oo列"Count“和另一列"State”。我想输出一个列表列表，每个子集列表只是每个状态的计数。实例输出：[120,200，40，20，40，.] 120和200对加州来说是很重要的我尝试了以下几点： df_new = df[['State']].groupby(['Count']).to_list() 我收到一个键错误：“计数” 回溯： Traceback (most recent call last): File "C:\Users\Michael\workspace\UCII

浏览 3提问于2015-08-09得票数 0

回答已采纳

1回答

按索引分组表或列表列表

、、

如何用elisp按给定的索引对列表进行分组？这些列表表示表，就像org-table一样，因此每个子列表表示一行，例如。 | a | 1 | 0 | | b | 1 | 1 | | c | 0 | 0 | 会是'((a 1 0) (b 1 1) (c 0 0))。我希望能够将给定的列按另一列分组。因此，例如，将第一列按第三列分组，我希望是'((0 a c) (1 b))，因为第一行和第三行的第三列是0。我尝试了下面的代码，但是它产生了这么多循环。在elisp中是否有分组功能，还是更好的方法？ ;; group column1 by column2 in table (defu

浏览 14提问于2017-04-11得票数 1

回答已采纳

1回答

将pyspark groupedData转换为pandas DataFrame

、、、、

我需要通过Spark分组一个大型数据集，我将其加载为两列的Pandas数据框架，然后重新转换为Pandas:基本上是做Pandas -> 'pyspark.sql.group.GroupedData‘-> Pandas。两列中的元素都是整数，分组后的数据需要以列表的形式存储，如下所示： df.a df.b 1 3 2 5 3 8 1 2 3 1 2 6 ... spark_df = spark.createDataFrame(df

浏览 1提问于2017-08-03得票数 1

1回答

SSRS如何冻结列表中矩阵的列和行

、、

我的SSRS报告目前按预期工作，使用一个矩阵，我使用tablix属性冻结列和行，“滚动时保持标头可见”。现在，我需要通过“EventId”将数据分离到不同的页面上。为此，我将矩阵放在列表中，并将列表设置为EventId上的组。将矩阵放入列表中后，我将得到错误消息。 “该表包含一个表头或列，其固定头设置为真。在其他数据区域内的数据区域不允许这样做。” 如何将矩阵的列和行冻结在列表中？或者有其他方法可以将特定EventId的相关数据分组到不同的页面上？

浏览 3提问于2019-11-15得票数 1

回答已采纳

1回答

是否可以使用nattable group by功能进行排序？

、、

所以我正在考虑一个项目的Nattable，它看起来很棒，但我的一个要求是在多个列上有一个良好的可配置排序，并清楚地显示正在发生的事情，看过组示例后，这是一个很好的功能：你可以把列拖到条形图中，然后按这些值对数据进行分组，这就是我想要的排序方式，即我不想要树的扩展，也不想添加新的行，我只想按我拖动列的顺序对表进行排序。我想知道这在nattable中是否可行，因为与这个分组栏相比，多个列的排序示例比较平淡无奇，所以它能做到吗？

浏览 22提问于2020-05-14得票数 0

1回答

如何用层次指数计算大熊猫的平均数

、

我有一个具有1mi行和分层索引(国家、州、城市，按此顺序)的pandas数据帧，每行都有一个产品的价格观察。我如何计算每个国家、州和城市的均值和标准差(请记住，由于我的df很大，我正在避免循环)？对于每个级别的均值和标准差，我希望将值保存在此数据框中的新列中，以供将来访问。

浏览 16提问于2017-06-23得票数 1

回答已采纳

2回答

带有pandas的列中的行内换行符

、、

在pandas中，有没有办法在一列中分隔一行中的数据？行有多个数据，我的意思是，我按col1分组，结果是我有一个这样的df： col1 Col2 0 1 abc,def,ghi 1 2 xyz,asd and desired output would be: Col1 Col2 0 1 abc def ghi 1 2 xyz asd 谢谢

浏览 96提问于2020-07-17得票数 0

2回答

Pandas将一个列与多个列关联按列的范围分组

、、、

假设我有一个类似于下面的数据帧(实际数据帧有数百万个观测值)，我如何获得信号列和返回列列表之间的相关性，然后按Signal_Up列进行分组？我尝试了pandas corrwith函数，但它没有给出signal_up列的相关分组 df[['Net_return_at_t_plus1', 'Net_return_at_t_plus5', 'Net_return_at_t_plus10']].corrwith(df['Signal_Up'])) 我正在尝试寻找signal列和由signal_up列的不同值分组的

浏览 46提问于2020-03-20得票数 0

回答已采纳

2回答

如何按月份和另一列pandas数据框分组

、、

我有一个数据框，如下所示： import pandas as pd df = pd.DataFrame({'Date':[2019-08-06,2019-08-08,2019-08-01,2019-10-12], 'Name':['A','A','B','C'], 'grade':[100,90,69,80]}) 我想按Datetime中的月份和年份对数据进行分组，也可以按名称进行分组。然后对其他列进行汇总。因此，期望的输出将类似于下面的内容 df = pd.DataFrame

浏览 12提问于2020-08-19得票数 0

1回答

Dask中的基本groupby操作

、、

我正在尝试使用Dask来处理一个大文件(50 gb)。通常，我会将其加载到内存中并使用Pandas。我想按两列"A“和"B”分组，每当"C“列以一个值开头时，我想为那个特定的组重复该列中的值。在熊猫中，我会做以下事情： df['C'] = df.groupby(['A','B'])['C'].fillna(method = 'ffill') Dask中的等价物是什么？此外，我还有点迷惑于如何在Dask中构建问题，而不是在Pandas中，谢谢, 我到目前为止的进展是：第一组索引： df1

浏览 7提问于2016-08-12得票数 3

1回答

在列表视图中插入副标题，SharePoint 2013

我有一个包含80多个数据字段的SharePoint 2013列表。我想在列表视图中插入副标题，这样我就可以按主题对字段进行分组，从而允许用户快速找到他们需要的内容。任何协助都将不胜感激。

浏览 0提问于2016-03-23得票数 0

1回答

pandas数据帧中的函数，用于复制R中的dplyr group_by(多变量)函数

、、、

考虑一下这种情况：在dplyr中： df = df%>% group_by(a,b) %>% 表示数据帧首先按列a分组，然后按b分组。在我的例子中，我尝试先按group_name列、然后按user_name、再按type_of_work对数据进行分组。有三列以上(这就是我感到困惑的原因)，但我需要根据这三个标题以相同的顺序对数据进行分组。在这个阶段之后，我已经有了一个处理列的算法。我只需要一个算法来创建一个根据这三列分组的数据帧。在我的例子中，像dplyr函数一样保留序列是很重要的。我们在pandas data-frame中有类似的东西吗？

浏览 0提问于2017-06-19得票数 1

2回答

熊猫群多列给出奇怪的索引行为

、、、

我有如下数据，有7列。我希望合并列1-6中具有相同值的所有行，并将相应的列-7数据之和。 0.1 0.2 0.3 0.1 0.2 0.3 0.001 0.1 0.2 0.3 0.1 0.2 0.3 0.002 0.9 0.9 0.9 0.1 0.1 0.1 0.002 0.9 0.9 0.9 0.8 0.8 0.8 0.1 0.9 0.9 0.9 0.8 0.8 0.8 0.2 0.1 0.2 0.3 0.1 0.2 0.3 0.001 0.1 0.2 0.3 0.1 0.1 0.1 0.002 0.9

浏览 0提问于2019-06-29得票数 0

回答已采纳

1回答

使用MultiIndex实现数据帧中两个字段的分组和求和

、、、、

我正在尝试做一个GroupBy和Sum，但这有点棘手，因为我认为我需要基于数据框中的两个头来做这件事。我需要在一个特定的数据帧中有两个头，所以我会相应地设置它。 df = pd.read_csv(f, delimiter='\t', skiprows=0, header=[0,1]) 当我列出我的数据框中的所有字段时，我看到了以下内容。 my_list = list(df_append) my_list 然后..。 [('IDRSSD', 'Unnamed: 0_level_1'), ('RCFD3531',

浏览 23提问于2021-01-16得票数 0

回答已采纳

1回答

如何计算pandas多索引DataFrame中的分位数？

、

我有一个pandas多索引DataFrame，我想计算它在特定索引级别上的分位数。最好用一个例子来解释。首先，让我们创建DataFrame： import itertools import pandas as pd import numpy as np item = ('A', 'B') item_type = (0, 1, 2) location = range(5) idx = pd.MultiIndex.from_tuples(list(itertools.product(item, item_type, location)),names=('

浏览 5提问于2016-04-07得票数 5

3回答

我们可以展开pandas列中的列表吗

我有我的熊猫，如下所示。它在其中一列中有一个列表，它可以按如下方式展开吗：？ import pandas as pd L1 = [['ID1', 0, [0, 1, 1] , [0, 1]], ['ID2', 2, [1, 2, 3], [0, 1]] ] df1 = pd.DataFrame(L1,columns=['ID', 't', 'Key','Value']) 这个可以像下面这样展开吗？ import pandas as pd L1 = [['ID1

浏览 3提问于2021-04-30得票数 2

1回答

访问二维列表的元素

、、

我在python中有一个变量列表，我希望能够访问每行和每列中单个值的索引。因为我是python的新手，所以我不知道是否有其他方法可以访问索引或按行和列选择单个值。到目前为止，我找到的唯一方法是使用pandas库，但由于安装过程中出现问题，我无法使用pandas。请告诉我如何创建数据帧(不使用pandas)或任何其他数据结构，以便我可以通过它们的索引，按行和按列访问它的值。假设我有以下列表：(实际上，当我尝试查找数据结构类型时，python说它是一个列表。 (['Name' 'Age' 'Smoking' 'Gr

浏览 2提问于2016-09-04得票数 1

回答已采纳

1回答

尝试使用groupby函数两次，然后找到最大值？

、

我有从1976年到2020年的选举数据，我试图找到每年单独赢得每个州的政党。也就是说，我正在寻找1976年阿拉巴马州的获胜者(如共和党人、民主党人等)。此外，在数据框中，我有候选人的选票和总票数。因此，我试图通过按州分组，按年份分组，然后获得最大票数来找到获胜者并删除其他所有内容来提取每个获胜者。(所以最终的df应该有240个项目)。这有可能吗？到目前为止，这是我的代码:在其中，我得到了键error: state。这不是大小写问题，而且有一列标记为“state”，所以我不确定我做错了什么。 import matplotlib import pandas as pd # import

浏览 10提问于2021-10-12得票数 0

2回答

SQL计数和分组

我的表里有5列 Name, UserID, Depertment, JobCode, Template 我想找到Count(Template) Group By Department and JobCode，但也想选择其他列。我的问题是： Select UserID, Department, JobCode, Template, Count(Template) From MyTable Group By Department, JobCode 获取错误： UserID在选择列表中无效，因为它不在“组按列表”中。

浏览 0提问于2015-02-17得票数 0

1回答

pandas dataframe自动索引禁用

、、、

有没有办法告诉pandas不要按字符列索引？我的代码是 A=['a','b','c'] B=[1,2,3] pd.DataFrame(A,B) 0 1 a 2 b 3 c 我想要的是两列，这样我就可以按A列分组了，我该怎么做呢？我可以这样做，但我想跳过列名，以获得尽可能多的性能。 pd.DataFrame({'A':A,'B':B}) A B 0 a 1 1 b 2 2 c 3

浏览 6提问于2018-02-08得票数 0

回答已采纳

7回答

是否同时对列和索引值对pandas数据帧进行排序？

、、、

按列的值和索引对pandas dataframe进行排序是否可行？如果按列的值对pandas数据帧进行排序，则可以得到按列排序的结果数据帧，但不幸的是，您会看到数据帧的索引顺序与排序列的值相同。那么，我是否可以按列对数据帧进行排序，例如名为count的列，但也可以按索引值对其进行排序？按降序对列进行排序也是可行的，但是按升序对索引进行排序是否可行呢？我知道如何对dataframe中的多个列进行排序，也知道通过首先对索引执行reset_index()并对其进行排序，然后再次创建索引，就可以实现这里所要求的结果。但是，这是不是更直观、更有效的方法呢？

浏览 2提问于2013-11-29得票数 59

2回答

在groupby子句中，错误的含义是什么不能处理非唯一的多个索引？

、、、、

我有一个数据，它有三个级别的索引，我希望计算一个值偏离平均值有多大。但根据我的指数，对于不同的群体，我有不同的平均值。这就是我试过的： In [4]: df['count'].groupby(level=[0,1,2]).apply(lambda x: x-np.mean(x)) 但是，我得到了一个错误，我在下面插入了堆栈跟踪。我不知道为何会有这样的问题。 Exception Traceback (most recent call last) <ipython-input-4-678992689ff2>

浏览 2提问于2016-03-17得票数 8

1回答

熊猫:按值列表排序，类似于从df中按字段排序(id，.)

、、

与Pandas中的SELECT * FROM df WHERE id in (3,1,2) ORDER BY FIELD(id,3,1,2)类似的查询是什么？ list_ids = [3, 1, 2] df[df.id.isin(list_ids)]#.sort_by_field('id', list_ids) afaik .sort_values()只能按数据格式中的列进行排序。注意:我不想按多个/列列表进行排序。我想按照特定的值列表对一列进行排序。

浏览 4提问于2021-02-16得票数 0

回答已采纳

1回答

python pandas为列I group by提供了一个键错误，即使布尔表达式显示该列是数据帧的一部分

、、、、

我似乎无法打印以下行：summarydata["Name"].groupby(["Tag"]).size() 不会得到错误： File "C:\Users\rspatel\untitled0.py", line 76, in <module> print(summarydata["Name"].groupby(["Tag"]).size()) File "C:\Users\rspatel\Anaconda3\lib\site-packages\pandas\core\serie

浏览 0提问于2021-09-20得票数 2

1回答

IgGrid -如何在代码中执行多个分组？

、、、

在我的项目中，我必须创建我自己的多个排序和多个分组对话框。基本上，用户可以选择应该包括哪些列，选择顺序和操作方向。对于多个排序，我使用这个函数，它是有效的 .igGridSorting( "sortMultiple", [exprs:array] ); 现在的问题是分组。有没有类似的函数？我的意思是使用分组表达式的数组(定义要分组的列、分组的顺序和分组的方向(acs / desc))作为参数执行？(此功能由ignite-ui内置对话框支持) 在我找到的文档中： .igGridGroupBy( "groupByColumns" ); 描述是“向group b

浏览 9提问于2018-08-03得票数 3

回答已采纳

2回答

如何使用动态列通过查询创建LINQ组？

、、

我想按数据表按列表中的列进行分组。此外，我想用结果对一列进行求和。如何为此创建动态的linq查询？

浏览 7提问于2022-05-25得票数 -1

1回答

Pandas DataFrame中的多步聚合

、、

在Pandas中，如何在同一个数据集中进行多步/顺序聚合？好像每个步骤都是下一个步骤的“子查询”。在SQL中，我可以这样想： SELECT x.A, COUNT(x.B) as B_COUNT, SUM(x.C_SUM) as C_SUM FROM ( SELECT df.A, df.B, SUM(df.C) as C_SUM FROM df GROUP BY df.A, df.B ) x GROUP BY x.A 在Python3.4和Pandas0.19.2中工作，我有这样一个数据框架： import pandas import numpy numpy.rand

浏览 0提问于2016-12-30得票数 1

回答已采纳

1回答

在Pyspark中，当您groupBy与partitionBy中使用的列相同的列时会发生什么？

、、

我有一个按列ID分区的数据集，并将其写入磁盘。这会导致每个分区在文件系统中获得自己的文件夹。现在我正在读回这些数据，并想先调用groupBy('ID')，然后再调用一个pandas_udf函数。我的问题是，既然数据是由ID分区的，那么groupBy('ID')会比没有分区的数据快吗？例如，使用文件夹结构一次读取一个ID是不是更好？我担心groupBy操作会遍历每条记录，即使它们已经被分区。

浏览 1提问于2019-11-07得票数 0

1回答

熊猫一片片串在一起

、、

我有一个dataframe，我想按ID字段的第一部分进行分组。例如，假设我有以下内容： >>> import pandas as pd >>> df=pd.DataFrame(data=[['AA',1],['AB',4],['AC',5],['BA',11],['BB',2],['CA',9]], columns=['ID','Value']) >>> df ID Value 0 AA 1 1

浏览 1提问于2015-12-30得票数 6

回答已采纳

2回答

组并仅选定列

、、、

这里我读了一个文件"userdata.xlsx"： ID Debt Email Age User 1 7.5 john@email.com 16 John 2 15 john@email.com 15 John 3 22 john@email.com 15 John 4 30 david@email.com 22 David 5 33 david@email.com 22 David 6 51 fred@email.com 61 Fred 7 11 fred@email.com 25 Fred 8

浏览 1提问于2018-12-08得票数 2

回答已采纳

1回答

排除mysql 8.0中的重复项

、、

在升级到MySQL 8.0之前，我以前使用GROUP BY不选择重复项，但现在我得到了： 1055 - SELECT list的表达式#2不是按子句分组，而是包含非聚合列'database.orders.ID‘，它在功能上不依赖于按子句分组的列；这与sql_mode=only_full_group_by不兼容，时间:0.02800s 我知道我可以按以下方式更改mysql模式： mysql -u root -p mysql > SET GLOBAL sql_mode=(SELECT REPLACE(@@sql_mode,'ONLY_FULL_GROUP_BY'

浏览 1提问于2019-03-11得票数 1

回答已采纳

1回答

按两列排序，为什么不先分组呢？

、、、、

我有两列，一列是包含客户姓名的字符串字段customer，另一列是表示销售额的数字字段sales。我想要做的是按客户对数据进行分组，然后在组内对销售进行排序。在SQL或Pandas中，这通常是通过表上的order by customer, sales实现的。但我只是对这个实现很好奇。与其先对customer排序，然后对sales排序，为什么不先对customer进行分组，然后对sales进行排序。我真的不关心不同客户的顺序，因为我只关心同一客户被分组在一起的记录。分组本质上是映射，应该比排序运行得更快。为什么在SQL中没有这样的实现？我是不是遗漏了什么？示例数据name,sales

浏览 13提问于2018-01-03得票数 0