先说大致的结论(完整结论在文末): 在语义相同,有索引的情况下:group by和distinct都能使用索引,效率相同。 在语义相同,无索引的情况下:distinct效率高于group by。...rows in set (0.01 sec) DISTINCT 关键词用于返回唯一不同的值。...如果列具有NULL值,并且对该列使用DISTINCT子句,MySQL将保留一个NULL值,并删除其它的NULL值,因为DISTINCT子句将所有NULL值视为相同的值。...因为group by和distinct近乎等价,distinct可以被看做是特殊的group by。 在语义相同,无索引的情况下: distinct效率高于group by。...但从Mysql8.0开始,Mysql就删除了隐式排序,所以,此时在语义相同,无索引的情况下,group by和distinct的执行效率也是近乎等价的。
在MySQL数据库中,经常会遇到需要对数据进行分组和去重的情况。为了达到这个目的,我们通常会使用GROUP BY和DISTINCT这两个关键字。虽然它们都可以用于去重,但是它们具有不同的用法和效果。...本文将详细解析MySQL中的GROUP BY和DISTINCT的用法,并比较它们对同一字段的去重效果是否相同。...从上面的两个查询可以看出,Distinct和Group By的效果是相同的,都能够去除重复的字段值。然而,它们之间存在一些细微的差异。...结论通过本文的介绍,我们了解了Mysql中的Group和Distinct的用法,并对它们进行了比较和对比。Group By关键字用于将结果集按照指定的字段进行分组,适用于分组计算和聚合操作。...Distinct关键字用于去除结果集中重复的字段值,适用于单个字段的去重操作。在对同一字段进行去重时,Group By和Distinct的效果是相同的。Group By还可以用于多个字段的分组操作。
注:由于执行sql进行修改的方法在重启mysql后会失效,所以本文仅介绍通过修改配置文件从而永久解决该问题的办法 在MYSQL中通过GROUP BY查询数据时报错如下 [Err] 1055 - Expression...=only_full_group_by 如下图: 在Navicat中或是登录mysql,通过sql_mode查询支持的语法: select @@sql_mode; 结果如下: ONLY_FULL_GROUP_BY...应该支持的sql语法,对数据的校验等 解释:ONLY_FULL_GROUP_BY: 对于GROUP BY聚合操作,如果在SELECT中的列,没有在GROUP BY中出现,那么将认为这个SQL是不合法的...,因为列不在GROUP BY从句中 因为有only_full_group_by,所以我们要在MySQL中正确的使用group by语句的话,只能是select column1(只能是一个字段) from...tb1 group by column1(即只能展示group by的字段,其他均都要报1055的错,如下图) 我们需要修改sql_mode,Linux中的操作如下: 修改根目录中的/etc
第 2 步,如果 e1 字段值对应的记录在临时表中已经存在,执行 count(i1) 函数得到当前分组新计数,然后把分组新计数更新到临时表。...第 3 步,如果 e1 字段值对应的记录在临时表中还不存在,执行 count(i1) 函数初始化分组计数,然后把 e1 字段值和分组计数插入到临时表中。...如果写入失败,说明临时表中已经有该 i1 字段值对应的记录了,此时,写入失败的错误会被忽略,因为这正是我们想要的结果:对 i1 字段值去重。...总结 第 2 小节,列出了 MySQL 使用临时表的部分场景,这些场景反正也记不住,就不用记了,了解下就好。...对于 group by,临时表中会写入存储引擎返回给 server 层的所有字段,写入临时表的字段内容,可能是字段值,也可能是聚合函数基于字段值计算的结果;对于 distinct,临时表中会写入聚合函数中的字段
本文我们一起来探寻 MySQL 使用索引实现 group by 的过程,使用临时表实现 group by 会单独用一篇文章来介绍。 本文内容基于 MySQL 5.7.35 源码。...引言 使用索引实现 group by,最简单的方式,大概就是这样了: 存储引擎按顺序一条一条读取记录,返回给 server 层。 server 层判断记录是否符合 where 条件。...分组计数(字段值不为 NULL 才进行计数) if (!...在读取数据时,min()、max() 用 group by 字段值作为分组前缀;count(distinct)、sum(distinct)、avg(distinct) 用 group by 字段值 +...为此,MySQL 祭出了一个大招,既要和紧凑索引扫描一样顺序读取数据,又要用松散索引扫描自带的去重能力。
对于add column,会将历史为null的值刷成default指定的值。 而对于modify column,只会对新数据产生影响,历史数据仍然会保持为null。...结论: 1. add column和modify column在default的语义上存在区别,如果想修改大表历史数据的值,建议给一个新的update语句(不管是add column还是modify column...即使指定了default的值,如果insert的时候强制指定字段的值为null,入库还是会为null 3....结论:mysql 的默认值只有在insert语句中没有这个字段时才会生效,如果insert中有插入该字段而该字段取值又为null,null值将被插入到表中,默认值此时失效。...本篇文章如有帮助到您,请给「翎野君」点个赞,感谢您的支持。 首发链接:https://www.cnblogs.com/lingyejun/p/17581523.html
PS4: 如果大家觉得我写的不好,给大家介绍一个mysql学习的网站unoob.com ,这个网站有队mysql的基本入门介绍,且分类,示例都做的比较好。(我也是在上面学习的哈哈哈哈)。...想要实现类似于:“name字段去重,对于重复值取分数最高”这种效果需要自己实现,distinct不可以。...group by group by语句可以实现对数据以一列或者多列进行分组,例如可以使用group by实现distinct的功能。...select name from record group by name 而在实际使用过程中,group by 语句经常和函数(求和,求均值,计数等)一起使用,(毕竟如果分组不是为了统计,那将毫无意义...即: //错误语句 select name,score from record group by name; 会报错。
②获得表中行组的和 ③找出表列(或所有行或某些特定的行)的最大值、最小值和平均值 聚集函数(aggregate function):运行在行组上,计算和返回单个值的函数(MySQL还支持一些列的标准偏差聚集函数...子句保证只统计某个指定列的数值; PS:利用标准的算数操作符,所有聚集函数都可用来执行多个列上的计算(sum()函数忽略列值为null的行) 6、distinct与聚集函数 MySQL5.0.3以及之后的版本...products表中items的数目、price的最高、最低以及平均值) PS:在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名;这样便于使用SQL更加容易和理解,以及排除方便排除错误。...二、分组数据 1、group by创建分组 在MySQL中,分组是在select语句中的group by子句中建立的,比如: select vend-id,count(*) as num_prods from...products group by vend_id; 这条SQL语句指定了2个列,group by指示MySQL按照vend_id排序并且分组(如果使用group by,则不必指定要计算的每个组) group
然后我们用MySQL,再执行前面那句错误的代码: 也就是: SELECT * FROM stud GROUP BY saddress; 我们看结果: ?...其实这个结果是不对,但是MySQL应该是兼容了这个错误! 而DOS却是严格按照SQL的语法来的。...; select a,max(a) from table_name group by a,b,c; 以下语句则是错误的: select a,b,c from table_name group by a,...b; select a,b,c from table_name group by a; 而因为MySQL的强大,它兼容了这个错误!!!...但是在DOS是不能的。所以出现了DOS下报错,而在MySQL中能够查找的情况(其实这个查找的结果是不对的)。
有时看了一下规律,是这样的他有一个字段区分度还是很低的 所以说吧区分度低的放在后面区分度高的放在前面。...由于联合索引的是先以 前面的排序在根据后面的排序所以说将区分度高的放在前面会减少扫描行数增加查询效率 但是最重要的问题来了,我就要提交SQL的时候 leader 问了一句我,你这边的话这个数据字段 默认值为...我说是的默认值为 null(按照规定这玩意是不能null 的 应该 not null的,但是是历史数据 我这变也没改(其实这两个字段也是我之前实习的时候加的)),于是她说这样的话索引会失效, 于是我就在想为什么啊...B+树 不能存储为null值的字段吗。想想也是啊 为null 值这个key 怎么建立啊,怎么进行区分呢?...所以说这个null值一定是加到B+ 树里面了 但是这个就会哟疑问了 索引的key值为null值在B+树是怎么存储着呢 ???
将较大的表放在inner join操作符的右侧,可以提高查询效率,执行速度快,不容易出现计算内存溢出错误。...正确写法 A join B on A.key=B.key ; 错误写法 from A ,B where A.key=B.key ; 下面写法在mysql/oracle等价于内连接,但是在Hive中会导致笛卡尔积...07 distinct与group by的区别「计数场景」 在去重计数场景中,我们经常应用count(distinct)来进行处理;有时也会先在内层通过group by聚合,然后再在外层计数count(...原理:distinct需要将col列中的全部内容都存储在一个内存中,可以理解为一个hash结构,key为col的值,最后计算hash结构中有多少个key即可得到结果。...需要将所有不同值存储在一起,内存消耗较大。 优点:时间复杂度低,适用于中小数据量级。
介绍使用索引、临时表 + 文件排序实现 group by,以及单独介绍临时表的三篇文章中,多次以 count(distinct) 作为示例说明。...回到正题,MySQL 使用 MEMORY 引擎临时表实现 count(distinct) 的去重功能时,玩出了新花样,所以,还是值得写一下的。背景说明到此为止,我们快快开始。...i1) from t_group_by group by e1 在调试过程中,我给 t_group_by 表的 e1 字段建了索引,所以 SQL 执行时就不需要先对表中记录进行排序了。...从 t_group_by 表读取一条记录之后,i1 字段值作为新结点的数据插入到红黑树中,然后回到第 1 步继续执行。...第 3 小节,以循序渐进的方式介绍了 MySQL 为什么选择使用红黑树实现 count(distinct) 的去重功能。
. mysql -> DAYNAME(DATE) doris -> DAYNAME(DATE) 返回日期的工作日索引值. mysql -> dayofweek(DATETIME date) doris...(从1开始计数)。...该函数是类似于 sum() 的聚合函数,group_concat 将结果集中的多行结果连接成一个字符串. mysql -> group_concat(VARCHAR str[, VARCHAR sep...length(VARCHAR str) 返回 substr 在 str 中出现的位置(从1开始计数). mysql -> locate(VARCHAR substr, VARCHAR str[, INT...COUNT(DISTINCT col) 结果的近似值聚合函数. ps:对比COUNT与DISTINCT组合使用效率更高 mysql -> COUNT(DISTINCT expr,[expr...])
如果没有非空值,则返回 NULL。 完整的语法如下所示: GROUP_CONCAT([DISTINCT] expr [,expr ...]...如果计数 count 为正,则返回从左到右 count 个子串。如果计数为负数,则返回从右边到左 count 个子串。...', -2); -> 'mysql.com' 3.日期和时间函数 NOW() 返回当前日期时间。 如果 fsp 参数指定从0到6的秒精度,则返回值包含该位数的秒小数部分。...DISTINCT 选项可用于返回 expr 的不同值的平均值。 如果没有匹配的行或 expr 为NULL,AVG() 返回 NULL。...SUM() 返回 expr 的和。DISTINCT 关键字能用于对 expr 中不同的值求和。 如果没有匹配的行或 expr 为 NULL,SUM() 返回 NULL。
一、聚合函数(aggregation function)—也就是组函数 在一个行的集合(一组行)上进行操作,对每个组给一个结果。...常用的组函数: AVG([distinct] expr) 求平均值 COUNT({*|[distinct] } expr) 统计行的数量 MAX([distinct] expr) 求最大值 MIN([distinct...] expr) 求最小值 SUM([distinct] expr) 求累加和 ①每个组函数接收一个参数 ②默认情况下,组函数忽略列值为null的行,不参与计算 ③有时,会使用关键字distinct...列):返回列值非空的、并且列值不重复的行的数量 mysql> select count(distinct salary) from salary_tab; +---------------------...2、GROUP_CONCAT()函数 函数的值等于属于一个组的指定列的所有值,以逗号隔开,并且以字符串表示。
一、聚合函数(aggregation function)---也就是组函数 在一个行的集合(一组行)上进行操作,对每个组给一个结果。...常用的组函数: AVG([distinct] expr) 求平均值 COUNT({*|[distinct] } expr) 统计行的数量 MAX([distinct] expr) 求最大值 MIN([distinct...] expr) 求最小值 SUM([distinct] expr) 求累加和 ①每个组函数接收一个参数 ②默认情况下,组函数忽略列值为null的行,不参与计算 ③有时,会使用关键字distinct...列):返回列值非空的、并且列值不重复的行的数量 mysql> select count(distinct salary) from salary_tab; +---------------------...2、GROUP_CONCAT()函数 函数的值等于属于一个组的指定列的所有值,以逗号隔开,并且以字符串表示。
例如select distinct a,b from t order by c;是错误的。但MySQL和mariadb又在这里进行了扩展,它们的排序列允许非select_list中的列。...假如DISTINCT消除了部分列的重复值,最终将只返回一条重复记录,而如果使用非select_list的列排序,将要求返回一条重复记录的同时还要返回每个重复值对应的多条记录以便排序,而在要求范式的关系表中是无法整合这样的结果...1.9 关于标准SQL的GROUP BY 如果让我给SQL语句的逻辑执行顺序划分为两段式,我会将"三八线"划在GROUP BY这里。...关于GROUP BY,有以下两个问题: 1.为什么分组之后涉及到对组的操作时只允许返回标量值? 标量值即单个值,比如聚合函数返回的值就是标量值。...假如先执行DISTINCT去重再执行OVER,那么去重后再对具有唯一值的列(或多列)进行开窗就没有任何意义。
本篇主要介绍mysql的聚合函数和group by的使用,最后是OJ题目的练习。...聚合函数 MySQL中的聚合函数用于对数据进行计算和统计,常见的聚合函数包括下面列举出来的聚合函数: 函数 说明 COUNT([DISTINCT] expr) 返回查询到的数据的数量...] expr) 返回查询到的数据的最大值,不是数字没有意义 MIN([DISTINCT] expr) 返回查询到的数据的最小值,不是数字没有意义 对于上面所列举出来的聚合函数,下面我们通过一些案例来进行对聚合函数的运用...distinct select distinct count(distinct math) from exam_result; 统计数学成绩总分 select sum(math) from exam_result...不要单纯的认为只有在磁盘上表结构导入到mysql,真实存在的表才叫做表,中间筛选出来的包括最终结果全部都是逻辑上的表,可以理解为mysql一切皆为表。
领取专属 10元无门槛券
手把手带您无忧上云