专栏首页王磊的博客MySQL为Null会导致5个问题,个个致命!

MySQL为Null会导致5个问题,个个致命!

在正式开始之前,我们先来看下 MySQL 服务器的配置和版本号信息,如下图所示:

“兵马未动粮草先行”,看完了相关的配置之后,我们先来创建一张测试表和一些测试数据。

-- 如果存在 person 表先删除
DROP TABLE IF EXISTS person; 

-- 创建 person 表,其中 username 字段可为空,并为其设置普通索引
CREATE TABLE person (
	id INT PRIMARY KEY auto_increment,
	name VARCHAR(20),
	mobile VARCHAR(13),
	index(name)
) ENGINE='innodb';

-- person 表添加测试数据
insert into person(name,mobile) values('Java','13333333330'),
	('MySQL','13333333331'),
	('Redis','13333333332'),
	('Kafka','13333333333'),
	('Spring','13333333334'),
	('MyBatis','13333333335'),
	('RabbitMQ','13333333336'),
	('Golang','13333333337'),
	(NULL,'13333333338'),
	(NULL,'13333333339');
  
select * from person;

构建的测试数据,如下图所示:

有了数据之后,我们就来看当列中存在 NULL 值时,究竟会导致哪些问题?

1.count 数据丢失

当某列存在 NULL 值时,再使用 count 查询该列,就会出现数据“丢失”问题,如下 SQL 所示:

select count(*),count(name) from person;

查询执行结果如下:

从上述结果可以看出,当使用的是 count(name) 查询时,就丢失了两条值为 NULL 的数据丢失。

解决方案

如果某列存在 NULL 值时,就是用 count(*) 进行数据统计。

扩展知识:不要使用 count(常量)

阿里巴巴《Java开发手册》强制规定:不要使用 count(列名) 或 count(常量) 来替代 count(),count() 是 SQL92 定义的标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关。 说明:count(*) 会统计值为 NULL 的行,而 count(列名) 不会统计此列为 NULL 值的行。

2.distinct 数据丢失

当使用 count(distinct col1, col2) 查询时,如果其中一列为 NULL,那么即使另一列有不同的值,那么查询的结果也会将数据丢失,如下 SQL 所示:

select count(distinct name,mobile) from person;

查询执行结果如下:

数据库的原始数据如下:

从上述结果可以看出手机号一列的 10 条数据都是不同的,但查询的结果却为 8。

3.select 数据丢失

如果某列存在 NULL 值时,如果执行非等于查询(<>/!=)会导致为 NULL 值的结果丢失。 比如以下这个数据:

我需要查询除 name 等于“Java”以外的所有数据,预期返回的结果是 id 从 2 到 10 的数据,但当执行以下查询时:

select * from person where name<>'Java' order by id;
-- 或
select * from person where name!='Java' order by id;

查询结果均为以下内容:

可以看出为 NULL 的两条数据凭空消失了,这个结果并不符合我们的正常预期。

解决方案

要解决以上的问题,只需要在查询结果中拼加上为 NULL 值的结果即可,执行 SQL 如下:

select * from person where name<>'Java' or isnull(name) order by id;

最终的执行结果如下:

4.导致空指针异常

如果某列存在 NULL 值时,可能会导致 sum(column) 的返回结果为 NULL 而非 0,如果 sum 查询的结果为 NULL 就可以能会导致程序执行时空指针异常(NPE),我们来演示一下这个问题。

首先,我们先构建一张表和一些测试数据:

-- 如果存在 goods 表先删除
DROP TABLE IF EXISTS goods; 

-- 创建 goods 表
CREATE TABLE goods (
	id INT PRIMARY KEY auto_increment,
	num int
) ENGINE='innodb';

-- goods 表添加测试数据
insert into goods(num) values(3),(6),(6),(NULL);

select * from goods;

表中原始数据如下:

接下来我们使用 sum 查询,执行以下 SQL:

select sum(num) from goods where id>4;

查询执行结果如下:

当查询的结果为 NULL 而非 0 时,就可以能导致空指针异常。

解决空指针异常

可以使用以下方式来避免空指针异常:

select ifnull(sum(num), 0) from goods where id>4;

查询执行结果如下:

5.增加了查询难度

当某列值中有 NULL 值时,在进行 NULL 值或者非 NULL 值的查询难度就增加了。

所谓的查询难度增加指的是当进行 NULL 值查询时,必须使用 NULL 值匹配的查询方法,比如 IS NULL 或者 IS NOT NULL 又或者是 IFNULL(cloumn) 这样的表达式进行查询,而传统的 =、!=、<>... 等这些表达式就不能使用了,这就增加了查询的难度,尤其是对小白程序员来说,接下来我们来演示一下这些问题。

还是以 person 表为例,它的原始数据如下:

错误用法 1:

select * from person where name<>null;

执行结果为空,并没有查询到任何数据,如下图所示:

错误用法 2:

select * from person where name!=null;

执行结果也为空,没有查询到任何数据,如下图所示:

正确用法 1:

select * from person where name is not null;

执行结果如下:

正确用法 2:

select * from person where !isnull(name);

执行结果如下:

推荐用法

阿里巴巴《Java开发手册》推荐我们使用 ISNULL(cloumn) 来判断 NULL,原因是在 SQL 语句中,如果在 null 前换行,影响可读性;而 ISNULL(column) 是一个整体,简洁易懂。从性能数据上分析 ISNULL(column) 执行效率也更快一些。

扩展知识:NULL 不会影响索引

细心的朋友可能发现了,我在创建 person 表的 name 字段时,为其创建了一个普通索引,如下图所示:

然后我们用 explain 来分析查询计划,看当 name 中有 NULL 值时是否会影响索引的选择。

explain 的执行结果如下图所示:

从上述结果可以看出,即使 name 中有 NULL 值也不会影响 MySQL 使用索引进行查询。

总结

本文我们讲了当某列为 NULL 时可能会导致的 5 种问题:丢失查询结果、导致空指针异常和增加了查询的难度。因此在最后提倡大家在创建表的时候尽量设置 is not null 的约束,如果某列确实没有值,可以设置空值('')或 0 作为其默认值。

最后:大家还有因为 NULL 而造成的各种坑吗?欢迎评论区补充留言。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • kafka版本不一致导致的一个小问题(二)

    我是攻城师
  • CMS收集器中两个致命的问题

    入门小站
  • 安装多个jdk导致eclipse打不开问题

    本来使用的是jdk1.8,由于其他原因需要使用jdk1.6,在安装完jdk1.6后打开eclipse就会报错: Version 1.6.0_43 of the...

    布禾
  • 领导绝对会问的5个安全问题

    安全主管要汇报给董事会一些他们关心的、对他们有意义的事。除了个人的喜好和担忧之外,董事会通常还关心三件事:

    FB客服
  • 一个奇怪的问题,pw导出格式导致的DB2错误

    使用powerdesigner设计好数据库,在生成语句的时候,默认会给字段加上双引号,如果使用数据库工具(我用的dbvis)连接该新建的表,是看不到字段是引号的...

    西门呀在吹雪
  • Google Fonts导致WordPress 速度问题的三个解决方案

    本来实在是不想写这个的,因为相关方法在圈子里面已经烂大街了。但无奈,一些客户将近期的Google Fonts导致 WordPress 打开速度慢的现象归咎于我的...

    Jeff
  • 观点 | 特朗普的《AI 倡议》存在一个致命问题

    雷锋网 AI 科技评论按:Oren Etzioni 是艾伦人工智能研究所的 CEO ,兼华盛顿大学艾伦计算机科学学院的教授。针对特朗普不久前签署的《美国人工智能...

    AI科技评论
  • 一个正则表达式导致 CPU 高的问题排查过程

    这篇文章记录一个正则表达是导致 CPU 高的问题排查。由于无法直接使用线上的代码测试,所以我自己把代码整理了下来,具体代码如下:

    付威
  • 一个简单的MySQL参数导致的连接问题解惑(r7笔记第33天)

    最近在做一套MySQL环境的数据迁移,需要把一部分数据从一个站点迁移到另外一个站点,新站点是一套全新的环境,对于MySQL的安装采用了同事建议的 二进制方式。当...

    jeanron100

扫码关注云+社区

领取腾讯云代金券