数据库时间出现'0000/00/00',难道我穿越了?

前几天有个朋友遇到一个问题,在做日期类型数据的运算的时候出现了‘0000-00-00’的结果,不得其解。你是否遇到过同样的问题呢?这样一个并不存在的时间点,难道是因为数据库系统穿越了?

问题回顾

在使用ogg同步数据到备库的时候,报ORA-01850的错误,通过logdump发现了很多类似的SQL报错,选取其中一个如下:

select to_char(a.station_time) from sfis1.r_vip_log a where id=486270420;

结果显示:0000-00-00

因为显示结果年份为0,属于不合法的时间格式,因此报错。

说明:在Oracle中,date类型的数据的取值范围是从-4712/12/31到9999/12/31之间,年份不能为0。并且从12.1开始,对于小时和分钟做了更精确的判断。比如来看上面ORA-01850的错误为:

首先尝试不做类型转换,直接查询:

select a.station_time from sfis1.r_vip_log a where id=486270420;

此时输出时间正常。(要说明一点的是,这里输出的时间仍然不对,但涉及的问题跟本文无关,并且是正常的日期格式,所以此处不做深入探究)

这是什么原因?遇到这种问题,我们可能首先会猜,是不是遭遇了bug,那么首先来看数据库版本,是10204,果然是比较低的版本,因此初步猜测是10g的bug。

但这一猜测很快就被否定。

为了验证这是一个bug,Google了一下发现的确有人遭遇类似的问题,我参考一篇文章做了以下测试。(原文链接见:http://www.hellodba.com/reader.php?ID=95&lang=CN)

10204,11204,12201三个版本上分别做了如下测试:

1、当日期类型做减法,刚好减完为0 的时候: select to_date('0001-01-01', 'yyyy-mm-dd')-365 from dual; 2、减完大于0,但减法使得年份为0 select to_date('0001-01-01', 'yyyy-mm-dd')-360 from dual; 3、减完小于0 select to_date('0001/01/01', yyyy/mm/dd') - 900 from dual; 4、查询年份为0时 select date '0000-11-22' from dual; 5、年份小于0时 select date '-4712-11-11' +15 from dual; 6、非闰年遇到2.29 select date '1500-2-28' +2 from dual; select date '1500-2-28' +1 from dual; 7、闰年遇到2.29 select date '1600-2-28' +1 from dual;

第一次测试的结果如下:

结果并不是预期的,有很多奇奇怪怪的输出(当时我深信他们是奇奇怪怪的),并且没有任何一种情况出现全零。这就奇怪了,再次猜测难道那篇帖子是9i 的?

这些输出在我看来没有任何规律可以总结,甚至说,在10g,11g能够正常输出的语句在12.2中不能正常输出而报错的时候,我认为这是非常不科学的。

当我们认定一件事情的时候,如果这件事情不是对的,那么很可能一直把我们带到坑里而不自知。很显然之前关于版本的猜测被推翻了。因为10g中并没有想象中出现全零的状况,而其他的结果虽然可疑,但我并没看出来任何规律。

柳暗花明又一村发生在不久之后。

有朋友看到我的测试结果,表达自己在11g中的测试结果不一样。通过他发的截图,的确又一次出现了全零的错误结果。

也就是说10g中很可能会全零,11g中也可能会。但为什么我没有遇到呢。看着两个全零结果的截图,突然发现两者都是通过plsql developer连接数据库的。这会不会有关系。此时恰好有高人指点,提到终端的显示问题。

之后杨长老对我之前的结果做了反馈,首先对于前两条SQL的输出,我认为是12.2的输出不合理,理由是做了减法反而得到的结果比被减数还大,这不科学。

事实上,对于日期类型,Oracle是可以区分正负的,正数表示公元后,负数表述公元前。只是因为我们在常用的计算中都用到的是正数,所以默认显示的是正数。如果需要显示负数,需要对时间格式加以限制。

接下来我们对以上的测试SQL做逐一的分析。

对于前两条SQL:

我们最初得到的结果如下:

很显然,一眼看去,12.2的输出年份不合理。但如果考虑正负的话,情况就不一样。

我们来测试,首先修改日期显示格式,使其能够显示日期类型的正负。

SQL> alter session set nls_date_format='syyyy-mm-dd hh24:mi:ss';

Session altered.

再次在12.2中执行前两条语句,结果如下:

SQL> select to_date('0001-01-01', 'syyyy-mm-dd')-365 from dual; TO_DATE('0001-01-01' -------------------- -0001-01-02 00:00:00 SQL> select to_date('0001-01-01', 'syyyy-mm-dd')-360 from dual; TO_DATE('0001-01-01' -------------------- -0001-01-07 00:00:00

我们发现,结果为负数,也就是说,计算结果为公元前。并没有问题,只是之前对于时间格式的设置导致数据的正负没有显示出来。

第三条很好理解:本身就不存在为0的年份,因此Oracle会直接报错。

再次查看错误码,发现的确是12.1开始出现的。

结论1:在12.2中以SQLplus登录数据库,会识别日期类型中数据的取值范围,而11g和10g的版本做了普通的运算而未校验结果。

要说明一点的是,这个改变不是12.2是新特性,根据01850和01841错误,判断应该是从12.1就开始有了新的校验机制。因为我手头没有12.1的测试环境,有疑问的同学可以自己再验证一下。

第四条和第五条很有意思。

从逻辑上来讲,1500和1000并不属于闰年,因此2月28加上两天结果应该是3月2日,但此时两个结果都很明显算进去了不存在的2月29日。

这是怎么回事?之前我们对于闰年,闰月,闰秒有过很多的探讨,如果说Oracle不能识别那也不科学,但此时为什么没有显示。

首先在杨老师建议下,我换了一组数据做了测试,将非闰年的选择时间改为1900年。

SQL> select date '1900-2-28' +2 from dual; DATE'1900-2-28'+2 ------------------- 1900-03-02 00:00:00 SQL> select date '1900-2-28' +1 from dual; DATE'1900-2-28'+1 ------------------- 1900-03-01 00:00:00

很显然,这次的结果考虑了闰年的问题。那说明,的确是有一个时间点的划分,在此之前和之后,Oracle的处理方式是不一样的。

通过以下的SQL可以验证:

SQL> select to_date(to_char(rownum * 100) || '-2-28', 'yyyy-mm-dd') + 2 from dual connect by rownum <= 30; TO_DATE(TO_CHAR(ROWN -------------------- 0100-03-01 00:00:00 0200-03-01 00:00:00 0300-03-01 00:00:00 0400-03-01 00:00:00 0500-03-01 00:00:00 0600-03-01 00:00:00 0700-03-01 00:00:00 0800-03-01 00:00:00 0900-03-01 00:00:00 1000-03-01 00:00:00 1100-03-01 00:00:00 1200-03-01 00:00:00 1300-03-01 00:00:00 1400-03-01 00:00:00 1500-03-01 00:00:00 1600-03-01 00:00:00 1700-03-02 00:00:00 1800-03-02 00:00:00 1900-03-02 00:00:00 2000-03-01 00:00:00 2100-03-02 00:00:00 2200-03-02 00:00:00 2300-03-02 00:00:00 2400-03-01 00:00:00 2500-03-02 00:00:00 2600-03-02 00:00:00 2700-03-02 00:00:00 2800-03-01 00:00:00 2900-03-02 00:00:00 3000-03-02 00:00:00

我们看到,对于整百的非闰年年份,做相同的计算,在1600年前后的结果是不一样的。1600之后,才开始识别到底有没有2月29这个日期,之前的年份不做校验。

为什么会这样?

这里跟大家科普一下:

公历是根据罗马人的"儒略历"改编而得。由于当时没有了解到每年要多算出0.0078天的问题,从公元前46年,到16世纪,一共累计多出了10天。为此,当时的教皇格列高利十三世,将1582年10月5日人为规定为10月15日。并开始了新闰年规定。即规定公历年份是整百数的,必须是400的倍数才是闰年,不是400的倍数的就是平年。

简单来说,就是1582之后才有闰年计算标准,因此在上面的测试中,由于1600是闰年,从1700开始的结果是正确的。

结论二:由于闰年的计算标准始于1582年,Oracle对于这个时间点前后的数据处理方式不一样,1582之前的数据,不做闰年校验,默认2月29天;1582之后才开始校验。

当然Oracle在这里也是有点偷懒,认为在1582之前没有这种计算标准,就不做校验是不对的。

接下来的两条SQL,

对于年份小于0的,或者运算之后的年份小于0的,同样是负数,也就是公元前的计时方式。我们通过显示正负号再次验证:

SQL> alter session set nls_date_format='syyyy-mm-dd hh24:mi:ss'; Session altered. SQL> select to_date('0001/01/01','syyyy/mm/dd') - 900 from dual; TO_DATE('0001/01/01' -------------------- -0002-07-16 00:00:00 SQL> select date'-4712-11-11'+15 from dual; DATE'-4712-11-11'+15 -------------------- -4712-11-26 00:00:00

全为负值,也就是公元前,经计算,逻辑合理。

至此,关于日期的正负告一段落。那么,为什么有些环境下能测出全零的结果呢?

之前我们说,可能是终端的显示问题。事实上,更确切的说,不只是显示,更是工具与Oracle在进行衔接过程中的机制问题。

通过plsql developer等工具连接数据库的时候,事实上并不只是简单地连接,读取请求和返回结果,内部有很多复杂的机制。Oracle是用c语言写的,为了跟Oracle内部更好地衔接,这些外部的工具很可能做了很多c的接口,这些接口对于数据的操作不止于读取和传递,这就是为什么很多时候我们使用不同的工具很可能同样的SQL会有不一样的结果。

回到最初的问题:

select to_char(a.station_time) from sfis1.r_vip_log a where id=486270420;

使用to_char函数做转换的时候,导致出现全零,也可以看出在plsql developer上调用to_char函数的时候,对于数据格式和类型的转换机制不完全等同于Oracle的转换机制。这很可能也是因为工具的接口函数导致。

这样的例子还有很多,比如当我们用SQLplus连接数据库查询一张表的时候,会直接返回所有的行,但plsql developer则可能会先显示一部分,其他的你可以根据需求展开。也有在做逻辑导入导出的时候,有一些表和索引的创建出现问题,直接在SQLplus执行出错,而使用plsql developer则可以。

具体的区别如果有人感兴趣,可以做更深入的学习。我们在这里想跟大家强调的是,当你使用第三方工具操作数据库的时候,千万要谨慎,我们并不知道这些工具里到底埋了多少坑。

所以,至此你是否也有豁然开朗的感觉?

最后,关于文中提到的黄玮老师的帖子,猜想很可能是比较早期的版本,或者当时的一些工具的不完善导致。当然归根到底,我们看到Oracle在12c之前,通过运算仍然可以得到年份为0的情况,虽然正常显示了,但由于是不合法的数据,这些数据在需要使用比如导入导出,计算或者转换的时候就可能出错。

Oracle一直在不断地完善和进步,关于12c的新特性,也仍有很多待我们去发现。热爱学习的你,欢迎跟我们一起来踩坑。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2017-06-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏架构师之路

如何快速实现高并发短文检索

一、需求缘起 某并发量很大,数据量适中的业务线需要实现一个“标题检索”的功能: (1)并发量较大,每秒20w次 (2)数据量适中,大概200w数据 (3)是否需...

3448
来自专栏美图数据技术团队

一览美图数据开发与SQL解析

感谢阅读「美图数据技术团队」的第 16 篇原创文章,关注我们持续获取美图最新数据技术动态。

1282
来自专栏web前端教室

【蒙圈】自己写的Js,自己不认识了?

但是,下课之前我说,今天的作业,如何如何要求,格式什么样,标明用了多长时间,然后就有同学在学习群里问我,。。原话记不太清了,大概意思就是,自己写的看不明白了,还...

1484
来自专栏salesforce零基础学习

salesforce 零基础学习(四十一)Group

 salesforce中,有的时候我们需要将一组用户放进一个Group,用来实现以下主要功能: 1.通过sharing rule设置默认的共享访问; 2.将记录...

2138
来自专栏CDA数据分析师

入门必学!在Python中利用Pandas库处理大数据

在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Had...

2159
来自专栏PPV课数据科学社区

数据流编程教程:R语言与DataFrame

DataFrame DataFrame 是一个表格或者类似二维数组的结构,它的各行表示一个实例,各列表示一个变量。 一. DataFrame数据流编程 ? 二....

48212
来自专栏牛客网

今日头条 前端面经今日头条 2018.03.20 一面今日头条 2018.03.20 二面今日头条 2018.03.20 三面

回馈一波~~今日头条,前端面经(三面全,offer已到手),19实习。 今日头条 2018.03.20 一面 一面问了好多问题,都是基础上很细节很钻的问题,平时...

6787
来自专栏IT派

使用 Pandas 处理亿级数据

在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hado...

1434
来自专栏SAP最佳业务实践

想学FM系列(21)-SAP FM模块:派生规则推导策略(4)-派生规则推导步骤-功能模块

4.1.6 功能模块 在推导步骤过程中调用一个功能函数,将源数据字段值传入功能函数的参数值,再把功能函数执行后的结果数据值传出到目标字段。 在选择步骤类型为功能...

63010
来自专栏郭霖

Android数据库高手秘籍(四)——使用LitePal建立表关联

目前我们已经对LitePal的用法有了一定了解,学会了使用LitePal来创建表和升级表的方式,那么今天就让我们一起继续进阶,探究一下如何使用LitePal来建...

3159

扫码关注云+社区

领取腾讯云代金券