EDB和Oracle在分区剪裁实践上的一点差别

前两天碰到一个问题,在EDB数据库中创建的一张分区表,需要使用分区本地索引和分区剪裁,但查看执行计划发现没能用到分区剪裁的功能。

创建分区表:

CREATE TABLE test
(
  id bigint NOT NULL,
  bag_id bigint,
  bp_airline_code character varying(3),
  bp_flight character varying(5),
  bp_flight_suffix character varying(2),
  bp_flight_date timestamp with time zone,
  CONSTRAINT pk_test PRIMARY KEY (id)
)
partition by range(bp_flight_date)
(
    partition part_20151101 VALUES LESS THAN('2015-NOV-02'),
    partition part_20151102 VALUES LESS THAN('2015-NOV-03'),
    partition part_20151103 VALUES LESS THAN('2015-NOV-04')
);

创建主表和三个分区的本地索引:

CREATE INDEX test_idx_01
    ON test
    (bag_id, bp_airline_code, bp_flight, bp_flight_suffix);

CREATE INDEX test_part_20151101_idx
    ON test_part_20151101
    (bag_id, bp_airline_code, bp_flight, bp_flight_suffix);

CREATE INDEX test_part_20151102_idx
    ON test_part_20151102
    (bag_id, bp_airline_code, bp_flight, bp_flight_suffix);

CREATE INDEX test_part_20151103_idx
    ON test_part_20151103
    (bag_id, bp_airline_code, bp_flight, bp_flight_suffix);

执行以下带有分区键的查询语句,:

explain select * from test
where bp_flight_date=to_date('2015-11-01', 'yyyy-mm-dd') and bag_id = 1

发现并没有使用到分区剪裁:

有点疑惑,明明用了分区键作为查询条件,为什么此处是扫描了所有分区?

分析: 其实这个问题说简单也简单,说麻烦也麻烦,主要还是细节和原理的理解。 上例中使用的分区规则是:

partition by range(bp_flight_date)
(
    partition part_20151101 VALUES LESS THAN('2015-NOV-02')
...

以bp_flight_date日期字段作为分区键,条件是LESS THAN(‘2015-NOV-02’)。但执行的查询语句条件是:

where bp_flight_date=to_date('2015-11-01', 'yyyy-mm-dd') and bag_id = 1

对日期值是使用了to_date函数,并不是像分区规则中的“字符串”格式,有理由怀疑是因为两者不统一,由于某些RULE导致未能用到分区剪裁的功能。

接下来按照猜想改下查询条件:

explain select * from test
where bp_flight_date='2015-11-01', 'yyyy-mm-dd' and bag_id = 1

查看执行计划:

现在已经只扫描test_part_20151101这个分区,达到了分区剪裁的目的。

之所以有上面这些问题,可能还是源于Oracle的一些思维,在Oracle,意识当中将日期字段作为查询条件就应该使用to_date()这类的函数

和上面相同的表结构在Oracle中的实现:

这里看到执行计划显示还是用到了分区特性,并没有执行全表扫描,其中Pstart和Pstop显示的是KEY,表示是基于函数值的分区键。

那么像EDB这样创建一个不用to_date函数的分区表:

直接报错了,提示字段类型不匹配,无法创建表。这也说明了在日期字段类型上,EDB和Oracle的一点不同。

总结: 1. EDB中分区键是日期字段,VALUES LESS THAN(‘2015-11-01’)可以使用字符串格式,但Oracle则会报ORA-01861的错误,不支持这种创建方式。 2. EDB对使用分区键的查询语句,如果日期条件的格式和分区规则中不同,例如分区规则是’2015-NOV-01’或’2015-11-01’,但查询条件使用to_date(‘2015-11-01’,’yyyy-mm-dd’),则不会用到分区剪裁的特性,而是扫描所有分区。对于Oracle,在创建分区规则时就已经做了严格限制,因此不存在日期条件的格式和分区规则中不一致的情况。这两种方式说不上孰好孰坏,EDB是更自由,但需要人为注意书写的正确,Oracle则是严谨,好处是避免了人为使用出错的可能,间接上可能也反映出了“社区 VS 商业”、“开源 VS 闭源”对待某个问题的一种态度。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券