sqlldr和oracle_datapump性能比较(r2笔记35天)

针对之前在生产环境中使用sql*loader的性能问题,最近一直在想使用外部表的oracle_datapump来替代它。 昨天下午做了大量数据的测试,比较了这两种方案。最后发现在一定的限定条件下,从很多细节来看 oracle_datapump要更胜一筹。 首先使用sql*loader对于clob,blob的数据相比普通表的处理要一些额外的工作,但是这些限制或者额外工作再oracle_datapump中就可以很方便的使用,oracle_datapump支持的数据类型要更丰富。 在生产环境中,迁移数据的时候,只是对于foreign key做了disable的操作,对于其他的constraint都做了保留,没有任何其他的操作,所以使用sql*loader 的direct选项就有很多的限制和无法实现的苦衷。在表级都设置了nologging。 --》数据抽取 以下是使用sql*loader和oracle_datapump的一些性能比较。数据量在120-150G左右。 使用sql*loader的时候因为有2张表含有clob字段,所以就先没有处理,以此来对比oracle_datapump的速度。 可以看到sqlldr的速度做数据抽取大概耗费了14分钟,而且不包括2张含有clob的表,生成的dump文件有150G oracle_datapump的速度要更快一些。只耗费了大概3分钟左右,生成的dump文件要更加精简。 当然了sqlldr可以使用客户端来抽取数据,而oracle_datapump只能基于服务端,灵活性上sqlldr要好一些。

extract start time

extract end time

Duration

Dump_generated

sqlldr(exclude 2 tables)_68 tables

Tue Jul 15 13:28:15 ICT 2014

Tue Jul 15 13:42:32 ICT 2014

14 mins

150G

EXT_DATAPUMP 70 tables

Tue Jul 15 14:03:11 ICT 2014

Tue Jul 15 14:06:20 ICT 2014

3 mins

59G

--》数据加载 数据抽取的速度其实不是关键,很多工作可以在升级之前完成,对于系统的影响倒不是很重要,关键在于数据的加载速度。 可以看到采用sqlldr加载数据的时候,启用了150个并行线程,sqlldr开启了并行。耗费了大约80分钟,产生的日志数据量也不少有,230G左右。 而oracle_datapump的表现在这方便确实更胜一筹,启用了4个session,每个session启用并行度为8来做数据的加载,加载速度要快一倍以上。而且产生的日志数据量也少了将近一半。

data loading start time

data loading end time

Duration

archive_logs_generated

sqlldr(exclude 2 tables)_68 tables

Tue Jul 15 14:24:24 ICT 2014

Tue Jul 15 15:44:04 ICT 2014

80 mins

230G

EXT_DATAPUMP 70 tables

Tue Jul 15 17:06:51 ICT 2014

Tue Jul 15 17:50:04 ICT 2014

44 mins

139G

--》数据校验 在数据校验方面,sqlldr就没有任何可行的方法来比较冗余数据了,在这方面,oracle_datapump可以根据生成的dump文件创建外部表,不耗费额外的表存储空间,在这个基础上,直接可以对外部表和目标表进行比较。在数据加载之前找到可能出现的潜在问题。 --》数据纠错 在数据纠错方面,sqlldr提供了完整的处理机制,如果数据不符合要求被reject,可以生成对应的错误文件,里面包含所有被拒的数据,可以再次使用sqlldr来加载。 但是对于oracle_datapump来说,只能到这里了。不过在数据库层面还有其他可行的方式,比如采用error log就可以得到出错的数据进行排错。

原文发布于微信公众号 - 杨建荣的学习笔记(jianrong-notes)

原文发表时间:2014-07-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏我的博客

Lucenu和Sphinx介绍

一、Lucene介绍 1、简介 Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查...

3426
来自专栏Java架构

跳槽必看!一位程序猿面试蚂蚁金服后端的经验总结!前言自我介绍最近的项目经历总结

2185
来自专栏SDNLAB

SDN实战团分享(三十一):Segment Routing meet SDN

一、介绍 ? 在1990年代Yakov, Eric Rosen, Kompella很多业界先驱(仅列举了Juniper公司的MPLS业界领袖,其他公司也有 很多...

61616
来自专栏Jerry的SAP技术分享

SAP S4CRM和C4C的技术比较

如果您对SAP S/4HANA for Customer Management(以下简称S4CRM)和SAP Cloud for Customer(以下简称C4...

4207
来自专栏程序人生

Let it crash: 因为误解,所以瞎说

今天我知乎的时间线上反复出现了一个流毒甚广的帖子:「应该如何理解Erlang的“就让它崩溃”思想?」,十几个不懂装懂的回答,赞竟然都不少。 严格意义上来说,我之...

3237
来自专栏Albert陈凯

2018-11-06 成为一个专业的程序员前言

https://github.com/stanzhai/be-a-professional-programmer

3452
来自专栏吴伟祥

对于初学者,Linux的哪种桌面环境比较适用?

对初学者来说,Linux桌面可能是他们遇到的第一个难题,无论是从Win还是OSX过来的人,刚开始的时候可能连桌面的概念都不知道。我接下来的分析建立在这样的基础之...

1412
来自专栏CSDN技术头条

最有趣的代码注释,一次看过瘾!

代码注释的作用,不需要对程序员解释了。有时在查看他人代码,能看到一些令人不禁大笑的注释。比如:

912
来自专栏安恒网络空间安全讲武堂

从零开始的CTF学习过程

在上大学之前,我是从来没有学习过任何编程知识的。不过我喜欢计算机,甚是喜欢这折腾的过程,从刚开始的学习使用、玩游戏、找外挂辅助,到后来的维修计算机。

1852
来自专栏施炯的IoT开发专栏

Windows Mobile Ink

    在之前的文章“Signature on Pocket PC”中,是将签名作为bmp位图的格式存放在Windows Mobile设备的某一个目录下面。今天...

1835

扫码关注云+社区