前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Oracle 大数据量导出工具——sqluldr2 的安装与使用

Oracle 大数据量导出工具——sqluldr2 的安装与使用

作者头像
JiekeXu之路
发布2023-09-06 09:53:02
2.3K0
发布2023-09-06 09:53:02
举报
文章被收录于专栏:JiekeXu之路

作者 | JiekeXu

来源 |公众号 JiekeXu DBA之路(ID: JiekeXu_IT)

如需转载请联系授权 | (个人微信 ID:JiekeXu_DBA)

大家好,我是 JiekeXu,很高兴又和大家见面了,今天和大家一起来看看 sqluldr2 的安装与使用,欢迎点击上方蓝字“JiekeXu DBA之路”关注我的公众号,标星或置顶,更多干货第一时间到达!

sqluldr2 使用情况基本介绍

近期在做一些国产数据库的 POC 工作,在数据迁移导出时用到了数据导出工具 sqluldr2,它是一款十分不错的 oracle 数据导出工具,还支持导出时同时生成 sqlldr 的控制文件,它可以将数据以 TXT/CSV 等格式导出,能导出亿级数据为 excel 文件,包含32、64 位程序,不仅在大数据量导出方面速度超快,导入速度也是非常快速。

基本介绍

sqluldr2 是一款Oracle数据快速导出工具,包含32、64位程序,sqluldr2 在大数据量导出方面速度超快,能导出亿级数据为excel文件,另外它的导入速度也是非常快速,功能是将数据以TXT/CSV等格式导出。

软件说明

下载完sqluldr解压后,文件夹内容如下:

sqluldr2.exe 用于32位windows平台;

sqluldr264.exe 用于64位windows平台。

sqluldr2_linux32_10204.bin 适用于linux32位操作系统;

sqluldr2_linux64_10204.bin 适用于linux64位操作系统;

可在公众号后台回复关键字【sqluldr2】获取下载文件。

使用说明

1、首先将 sqluldr2_linux64_10204.bin 复制到执行目录下,给予可执行权限,即可开始使用

代码语言:javascript
复制
mkdir -m 775 /home/oracle/tmp/sqluldr2

2、 help 查看帮助

chmod 775 sqluldr2_linux64_10204.bin./sqluldr2_linux64_10204.binSQL*UnLoader: Fast Oracle Text Unloader (GZIP, Parallel), Release 4.0.1(@) Copyright Lou Fangxin (AnySQL.net) 2004 - 2010, all rights reserved.License: Free for non-commercial useage, else 100 USD per server.Usage: SQLULDR2 keyword=value [,keyword=value,...]Valid Keywords: user = username/password@tnsname sql = SQL file name query = select statement field = separator string between fields record = separator string between records rows = print progress for every given rows (default, 1000000) file = output file name(default: uldrdata.txt) log = log file name, prefix with + to append mode fast = auto tuning the session level parameters(YES) text = output type (MYSQL, CSV, MYSQLINS, ORACLEINS, FORM, SEARCH). charset = character set name of the target database. ncharset= national character set name of the target database. parfile = read command option from parameter file for field and record, you can use '0x' to specify hex character code, \r=0x0d \n=0x0a |=0x7c ,=0x2c, \t=0x09, :=0x3a, #=0x23, "=0x22 '=0x27

3、执行数据导出命令

3.1 sqluldr2的链接数据库

本地执行方式:users 参数可以省略不写,和 expdp username/passwd 方式一样

代码语言:javascript
复制
export ORACLE_SID=orcl
sqluldr2 testuser/testuser query=test_table1 file=test_table1.txt

客户端连接:tns 方式

代码语言:javascript
复制
sqluldr2 testuser/testuser@orcl query=test_table1 file=test_table1.txt

客户端连接:简易连接

代码语言:javascript
复制
sqluldr2 testuser/testuser@x.x.x.x:1521/orcl query=test_table1 file=test_table1.txt

3.2 要导出的数据由 query 控制

query 参数如果整表导出,可以直接写表名,如果需要查询运算和 where 条件,query=“sql文本”,也可以把复杂 SQL 写入到文本中由 query 调用。

3.3 分隔符设置

默认是逗号分隔符,通过field参数指定分隔符

代码语言:javascript
复制
sqluldr2 testuser/testuser query=chen.tt1 field=";"

3.4 大数据量操作

对于大表可以输出到多个文件中,指定行数分割或者按照文件大小分割,例如:

代码语言:javascript
复制
sqluldr2 testuser/testuser@orcl query="select * from test_table2" file=test_table2_%B.txt batch=yes rows=500000

3.5 常规导出

Win:

代码语言:javascript
复制
sqluldr2 test/test@127.0.1.1/orcl query="select * from temp_001" head=yes file=d:\tmp001.csv

Linux:

代码语言:javascript
复制
cd /home/oracle/tmp/sqluldr2
./sqluldr2_linux64_10204.bin sys  query="select * from scott.emp" head=yes file=./emp01.csv
          0 rows exported at 2023-07-26 10:45:47, size 0 MB.
          14 rows exported at 2023-07-26 10:45:47, size 0 MB.
         output file ./emp01.csv closed at 14 rows, size 0 MB.

说明:head=yes 表示输出表头

3.6 使用 SQL 参数

代码语言:javascript
复制
./sqluldr2_linux64_10204.bin scott/scott@127.0.0.1/testogg sql=test_sql.sql head=yes file=/home/oracle/tmp/sqluldr2/test_emp01.csv

test_sql.sql 的内容为:

代码语言:javascript
复制
select * from scott.dept

注意:这里仅支持一条 SQL,有无分号均可。当然 SQL也支持表关联子查询等。

3.7 使用 log 参数

当集成 sqluldr2 在脚本中时,就希望屏幕上不输出这些信息,但又希望这些信息能保留,这时可以用“LOG”选项来指定日志文件名。

代码语言:javascript
复制
sqluldr2 test/test@127.0.0.1/orcl sql=test.sql head=yes file=d:\tmp001.csv log=+d:\tmp001.log
Linux:
--连接到 PDB1
sqlplus sys/Oracle@JIEKEXUPDB1 as sysdba
--创建用户并赋权
create user test identified by test;
grant connect,resource,dba to test;
--连接到测试用户,创建表 t1
conn test/test@JIEKEXUPDB1
create table t1 as select * from dba_objects;
commit;
--导出
./sqluldr2_linux64_10204.bin  test/test@JIEKEXUPDB1 query=t1 head=yes file=/home/oracle/t1.csv log=/home/oracle/test_t1.log

3.8 使用 table 参数

当使用 table 参数时,在目录下会生成对应的ctl控制文件,如下语句会生成temp_001_sqlldr.ctl文件。

代码语言:javascript
复制
./sqluldr2_linux64_10204.bin  test/test@JIEKEXUPDB1 query="select * from t1" table=t1 head=yes file=/home/oracle/test1.csv

生成的控制文件t1_sqlldr.ctl的内容如下:

代码语言:javascript
复制
--
-- SQL*UnLoader: Fast Oracle Text Unloader (GZIP), Release 3.0.1
-- (@) Copyright Lou Fangxin (AnySQL.net) 2004 - 2010, all rights reserved.
--
--  CREATE TABLE t1 (
--    OWNER VARCHAR2(128),
--    OBJECT_NAME VARCHAR2(128),
--    SUBOBJECT_NAME VARCHAR2(128),
--    OBJECT_ID NUMBER,
--    DATA_OBJECT_ID NUMBER,
--    OBJECT_TYPE VARCHAR2(23),
--    CREATED DATE,
--    LAST_DDL_TIME DATE,
--    TIMESTAMP VARCHAR2(19),
--    STATUS VARCHAR2(7),
--    TEMPORARY VARCHAR2(1),
--    GENERATED VARCHAR2(1),
--    SECONDARY VARCHAR2(1),
--    NAMESPACE NUMBER,
--    EDITION_NAME VARCHAR2(128),
--    SHARING VARCHAR2(18),
--    EDITIONABLE VARCHAR2(1),
--    ORACLE_MAINTAINED VARCHAR2(1),
--    APPLICATION VARCHAR2(1),
--    DEFAULT_COLLATION VARCHAR2(100),
--    DUPLICATED VARCHAR2(1),
--    SHARDED VARCHAR2(1),
--    CREATED_APPID NUMBER,
--    CREATED_VSNID NUMBER,
--    MODIFIED_APPID NUMBER,
--    MODIFIED_VSNID NUMBER
--  );
--
OPTIONS(BINDSIZE=2097152,READSIZE=2097152,SKIP=1,ERRORS=-1,ROWS=50000)
LOAD DATA
INFILE '/home/oracle/test1.csv' "STR X'0a'"
INSERT INTO TABLE t1
FIELDS TERMINATED BY X'2c' TRAILING NULLCOLS
(
  "OWNER" CHAR(128) NULLIF "OWNER"=BLANKS,
  "OBJECT_NAME" CHAR(128) NULLIF "OBJECT_NAME"=BLANKS,
  "SUBOBJECT_NAME" CHAR(128) NULLIF "SUBOBJECT_NAME"=BLANKS,
  "OBJECT_ID" CHAR(46) NULLIF "OBJECT_ID"=BLANKS,
  "DATA_OBJECT_ID" CHAR(46) NULLIF "DATA_OBJECT_ID"=BLANKS,
  "OBJECT_TYPE" CHAR(23) NULLIF "OBJECT_TYPE"=BLANKS,
  "CREATED" DATE "YYYY-MM-DD HH24:MI:SS" NULLIF "CREATED"=BLANKS,
  "LAST_DDL_TIME" DATE "YYYY-MM-DD HH24:MI:SS" NULLIF "LAST_DDL_TIME"=BLANKS,
  "TIMESTAMP" CHAR(19) NULLIF "TIMESTAMP"=BLANKS,
  "STATUS" CHAR(7) NULLIF "STATUS"=BLANKS,
  "TEMPORARY" CHAR(1) NULLIF "TEMPORARY"=BLANKS,
  "GENERATED" CHAR(1) NULLIF "GENERATED"=BLANKS,
  "SECONDARY" CHAR(1) NULLIF "SECONDARY"=BLANKS,
  "NAMESPACE" CHAR(46) NULLIF "NAMESPACE"=BLANKS,
  "EDITION_NAME" CHAR(128) NULLIF "EDITION_NAME"=BLANKS,
  "SHARING" CHAR(18) NULLIF "SHARING"=BLANKS,
  "EDITIONABLE" CHAR(1) NULLIF "EDITIONABLE"=BLANKS,
  "ORACLE_MAINTAINED" CHAR(1) NULLIF "ORACLE_MAINTAINED"=BLANKS,
  "APPLICATION" CHAR(1) NULLIF "APPLICATION"=BLANKS,
  "DEFAULT_COLLATION" CHAR(100) NULLIF "DEFAULT_COLLATION"=BLANKS,
  "DUPLICATED" CHAR(1) NULLIF "DUPLICATED"=BLANKS,
  "SHARDED" CHAR(1) NULLIF "SHARDED"=BLANKS,
  "CREATED_APPID" CHAR(46) NULLIF "CREATED_APPID"=BLANKS,
  "CREATED_VSNID" CHAR(46) NULLIF "CREATED_VSNID"=BLANKS,
  "MODIFIED_APPID" CHAR(46) NULLIF "MODIFIED_APPID"=BLANKS,
  "MODIFIED_VSNID" CHAR(46) NULLIF "MODIFIED_VSNID"=BLANKS
)

顺便说一句,每次运行都需要 ./sqluldr2_linux64_10204.bin 有点麻烦,我们将其重命名并放到数据库服务器 $ORACLE_HOME/bin 目录下,便可以直接运行了。

代码语言:javascript
复制
mv sqluldr2_linux64_10204.bin sqluldr2

cp sqluldr2 $ORACLE_HOME/bin

which sqluldr2

4、本地 Oracle client 安装

1)如果想要访问远程数据库,导出远程数据库数据,需要在本地安装 Oracle 客户端软件,访问远端数据库,下载客户端 rpm 包或者标准的 Oracle 客户端 zip 包进行安装。

代码语言:javascript
复制
cd /home/jiekexu/soft/
oracle-instantclient-11.2.0.4.0-1.1.x86_64.rpm
oracle-instantclient11.2-sqlplus-11.2.0.4.0-1.x86_64.rpm
oracle-instantclient11.2-basic-11.2.0.4.0-1.x86_64.rpm

2)这里以 prm 包为例,root用户使用rpm -ivh [包名] 进行安装:

如:rpm -ivh oracle-instantclient-11.2.0.4.0-1.1.x86_64.rpm

安装的文件默认放在两个位置:

头文件:/usr/lib/oracle/11.2/client64/下,如果在使用时报错找不到头文件,记得看路径是否是这个。

包文件:/usr/lib64/oracle/11.2.0.4.0/client/下,包含{bin、lib}两个文件夹;

3)创建oracle-instantclient.conf文件,并添加内容:

代码语言:javascript
复制
vim  /etc/ld.so.conf.d/oracle-instantclient.conf
添加内容
/usr/lib64/oracle/11.2.0.4.0/client/lib/

4)生效环境变量

代码语言:javascript
复制
source  .ldconfig

5)创建软连接

代码语言:javascript
复制
cd  /usr/lib64/oracle/11.2.0.4.0/client/lib
执行
cd /usr/lib64/oracle/11.2.0.4.0/client/lib/
ln -s libclntsh.so.11.1  libclntsh.so

5、主要参数说明

Field 分隔符 指定字段分隔符,默认为逗号

record 分隔符 指定记录分隔符,默认为回车换行,Windows下的换行

quote 引号符 指定非数字字段前后的引号符

例如现在要改变默认的字段分隔符,用“#”来分隔记录,导出的命令如下所示:

sqluldr2 test/test sql=tmp.sql field=#

在指定分隔符时,可以用字符的ASCII代码(0xXX,大写的XX为16进制的ASCII码值)来指定一个字符,常用的字符的ASCII代码如下:

回车=0x0d,换行=0x0a,TAB键=0x09,|=0x7c,&=0x26,井号=0x23,双引号=0x22,单引号=0x27,冒号=0x3a

注意:在选择分隔符时,一定不能选择会在字段值中出现的字符,例如TAB键,&、| 等均有可能会出现在字段值中,所以推荐在导出数据时,使用多个分隔符,如0x230x7c。

全文完,希望可以帮到正在阅读的你,如果觉得此文对你有帮助,可以分享给你身边的朋友,同事,你关心谁就分享给谁,一起学习共同进步~~~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 JiekeXu之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • sqluldr2 使用情况基本介绍
    • 基本介绍
      • 软件说明
        • 使用说明
        相关产品与服务
        大数据
        全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档