这里的需求比较简单,可以通过pt-archiver来做,也通过kettle之类工具来做。kettle的话比较重,可支持的数据整型功能也更强大。...我这里是用kettle来搞的(复习下kettle,弄个demo,指不定后面有更复杂的业数据需求要找DBA介入) 配置JDBC连接的时候,建议加上字符集设定等几个参数: defaultFetchSize...if [ -z "$PENTAHO_DI_JAVA_OPTIONS" ]; then PENTAHO_DI_JAVA_OPTIONS="-Xms2048m -Xmx2048m" fi job命令行下的启动...lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar export PATH=$PATH:$JAVA_HOME/bin cd /opt/kettle.../demo /opt/kettle/data-integration/kitchen.sh -file /opt/kettle/demo/test.kjb >> .
1,首先是安装jdk,并设置环境变量 采用yum安装可不设置环境变量 2,下载kettle https://sourceforge.net/projects/pentaho/files/Data%20Integration...%20Integration/7.0/pdi-ce-7.0.0.0-25.zip 3,使用unzip命令对这个压缩包进行解压 unzip pdi-ce-7.0.0.0-25.zip -d “/opt/kettle...” 4,解压后给予相应文件可执行权限 进入到/opt/kettle/data-integration 授予 *.sh +x权限 即可执行权限 5,执行转换 编写测试转换,执行如下命令即可 /opt/kettle-spoon.../data-integration/pan.sh -file=/opt/kettle-spoon/ktr/test/test1.ktr log=test1.log 6,执行job sudo /opt/kettle-spoon.../data-integration/kitchen.sh -file=/opt/kettle-spoon/ktr/test/SechuldUpdate.kjb log=timeLogUpdate.log
2、Kettle简介 Kettle是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。...3、kettle的核心组件 4、Kettle的概念模型 Kettle的执行分为两个层次:Job(作业)和Transformation(转换)。...4、打开kettle只需要运行spoon.bat,即可打开spoon图形工具: 5、Kettle目录文件介绍 三 常见的kettle报错 1、打开kettle后一闪而过就没了 可能有如下原因:...2、连接数据库报错 大部分连接数据库报错,除了IP/账号密码/端口/库不对之外,就是没有把数据库驱动放到data-integration7\lib下,下载好对应的驱动,放置到lib文件下即可。...3、kettle无法创建xml相关步骤,有相关步骤的.ktr文件也打不开 可能是因为路径中包含中文,将整个安装包移动到桌面或其他没有中文字符的路径下,重启Spoon.bat即可。
本章主要是介绍Kettle的性能优化及效率提升。...一、Kettle调优 1、 调整JVM大小进行性能优化 修改Kettle定时任务中的Kitchen或Pan或Spoon脚本: 修改脚本代码片段 set OPT=-Xmx512m -cp %CLASSPATH...在确保结果输出正确的情况下,能使用并行处理的就不要使用串行处理; (18)....select a.* from table1 a left join table2 b on a.id = b.id where b.id is null; 总结:EXISTS与IN的使用效率的问题,通常情况下采用...我们一起来想下,执行group by语句为什么需要临时表呢?group by的语义逻辑,就是统计不同的值出现的个数。
一、Kettle设计原则 Kettle工具在设计之初就考虑到了一些设计原则,这些原则也借鉴了以前使用过的其它一些ETL工具积累下的经验和教训。...默认情况下,空字符串被认为与NULL相等,但可以通过一个参数kettle_empty_string_differs_from_null来设置。 5....所以默认情况下,Kettle使用一个char(1)字段的不同值(如Y或N)来代替Boolean字段。如果选中了这个选项,Kettle就会为支持Boolean类型的数据库生成正确的SQL方言。...尽管这样在很多情况下会提高性能,但当不同步骤更新同一个表时,也会带来锁和参照完整性问题。 为了解决打开多个连接而产生的问题,Kettle可以在一个事务中完成转换。...在Kettle里,所有使用数据库连接的步骤都可以使用分片的特性。例如,表输出步骤在分片模式下会把不同的数据行输出到不同的数据分区(片)中。
在Linux上面kettle-spoon启动问题 文件大小限制问题 修改此文件 /etc/security/limits.conf * soft nofile 327680 * hard nofile
本文要点:Kettle的建立数据库连接、使用kettle进行简单的全量对比插入更新:kettle会自动对比用户设置的对比字段,若目标表不存在该字段,则新插入该条记录。若存在,则更新。...Kettle简介:Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。...(引用百度百科) 1、Kettle的下载与安装(在本文中使用的kettle版本为6.1.0.1-196) kettle的最新下载地址:http://community.pentaho.com/projects.../data-integration/ 2、打开kettle。...到这里,一个简单的通过作业调度的kettle就算做完了。
Carte.bat: 启动web服务,用于 Kettle 的远程运行或集群运行。...Encr.bat: 密码加密 转换和作业: Kettle 的 Spoon 设计器用来设计转换(Transformation)和 作业(Job)。 ...6.预览 比如上面的例子,如果只是想看一下随机数是否正确正常,不想再另外配一个文本输出来查看结果,可以删除输出节点,使用预览: ? 点击快速启动,即可查看结果: ?
• 生成记录/自定义常量 • 获取系统信息 • 表输入 • 文本文件输入 • XML 文件输入 • Json输入...
、数据库输出 1.表输出 使用SQL的方式向数据库插入数据(INSERT) 支持批量提交 支持分区(Date分区) 支持字段映射 支持返回自增列 这里提示一下出现表输出的中文乱码问题的解决方案...MySQL批量加载需要在Linux环境运行(有命令只能在Linux下运行) Oracle需要本地有oracle客户端(sqlldr文件,在Oracle安装目录下查找) 三、文件输出 1.SQL文件输出
下载pdi-ce-7.1.0.0-12安装,在lib目录下传mysql的驱动:mysql-connector-5.1.8.jar目前要这个版本 mysql如果连接提示时区有问题,就需要设置下 登入MySQL...> set global time_zone='+8:00'; 方法二: 修改my.ini文件,在[mysqld]加入以下命令: default-time-zone='+8:00' 方法三: 修改kettle
(不要忘了给个star哦) 发布版本:百度网盘 请输入提取码 提取码 提取码: 52r8 kettle8.0工具下载地址:点击下载 部署 1.基础环境 操作系统:windows(linux...3.将源码编译打包后解压到tomcat下的webapps目录下。...) kettle.home=D:\\data-integration #绝对路径kettle下plugins文件 kettle.plugin=E:\\zhaxiaodong\\apache-tomcat...7.启动tomcat Windows:apache-tomcat-9.0.12\bin\startup.bat; Linux: apache-tomcat...注意:km为解压到tomcat/webapps下的项目的文件夹名称,一般源码编译后为kettle-scheduler,即可访问http://localhost:8080/kettle-scheduler
目录 一、安装Java 二、安装Kettle 三、运行Kettle程序 1. 安装Linux图形环境 2. 安装配置VNC Server 3. 在客户端使用vncviewer连接系统 4....保存文件后,Linux桌面出现spoon图标,如图4所示。 ? 图4 双击spoon图标或者点击图标右键菜单的“Open”,启动spoon.sh程序,打开Kettle设计界面。...其它Kettle的程序都不使用这个文件。.spoonrc文件位于.kettle目录下。因为在默认情况下,.kettle目录位于用户目录下,所以不同用户都使用各自的.spoonrc文件。....Carte服务会读取当前启动路径下的repositories.xml文件。如果当前路径下没有,会使用上面的用户本地目录下的.kettle目录下的repositories.xml文件。...用于启动Kettle程序的shell脚本 在下面一些情况下,可能要调整一下启动Kettle程序的shell脚本: 给Java classpath增加新的jar包。
kettle工具使用简明手册 运行启动脚本spoon.bat快捷方式 如果正确启动,则出现的主界面应该是下面这样的。...初次进入需右键新建作业 新建数据库连接 也可以想下面一样,新建数据库连接向导 填完参数测试一下连接 通过向导分步来 我已经建立了转换任务和数据库连接,可以直接应用。
可以进行字符串转义(例如> 转义为 >)、保留/去除字符串里的数字、移除特殊字符、补充长度
Java调用Kettle工具方法 这里需要的主要依赖包下面已列出,其他的运行时缺什么补什么就行: pentaho-kettle kettle-core 7.1.0.0-12 pentaho-kettle...= "D:\\kettle"; private static final String KETTLE_KET_DIR = KETTLE_BASE_DIR + "\\ktr"; private static...final String KETTLE_PLUGIN_DIR = KETTLE_BASE_DIR + "\\plugins"; static { try { log.debug("加载Kettle...true)); log.debug("Kettle插件加载成功"); log.debug("初始化Kettle插件环境"); KettleEnvironment.init(); log.debug("Kettle
传统数据仓库一般利用操作系统自带的调度功能(如Linux的cron或Windows的计划任务)实现作业自动执行。...再比如,开发一般是在Windows或Mac机上进行的,而生产环境一般是Linux系统或集群,ETL解决方案应该可以无缝地在这些系统间切换。...Kettle设计原则 Kettle工具在设计之初就考虑到了一些设计原则,这些原则也借鉴了以前使用过的其它一些ETL工具积累下的经验和教训。...默认情况下,空字符串被认为与NULL相等,但可以通过kettle.properties文件中的kettle_empty_string_differs_from_null参数来设置。...在Kettle安装目录下,有启动Spoon的脚本,如Windows下的Spoon.bat,类UNIX下的spoon.sh。Windows用户还可以通过执行Kettle.exe启动Spoon。
♂️简介:Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。...Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制...(更多介绍自行搜索) ?...Kettle中文网:https://www.kettle.net.cn/ ⏬下载地址:https://jaist.dl.sourceforge.net/project/pentaho/Pentaho 9.1...举例子: 第一种:从A表->抽数据到->B表(可不同数据库) 启动kettle step 1:左侧操作区->核心对象Tab->输入->选择“表输入”->拖拽到右侧操作区 step 2:左侧操作区->核心对象
kettle的转换功能十分便捷,大大减少了我们的工作量。...下面开始介绍如何使用kettle进行转换: 以文本转换为mysql数据表为例 首先,点击文件:在文件中新建→转换 然后,点击转换下的DB转换:选择要转换成什么数据库表,连接方式,输入用户名密码以及主机
领取专属 10元无门槛券
手把手带您无忧上云