首页
学习
活动
专区
工具
TVP
发布

Kettle教程一:Kettle简介和Kettle的部署安装

2、Kettle简介 Kettle是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。...3、kettle的核心组件 4、Kettle的概念模型 Kettle的执行分为两个层次:Job(作业)和Transformation(转换)。...二 安装Kettle 1、kettle下载地址和教程链接: 官网各个版本下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration.../ B站2019kettle8.2最新教程:https://www.bilibili.com/video/BV1jE411B7J8 国内kettle论坛网:https://www.kettle.net.cn...4、打开kettle只需要运行spoon.bat,即可打开spoon图形工具: 5、Kettle目录文件介绍 三 常见的kettle报错 1、打开kettle后一闪而过就没了 可能有如下原因:

58.8K66

kettle 性能优化_kettle过滤记录

本章主要是介绍Kettle的性能优化及效率提升。...一、Kettle调优 1、 调整JVM大小进行性能优化 修改Kettle定时任务中的Kitchen或Pan或Spoon脚本: 修改脚本代码片段 set OPT=-Xmx512m -cp %CLASSPATH...7、延迟转化 很多字段在读入到最后输出,实际上都没有被操作过,开启延迟转化可以让kettle在必要的时候再进行转化。这里的转化是指从二进制到字符串之间的转化,在输入和输出都是文本的时候更为明显。...9、不要在Select Values的步骤删除某个字段 如果在Select Values的步骤删除某个字段kettle会需要调整现有的存储结构,在可以不删除的时候尽量不要删除字段。...6、优化GROUP BY: group by使用了临时表和排序: Extra 这个字段的Using temporary表示在执行分组的时候使用了临时表 Extra 这个字段的Using filesort

2.6K20
您找到你想要的搜索结果了吗?
是的
没有找到

Kettle与Hadoop(一)Kettle简介

Kettle的一个重要核心原则就是,在ETL流程中所有未指定的字段都自动被传递到下一个组件。也就是说输入中的字段会自动出现在输出中,除非中间过程特别设置了终止某个字段的传递。...每个步骤在输出数据行时都有对字段的描述,这种描述就是数据行的元数据,通常包括下面一些信息: 名称:行里的字段名应该是唯一的。 数据类型:字段的数据类型。...初始步骤:Kettle在元数据里还记录了字段是由哪个步骤创建的。可以让用户快速定位字段是由转换里的哪个步骤最后一次修改或创建。...就是说:当从多个步骤向一个步骤里写数据时,多个步骤输出的数据行应该有相同的结构,即字段相同、字段数据类型相同、字段顺序相同。 字段元数据不会在转换中发生变化。...所以默认情况下,Kettle使用一个char(1)字段的不同值(如Y或N)来代替Boolean字段。如果选中了这个选项,Kettle就会为支持Boolean类型的数据库生成正确的SQL方言。

2.9K21

kettle学习笔记(五)——kettle输出步骤

Excel Writer   其他(报表、应用) 二、数据库输出 1.表输出     使用SQL的方式向数据库插入数据(INSERT)     支持批量提交     支持分区(Date分区)     支持字段映射...如果选择分区,需要选择Date字段进行分区,并且需要手动创建表(例如按月分区,有201804 201805两个月,则需要创建tb_201804 tb_201805两个表) 2.返回自增主键     表输出的配置如下...3.数据库字段映射     前面步骤可以后后面表输出进行字段映射匹配:     表输出配置如下: ?   ...字段映射:     使用猜一猜可以进行名称匹配,如果需要手动匹配,可以左右分别选择,点击Add即可!     并且映射完成之后也可以删除丢弃某些字段 ?...根据一个flag字段执行相应的插入/更新/删除操作。     配置图如下:使用合并后的flag字段(可能有new deleteed等flag),后续再根据此flag,同步变化的数据到表1 ?

2.7K30

kettle调度监控平台(kettle-scheduler)开源

背景 Kettle作为用户规模最多的开源ETL工具,强大简洁的功能深受广大ETL从业者的欢迎。但kettle本身的调度监控功能却非常弱。...项目介绍 Kettle调度监控平台(以下简称KS)是一个自主开发的javaweb程序,专门用来调度和监控由kettle客户端创建的job和transformation。...项目源码:GitHub – zhaxiaodong9860/kettle-scheduler: 一款简单易用的Kettle调度监控平台,专门用来调度和监控由kettle客户端创建的job和transformation...# Kettle Properties #绝对路径,用于初始化kettle环境变量(.kettle/kettle.properties所在路径),指向kettle根目录(例如 D:\data-integration...) kettle.home=D:\\data-integration #绝对路径kettle下plugins文件 kettle.plugin=E:\\zhaxiaodong\\apache-tomcat

7.1K150

Kettle与Hadoop(二)Kettle安装配置

五、配置 Kettle运行环境内的一些因素会影响Kettle的运行方式。这些因素包括配置文件、与Kettle集成在一起的外部软件。我们把这些因素统称为Kettle的配置。 1....配置文件和.kettle目录 Kettle运行环境中有几个文件影响了Kettle的运行情况。...这些文件可以看成是Kettle配置文件,当Kettle做了环境移植或升级时,这些文件也要随之改变,包括: .spoonrc jdbc.properties kettle.properties kettle.pwd...图5 如图中所示,在文件名字段里不再用硬编码路径,而使用了变量的方式{INPUT_PATH}。对任何带有“”符号的输入框都可以使用这种变量的输入方式。...kettle.pwd文件位于Kettle根目录下的pwd目录下。

6K50

Kettle构建Hadoop ETL实践(一):ETL与Kettle

例如,“价格”和“数量”字段作为输入字段,在转换中根据这两个字段计算出“收入”字段。...Kettle的一个重要核心原则就是,在ETL流程中所有未指定的字段都自动被传递到下一个组件。也就是说输入中的字段会自动出现在输出中,除非中间过程特别设置了终止某个字段的传递。...初始步骤:Kettle在元数据里还记录了字段是由哪个步骤创建的,可以让用户快速定位字段是由转换里的哪个步骤最后一次修改或创建。...许多数据库根本不支持Boolean数据类型,如Oracle和MySQL,所以默认情况下,Kettle使用一个char(1)字段的不同值(如Y或N)来代替Boolean字段。...现在是Kettle一显身手的时候了。Kettle的转换处理数据流,其中有一个“获取文件名”的输入步骤,可以使用它在导入文件数据时添加上文件名字段,而且支持正则表达式同时获取多个文件名,正好适用此场景。

4.2K67

Kettle使用小结

♂️简介:Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。...Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制...(更多介绍自行搜索) ?...Kettle中文网:https://www.kettle.net.cn/ ⏬下载地址:https://jaist.dl.sourceforge.net/project/pentaho/Pentaho 9.1...举例子: 第一种:从A表->抽数据到->B表(可不同数据库) 启动kettle step 1:左侧操作区->核心对象Tab->输入->选择“表输入”->拖拽到右侧操作区 step 2:左侧操作区->核心对象...(据此判断插入or更新数据)->“更新字段”(表字段列:要抽取到的目标表字段;流字段列:被抽取的表字段,对应上即可) 陆续更新...

1.3K40

kettle工具练习

1.打开kettle工具创建一个转换csv_extract,并添加“CSV文件输入”控件,“表输出”控件及Hop跳连接线,用于实现CSV文件数据的抽取功能,具体效果如下图所示: 2.配置CSV文件输入控件...,具体操作如下图所示: 获取字段...1.打开kettle工具创建转换,并添加JSONinput控件。...文件中的数据抽取到数据表json中,执行结果如下图所示: 从上图看出,JSON input控件输入2条数据并写入该控件中,JSON input2控件读取JSON input控件的2条数据的data字段中并获取...6条数据作为输入并写入该控件中,表输出控件读取JSON input控件的2条数据,从这两条数据的data字段共获取6条数据作为输入并写入该控件中,也就是说,表输出控件从JSON input2流中读取6条数据均写入数据表

579100

kettle相关知识

/topics/390349305 Kettle_抽取数据举例 http://blog.csdn.net/huangyanlong/article/details/42264543 文件列表 kettle...Kettle使用及练习—安装部署 Kettle的下载可以在 http://kettle.pentaho.org/ 网站下载。...运行spoon.bat即能看到kettle的欢迎界面,选择没有资源库,打开kettle主界面,在左边的Main tree,双击transaction,配置DB Connection,点击test,提示成功则表示...只更新、无更新、无删除 只使用【更新操作】,注意,更新操作的查询字段只能包含PRAMARY KEY,其他字段不能被包含,更新字段要包含全部字段。...只增加 增加+更新、无删除 上述都可以用【插入\更新操作】,注意其中的查询字段同样只需要主键。 增加+更新+删除 需要【组合】【多种操作】

1.4K40

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券