首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Kettle使用小结

♂️简介:Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。...Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制...(更多介绍自行搜索) ?...Kettle中文网:https://www.kettle.net.cn/ ⏬下载地址:https://jaist.dl.sourceforge.net/project/pentaho/Pentaho 9.1...启动方式:解压到本地,mac启动方式 /路径/pdi-ce-9.1.0.0-324/data-integration/spoon.sh ⚠️MySql数据抽取:如果使用MySql数据库下载jar https...举例子: 第一种:从A表->抽数据到->B表(可不同数据库) 启动kettle step 1:左侧操作区->核心对象Tab->输入->选择“表输入”->拖拽到右侧操作区 step 2:左侧操作区->核心对象

1.3K40

kettle工具的简单使用

1.使用kettle抽取CSV文件 通过Kettle工具抽取CSV文件csv_extract.csv中的数据并保存至数据库extract的数据表csv中。...(1)、创建一个转换 通过使用Kettle工具,创建一个转换csv_extract,并添加“CSV文件输入”控件、“表输出”控件以及Hop跳连接线,具体如图所示。...单击【浏览】按钮,选择要抽取的文件csv_extract.csv 单击【获取字段】按钮,Kettle自动检索CSV文件,并对文件中的字段类型、格式、长度、精度等属性进行分析。...2、json文件的抽取 通过Kettle工具抽取JSON文件json_extract.json中的数据并保存至数据库extract中的数据表json中。...(1)通过使用Kettle工具,创建一个转换json_extract,并添加“JSON input”控件、“表输出”控件以及Hop跳连接线,具体如图所示。

1.9K20

使用Kettle连接动态分库

article/details/53883505 一、问题提出 在一个数据仓库应用中,每天新建一个MySQL数据库,以当天日期命名,如d_p20161201、d_p20161202等,并使用...Kettle连接这些数据库做数据清洗和ETL工作。...建立作业,在开始后首先调用上一步建立的转换,后续的转换或作业即可正常使用第1步建立的数据库连接。 三、验证步骤 1. 建立测试数据库表。...使用JavaScript步骤给变量赋值,这种在Kettle中编程的方式,能够实现非常复杂的应用逻辑。 2. 数据库连接可以在运行时动态引用变量,这给实现统一的ETL调度提供了一种可能性。...先设置变量并赋值,然后在后面的步骤或作业项中使用变量,这是一种通用的方法。通过在Kettle中进行程序设计,大大增强了Kettle的功能。

1.6K31

kettle使用教程(超详细)

今天详细详细说一下kettle 的安装,安装的版本: jdk:jdk-8u152-windows–x64 kettle:KETTLE-5.4 一、环境部署 1、安装JDK,按默认值安装即可 2、...设置环境变量,如图下图 具体步骤: 1.右击我的电脑-属性-高级系统设置-环境变量-系统变量-新建 2.变量名:JAVA_HOME 3.变量值: JDK安装目录 3、 Kettle程序打开(无需安装...(根据自己的系统而定,我的是win64) 4、启动kettle,选择新建连接就可以选择Clickhouse了 目前感觉使用还不错,虽然kettle自带调度任务,但是前提是保持kettle打开,并且作业和转换在运行状态...,这个不太适用与远程服务器安装windows客户端,或者一些学习的同学可以在本地windows设置调度任务也可以,在linux上安装部署kettle并调度是一个比较合适的方法。...因此,在linux中不推荐使用kettle里面的自动执行,使用操作系统的定时执行要稳定的多。 Windows下使用定时任务计划,linux使用crontab。

5.7K21

kettle工具使用及集成

kettle简介 Kettle是一款免费开源的基于Java的企业级ETL工具,功能强大简单易用,无可抗拒。...,可以将多个转换组合成一块进行数据处理 kettle使用方式 1.图形化界面工具(spoon) 上图截取了数据处理的转换脚本,可以看出基于图形化界面操作kettle进行数据处理,只需按照数据处理的流程配置相应的步骤即可...,简单易用,但不适合在程序中集成 2.依赖jar包的方式 应用程序集成kettle更多采用的是maven依赖jar包的方式,在jar包依赖之后可以通过两种方式对数据进行处理: 1)通过调用kettle脚本的方式.../person_import_data.ktr"; // 初始化kettle环境 KettleEnvironment.init(); // new tran的源数据对象 TransMeta transMeta...的api:通过kettle的api可以模拟步骤(step),脱离图形化界面,下面通过kettle的api模拟了一个表输入步骤,但是通过kettle的api模型步骤,适用常用的步骤,很多步骤在api中是没有的

84320

Kettle使用_29 转换里使用参数

Kettle使用_29 转换里使用参数 大家好,我是架构君,一个会写代码吟诗的架构师。...今天说一说Kettle使用_29 转换里使用参数,希望能够帮助大家进步!!!                          ...Kettle使用_29 转换里使用参数 需求:通过Kettle对转换进行参数传递 解决方法:通过环境变量、命名参数、获取系统信息、获取变量等组件对转换进行传值。...Previous work: 这里通过参数组件直接结合文本文件输出的方式展示,实际使用时结合自己的转换即可。 方法一 环境变量 Step1:新建个转换。...Step2:设置环境变量,详细步骤见下: Step3:GUI调用,见方法三 命名参数里的step2,在获取变量里直接获取环境变量值即可。

1.2K30

kettlelinux定时任务_CentOS(Linux)安装KETTLE教程 并配置执行定时任务

1,首先是安装jdk,并设置环境变量 采用yum安装可不设置环境变量 2,下载kettle https://sourceforge.net/projects/pentaho/files/Data%20Integration.../ 请选择我们当前工作的版本7.0 可以使用如下命名直接下载 wget -c –output-document=pdi-ce-7.0.0.0-25.zip https://nchc.dl.sourceforge.net.../project/pentaho/Data%20Integration/7.0/pdi-ce-7.0.0.0-25.zip 3,使用unzip命令对这个压缩包进行解压 unzip pdi-ce-7.0.0.0...-25.zip -d “/opt/kettle” 4,解压后给予相应文件可执行权限 进入到/opt/kettle/data-integration 授予 *.sh +x权限 即可执行权限 5,执行转换...编写测试转换,执行如下命令即可 /opt/kettle-spoon/data-integration/pan.sh -file=/opt/kettle-spoon/ktr/test/test1.ktr

6.3K20

kettle下载安装使用教程

Kettle简介 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行, 数据抽取高效稳定。...Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。...1、Kettle的下载与安装(本文使用kettle版本为pdi-ce-7.1.0.0-12)点击下载地址官方网站 2、下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可。...然后打开Spoon.bat,如图所示: 因为,运行spoon在不同的平台上运行spoon所支持的脚本: Spoon.bat:在Windows平台上运行spoon; Spoon.sh:在Linux、AppleOSX...3、初步启动和使用可能出现的问题总结 因为是纯java编写要安装jdk配置环境变量 如果启动还报错 ERROR:could not create the java virtual machine!

10.7K32
领券