首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用kettle按天抽取数据

需求背景:    因xx需求要导出数据,研发给到一个A JOIN B JOIN C + dependent query 的复杂查询。直接查询的话,特别慢(可能小时级别都出不来结果)。...分析了下这个查询中,如果在where条件中拼上个驱动表的索引列(例如主键列或者create_time列之类), 可以将join的数据集控制在一个很小的范围内。...这个方法有了后,我们可以用程序去跑,也可以用kettle去跑。 下面是用kettle 按天去跑的案例, 为了演示做了很多精简。...3、将step2的数据集写到一个临时的表里面 4、重复执行step2、step3 5、最后将临时表的数据导出 job如下图: 注意的是,中文乱码的问题解决方法: 1、修改数据源的选项,加上字符集设置...2、修改kettle启动文件,以win环境下为例,修改 Spoon.bat ,增加如下:

1.6K50

Kettle构建Hadoop ETL实践(五):数据抽取

目录 一、Kettle数据抽取概览 1. 文件抽取 (1)处理文本文件 (2)处理XML文件 2. 数据抽取 二、变化数据捕获 1. 基于源数据的CDC 2. 基于触发器的CDC 3....首先简述Kettle中几种抽取数据的组件,然后讲述变化数据捕获(Change Data Capture,CDC),以及Kettle如何支持不同的CDC技术。...最后我们使用Kettle里的Sqoop作业项以及基于时间戳的CDC转换实现销售订单示例的数据抽取过程,将MySQL中的源数据抽取到Hive的rds数据库中。...一、Kettle数据抽取概览 Kettle大部分数据抽取类的步骤都放在“输入”类别下。输入类的步骤,顾名思义就是从外部数据抽取数据,把数据输入到Kettle数据流中。...最后再创建一个功能相反的转换,从MySQL表中抽取数据并保存成XML文件。

6.3K30
您找到你想要的搜索结果了吗?
是的
没有找到

ods mysql_ODS数据抽取平台

一、产品简介 ODS数据抽取平台是数据仓库对数据进行精细加工的中间环节,将加工后的数据存储到ODS数据模型中,以便总账,报表,数据仓库使用。...通过和外系统集成,可以实现定时调度ODS平台的功能,这样就不需要人工去触发ODS了,在夜间也可以进行数据抽取的功能。...B、实时脚本监测 在抽数任务启动后,用户需要实时监控数据抽取脚本的运行状态。通过脚本状态实时监控页面可以查询当前正在运行脚本的各项运行状态。脚本实时监控页面还可以显示每个脚本下所有步骤的运行状态。...C、任务状态查询 每次数据抽取任务从触发开始到结束,数据抽取平台会根据运行的任务编号,记录抽数任务的运行状态的详细信息,通过任务状态查询平台,可以查询每次任务运行的历史记录和每次抽数任务脚本的详细信息,...E、抽数日志查看 抽数日志查看功能供用户查看抽取日志使用。用户可在该界面选择查看某天的日志详细信息并可下载所需日子。

1.5K10

程序员小sister的烦恼_快速上手大数据ETL神器Kettle(xls导入mysql)

数据抽取的需求 需要从Excel中将这些用户的数据,使用Kettle抽取MySQL中 准备工作 为了完成本案例,我们需要准备以下几件工作: 找到小姐姐的Excel文件 在资料/测试数据 文件夹中可以找到...user.xlsx文件 4.3.2 在MySQL数据库中创建数据库 为了方便将Excel文件中的数据抽取MySQL中,我们必须要创建一个名字叫kettle_demo的数据库,后续Excel中的数据会装载到该数据库的表中...配置Kettle数据流图中的组件 刚刚已经把数据流图构建好了,那么Kettle就可以将Excel文件中的数据抽取MySQL中吗?...Kettle根本不知道要将哪个Excel文件中的数据抽取到哪个MySQL中。我们需要配置这两个组件,告诉Kettle从哪个Excel文件中抽取,以及将数据装载到哪个MySQL中。...日志,说明Kettle的转换已经执行成功!! 确认执行结果 Kettle是否已经帮助我们将Excel中的数据抽取并装载到MySQL呢?

1K20

程序员小姐姐的烦恼_快速上手大数据ETL神器Kettle(xls导入mysql)

数据抽取的需求 需要从Excel中将这些用户的数据,使用Kettle抽取MySQL中 准备工作 为了完成本案例,我们需要准备以下几件工作: 找到小姐姐的Excel文件 在资料/测试数据 文件夹中可以找到...4.3.2 在MySQL数据库中创建数据库 为了方便将Excel文件中的数据抽取MySQL中,我们必须要创建一个名字叫kettle_demo的数据库,后续Excel中的数据会装载到该数据库的表中。...配置Kettle数据流图中的组件 刚刚已经把数据流图构建好了,那么Kettle就可以将Excel文件中的数据抽取MySQL中吗? 显然是不行的。...Kettle根本不知道要将哪个Excel文件中的数据抽取到哪个MySQL中。我们需要配置这两个组件,告诉Kettle从哪个Excel文件中抽取,以及将数据装载到哪个MySQL中。...日志,说明Kettle的转换已经执行成功!! ? ? 确认执行结果 Kettle是否已经帮助我们将Excel中的数据抽取并装载到MySQL呢?

1.4K20

Kettle使用小结

♂️简介:Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。...启动方式:解压到本地,mac启动方式 /路径/pdi-ce-9.1.0.0-324/data-integration/spoon.sh ⚠️MySql数据抽取:如果使用MySql数据库下载jar https...->Add->Other Repositories->Database Repository->Get Started(后面就是创建mysql相关数据库链接信息) ?...举例子: 第一种:从A表->抽数据到->B表(可不同数据库) 启动kettle step 1:左侧操作区->核心对象Tab->输入->选择“表输入”->拖拽到右侧操作区 step 2:左侧操作区->核心对象...4:双击“插入/更新”->选择数据库链接->选择表->“用来查询的关键字”->选择类似UK的字段(据此判断插入or更新数据)->“更新字段”(表字段列:要抽取到的目标表字段;流字段列:被抽取的表字段,

1.4K40

企业实战(20)ETL数据库迁移工具Kettle的安装配置详解

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。...ETL(Extract-Transform-Load的缩写),即数据抽取、转换、装载的过程。...在使用中我感觉这个工具真的很强大,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它...易配置 可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 不同数据库 ETL工具集,它允许你管理来自不同数据库的数据。...6.创建数据库连接 输入连接名称、选择类型(根据自身所需选择,这里连接的是mysql数据库,如连接其他数据库,需将数据库驱动放在kettle根目录中的lib下面,然后启动数据库重启kettle)确认输入无误后点击测试

1.2K10

Kettle教程 程序员小姐姐的第二次邂逅——JOB(作业)开发

程序员小姐姐的第二次邂逅——JOB 前几天帮助程序员小姐姐小花解决了使用Kettle从Excel中抽取数据MySQL问题,小姐姐特别高兴,请你吃了一顿饭,好一顿魂牵梦绕。...项目经理要求小姐姐小花能够每5秒钟执行一次Kettle转换,也就是每5秒钟将Excel中的数据抽取并装载到MySQL中。 怎么实现呢?...要实现这个需求,我们需要学习Kettle的JOB,也就是作业。 Kettle中的作业(job)定义了转换应该如何执行,可以配置转换来进行定时执行。...JOB定时任务开发 2.1 需求 每5秒钟执行一次Kettle转换,也就是每5秒钟将Excel中的数据抽取并装载到MySQL中 2.2 创建作业 2.3 构建作业流组件图 效果图: image.png...2.5 启动运行作业 点击播放箭头启动作业,并观察数据库中的数据是否会5秒钟增加一次。 我们看到数据每隔5秒钟就会增加一次。

48131

开源基于开源Kettle自研的大数据调度服务监控平台

本产品是基于开源Kettle自研的Kettle核心接口调用基础组件,其实早在5年前就想搞了,构思了很久,拖到现在,不过还行,现在也不晚吧 最初的想法是启蒙于当年给烟草做过的一个数据交换平台的项目,数据抽取是基于...Kettle 5.x版本, 使用kettle的spoon客户端做的数据抽取 为企业解决了棘手并且重要的ETL问题,因此Kettle是一款非常优秀的开源数据抽取工具。...、丑陋,生产环境无法投入使用 基于上述几个企业痛点,我才决定工作之余,每天借用一点休息时间,慢慢积累,坚持不懈,才有了今天Smart Kettle调度平台的出世,也希望能切实 帮助到企业解决数据抽取、调度...提供Druid数据库查询脚本的实时监控能力 支持 Kettle 7.0.1+以上 版本 当前Kettle版本为9.2.0.0-179(注意:需要配置kettle-password-encoder-plugins...,本系统已经集成进来,不需要再配置) Maven3+ Jdk1.8+ Mysql5.7+ https://gitee.com/yaukie/x-smart-kettle-server

2.6K10

Kettle(PDI)的坑,有点大

说起ETL工具,很多人都觉得这个东西简单,不用学Mysql,不用学大数据的编程,简单的通过图形化的拖拉拽,就能实现对数据抽取、转换、加载,而实际上往往并非如此,在复杂一点的应用场景上,往往就会出现一些意想不到的坑...Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。...而Kettle实现起来则要复杂很多,首先要在一个Transformer里面读取mysql数据,然后存到结果集;在上层的Job里面,需要写一个Javascript,在里面读取结果数据。...3.Minus操作 如果要实现类似mysql里面的minus操作(也就是一个数据集减去另外一个数据集),Kettle实现起来要麻烦一些,一般想把两个数据集用full outer join的方式连接起来,...4.将变量更新到数据集中 如果要对mysql查询后的数据做变更,比如说增加一个字段,字段的值为某个变量,这个往往需要在mysql的查询中先新增一个值为null的字段,然后在后面增加一个“Set field

8K41
领券