前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ETL 是什么 ETL 工具有哪些 ETL 数据交换系统

ETL 是什么 ETL 工具有哪些 ETL 数据交换系统

原创
作者头像
威哥
发布2023-02-01 16:03:10
2.1K0
发布2023-02-01 16:03:10
举报
文章被收录于专栏:etletl

ETL简介

  • ETL是英文Extract-Transform-Load的缩写。
  • 用来描述将数据从源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
  • 它能够对各种分布的、异构的源数据(如关系数据)进行抽取。
  • 按照预先设计的规则将不完整数据、重复数据以及错误数据等“脏"数据内容进行清洗。
  • 得到符合要求的“干净”数据,并加载到数据仓库中进行存储。

这些“干净”数据就成为了数据分析、数据挖掘的基石。

ETL重要性

  • ETL是实现商务智能(Business Intelligence,BI)的核心。
  • 一般情况下,ETL会花费整个BI项目三分之一的时间,因此ETL设计得好坏直接影响BI项目的成败。

ETL工具有哪些

  • datastage (收费) 最专业的ETL工具, 2005年被IBM收购,目前发展到11.7版本。
  • informatica (收费) informatica创立于1993年,专业程度与Datastage旗鼓相当。
  • ODI (收费) oracle数据库厂商提供的工具,有局限性,与oracle数据库耦合太深。
  • kettle(免费) Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定,但学习及维护成本太高。
  • etl-engine (免费) 用go语言实现的ETL工具,轻量级引擎、跨平台(windows,linux,unix,mac)、可嵌入go语言脚本并解析执行,方便集成到各种项目中

参考资料

代码语言:shell
复制
  [资源下载](https://github.com/hw2499/etl-engine/releases)
  [etl-engine使用手册](https://github.com/hw2499/etl-engine)
  [etl-crontab使用手册](https://github.com/hw2499/etl-engine/wiki/etl-crontab%E8%B0%83%E5%BA%A6)
  [嵌入脚本开发](https://github.com/hw2499/etl-engine/wiki/%E5%B5%8C%E5%85%A5%E8%84%9A%E6%9C%AC%E5%BC%80%E5%8F%91)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ETL简介
  • ETL重要性
  • ETL工具有哪些
  • 参考资料
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档