前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据数据传输篇之DataX

大数据数据传输篇之DataX

作者头像
Freedom123
发布2024-03-29 09:47:42
950
发布2024-03-29 09:47:42
举报
文章被收录于专栏:DevOpsDevOps

一. 简介

DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能

设计理念

为了解决异构数据源同步问题,DataX将复杂的网状的同步链路变成了星型数据链路,DataX作为中间传输载体负责连接各种数据源。当需要接入一个新的数据源的时候,只需要将此数据源对接到DataX,便能跟已有的数据源做到无缝数据同步

二. 核心

架构图
datax 3.0 核心架构
核心优势
  1. 可靠的数据质量监控
  2. 丰富的数据转换功能
  3. 精准的速度控制
  4. 强劲的同步性能
  5. 健壮的容错机制
  6. 线程级别重试
与sqoop 的对比

三. 其他

1. 学习

https://www.jianshu.com/p/f5f0dc99d5ab ***** https://tech.youzan.com/datax-in-action/ https://github.com/alibaba/DataX //阿里

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2024-03-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一. 简介
    • 设计理念
    • 二. 核心
      • 架构图
        • datax 3.0 核心架构
          • 核心优势
            • 与sqoop 的对比
            • 三. 其他
              • 1. 学习
              相关产品与服务
              大数据
              全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档