前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ETL(九):同构关联(源限定符转换组件的使用)

ETL(九):同构关联(源限定符转换组件的使用)

作者头像
数据分析与统计学之美
发布2021-11-25 09:50:06
2790
发布2021-11-25 09:50:06
举报
文章被收录于专栏:Python+数据分析+可视化

一、解法一

1、同构关联和异构关联的区别
在这里插入图片描述
在这里插入图片描述

注:同构关联的表出自同一个地方,比如说两张表都来自Oracle数据库;异构关联的表出自不同地方,比如说一张表来自Oracle数据库,一张表来自于MySQL数据库。

2、需求
在这里插入图片描述
在这里插入图片描述
3、ETL开发流程
1)定义源表

① 将scott用户中的emp表和dept表都导入到info中;

在这里插入图片描述
在这里插入图片描述
2)定义目标表

① 由于源表有两个,我们随便拖拉一张表到右侧灰色区域,进行目标表的设置;

在这里插入图片描述
在这里插入图片描述

② 双击该表,进行目标表表名的设置;

在这里插入图片描述
在这里插入图片描述

③ 在原来字段的基础上,新增几个字段,得到最终目标表的字段;

在这里插入图片描述
在这里插入图片描述

④ 生成并执行sql,在目标数据库中生成该目标表;

在这里插入图片描述
在这里插入图片描述

⑤ 取edw用户下,查看该目标表ora_edw_same_join;

在这里插入图片描述
在这里插入图片描述
3)定义映射

① 创建一个映射;

在这里插入图片描述
在这里插入图片描述

② 将源表和目标表都拖拉到右侧的灰色区域;

在这里插入图片描述
在这里插入图片描述

③ 删除emp表和dept表各自的SQ表,效果如下;

在这里插入图片描述
在这里插入图片描述

④ 新建一个“源限定符转换SQ”组件,将上述两张表进行关联;

在这里插入图片描述
在这里插入图片描述

⑤ 完成上述操作后,就会产生如图所示的“源限定符转换SQ”组件;

在这里插入图片描述
在这里插入图片描述

⑥ 双击“源限定符转换SQ”组件,设置上面两张表的关联条件;

在这里插入图片描述
在这里插入图片描述

⑦ 将“源限定符转换SQ”组件中的字段,与目标表之间的字段进行连接;

在这里插入图片描述
在这里插入图片描述

⑧ 使用CTRL + S保存创建的映射;

在这里插入图片描述
在这里插入图片描述
4)定义任务

① 创建一个任务;

在这里插入图片描述
在这里插入图片描述

② 选择该任务要执行的映射;

在这里插入图片描述
在这里插入图片描述

③ 修改源表的连接对象;

在这里插入图片描述
在这里插入图片描述

④ 修改目标表的连接对象;

在这里插入图片描述
在这里插入图片描述

⑤ 使用CTRL + S保存一下该任务;

在这里插入图片描述
在这里插入图片描述
5)定义工作流

① 定义一个工作流;

在这里插入图片描述
在这里插入图片描述

② 建立工作流与任务之间的连接;

在这里插入图片描述
在这里插入图片描述

③ 使用CTRL + S,保存一下工作流;

在这里插入图片描述
在这里插入图片描述

④ 通过任务启动工作流;

在这里插入图片描述
在这里插入图片描述

⑤ 上述操作会自动打开M客户端,我们在M客户端查看一些日志信息。尤其是当我们出现错误的时候,日志信息可以帮助我们找到自己的错误究竟在哪里;

在这里插入图片描述
在这里插入图片描述

⑥ 最后可以去edw用户下,查看目标表中的数据,正是我们想要的效果;

在这里插入图片描述
在这里插入图片描述

二、解法二:直接在info中使用SQL

  在上述操作基础上,进行部分开发步骤的修改即可。为了和上面目标表的结果区分开,我们完成如下效果展示;

在这里插入图片描述
在这里插入图片描述
1、直接从原来创建好的映射那里,开始进行修改;

① 先来查看一下之前创建好的映射,是啥样;

在这里插入图片描述
在这里插入图片描述

② 删除原来的“源限定符转换SQ”组件;

在这里插入图片描述
在这里插入图片描述

③ 重新添加一个“源限定符转换SQ”组件;

在这里插入图片描述
在这里插入图片描述

完成上述操作后,就会出现如下界面;

在这里插入图片描述
在这里插入图片描述

④ 双击c,就会出现如下界面;

在这里插入图片描述
在这里插入图片描述

⑤ 在上述基础上,进行如下操作(这一步很关键);

在这里插入图片描述
在这里插入图片描述

注意!注意!注意!上述操作只是第一步,接着进行下面这一步;

在这里插入图片描述
在这里插入图片描述

⑥ 然后在将“源限定符转换SQ”组件中的字段,全部传递给目标表中的字段;

在这里插入图片描述
在这里插入图片描述

⑦ 使用CTRL + S保存修改好的映射;

在这里插入图片描述
在这里插入图片描述

⑧ 重新刷新一下映射;

在这里插入图片描述
在这里插入图片描述

⑨ 使用CTRL + S保存;

在这里插入图片描述
在这里插入图片描述

⑩ 重新启动任务;

在这里插入图片描述
在这里插入图片描述

注意:可以看到这里拒绝了一行,那是因为我们做右连接的时候,最后一条数据emptno为空,但是emptno在目标表中又是一个主键,因此不允许插入,因此目标表中仍然是14条记录。 ⑪ 可以去edw用户下,检验一下目标表中的数据;

在这里插入图片描述
在这里插入图片描述
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/12/23 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、解法一
    • 1、同构关联和异构关联的区别
      • 2、需求
        • 3、ETL开发流程
          • 1)定义源表
          • 2)定义目标表
          • 3)定义映射
          • 4)定义任务
          • 5)定义工作流
      • 二、解法二:直接在info中使用SQL
        • 1、直接从原来创建好的映射那里,开始进行修改;
        相关产品与服务
        数据库
        云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档