前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >将 Oozie 迁移到 CDP

将 Oozie 迁移到 CDP

作者头像
大数据杂货铺
发布2021-10-09 14:54:47
5350
发布2021-10-09 14:54:47
举报
文章被收录于专栏:大数据杂货铺大数据杂货铺

这是CDH/HDP/Apache Hadoop迁移到CDP系列的博客,如对迁移感兴趣,请关注该系列之前博客《使用 Replication Manager 迁移到CDP 私有云基础》、《将数据迁移到CDP 私有云基础的数据迁移用例》、《将Hive数据迁移到CDP》、《将 Kudu 数据迁移到 CDP》、《将 HBase 迁移到 CDP》、《将 Accumulo 迁移到 CDP》、《安全和治理迁移到CDP》。

将 Oozie 数据迁移到 CDP 后,您必须首先配置 Oozie,然后将自定义 ShareLib jar 迁移到您的新集群。

您必须将 Oozie 配置为使用不同的 CDP 服务,包括 Sqoop 操作、Yarn 作业和 HDFS HA。有关配置这些服务的信息,请参阅配置 Oozie。

笔记

默认情况下,Oozie 服务安排内部作业从数据库中清除所有早于 30 天的 Oozie 工作流。但是,在协调器完成之前,与长时间运行的协调器相关联的操作不会清除。Cloudera 建议您使用空数据库为 CDP 配置 Oozie。要查看旧数据,您可以备份并对该数据运行 SQL 查询。您必须重新创建长时间运行的协调器作业,因为 CDP 环境与 HDP 和 CDH 的环境不同。

程序

配置 Oozie 后,您必须将自定义 ShareLib jar 迁移到新集群。

  1. 从 HDP 或 CDH 集群复制 Oozie ShareLib jar:

cp /user/oozie/share/lib/lib_{TIMESTAMP}/{COMPONENT}

Oozie ShareLib 的位置在 HDP、CDH 和 CDP 环境中是相同的。

  1. 将 ShareLib 粘贴到 CDP 环境的新文件系统中。

paste /user/oozie/share/lib/lib_{TIMESTAMP}/{COMPONENT}

笔记

这些文件必须存在于存储(如 HDFS、S3 等)上,而不是存在于您安装 Oozie 的主机上。

  1. 执行 ShareLib 更新:

oozie admin -oozie {OOZIE_URL} -sharelibupdate

迁移自定义 ShareLib jar 后,更新 DFS 路径、JDBC URL(例如 Hive)等的工作流 XML 文件,以管理新环境。

原文链接:https://docs.cloudera.com/cdp-private-cloud-upgrade/latest/data-migration/topics/cdp-data-migration-oozie-migration.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据杂货铺 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 这是CDH/HDP/Apache Hadoop迁移到CDP系列的博客,如对迁移感兴趣,请关注该系列之前博客《使用 Replication Manager 迁移到CDP 私有云基础》、《将数据迁移到CDP 私有云基础的数据迁移用例》、《将Hive数据迁移到CDP》、《将 Kudu 数据迁移到 CDP》、《将 HBase 迁移到 CDP》、《将 Accumulo 迁移到 CDP》、《安全和治理迁移到CDP》。
相关产品与服务
专用宿主机
专用宿主机(CVM Dedicated Host,CDH)提供用户独享的物理服务器资源,满足您资源独享、资源物理隔离、安全、合规需求。专用宿主机搭载了腾讯云虚拟化系统,购买之后,您可在其上灵活创建、管理多个自定义规格的云服务器实例,自主规划物理资源的使用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档