描述
将集群从 Hive1 /2升级到 Hive3?这包括:CDH5→CDP、CDH6→CDP、HDP2→HDP3 或 HDP2→CDP。这种升级的挑战有多种形式。此工具旨在(多次)在 Hive1/2 环境中运行,以收集有关在尝试升级之前需要解决的“什么”的详细信息。
如何使用
包含在 Github 自述文件中:https://github.com/dstreev/cloudera_upgrade_utils/blob/master/hive-sre/README.md
日期 | 标题 | 关联 | 笔记 | 由某人交付 |
---|---|---|---|---|
2020-12-03 | 最新发布 | 发布 | David Streever | |
2021-03-29 | v2.3.5.0 | 发布 | HiveStrictManagedMigration 白名单。Kudu Legacy Class DiscoveryDECIMAL Legacy Issue DiscoveryPostgreSQL 分区计数的语法修复 | David Streever |
2021-05-03 | v2.3.5.3 | 发布 | 修复了非 ha hdfs 环境的问题(hadoop-cli 依赖项)。增加了我们可以处理的数据库数量的可扩展性。 | David Streever |
2021-05-07 | v2.3.5.6 | 发布 | 更改了规模的线程模型和更好的大型元存储资源管理。修复了 Metastore 报告。 | David Streever |
此应用程序有 3 个子程序:
子程序 | 数据库 | 版本 | 已测试 | 笔记 |
---|---|---|---|---|
u3 | MySQL | 5.6 | 有限的测试 | 建议升级5.7。这是用于 HDP 的较低 MySql 支持的环境 |
5.7 | Yes | |||
5.7 | Yes | |||
8.0 | No | CDH/HDP 不支持 | ||
MariaDB | 10.1 | No,但应该像 10.2 一样工作 | ||
10.2 | Yes | |||
PostgreSQL | 9.6 | No,但应该工作 | ||
10 | Yes | 现场测试,可能仍然是测试的比较粗糙 | ||
11 | No,但应该在 10 下工作 | |||
Oracle | 12 | Yes | 现场测试,可能仍然是测试的比较粗糙 | |
sre | MySQL | 5.6 | 有限的测试 | 建议升级5.7。这是用于 HDP 的较低 MySql 支持的环境 |
5.7 | Yes | |||
5.7 | Yes | |||
8.0 | No | CDH/HDP 不支持 | ||
MariaDB | 10.1 | 不,但应该像 10.2 一样工作 | ||
10.2 | Yes | |||
PostgreSQL | 9.6 | No,但应该工作 | ||
10 | Yes | 现场测试,可能仍然是测试的比较粗糙 | ||
11 | No,但应该在 10 下工作 | |||
Oracle | 12 | Yes | 现场测试,可能仍然是测试的比较粗糙 |
确保${HOME}/.hive-sre/aux_libs目录中有适合数据库的驱动程序。
我已经尝试尽可能多地匹配 HDP 2.6.5 和 3.1.x 及CDH5/6支持的数据库。
使用预建的二进制文件!!!如果不下载和构建“Hadoop Cli”,您将没有从头开始构建所需的依赖项。
不要构建,在这里下载最新的二进制文件!!!
tar xzvf hive-sre-dist.tar.gz
cd hive-sre
./setup
这将创建和安装hive-sre和hive-sre-cli应用程序到您的路径。
在具有默认配置的主机上试用(如果已进行 kerberized,请先获取票证):
hive-sre-cli
或者
hive-sre
有关详细信息,请参阅配置文档。
为了简化下面的应用程序的启动,请配置这些核心环境变量。
hive-sre sre -db priv_dstreev -cfg /tmp/test.yaml -o ./sre-out`
输出是一组带有操作和错误信息(遇到时)的文件。这些文件可能是txt文件或markdown. 您可能希望使用markdown查看器来更轻松地查看这些报告。markdown查看器需要支持github markdown表。
只有活动进程会显示在 UI 中。UI 将每秒刷新一次并在下方显示当前详细信息。
u3中定义了几个“进程” 。每个进程将运行 1 个或多个“子进程”。UI 中的计数器列表特定于该部分中的“进程”和“子进程”。
并发进程数由parallelism上面定义的配置yaml中的变量控制。
sort -k 1 --field-separator="|" loc_scan_missing_dirs.md > loc_scan_missing_dirs_sorted.txt
原文链接:https://github.com/dstreev/cloudera_upgrade_utils/blob/master/hive-sre/README.md