首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

0549-6.1-如何在SUSE12 SP3安装CDH6.1

作者:李继武

1

基础设施

2.1

硬件配置

2.2

软件环境

2.3

角色部署

2.4

Access UI

2.5

Postgresql

元数据库使用的是外部数据库:Postgresql数据库

Address:128.18.9.208:5432

2.6

数据目录信息

3

集群基本配置及部署安装

因节点之间通过root用户相互ssh的权限被关闭,所以不能使用控制台自动化安装agent,需要手动到所有节点安装agent,并修改相关配置。

3.1

前置准备

以下条件原集群已配置完成:

Hosts文件已配置

Ntp时钟同步

防火墙已关闭

Selinux已关闭

1. 修改swappiness

2. 从系统镜像挂载点配置repo

vim /etc/zypp/repos/iso.repo

3. 安装httpd

4. 利用httpd制作系统镜像本地zypper源

在apache2的配置文件中添加该文件夹

vim /etc/apache2/httpd.conf

5. 利用httpd制作cm本地zypper源和parcel源

将cm的安装包上传到cm6.1.0目录下,特别注意的是,SUSE系统还需要下载一个python-psycopg2依赖包上传到cm6.1.0下

在apache2的配置文件中添加这两个文件夹

vim /etc/apache2/httpd.conf

6. 所有节点配置镜像源和cm源

vim /etc/zypp/repos/iso.repo

vim /etc/zypp/repos/cm.repo

3.2

CM节点安装server、agent

1. 安装jdk1.8

2. 安装cloudera-manager-server、cloudera-manager-agent

3. 修改agent的配置文件,修改其连接的server主机,log目录以及lib目录

在数据盘下创建目录

将原来的目录移到这两个目录下

启动agent

4. 修改server的启动脚本,配置log目录

将目录文件移到数据盘上

5. 初始化cloudera-scm-server的数据库

6. 配置postgresql数据库驱动

将驱动上传到httpd节点的/srv/www/htdocs/cdh6.1.0目录下,其他节点通过wget进行拉取

7. 启动server

3.3

其他节点安装agent

剩余节点都需要手动执行以下操作,手动安装agent并修改配置

1. 安装jdk1.8

2. 安装cloudera-manager-agent

3. 修改agent的配置文件,修改其连接的server主机,log目录以及lib目录

在数据盘下创建目录

将原来的目录移到这两个目录下

4. 配置postgresql数据库驱动

5. 启动agent

3.4

修改数据盘所属用户及权限

由于原来数据盘都是由ods用户挂载,并且权限是700,这将导致root安装集群时无法生成所需目录,最终安装失败

修改这些数据盘目录所属用户为root,所属用户组为root,权限赋予755

4

控制台安装

1. 打开http://128.18.9.209:7180,以admin/admin登录

2. 点“继续”

3. 勾选同意,点继续

4. 选择“60天试用版”,点击继续

5. 点击“继续”

6. 点击“当前管理主机”,全部勾选,点击“继续”

7. 点击“更多选项”

8. 将其他的parcel路径删掉,添加自己制作的parcel包下载路径

9. 点击继续

10. 开始下载并分发parcel包,等待下载分发激活完成

11. 确保下方的主机检查项全部通过,点击“继续”

12. 点击“自定义服务”,勾选需要的服务

13. 输入元数据库的信息,测试连接

14. 配置相关目录

Datenode数据目录暂时默认即可,后期根据不同的节点分配不同的角色组,来分配不同的目录。

Namenode数据目录:

SecondaryNamenode数据目录:

CM服务数据目录:

NodeManager数据目录:

Zookeeper数据目录:

15. 点击“继续”,等待安装完成。

16. 配置DataNode目录,先配置角色组,设置Datanode角色为三个组,Datenode Default Group,onlywithzk,withnamenode:

17. 根据不同的角色来分配datanode目录,以为namenode、zk、journalNode留出独立的数据盘:

5

启用HA

本集群启用了HDFS,YARN的高可用

JournalNode数据目录为:

6

配置组件的log,tmp等目录

7

集群基本配置

7.1

Cloudera Manager

这些服务主要是提供监控功能,目前的调整主要集中在内存放,以便有足够的资源完成集群管理。

7.2

HDFS配置

7.3

YARN配置

7.4

Zookeeper配置

7.5

Hive配置

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190222B018UR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券