前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据平台 CDH 6.2 搭建

大数据平台 CDH 6.2 搭建

作者头像
木野归郎
发布2020-06-15 14:56:55
1.1K0
发布2020-06-15 14:56:55
举报
文章被收录于专栏:share ai happiness

https://archive.cloudera.com/cm6/6.2.0/redhat7/yum/RPMS/x86_64/

CDH6.2.0安装包地址:

https://archive.cloudera.com/cdh6/6.2.0/parcels/

由于我们的操作系统为CentOS7,需要下载以下文件:

当然你还可以选择我的资料

链接:

https://pan.baidu.com/s/1dj-UhMKkxsj7Aw9btqcuZg

提取码:zo7r

系统准备

1. 准备虚拟机(根据自己的系统资源分配虚拟机资源)

操作系统

CPU

内存

硬盘

hostname

ip

角色

CentOS(64位)

2vCPU

16GiB

800GiB

manager

192.168.124.100

clouder-manager

CentOS(64位)

2vCPU

32GiB

800GiB

node1

192.168.124.101

CentOS(64位)

2vCPU

32GiB

800GiB

node2

192.168.124.102

CentOS(64位)

2vCPU

32GiB

800GiB

node3

192.168.124.103

2. 静态IP设置(每个节点)

sudo su -- 切换到root用户

代码语言:javascript
复制
vi /etc/sysconfig/network-scripts/ifcfg-ens192
代码语言:javascript
复制
service network restart 重启网络生效
yum install -y net-tools ifconfig查看设置

3. 编辑/etc/hosts文件(每个节点)

代码语言:javascript
复制
vim /etc/hosts

[root@10-43-75-89 ecarx_dev]# hostnamectl set-hostname slave02

192.168.124.100 master

192.168.124.101 slave01

192.168.124.102 slave02

192.168.124.103 slave03

4. 关闭防火墙、禁止防火墙开机自启(每个节点)

  • systemctl stop firewalld 关闭防火墙
  • systemctl disable firewalld 禁止防火墙开机自启
  • vi /etc/selinux/config —> SELINUX=disabled (修改)

5. ssh无密码登录,只需要执行红色的都行

  • manager节点执行ssh-keygen -t rsa 一路回车到结束,在/root/.ssh/下面会生成一个公钥文件id_rsa.pub
  • cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys 将公钥追加到authorized_keys
  • chmod 600 ~/.ssh/authorized_keys 修改权限
  • 将~/.ssh从当前节点分发到其他各个节点。如:scp -r ~/.ssh/ root@node1:~/.ssh/

[root@master parcel]# for i in {1..2}; do ssh -p52222 root@slave0$i cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys; done

[root@master parcel]# for i in {1..2}; do scp -P52222 /root/.ssh/authorized_keys root@slave0$i:/root/.ssh/authorized_keys; done

ssh-keygen -t rsa

[root@master ecarx_dev]# ssh-copy-id master [root@master ecarx_dev]# ssh-copy-id slave01 [root@master ecarx_dev]# ssh-copy-id slave02

scp -P52222 ./aa.txt 10.43.75.89:/

1、scp指定端口传输,端口需放在scp后面 scp -P52222 -r ~/.ssh/ root@10.43.16.89:~/.ssh/ scp -P 34543 -r spark xiaojp@120.26.233.3:~/2、ssh指定端口登录:ssh -p 34543 xiaojp@120.26.233.3 scp -P52222 ./abc.txt root@10.43.16.89:/root

  • ssh 各个节点互相登陆

6. 配置NTP服务(所有节点如果公司的时间同步则可以跳过)

  • 修改时区(改为中国标准时区)ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
  • 安装ntp yum -y install ntp
  • ntp主机配置 vim /etc/ntp.conf
  • manager节点
  • 其余节点
  • 重新启动 ntp 服务:service ntpd restart
  • 设置开机自启:systemctl enable ntpd.service
  • ntpdc -c loopinfo #查看与时间同步服务器的时间偏差
  • ntpq -p #查看当前同步的时间服务器
  • ntpstat #查看状态
  • 配置成功状态(服务开启后前面出现*说明成功):

7. 修改Linux swappiness参数(所有节点)

为了避免服务器使用swap功能而影响服务器性能,一般都会把vm.swappiness修改为0(cloudera建议10以下)

echo 0 > /proc/sys/vm/swappiness

这样操作重启机器还是还原

修改配置文件,开机自动设置参数

编辑vim /etc/sysctl.conf

在最后添加vm.swappiness=0

  • 上述方法rhel6(指的是以前的版本centos5左右的)有效,rhel7.2中:tuned服务会动态调整系统参数
  • 查找tuned中配置,直接修改配置
  • cd /usr/lib/tuned/
  • grep “vm.swappiness” * -R 查询出后依次修改
  • 上述方法不能用
  • [root@ceph2 lib]# cd /usr/lib/tuned/
  • [root@ceph2 tuned]# grep "vm.swappiness" * -R
  • 在进行各个设置为0 swappiness

修改完确认:

  • 参考:sysctl修改内核参数

重启不生效:

https://blog.csdn.net/ygtlovezf/article/details/79014299

8. 禁用透明页(所有节点)

  • echo never > /sys/kernel/mm/transparent_hugepage/defrag
  • echo never > /sys/kernel/mm/transparent_hugepage/enabled
  • 永久生效 在/etc/rc.local 添加上面命令
  • vi /etc/rc.local
  • 给与可执行权限:chmod +x /etc/rc.local

9. JDK安装(所有节点)

  • rpm -qa | grep java # 查询已安装的java
  • yum remove java* # 卸载
  • rpm-ivh oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm
  • vi /etc/profile 末尾添加
代码语言:javascript
复制
# java 
export JAVA_HOME=/usr/java/jdk1.8.0_181-clouderaexport 
CLASSPATH=.:$CLASSPTAH:$JAVA_HOME/libexport 
PATH=$PATH:$JAVA_HOME/bin
  • source /etc/profile
  • java -version验证

10. 创建/usr/share/java目录,将mysql-jdbc包放过去(所有节点)

  • mkdir -p /usr/share/java
  • mv/opt/mysql-j/mysql-connector-java-5.1.34.jar /usr/share/java/
  • mysql-connector-java-5.1.34.jar 一定要命名为mysql-connector-java.jar
  • mv./mysql-connector-java-5.1.34.jar mysql-connector-java.jar

11. 为保证防火墙、虚拟机参数修改后生效,各节点机器需要重启 reboot

12. Mysql安装

  • 卸载mariadb:rpm -qa|grep mariadb
  • rpm -e --nodeps mariadb-libs-5.5.60-1.el7_5.x86_64
  • cd /opt/mysql/
  • tar -xvf ./mysql-5.7.19-1.el7.x86_64.rpm-bundle.tar
  • rpm -ivh mysql-community-common-5.7.19-1.el7.x86_64.rpm
  • rpm -ivh mysql-community-libs-5.7.19-1.el7.x86_64.rpm
  • rpm -ivh mysql-community-client-5.7.19-1.el7.x86_64.rpm
  • rpm -ivh mysql-community-server-5.7.19-1.el7.x86_64.rpm
  • rpm -ivh mysql-community-libs-compat-5.7.19-1.el7.x86_64.rpm
  • MYSQL配置:
  • mysqld --initialize --user=mysql # 初始化mysql使mysql目录的拥有者为mysql用户
  • cat /var/log/mysqld.log # 最后一行将会有随机生成的密码
  • systemctl start mysqld.service # 设置mysql服务自启
  • mysql -uroot –p 如果不能登陆
  • 设置免密登录并重启mysql服务(先开启免密登陆,设置完密码以后,一定要注释了restart)
  • vi /etc/my.cnf
  • 注意:字母的符号一定是英文的否则报错
  • systemctl restart mysqld
  • #登录
代码语言:javascript
复制
$>mysql -u root
mysql>use mysql;
mysql>update user set authentication_string = password('123456'), password_expired = 'N', password_last_changed = now() where user = 'root';
mysql>exit;

在这里进行之后,把skip-grant-tables 注释,重新启动mysql,链接mysql

代码语言:javascript
复制
mysql -uroot -p123456
  • 创建库(后续安装服务等使用)
  • cmserver

CREATE DATABASE test DEFAULT CHARSET utf8 COLLATE utf8_general_ci;

CREATE DATABASE cmserver DEFAULT CHARSET utf8 COLLATE utf8_general_ci; GRANT ALL ON cmserver.* TO 'cmserver'@'%' IDENTIFIED BY 'Yyf5211314!'; hive中的元数据 CREATE DATABASE metastore DEFAULT CHARSET utf8 COLLATE utf8_general_ci; GRANT ALL ON metastore.* TO 'hive'@'%' IDENTIFIED BY 'Yyf5211314!'; Activity Monitor CREATE DATABASE amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci; GRANT ALL ON amon.* TO 'amon'@'%' IDENTIFIED BY 'Yyf5211314!'; ReportsManager CREATE DATABASE rman DEFAULT CHARSET utf8 COLLATE utf8_general_ci; GRANT ALL ON rman.* TO 'rman'@'%' IDENTIFIED BY 'Yyf5211314!'; CREATE DATABASE oozie DEFAULT CHARSET utf8 COLLATE utf8_general_ci; GRANT ALL ON oozie.* TO 'oozie'@'%' IDENTIFIED BY 'Yyf5211314!'; HUE CREATE DATABASE hue DEFAULT CHARSET utf8 COLLATE utf8_general_ci; GRANT ALL ON hue.* TO 'hue'@'%' IDENTIFIED BY 'Yyf5211314!'; Navigator Audit Server CREATE DATABASE nav DEFAULT CHARSET utf8 COLLATE utf8_general_ci; GRANT ALL ON nav.* TO 'nav'@'%' IDENTIFIED BY 'Yyf5211314!'; Navigator Metadata Server CREATE DATABASE navms DEFAULT CHARSET utf8 COLLATE utf8_general_ci; GRANT ALL ON navms.* TO 'navms'@'%' IDENTIFIED BY 'Yyf5211314!';

授权用户 (1)任意主机以用户root和密码pwd连接到mysql服务器 mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'pwd' WITH GRANT OPTION; mysql> flush privileges; (2)指定IP为(如192.168.1.100)的主机以用户tuser和密码tpwd连接到mysql服务器 mysql> GRANT ALL PRIVILEGES ON *.* TO 'tuser'@'192.168.1.100' IDENTIFIED BY 'tpwd' WITH GRANT OPTION; mysql> flush privileges;

//允许root用户进行访问链接

代码语言:javascript
复制
use mysql

mysql> select host, user from user; +-----------+---------------+ | host | user | +-----------+---------------+ | % | amon | | % | amonuser | | % | cmserver | | % | cmserveruser | | % | hive | | % | hiveuser | | % | hue | | % | hueuser | | % | nav | | % | navms | | % | oozie | | % | oozieuser | | % | rman | | % | rmanuser | | % | root | | % | sentry | | localhost | mysql.session | | localhost | mysql.sys | | localhost | root | +-----------+---------------+

GRANT ALL PRIVILEGES ON *.* TO 'root'@'%'IDENTIFIED BY '123456' WITH GRANT OPTION; FLUSH PRIVILEGES;

13. 安装Httpd服务(manager)

  • yum install httpd
  • service httpd start
  • systemctl enable httpd.service 设置httpd服务开机自启

14. 防止出现莫名错误,事先安装以下插件(所有节点)(我只在主节点)这一步我没成功,而是更新本地的yum源以后,进行的第17没有执行

  • yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server --skip-broken --nogpgcheck

15. 配置Cloudera Manager包,配置本地yum源(manager节点)

  • vi /etc/yum.repos.d/cloudera-manager.repo

[cloudera-manager] name = Cloudera Manager, Version baseurl = http://master/cloudera-repos/cm6/ gpgcheck = 1

注意路径:http://master/cloudera-repos/cm6/

  • yum clean all
  • yum makecache

[root@master cm5.16]# yum clean all && yum makecache Loaded plugins: fastestmirror Cleaning repos: base cloudera-manager epel extras updates Cleaning up everything Maybe you want: rm -rf /var/cache/yum, to also free up space taken by orphaned data from disabled or removed repos Cleaning up list of fastest mirrors Loaded plugins: fastestmirror base | 2.9 kB 00:00:00 cloudera-manager | 2.9 kB 00:00:00 epel | 2.9 kB 00:00:00 extras | 2.9 kB 00:00:00 updates | 2.9 kB 00:00:00 (1/15): base/primary_db | 6.0 MB 00:00:00 (2/15): base/other_db | 2.6 MB 00:00:00 (3/15): cloudera-manager/filelists_db | 88 kB 00:00:00 (4/15): cloudera-manager/primary_db | 11 kB 00:00:00 (5/15): base/filelists_db | 7.1 MB 00:00:00 (6/15): cloudera-manager/other_db | 1.1 kB 00:00:00 (7/15): epel/filelists_db | 14 MB 00:00:00 (8/15): epel/primary_db | 7.4 MB 00:00:00 (9/15): epel/other_db | 3.5 MB 00:00:00 (10/15): extras/filelists_db | 250 kB 00:00:00 (11/15): extras/primary_db | 216 kB 00:00:00 (12/15): extras/other_db | 132 kB 00:00:00 (13/15): updates/filelists_db | 5.2 MB 00:00:00 (14/15): updates/other_db | 764 kB 00:00:00 (15/15): updates/primary_db | 7.4 MB 00:00:00 Determining fastest mirrors Metadata Cache Created [root@master cm5.16]#

16.导入GPG key(如果没有这步操作,很可能cloudera服务安装失败)manager节点

代码语言:javascript
复制
rpm--import https://archive.cloudera.com/cm6/6.2.0/redhat7/yum/RPM-GPG-KEY-cloudera

17. 安装 Cloudera Manager(manager节点 和最上面类似14)

  • sudo yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server
  • 安装完CM后/opt/ 下会出现cloudera目录
  • mv /opt/parcels/* /opt/cloudera/parcel-repo # 将parcel包移动到指定位置
  • 在/opt/cloudera/parcel-repo执行以下命令:
  • sha1sum CDH-6.2.0-1.cdh6.2.0.p0.967373-el7.parcel | awk '{ print $1 }' > CDH-6.2.0-1.cdh6.2.0.p0.967373-el7.parcel.sha
  • 执行初始化脚本:Yyf5211314!和上面设置的对应的数据库的密码保持一直
  • /opt/cloudera/cm/schema/scm_prepare_database.sh mysql cmserver cmserveruser Yyf5211314!
  • 打开server服务:
  • service cloudera-scm-server start
  • 静候几分钟,打开http://master:7180
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OnlyCoding 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档