前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >hadoop集群搭建(超详细版)「建议收藏」

hadoop集群搭建(超详细版)「建议收藏」

作者头像
全栈程序员站长
发布2022-11-04 15:31:03
3K0
发布2022-11-04 15:31:03
举报
文章被收录于专栏:全栈程序员必看

1.准备好需要安装的软件

虚拟机VMware12.pro

操作系统CentOS 6.5

远程控制虚拟机的终端SecureCRT8.1

2.在虚拟机中安装CentOS操作系统

安装好虚拟机,图形界面如下图

创建新的虚拟机,选择自定义(高级),点击下一步

虚拟机硬件兼容性默认,浏览需要安装的CentOS6.5镜像文件

自定义用户名和密码(用于登录)

设置虚拟机名称和存储路径

处理器设置默认(后面可以修改),内存设为1GB

网络类型选择NAT模式

选择创建新虚拟磁盘

最大磁盘大小设为20GB,然后将虚拟磁盘存储为单个文件

将创建好的磁盘文件存储在虚拟机指定目录下

虚拟机创建完成

3. 虚拟网络配置

编辑虚拟网络设置,选择NAT模式

点击NAT设置,查看网络信息(后面设置ip会用到)

查看主机ip地址

修改网络配置文件,将BOOTPROTO值修改为”static”

重启网络服务network

再次查看主机ip

4. 更改主机名称

修改主机名文件(重启永久生效)

查看主机名hostname(文件修改后没有重启主机名没有生效,可以用hostname临时生效)

复制master文件两次,重命名为slave1和slave2,打开虚拟机文件,然后按照同样的方法设置两个节点的ip和主机名

5.建立主机名和ip的映射

查看是否能ping通

6.配置ssh免密码登录

在root用户下输入ssh-keygen -t rsa 一路回车

秘钥生成后在~/.ssh/目录下,有两个文件id_rsa(私钥)和id_rsa.pub(公钥),将公钥复制到authorized_keys并赋予authorized_keys600权限

同理在slave1和slave2节点上进行相同的操作,然后将公钥复制到master节点上的authoized_keys

将master节点上的authoized_keys远程传输到slave1和slave2的~/.ssh/目录下

检查是否免密登录(第一次登录会有提示)

7.关闭防火墙

关闭selinux(永久)

8.安装JDK

三个节点安装java并配置java环境变量

解压压缩包

在/etc/profile文件里添加jdk路径

执行命令source /etc/profile使配置文件生效,并查看java版本信息

9.安装MySQL(主节点)

查询系统已安装的mysql

彻底卸载mysql及其所依赖的包

解压MySQL包

安装MySQL有关的三个rpm包,分别为server、client和devel包

启动mysql /usr/bin/mysqld_safe –skip-grant-tables & 并登陆mysql数据库

查看mysql中的数据库

10.安装SecureCRT

操作比较简单,安装好的图形界面如图

连接好之后

12.搭建集群

12.1 集群结构

三个结点:一个主节点master两个从节点 内存1GB 磁盘20GB

Ip地址

主机名

Namenode

Secondary namenode

Datanode

Resource Manager

NodeManager

192.168.63.16

master

Y

Y

N

Y

N

192.168.63.17

slave1

N

N

Y

N

Y

192.168.63.18

slave2

N

N

Y

N

Y

12.2 新建hadoop用户及其用户组

用adduser新建用户并设置密码

将新建的hadoop用户添加到hadoop用户组

前面hadoop指的是用户组名,后一个指的是用户名

赋予hadoop用户root权限

12.3 安装hadoop并配置环境变量

由于hadoop集群需要在每一个节点上进行相同的配置,因此先在master节点上配置,然后再复制到其他节点上即可。

将hadoop包放在/usr/目录下并解压

配置环境变量

在/etc/profile文件中添加如下命令

12.4 搭建集群的准备工作

在master节点上创建以下文件夹

/usr/hadoop-2.6.5/dfs/name

/usr/hadoop-2.6.5/dfs/data

/usr/hadoop-2.6.5/temp

12.5 配置hadoop文件

接下来配置/usr/hadoop-2.6.5/etc//hadoop/目录下的七个文件

slaves core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml hadoop-env.sh yarn-env.sh

配置hadoop-env.sh

配置yarn-env.sh

配置slaves文件,删除localhost

配置core-site.xml

配置hdfs-site.xml

配置mapred-site.xml

配置yarn-site.xml

将配置好的hadoop文件复制到其他节点上

12.6 运行hadoop

格式化Namenode

source /etc/profile

13. 启动集群

代码语言:javascript
复制
[root@master sbin]# ./start-all.sh

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/181748.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月15日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.准备好需要安装的软件
  • 2.在虚拟机中安装CentOS操作系统
  • 3. 虚拟网络配置
  • 4. 更改主机名称
  • 5.建立主机名和ip的映射
  • 6.配置ssh免密码登录
  • 7.关闭防火墙
  • 8.安装JDK
  • 9.安装MySQL(主节点)
  • 10.安装SecureCRT
  • 12.搭建集群
    • 12.1 集群结构
      • 12.2 新建hadoop用户及其用户组
        • 12.3 安装hadoop并配置环境变量
          • 12.4 搭建集群的准备工作
            • 12.5 配置hadoop文件
              • 12.6 运行hadoop
              • 13. 启动集群
              相关产品与服务
              云数据库 SQL Server
              腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档