前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hadoop安装与环境配置入门

Hadoop安装与环境配置入门

作者头像
泰坦HW
发布2020-07-22 16:15:00
1.5K0
发布2020-07-22 16:15:00
举报
文章被收录于专栏:Titan笔记Titan笔记

写在前面

本文所使用的系统为 Centos 8 系统,略过了系统的安装部分,使用的Hadoop版本为Hadoop v2.10.0版本。

配置JDK及其环境变量

在安装JDK的过程中,使用的是软件包管理器直接安装的方式,当然你也可以采用编译的方式,这里就不再赘述。

1. 安装 JDK 1.8

代码语言:javascript
复制
yum install java-1.8.0-openjdk* -y

使用查看版本的命令,查看是否安装成功

代码语言:javascript
复制
[[email protected] hadoop]$ java -version
openjdk version "1.8.0_252"
OpenJDK Runtime Environment (build 1.8.0_252-b09)
OpenJDK 64-Bit Server VM (build 25.252-b09, mixed mode)

如果你的输出结果与上面的类似,就说明你已经成功安装了JDK

2. 配置 JAVA_HOME 环境变量

Hadoop的启动和一些其他的操作依赖于环境变量,所以你需要先配置JAVA_HOME变量。 编辑 /etc/profile 文件,在最下面加入

代码语言:javascript
复制
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.252.b09-3.el8_2.x86_64
export HADOOP_HOME=/opt/moudle/hadoop-2.10.0export PATH=$PATH:$JAVA_HOME/bin

需要注意的是,上面 JAVA_HOME 中的路径里 java-1.8.0-openjdk-1.8.0.252.b09-3.el8_2.x86_64 ,可能与你安装的路径不一致,如果你和我一样是采用yum方式直接安装的JDK,cd到/usr/lib/jvm/目录后,使用ls命令列出当前目录的所有文件夹,将上面这个名称修改为例看到的 java-1.8.0-openjdk-1.8-xxxx 即可。

代码语言:javascript
复制
[[email protected] hadoop-2.10.0]$ source /etc/profile
[[email protected] hadoop]$ echo $JAVA_HOME<br>/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.252.b09-3.el8_2.x86_64

Hadoop的安装与配置

下载Hadoop

这里下载的是Hadoop的预编译版本,省去编译步骤

https://downloads.apache.org/hadoop/common/hadoop-2.10.0/hadoop-2.10.0.tar.gz

准备用户与目录

在/opt目录下新建source和moudle目录,并且使用chown命令将目录所有者修改为你要运行Hadoop的用户,我这里默认用户就是hadoop

代码语言:javascript
复制
sudo mkdir module
sudo mkdir software
sudo chown -R hadoop:hadoop module/ source/

确定你已经成功的修改了目录权限

代码语言:javascript
复制
[[email protected] opt]$ ls -l
total 0
drwxr-xr-x. 3 hadoop hadoop 27 Jul  7 19:37 moudle
drwxr-xr-x. 2 hadoop hadoop 34 Jul  7 19:37 source

安装Hadoop

将下载的tar传入 /opt/source目录,然后将内容解压至 /opt/moudle目录

tar -zxvf /opt/source/hadoop-2.10.0.tar.gz -C /opt/moudle

检查是否与下面的输出一致

代码语言:javascript
复制
[[email protected] moudle]$ cd hadoop-2.10.0/
[[email protected] hadoop-2.10.0]$ ls
LICENSE.txt  NOTICE.txt  README.txt  bin  data  etc  include  lib  libexec  logs  sbin  share

配置Hadoop的环境变量

如同配置JAVA_HOME一样,在/etc/profile中加入以下的内容

export HADOOP_HOME=/opt/moudle/hadoop-2.10.0

在刚刚配置Java的PATH后面加入一些东西,修改后的内容可能为

export PATH=PATH:JAVA_HOME/bin:HADOOP_HOME/bin:HADOOP_HOME/sbin

然后在Shell中执行 source /etc/profile 更新下环境变量即可。

修改Hadoop配置文件

修改/opt/moudle/hadoop-2.10.0/etc/hadoop 中的core-site.xml配置文件

代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl" ?>
<!--
  Licensed under the Apache License, Version 2.0 (the "License");
  you may not use this file except in compliance with the License.
  You may obtain a copy of the License at

    http://www.apache.org/licenses/LICENSE-2.0

  Unless required by applicable law or agreed to in writing, software
  distributed under the License is distributed on an "AS IS" BASIS,
  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  See the License for the specific language governing permissions and
  limitations under the License. See accompanying LICENSE file.
-->

<!-- Put site-specific property overrides in this file. -->

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://hadoop1:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/moudle/hadoop-2.10.0/data/tmp</value>
  </property>
</configuration>

将模板配置文件/opt/moudle/hadoop-2.10.0/etc/hadoop/mapred-site.xml.template 复制一份为同目录下的 mapred-site.xml,然后进行修改

代码语言:javascript
复制
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!--
  Licensed under the Apache License, Version 2.0 (the "License");
  you may not use this file except in compliance with the License.
  You may obtain a copy of the License at

    http://www.apache.org/licenses/LICENSE-2.0

  Unless required by applicable law or agreed to in writing, software
  distributed under the License is distributed on an "AS IS" BASIS,
  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  See the License for the specific language governing permissions and
  limitations under the License. See accompanying LICENSE file.
-->

<!-- Put site-specific property overrides in this file. -->

<configuration>
<!-- 指定MR运行在YARN上 -->
<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>
</configuration>

配置yarn-site.xml

代码语言:javascript
复制
<!-- reducer获取数据的方式 -->
<property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>这里配置为你的服务器hostname</value>
</property>
</configuration>

初始化Hadoop Namenode数据目录

hadoop namenode -format

启动Hadoop各功能组件

代码语言:javascript
复制
启动NN:hadoop-daemon.sh start namenode
启动DN:hadoop-daemon.sh start datanode
启动ResourceManager:yarn-daemon.sh start resourcemanager
启动NodeManager:yarn-daemon.sh start nodemanager

分别访问 http://主机hostname:8088 http://主机hostname:50070

成功访问Hadoop的HTTP服务,说明配置已经成功了!

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020年07月07日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 写在前面
  • 配置JDK及其环境变量
    • 1. 安装 JDK 1.8
      • 2. 配置 JAVA_HOME 环境变量
      • Hadoop的安装与配置
        • 下载Hadoop
          • 准备用户与目录
            • 安装Hadoop
              • 配置Hadoop的环境变量
                • 修改Hadoop配置文件
                  • 初始化Hadoop Namenode数据目录
                  • 启动Hadoop各功能组件
                  领券
                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档