前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hadoop单机伪分布式部署

Hadoop单机伪分布式部署

作者头像
云原生
发布2022-09-01 14:49:46
3150
发布2022-09-01 14:49:46
举报
文章被收录于专栏:云原生实践云原生实践

Hadoop 在单节点上以伪分布式模式运行,其中每个 Hadoop 守护进程在单独的 Java 进程中运行。

部署过程:

1.修改映射文件

代码语言:javascript
复制
vim /etc/hosts

在最末尾添加

代码语言:javascript
复制
192.168.0.9 master

2.上传jdk和hadoop的压缩包并解压

代码语言:javascript
复制
tar -xvzf hadoop-3.2.2.tar.gz
tar -xvzf jdk-8u202-linux-x64.tar.gz

3.配置java和hadoop的环境变量

vim /etc/profile

代码语言:javascript
复制
export JAVA_HOME=/usr/local/jdk1.8.0_202
export CLASSPATH=$:CLASSPATH:$JAVA_HOME/lib/
PATH=$PATH:$JAVA_HOME/bin
export HADOOP_HOME=/usr/local/hadoop
PATH=$PATH:$HADOOP_HOME/bin
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"

4.免密登录设置

代码语言:javascript
复制
ssh-copy-id

连续按三次回车键就可以

代码语言:javascript
复制
ssh-copy-id master

中间过程需要输入yes,之后输入root密码

5.对hadoop文件进行配置

(1)修改core-site.xml文件
代码语言:javascript
复制
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop/data/tmp</value>
    </property>
</configuration>
(2)修改hdfs-site.xml文件
代码语言:javascript
复制
<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop/data/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/hadoop/data/datanode</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
      <name>dfs.permissions</name>
      <value>false</value>
      <description>need not permissions</description>
    </property>
</configuration>
(3)修改mapred-site.xml文件
代码语言:javascript
复制
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
(4)修改yarn-site.xml文件
代码语言:javascript
复制
<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
        <description>指定resourcemanager所在的hostname</description>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
        <description>NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行 MapReduce程序</description>
    </property>
</configuration>
(5) 修改hadoop-env.sh
代码语言:javascript
复制
export JAVA_HOME=/usr/local/jdk1.8.0_202/
HDFS_DATANODE_USER=root
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
YARN_RESOURCEMANAGER_USER=root
YARN_NODEMANAGER_USER=root
(6)设置slaves文件

vim workers

代码语言:javascript
复制
master

6.格式化集群

代码语言:javascript
复制
hdfs namenode -format

若成功会打印如下信息

has been successfully formatted

7.启动并查看

代码语言:javascript
复制
./start-dfs.sh
./start-yarn.sh

jps查看进程

代码语言:javascript
复制
[root@master ~]# jps
23153 NameNode
31432 Jps
26078 NodeManager
23295 DataNode
23535 SecondaryNameNode
25935 ResourceManager

查看HDFS web ui,端口9870

查看YARN web ui, 端口8088

到此hadoop单机伪分布式部署完成

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-06-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 云原生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.修改映射文件
  • 2.上传jdk和hadoop的压缩包并解压
  • 3.配置java和hadoop的环境变量
  • 4.免密登录设置
  • 5.对hadoop文件进行配置
    • (5) 修改hadoop-env.sh
      • (6)设置slaves文件
      • 6.格式化集群
      • 7.启动并查看
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档