前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Mac的Hadoop开发环境搭建

Mac的Hadoop开发环境搭建

作者头像
羊羽shine
发布2019-08-05 17:40:26
1.4K0
发布2019-08-05 17:40:26
举报
文章被收录于专栏:Golang开发Golang开发

JAVA环境配置

代码语言:javascript
复制
$ java -version
java version "1.8.0_121"
Java(TM) SE Runtime Environment (build 1.8.0_121-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.121-b13, mixed mode)

mac查看Java的安装位置信息

代码语言:javascript
复制
$  /usr/libexec/java_home
/Library/Java/JavaVirtualMachines/jdk1.8.0_121.jdk/Contents/Home

SSH配置

文件和目录的权限千万别设置成chmod 777.这个权限太大了,不安全

代码语言:javascript
复制
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys

如果没有ssh公钥,执行下面命令

代码语言:javascript
复制
ssh-keygen -t rsa

开启远程登录

image.png

测试远程登录是否开启

代码语言:javascript
复制
ssh localhost

安装hadoop

最终的安装目录在/usr/local/Cellar/hadoop/ 安装的版本是3.1.2

代码语言:javascript
复制
$ brew install hadoop
Updating Homebrew...
==> Downloading https://www.apache.org/dyn/closer.cgi?path=hadoop/common/hadoop-3.1.2/hadoop-3.1.2.tar.gz
==> Downloading from http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.1.2/hadoop-3.1.2.tar.gz
######################################################################## 100.0%
?  /usr/local/Cellar/hadoop/3.1.2: 21,686 files, 774.1MB, built in 10 minutes 1 second

配置

需要修改五个文件, 都在/usr/local/Cellar/hadoop/3.1.2/libexec/etc/hadoop这个目录下

代码语言:javascript
复制
$ vim hadoop-env.sh
$ vim core-site.xml
$ vim hdfs-site.xml
$ vim mapred-site.xml
$ vim yarn-site.xml
hadoop-env.sh

配置JAVA_HOME

image.png

/usr/libexec/java_home查到的 Java 路径,记得去掉注释 #。

代码语言:javascript
复制
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_121.jdk/Contents/Home
core-site.xml

修改core-site.xml 文件参数,配置NameNode的主机名和端口号

代码语言:javascript
复制
<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/Cellar/hadoop/hdfs/tmp</value>
        <description>A base for other temporary directories</description>
    </property>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>
hdfs-site.xml

变量dfs.replication指定了每个HDFS数据库的复制次数。 通常为3, 由于我们只有一台主机和一个伪分布式模式的DataNode,将此值修改为1

代码语言:javascript
复制
<configuration>
 <property>
 <name>dfs.replication</name>
 <value>1</value>
 </property>
</configuration>
mapred-site.xml

如果文件后缀是 .xml.example,改为 .xml。变量mapred.job.tracker 保存了JobTracker的位置

代码语言:javascript
复制
<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>localhost:9010</value>
    </property>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
yarn-site.xml
代码语言:javascript
复制
<configuration>

<!-- Site specific YARN configuration properties -->

    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

</configuration>
格式化

格式化hdfs操作只要第一次才使用,否则会造成数据全部丢失 hdfs namenode -format

image.png

启动 NameNode 和 DataNode:
代码语言:javascript
复制
$ cd /usr/local/Cellar/hadoop/3.1.2/sbin
$ ./start-dfs.sh
Starting namenodes on [localhost]
Starting datanodes
Starting secondary namenodes [baxiangs-Mac-mini.local]
baxiangs-Mac-mini.local: Warning: Permanently added 'baxiangs-mac-mini.local,192.168.1.115' (ECDSA) to the list of known hosts.
2019-08-04 01:25:14,753 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

http://localhost:9870/

image.png

代码语言:javascript
复制
$ jps
5665 DataNode
5890 Jps
5797 SecondaryNameNode
1274 Launcher
317
5566 NameNode
YARN服务
代码语言:javascript
复制
./start-yarn.sh

关闭YARN服务

代码语言:javascript
复制
./stop-yarn.sh

启动成功后,我们在浏览器中输入http://localhost:8088/cluster

image.png

启动/关闭Hadoop服务(等效上面两个) ./start-all.sh ./stop-all.sh

安装spark

代码语言:javascript
复制
=> Downloading https://www.apache.org/dyn/closer.lua?path=spark/spark-2.4.3/spark-2.4.3-bin-hadoop2.7.tgz
==> Downloading from http://45.252.224.79/files/623300000DD89759/mirror.bit.edu.cn/apache/spark/spark-2.4.3/spark-2.4.3-bin-hadoop2.7.tgz
######################################################################## 100.0%
?  /usr/local/Cellar/apache-spark/2.4.3: 1,059 files, 248.4MB, built in 29 seconds
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.08.04 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • JAVA环境配置
  • SSH配置
  • 安装hadoop
  • 配置
    • hadoop-env.sh
      • core-site.xml
        • hdfs-site.xml
          • mapred-site.xml
            • yarn-site.xml
              • 格式化
                • 启动 NameNode 和 DataNode:
                  • YARN服务
                  • 安装spark
                  相关产品与服务
                  大数据
                  全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
                  领券
                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档