前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hadoop05【命令操作】

Hadoop05【命令操作】

作者头像
用户4919348
发布2019-04-02 10:58:16
6841
发布2019-04-02 10:58:16
举报
文章被收录于专栏:波波烤鸭波波烤鸭

  上篇文章我们成功的搭建了hadoop的集群环境,本文来介绍下hadoop的基本操作

HDFS存储目录

1.存储目录结构

在datanode的hdfsdata目录下查看:

在这里插入图片描述
在这里插入图片描述

文件

说明

BP-1867776167-192.168.88.61-1554050717516

BP-random integer-NameNode-IP address-creation time

finalized/rbw

这两个目录都是用于实际存储HDFS BLOCK的数据,里面包含许多block_xx文件以及相应的.meta文件,.meta文件包含了checksum信息。rbw是“replica being written”的意思,该目录用于存储用户当前正在写入的数据

dncp_block_verification.log.curr

该文件用于追踪每个block最后修改后的checksum值,该文件会定期滚动,滚动后会移到.prev文件

in_use.lock

防止一台机器同时启动多个Datanode进程导致目录数据不一致

2.浏览器快速查看

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

常用命令

1.查看根目录下的所有文件

代码语言:javascript
复制
hadoop fs -ls /

2.上传文件

将a.txt文件上传到hdfs中

在这里插入图片描述
在这里插入图片描述

上传命令

代码语言:javascript
复制
hadoop fs -put a.txt /
在这里插入图片描述
在这里插入图片描述

浏览器中查看上传的文件

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

hadoop-node03节点存储结构中查看文件

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.查看上传文件内容

代码语言:javascript
复制
hadoop fs -cat /a.txt
在这里插入图片描述
在这里插入图片描述

4.下载文件

代码语言:javascript
复制
hadoop fs -get /a.txt
在这里插入图片描述
在这里插入图片描述

5.删除文件

代码语言:javascript
复制
hadoop fs -rm /a.txt
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.创建目录

代码语言:javascript
复制
[root@hadoop-node04 subdir0]# hadoop fs -mkdir /aaa
[root@hadoop-node04 subdir0]# hadoop fs -mkdir -p  /a1/b1/c1
在这里插入图片描述
在这里插入图片描述

大文件操作

上传一个超过128M的文件

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

文件拼接

  将切割成两块的文件拼接成一个文件,我们看下是否可以解压使用。

代码语言:javascript
复制
[root@hadoop-node04 subdir0]# cat blk_1073741826 >> hadoop.file
[root@hadoop-node04 subdir0]# cat blk_1073741827 >> hadoop.file 
在这里插入图片描述
在这里插入图片描述

尝试解压缩

代码语言:javascript
复制
tar -zxvf hadoop.file
在这里插入图片描述
在这里插入图片描述

执行基本信息

1.查看HDFS的基本统计信息:

代码语言:javascript
复制
hadoop dfsadmin -report

2. 退出安全模式

  NameNode在启动时会自动进入安全模式。安全模式是NameNode的一种状态,在这个阶段,文件系统不允许有任何修改。系统显示Name node in safe mode,说明系统正处于安全模式,这时只需要等待十几秒即可,也可通过下面的命令退出安全模式:

代码语言:javascript
复制
hadoop dfsadmin -safemode leave

3.进入安全模式

在必要情况下,可以通过以下命令把HDFS置于安全模式:

代码语言:javascript
复制
hadoop dfsadmin -safemode enter
在这里插入图片描述
在这里插入图片描述

常见的错误

  1. 初始化工作目录结构 hdfs namenode -format 只是初始化了namenode的工作目录,而datanode的工作目录是在datanode启动后自己初始化的
  2. datanode不被namenode识别的问题 namenode在format初始化的时候会形成两个标识:blockPoolId,clusterId 新的datanode加入时,会获取这两个标识作为自己工作目录中的标识,一旦namenode重新format后,namenode的身份标识已变,而datanode如果依然持有原来的id,就不会被namenode识别
  3. datanode下线后多久看到效果 datanode不是一下线就会被namenode认定为下线的,有一个超时时间
  4. 关于副本数量的问题 副本数由客户端的参数dfs.replication决定(优先级: conf.set > 自定义配置文件 > jar包中的hdfs-default.xml)
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019年04月01日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • HDFS存储目录
    • 1.存储目录结构
      • 2.浏览器快速查看
      • 常用命令
        • 1.查看根目录下的所有文件
          • 2.上传文件
            • 3.查看上传文件内容
              • 4.下载文件
                • 5.删除文件
                  • 6.创建目录
                  • 大文件操作
                    • 上传一个超过128M的文件
                      • 文件拼接
                      • 执行基本信息
                        • 1.查看HDFS的基本统计信息:
                          • 2. 退出安全模式
                            • 3.进入安全模式
                            • 常见的错误
                            相关产品与服务
                            大数据
                            全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
                            领券
                            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档