上篇文章我们成功的搭建了hadoop的集群环境,本文来介绍下hadoop的基本操作
在datanode的hdfsdata目录下查看:
文件 | 说明 |
---|---|
BP-1867776167-192.168.88.61-1554050717516 | BP-random integer-NameNode-IP address-creation time |
finalized/rbw | 这两个目录都是用于实际存储HDFS BLOCK的数据,里面包含许多block_xx文件以及相应的.meta文件,.meta文件包含了checksum信息。rbw是“replica being written”的意思,该目录用于存储用户当前正在写入的数据 |
dncp_block_verification.log.curr | 该文件用于追踪每个block最后修改后的checksum值,该文件会定期滚动,滚动后会移到.prev文件 |
in_use.lock | 防止一台机器同时启动多个Datanode进程导致目录数据不一致 |
hadoop fs -ls /
将a.txt文件上传到hdfs中
上传命令
hadoop fs -put a.txt /
浏览器中查看上传的文件
hadoop-node03节点存储结构中查看文件
hadoop fs -cat /a.txt
hadoop fs -get /a.txt
hadoop fs -rm /a.txt
[root@hadoop-node04 subdir0]# hadoop fs -mkdir /aaa
[root@hadoop-node04 subdir0]# hadoop fs -mkdir -p /a1/b1/c1
将切割成两块的文件拼接成一个文件,我们看下是否可以解压使用。
[root@hadoop-node04 subdir0]# cat blk_1073741826 >> hadoop.file
[root@hadoop-node04 subdir0]# cat blk_1073741827 >> hadoop.file
尝试解压缩
tar -zxvf hadoop.file
hadoop dfsadmin -report
NameNode在启动时会自动进入安全模式。安全模式是NameNode的一种状态,在这个阶段,文件系统不允许有任何修改。系统显示Name node in safe mode,说明系统正处于安全模式,这时只需要等待十几秒即可,也可通过下面的命令退出安全模式:
hadoop dfsadmin -safemode leave
在必要情况下,可以通过以下命令把HDFS置于安全模式:
hadoop dfsadmin -safemode enter