课程链接:https://www.imooc.com/video/16287
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 详情见:Hadoop基本介绍
NameNode 管理文件系统的命名空间,存放文件元数据,维护着文件系统的所有文件和目录,文件与数据快的反射,记录每个文件中各个块所在数据节点的信息
DataNode存储检索数据块,向NameNode更新所存储块的列表
HDFS写流程:(1)客户端向NameNode发起写数据请求(2)分块写入DateNode节点,DataNode自动完成副本备份(3)DataNode向NameNode汇报存储完成,NameNode通知客户端
HDFS读流程:(1)客户端向NameNode发起读数据请求(2)NameNode找出距离最近的DataNode节点信息(3)客户端从DataNode分块下载文件
将home下的mk.txt上传到hdfs