前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【趣学程序】HDFS读写流程

【趣学程序】HDFS读写流程

作者头像
趣学程序-shaofeer
发布2019-08-20 11:09:19
6590
发布2019-08-20 11:09:19
举报
文章被收录于专栏:upuptop的专栏upuptop的专栏

HDFS

代码语言:javascript
复制
    HDFS是Hadoop Distribute File System 的简称,

    也就是Hadoop的一个分布式文件系统。

    这里的“超大文件”是指几百MB、GB甚至TB级别的文件。

    HDFS存储的数据集作为hadoop的分析对象。

HDFS的组成

代码语言:javascript
复制
    1.NameNode:存储文件的元数据,如文件名,

                文件目录结构,文件属性(创建时间,文件权限,文件大小)

                以及每个文件的块列表和块所在的DataNode等。

                类似于一本书的目录功能。


    2.DataNode:在本地文件系统存储文件块数据,

                以及块数据的校验和。

    3.SecondaryNameNode:

                用来监控HDFS状态的辅助后台程序,

                每隔一段时间获取HDFS元数据的快照。

HDFS写数据流程

代码语言:javascript
复制
    1.HDFS客户端向NameNode请求是否可以上传该文件

    2.NameNode返回客户端可以上传该文件

    3.客户端请求NameNode索要文件上传DataNode路径

    4.NameNode返回客户端上传的DataNode地址

    5.客户端根据返回的DataNode,与其建立通道

    6.DataNode应答成功

    7.客户端上传数据

HDFS读数据流程

代码语言:javascript
复制
    1.HDFS客户端向NameNode请求下载文件

    2.NameNode返回目标文件的元数据信息

    3.客户端请求读取目标文件所在DataNode

    4.DataNode向客户端传输数据
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 趣学程序 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • HDFS
  • HDFS的组成
  • HDFS写数据流程
  • HDFS读数据流程
相关产品与服务
云 HDFS
云 HDFS(Cloud HDFS,CHDFS)为您提供标准 HDFS 访问协议,您无需更改现有代码,即可使用高可用、高可靠、多维度安全、分层命名空间的分布式文件系统。 只需几分钟,您就可以在云端创建和挂载 CHDFS,来实现您大数据存储需求。随着业务需求的变化,您可以实时扩展或缩减存储资源,CHDFS 存储空间无上限,满足您海量大数据存储与分析业务需求。此外,通过 CHDFS,您可以实现计算与存储分离,极大发挥计算资源灵活性,同时实现存储数据永久保存,降低您大数据分析资源成本。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档