前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >图文简述HDFS(一)

图文简述HDFS(一)

作者头像
希望的田野
发布2019-09-24 11:29:44
5100
发布2019-09-24 11:29:44
举报
文章被收录于专栏:信息化漫谈

谈到大数据,离不开google的三剑客:big table、mapreduce、gfs。作为该体系的开源版本,主要是hbase、mapreduce和hdfs。今天主要谈一谈大数据处理最基础的hdfs,hadoop data file system。hdfs主要用于对在低廉的pc服务器上实现高可靠的数据存储,满足大数据处理的底层数据存储需求。

一、HDFS相比传统的本地磁盘的数据存储,主要有几大区别:

1、数据高可靠:默认三副本存储,可灵活配置。当其中不同的服务器任意两块硬盘故障,均不会影响业务的使用。

2、数据访问快:同时向多块数据盘进行数据的读写,加快速度。

3、管理轻松:支持服务器的灵活增加、删除,并自动根据存储数据量进行存储量的均衡化部署。

二、下面简要介绍hdfs的原理

如图,hdfs分为client客户端、namenode数据管理端(master节点)、datanode数据存储端(slave节点)。client进行数据存储时,需调用hdfs的sdk的开发包。进行数据读取时,向namenode请求数据在datanode的访问路径,client收到访问路径后直接向datanode发起数据访问请求(hdfs中,默认每个数据块为64M,分别放在不同的datanode)。

三、接下来,我们用一些图帮助大家理解。

不同的client、namenode、datanode的形象表达

当某用户有数据读取请求,client程序收到这个指令。

先联系namenode,获取文件的存储位置

client程序从datanode中不断顺序取出数据

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 信息化漫谈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档