前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >漫画大数据:HDFS 中 NameNode 的内存为什么会一直涨?

漫画大数据:HDFS 中 NameNode 的内存为什么会一直涨?

作者头像
DataChat
发布2023-02-06 10:48:15
5850
发布2023-02-06 10:48:15
举报
文章被收录于专栏:漫画大数据漫画大数据

NameNode 里有个叫 Namespace 的,它是维护整个 HDFS 文件系统的目录树结构及目录树上的状态变化的,比如一个目录树长这样:

代码语言:javascript
复制
/
├── user
│   ├── aaa.txt
│   ├── bbb.avi
├── tmp
├── opt
│   ...

当新增了一个目录/文件,或者删除了一个目录/文件时,Namespace 就会更新这个目录树。

NameNode 里有还有个叫 BlockManager的,它是用来维护整个文件系统中与数据块相关的信息及数据块的状态变化的,比如,/user/bbb.avi 这个视频文件很大,它会被切分后存放在不同的地方(Block),BlockManager 就是用来记录这些 Block 到底是在哪台机器(DataNode)上。

当我们想要查看 HDFS 上的某个文件时,都需要先问问 NameNode,这个文件它被切成了几小块(Namespace的作用),每个小块都保存在哪台机器上(BlockManger的作用),然后我们再按顺序去那些机器(DataNode)上一小块一小块地去查看文件。

当 HDFS 里的目录和文件变多,Namespace 要维护的目录树就会变大;同时,文件数量增加,BlockManager 要记录的文件被切分后的 Block 信息就多了。这两样东西都是维护在 NameNode 的内存里的,所以呢,慢慢地 NameNode 占用的内存就跟着变大了。

—————END—————

喜欢本文的朋友们,欢迎关注公众号DataChat,收看更多精彩内容~

文中「澜妹、澜宝」使用了数澜的吉祥物,数澜科技:让数据用起来!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-11-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DataChat 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档