首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >HDFS如何管理块大小?

HDFS如何管理块大小?
EN

Stack Overflow用户
提问于 2015-12-23 14:30:02
回答 3查看 732关注 0票数 2

我的文件大小是65 My,默认的hdfs块大小(64 my ),那么将有多少64 my块分配给我的文件?

它是像1-64MB块,1-1MB块还是2-64MB块?如果它是2-64MB块,那么它将被浪费掉其余的63 of,还是会分配给其他文件?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-12-23 14:37:17

块大小64 an意味着块的上限大小。这并不意味着小于64‘t的文件块将消耗64’t。它不会消耗64 1MB来存储1MB的块。

如果文件是160兆字节的

希望这能有所帮助。

票数 2
EN

Stack Overflow用户

发布于 2015-12-23 14:42:32

根据此页的说法。看起来是一个64 MB的块和一个1MB的块。

HDFS常常幸灾乐祸地不知道,一个块中的最后记录可能只是部分记录,其其余内容被分流到下面的块。HDFS只想确保文件被分割成大小相等的块,这些块与Hadoop实例的预定义块大小相匹配.并不是您需要存储的每个文件都是系统块大小的确切倍数,因此文件的最终数据块只占用所需的空间。

票数 2
EN

Stack Overflow用户

发布于 2018-05-03 20:20:56

答案是两个块,一个64 1MB和其他1MB。

与其他文件系统一样,HDFS将文件拆分为块,然后将这些块保存到磁盘中。

但它们之间有两个主要区别:

  1. HDFS块大小很大,因为每个块在namenode上都有一个元数据记录,较小的块大小意味着大量块和namenode的元数据重载。

因此,在HDFS中使用更大的块大小。

  1. HDFS块大小只是linux文件系统上的一个抽象,因此65 1MB将使用一个64 1MB块和来自第二个块的其他1MB空间,来自第二个块的rest 63MB仍然是免费的,可以用于其他数据。

也就是说,Namenode将为65 is记录两个块,但实际的文件系统空间仅为65 is。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34437853

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档