您在HDP集群上使用RAID1的经验是什么?
我脑子里有两个选择:
即使我失去了一个从节点,我也会有另外两个副本。在我看来,RAID只会拖慢我的集群。
你觉得那个怎么样?你对HDP和RAID有什么经验?您认为对从节点使用RAID 0如何?
发布于 2016-09-20 13:55:47
我建议在Hadoop主机上不要进行任何RAID。请注意,如果您在后台使用关系DB运行诸如Oozie和Hive亚稳态之类的服务,那么raid在DB主机上很可能是有意义的。
在主节点上,假设您有Namenode、等--通常,冗余是内置在服务中的。对于namenodes,所有数据都存储在两个namenodes上。对于,如果您丢失了一个节点,那么其他两个节点拥有所有的信息。
动物园管理员喜欢快盘-理想情况下,把完整的磁盘奉献给动物园管理员。如果您有namenode,请为namenode编辑目录和每个日志节点提供一个专用磁盘。
对于从节点,datanode将跨所有磁盘写入,从而有效地对数据进行条带化。每个“写”最多都是HDFS块大小,所以如果您正在编写一个大文件,您可以在磁盘1上获得128 at,然后在磁盘2上得到下一个128 at等等。
https://stackoverflow.com/questions/39590729
复制相似问题