注意: 本文涉及到的专有名词将直接使用英文, 便于理解记忆
注意: 本文面向hadoop 2版本, 其它版本差异并不涉及
Hadoop是什么?...不难看出, 其中commodity hardware, massive storage和enormous processing power就是Hadoop的重要特点....当读取文件时, HDFS client先从Name Node获取文件数据块的Data Node, 然后直接从最近的Data Node获取数据....不同于传统文件系统, HDFS提供获取文件块位置的API, 允许应用程序直接将任务运行于目标Data Node上, 减少了不必要的流量消耗....当client打开读取一个文件, client将获取块的存储列表, 并选择最近的Data Node读取数据. 当读取失败, 就会尝试下一个. 可能会有疑问, 什么时候读取会失败呢?