name | value | 含义 |
---|---|---|
JAVA_HOME | /usr/java/jdk1.6.0_30 | JDK所在路径 |
Name | value | 含义 |
---|---|---|
fs.default.name | hdfs://namenode | 指定默认的文件系统,默认端口 8020。 |
io.file.buffer.size | 65536 | 指定缓冲区的大小,默认4K太小,64k(65536)或128k(131072)更为常用 |
Name | Value | 含义 |
---|---|---|
dfs.name.dir | 逗号分隔的目录列表 | NameNode上持久化存储元数据和事务日志的路径。指定多个目录的话,各个目录内容完全一致。 |
dfs.data.dir | 逗号分隔的目录列表 | DataNode上存储数据块的地方。如果指定多个目录,则数据库被随机的存放。 |
dfs.replication | 整数 | 数据复制的份数 |
dfs.datanode.max.xcievers | 4096 | datanode同时打开的文件上限。默认256太小。 |
fs.checkpoint.dir | 逗号分隔的目录列表 | 辅助NameNode检查点存储目录,分别存储到各个目录,支持冗余备份。 |
MapReduce的配置集中在mapred-size.xml。如果只用到了HDFS,这一部分的配置可以忽略。
Name | Value | 说明 |
---|---|---|
mapred.job.tracker | namenode:8021 | Jobtracker的RPC服务器所在的主机名称和端口。 |
mapred.local.dir | 逗号分隔的目录列表 | 存储作业中间数据的目录列表,作业结束后,数据被清楚 |
mapred.system.dir | HDFS上的目录 | 作业运行期间的存储共享目录的目录,必须是HDFS之上的目录 |
mapred.task.tracker. map.tasks.maximum | 整数 | 运行在tasktracker之上的最大map任务数 |
mapred.task.tracker. reduce.tasks.maximum | 整数 | 运行在tasktracker之上的最大reduce任务数 |
mapred.child.java.opts | Java虚拟机选项 | JVM选项,默认 -Xmx200m |