我有一个带有Hadoop安装的PC集群。该服务运行良好,我执行了许多工作没有问题。出于研究目的,我将作业日志发送到JobHistoryServer服务。
对于一个职务,历史服务没有保存统计数据。如果我使用相同的配置执行其他作业,则会保存统计数据。但是我重新运行了这个作业,并且历史服务器不保存统计数据。
历史服务器日志(文件mapred-hduser-历史性服务器-主日志):
2017-05-13 11:28:59,634 INFO org.apache.hadoop.mapreduce.v2.hs.JobHistory: Starting scan to move intermediate done files
2017-05-13 11:31:59,634 INFO org.apache.hadoop.mapreduce.v2.hs.JobHistory: Starting scan to move intermediate done files
2017-05-13 11:34:59,634 INFO org.apache.hadoop.mapreduce.v2.hs.JobHistory: Starting scan to move intermediate done files
2017-05-13 11:37:59,634 INFO org.apache.hadoop.mapreduce.v2.hs.JobHistory: Starting scan to move intermediate done files
2017-05-13 11:40:59,634 INFO org.apache.hadoop.mapreduce.v2.hs.JobHistory: Starting scan to move intermediate done files
我的问题是:我如何开始调试正在发生的事情?
更多数据:
发布于 2017-05-14 14:02:18
最后我发现了问题。其中一名工人的日期已过更新。我设置了正确的日期,并且历史服务器正确地保存了作业的日志。
https://stackoverflow.com/questions/43954973
复制相似问题