我想让我的hadoop流媒体工作。
但是我想使用第一步的输出作为我的mapreduce作业的第二步的输入,而不是存储在hdfs中,可能输出为stdout。有没有像linux管道这样的东西?如hadoop jar hadoop-streaming.jar -mapper map1.py -reducerreducer.py -input xx |
每当我试图运行这段代码来执行python中的map-还原代码时,我就会得到一个classnotfoundexception.。我目前正在使用hadoop-2.6.5。输入:
hadoop jar /usr/local/hadoop1/share/hadoop/tools/sources/hadoop-streaming-2.6.5-test-sources.jar/home