现在我想计算一下,如果有任何单词出现在其他文件中。,我有两个文档: Doc A => "brown fox jump“Doc B => "dog not jump”Doc C=> "fox jump dog“
假设我的程序读取了第一个文档,现在第一个单词是"brown“,现在我的程序将检查这个单词是否也出现在任何其他文档中?现在它将再次检查第二个单词"fox",它将输出它出现在(Doc C)中,依此类推……现在它将读取文档B,并检查狗是否出现在其
我对Map/Reduce原理和python mrjob框架非常陌生,我写了这个示例代码,它工作得很好,但我想知道我可以在其中做些什么来使它“完美”/更高效。import operatoroutput_words = []
# move list of tuples across mapper
self.words