generate_output_line(item) + "\n" for item in y)output.writelines(z)
这段代码从输入文件中读取每一行,通过几个函数运行它,并将输出写入输出文件。现在我知道函数process_line、process_item和generate_output_line永远不会相
我试图在csv文件中使用mrJobs。问题是csv文件有跨越多行的输入。
在mrJob文档中搜索,我想我需要编写一个自定义协议来处理输入。我试图在下面编写我自己的协议,multiLineCsvInputProtocol,但是我已经收到了一个错误:TypeError: a bytes-like object is required, not基本上,多行csv文件中的每一行</