谁能为我提供一些关于如何从一个非常大的文件块异步写入的指导,每个块都是在许多集群(8-500)中使用相同的函数处理的。文件大小约为25 GB,太大,内存无法容纳。
我们目前正在使用'snow(fall)‘和'mmap’包,但无法通过一些瓶颈。同步写入可以很好地工作,但异步写入会更有效率。
我不确定您还需要更多的信息,但请随时问我!
发布于 2013-07-08 04:24:12
也许你可以使用
sink("filename.any_extension")
因此,使用此命令将在收到from命令后立即将结果输出到文本文件中,并进一步处理您的结果
readLines("filename.any_extension",n=-1,warn=TRUE).
我希望这能帮到你。
https://stackoverflow.com/questions/12303088
复制相似问题