依次类推
接下来,我们的外部排序, 采用二路归并的方式实现.
?
数据源,来自多方....假如: 这每一个数组都是一个对象, 一个很大的对象, 处理链路比较长. 这时候, 放入管道中. 就可以并发处理了. 不影响后面的流程....传进来一个数组, 然后, 我们将数组放入管道中进行处理...., 提高了管道处理的效率
3.9 网络版外部排序
通过上面的排序结果, 我们看到, 一个800M的文件排序时间大概是40-50秒....肯定是要比直接处理要慢的.
第二: 虽然用管道会慢, 但我们依然用它,为什么么? 这里是开启了4路并行处理. 文件一共800M, 那么如果是8G呢?800G呢?我们能用一个线程单独去执行么?