我有一个处理几百万个元素的Stream
。它背后的Map-Reduce算法需要几毫秒,因此任务完成大约需要20分钟。
Stream<MyData> myStream = readData();
MyResult result = myStream
.map(row -> process(row))
.peek(stat -> System.out.println("Hi, I processed another item"))
.reduce(MyStat::aggregate);
我想要一种显示整体进度的方法,而不是为每个元素打印一行(这会导致每秒数千行,需要时间,并且不能提供任何有关整体进度的有用信息)。我想展示一些类似的东西:
5% (08s)
10% (14s)
15% (20s)
...
最好(和/或最简单)的方法是什么?
发布于 2018-06-11 00:17:27
首先,流并不是用来完成这类任务的(与传统的数据结构相反)。如果你已经知道你的流将处理多少元素,你可以选择以下选项,我重复一遍,这不是流的目标。
Stream<MyData> myStream = readData();
final AtomicInteger loader = new AtomicInteger();
int fivePercent = elementsCount / 20;
MyResult result = myStream
.map(row -> process(row))
.peek(stat -> {
if (loader.incrementAndGet() % fivePercent == 0) {
System.out.println(loader.get() + " elements on " + elementsCount + " treated");
System.out.println((5*(loader.get() / fivePercent)) + "%");
}
})
.reduce(MyStat::aggregate);
发布于 2018-06-11 00:05:21
这样做的可能性在很大程度上取决于您在stream
中拥有的source
类型。如果你有一个集合,并且你想要对它应用一些操作,你可以这样做,因为你知道这个集合的大小,并且你可以对处理过的元素进行计数。但在这种情况下也有一个警告。如果你要在流中进行并行计算,这也会变得更加困难。
在您从应用程序外部流式传输数据的情况下,您很难对进度建模,因为您不知道流将何时结束。
https://stackoverflow.com/questions/50785508
复制相似问题