java8专栏目录:
本文揭示如何学习一门新技术,从示例入手,重点阐述Stream#collect方法的实现原理,为更好的使用java8中流来收集数据。
我们在前面的文章中反复使用的场景:获取菜单中所有菜品的名称,返回一个集合,其代码如下:
1public static void test_toList(List<Dish> menu) {
2 List<String> names = menu.stream().map(Dish::getName)
3 .collect(Collectors.toList()); // @1
4
5 for(String s : names) {
6 System.out.println(s);
7 }
8}
通过Stream.collect这个终端操作进行数据收集,至于如何收集,则由该方法的参数来决定(Collector),即行为参数化。
代码@1:collect(Collectors.toList()) 的意思就是返回List,这里涉及到两个关键,一个是Stream#collect方法,另外一个就是其参数Collectors.toList()。
接下来我们将以上述两个突破点来揭开如何使用java8的流来收集数据。
1ReferencePipeline#collect
2
3public final <R, A> R collect(Collector<? super P_OUT, A, R> collector) { // @1
4 A container;
5 if (isParallel()
6 && (collector.characteristics().contains(Collector.Characteristics.CONCURRENT))
7 && (!isOrdered() || collector.characteristics().contains(Collector.Characteristics.UNORDERED))) { // @2
8 container = collector.supplier().get(); // @3
9 BiConsumer<A, ? super P_OUT> accumulator = collector.accumulator();
10 forEach(u -> accumulator.accept(container, u));
11 }
12 else { // @4
13 container = evaluate(ReduceOps.makeRef(collector));
14 }
15 return collector.characteristics().contains(Collector.Characteristics.IDENTITY_FINISH) // @5
16 ? (R) container
17 : collector.finisher().apply(container);
18}
代码@1:函数声明,该方法返回的结果类型为R,传入的行为参数接口为Collector。
代码@2:判断是否符合并行化累积与规约的条件。
代码@3:并行执行收集动作。
代码@4:串行执行收集动作。
代码@5:如果收集器收集行为集合中包含Characteristics.IDENTITY_FINISH,则直接返回原始值,否则使用Collector.finishier()方式对计算的值进行函数式计算。
通过上面的代码,我们应该对Characteristics枚举类型中的3个值不难得出如下类型:
疑问?代码@3,这段代码不是很好理解,该怎么继续往下深入呢?
针对上面看不太懂的代码,我的处理办法是先转移思路,看一下Collector接口以及示例中Collectos.toList()返回的收集器是什么(重点关注返回的Collector中具体属性)。
收集器中的泛型参数说明如下:
其属性一览如下:
其supplier函数到底是干什么的呢?对上面的方法都是基于名字来推测的(当然JDK代码非常优雅,根据名字去猜测,准确度还是很高的),但如何确认呢?这个时候我们还是结合Collectos.toList()方法返回的Collector来做进一步推断。
代码如下:
1public static <T> Collector<T, ?, List<T>> toList() {
2 return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add,
3 (left, right) -> { left.addAll(right); return left; },
4 CH_ID);
5}
有了上面这些知识,我们再来看如下这段代码:
1、A container:累积器的初始值,如果使用Collectors.toList(),则这里会返回List的对象。 2、获取collector中定义的累积器。 3、遍历流,执行累积器动作,其中形式参数u,代表流中的一个个元素。
至于forEach方法,底层流的具体实现,本文就不再往深探究。
java8 使用流来收集数据的基本用法:
下一节,将以Collectos类为入口,详细介绍java8中默认提供的收集器,已经如何使用。