专栏首页码农小胖哥的码农生涯Java入门必看的Java 8 Stream API 使用指南

Java入门必看的Java 8 Stream API 使用指南

1.概述

Java 8 引入的一个重要的特性无疑是 Stream API。Stream 翻译过来是“流”,突然想到的是大数据处理有个流式计算的概念,数据通过管道经过一个个处理器(Handler)进行筛选,聚合,而且流都具有向量性,强调的是对数据的计算处理,而集合强调的是数据集。Stream可以看做是一个可操作的数据集序列,它可以指定你希望对集合进行的操作,可以执行非常复杂的查找、过滤和映射数据等操作。有点类似于数据库中的增删改查操作。十分高效而且易于使用。

2. 创建Stream流

从不同的数据源创建流有很多方式。被创建的流并不能改变数据源。什么意思呢?打个比方,从一个集合创建流后,对流的操作并不会改变这个集合的数据状态。我们还是举个例子吧。

如上图, 我们将一个长度为3的集合放入一个流,过滤掉元素长度不超过4的元素,然后把剩下的迭代出来。同时我们还打印一下原始的数据源strArr集合长度看看是否发生了变化。结果虽然从流中移除了“java”这个元素但是strArr却并没有变化。

接下来我们开始梳理一下创建流的方式。

2.1 空流

你应该注意到上图中我用Collections 创建了一个空的LIst,流也是一样,而且这两者的意义也是一样的。都是避免为没有元素而返回null。

2.2 从集合创建流

上面摘自java 8 Collection<E> 说明只要是Collection<E>的实现都可以创建流。

2.3 从数组创建流

我们可以从数组来创建一个流,或者从数组中按照索引截取一部分创建流

2.4 通过构造器创建流

Stream 提供建造者方法来构建流。不过请注意泛型约束,否则返回的是Object类型的流。

2.5 创建无限流

generate() 方法接收 Supplier<T> 函数来生成元素,而且生成如果不加以限制将不会停止,直到内存限制。下面这个例子将生成长度为10,字符串元素长度为5的字符串流

创建无限流的另一种方法是使用iterate() 方法。和generate() 方法一样都要加以限制。不同的是iterate()方法第一个参数作为起始的种子,第二个函数参数来定制生成元素的规则。下面这个例子是从1作为第一个元素,每个元素在上一个元素的基础上加1,限制长度为10。下面将打印1-10。

2.6 基本类型流

Java 8提供了从三种基本类型创建流的可能性:int,long和double。由于Stream <T>是一个通用接口,并且无法使用基本类型作为泛型的类型参数,因此创建了三个新的特殊接口:IntStream,LongStream,DoubleStream。

使用这些新的API避免了不必要的自动装箱,从而提高了生产率:

以上两个方法的起始都是从1开始,步长为1创建序列。区别就是endExclusive=3 range方法不包含3,而rangeClosed包括3。 从Java 8开始,Random类为生成基本类型流提供了广泛的方法。例如,以下代码创建一个DoubleStream,它有三个随机double元素:

2.7 字符串流

String也可以用作创建流的源。借助String类的chars()方法。由于没有界面CharStream在JDK的IntStream用于表示字符流代替。

以下示例根据指定的RegEx将String拆分为子字符串:

2.8 文件流

Java NIO类Files允许通过lines()方法生成文本文件的Stream <String>。文本的每一行都成为流的一个元素:

你还可以在lines() 方法中指定字符集编码。

2.9 并行流

并行流就是把一个内容分成多个数据块,并用不同的线程分成多个数据块,并用不同的线程分别处理每个数据块的流。底层用了Fork/Join框架。该流主要用来处理大批量的数据源。少量数据不建议使用。带有parallel的声明方式都是并行流,这里不在介绍。 但是使用一定要注意数据并行处理同步。要么使用同步集合,诸如Collections.synchronized系列。或者在并行流收集元素到集合中时,调用collect方法,一定不要采用Foreach方法或者map方法。

3. 流的引用

只要只调用中间操作,就可以实例化一个流并具有对它的可访问引用。执行终端操作会使流不可访问。从技术上讲,以下代码看上去是有效的:

第3行是终端操作 如果接着执行第4行对stream进行重用将触发IllegalStateException。一定要谨记 Java 8 中同一个Stream 在终端操作后是不能重用的。正确的做法是这样的:

4. 流的中间操作

中间操作就是对数据源中的数据的计算操作。其实上面我们已经对流进行很多的中间操作比如filter()、limit()下面是网上很著名的一些中间操作讲解

5.流的生命周期

  • 创建Stream 一个数据源(如:集合、数组),获取一个流
  • 中间操作 一个中间操作链,对数据源的数据进行处理
  • 终止操作(终端操作)一个终止操作,执行中间操作链,并产生结果,到此整个流消亡。

6. 总结

Java 8 Stream 具有里程碑的意义。改变了以往对数据处理的模式。通过本篇对流以及流的生命周期都做了详尽的说明。相信你已经能够通过Stream来提高你的开发效率。

本文分享自微信公众号 - 码农小胖哥(Felordcn),作者:码农小胖哥

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-07-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • JDK源码阅读(三):ArrayList源码解析

    一般来讲文章开始应该先介绍一下说下简介。这里就不介绍了 如果你不知道 ArrayList 是什么的话就没必要在看了。大致讲一下一些常用的方法

    码农小胖哥
  • 运维监控指标可视化利器-Grafana

    grafana 是一款采用 go 语言编写的开源应用,主要用于大规模指标数据的可视化展现,是网络架构和应用分析中最流行的时序数据展示工具,目前已经支持绝大部分常...

    码农小胖哥
  • 学好Spring Security 和Apache Shiro你需要具备这些条件

    web应用达到生产需要就必须有安全控制。java web领域经常提及的两大开源框架主要有两种选择 Spring Security和Apache Shiro 。所...

    码农小胖哥
  • 解决子元素用css float浮动后父级元素高度自适应高度

    windseek
  • HTML5-创建HTML文档

    HTML5中的一个主要变化是:将元素的语义与元素对其内容呈现结果的影响分开。从原理上讲这合乎情理。HTML元素负责文档内容的结构和含义,内容的呈现则由应用于元素...

    奋飛
  • Python数据类型详解-列表#学习猿地

    + 在定义列表中的元素时,需要在每个元素之间使用逗号,进行分隔。[1,2,3,4]

    学习猿地
  • Python数据类型详解-列表#学习猿地

    + 在定义列表中的元素时,需要在每个元素之间使用逗号,进行分隔。[1,2,3,4]

    学习猿地
  • iOS 优化界面流畅的技巧

    对象的创建会分配内存、调整属性、甚至还有读取文件等操作,比较消耗 CPU 资源。尽量用轻量的对象代替重量的对象,可以对性能有所优化。比如 CALayer 比 U...

    用户2491699
  • Java 多线程(2)---- 线程的控制

    在上一篇文章中我们简单的认识了一下线程。包括线程的优先级、如何创建一个线程(通过继承 Thread 类或者通过新建 Runnable 对象并作为参数传入 Thr...

    指点
  • Thread备忘录

    start()用来启动一个线程,当调用start方法后,系统才会开启一个新的线程来执行用户定义的子任务,在这个过程中,会为相应的线程分配需要的资源。

    Oceanlong

扫码关注云+社区

领取腾讯云代金券