Java8 Lambda表达式.md什么是λ表达式λ表达式的类型λ表达式的使用其它相关概念

为了支持函数式编程,Java 8引入了Lambda表达式. 在Java 8中采用的是内部类来实现Lambda表达式.具体实现代码,可以通过debug看, 同时通过字节码查看工具及反编译工具来验证.

自从lambda表达式成为Java语言的一部分之后,Java集合(Collections)API就面临着大幅变化。而JSR 355(规定了Java lambda表达式的标准)的正式启用更是使得Java集合API变的过时不堪。

尽管我们可以从头实现一个新的集合框架(比如“Collection II”),但取代现有的集合框架是一项非常艰难的工作,因为集合接口渗透了Java生态系统的每个角落,将它们一一换成新类库需要相当长的时间。因此,我们决定采取演化的策略(而非推倒重来)以改进集合API: 为现有的接口(例如Collection,List和Stream)增加扩展方法; 在类库中增加新的(stream,即java.util.stream.Stream)抽象以便进行聚集(aggregation)操作; 改造现有的类型使之可以提供流视图(stream view); 改造现有的类型使之可以容易的使用新的编程模式,这样用户就不必抛弃使用以久的类库,例如ArrayList和HashMap (当然这并不是说集合API会常驻永存,毕竟集合API在设计之初并没有考虑到lambda表达式。我们可能会在未来的JDK中添加一个更现代的集合类库)。

除了上面的改进,还有一项重要工作就是提供更加易用的并行(Parallelism)库。尽管Java平台已经对并行和并发提供了强有力的支持,然而开发者在实际工作(将串行代码并行化)中仍然会碰到很多问题。因此,我们希望Java类库能够既便于编写串行代码也便于编写并行代码,因此我们把编程的重点从具体执行细节(how computation should be formed)转移到抽象执行步骤(what computation should be perfomed)。

除此之外,我们还需要在将并行变的容易(easier)和将并行变的不可见(invisible)之间做出抉择,我们选择了一个折中的路线:提供显式(explicit)但非侵入(unobstrusive)的并行。(如果把并行变的透明,那么很可能会引入不确定性(nondeterminism)以及各种数据竞争(data race)问题)

什么是λ表达式

用() -> {}代码块替代了整个[匿名类]

Lambda 表达式是一个匿名函数,源于数学λ演算。是闭包函数,但闭包并不一定是Lambda 函数。它可以赋值给变量,作为函数参数,作为函数返回值。

Java 8 lambda表达式的语法

(params) -> expression

(params) -> statement

(params) -> { statements }

用法

Arrays.asList(
"a",
"b",
"d" ).sort( ( e1, e2 ) -> e1.compareTo( e2 ) );

// Java 8之前:

new Thread( new Runnable() {
@Override
public void run() { 
System.out.println(
      "Before Java8, too much code for too little to do"
);}}).start();

//Java 8方式:

new Thread( () -> System.out.println(
"In Java8, Lambda expression rocks !!"
) ).start();

// Java 8之前:

JButton show = new JButton("Show");
show.addActionListener(new ActionListener() {
@Override 
public void actionPerformed(ActionEvent e) {    
System.out.println("Event handling without lambda expression is boring");   
}});

// Java 8方式:

show.addActionListener((e) -> {
System.out.println("Light, Camera, Action !! Lambda expressions Rocks");
});

代码示例:

https://github.com/java-8/java8-impatient/blob/master/src/main/java/study/java8/lambda/LambdaDemo.java

/**
 * LambdaDemo.java
 */
package study.java8.lambda;

import java.util.Arrays;
import java.util.Comparator;
import java.util.List;
import java.util.function.Predicate;

/**
 * @author jack 2016年8月18日 下午2:16:53
 */
public class LambdaDemo {
    
    /**
     * @param args
     */
    public static void main(String[] args) {
        
        List<Integer> nums = Arrays.asList(1,
                                           23,
                                           4,
                                           56,
                                           7,
                                           8,
                                           10);
        // 用stream api
        nums.stream()
            .sorted()
            .forEach(System.out::println);
        // lambda表达式本质上也是Collections.sort方法
        nums.sort((e1, e2) -> e1.compareTo(e2));
        nums.forEach(System.out::println);
        
        // 内部类,Collections.sort方法
        nums.sort(new Comparator<Integer>() {
            
            @Override
            public int compare(Integer o1, Integer o2) {
                return o1.compareTo(o2);
            }
        });
        
        List<String> languages = Arrays.asList("Java",
                                               "Scala",
                                               "C++",
                                               "Haskell",
                                               "Lisp");
        
        System.out.println("Languages which starts with J :");
        filter(languages,
               (str) -> str.startsWith("J"));
        
        System.out.println("Languages which ends with a ");
        filter(languages,
               (str) -> str.endsWith("a"));
        
        System.out.println("Print all languages :");
        filter(languages,
               (str) -> true);
        
        System.out.println("Print no language : ");
        filter(languages,
               (str) -> false);
        
        System.out.println("Print language whose length greater than 4:");
        filter(languages,
               (str) -> str.length() > 4);
        
    }
    
    public static void filter(List<String> names, Predicate<String> condition) {
        for (String name : names) {
            if (condition.test(name)) {
                System.out.println(name + " ");
            }
        }
    }
    
}

通常都会把lambda表达式内部变量的名字起得短一些。这样能使代码更简短,放在同一行。

Java代码中,对于非常简单的逻辑(比如比较list中element大小),可以使用lambda表达式实现,但是复杂的逻辑千万不要用lamdda表达式,理由只要一个就够了—代码难以维护。理由是:

  1. 代码阅读起来不直观
  2. 调用栈分析不清楚
  3. 后人重构、修改一段匿名函数时很痛苦

函数式接口 Comparator

java.util. Comparator

λ表达式本质上是一个匿名方法。让我们来看下面这个例子:

public int add(int x, int y) {return x + y;}

转成λ表达式后是这个样子:

 (int x, int y) -> x + y;

参数类型也可以省略,Java编译器会根据上下文推断出来:

    (x, y) -> x + y; //返回两数之和

或者

    (x, y) -> { return x + y; } //显式指明返回值

可见λ表达式有三部分组成:参数列表,箭头(->),以及一个表达式或语句块。

下面这个例子里的λ表达式没有参数,也没有返回值(相当于一个方法接受0个参数,返回void,其实就是Runnable里run方法的一个实现):

    () -> { System.out.println("Hello Lambda!"); }

如果只有一个参数且可以被Java推断出类型,那么参数列表的括号也可以省略:

c -> { return c.size(); }

λ表达式的类型

λ表达式可以被当做是一个Object(注意措辞)。λ表达式的类型,叫做“目标类型(target type)”。λ表达式的目标类型是“函数接口(functional interface)”,这是Java8新引入的概念。它的定义是:

一个接口,如果只有一个显式声明的抽象方法,那么它就是一个函数接口。

一般用@FunctionalInterface标注出来(也可以不标)。举例如下:

@FunctionalInterface    
public interface Runnable { void run(); }        

public interface Callable<V> { V call() throws Exception; }        

public interface ActionListener { void actionPerformed(ActionEvent e); }        

public interface Comparator<T> { int compare(T o1, T o2); 

boolean equals(Object obj); }

注意最后这个Comparator接口。它里面声明了两个方法,貌似不符合函数接口的定义,但它的确是函数接口。这是因为equals方法是Object的,所有的接口都会声明Object的public方法——虽然大多是隐式的。所以,Comparator显式的声明了equals不影响它依然是个函数接口。 你可以用一个λ表达式为一个函数接口赋值:

Runnable r1 = () -> {System.out.println("Hello Lambda!");};    

然后再赋值给一个Object:

Object obj = r1;    

但却不能这样干:

Object obj = () -> {System.out.println("Hello Lambda!");}; // ERROR! Object is not a functional interface!

必须显式的转型成一个函数接口才可以:

 Object o = (Runnable) () -> { System.out.println("hi"); }; // correct    

一个λ表达式只有在转型成一个函数接口后才能被当做Object使用。所以下面这句也不能编译:

    System.out.println( () -> {} ); //错误! 目标类型不明    

必须先转型:

    System.out.println( (Runnable)() -> {} ); // 正确

假设你自己写了一个函数接口,长的跟Runnable一模一样:

@FunctionalInterface    
public interface MyRunnable {public void run();    }

那么

Runnable r1 =    () -> {System.out.println("Hello Lambda!");};    

MyRunnable2 r2 = () -> {System.out.println("Hello Lambda!");};

都是正确的写法。这说明一个λ表达式可以有多个目标类型(函数接口),只要函数匹配成功即可。但需注意一个λ表达式必须至少有一个目标类型。 JDK预定义了很多函数接口以避免用户重复定义。最典型的是Function:

@FunctionalInterface    
public interface Function<T, R> {   R apply(T t);    }

这个接口代表一个函数,接受一个T类型的参数,并返回一个R类型的返回值。 另一个预定义函数接口叫做Consumer,跟Function的唯一不同是它没有返回值。

    @FunctionalInterface    public interface Consumer<T> {        void accept(T t);    }

还有一个Predicate,用来判断某项条件是否满足。经常用来进行筛滤操作:

 @FunctionalInterface    public interface Predicate<T> {
        boolean test(T t);
    }    

综上所述,一个λ表达式其实就是定义了一个匿名方法,只不过这个方法必须符合至少一个函数接口。

λ表达式的使用

λ表达式用在何处

λ表达式主要用于替换以前广泛使用的内部匿名类,各种回调,比如事件响应器、传入Thread类的Runnable等。看下面的例子:

Thread oldSchool = new Thread( new Runnable () {
        @Override
        public void run() {
            System.out.println("This is from an anonymous class.");
        }} );

        Thread gaoDuanDaQiShangDangCi = new Thread( () -> {        
                 System.out.println("This is from an anonymous method (lambda exp)."); 
       } );

注意第二个线程里的λ表达式,你并不需要显式地把它转成一个Runnable,因为Java能根据上下文自动推断出来:一个Thread的构造函数接受一个Runnable参数,而传入的λ表达式正好符合其run()函数,所以Java编译器推断它为Runnable。

从形式上看,λ表达式只是为你节省了几行代码。但将λ表达式引入Java的动机并不仅仅为此。Java8有一个短期目标和一个长期目标。短期目标是:配合“集合类批处理操作”的内部迭代和并行处理(下面将要讲到);长期目标是将Java向函数式编程语言这个方向引导(并不是要完全变成一门函数式编程语言,只是让它有更多的函数式编程语言的特性),也正是由于这个原因,Oracle并没有简单地使用内部类去实现λ表达式,而是使用了一种更动态、更灵活、易于将来扩展和改变的策略(invokedynamic)。

λ表达式与集合类批处理操作(或者叫块操作)**

上文提到了集合类的批处理操作。这是Java8的另一个重要特性,它与λ表达式的配合使用乃是Java8的最主要特性。集合类的批处理操作API的目的是实现集合类的“内部迭代”,并期望充分利用现代多核CPU进行并行计算。Java8之前集合类的迭代(Iteration)都是外部的,即客户代码。而内部迭代意味着改由Java类库来进行迭代,而不是客户代码。例如:

for(Object o: list) { 
        // 外部迭代
        System.out.println(o);
    }

可以写成:

    list.forEach(o -> {System.out.println(o);}); //forEach函数实现内部迭代

集合类(包括List)现在都有一个forEach方法,对元素进行迭代(遍历),所以我们不需要再写for循环了。forEach方法接受一个函数接口Consumer做参数,所以可以使用λ表达式。 这种内部迭代方法广泛存在于各种语言,如C++的STL算法库、Python、ruby、scala等。 Java8为集合类引入了另一个重要概念:流(stream)。一个流通常以一个集合类实例为其数据源,然后在其上定义各种操作。流的API设计使用了管道(pipelines)模式。对流的一次操作会返回另一个流。如同IO的API或者StringBuffer的append方法那样,从而多个不同的操作可以在一个语句里串起来。看下面的例子:

List<Shape> shapes = shapes.stream()
.filter(s -> s.getColor() == BLUE)      
.forEach(s -> s.setColor(RED));

首先调用stream方法,以集合类对象shapes里面的元素为数据源,生成一个流。然后在这个流上调用filter方法,挑出蓝色的,返回另一个流。最后调用forEach方法将这些蓝色的物体喷成红色。(forEach方法不再返回流,而是一个终端方法,类似于StringBuffer在调用若干append之后的那个toString) filter方法的参数是Predicate类型,forEach方法的参数是Consumer类型,它们都是函数接口,所以可以使用λ表达式。

还有一个方法叫parallelStream(),顾名思义它和stream()一样,只不过指明要并行处理,以期充分利用现代CPU的多核特性。

shapes.parallelStream(); // 或shapes.stream().parallel()

来看更多的例子。下面是典型的大数据处理方法,Filter-Map-Reduce:

/**

 * DistinctPrimary.java

 */

package study.java8.stream;

import java.util.Arrays;

import java.util.List;

import java.util.stream.Collectors;

/**

 * @author jack 2016年8月18日 下午1:50:56

 */

public class DistinctPrimary {

 /**

  * @param args

  */

 public static void main(String[] args) {

 distinctPrimary(2,

                 2,

                 2,

                 5,

                 5,

                 5,

                 10,

                 8,

                 9,

                 11,

                 11,

                 13,

                 13,

                 13,

                 19,

                 23,

                 45,

                 97);

 }

 // 给出一个Integer类型的数组,找出其中所有不重复的素数

 public static void distinctPrimary(Integer... numbers) {

 List<Integer> l = Arrays.asList(numbers);

 List<Integer> r = l.stream()

                    .map(e -> new Integer(e))

                    .distinct()

                    .filter(e -> Primes.isPrime(e))

                    .collect(Collectors.toList());

 System.out.println("distinctPrimary result is: " + r);

 }

}

class Primes {

 public static boolean isPrime(int a) {

 boolean flag = true;

 if (a < 2) {// 素数不小于2

 return false;

 } else {

 for (int i = 2; i <= Math.sqrt(a); i++) {

 if (a % i == 0) {// 若能被整除,则说明不是素数,返回false

 flag = false;

 break;// 跳出循环

 }

 }

 }

 return flag;

 }

}

第一步:传入一系列String(假设都是合法的数字),转成一个List,然后调用stream()方法生成流。 第二步:调用流的map方法把每个元素由String转成Integer,得到一个新的流。map方法接受一个Function类型的参数,上面介绍了,Function是个函数接口,所以这里用λ表达式。 第三步:调用流的filter方法,过滤那些不是素数的数字,并得到一个新流。filter方法接受一个Predicate类型的参数,上面介绍了,Predicate是个函数接口,所以这里用λ表达式。 第四步:调用流的distinct方法,去掉重复,并得到一个新流。这本质上是另一个filter操作。 第五步:用collect方法将最终结果收集到一个List里面去。collect方法接受一个Collector类型的参数,这个参数指明如何收集最终结果。在这个例子中,结果简单地收集到一个List中。我们也可以用Collectors.toMap(e->e, e->e)把结果收集到一个Map中,它的意思是:把结果收到一个Map,用这些素数自身既作为键又作为值。toMap方法接受两个Function类型的参数,分别用以生成键和值,Function是个函数接口,所以这里都用λ表达式。

你可能会觉得在这个例子里,List l被迭代了好多次,map,filter,distinct都分别是一次循环,效率会不好。实际并非如此。这些返回另一个Stream的方法都是“懒(lazy)”的,而最后返回最终结果的collect方法则是“急(eager)”的。在遇到eager方法之前,lazy的方法不会执行。 当遇到eager方法时,前面的lazy方法才会被依次执行。而且是管道贯通式执行。这意味着每一个元素依次通过这些管道。例如有个元素“3”,首先它被map成整数型3;然后通过filter,发现是素数,被保留下来;又通过distinct,如果已经有一个3了,那么就直接丢弃,如果还没有则保留。这样,3个操作其实只经过了一次循环。

除collect外其它的eager操作还有forEach,toArray,reduce等。 下面来看一下也许是最常用的收集器方法,groupingBy:

    //给出一个String类型的数组,找出其中各个素数,并统计其出现次数    public void primaryOccurrence(String... numbers) {
        List<String> l = Arrays.asList(numbers);
        Map<Integer, Integer> r = l.stream()
.map(e -> new Integer(e))
.filter(e -> Primes.isPrime(e))
.collect( Collectors.groupingBy(p->p,Collectors.summingInt(p->1)) );
        
System.out.println("primaryOccurrence result is: " + r); 

   }

注意这一行:

    Collectors.groupingBy(p->p, Collectors.summingInt(p->1))

它的意思是:把结果收集到一个Map中,用统计到的各个素数自身作为键,其出现次数作为值。 下面是一个reduce的例子:

    //给出一个String类型的数组,求其中所有不重复素数的和    public void distinctPrimarySum(String... numbers) {        List<String> l = Arrays.asList(numbers);        int sum = l.stream()            .map(e -> new Integer(e))            .filter(e -> Primes.isPrime(e))            .distinct()            .reduce(0, (x,y) -> x+y); // equivalent to .sum()        System.out.println("distinctPrimarySum result is: " + sum);    }

reduce方法用来产生单一的一个最终结果。流有很多预定义的reduce操作,如sum(),max(),min()等。 再举个现实世界里的栗子比如:

    // 统计年龄在25-35岁的男女人数、比例    public void boysAndGirls(List<Person> persons) {        Map<Integer, Integer> result = persons.parallelStream().filter(p -> p.getAge()>=25 && p.getAge()<=35).            collect(                Collectors.groupingBy(p->p.getSex(), Collectors.summingInt(p->1))        );        System.out.print("boysAndGirls result is " + result);        System.out.println(", ratio (male : female) is " + (float)result.get(Person.MALE)/result.get(Person.FEMALE));    }

λ表达式的更多用法

 // 嵌套的λ表达式    
Callable<Runnable> c1 = () -> () -> { System.out.println("Nested lambda"); };   
c1.call().run();
    
// 用在条件表达式中    
Callable<Integer> c2 = true ? (() -> 42) : (() -> 24);    System.out.println(c2.call());
   
 // 定义一个递归函数,注意    
protected UnaryOperator<Integer>
 factorial = i -> i == 0 ? 1 : i  * this.factorial.apply( i - 1 ); 
 System.out.println(factorial.apply(3));

递归函数,注意 须用this限定

在Java中,随声明随调用的方式是不行的,比如下面这样,声明了一个λ表达式(x, y) -> x + y,同时企图通过传入实参(2, 3)来调用它:

    int five = ( (x, y) -> x + y ) (2, 3); // ERROR! try to call a lambda in-place

这在C++中是可以的,但Java中不行。Java的λ表达式只能用作赋值、传参、返回值等。

其它相关概念

捕获(Capture)

捕获的概念在于解决在λ表达式中我们可以使用哪些外部变量(即除了它自己的参数和内部定义的本地变量)的问题。 答案是:与内部类非常相似,但有不同点。不同点在于内部类总是持有一个其外部类对象的引用。而λ表达式呢,除非在它内部用到了其外部类(包围类)对象的方法或者成员,否则它就不持有这个对象的引用。

在Java8以前,如果要在内部类访问外部对象的一个本地变量,那么这个变量必须声明为final才行。在Java8中,这种限制被去掉了,代之以一个新的概念,“effectively final”。它的意思是你可以声明为final,也可以不声明final但是按照final来用,也就是一次赋值永不改变。换句话说,保证它加上final前缀后不会出编译错误。

在Java8中,内部类和λ表达式都可以访问effectively final的本地变量。 Java要求本地变量final或者effectively final的原因是多线程并发问题。内部类、λ表达式都有可能在不同的线程中执行,允许多个线程同时修改一个本地变量不符合Java的设计理念。

方法引用(Method reference)

任何一个λ表达式都可以代表某个函数接口的唯一方法的匿名描述符。我们也可以使用某个类的某个具体方法来代表这个描述符,叫做方法引用。例如:

Integer::parseInt //静态方法引用    
System.out::print //实例方法引用    
Person::new       //构造器引用

使用方法引用,你的程序会变得更短些。现在distinctPrimarySum方法可以改写如下:

    public void distinctPrimarySum(String... numbers) {
        List<String> l = Arrays.asList(numbers);
        int sum = 
        l.stream().map(Integer::new)
                         .filter(Primes::isPrime)
                         .distinct()
                         .sum();        
        System.out.println("distinctPrimarySum result is: " + sum);    }    

默认方法(Default method)

Java8中,接口声明里可以有方法实现了,叫做默认方法。在此之前,接口里的方法全部是抽象方法。

    public interface MyInterf {
            String m1();
                default String m2() {
            return "Hello default method!";
        }
   }    

这实际上混淆了接口和抽象类,但一个类仍然可以实现多个接口,而只能继承一个抽象类。

这么做的原因是:由于Collection库需要为批处理操作添加新的方法,如forEach(),stream()等,但是不能修改现有的Collection接口——如果那样做的话所有的实现类都要进行修改,包括很多客户自制的实现类。所以只好使用这种妥协的办法。

如此一来,我们就面临一种类似多继承的问题。如果类Sub继承了两个接口,Base1和Base2,而这两个接口恰好具有完全相同的两个默认方法,那么就会产生冲突。这时Sub类就必须通过重载来显式指明自己要使用哪一个接口的实现(或者提供自己的实现)。

除了默认方法,Java8的接口也可以有静态方法的实现:

    public interface MyInterf {
            String m1();
            default String m2() {
            return "Hello default method!";
           }
           static String m3() {
            return "Hello static method in Interface!";
           }
   }   

生成器函数(Generator function)

有时候一个流的数据源不一定是一个已存在的集合对象,也可能是个“生成器函数”。一个生成器函数会产生一系列元素,供给一个流。Stream.generate(Supplier<T> s)就是一个生成器函数。其中参数Supplier是一个函数接口,里面有唯一的抽象方法 <T> get()。 下面这个例子生成并打印5个随机数:

    Stream.generate(Math::random).limit(5).forEach(System.out::println);

注意这个limit(5),如果没有这个调用,那么这条语句会永远地执行下去。也就是说这个生成器是无穷的。这种调用叫做终结操作,或者短路(short-circuiting)操作。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏前端黑板报

一个数字截取引发的精度问题(三)

上次总结的第四条: 当传入的参数小于数字的整数位时,返回指数形式表示的字符串。 let numObj = 12345.6numObj.toPrecision(2...

20880
来自专栏aCloudDeveloper

全排列(含递归和非递归的解法)

全排列在近几年各大网络公司的笔试中出现的比较频繁 首先来看看题目是如何要求的。 用C++写一个函数, 如 Foo(const char *str), 打印出 s...

36790
来自专栏芋道源码1024

Java 函数式编程和 lambda 表达式

函数式编程更多时候是一种编程的思维方式,是种方法论。函数式与命令式编程的区别主要在于:函数式编程是告诉代码你要做什么,而命令式编程则是告诉代码要怎么做。说白了,...

11510
来自专栏java学习

面试题11(谈谈final、finally、finalize的区别)

考点:考察求职者对这3个java关键字的理解和区分 出现频率:★★★★ 【面试题解析】带有 final修饰符的类是不可派生的。在Java核心APⅠ中,有许多应用...

464100
来自专栏程序员同行者

python 函数进阶

函数根据 有没有参数 以及 有没有返回值,可以 相互组合,一共有 4 种 组合形式

12930
来自专栏java达人

java面试基础知识(一)

这套面试题主要目的是帮助那些还没有java软件开发实际工作经验,而正在努力寻找java软件开发工作的朋友在笔试时更好地赢得笔试和面试。由于这套面试题涉及的范围很...

24880
来自专栏BestSDK

封装、私有,一文掌握Python关键代码

首先,什么是 Python?根据 Python 创建者 Guido van Rossum 所言,Python 是一种高级编程语言,其设计的核心理念是代码的易读性...

39130
来自专栏数据科学学习手札

(数据科学学习手札49)Scala中的模式匹配

  Scala中的模式匹配类似Java中的switch语句,且更加稳健,本文就将针对Scala中模式匹配的一些基本实例进行介绍:

10440
来自专栏北京马哥教育

从Zero到Hero,一文掌握Python关键代码

本文整体梳理了 Python 的基本语法与使用方法,并重点介绍了对机器学习十分重要且常见的语法,如基本的条件、循环语句,基本的列表和字典等数据结构,此外还介绍...

32070
来自专栏技术专栏

Scala入门与进阶(五)- 模式匹配

9210

扫码关注云+社区

领取腾讯云代金券