41 突破难点：如何看 Lambda 源码 · 面试官系统精讲Java源码及大厂真题

## 41 突破难点：如何看 Lambda 源码 ## 引导语大家都知道 Java8 中新增了 Lambda 表达式，使用 Lambda 表达式可以对代码进行大量的优化，用几行代码就可以做很多事情，本章以 Lambda 为例，第一小节说明一下其底层的执行原理，第二小节说明一下 Lambda 流在工作中常用的姿势。 ### 1 Demo 首先我们来看一个 Lambda 表达式的 Demo，如下图： ![](https://img.kancloud.cn/c4/52/c452000b5a5760efd79a3ae9e867d634_741x490.jpg) 代码比较简单，就是新起一个线程打印一句话，但对于图中 () -> System.out.println ( “ lambda is run “ ) 这种代码，估计很多同学都感觉到很困惑，Java 是怎么识别这种代码的？如果我们修改成匿名内部类的写法，就很清楚，大家都能看懂，如下图： ![](https://img.kancloud.cn/cd/26/cd268d57aad61c145054d833028bf708_695x555.jpg) 那是不是说 () -> System.out.println ( “ lambda is run “ ) 这种形式的代码，其实就是建立了内部类呢？其实这就是最简单 Lambda 表达式，我们是无法通过 IDEA 看到源码和其底层结构的，下面我们就来介绍几种可看到其底层实现的方式。 ### 2 异常判断法我们可以在代码执行中主动抛出异常，打印出堆栈，堆栈会说明其运行轨迹，一般这种方法简单高效，基本上可以看到很多情况下的隐藏代码，我们来试一下，如下图： ![](https://img.kancloud.cn/c7/1e/c71ea4d140ac005a75f976571ca1559d_765x697.jpg) 从异常的堆栈中，我们可以看到 JVM 自动给当前类建立了内部类（错误堆栈中出现多次的 $ 表示有内部类），内部类的代码在执行过程中，抛出了异常，但这里显示的代码是 Unknown Source，所以我们也无法 debug 进去，一般情况下，异常都能暴露出代码执行的路径，我们可以打好断点后再次运行，但对于 Lambda 表达式而言，通过异常判断法我们只清楚有内部类，但无法看到内部类中的源码。 ### 3 javap 命令法 javap 是 Java 自带的可以查看 class 字节码文件的工具，安装过 Java 基础环境的电脑都可以直接执行 javap 命令，如下图： ![](https://img.kancloud.cn/e8/86/e8864187839dd8f0844069421abf70b0_916x568.jpg) 命令选项中，我们主要是用-v -verbose 这个命令，可以完整输出字节码文件的内容。接下来我们使用 javap 命令查看下 Lambda.class 文件，在讲解的过程中，我们会带上一些关于 class 文件的知识。我们在命令窗口中找到 Lambda.class 所在的位置，执行命令：javap -verbose Lambda.class，然后你会看到一长串的东西，这些叫做汇编指令，接下来我们来一一讲解下（所有的参考资料来自 Java 虚拟机规范，不再一一引用说明）：汇编指令中我们很容易找到 Constant pool 打头的一长串类型，我们叫做常量池，官方英文叫做 Run-Time Constant Pool，我们简单理解成一个装满常量的 table ，table 中包含编译时明确的数字和文字，类、方法和字段的类型信息等等。table 中的每个元素叫做 cpinfo，cpinfo 由唯一标识 ( tag ) + 名称组成，目前 tag 的类型一共有： ![](https://img.kancloud.cn/a1/90/a190e236c10d2cb0853716f7972ce116_502x734.jpg) 贴出我们解析出来的部分图： ![](https://img.kancloud.cn/11/c6/11c66ddfd92620e4f223603546516e4a_1873x940.jpg) 1. 图中 Constant pool 字样代表当前信息是常量池； 2. 每行都是一个 cp_info ，第一列的 #1 代表是在常量池下标为 1 的位置； 3. 每行的第二列，是 cp_info 的唯一标识 ( tag ) ，比如 Methodref 对应着上表中的 CONSTANT_Methodref（上上图中表格中 value 对应 10 的 tag），代表当前行是表示方法的描述信息的，比如说方法的名称，入参类型，出参数类型等，具体的含义在 Java 虚拟机规范中都可以查询到，Methodref 的截图如下： ![](https://img.kancloud.cn/f7/3b/f73b0bb161c8df440f4d4560deee5357_1943x1449.jpg) 4. 每行的第三列，如果是具体的值的话，直接显示具体的值，如果是复杂的值的话，会显示 cp_info 的引用，比如说图中标红 2 处，引用两个 13 和 14 位置的 cp_info，13 表示方法名字是 init，14 表示方法无返回值，结合起来表示方法的名称和返回类型，就是一个无参构造器； 5. 每行的第四列，就是具体的值了。对于比较重要的 cp_info 类型我们说明下其含义： 1. InvokeDynamic 表示动态的调用方法，后面我们会详细说明； 2. Fieldref 表示字段的描述信息，如字段的名称、类型； 3. NameAndType 是对字段和方法类型的描述； 4. MethodHandle方法句柄，动态调用方法的统称，在编译时我们不知道具体是那个方法，但运行时肯定会知道调用的是那个方法； 5. MethodType 动态方法类型，只有在动态运行时才会知道其方法类型是什么。我们从上上图中标红的 3 处，发现 Ljava/lang/invoke/MethodHandles$Lookup，java/lang/invoke/LambdaMetafactory.metafactory 类似这样的代码，MethodHandles 和 LambdaMetafactory 都是 java.lang.invoke 包下面的重要方法，invoke 包主要实现了动态语言的功能，我们知道 java 语言属于静态编译语言，在编译的时候，类、方法、字段等等的类型都已经确定了，而 invoke 实现的是一种动态语言，也就是说编译的时候并不知道类、方法、字段是什么类型，只有到运行的时候才知道。比如这行代码：Runnable runnable = () -> System.out.println(“lambda is run”); 在编译器编译的时候 () 这个括号编译器并不知道是干什么的，只有在运行的时候，才会知道原来这代表着的是 Runnable.run() 方法。invoke 包里面很多类，都是为了代表这些 () 的，我们称作为方法句柄（ MethodHandler ），在编译的时候，编译器只知道这里是个方法句柄，并不知道实际上执行什么方法，只有在执行的时候才知道，那么问题来了，JVM 执行的时候，是如何知道 () 这个方法句柄，实际上是执行 Runnable.run() 方法的呢？首先我们看下 simple 方法的汇编指令： ![](https://img.kancloud.cn/b9/70/b9705daee85a385bdcaa8dcf0c35811d_765x528.jpg) 从上图中就可以看出 simple 方法中的 () -> System.out.println(“lambda is run”) 代码中的 ()，实际上是Runnable.run 方法。我们追溯到 # 2 常量池，也就是上上图中标红 1 处，InvokeDynamic 表示这里是个动态调用，调用的是两个常量池的 cp_info，位置是 #0:#37 ，我们往下找 #37 代表着是 // run:()Ljava/lang/Runnable，这里表明了在 JVM 真正执行的时候，需要动态调用 Runnable.run() 方法，从汇编指令上我们可以看出 () 实际上就是 Runnable.run()，下面我们 debug 来证明一下。我们在上上图中 3 处发现了 LambdaMetafactory.metafactory 的字样，通过查询官方文档，得知该方法正是执行时，链接到真正代码的关键，于是我们在 metafactory 方法中打个断点 debug 一下，如下图： ![](https://img.kancloud.cn/fe/ff/feff7439808bfa9ada9a2a568998380f_1797x859.jpg) metafactory 方法入参 caller 代表实际发生动态调用的位置，invokedName 表示调用方法名称，invokedType 表示调用的多个入参和出参，samMethodType 表示具体的实现者的参数，implMethod 表示实际上的实现者，instantiatedMethodType 等同于 implMethod。以上内容总结一下： 1：从汇编指令的 simple 方法中，我们可以看到会执行 Runnable.run 方法； 2：在实际的运行时，JVM 碰到 simple 方法的 invokedynamic 指令，会动态调用 LambdaMetafactory.metafactory 方法，执行具体的 Runnable.run 方法。所以可以把 Lambda 表达值的具体执行归功于 invokedynamic JVM 指令，正是因为这个指令，才可以做到虽然编译时不知道要干啥，但动态运行时却能找到具体要执行的代码。接着我们看一下在汇编指令输出的最后，我们发现了异常判断法中发现的内部类，如下图： ![](https://img.kancloud.cn/f3/cc/f3cc5812b4fb6b52544bbfbabc114141_1348x1047.jpg) 上图中箭头很多，一层一层的表达清楚了当前内部类的所有信息。 ### 4 总结我们总结一下，Lambda 表达式执行主要是依靠 invokedynamic 的 JVM 指令来实现，咱们演示的类的全路径为：demo.eight.Lambda 感兴趣的同学可以自己尝试一下。