企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
## 41 突破难点:如何看 Lambda 源码 ## 引导语 大家都知道 Java8 中新增了 Lambda 表达式,使用 Lambda 表达式可以对代码进行大量的优化,用几行代码就可以做很多事情,本章以 Lambda 为例,第一小节说明一下其底层的执行原理,第二小节说明一下 Lambda 流在工作中常用的姿势。 ### 1 Demo 首先我们来看一个 Lambda 表达式的 Demo,如下图: ![](https://img.kancloud.cn/c4/52/c452000b5a5760efd79a3ae9e867d634_741x490.jpg) 代码比较简单,就是新起一个线程打印一句话,但对于图中 () -> System.out.println ( “ lambda is run “ ) 这种代码,估计很多同学都感觉到很困惑,Java 是怎么识别这种代码的? 如果我们修改成匿名内部类的写法,就很清楚,大家都能看懂,如下图: ![](https://img.kancloud.cn/cd/26/cd268d57aad61c145054d833028bf708_695x555.jpg) 那是不是说 () -> System.out.println ( “ lambda is run “ ) 这种形式的代码,其实就是建立了内部类呢?其实这就是最简单 Lambda 表达式,我们是无法通过 IDEA 看到源码和其底层结构的,下面我们就来介绍几种可看到其底层实现的方式。 ### 2 异常判断法 我们可以在代码执行中主动抛出异常,打印出堆栈,堆栈会说明其运行轨迹,一般这种方法简单高效,基本上可以看到很多情况下的隐藏代码,我们来试一下,如下图: ![](https://img.kancloud.cn/c7/1e/c71ea4d140ac005a75f976571ca1559d_765x697.jpg) 从异常的堆栈中,我们可以看到 JVM 自动给当前类建立了内部类(错误堆栈中出现多次的 $ 表示有内部类),内部类的代码在执行过程中,抛出了异常,但这里显示的代码是 Unknown Source,所以我们也无法 debug 进去,一般情况下,异常都能暴露出代码执行的路径,我们可以打好断点后再次运行,但对于 Lambda 表达式而言,通过异常判断法我们只清楚有内部类,但无法看到内部类中的源码。 ### 3 javap 命令法 javap 是 Java 自带的可以查看 class 字节码文件的工具,安装过 Java 基础环境的电脑都可以直接执行 javap 命令,如下图: ![](https://img.kancloud.cn/e8/86/e8864187839dd8f0844069421abf70b0_916x568.jpg) 命令选项中,我们主要是用-v -verbose 这个命令,可以完整输出字节码文件的内容。 接下来我们使用 javap 命令查看下 Lambda.class 文件,在讲解的过程中,我们会带上一些关于 class 文件的知识。 我们在命令窗口中找到 Lambda.class 所在的位置,执行命令:javap -verbose Lambda.class,然后你会看到一长串的东西,这些叫做汇编指令,接下来我们来一一讲解下( 所有的参考资料来自 Java 虚拟机规范,不再一一引用说明): 汇编指令中我们很容易找到 Constant pool 打头的一长串类型,我们叫做常量池,官方英文叫做 Run-Time Constant Pool,我们简单理解成一个装满常量的 table ,table 中包含编译时明确的数字和文字,类、方法和字段的类型信息等等。table 中的每个元素叫做 cpinfo,cpinfo 由唯一标 识 ( tag ) + 名称组成,目前 tag 的类型一共有: ![](https://img.kancloud.cn/a1/90/a190e236c10d2cb0853716f7972ce116_502x734.jpg) 贴出我们解析出来的部分图: ![](https://img.kancloud.cn/11/c6/11c66ddfd92620e4f223603546516e4a_1873x940.jpg) 1. 图中 Constant pool 字样代表当前信息是常量池; 2. 每行都是一个 cp_info ,第一列的 #1 代表是在常量池下标为 1 的位置 ; 3. 每行的第二列,是 cp_info 的唯一标识 ( tag ) ,比如 Methodref 对应着上表中的 CONSTANT_Methodref(上上图中表格中 value 对应 10 的 tag),代表当前行是表示方法的描述信息的,比如说方法的名称,入参类型,出参数类型等,具体的含义在 Java 虚拟机规范中都可以查询到,Methodref 的截图如下: ![](https://img.kancloud.cn/f7/3b/f73b0bb161c8df440f4d4560deee5357_1943x1449.jpg) 4. 每行的第三列,如果是具体的值的话,直接显示具体的值,如果是复杂的值的话,会显示 cp_info 的引用,比如说图中标红 2 处,引用两个 13 和 14 位置的 cp_info,13 表示方法名字是 init,14 表示方法无返回值,结合起来表示方法的名称和返回类型,就是一个无参构造器; 5. 每行的第四列,就是具体的值了。 对于比较重要的 cp_info 类型我们说明下其含义: 1. InvokeDynamic 表示动态的调用方法,后面我们会详细说明; 2. Fieldref 表示字段的描述信息,如字段的名称、类型; 3. NameAndType 是对字段和方法类型的描述; 4. MethodHandle方法句柄,动态调用方法的统称,在编译时我们不知道具体是那个方法,但运行时肯定会知道调用的是那个方法; 5. MethodType 动态方法类型,只有在动态运行时才会知道其方法类型是什么。 我们从上上图中标红的 3 处,发现 Ljava/lang/invoke/MethodHandles$Lookup,java/lang/invoke/LambdaMetafactory.metafactory 类似这样的代码,MethodHandles 和 LambdaMetafactory 都是 java.lang.invoke 包下面的重要方法,invoke 包主要实现了动态语言的功能,我们知道 java 语言属于静态编译语言,在编译的时候,类、方法、字段等等的类型都已经确定了,而 invoke 实现的是一种动态语言,也就是说编译的时候并不知道类、方法、字段是什么类型,只有到运行的时候才知道。 比如这行代码:Runnable runnable = () -> System.out.println(“lambda is run”); 在编译器编译的时候 () 这个括号编译器并不知道是干什么的,只有在运行的时候,才会知道原来这代表着的是 Runnable.run() 方法。invoke 包里面很多类,都是为了代表这些 () 的,我们称作为方法句柄( MethodHandler ),在编译的时候,编译器只知道这里是个方法句柄,并不知道实际上执行什么方法,只有在执行的时候才知道,那么问题来了,JVM 执行的时候,是如何知道 () 这个方法句柄,实际上是执行 Runnable.run() 方法的呢? 首先我们看下 simple 方法的汇编指令: ![](https://img.kancloud.cn/b9/70/b9705daee85a385bdcaa8dcf0c35811d_765x528.jpg) 从上图中就可以看出 simple 方法中的 () -> System.out.println(“lambda is run”) 代码中的 (),实际上是Runnable.run 方法。 我们追溯到 # 2 常量池,也就是上上图中标红 1 处,InvokeDynamic 表示这里是个动态调用,调用的是两个常量池的 cp_info,位置是 #0:#37 ,我们往下找 #37 代表着是 // run:()Ljava/lang/Runnable,这里表明了在 JVM 真正执行的时候,需要动态调用 Runnable.run() 方法,从汇编指令上我们可以看出 () 实际上就是 Runnable.run(),下面我们 debug 来证明一下。 我们在上上图中 3 处发现了 LambdaMetafactory.metafactory 的字样,通过查询官方文档,得知该方法正是执行时, 链接到真正代码的关键,于是我们在 metafactory 方法中打个断点 debug 一下,如下图: ![](https://img.kancloud.cn/fe/ff/feff7439808bfa9ada9a2a568998380f_1797x859.jpg) metafactory 方法入参 caller 代表实际发生动态调用的位置,invokedName 表示调用方法名称,invokedType 表示调用的多个入参和出参,samMethodType 表示具体的实现者的参数,implMethod 表示实际上的实现者,instantiatedMethodType 等同于 implMethod。 以上内容总结一下: 1:从汇编指令的 simple 方法中,我们可以看到会执行 Runnable.run 方法; 2:在实际的运行时,JVM 碰到 simple 方法的 invokedynamic 指令,会动态调用 LambdaMetafactory.metafactory 方法,执行具体的 Runnable.run 方法。 所以可以把 Lambda 表达值的具体执行归功于 invokedynamic JVM 指令,正是因为这个指令,才可以做到虽然编译时不知道要干啥,但动态运行时却能找到具体要执行的代码。 接着我们看一下在汇编指令输出的最后,我们发现了异常判断法中发现的内部类,如下图: ![](https://img.kancloud.cn/f3/cc/f3cc5812b4fb6b52544bbfbabc114141_1348x1047.jpg) 上图中箭头很多,一层一层的表达清楚了当前内部类的所有信息。 ### 4 总结 我们总结一下,Lambda 表达式执行主要是依靠 invokedynamic 的 JVM 指令来实现,咱们演示的类的全路径为:demo.eight.Lambda 感兴趣的同学可以自己尝试一下。