原创 菜菜的后端私房菜
Java文件编译成字节码文件后,通过类加载机制到Java虚拟机中,Java虚拟机能够执行所有符合要求的字节码,因此无论什么语言,只要能够编译成符合要求的字节码文件就能够被Java虚拟机执行.
Java虚拟机和字节码是语言、平台无关性的基石.
本篇文章将深入浅出的解析字节码文件.
一、无关性的基石
曾经: 源代码⏩经过编译⏩本地机器码
Java: 源代码⏩经过编译⏩字节码 ⏩解释器 ⏩ 本地机器码
字节码
: 与操作系统和机器指令集无关的,平台中立的程序编译后的存储格式
字节码是无关性的基石。
平台无关性的基石:
所有平台都统一支持字节码
不同的Java虚拟机都可以执行平台无关的字节码
因此实现了 一次编译,到处运行
语言无关性的基石:
Java虚拟机
字节码
Java虚拟机不是只可以执行Java源代码编译而成的字节码,只要符合要求(安全...)的字节码,它都可以执行
因此Kotlin...等语言可以运行在Java虚拟机上
二、Class类文件结构
文件格式存取数据的类型
1、无符号数 : u1,u2,u4,u8代表1,2,4,8个字节的无符号数(可以表示数字,UTF-8的字符串,索引引用....)
2、表: 由n个无符号数或n个表组成(命名以_info
结尾)
2.1 初识Class文件格式
2.1.1 编写Java源代码
public class Test {private int m;private final int CONSTANT=111;public int inc() throws Exception {int x;try {x = 1;return x;}catch (Exception e){x = 2;return x;}finally{x = 3;}}}
2.1.2 使用可视化工具classpy查看反编译的结果
每个集合前都有一个计数器来统计集合中元素的数量
2.1.3 Class文件格式的描述
魔数与主次版本号
魔数
: 确定这个文件是否为一个能被虚拟机接受的有效Class文件
主次版本号
: 虚拟机拒绝执行超过其版本号的Class文件
不同版本的Java前端编译器编译生成对应的Class文件主次版本号不同支持高版本JVM执行低版本前端编译器生成的Class文件(向下兼容)拒绝低版本JVM执行高版本前端编译器生成的Clsss文件
常量池
常量池包含两大常量: 字面量和符号引用
符号引用使用一组符号描述引用(为了定位到目标引用)与虚拟机内存布局无关还是符号引用时目标引用不一定被加载到内存直接引用直接执行目标的指针,相对偏移量或间接定位目标引用的句柄与虚拟机内存布局相关解析直接引用时目标引用已经被加载到内存中
字面量文本字符串被final声明的常量符号引用全限定名方法或字段的简单名称和描述符
图中的常量有我们代码中熟悉的常量也有很多没有显示出现在代码中的常量
访问标志:用于识别类或接口的访问信息
是否是一个接口,枚举,模块,注解...
是否被final(public,abstract...)修饰
ACC_PUBLIC:被public修饰
ACC_SUPER: 允许使用invokespecial字节码指令
类索引,父类索引与接口索引集合
类索引指向常量池中表示该类的符号引用
父类索引指向常量池中表示该类父类的符号引用
除了Object外,所有类的父类索引都不为0
我们的例子中没有实现接口,就没有(接口索引集合计数器为0)
字段表集合:描述类声明的字段
字段包括类变量和成员变量(实例变量),不包括局部变量
简单名称字段: 没有描述字段类型的名称方法: 没有描述参数列表和返回类型的名称描述符参数列表按照从左到右的顺序写在()中。返回类型写到最后。比如String method(long[],int,String[]) => ([JIL[java.lang.String)Ljava.lang.String在前面先写n个[ 再写标识字符。比如java.lang.Integer[ ] => [Ljava.lang.Integer字段: 描述字段的类型方法: 描述参数列表和返回值描述符字符含义(long,boolean,对象类型是J,Z,L 其他都是首字母大写)
描述符描述n维数组描述符描述方法
因此Class文件中字段描述符指向常量池中的#07 I 符号引用(的索引)
1、字段表集合不会列出父类或父接口中声明的字段2、只用 简单名称 来确定字段,所以不能有重名字段3、用 简单名称 和 描述符 确定方法,所以方法可以重名(重载)字节码文件 规定 简单名称+描述符相同才是同一个方法但是 Java语法 规定 重载 = 简单名称相同 + 描述符的参数列表不同 + 描述符的返回类型不能不同
方法表集合:描述类声明的方法
与字段表集合类似
属性表集合:用于描述某些场景专有信息
属性比较多,这里只说明我们例子中出现的,其他的会总结
刚刚在字段,方法表集合中都可以看到属性表集合,说明属性表集合是可以被携带的
Code属性
Java源代码中方法体中的代码经过编译后编程字节码指令存储在Code属性内
其中的异常表集合代表 编译器为这段代码生成的多条异常记录,对应着可能出现的代码执行路径
(程序在try中不抛出异常会怎么执行,抛出异常又会怎么执行....)
Exceptions属性
列举出方法中可能抛出的检查异常(Checked Exception),也就是方法声明throws关键字后面的列举异常
LineNumberTable属性
描述Java源码行号与字节码指令行号(字节码偏移量)对应关系
SourceFile属性
记录生成此Class文件的源码名称
StackMapTable属性
虚拟机类加载验证阶段的字节码验证时,不需要再检验了,只需要查看StackMapTable属性中的记录是否合法
编译阶段将一系列的验证类型结果记录在StackMapTable属性中
ConstantValue:在类加载的准备阶段,为静态变量(常量)赋值
只有类变量才有这个属性
实例变量的赋值: 在实例构造器
类变量的赋值: 在类构造器或 带有ConstantValue属性在类加载的准备阶段
如果类变量被final修饰(此时该变量是一个常量),且该变量数据类型是基本类型或字符串,就会生成ConstantValue属性,该属性指向常量池中要赋值的常量,在类加载的准备阶段,直接把在常量池中ConstantValue指向的常量赋值给该变量
总结所有属性
三、javap解析Class文件
关于javac
javac xx.java
:编译Java源文件,不会生成对应的局部变量表
javac -g xx.java
:编译Java源文件,生成对应的局部变量表
idea中编译Java源文件使用的是javac -g
关于javap
常用
javap -v
基本上可以反汇编出Class文件中的很多信息(常量池,字段集合,方法集合...)
但是它不会显示私有字段或方法的信息,所以可以使用javap -v -p
详解javap -v -p
public class JavapTest {private int a = 1;float b = 2.1F;protected double c = 3.5;public int d = 10;private void test(int i){i+=1;System.out.println(i);}public void test1(){String s = "test1";System.out.println(s);}}