1、首先理解下什么是 jvm 内存模型?
jvm内存模型定义了Java虚拟机运行时如何组织和管理内存,规定了各个内存区域的作用、结构和交互方式,以及线程间的内存可见性、内存操作的原子性等行为,以支持Java程序的执行,即一种约束或规定
2、内存区域划分及作用
a、栈(Stack)
用于存储方法的调用和局部变量,每个方法在调用时都会创建一个栈帧,栈帧包含方法的参数、局部变量以及部分运行时数据。方法的调用及返回则对应栈帧的入栈和出栈
局部变量表:局部变量表用于存储方法中的局部变量。它包含了方法的参数以及方法内部定义的局部变量。局部变量表中的每个变量都在编译时确定其类型和内存位置。
操作数栈:操作数栈用于存储方法执行过程中的操作数和中间结果。它是一个后进先出(LIFO)的数据结构,方法的操作数和计算结果通过操作数栈进行传递。
动态链接:栈帧中包含一个指向运行时常量池中方法的具体位置的引用,用于实现方法的动态绑定。动态链接在方法调用时确定所调用的方法。
返回值地址:栈帧中存储了方法执行完毕后的返回地址,用于指示程序在方法执行结束后继续执行的位置。
b、堆(Heap)
虚拟机内存管理的绝对核心,提供了动态分配和回收内存的机制,用于存储Java程序中创建的对象实例和数组
新生代(Young Generation):分为Eden空间、Survivor空间,JVM 最大的一块内存空间
Eden空间:是新创建对象的初始分配区域。大多数对象在被创建后都会被分配到Eden空间。
Survivor空间:当Eden空间中的对象经过一次垃圾回收后仍然存活,它们会被移动到Survivor空间。Survivor空间通常有两个,其中一个是空的,用于垃圾回收时进行对象复制。
老年代(Old Generation):用于存储生命周期较长的对象。当对象在新生代经过多次垃圾回收仍然存活时,会被移送到老年代。 age > 15 会进入老年代,是因为HotSpot在对象头中的标记字段分配的空间为4位,最多只能记录到15 (对应虚拟机参数 -XX:+MaxTenuringThreshold)
TLAB(thread local allocation buffer):线程私有的,为了减少多线程环境下的锁竞争,提高对象分配的性能而引入的优化技术。一种针对多线程环境下对象分配的优化策略。 不同的Java虚拟机实现 TLAB 可能会有不同的默认值。一般情况下,默认的TLAB大小是相对较小的,通常在几十KB到几百KB之间。在大多数情况下,线程可以直接在自己的TLAB中进行对象分配,无需竞争TLAB。可能需要竞争TLAB的情况:
线程的TLAB已满:线程的TLAB用尽,它需要重新分配一个新的TLAB。这个过程可能需要进行锁竞争,以确保线程可以安全地获取新的TLAB。
大对象分配:TLAB通常用于分配小对象,而较大的对象可能无法在TLAB中容纳。当线程需要分配较大的对象时,它可能无法在自己的TLAB中完成分配,而需要在堆上进行分配。在这种情况下,线程可能需要竞争全局的堆锁或其他锁来进行对象分配。
GC(垃圾回收)期间的TLAB分配:当进行垃圾回收时,JVM可能需要重新分配和回收TLAB。这个过程可能需要进行锁竞争,以确保在进行垃圾回收的同时,其他线程可以安全地分配对象。
c、方法区(Method Area)
用于存储类结构信息、常量、静态变量、即时编译器编译后的代码等数据的内存区域。方法区是线程共享的,用于支持多个线程的并发访问。
class常量池(Class Constant Pool):存储编译时生成的字面量和符号引用。包含了类中的常量、字段和方法的符号引用,这些符号引用在类加载时被解析为直接引用(在类加载和链接阶段使用)
- 字面值(Literal):指直接出现在代码中的常量值,例如整数、浮点数、字符、字符串、布尔值等。在编译阶段,编译器会将这些字面值的值存储在常量池中。例如,对于代码
int num = 10;
,数字10
就是一个字面值。- 符号引用(Symbolic Reference):指在编译阶段无法确定具体内存地址的引用,它包含了对类、方法、字段等符号的引用。在常量池中,符号引用以符号的形式存储,包括类的全限定名、方法的名称和描述符、字段的名称和描述符等。符号引用作为一种符号化的引用形式,可以在编译时进行跨模块的引用,而不需要指定具体的内存地址。
- 直接引用(Direct Reference):指直接指向内存中某个对象、方法或字段的指针、句柄或其他引用形式。运行时通过解析符号引用,转换为具体的直接引用,虚拟机可以定位到具体的内存地址,并进行方法调用、字段访问等操作。
运行时常量池(Runtime Constant Pool):存储经过解析的符号引用对应的直接引用。在类加载时,类的符号引用会被解析为直接引用,存储在运行时常量池中供程序在运行时使用(在类的实例化、方法调用等运行时操作中使用)
类的加载是在第一次使用该类时进行的,虚拟机为了防止多个线程同时加载同一个类,会对类加载过程进行同步处理(类加载的同步)。在类加载的过程中,会通过加锁机制保证同一时间只有一个线程可以加载该类。其他线程在等待时,会被阻塞或进入等待状态。
d、程序计数器(Program Counter,PC)
用于记录当前线程执行的字节码指令位置,实现分支控制、循环控制、异常处理和线程切换恢复等功能。程序计数器的正确性和准确性对于程序的正确执行非常关键。
e、本地方法(Native Method)
用于支持执行本地方法(Native Method)的线程调用。本地方法是使用非Java语言(通常是C或C++)编写的方法,通过Java本地接口(JNI)与Java代码进行交互。
本地方法栈与Java虚拟机栈类似,每个线程都有自己的本地方法栈。它们的主要区别是,Java虚拟机栈用于支持Java方法的调用和执行,而本地方法栈用于支持本地方法的调用和执行。
3、方法区的不同实现
a、因为虚拟机的多样性,不同的Java虚拟机按照规定或约束对方法区的实现也存在一些差异
Java 7及之前版本,通常采用永久代(Permanent Generation)作为方法区的实现方式,该区域使用固定大小的内存空间存储类的元数据、字节码和常量池等信息。然而,永久代的大小固定且无法动态调整,垃圾回收机制相对简单,可能导致内存溢出问题。
Java 8及之后版本,永久代被元空间(Metaspace)所取代,成为主流的方法区实现方式。元空间使用本地内存实现,将类的元数据存储在本地内存中。相比永久代,元空间的大小可以动态调整,避免了永久代内存溢出的问题,并利用操作系统的虚拟内存机制,减轻了内存管理的压力。值得注意的是Java 8及之后版本的元空间将一部分内容从方法区中移出,例如运行时常量池中的符号引用和字符串常量。这些内容被移到了堆中或者本地内存中。
Java 9及之后版本,引入了元空间的元数据共享特性,允许多个Java虚拟机进程共享元数据,进一步减少内存占用。
b、存储内容的区别
永久代(Permanent Generation):
- 类的元数据:包括类的名称、父类、接口、字段和方法等信息。
- 字节码:类的字节码指令。
- 运行时常量池:存储类的常量。
- 静态变量:类的静态字段。
元空间(Metaspace):
- 类的元数据:包括类的名称、父类、接口、字段和方法等信息。
- 字节码:类的字节码指令。
- 运行时常量池:存储类的常量。
- 符号引用:包括类的符号引用、方法的符号引用等。
- 字符串常量:存储字符串常量。
- 静态变量:类的静态字段。
永久代和元空间存储的内容是非常相似的,主要包括类的元数据、字节码、运行时常量池和静态变量等。
唯一的区别在于元空间还存储了符号引用,用于引用类、方法、字段等。符号引用在运行时可以解析为直接引用,从而实现动态链接和类加载的过程。此外,元空间还可以存储字符串常量,即类中的字符串字面量。