JVM工作原理与实战(三十八):JIT即时编译器原理

专栏导航

JVM工作原理与实战

RabbitMQ入门指南

从零开始了解大数据


目录

专栏导航

前言

一、JIT即时编译器

二、HotSpot中的JIT编译器

三、JIT优化技术

1.方法内联

2.逃逸分析

四、JIT优化建议

总结


前言

JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了JIT即时编译器、HotSpot中的JIT编译器、JIT优化技术、JIT优化建议等内容。


一、JIT即时编译器

在Java编程环境中,即时编译器(JIT, Just-In-Time Compiler)是一项核心技术,旨在显著提高应用程序代码的执行效率。Java虚拟机(JVM)通常首先解释执行字节码指令,但随着时间的推移,它会识别出那些频繁执行的代码段,这些被称为“热点代码”。JIT编译器会针对这些热点代码进行优化编译,将它们从字节码形式转换为高效的本地机器码。这一转换过程还包括一系列优化步骤,以进一步提高代码的性能。一旦编译完成,这些优化后的机器码就会被保存在内存中,以便在未来执行时能够直接从内存中读取并运行在计算机的硬件上,从而避免了解释执行带来的额外开销。这种即时编译和优化的方式使得Java应用程序能够在运行时达到接近原生代码的性能水平。

二、HotSpot中的JIT编译器

在 HotSpot 虚拟机中,C1、C2 和 Graal 是三款不同的即时(Just-In-Time, JIT)编译器。它们的主要目标是提高代码的运行效率,但每个编译器在实现这一目标时采用了不同的策略和优化级别。

C1 编译器

  • 特点:C1 编译器的主要特点是编译速度快,但优化程度相对较低。
  • 适用场景:因此,它更适合执行时间较短、对编译速度要求较高的代码段,例如启动时的类加载和初始化过程。
  • 优化与取消优化:C1 的优化策略相对简单,它主要关注基本的性能提升,如方法内联、类型检查消除等。由于它更注重编译速度,所以在某些情况下,它可能会编译一些不那么优化的代码,以便尽快完成编译任务。取消优化的概念在这里并不明显,因为 C1 的主要目标是快速编译而不是深度优化。

C2 编译器

  • 特点:C2 编译器与 C1 相反,它更注重深度优化,以提高代码的长期运行性能。
  • 适用场景:因此,它更适合处理服务端程序中那些长期运行且需要更高性能的代码。
  • 优化与取消优化:C2 编译器采用了更为复杂的优化策略,包括高级方法内联、逃逸分析、循环展开、类型剖析等。这些优化可以显著提高代码的运行效率,尤其是在长期运行的程序中。然而,在某些情况下,过度的优化可能会导致代码膨胀(即编译后的代码体积增大),从而影响性能。因此,C2 编译器也会根据代码的运行情况和性能反馈来进行“取消优化”,即撤销一些不太必要或导致性能下降的优化。

C1 和 C2 编译器在优化和取消优化方面有着不同的侧重点。C1 更注重编译速度,而 C2 更注重深度优化。在实际运行中,HotSpot 虚拟机还会根据代码的运行情况和性能反馈来动态选择使用哪个编译器或进行哪些优化。

自JDK 7版本起,HotSpot引入了分层编译机制,该机制使得C1和C2编译器能够协同工作,共同提升代码性能。在分层编译中,整个优化过程被划分为五个不同的等级,每个等级对应着不同的编译策略和优化级别。

等级使用的组件描述保存的内容性能分数(1 - 5)
0解释器解释执行记录方法调用次数及循环次数1
1C1即时编译器C1完整优化优化后的机器码4
2C1即时编译器C1完整优化,记录方法调用次数及循环次数

优化后的机器码;

部分额外信息:方法调用次数及循环次数

3
3C1即时编译器C1完整优化,记录所有额外信息

优化后的机器码;

所有额外信息:分支跳转次数、类型转换等等

2
4C2即时编译器C2完整优化优化后的机器码5

C1和C2编译器各自拥有独立的线程来处理编译任务,这些线程内部维护了一个任务队列,用于存放待编译的代码。通常情况下,即时编译器主要针对方法进行优化,不过在某些情况下,也会对代码中的循环结构进行优化。

在HotSpot虚拟机中,C1和C2编译器的协作机制是实现高效代码编译和优化的关键。它们之间的协作主要体现在以下几个方面:

  • 信息收集和触发阈值:首先,C1编译器在执行代码的过程中会负责收集运行时的各种信息,如方法执行次数、循环执行次数、分支执行次数等。这些信息对于后续的优化至关重要。当这些执行次数达到一个由JVM动态计算的触发阈值时,代码会进入C2编译器进行更深层次的优化。这种触发机制确保了只有经过充分运行和验证的代码才会被进一步优化,从而提高了优化的针对性和效率。

  • 优化策略选择:在某些情况下,如果方法的字节码执行次数较少,JVM会评估C1和C2的优化性能。如果认为两者的优化效果相近,那么JVM将停止收集信息,并直接由C1编译器进行优化。这种策略选择机制避免了不必要的开销,确保了编译过程的效率。

  • 线程忙碌时的处理:当C1的线程资源紧张,无法及时处理编译任务时,C2编译器会接管这些任务。C2以其强大的优化能力来处理这些代码,确保了程序在忙碌场景下的性能表现。这种机制确保了在高负载情况下,代码仍然能够得到有效的编译和优化。

  • 分层编译和协作流程:在C2线程忙碌时,为了保持编译流程的连续性,会先由2层C1编译器进行初步的信息收集和优化。这一阶段的目的是快速积累运行时的基本信息。随后,这些信息会传递给3层C1进行处理。然而,由于3层C1的优化效率相对较低,因此会尽量减少在这一层的停留时间。这种分层编译和协作流程确保了即使在C2忙碌时,代码仍然能够得到一定程度的优化,而不会造成过多的延迟。一旦C2线程空闲,它会接手这些任务,并进行更为深入的优化,从而确保代码的最终性能。

三、JIT优化技术

JIT编译器主要通过方法内联逃逸分析两种技术来优化代码。

1.方法内联

这是一种将方法体中的字节码指令直接复制到调用方的字节码指令中的技术,它有助于减少栈帧的创建开销,提高代码的执行效率。但并非所有的方法都适合内联,它受到一定的限制,如方法的大小、热点度等。

案例(实际上,涉及的是字节码指令,但为了简化理解和说明,此处采用了源代码进行展示)

    int result = add(a, b);public int add(int a, int b) {return a + b;}

方法内联结果:

    int result = a+ b;

方法内联的限制:在Java虚拟机(JVM)的即时编译器(JIT)中,方法内联是一项重要的优化技术,但并非所有方法都可以或应该被内联。内联的应用受到一系列限制和条件的约束,以确保优化的有效性和代码的性能。以下是方法内联的一些主要限制:

  • 字节码指令大小限制:如果一个方法编译后的字节码指令总大小小于35字节,则JIT编译器通常会将其视为轻量级方法,并可能直接进行内联。这个限制可以通过JVM参数-XX:MaxInlineSize=值进行调整,允许更大的字节码大小进行内联。
  • 热方法的字节码大小限制:对于编译后的字节码指令总大小在35字节到325字节之间的方法,如果它们被频繁调用(即热方法),JIT编译器也可能会选择进行内联。这个限制可以通过-XX:FreqInlineSize=值参数进行配置,允许根据实际需求调整热方法的内联大小阈值。
  • 机器码大小限制:即使一个方法的字节码大小满足上述条件,其编译生成的机器码大小也不能超过1000字节。这是为了确保内联后的代码不会过于庞大,影响执行效率。这个限制可以通过-XX:InlineSmallCode=值参数进行调整。
  • 接口实现数量的限制:如果一个接口的实现方法数量超过3个,那么这些方法通常不会被内联。这是因为接口的实现通常具有多态性,内联过多的接口实现方法可能导致代码膨胀和性能下降。

这些限制确保了方法内联的针对性和有效性,避免了不必要的内联操作,从而提高了代码的执行效率和性能。在实际应用中,开发者可以通过调整JVM参数来平衡内联的积极程度和性能表现。

2.逃逸分析

逃逸分析是JIT(Just-In-Time)编译器中的一种高级优化技术,其核心在于判断方法内部创建的对象是否会被方法外部引用。如果JIT编译器确定一个对象不会“逃逸”到方法外部,即该对象的生命周期仅限于当前方法内,那么就可以应用一系列优化策略,如锁消除和标量替换,以提升程序性能。

锁消除:

锁消除是一种针对同步锁的优化手段。在逃逸分析的指导下,如果JIT编译器判断某个对象不会逃逸出当前方法,那么该对象就不会面临多线程并发访问的问题。因此,编译器可以选择消除该对象上的所有锁操作,包括锁的获取、释放以及等待锁的代码。这样可以有效减少线程间的竞争和同步开销,提高程序的执行效率。需要注意的是,锁消除优化在实际应用中并不常见,因为通常情况下,加锁的对象都是设计用来支持多线程并发访问的。

案例:

public void nonEscapingMethod() {  synchronized(new Object()) {  // ... 锁内的代码逻辑  }  
}

在上述代码中,由于新创建的对象只在nonEscapingMethod方法内部使用,并没有逃逸出去,因此理论上是可以进行锁消除的。

标量替换:

标量替换是逃逸分析中另一种重要的优化手段。在Java虚拟机中,对象内部的基本数据类型成员被称为标量,而对象引用的其他对象则被称为聚合量。当JIT编译器确定一个对象不会逃逸时,它可以选择将该对象拆分成若干个标量,并将这些标量直接在栈上分配而不是在堆上。这样做的好处是可以减少堆内存的分配和垃圾回收的压力,同时还能消除因对象访问带来的间接引用开销,从而提升程序的执行性能。

案例:

public class Point {  private int x, y;  ...
}  public void nonEscapingMethod() {  Point point = new Point(1, 2);  // 仅使用point的x和y属性,不逃逸  ...
}

在上述代码中,如果Point对象被确定不会逃逸出nonEscapingMethod方法,那么JIT编译器可能会选择将point对象的x和y属性直接作为局部变量处理,而不是在堆上分配一个完整的Point对象。这种优化就是标量替换。

四、JIT优化建议

针对JIT(Just-In-Time)编译器在优化Java代码时的特性,为了确保代码执行时能够获得卓越的性能,建议在编写代码时遵循以下几个关键指导原则:

  • 编写小型方法:为了最大化方法内联的效果,应尽可能编写小型且专一的方法。小型方法更有可能被JIT编译器识别为内联候选,从而消除方法调用的开销,提高执行效率。
  • 优化高频代码:对于频繁执行的代码段,特别是那些来自第三方依赖库或JDK本身的代码,如果其内部实现过于复杂,可能无法被内联。在这种情况下,可以考虑自行实现一个定制化的、更简洁的版本,以便JIT编译器能够更有效地对其进行优化。
  • 控制接口实现数量:接口的实现数量对JIT的内联处理有显著影响。为了促进内联,建议将接口的实现数量限制在最低必要水平,通常不应超过两个。这样可以降低内联的复杂性,提高编译器的优化能力。
  • 避免对象逃逸:在高频调用的方法中,如果创建了仅供临时使用的对象,应尽量避免这些对象逃逸到方法外部。对象逃逸可能导致额外的性能开销,如垃圾回收压力增加和可能的锁竞争。通过局部变量的使用或对象池技术,可以有效减少对象逃逸的情况。


总结

JVM是Java程序的运行环境,负责字节码解释、内存管理、安全保障、多线程支持、性能监控和跨平台运行。本文主要介绍了JIT即时编译器、HotSpot中的JIT编译器、JIT优化技术、JIT优化建议等内容,希望对大家有所帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/472232.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

问题:下列不属于影响职业选择的内在因素是()。 #微信#微信

问题:下列不属于影响职业选择的内在因素是()。 A.健康 B.个性特征 C.性别 D.家庭的影响 参考答案如图所示

【AIGC】Stable Diffusion之模型微调工具

推荐一款好用的模型微调工具,cybertron furnace 是一个lora训练整合包,提供训练 lora 模型的工具集或环境。集成环境包括必要的依赖项和配置文件、预训练脚本,支持人物、二次元、画风、自定义lora的训练,以简化用户训练 lora 模型…

springboot189基于SpringBoot电商平台的设计与实现

简介 【毕设源码推荐 javaweb 项目】基于springbootvue 的 适用于计算机类毕业设计,课程设计参考与学习用途。仅供学习参考, 不得用于商业或者非法用途,否则,一切后果请用户自负。 看运行截图看 第五章 第四章 获取资料方式 **项…

STM32 寄存器操作 GPIO 与下降沿中断

一、如何使用stm32寄存器点灯? 1.1 寄存器映射表 寄存器本质就是一个开关,当我们把芯片寄存器配置指定的状态时即可使用芯片的硬件能力。 寄存器映射表则是开关的地址说明。对于我们希望点亮 GPIO_B 的一个灯来说,需要关注以下的两个寄存器…

使用骨传导耳机真的不损伤听力吗?哪些人群适合购买骨传导耳机?

如果是正确的使用骨传导耳机,是不会损伤听力的,因为骨传导耳机采用开放式佩戴,而且传声方式不经过耳道和耳膜,是通过人体骨骼来传递声音,不会损伤耳膜,所以不会损伤听力。 由于骨传导耳机的特殊性&#xff…

指针的经典笔试题

经典的指针试题,让你彻底理解指针 前言 之前对于指针做了一个详解,现在来看一些关于指针的经典面试题。 再次说一下数组名 数组名通常表示的都是首元素的地址,但是有两个意外,1.sizeof(数组名)这里数组名…

【AIGC】Stable Diffusion的插件入门

一、上文中作者使用插件包的方式下安装插件,用户也可以从Stable Diffusion的界面安装插件,如下图所示,在相应的插件后面点安装按钮。 二、介绍一些比较好用的插件 “adetailer” 插件是 Stable Diffusion 中的一个增强功能,旨在提…

Leetcode-103. 二叉树的锯齿形层序遍历

这个年和树过不去啦啦啦! 题目: 给你二叉树的根节点 root ,返回其节点值的 锯齿形层序遍历 。(即先从左往右,再从右往左进行下一层遍历,以此类推,层与层之间交替进行)。 示例 1&…

vivim复习

vi/vim常用命令 vi&vim常用命令 set nu 显示行号 gg 跳转到文件开头 / 向后搜索 ? 向前搜索 n 查找下一处N 查找上一处 | 光标所在行行首L 屏幕所显示的底行{ 段首} 段尾- 前一行行首 后一行行首 ( 句首 ) 下一句首 $ 行末 M 屏…

《区块链公链数据分析简易速速上手小册》第2章:数据获取基础(2024 最新版)

文章目录 2.1 访问区块链数据2.1.1 基础知识2.1.2 重点案例:使用 Python 查询比特币交易记录2.1.3 拓展案例 1:使用 Web3.py 读取以太坊智能合约状态示例智能合约(Solidity)Python 脚本读取智能合约状态结论 2.1.4 拓展案例 2&…

SSM整合进阶操作

SSM整合: http://t.csdnimg.cn/0lgfl 响应格式统一 我们要保证一个项目中所有接口返回的数据格式的统一。这样无论是前端还是移动端开发获取到我们的数据后都能更方便的进行统一处理。 所以我们定义以下结果封装类 /*** 在将Java对象转换为JSON格式时,…

年薪又又又刷新认知,最高160万!鸿蒙开发者迎来黄金期!

如今,鸿蒙与安卓彻底切割时间似乎越来越近,一批嗅觉灵敏的互联网厂商已经完成或开始启动开发鸿蒙原生App。随着头部App厂商启动鸿蒙(HarmonyOS)原生应用开发,鸿蒙开发人才变得紧缺。专家预测,鸿蒙开发的人才…