深入学习JVM —— GC垃圾回收机制

前言

        前面荔枝已经梳理了有关JVM的体系结构和类加载机制,也详细地介绍了JVM在类加载时的双亲委派模型,而在这篇文章中荔枝将会比较详细地梳理有关JVM学习的另一大重点——GC垃圾回收机制的相关知识,重点了解的比如对象可达性的判断、四种回收算法、分代回收机制的流程和区域划分。希望对有需要的小伙伴有帮助~~~~


文章目录

前言

一、基本概念

1.1 Java中的引用类型 

1.2 垃圾回收区域

1.3 判断对象可回收的方法

1.3.1 引用计数法

1.3.2 可达性分析法

二、JVM中的垃圾回收算法

2.1 标记——清除算法

2.2 标记——复制算法

2.3 标记——整理算法

三、分代回收机制

3.1 垃圾回收的类型

3.2 空间结构与区域划分

3.3 跨代引用

总结


一、基本概念

        GC(Carbage Collection)又称为垃圾回收器,我们知道一个对象在其生命周期结束的时候是会被销毁掉的,在Java中对象的销毁时不需要开发者去显示调用的,而是交给Java虚拟机中的垃圾回收器来回收。Java中提供了多种垃圾回收器,而在JVM中会一直维护一个垃圾回收线程,通常该线程只有在堆内存不足或者是JVM空闲的时候才会触发执行,将他们添加到要回收的集合中并进行回收。

GC监控时机 

        对于GC来说,当程序员创建对象时,GC就开始监控这个对象的地址、大小以及使用情况。通常,GC采用有向图的方式记录和管理堆(heap)中的所有对象。通过这种方式确定哪些对象是"可达的",哪些对象是"不可达的"。当GC确定一些对象为"不可达"时,GC就有责任回收这些内存空间。

1.1 Java中的引用类型 

Java中的引用类型有四种,分别是:强引用、弱引用、软引用和虚引用。Java中的默认声明其实就是强引用。

//强引用
//强引用所关联的对象始终不会被垃圾回收机制回收
String str
Object obj = new Object();//软引用
//内存不足的时候才会回收软引用所关联的对象
//软引用是通过java.lang.ref.SoftReference
buff = new byte[1024 * 1024];
SoftReference<byte[]> sr = new SoftReference<>(buff);//弱引用
//无论内存是否足够,只要 JVM 开始进行垃圾回收,那些被弱引用关联的对象都会被回收
//java.lang.ref.WeakReference 来表示弱引用
byte[] buff = new byte[1024 * 1024];
WeakReference<byte[]> sr = new WeakReference<>(buff);//虚引用
//虚引用是最弱的一种引用关系,如果一个对象仅持有虚引用,那么它就和没有任何引用一样,它随时可能会被回收
//用 PhantomReference 类来表示
  • 强引用:发生 gc 的时候不会被回收,即使内存不足也不会回收而是抛出异常,如果想中断强引用于对象之间的联系,可以给引用赋值为null,这样对象就可以被回收了。
  • 软引用:有用但不是必须的对象,在发生内存溢出之前会被回收。
  • 弱引用:有用但不是必须的对象,在下一次GC时会被回收。
  • 虚引用:无法通过虚引用获得对象,用 PhantomReference 实现虚引用,虚引用的用途是在 gc 时返回一个通知。

1.2 垃圾回收区域

         在上一篇文章JVM的体系架构中我们了解了JVM的内存结构,其中讲到了JVM内存结构中的栈区中的基本类型数据是不会被垃圾回收机制给回收的,而是在超出其作用范围自动销毁滴。其实JVM中的GC机制主要是回收堆区和方法区内的基本数据和对象。

1.3 判断对象可回收的方法

在GC垃圾回收机制中,当对象没有引用了或者方法不可达就可以判断该对象可以回收,即垃圾回收线程可以将该对象加入回收集合了,具体的判断对象可达性的方法如下: 

1.3.1 引用计数法

为每个对象创建一个引用计数,有对象引用时计数器 +1,引用被释放时计数 -1,当计数器为 0 时就可以被回收,这种方法实现起来比较简单。

缺点:无法回收相互引用的对象。

1.3.2 可达性分析法

        可达性分析法又被称为根搜索法,用来判断对象是否存活。从GC机制的某一个根节点触发开始向下搜索,搜索所走过的路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是可以被回收的。

可作为根节点的对象:

  • 在虚拟机栈帧中引用的对象,例如线程调用方法时,使用或产生的参数、局部变量、临时变量等。
  • 在方法区中,类的引用类型静态变量或常量;
  • 在本地方法栈中的JNI引用的对象;
  • 在JVM内部的对象,例如基本数据类型的Class对象,一些常驻的异常对象(NullPointExcepiton),系统类加载器等;
  • 所有synchronized同步锁的持有对象;
  • 反映JVM内部情况的JMXBean、JVMTI注册的回调、本地代码缓存等。

二、JVM中的垃圾回收算法

JVM中的垃圾回收算法主要有四种,其中按回收策略来说应该分为两类:分代回收和局部回收。我们先来梳理局部回收的三种回收算法:

2.1 标记——清除算法

        简单描述该方法就是标记出所有的存活对象,再扫描整个空间中未被标记的对象进行垃圾清除(回收)。标记 - 清除算法由于回收后没有进行整理的操作,所以会存在内存空间碎片化的问题,可能会导致后续产生的对象不能找到可利用的空间这个问题。

2.2 标记——复制算法

        常规的复制算法就是将内存分为两块大小相同的空间,但其中的一块内存用完后就会将存活的对象拷贝到另一块内存中,之后再将原空间进行一次性清理,这个方法虽然效率高但却是以牺牲内存空间为代价的。标记-复制算法在这个基础之上对其进行了优化,不再是通过1:1的比例来分配内存空间,而是按照8:1:1来分配内存空间的,即将内存空间的80%作为Eden空间,剩下的20%分成两个10%的Survivor空间。把Eden和其中一块Survivor空间中存活的对象,复制到另一块空闲的Survivor空间,然后直接把Eden和使用过的那块Survivor空间清理掉。

需要注意的是:

        目前主流的使用分代回收机制的Java虚拟机,都是使用标记-复制算法来作为新生代的回收算法。它非常适合用在新生代这种回收率极高的场景,这样的场景下,复制算法浪费的空间几乎可以忽略不计。效率高,且内存不会有碎片化的问题。 

分配担保机制

        极端情况下可能会出现超过10%的对象存活,分配担保机制就是为了保证当出现这种情况时,有其他内存空间来存放存活的对象。通常这个“担保人”是老年代,当存活的对象超过Survivor空间大小时,这些存活的对象会忽略年龄,直接进入老年代里。  

2.3 标记——整理算法

        在前面我们了解到标记-清除算法的缺点就是会产生内存碎片,不适合哪些需要大量连续内存空间的场景,而标记-整理算法就是在其基础之上,增加了整理这个操作来解决内存空间碎片化的问题

算法流程

        首先标记出所有的存活对象,但在清除之前会先进行整理,把所有存活的对象往内存空间的左边移动,然后清理掉存活对象边界以外的内存,即完成了清除的操作。标记-整理 算法是在 标记-清除 算法之上,又进行了对象的移动排序整理,因此成本更高,但却解决了内存碎片的问题。上面的几种算法比较适合于老年代中的对象回收。


三、分代回收机制

接着我们来看看分代回收算法,在介绍分代回收机制之前,我们需要明确两个分代假说,或者说是常识也行:

  • 弱分代假说:绝大多数对象都是朝生夕改的
  • 强分代假说:熬过越多次垃圾回收的对象就越难消亡

根据分代假说,既然绝大多数对象容易被垃圾回收,而留下的对象不易被回收,就可以对GC区域内对象进行分类,分为新生代和老年代。相比两个区域内的对象的特性,GC就不用每次都对老年代进行搜索标记,而仅需要搜索标记新生代所存放的内存空间即可。

3.1 垃圾回收的类型

  • Minor GC:只回收新生代对象存放的内存空间
  • Major GC:只回收老年代对象存放的内存空间,只有CMS收集器实现了Major GC
  • Full GC:回收整个堆区和方法区,相当于全盘扫描标记,效率低
  • Mixed GC:回收整个新生代和部分老年代。G1收集器实现了这个类型 

需要注意的是:在老年代里,触发GC,除了CMS和G1之外的其他收集器,大多数触发的其实是 Full GC。

3.2 空间结构与区域划分

我们知道在GC中一般将对象分为新生代(年轻代)和老年代(年老代),下面我们详细认识一下整个二者以及堆区和方法区的具体空间结构。

新生代:

绝大多数新创建的对象会被分配到新生代里,仅在该区域进行垃圾回收被称之为Minor GC。

老年代:

        对象在新生代周期中存活了下来的,会被拷贝到这里。通常情况下这个区域分配的空间要比新生代多。正是由于对象经历的GC次数越多越难回收,加上相对大的空间,一般发生在老年代的GC次数要比新生代少得多。这个区域触发的垃圾回收称之为:Major GC 或者 Full GC。

永久代

        是hotspot虚拟机的特有的概念,他不属于堆内存,是方法区的一种实现,各大厂商对方法区其实都有各自的实现。永久代一般存放jvm运行时需要的类,包含java库的类和方法,在触发full gc的情况下,永久代也会被进行垃圾回收。在JDK1.8之后,JVM使用元空间metaspace来取代永久代,最大区别是元空间中的数据是储存在本地内存的。

空间结构

        一般来说呢,新生代的空间会被按照 8:1:1 的方式来进行划分为一个Eden空间和两个Survivor空间,这种设计是为了更好的适配新生代对象容易被回收的特点,同时也比较适合使用标记——复制算法来GC。那些经历了多次GC的对象一般都是从新生代的Eden到Survive空间,重复N次达到设定的阈值后才会到老年代空间里面,当然也有一些比较大的对象是直接到老年代空间里面的。

 

老年代区域GC耗时更长的原因:

  • 老年代中会有更比较大的对象,并且老年代的内存占比一般更大;
  • 老年代使用的是标记-整理算法,清理内存前会把存活的对象重新排序整理成连续的空间,成本更高

3.3 跨代引用

场景:新生代中的对象很有可能会被老年代里的对象所引用,当新生代触发GC的时候,只搜索新生代的区域明显是不够的,还得搜索老年代的对象是否引用了新生代中非 GC Roots 引用链上的对象,来确保正确性。 

解决方法 

        Java定义了一种名为记忆集的抽象的数据结构,用于记录存在跨区域引用的对象指针集合。大多数的虚拟机,都采用一种名为卡表(Card Table)的方式去实现记忆集,卡表由一个数组构成,每一个元素都对应着一块特定大小的内存区域,这块内存区域被称之为卡页(Card Page),每一个卡页,可能会包含N个存在跨区域引用的对象,只要存在跨区域引用的对象,这个卡页就会被标识为1。当GC发生的时候,就不需要扫描整个区域了,只需要把这些被标识为1的卡页加入对应区域的 GC Roots 里一起扫描即可。


总结

        这篇文章结束,荔枝有关JVM的初步学习就要告一段落啦,这篇文章主要还是大体上了解了JVM的垃圾回收机制中的一些空间结构和区域划分,以及不同时期的对象在堆空间中存储的区域和相关的回收算法。总的来说通过这几篇文章应该就答题了解的差不多了,接下来荔枝就要开始看项目和继续学习一些中间件了哈哈哈,大家一起加油啦~~~

今朝已然成为过去,明日依然向往未来!我是小荔枝,在技术成长的路上与你相伴,码文不易,麻烦举起小爪爪点个赞吧哈哈哈~~~ 比心心♥~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/53151.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

7种有效安全的网页抓取方法,如何避免被禁止?

网页抓取是一种从互联网上抓取网页内容的过程&#xff0c;但在网络抓取种相信您也经常遇到障碍&#xff1f;尤其是做跨境业务的&#xff0c;在抓取国外的网站时更有难度。但我们站在您的立场上&#xff0c;提供七种有效的方法来进行网页抓取而不被阻止&#xff0c;最大限度地降…

【云原生】Serverless 技术架构分析

一、什么是Serverless? 1、Serverless技术简介 ​ Serverless&#xff08;无服务器架构&#xff09;指的是由开发者实现的服务端逻辑运行在无状态的计算容器中&#xff0c;它由事件触发&#xff0c; 完全被第三方管理&#xff0c;其业务层面的状态则被开发者使用的数据库和存…

windows部署springboot项目 jar项目 (带日志监听和开机自起脚本)

windows部署springboot项目 jar项目 &#xff08;带日志监听&#xff09; 1.把项目打包成jar包&#xff0c;本例演示打包后的jar文件名为demo.jar ———————————————— 2.需要装好java环境&#xff0c;配置好JAVA_HOME&#xff0c;CLASSPATH&#xff0c;PATH等…

数据结构--线性表2-2

目录 一、线性表例题&#xff1a; 二、分配动态内存&#xff1a; 1.动态创建一个空顺序表的算法&#xff1a; 2.动态顺序表的插入算法&#xff1a; 3.动态顺序表的删除 三、线性表的链式表示和实现 例题1&#xff1a;创建链表并插入26个字母 例题2&#xff1a;在链表中取…

docker端口映射详解(随机端口、指定IP端口、随意ip指定端口、指定ip随机端口)

目录 docker端口映射详解 一、端口映射概述&#xff1a; 二、案例实验&#xff1a; 1、-P选项&#xff0c;随机端口 2、使用-p可以指定要映射到的本地端口。 Local_Port:Container_Port&#xff0c;任意地址的指定端口 Local_IP:Local_Port:Container_Port 映射到指定地…

嵌入式面试刷题(day3)

文章目录 前言一、怎么判断两个float是否相同二、float数据可以移位吗三、数据接收和发送端大小端不一致怎么办四、怎么传输float类型数据1.使用联合进行传输2.使用字节流3.强制类型转换 总结 前言 本篇文章我们继续讲解嵌入式面试刷题&#xff0c;给大家继续分享嵌入式中的面…

分布式异步任务处理组件(七)

分布式异步任务处理组件底层网络通信模型的设计--如图&#xff1a; 使用Java原生NIO来实现TCP通信模型普通节点维护一个网络IO线程&#xff0c;负责和主节点的网络数据通信连接--这里的网络数据是指组件通信协议之下的直接面对字节流的数据读写&#xff0c;上层会有另一个线程负…

嵌入式该往哪个方向发展?

1. 你所在的城市嵌入式Linux岗位多吗&#xff1f;我觉得这是影响你做决定的另一个大问题。我们学嵌入式Linux这门技术&#xff0c;绝大部分人是为了从事相关的工作&#xff0c;而不是陶冶情操。但是根据火哥统计来看&#xff0c;嵌入式Linux的普遍薪资虽然高于单片机&#xff0…

把几个Cad图纸 合并到一个Cad文件。但是不同图纸比例不一致,怎么调成一样大--推荐

把几个Cad图纸 合并到一个Cad文件。但是不同图纸比例不一致&#xff0c;怎么调成一样大; 一、需求&#xff1a; 最近在做cad画图纸的过程中&#xff0c;需要在不同的图上获取“框图”&#xff0c;但是复制到当前的cad中后&#xff0c;大小&#xff0c;比例都是变了&#xff0c…

Day11-Webpack前端工程化开发

Webpack 一 webpack基本概念 遇到问题 开发中希望将文件分开来编写,比如CSS代码,可以分为头部尾部内容,公共的样式。 JS代码也希望拆分为多个文件,分别引入,以后代码比较好维护。 本地图片,希望可以实现小图片不用访问后端,保存在前端代码中就可以了 运行程序时我…

Windows下安装Spark(亲测成功安装)

Windows下安装Spark 一、Spark安装前提1.1、JDK安装&#xff08;version&#xff1a;1.8&#xff09;1.1.1、JDK官网下载1.1.2、JDK网盘下载1.1.3、JDK安装 1.2、Scala安装&#xff08;version&#xff1a;2.11.12&#xff09;1.2.1、Scala官网下载1.2.2、Scala网盘下载1.2.3、…

LLVM笔记1

参考&#xff1a;https://www.bilibili.com/video/BV1D84y1y73v/?share_sourcecopy_web&vd_sourcefc187607fc6ec6bbd2c74a3d0d7484cf 文章目录 零、入门名词解释1. Compiler & Interpreter2. AOT静态编译和JIT动态解释的编译方式3. Pass4. Intermediate Representatio…