JVM运行时数据区——对象的实例化内存布局与访问定位

文章目录

  • 1、对象的实例化
    • 1.1、创建对象的方式
    • 1.2、创建对象的步骤
  • 2、对象的内存布局
  • 3、对象的访问定位
    • 3.1、对象访问的定位方式
    • 3.2、使用句柄访问
    • 3.3、使用指针访问
  • 4、小结

平时大家经常使用new关键字来创建对象,那么我们创建对象的时候,怎么去和运行时数据区关联起来呢?本贴将会带着这样的问题来重点讲解对象实例化的过程和方式,包括对象在内存中是怎样布局的,以及对象的访问定位方式,带领大家更加深入地学习对象的实例化布局。

1、对象的实例化

对象的实例化将分成两部分讲解,第一部分为创建对象的方式,第二部分为创建对象的步骤。如下图所示,是对象实例化的整体结构图:
在这里插入图片描述

1.1、创建对象的方式

创建对象的方式有多种,例如使用new关键字、Class的newInstance()方法、Constructor类的newInstance()方法、clone()方法、反序列化、第三方库Objenesis等,如下图所示:
在这里插入图片描述
每种创建对象方式的实际操作如下:

  • 使用new关键字——调用无参或有参构造器创建。
  • 使用Class的newInstance()方法——调用无参构造器创建,且需要是public的构造器。
  • 使用Constructor类的newInstance()方法——调用无参或有参、不同权限修饰构造器创建,实用性更广。
  • 使用clone()方法——不调用任何构造器,且对象需要实现Cloneable接口并实现其定义的clone()方法,且默认为浅复制。
  • 使用反序列化——从指定的文件或网络中,获取二进制流,反序列化为内存中的对象。
  • 第三方库Objenesis——利用了asm字节码技术,动态生成Constructor对象。

Java是面向对象的静态强类型语言,声明并创建对象的代码很常见,根据某个类声明一个引用变量指向被创建的对象,并使用此引用变量操作该对象。在实例化对象的过程中,JVM中发生了什么变化呢?

下面从最简单的Object ref = new Object();代码进行分析,利用javap -verbose -p命令查看对象创建的字节码,如下图所示:
在这里插入图片描述
各个指令的含义如下:

  • new:首先检查该类是否被加载。如果没有加载,则进行类的加载过程;如果已经加载,则在堆中分配内存。对象所需的内存的大小在类加载完成后便可以完全确定,为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。这个指令完毕后,将指向实例对象的引用变量压入虚拟机栈栈顶。
  • dup:在栈顶复制该引用变量,这时的栈顶有两个指向堆内实例对象的引用变量。
  • invokespecial:调用对象实例方法,通过栈顶的引用变量调用方法。是对象初始化时执行的方法,而是类初始化时执行的方法。

从上面的四个步骤中可以看出,需要从栈顶弹出两个实例对象的引用。这就是为什么会在new指令下面有一个dup指令。其实对于每一个new指令来说,一般编译器都会在其下面生成一个dup指令,这是因为实例的初始化方法(方法)肯定需要用到一次,然后第二个留给业务程序使用,例如给变量赋值、抛出异常等。如果我们不用,那编译器也会生成dup指令,在初始化方法调用完成后再从栈顶pop出来。

1.2、创建对象的步骤

前面所述是从字节码角度看待对象的创建过程,现在从执行步骤的角度来分析,如下图所示:
在这里插入图片描述

创建对象的步骤如下:

  • 1、判断对象对应的类是否加载、链接、初始化:虚拟机遇到一条new指令,首先去检查这个指令的参数能否在Metaspace的常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化(即判断类元信息是否存在)。如果没有,那么在双亲委派模式下,使用当前类加载器以“ClassLoader+包名+类名”为Key查找对应的“.class”文件。如果没有找到文件,则抛出ClassNotFoundException异常。如果找到,则进行类加载,并生成对应的Class类对象。
  • 2、为对象分配内存:首先计算对象占用空间大小,接着在堆中划分一块内存给新对象。如果实例成员变量是引用变量,仅分配引用变量空间即可,即4字节大小。如果内存规整,使用指针碰撞。如果内存是规整的,那么虚拟机将采用指针碰撞法(Bump The Pointer)来为对象分配内存。意思是所有用过的内存在一边,空闲的内存在另外一边,中间放着一个指针作为分界点的指示器,分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离罢了。一般使用带有compact(整理)过程的收集器时,使用指针碰撞,例如Serial Old、Parallel Old等垃圾收集器。如果内存不规整,虚拟机需要维护一个列表,使用空闲列表(Free List)分配。如果内存不是规整的,已使用的内存和未使用的内存相互交错,那么虚拟机将采用空闲列表法来为对象分配内存。意思是虚拟机维护了一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的内容。这种分配方式称为空闲列表。选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。
  • 3、处理并发安全问题:创建对象是非常频繁的操作,在分配内存空间时,另外一个问题是保证new对象的线程安全性。虚拟机采用了两种方式解决并发问题。CAS(Compare And Swap):是一种用于在多线程环境下实现同步功能的机制。CAS操作包含三个操作数,内存位置、预期数值和新值。CAS的实现逻辑是将内存位置处的数值与预期数值相比较,若相等,则将内存位置处的值替换为新值;若不相等,则不做任何操作。TLAB:把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存。
  • 4、初始化分配到的空间:内存分配结束,虚拟机将分配到的内存空间都初始化为零值(不包括对象头)。这一步保证了对象的实例字段在Java代码中可以不用赋初始值就可以直接使用,程序能访问到这些字段的数据类型所对应的零值。
  • 5、设置对象的对象头:将对象的所属类(即类的元数据信息)、对象的HashCode、对象的GC信息、锁信息等数据存储在对象头中。这个过程的具体设置方式取决于JVM实现。
  • 6、执行init()方法进行初始化:从Java程序的视角看来,初始化才正式开始。初始化成员变量,执行实例化代码块,调用类的构造方法,并把堆内对象的首地址赋值给引用变量。因此一般来说(由字节码中是否跟随由invokespecial指令所决定),new指令之后接着就是执行方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全创建出来。

2、对象的内存布局

对象的内存布局如下图所示:
在这里插入图片描述
在HotSpot虚拟机中,对象在内存中的布局可以分成对象头(Header)、实例数据(Instance Data)、对齐填充(Padding)三部分。

  • 对象头:主要包括对象自身的运行时元数据,比如哈希值、GC分代年龄、锁状态标志等,同时还包含一个类型指针,指向类元数据,表明该对象所属的类型。此外,如果对象是一个数组,对象头中还必须有一块用于记录数组的长度的数据。因为正常通过对象元数据就知道对象的确切大小。所以数组必须得知道长度。
  • 实例数据:它是对象真正存储的有效信息,包括程序代码中定义的各种类型的字段(包括从父类继承下来的和本身拥有的字段)。
  • 对齐填充:由于HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是任何对象的大小都必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数(1倍或者2倍),因此,如果对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。它不是必要存在的,仅仅起着占位符的作用。

对象的内存布局示例如下图所示:
在这里插入图片描述
下面我们用代码来讲述实例在内存中的布局,如下代码清单所示:
在这里插入图片描述
把CustomerTest中main()方法看作是主线程,主线程虚拟机栈中放了main()方法的栈帧,其中栈帧里包含了局部变量表、操作数栈、动态链接、方法返回地址、附加信息等结构。局部变量表对于main()方法来讲第一个位置放的是args,第二个位置放的是cust,cust指向堆空间中new Customer()实体。Customer对象实体整体来看分为对象头、实例数据、对齐填充。对象头中主要有运行时元数据和元数据指针,元数据指针也可称为类型指针,运行时元数据包含哈希值、GC分代年龄、锁状态标志等信息;类型指针指向当前对象所属类的信息,也就是方法区的Customer类的Klass类元信息,Klass类元信息包括对象的类型信息;在实例数据中包含父类的实例数据,对于当前对象来讲它有id、name、acct三个变量,name的字符串常量放在堆空间的字符串常量池中,成员变量acct指向new Account()对象实例在堆中的内存地址,new Account()对象实例的对象头中也维护了一个类型指针指向方法区的Account的Klass类元信息。整体布局如下图所示:
在这里插入图片描述

3、对象的访问定位

3.1、对象访问的定位方式

前面讲解了创建对象的方式以及对象的内存结构。创建好对象之后,接下来就是去访问对象,那么JVM是如何通过栈帧中的对象引用访问到其内部对象实例的呢?如下图所示:
在这里插入图片描述
通常来讲,栈帧存储指向堆区中的对象地址,对象中含有该类对象的类型指针,也就是我们说的元数据指针,如果访问对象,只需要访问栈帧中的地址即可。

《Java虚拟机规范》没有对访问对象做具体的说明和要求,所以对象访问方式由虚拟机实现而定。主流有两种方式,分别是使用句柄访问和使用直接指针访问。

3.2、使用句柄访问

堆需要划分出一块内存来做句柄池,reference中存储对象的句柄池地址,句柄中包含对象实例与类型数据各自具体的地址信息,如下图所示:
在这里插入图片描述
这样做的好处是reference中存储稳定句柄地址,对象被移动(垃圾收集时移动对象很普遍)时只会改变句柄中实例数据指针,reference本身不需要被修改。但是这样做会造成多开辟一块空间来存储句柄地址,相当于是间接访问对象。

3.3、使用指针访问

reference中存储的就是对象的地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销。

这样做的好处是访问速度更快,Java中对象访问频繁,每次访问都节省了一次指针定位的时间开销。HotSpot虚拟机主要使用直接指针访问的方式,如下图所示:
在这里插入图片描述
JVM可以通过对象引用准确定位到Java堆区中的对象,这样便可成功访问到对象的实例数据。JVM通过存储在对象中的元数据指针定位到存储在方法区中的对象的类型信息,即可访问目标对象的具体类型。

4、小结

讲解了多种创建对象的方式,如使用new关键字、Class的newInstance()方法、Constructor类的newInstance()方法等。紧接着讲解了创建对象的步骤,总共分为6步:第1步是判断对象对应的类是否加载、链接、初始化;第2步是为对象分配内存;第3步是处理并发安全问题;第4步是初始化分配到的空间;第5步是设置对象的对象头;第6步是执行init方法进行初始化。接下来讲解了对象的内存布局,并且使用案例讲解了对象在内存布局中的内容。最后讲解了访问对象的两种主流方式,分别是使用句柄访问和使用指针访问,其中经常使用的HotSpot虚拟机主要使用指针访问。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/517980.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯备战刷题four(自用)

1.砝码称重 #include <iostream> #include <vector> using namespace std; const int N110; const int M100010; int w[N]; int n; int f[N][M]; int m; int ans; //f[i][j]表示到第i个砝码进行放置时的称得的重量为j的方案数 int main() {cin>>n;for(int i1…

【MySQL】用户管理 -- 详解

如果我们只能使用 root 用户&#xff0c;这样存在安全隐患。这时就需要使用 MySQL 的用户管理。 一、 用户 1、用户信息 MySQL 中的用户都存储在系统数据库 MySQL 的 user 表中。 字段解释&#xff1a; host&#xff1a;表示这个用户可以从哪个主机登陆&#xff0c;如果…

【C语言】走迷宫之推箱子

前言&#xff1a; 在上一篇文章当中我介绍了一个走迷宫的写法&#xff0c;但是那个迷宫没什么可玩性和趣味性&#xff0c;所以我打算在迷宫的基础上加上一个推箱子&#xff0c;使之有更好的操作空间&#xff0c;从而增强了游戏的可玩性和趣味性。 1. 打印菜单 void menu() {…

Sqli-labs靶场第18关详解[Sqli-labs-less-18]自动化注入-SQLmap工具注入

Sqli-labs-Less-18 通过测试发现&#xff0c;在登录界面没有注入点&#xff0c;通过已知账号密码admin&#xff0c;admin进行登录发现&#xff1a; 返回了User Agent&#xff0c;设想如果在User Agent尝试加上注入语句&#xff08;报错注入&#xff09;&#xff0c;测试是否会…

多个word如何批量为汉字注音?别急跟我学几秒钟搞定,快速又高效

Word文档是大家常用的办公软件之一&#xff0c;有大量的文章或者其他材料编写工作需要用到这款实用工具。如果我们在编制文章材料时需要给多个word里的文字添加拼音怎么办&#xff1f;接下来小编来为大家介绍一下如何给不同Word文档里的文字添加拼音。 欢迎访问汇帮注音大师…

总结:大模型指令对齐训练原理

原文地址&#xff1a;大模型指令对齐训练原理 RLHF SFT RM PPOAIHF-based RLAIF 核心在于通过AI 模型监督其他 AI 模型&#xff0c;即在SFT阶段&#xff0c;从初始模型中采样&#xff0c;然后生成自我批评和修正&#xff0c;然后根据修正后的反应微调原始模型。在 RL 阶段&…

[SS]语义分割_U-Net

U-Net网络结构讲解视频 从零开始的U-net入门 U-Net详解 研习U-Net改进 目录 一、介绍 二、详解 1、网络结构 2、网络运行过程 3、实验现状 4、分割策略 一、介绍 U-Net是一种用于生物医学图像分割的卷积神经网络架构。它由Olaf Ronneberger等人在2015年提出&#x…

让 GenAI 提供更好答案的诀窍

在使用GenAI回答有关数据的问题之前&#xff0c;重要的是首先评估所提出的问题。这是Miso.ai的首席执行官兼联合创始人Lucky Gunasekara对当今开发GenAI工具的团队的建议。 GenAI作为一种界面提供了巨大的潜力&#xff0c;使用户能够以独特的方式查询你的数据&#xff0c;以接…

985硕的4家大厂实习与校招经历专题分享(part1)

先简单介绍一下我的个人经历&#xff1a; 985硕士24届毕业生&#xff0c;实验室方向:CV深度学习 就业&#xff1a;工程-java后端 关注大模型相关技术发展 校招offer: 阿里巴巴 字节跳动 等10 研究生期间独立发了一篇二区SCI 实习经历:字节 阿里 京东 B站 &#xff08;只看大厂…

区块链媒体套餐:精益求精链游媒体宣发推广7个关键细节分享-华媒舍

在如今竞争激烈的游戏行业&#xff0c;一款优秀的游戏缺乏有效的宣发推广&#xff0c;很难脱颖而出。而随着区块链技术的兴起&#xff0c;链游媒体的宣发推广成为游戏开发者和运营商的重要选择之一。本文将为大家介绍精益求精的链游媒体宣发推广的七个关键细节。 1. 定位目标受…

26.基于springboot + vue实现的前后端分离-就业管理系统

项目介绍 系统分为管理员、企业、求职者三个角色 管理员&#xff1a; 登录、个人中心、学生信息管理、企业信息管理、岗位分类管理、学历信息管理、友情链接管理、新闻资讯管理、收藏管理、招聘信息管理、应聘信息管理、求职者信息管理 企业&#xff1a; 注册、登录、个人…

【三】【SQL Server】如何运用SQL Server中查询设计器通关数据库期末查询大题

数据库学生选择1122 数据库展示 course表展示 SC表展示 student表展示 数据库学生选课1122_1 第一题 第二题 第三题 第四题 第五题 数据库学生选课1122_2 第六题 第七题 第八题 第九题 第十题 结尾 最后&#xff0c;感谢您阅读我的文章&#xff0c;希望这些内容能够对您有所启…