Android 内存泄漏分析思路和案例剖析

分析思路

内存泄漏是指 Android 进程中,某些对象已经不再使用,但被一些生命周期更长的对象引用,导致其占用的内存资源无法被GC回收,内存占用不断增加的一种现象;内存泄漏是导致我们应用性能下降、卡顿的一种常见因素,解决此类问题最核心的思路可以总结为以下两步:

  1. 模拟内存泄漏的操作路径,观察应用 Heap 内存变化,确定出现问题的大概位置;
  2. 针对具体位置展开分析,找到泄漏对象指向 GC Root 的完整引用链,从源头治理内存泄漏。
分析工具:Android Stuido Profiler

Profiler 中常用到的内存分析的工具有两个:内存曲线图和 Heap Dump;内存曲线可以实时观察内存使用状态,协助我们进行内存的动态分析;

内存泄漏出现时,内存曲线典型的现象就是呈现阶梯状,一旦上升则难以下降;例如 Activity 泄漏后,反复打开、关闭页面内存占用会一路上升,并且点击垃圾桶图标手动GC后,占用量无法下降到打开 Activity 之前的水平,这时大概率出现内存泄漏了。

这时,我们可以手动 dump 此时刻应用堆内存中的内存分布情况,用作静态分析:

UI中的各项指标说明:

  1. Allocations:堆内存中该类的实例个数;
  2. Native Size:该类所有实例引用到的Native对象所占内存
  3. Shallow Size:该类所有实例自身的实际内存占用大小,不包括其所引用到的对象的内存占用大小;
  4. Retained Size:与 Shallow Size 不同,这个数字代表该类所有实例及其所有引用到的对象的内存占用大小;

借助一张图,可以对这几个属性有更直观的印象:

如上图,红点的内存大小代表 Shallow Size,蓝点为 Native Size,所有橙色点的内存大小则为 Retained Size;当出现内存泄漏时,我们更应该关注 Retained Size 这个数字,它的意义是,因内存泄漏导致 Java 堆内存中所浪费的内存空间大小。 因为内存泄漏往往会形成“链式效应”,从泄漏的对象出发,该对象引用的所有对象和 Native 资源都无法回收,造成内存使用效率的下降。

另外 Leaks 代表可能的内存泄漏实例数量;点击列表中的类可以查看该类的实例详情;Instance 列表中的 depth 代表该实例到达 GC Root 的最短调用链深度,在图1右侧 Reference 一栏堆栈中可以直观地看到完整调用链,这时就可以一路追溯找出最可疑的引用,结合代码分析泄漏原因,并对症下药,根治问题。

接下来分析几个我们在项目中遇到一部分典型内存泄漏的案例:

案例剖析

案例1:BitmapBinder 内存泄漏

在涉及跨进程传输 Bitmap 的场景时,我们采用了一种 BitmapBinder 的方法;因为 Intent 支持我们传入自定义的 Binder,因此可以借助 Binder 实现 Intent 传输 Bitmap 对象:

// IBitmapBinder AIDL文件 
import android.graphics.Bitmap; 
interface IBitmapInterface { Bitmap getIntentBitmap(); 
}

然而,Activity1 在使用 BitmapBinderActivity2 传递 Bitmap 后,出现了两个严重的内存泄漏问题:

  1. 跳转后再返回,Activity1 finish 时无法回收;
  2. 反复跳转时,BitmapBinder 对象会反复创建且无法回收;

先分析 Heap Dump:

这是一个『多实例』内存泄漏,即每次 finish Activity1 再打开,都会增加一个 Activity 对象留在 Heap 中,无法销毁;常见于内部类引用、静态数组引用(如监听器列表)等场景;根据 Profiler 提供的引用链,我们找到了 BitmapExt 这个类:

suspend fun Activity.startActivity2WithBitmap() {val screenShotBitmap = withContext(Dispatchers.IO) { SDKDeviceHelper.screenShot() } ?: returnstartActivity(Intent().apply {val bundle = Bundle()bundle.putBinder(KEY_SCREENSHOT_BINDER, object : IBitmapInterface.Stub() {override fun getIntentBitmap(): Bitmap {return screenShotBitmap}}) putExtra (INTENT_QUESTION_SCREENSHOT_BITMAP, bundle)})
}

BitmapExt 有一个 Activity 的全局扩展方法 startActivity2WithBitmap,里面创建了一个 Binder,将获取到的屏幕截图 Bitmap 丢进去,并包在 Intent 中发送到 Activity2 ;显然这里有个IBitmapInterface的匿名内部类,看来泄漏是从这里发生的;

但有两个疑问,一是这个内部类是写在方法里的,方法结束时,不会把方法栈中的内部类引用清除掉吗?二是这个内部类也并没有引用到 Activity 吧?

要搞明白这两点,就要把 Kotlin 代码反编译成 Java 看看了:

@Nullable
public static final Object startActivity2WithBitmap(@NotNull Activity $this$startActivity2WithBitmap, boolean var1, @NotNull Continuation var2) {...Bitmap var14 = (Bitmap)var10000;if (var14 == null) {return Unit.INSTANCE;} else {Bitmap screenShotBitmap = var14;Intent var4 = new Intent();int var6 = false;Bundle bundle = new Bundle();// 内部类创建位置:bundle.putBinder("screenShotBinder", (IBinder)(new BitmapExtKt$startActivity2WithBitmap$$inlined$apply$lambda$1($this$startActivity2WithBitmap, screenShotBitmap)));var4.putExtra("question_screenshot_bitmap", bundle);Unit var9 = Unit.INSTANCE;$this$startActivity2WithBitmap.startActivity(var4);return Unit.INSTANCE;}
}// 这是kotlin compiler自动生成的一个普通类:
public final class BitmapExtKt$startActivity2WithBitmap$$inlined$apply$lambda$1 extends IBitmapInterface.Stub {// $FF: synthetic fieldfinal Activity $this_startActivity2WithBitmap$inlined; // 引用了activity// $FF: synthetic fieldfinal Bitmap $screenShotBitmap$inlined;BitmapExtKt$startActivity2WithBitmap$$inlined$apply$lambda$1(Activity var1, Bitmap var2) {this.$this_startActivity2WithBitmap$inlined = var1;this.$screenShotBitmap$inlined = var2;}@NotNullpublic Bitmap getIntentBitmap() {return this.$screenShotBitmap$inlined;}
}

在 Kotlin Compiler 编译生成的 Java 文件中,IBitmapInterface 匿名内部类被替换为普通类 BitmapExtKt$startActivity2WithBitmap$$inlined$apply$lambda$1,并且这个普通类持有了 Activity。出现这个情况的原因是,Kotlin 为了在该类的内部能正常使用方法内的变量,把方法的入参以及内部类代码以上创建的所有变量都写进了该类的成员变量中;因此 Activity 被该类引用;另外 Binder 本身生命周期长于 Activity,因此产生内存泄漏。

解决方法是,直接声明一个普通类,即可绕过 Kotlin Compiler 的“优化”,移除 Activity 的引用。

class BitmapBinder(private val bitmap: Bitmap): IBitmapInterface.Stub() {override fun getIntentBitmap( ) = bitmap
}// 使用:
bundle.putBinder(KEY_SCREENSHOT_BINDER, BitmapBinder(screenShotBitmap))

接下来,问题是 Bitmap 和 Binder 会反复创建且无法回收的问题,内存现象如图,每次跳转再关闭,内存都会上涨一点,如同阶梯;GC 后无法释放;

heap 中,通过 Bitmap 尺寸 2560x1600, 320density 可以推断,这些都是未能回收的截图 Bitmap 对象,被 Binder 持有;但查看 Binder 的引用链,却并没有发现任何被我们应用相关的引用;

我们推测 Binder 应该是被生命周期较长的 Native 层引用了,与 Binder 的实现有关,但没找到回收 Binder 的有效方法;

一种解决办法是,复用 Binder,确保每次打开 Activity2 时,Binder 不会重复创建;另外将 BitmapBinder 的 Bitmap 改为弱引用,这样即使 Binder 不能回收,Bitmap 也能被及时回收,毕竟 Bitmap 才是内存大户。

object BitmapBinderHolder {private var mBinder: BitmapBinder? = null // 保证全局只有一个BitmapBinderfun of(bitmap: Bitmap): BitmapBinder {return mBinder ?: BitmapBinder(WeakReference(bitmap)).apply { mBinder = this }}
}class BitmapBinder(var bitmapRef: WeakReference<Bitmap>?): IBitmapInterface.Stub() {override fun getIntentBitmap() = bitmapRef?.get()
}// 使用:
bundle.putBinder(KEY_SCREENSHOT_BINDER, BitmapBinderHolder.of(screenShotBitmap))

验证:如内存图,一次 GC 后,创建的所有 Bitmap 都可以正常回收。

案例2:Flutter 多引擎场景 插件内存泄漏

有不少项目使用了多引擎方案实现 Flutter 混合开发,在 Flutter 页面关闭时,为避免内存泄漏,不但要将 FlutterViewFlutterEngineMessageChannel 等相关组件及时解绑销毁,同时也需要关注各个 Flutter 插件是否有正常的释放操作。

例如在我们的一个多引擎项目中,通过反复打开关闭一个页面,发现了一个内存泄漏点:

这个activity是一个二级页面,使用多引擎方案,在上面跑了一个 FlutterView ;看样子是一个『单实例』的内存泄漏,即无论开关多少次,Activity 只会保留一个实例在heap中无法释放,常见的场景是全局静态变量的引用。这种内存泄漏对内存的影响比多实例泄漏略轻一点,但如果这个 Activity 体量很大,持有较多的 Fragment、View,这些相关组件一起泄漏的话,也是要着重优化的。

从引用链来看,这是 FlutterEngine 内的一个通信 Channel 引起的内存泄漏;当 FlutterEngine 被创建时,引擎内的每个插件会创建出自己的MessageChannel并注册到FlutterEngine.dartExecutor.binaryMessenger中,以便每个插件都能独立和 Native 通信。

例如一个普通插件的写法可能是这样:

class XXPlugin: FlutterPlugin {private val mChannel: BasicMessageChannel<Any>? = nulloverride fun onAttachedToEngine(@NonNull flutterPluginBinding: FlutterPlugin.FlutterPluginBinding) { // 引擎创建时回调mChannel = BasicMessageChannel(flutterPluginBinding.flutterEngine.dartExecutor.binaryMessenger, CHANNEL_NAME, JSONMessageCodec.INSTANCE)mChannel?.setMessageHandler { message, reply ->...}}override fun onDetachedFromEngine(@NonNull binding: FlutterPlugin.FlutterPluginBinding) { // 引擎销毁时回调mChannel?.setMessageHandler(null)mChannel = null}
}

可以看到其实 FlutterPlugin 其实是会持有 binaryMessenger 的引用的,而 binaryMessenger 又会有 FlutterJNI 的引用… 这一系列引用链最终会使 FlutterPlugin 持有 Context,因此如果插件没有正确释放引用,就必然会出现内存泄漏。

我们看下上图引用链中 loggerChannel 的写法是怎么样的:

class LoggerPlugin: FlutterPlugin {override fun onAttachedToEngine(flutterPluginBinding: FlutterPlugin.FlutterPluginBinding) {LoggerChannelImpl.init(flutterPluginBinding.getFlutterEngine())}override fun onDetachedFromEngine(binding: FlutterPlugin.FlutterPluginBinding) {}
}object LoggerChannelImpl { // 这是一个单例private var loggerChannel: BasicMessageChannel<Any>?= nullfun init(flutterEngine: FlutterEngine) {loggerChannel = BasicMessageChannel(flutterEngine.dartExecutor.binaryMessenger, LOGGER_CHANNEL, JSONMessageCodec.INSTANCE)loggerChannel?.setMessageHandler { messageJO, reply ->...}}
}

LoggerPlugin.onAttachedToEngine 中,将 FlutterEngine 传入到了单例 LoggerChannelImpl 里面,binaryMessenger 被单例持有,且 onDetachedFromEngine 方法未做销毁操作,因此一直被单例引用,context无法释放。

这个插件可能在设计时,没有考虑到多引擎的场景;单引擎时,插件的 onAttachedToEngineonDetachedFromEngine 相当于是跟着应用的生命周期走的,因此不会出现内存泄漏;但在多引擎场景下,DartVM 会为每个引擎分配 isolate,和进程有些类似;isolate 的 dart 堆内存是完全独立的,因此引擎之间任何对象(包括静态对象)都不互通;因此 FlutterEngine 会在自己的 isolate 中创建各自的 FlutterPlugin 实例,这使得每次创建引擎,插件的生命周期都会重走一遍。当销毁一个引擎时,插件没有正常回收,没有及时释放 ContextFlutterEngine 的相关引用,就会出现内存泄漏。

修改方案:

  1. LoggerChannelImpl 无需使用单例写法,替换为普通类即可,确保每个引擎的 MessageChannel都是独立的;
  2. LoggerPlugin.onDetachedFromEngine 需要对 MessageChannel 做销毁和置空操作;
案例3:三方库 Native 引用 内存泄漏

项目中接入了一个三方阅读器 SDK,在一次内存分析时,发现每次打开该阅读器,内存便会上升一截并且无法下降;从 heap dump 文件看,Profiler 并未指出项目中存在内存泄漏,但可以看到 app heap 中有一个 Activity 未能回收的实例个数非常多,且内存占用较大。

查看 GCRoot References,发现这些 Activity 没有被任何已知的 GCRoot 引用:

毫无疑问这个 Activity 是存在内存泄漏的,因为操作的时候已经把相关页面都 finish 掉并且手动 GC,因此原因只能是 Activity 被某个不可见的 GCRoot 引用了。

事实上,Profiler 的 Heap Dump 只会显示 Java 堆内存的 GCRoot,而在 Native 堆中的 GCRoot 并不会显示到这个引用列表中。所以,有没有可能是这个Activity被 Native 对象持有了?

我们用动态分析工具 Allocations Record 看一下 Java 类在 Native 堆的引用,果然发现了这个 Activity 的一些引用链:

但可惜引用链都是一些内存地址,没有显示类名,没法知道是何处引用到了 Activity;后面用 LeakCanary 试了一下,虽然也明确说明了是 Native 层 Global Variable 的引用造成的内存泄漏,但还是没有提供具体的调用位置;

我们只好回到源码去分析下可能的调用处了。这个是 DownloadActivity 是我们为了适配阅读器SDK做的一个书籍下载的页面;当本地没有图书时,会先下载书籍文件,随后传入 SDK 中,打开 SDK 自己的 Activity;因此,DownloadActivity 的功能就是下载、校验、解压书籍,并处理 SDK 阅读器的一些启动流程。

按常规思路,先检查下载、校验、解压的代码,都没有发现疑点,listener 之类的都做了弱引用封装;因此推测是 SDK 自身的写法导致的内存泄漏。

发现阅读器 SDK 启动时,有一个 context 入参:

class DownloadActivity {... private fun openBook() {... ReaderApi.getInstance().startReader(this, bookInfo) } 
}

由于这个 SDK 的源码都是混淆过的,只能硬啃了,从 startReader 方法点进去一路跟踪调用链:

class ReaderApi: void startReader(Activity context, BookInfo bookInfo) ↓ 
class AppExecutor: void a(Runnable var1) ↓ 
class ReaderUtils: static void a(Activity var0, BookViewerCallback var1, Bundle var2) ↓ 
class BookViewer: static void a(Context var0, AssetManager var1) ↓ 
class NativeCpp: static native void initJNI(Context var0, AssetManager var1);

最后到了 NativeCpp 这个类的 initJNI 方法,可以看到这个本地方法把我们的 Activity 传进去了,后续处理不得而知,但基于上面的内存分析我们基本可以断定,正是由于这个方法,Activity 的引用被 Native 的长生命周期对象持有,导致 Activity 出现内存泄漏。

至于为什么 Native 需要用到 context 则没法分析了,我们只能将这个问题反馈给 SDK 供应商,让他们做进一步处理。解决办法也不难:

  1. 在销毁阅读器时及时置空 Activity 引用;
  2. startReader 方法不需要指定 Activity 对象,入参声明改为 Context 即可,外部就可以将 Application Context 传进去。

Android 学习笔录

Android 性能优化篇:https://qr18.cn/FVlo89
Android Framework底层原理篇:https://qr18.cn/AQpN4J
Android 车载篇:https://qr18.cn/F05ZCM
Android 逆向安全学习笔记:https://qr18.cn/CQ5TcL
Android 音视频篇:https://qr18.cn/Ei3VPD
Jetpack全家桶篇(内含Compose):https://qr18.cn/A0gajp
OkHttp 源码解析笔记:https://qr18.cn/Cw0pBD
Kotlin 篇:https://qr18.cn/CdjtAF
Gradle 篇:https://qr18.cn/DzrmMB
Flutter 篇:https://qr18.cn/DIvKma
Android 八大知识体:https://qr18.cn/CyxarU
Android 核心笔记:https://qr21.cn/CaZQLo
Android 往年面试题锦:https://qr18.cn/CKV8OZ
2023年最新Android 面试题集:https://qr18.cn/CgxrRy
Android 车载开发岗位面试习题:https://qr18.cn/FTlyCJ
音视频面试题锦:https://qr18.cn/AcV6Ap

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/130119.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

epoll 定时器

参考&#xff1a; Linux下使用epoll监听定时器-CSDN博客 但是这个用的是gettimeofday。 本人使用的是 #include <stdlib.h> #include<stdio.h> #include <sys/timerfd.h> #include <sys/epoll.h> #include <unistd.h> #include <sys/time.…

库存管理方法有哪些?

本文将为大家讲解&#xff1a;库存管理方法有哪些&#xff1f; 库存管理是企业运营中的核心环节&#xff0c;它涉及到货物的采购、存储、销售和配送。有效的库存管理可以确保企业有足够的货物满足客户的需求&#xff0c;同时避免库存积压和浪费。为了达到这个目标&#xff0c;…

洛谷100题DAY7

31.P1636 Einstein学画画 此题为欧拉通路&#xff0c;必须要满足奇点的个数为0或2个 奇点&#xff1a;度数&#xff08;入度出度&#xff09;为奇数的点 如果奇点为2个或者0个就可以直接一笔化成 eg. 我们发现奇数点个数每增加2个就多一笔 #include<bits/stdc.h> us…

Navicat定时任务

Navicat定时任务 1、启动Navicat for MySQL工具&#xff0c;连接数据库。 2、查询定时任务选项是否开启 查询命令&#xff1a;SHOW VARIABLES LIKE ‘%event_scheduler%’; ON表示打开&#xff0c;OFF表示关闭。 打开定时任务命令 SET GLOBAL event_scheduler 0; 或者 SET G…

解决yolo无法指定显卡的问题,实测v5、v7、v8有效

方法1 基本上这个就能解决了&#xff01;&#xff01;&#xff01; 在train.py的最上方加上下面这两行&#xff0c;注意是最上面&#xff0c;其次指定的就是你要使用的显卡 import os os.environ[CUDA_VISIBLE_DEVICES]6方法2&#xff1a; **问题&#xff1a;**命令行参数指…

数据库系统工程师------时间周期

时间周期 计算机各种周期 时钟周期 机器&#xff08;CPU&#xff09;周期 指令周期 总线周期 时钟周期&#xff1a;也称振荡周期&#xff0c;定义为时钟频率的倒数。是计算机中最基本、最小的时间单位。 机器&#xff08;CPU&#xff09;周期&#xff1a;也称CPU周期&…

WPF中DataContext的绑定技巧

先看效果&#xff1a; 上面的绑定值都是我们自定义的属性&#xff0c;有了以上的提示&#xff0c;那么我们可以轻松绑定字段&#xff0c;再也不用担心错误了。附带源码。 目录 1.建立mvvm项目 2.cs后台使用DataContext绑定 3.xaml前台使用DataContext绑定 4.xaml前台使用Da…

阿里春招JAVA后端面试总结

阿里巴巴春招的后端面经,问了比较多的计算机基础和数据库的内容。 操作系统 一个操作系统,我们在衡量它的内存占用的时候,它一般会有哪些内存的部分? 答:堆和栈 补充: 这个其实是问你对free命令的理解。 主机的内存做一些清理的动作。你知道这里面会涉及到对哪些…

树莓派ubuntu上配置miniconda并创建虚拟环境

树莓派安装ubuntu和miniconda配置 本文所配置环境为&#xff1a;树莓派4B安装的系统为ubuntu 22 server&#xff0c;所配置的miniconda版本为4.2&#xff0c;python版本3.8。在此之前要清楚树莓派4B已经将处理器从arm架构换成了aarch64架构&#xff0c;所以能够使用最新的aarc…

记录在搭建Jenkins时,所遇到的坑,以及解决方案

项目场景&#xff1a; 记录在搭建Jenkins时,所遇到的坑,以及解决方案.问题描述1 在使用Jenkins构建时,报错如下&#xff1a; cp: cannot stat /project/xx/xxxx/dist/: No such file or directory Build step Execute shell marked build as failure Finished: FAILURE解决方…

【华为OD机考B卷 | 100分】统计监控、需要打开多少监控器(JAVA题解——也许是全网最详)

前言 本人是算法小白&#xff0c;甚至也没有做过Leetcode。所以&#xff0c;我相信【同为菜鸡的我更能理解作为菜鸡的你们的痛点】。 题干 OD&#xff0c;B 卷 100 分题目【OD 统一考试&#xff08;B 卷&#xff09;】 1. 题目描述 某长方形停车场每个车位上方都有一个监控…

在Kubernetes中实现gRPC流量负载均衡

在尝试将gRPC服务部署到Kubernetes集群中时&#xff0c;一些用户&#xff08;包括我&#xff09;面临的挑战之一是实现适当的负载均衡。在深入了解如何平衡gRPC的方式之前&#xff0c;我们首先需要回答一个问题&#xff0c;即为什么需要平衡流量&#xff0c;如果Kubernetes已经…