[转帖]JVM内存配置最佳实践

 

https://help.aliyun.com/zh/sae/use-cases/best-practices-for-jvm-heap-size-configuration

 

 
 

如果JVM堆空间大小设置过大,可能会导致Linux系统的OOM Killer被激活,进而结束(kill)Java应用进程,在容器环境下可能会表现为频繁异常重启。本文介绍在容器环境下JVM堆参数的配置建议,以及OOM的相关常见问题。

通过-XX:MaxRAMPercentage限制堆大小(推荐)

  • 在容器环境下,Java只能获取服务器的配置,无法感知容器内存限制。您可以通过设置-Xmx来限制JVM堆大小,但该方式存在以下问题:

    • 当规格大小调整后,需要重新设置堆大小参数。

    • 当参数设置不合理时,会出现应用堆大小未达到阈值但容器OOM被强制关闭的情况。

      说明

      应用程序出现OOM问题时,会触发Linux内核的OOM Killer机制。该机制能够监控占用过大内存,尤其是瞬间消耗大量内存的进程,然后它会强制关闭某项进程以腾出内存留给系统,避免系统立刻崩溃。

  • 推荐的JVM参数设置。

     
     
    -XX:+UseContainerSupport -XX:InitialRAMPercentage=70.0 -XX:MaxRAMPercentage=70.0 -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof

    参数说明如下。

       

    参数

    说明

    -XX:+UseContainerSupport

    使用容器内存。允许JVM从主机读取cgroup限制,例如可用的CPU和RAM,并进行相应的配置。当容器超过内存限制时,会抛出OOM异常,而不是强制关闭容器。

    -XX:InitialRAMPercentage

    设置JVM使用容器内存的初始百分比。建议与-XX:MaxRAMPercentage保持一致,推荐设置为70.0。

    -XX:MaxRAMPercentage

    设置JVM使用容器内存的最大百分比。由于存在系统组件开销,建议最大不超过75.0,推荐设置为70.0。

    -XX:+PrintGCDetails

    输出GC详细信息。

    -XX:+PrintGCDateStamps

    输出GC时间戳。日期形式,例如2019-12-24T21:53:59.234+0800。

    -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log

    GC日志文件路径。需保证Log文件所在容器路径已存在,建议您将该容器路径挂载到NAS目录或收集到SLS,以便自动创建目录以及实现日志的持久化存储。

    -XX:+HeapDumpOnOutOfMemoryError

    JVM发生OOM时,自动生成Dump文件。

    -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof

    Dump文件路径。需保证Dump文件所在容器路径已存在,建议您将该容器路径挂载到NAS目录,以便自动创建目录以及实现日志的持久化存储。

    说明
    • 使用-XX:+UseContainerSupport参数需JDK 8u191+、JDK 10及以上版本。

    • JDK 11版本下日志相关的参数-XX:+PrintGCDetails-XX:+PrintGCDateStamps-Xloggc:$LOG_PATH/gc.log参数已废弃,请使用参数-Xlog:gc:$LOG_PATH/gc.log代替。

    • Dragonwell 11不支持${POD_IP}变量。

    • 如果您没有将/home/admin/nas容器路径挂载到NAS目录,则必须保证该目录在应用启动前已存在,否则将不会产生日志文件。

通过-Xms -Xmx限制堆大小

  • 您可以通过设置-Xms-Xmx来限制堆大小,但该方式存在以下两个问题:

    • 当规格大小调整后,需要重新设置堆大小参数。

    • 当参数设置不合理时,会出现应用堆大小未达到阈值但容器OOM被强制关闭的情况。

      说明

      应用程序出现OOM问题时,会触发Linux内核的OOM Killer机制。该机制能够监控占用过大内存,尤其是瞬间消耗大量内存的进程,然后它会强制关闭某项进程以腾出内存留给系统,避免系统立刻崩溃。

  • 推荐的JVM参数设置。

     
     
    -Xms2048m -Xmx2048m -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof

    参数说明如下。

       

    参数

    说明

    -Xms

    设置JVM初始内存大小。建议与-Xmx相同,避免每次垃圾回收完成后JVM重新分配内存。

    -Xmx

    设置JVM最大可用内存大小。为避免容器OOM,请为系统预留足够的内存大小。

    -XX:+PrintGCDetails

    输出GC详细信息。

    -XX:+PrintGCDateStamps

    输出GC时间戳。日期形式,例如2019-12-24T21:53:59.234+0800。

    -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log

    GC日志文件路径。需保证Log文件所在容器路径已存在,建议您将该容器路径挂载到NAS目录或收集到SLS,以便自动创建目录以及实现日志的持久化存储。

    -XX:+HeapDumpOnOutOfMemoryError

    JVM发生OOM时,自动生成Dump文件。

    -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof

    Dump文件路径。需保证Dump文件所在容器路径已存在,建议您将该容器路径挂载到NAS目录,以便自动创建目录以及实现日志的持久化存储。

  • 推荐的堆大小设置。

       

    内存规格大小

    JVM堆大小

    1 GB

    600 MB

    2 GB

    1434 MB

    4 GB

    2867 MB

    8 GB

    5734 MB

通过ossutil下载堆转储文件

  1. 挂载容器日志目录至NAS。具体操作,请参见设置NAS存储。

  2. 设置JVM参数。

    其中Dump文件路径/home/admin/nas为NAS挂载目录:

     
     
    -Xms2048m -Xmx2048m -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof
  3. 当应用发生OOM时,会生成堆转储文件到NAS挂载目录,您可以利用ossutil工具,将该Dump文件下载到本地进行分析。具体操作,请参见通过日志上传下载诊断应用。

常见问题

容器出现137退出码的含义是什么?

当容器使用内存超过限制时,会出现容器OOM,导致容器被强制关闭。此时业务应用内存可能并未达到JVM堆大小上限,所以不会产生Dump日志。建议您调小JVM堆大小的上限,为容器内其他系统组件预留足够多的内存空间。m_exitcode_137

为什么发生OOM却没有生成Dump文件?

当发生OOM Killer时,并不一定会发生JVM OOM,所以不会生成Dump文件。您可以采取以下方式来避免这种情况。

  • 如果是Java应用,可以适当调小JVM的堆内存大小。具体配置,请参见本文。

  • 如果是非Java应用,可以调整实例规格,保证充裕的内存资源。具体配置,请参见变更实例规格。

堆大小和规格内存的参数值可以相同吗?

不可以。因为系统自身组件存在内存开销,例如使用SLS进行日志收集(设置日志收集至SLS)时会占用一小部分的内存空间,所以不能将JVM堆大小设置为和规格内存大小相同的数值,需要为这些系统组件预留足够的内存空间。

在JDK 8版本下设置-XX:MaxRAMPercentage值为整数时报错怎么处理?

这是JDK 8的一个Bug。具体信息,请参见Java Bug Database。例如,在JDK 8u191版本下,设置-XX:MaxRAMPercentage=70,此时JVM会启动报错。m_JDK8_bug

解决方案如下:

  • 方式一:设置-XX:MaxRAMPercentage70.0

    说明

    如果您使用了-XX:InitialRAMPercentage-XX:MinRAMPercentage,参数值同样不可设置为整数,需按照方式一的形式来设置。

  • 方式二:升级JDK版本至JDK 10及以上版本。

为什么JVM参数设置了6 GB,但是内存使用率却很低?

虽然JVM参数已设置-Xms6g -Xmx6g,但是操作系统不会马上分配6 GB的物理内存,需要实际使用后才分配。因此,内存使用率在应用启动的时候,会相对较低,后续会出现攀爬现象。

相关文档

   

文档

说明

JVM参数配置说明

介绍典型的JVM配置参数,例如调优堆栈内存与调优回收器GC。

设置启动命令

如果在启动前需要进行特殊配置,或者不采用预设的启动参数,可以通过SAE设置容器启动和运行时所需要的命令。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/708070.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高通在推动混合 AI 规模化 扩展方面独具优势

高通在推动混合 AI 规模化 扩展方面独具优势 摘要 正如白皮书第一部分所言,在云端和终端进行分布式处理的混合 AI 才是 AI 的未来。混合 AI 架 构,或仅在终端侧运行 AI,能够在全球范围带来成本、能耗、性能、隐私、安全和个性化优势。 高通正在助力实现随时随地的智能计算。…

自动获取随笔链接(用于博客签名或者版权信息)

今天弄了好久也不知道怎样自动获取每篇文章对应的链接,就在这时,突然发现博客签名里面有一个模板选项,下拉有个 转载声明 选择框,如下:点完之后,出现了我想要的东西!!这不就是我心心念念、苦苦寻找的自动获取文章链接函数吗?! <p>本文来自博客园,作者:{autho…

MySQL下载并安装(Windows)

下载MySQL:下载地址:https://dev.mysql.com/downloads/mysql/ 安装MySQL:解压下载的MySQL压缩包,并添加到环境变量中去 添加环境变量,请参照(https://www.cnblogs.com/pslsy/p/16226535.html)进行添加 管理员方式打开cmd,或者右键单击开始菜单图标,选择Windows powers…

发现一个好看的电脑壁纸网站

网站截图如下:废话不多说,上链接!! https://bz.zzzmh.cn/index作者:Shu-How Z 出处:http://www.cnblogs.com/zhangshuhao1116/个性签名:功不唐捐 玉汝于成 行而不辍 未来可期著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。来源:博客园cnblogs …

MJUCTF—WP

1.猫娘 点开发现有两个文件, 一个加密压缩包, 一个word文档 点开word发现是兽音加密, 点开在线网站进行解密# 得到一段文本, 先进行分割 小小年内则伏勤, 阵阵寒风刺骨寒。 是处寂寞无人问, 一个身影自徘徊。 个人的技艺超群, 福泽润物春意暖, 瑞气盈盈岁月新, 控制人生如棋…

本地浏览器查看云服务器训练模型的tensorboard界面

最近还是在搞YOLO弄毕业设计,一开始是在自己电脑上训练的,但是当开始训练时电脑就卡得不行,别的啥都干不了;另一方面训练速度也特别慢,还得一直开着机不能中断。 索性尝试把模型部署到阿里云服务器上训练,用的最低的2核2G的配置,勉勉强强能跑起来,好处自然是不占用自己…

关于单向循环链表的创建、插入、删除、遍历

关于单向循环链表的创建、插入、删除、遍历、 单向循环链表的公式单向循环链表的代码 #include <stdio.h> // 标准输入输出头文件 #include <string.h> // 字符串处理头文件 memset/清空 #include <stdlib.h> // 标准库头文件 …

AnimationCurve关键帧数值修改小工具

效果图 用途:界面动效已经由动效人员A做完(假设k了100帧),然后UI同事又把一些节点的位置做了10px的调整 此时一帧一帧去手动改,费事费力还可能出错。 这个工具的用途就是:对相关节点的所有关键帧批量做偏移。public class AnimClipEditWnd : EditorWindow {[MenuItem(&quo…

elastic使用postman操作

1、账号认证 2、elastic索引put请求,创建索引 get请求,查询所有索引get请求,查询索引 delete请求,删除索引 put请求,增加文档数据 get请求,查询文档数据简单查询,按id简单查询,查询固定index索引下的所有数据 修改数据整条修改局部修改

Python没有服务器如何部署运行Shiny应用程序

原文链接:https://tecdat.cn/?p=36205 原文出处:拓端数据部落公众号 随着Web技术的快速发展,越来越多的数据科学家和开发人员倾向于使用Web应用程序进行数据分析和可视化。Shiny for Python作为一种流行的Web应用程序框架,为Python开发人员提供了便捷的数据展示和交互工具…

R语言CART决策树、随机森林、chaid树预测母婴电商平台用户寿命、流失可视化

全文链接:http://tecdat.cn/?p=31644 原文出处:拓端数据部落公众号 借着二胎政策的开放与家庭消费升级的东风,母婴市场迎来了生机盎然的春天,尤其是母婴电商行业,近年来发展迅猛。用户获取和流失是一对相对概念,就好比一个水池,有进口,也有出口。我们不能只关心进口的…

Python金融时间序列模型ARIMA 和GARCH 在股票市场预测应用|附代码数据

原文链接:http://tecdat.cn/?p=24407 最近我们被客户要求撰写关于金融时间序列模型的研究报告,包括一些图形和统计输出。 这篇文章讨论了自回归综合移动平均模型 (ARIMA) 和自回归条件异方差模型 (GARCH) 及其在股票市场预测中的应用 ( 点击文末“阅读原文”获取完整代码数…