在Windows server 2012上使用virtualBox运行CentOS7虚拟机,被强制暂停

文章目录

    • 问题场景
    • 排查过程
    • 处理解决
    • 事后反思

问题场景

  • 我们的平台服务使用docker部署,使用docker-compose进行管理,部署到CentOS7的服务器里
  • 平台部署到客户环境时,一小部分客户,使用自己机房或单独的服务器。很多客户不愿意采购新的服务器,就让我们用他们已有的Windows server服务器
  • 我们在已有的Windows server服务器里,使用VirtualBox虚拟机工具,安装CentOS7虚拟机,再部署系统
  • 本周接到一客户投诉,那天下午三点左右,客户说平台打不开,虚拟机操作没反应,卡死,重启也解决不了
  • 后来询问了客户,说是上午平台还好好的,中午睡个午觉,下午上班发现平台不行了

排查过程

  • 首先看到的是一个卡死界面,CentOS7虚拟机卡死,被暂停了,点了下恢复,一直在卡进度条,没反应,点关闭按钮也没反应
  • 于是让客户用“任务管理器”关闭了VirtualBox程序,重新启动VirtualBox,再启动平台虚拟机,发现启动不了,看了下报错信息,感觉应该是直接杀死进程关闭导致的,就让客户重启下本Windows server服务器试试
  • 重启Windows server服务器后,发现桌面自启动了一堆东西,包括xx软件平台、一些自启动的Java程序dos窗口等。可能是我们当初部署平台时,这台电脑不是空机器,有一堆其他应用服务部署了,且设置了开机自启动
  • 询问了客户,这台服务器目前就给我们使用。于是让客户关闭其他服务,启动了VirtualBox虚拟机工具,启动信控平台虚拟机
  • 平台CentOS7虚拟机启动没问题,虽然有点慢,但正常的启动成功了。但当输入用户名密码,进入虚拟机终端,准备操作时,虚拟机被强制暂停了,点击恢复也没办法
  • 正常情况下,虚拟机暂停,重新点一下“暂停”,就会恢复
    在这里插入图片描述
  • 但是客户现场,点了后就弹出一个报错BLKCACHE IOERR,大致意思是“请确保磁盘上有足够的可用空间,并且磁盘工作正常”,报错详细信息如下:

The I/0 cache encountered an error while updating data in mediun"ahci-0-0’
(rc=VERR UNRESOLVED ERROR).Make sure there is enouth free space on the disk and that the disk is working properly. Operation can be rerumed afterward

  • 一开始怀疑是平台虚拟机里分配的磁盘空间,在运行大半年后快满了,空间不足导致的。想登录进虚拟机,查看和删除大文件。但是一直被“暂停”,无法进入操作。尝试了好几种办法,包括重启了两次,都没法终止暂停
  • 后来查看了下文件夹目录,发现平台现在只用了71G,而给平台分配了256G,远远没用完,应该不是这个问题。而且之前遇到过root目录被占满的事件,但是并不会被暂停(有兴趣的看我这篇文章:clickhouse系统日志引起的root目录磁盘满的问题处理)
  • 根据报错信息,去搜索好久,最终在微软的官方网站找到了类似问题和解决方式,确定是VirtualBox上运行的CentOS7虚拟机所在磁盘空间不足导致的
  • 官方社区链接:Virtual machines enter the paused state due to low disk free space
    在这里插入图片描述
  • 核心内容是以下几句:

Cause
The hard drives that store these VHD files or snapshots of these virtual machines are out of disk free space.
Resolution
To fix the issue, free disk space on these hard drives or move these VHD files to a new location.

  • 大致意思为:存储这些VHD文件或这些虚拟机的快照的硬盘驱动器的磁盘可用空间不足,若要解决此问题,请释放这些硬盘驱动器上的磁盘空间或将这些VHD文件移动到新位置。
  • 默认创建和导入虚拟机时,不另选位置,都会默认在C盘C:\Users\Administrator\VirtualBox VMs文件夹里面。查看了C盘空间,一共就256G,还剩20G左右,应该是C盘(系统盘)空间过少,不允许VirtualBox运行虚拟机,强制暂停
  • 根据客户反馈,今天是第一次遇到虚拟机暂停问题,应该是今天中午刚好达到了临界值

处理解决

  • 微软官方平台的报错原因说的很清楚,就是虚拟机文件所在磁盘空间不足,系统会不断检查磁盘空间并发出警告。当收到警告时,虚拟机将进入暂停的关键状态
  • 解决方式说的也很清楚,把当前磁盘清理掉一些东西,保障磁盘空间充足,或者迁移到另一个空间充足的磁盘
  • 由于这个是客户的机器,我们不好分辨哪些可以删除,只好选择迁移到另一个磁盘(1.5T空间)
  • 需要注意的是,迁移虚拟机文件不能直接拷贝再修改文件路径,要使用VirtualBox操作。选择“管理-虚拟介质管理”
    在这里插入图片描述
  • 选中要改的vid文件,修改文件目录路径(C改成了E),点击应用即可(如果文件较大,跨盘移动可能要一段时间)
    在这里插入图片描述
  • vid文件迁移完成后,重新启动平台虚拟机,启动正常,再也没有暂停的情况,问题解决

事后反思

  • 反思这次问题出现的原因:
  • 一是部署平台的优化人员不是专业的运维,发给他们的部署文档里,只是建议选一个磁盘空间比较大的盘,没有强制要求,他们就一直点默认的“下一步”了,默认装在了C盘
  • 二是这台机器不只是我们在用,按照正常情况,C盘的256G至少也能用个几年,但是没想到这才半年多就仅剩20G了
  • 三是没坚持让客户提供Linux机器,如果不使用Windows server服务器部署虚拟机的方式,而是直接部署到CentOS7平台上,就不会出现问题(因为直接使用服务器所有磁盘,而磁盘这玩意不值钱,一般服务器都有大容量)
  • 已经更新了部署文档,强制要求使用磁盘空间充足的非系统盘(除非不分盘),磁盘可用空间不能低于500G

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/18963.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【嵌入式Linux项目】基于Linux的全志H616开发板智能垃圾桶项目

目录 一、功能需求 二、涵盖的知识点 1、wiringPi库下的相关硬件操作函数调用 2、线程(未使用互斥锁和条件) 3、父子进程 4、网络编程(socket套接字) 5、进程间通信(共享内存和信号量) 三、开发环境…

Elasticsearch原理剖析

一、 Elasticsearch结构 Elasticsearch集群方案由EsMaster、EsClient和EsNode1、EsNode2、EsNode3、EsNode4、EsNode5、EsNode6、EsNode7、EsNode8、EsNode9进程组成,如下图所示,模块说明如表下所示。 说明如表: 名称说明ClientClient使用H…

OpenCV 入门教程:颜色空间转换

OpenCV 入门教程:颜色空间转换 导语一、颜色空间的基本概念1.1 RGB颜色空间1.2 灰度颜色空间1.3 其他颜色空间 二、颜色空间转换三、示例应用3.1 提取图像的色彩通道3.2 调整图像的亮度和对比度 总结 导语 在图像处理和计算机视觉领域,颜色空间转换是一…

OpenCV(图像处理)-图片搜索

图片搜索 1.知识介绍2.实现流程2.1 计算特征点与描述子2.2 描述子的匹配2.3 求出单应性矩阵并画出轮廓2.4 将特征点标出 此篇博客作者仍在探索阶段,还有一些模糊的概念没有弄懂,请读者自行分辨。 1.知识介绍 Opencv进行图片搜索需要的知识有&#xff1…

nginx漏洞修复之检测到目标URL存在http host头攻击漏洞

漏洞说明 为了方便的获得网站域名,开发人员一般依赖于HTTP Host header。例如,在php里用_SERVER[“HTTP_HOST”]。但是这个header是不可信赖的,如果应用程序没有对host header值进行处理,就有可能造成恶意代码的传入。 解决方法…

前端学习——css盒子模型、css3新特性、伪类、布局0711TODO

样式还是得具体使用才能理解,不然会忘记也理解不透彻;还有定位,元素溢出,浮动,布局水平&垂直对齐: css3新特性 1过渡 2 动画 3 2D、3D转换 伪类 三种定位方式 弹性布局/栅格布局

Unity | 向量、矩阵、齐次坐标

目录 一、向量点乘&叉乘 1.点乘 1.1 公式 1.2 几何意义 2.叉乘 2.1 公式 2.2 几何意义 二、矩阵点乘&叉乘 1.矩阵 2.矩阵的点乘 3.矩阵的叉乘 三、矩阵旋转 四、齐次坐标 一、向量点乘&叉乘 1.点乘 又称内积,结果是个标量, 1…

opencv读取图像数据并修改通道转变内存连续

opencv读取图像数据并修改通道转变内存连续

基于vscode的ros开发

Part1前言 ROS(机器人操作系统)是一个开源的机器人软件平台,旨在提供一套通用的工具和库,帮助开发人员创建机器人应用程序。ROS提供了用于构建机器人系统的库、工具、驱动程序、通信协议和软件包管理系统。 以下是ROS的一些主要特…

安科瑞智能母线监控在数据中心的应用

引言: 近年来,随着母线槽在建筑及工厂的配电中越来越广泛,母线槽场景运用的越多,随着数据中心建设的快速发展和更高需求,智能母线系统逐渐被应用于机房的末端配电中,具有电流小、插接方便、智能化程度高等…

快消品行业企业如何选择适合自己的订单管理系统源码

快消品行业企业在选择适合自己的订单管理系统源码时,需要考虑以下五个方面: 首先,企业需要考虑订单管理系统的功能是否能够满足自身的需求。订单管理系统应该具备订单录入、订单查询、订单处理、订单跟踪、进销存管理、临期提醒等基本功能&am…

sodner 论文复现

论文:A Span-Based Model for Joint Overlapped and DiscontinuousNamed Entity Recognition_pepsi_w的博客-CSDN博客 因为搞这个复现的环境弄了很久才跑通,记录一下。 介绍一下我的环境:window10 cpu pycharm miniconda 1. 下载代码文件&a…