ORACLE ODA一体机存储节点电源故障的分析处理

近期,某用户的ORACLE ODA一体机在例行机房巡检时出现亮黄灯告警;用户反馈次问题后我们立刻通过远程方式,登陆ODA的控制台进行查看;

对于ODA一体机(2个计算节点+1个存储节点),计算节点可以通过ilom管理界面登陆进行详细的硬件信息查看和管理,当然通过命令行也可以。

对于存储节点,是没有图形界面可以看,可以通过ODA管理台(7093/mgmt/index.html)或者命令查看;

本次问题查看为存储节点的1个电源故障,由于双电源配置,系统仍然可以正常工作;并且电源的更好工作是可以在线进行的。

如下为排查分析过程:

1、故障灯及系统中查看故障原因

[root@TEST2 ~]# odaadmcli show enclosure

        NAME        SUBSYSTEM         STATUS      METRIC   

        _FAN0       Cooling           OK          4910 rpm 
        _FAN1       Cooling           OK          4540 rpm 
        _FAN2       Cooling           OK          4920 rpm 
        _FAN3       Cooling           OK          4530 rpm 
        _IOM0       Encl_Electronics  OK          -        
        _IOM1       Encl_Electronics  OK          -        
        _PSU0       Power_Supply      Critical    -       ===>>>显示故障    
        _PSU1       Power_Supply      OK          -        
        _TEMP0      Amb_Temp          OK          23 C     
        _TEMP1      Midplane_Temp     OK          22 C     
        _TEMP2      PCM0_Inlet_Temp   OK          30 C     
        _TEMP3      PCM0_Hotspot_Temp OK          24 C     
        _TEMP4      PCM1_Inlet_Temp   OK          42 C     
        _TEMP5      PCM1_Hotspot_Temp OK          39 C     
        _TEMP6      IOM0_Temp         OK          22 C     
        _TEMP7      IOM1_Temp         OK          22 C 

4 、更换电源(可以先尝试插拔电源线,电源线松动是可能的,插拔后也可能就恢复了)

更换的步骤MOS文档(How to confirm power supply status about storage shelf on ODA X7-2 (Doc ID 2419846.1),How To Replace an ODA (Oracle Database Appliance) X6-2HA, X7-2HA, X8-2HA, X9-2HA DE3-24C Power Supply/Cooling Unit [VCAP] (Doc ID 2960220.1))有视频和步骤,没有特殊的难度,参考如下:

WHAT ACTION DOES THE FIELD ENGINEER/ADMINISTRATOR NEED TO TAKE?:
1. Locate the PSU by amber LED

The following LEDs are lit when a power supply fault is detected:

* Front and rear Service Required LEDs
* Rear PS Failure LED on the bezel of the server
* Failure LED on the faulty power supply

2. Verify the PSU part number in the System Handbook and re-confirm.

3. Removing the PSU as follows.
3.1 Clear access to the PSU of any cables harnesses or assemblies.
3.2 Ensure the PSU  On/Off switch is in the 'Off' Position.
3.3 Disconnect the power cord tie strap from the power cord, and unplug the power cord from the PSU.
3.4 Remove installed PSU by, Grasping the PSU handle, push the release button and slide out PSU.

4. Installing the Power Supply as follows or use the "online" Help Guide.

4.1 On the replacement PSU verify that the Release button is open .
4.2 Align PSU with empty bay in chassis and slide in .
4.3 Push the lever fully closed until you hear or feel a click.
4.4 Connect AC power cord to new PSU. Use the power cord retaining clips.
4.4 If required , place cable harness or assemblies back into normal position.
4.5 Turn the On/OFF switch to the On position .

5. Verify the replacement by checking for Green LED

IMPORTANT NOTE :
PSUs have a 3 minute Service time limit . When you remove a PSU the
fans on the remaining PSU go to 100 % duty cycle . Testing has shown that
HDD temperatures can exceed their operating temperature when a PSU has
been removed for 3 minutes.

5、检查最终状态(注意次命令的输出,ODA 的2个计算节点的的输出是不一致的,简单说是检测到恢复正常是有时间差的,如节点1显示OK,节点2可能过几分钟才显示OK)

[root@TEST2 ~]# odaadmcli show enclosure

        NAME        SUBSYSTEM         STATUS      METRIC   

        _FAN0       Cooling           OK          4910 rpm 
        _FAN1       Cooling           OK          4540 rpm 
        _FAN2       Cooling           OK          4910 rpm 
        _FAN3       Cooling           OK          4540 rpm 
        _IOM0       Encl_Electronics  OK          -        
        _IOM1       Encl_Electronics  OK          -        
        _PSU0       Power_Supply      OK          -        
        _PSU1       Power_Supply      OK          -        
        _TEMP0      Amb_Temp          OK          23 C     
        _TEMP1      Midplane_Temp     OK          22 C     
        _TEMP2      PCM0_Inlet_Temp   OK          29 C     
        _TEMP3      PCM0_Hotspot_Temp OK          24 C     
        _TEMP4      PCM1_Inlet_Temp   OK          41 C     
        _TEMP5      PCM1_Hotspot_Temp OK          39 C     
        _TEMP6      IOM0_Temp         OK          22 C     
        _TEMP7      IOM1_Temp         OK          28 C  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/700073.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HTTP协议及应用

一.HTTP协议 1.HTTP协议版本 HTTP1.0:服务器处理完成后立即断开TCP连接(无连接),服务器不跟踪每个客户端也不记录过去的请求(无状态); HTTP1.1:KeepAlived长连接避免了连接建立和…

卷积神经网络CNN的运行过程、常见术语与问题

目录 一、CNN运行过程 1、卷积(Convolution) 2、激活函数(activation function) 3、池化(pooling) 3.1 池化操作 3.2 池化过程 3.3 池化后结果 4、Flatten 5、全连接层 Flatten层的操作 全连接层…

MyBatis常见报错:org.apache.ibatis.binding.BindingException

哈喽,大家好,我是木头左! 异常现象描述 当开发者在使用MyBatis进行数据库操作时,可能会遇到org.apache.ibatis.binding.BindingException: Parameter appId not found这样的错误提示。这个错误通常会让程序无法正常运行&#xff…

namenode启动失败 org.apache.hadoop.hdfs.server.common.InconsistentFSStateException:

小白的Hadoop学习笔记 2024/5/14 18:26 文章目录 问题解决报错浅浅分析一下core-ste.xml 问题 namenode启动失败 读日志 安装目录下 vim /usr/local/hadoop/logs/hadoop-tangseng-namenode-hadoop102.log2024-05-14 00:22:46,262 ERROR org.apache.hadoop.hdfs.server.namen…

ov通配符证书1590

OV通配符SSL证书也可以称之为OV企业型泛域名SSL证书,指的是专为企事业单位准备的通配符SSL证书,不仅可以用一张SSL证书保护主域名以及主域名下所有的子域名,还可以为多个域名网站进行身份认证服务。今天就随SSL盾小编了解性价比较高的OV通配符…

端口号查询进程PID

情况1:由于 idea 突然闪退,导致正在 debug 的 Java 进程没结束掉,端口还在占用,重新 debug 不了,所以需要到任务管理器把进程结束掉 但问题是如果当任务管理器进程同时有多个 Java 进程在运行(而且名字一样…

涨点神器:即插即用特征融合模块!超低参数,性能依旧SOTA

在写论文时,一些通用性模块可以在不同的网络结构中重复使用,这简化了模型设计的过程,帮助我们加快了实验的迭代速度。 比如在视觉任务中,即插即用的特征融合模块可以无缝集成到现有网络中,以灵活、简单的方式提升神经…

推荐5个实用的工具软件,提高效率

​ 现在,有很多实用的工具和软件可以帮助我们更高效地完成各种任务。以下是几个值得推荐的工具和软件,能够极大地提高我们的工作效率。 1.浏览器插件——SuperCopy ​ SuperCopy是一款浏览器插件,主要用于增强网页文本的复制功能。它解决了…

曲线救国:window 安装 docker

你好,我是 shengjk1,多年大厂经验,努力构建 通俗易懂的、好玩的编程语言教程。 欢迎关注!你会有如下收益: 了解大厂经验拥有和大厂相匹配的技术等 希望看什么,评论或者私信告诉我! 文章目录 一…

深入解析RedisJSON:在Redis中直接处理JSON数据

码到三十五 : 个人主页 JSON已经成为现代应用程序之间数据传输的通用格式。然而,传统的关系型数据库在处理JSON数据时可能会遇到性能瓶颈。为了解决这一问题,Redis推出了RedisJSON模块,它允许开发者在Redis数据库中直接存储、查询…

C语言(指针)7

Hi~!这里是奋斗的小羊,很荣幸各位能阅读我的文章,诚请评论指点,关注收藏,欢迎欢迎~~ 💥个人主页:小羊在奋斗 💥所属专栏:C语言 本系列文章为个人学习笔记&#x…

linux 任务管理(临时任务定时任务) 实验

目录 任务管理临时任务管理周期任务管理 任务管理 临时任务管理 执行如下命令添加单次任务,输入完成后按组合键Ctrl-D。 [rootopenEuler ~]# at now5min warning: commands will be executed using /bin/sh at> echo "aaa" >> /tmp/at.log at&g…