CEPH 运维记录

news/2024/12/31 1:18:40/文章来源:https://www.cnblogs.com/gshelldon/p/18451632

基于l 版本。

1、osd 状态

ceph -sactive:PG 处于活动状态,正在处理读写请求。
clean:PG 中的所有对象都是最新的,所有副本都已同步,没有缺失或未完成的操作。
scrubbing:PG 正在进行数据校验过程,确保所有数据都是一致的。Scrubbing 是定期的检查,以防止数据损坏。
deep:表示正在进行深度校验,这种检查比普通的 scrubbing 更深入,检查每个对象的完整性。
inconsistent:表示 PG 中存在不一致的对象,可能是由于写入冲突、网络分区或其他原因导致数据不同步。
acting: 状态指的是一组正在积极处理请求的 OSD(对象存储设备)。
peering 状态表示 PG(Placement Group)正在与其副本 OSD 建立或重新建立连接以同步数据。remapped
表示 PG 中的数据已经被重新映射到新的 OSD。这通常发生在 OSD 故障、重新配置或数据迁移时。PG 将在新的 OSD 上存储数据,以确保数据的可用性和冗余性。backfilling:
表示正在进行数据填充过程,将缺失的数据从其他 OSD 复制到新的 OSD。这个过程确保新映射的 OSD 拥有与其他副本相同的数据,恢复冗余性。

2、常用运维命令

ceph osd tree          # 查看crushmap,可以看到osd装填。
ceph osd metadata osd.23    # 查看osd的源数据信息能看到在哪台主机使用的哪个盘位。
ceph osd perf            # 查看磁盘延迟情况100-200ms需要注意,>200ms可能存在物理故障。# 查看对应的osd进程
ceph-osd start 92
ceph osd status

3、踢出osd

ceph osd out 87
ceph osd crush remove osd.87
ceph auth del osd.87
ceph osd rm 87

4、加入新的osd到集群中

ceph-disk prepare /dev/sdX --cluster ceph --osd-id 92--cluster-id    # 这个内容可以替换

5、故障修复

1、OSD_SCRUB_ERRORS 12 scrub errors 数据不一致修复。

找出数据不一致的pg。

~]# ceph health detail
HEALTH_ERR 12 scrub errors; Possible data damage: 10 pgs inconsistent
OSD_SCRUB_ERRORS 12 scrub errors
PG_DAMAGED Possible data damage: 10 pgs inconsistentpg 3.5f is active+clean+inconsistent, acting [8,95,42]pg 3.ac is active+clean+inconsistent, acting [42,71,12]pg 3.b9 is active+clean+inconsistent, acting [103,42,14]pg 3.16c is active+clean+inconsistent, acting [42,95,29]pg 3.1d9 is active+clean+inconsistent, acting [32,79,42]pg 3.397 is active+clean+inconsistent, acting [83,25,42]pg 3.448 is active+clean+inconsistent, acting [86,19,42]pg 3.472 is active+clean+inconsistent, acting [31,85,42]pg 3.51b is active+clean+inconsistent, acting [57,0,42]pg 3.614 is active+clean+inconsistent, acting [16,42,6]

找到pg先执行修复命令。

ceph pg dump | grep inconsistent
[root@st-ceph01 ~]# ceph  pg dump | grep inconsistent
dumped all
3.1d9      1229                  0        0         0       0 5207347200 1563     1563   active+clean+inconsistent 2024-09-29 22:20:48.723218   10718'1989810   10718:2399372  [32,79,42]         32  [32,79,42]             32  10718'1988855 2024-09-29 22:20:48.723083   10718'1988855 2024-09-29 22:20:48.723083             0 
3.b9       1160                  0        0         0       0 4947824658 1597     1597   active+clean+inconsistent 2024-09-30 01:34:35.561404   10718'7524742  10718:24576553 [103,42,14]        103 [103,42,14]            103  10718'7524306 2024-09-30 01:34:35.561309   10718'7524306 2024-09-30 01:34:35.561309             0 
3.ac       1163                  0        0         0       0 4928442368 1503     1503   active+clean+inconsistent 2024-09-29 06:24:03.359505   10718'6239021   10718:8596505  [42,71,12]         42  [42,71,12]             42   7267'6228706 2024-09-29 06:24:03.359428    7267'6228706 2024-09-29 06:24:03.359428             0 
3.5f       1209                  0        0         0       0 5190213632 1525     1525   active+clean+inconsistent 2024-09-29 21:39:21.401495  10718'33589929  10718:33959383   [8,95,42]          8   [8,95,42]              8 10712'33582312 2024-09-29 21:39:21.401409  10712'33582312 2024-09-29 21:39:21.401409             0 
3.16c      1253                  0        0         0       0 5325017105 1593     1593   active+clean+inconsistent 2024-09-30 09:00:30.353639   10718'2019828   10718:2453359  [42,95,29]         42  [42,95,29]             42  10718'2019656 2024-09-30 09:00:30.353529   10718'2019656 2024-09-30 09:00:30.353529             0 
3.397      1217                  0        0         0       0 5185437696 1567     1567   active+clean+inconsistent 2024-09-30 05:23:16.057308   10718'1667046   10718:2052636  [83,25,42]         83  [83,25,42]             83  10718'1666171 2024-09-30 05:23:16.057212   10718'1666171 2024-09-30 05:23:16.057212             0 
3.448      1209                  0        0         0       0 5133334016 1558     1558   active+clean+inconsistent 2024-09-30 04:09:53.672050   10718'2971177   10718:3367896  [86,19,42]         86  [86,19,42]             86  10718'2970647 2024-09-30 04:09:53.671988   10718'2970647 2024-09-30 04:09:53.671988             0 
3.472      1166                  0        0         0       0 4987686912 1532     1532   active+clean+inconsistent 2024-09-29 14:48:28.522790   10718'4650728  10718:26130155  [31,85,42]         31  [31,85,42]             31   7267'4647489 2024-09-29 12:30:46.064131    7267'4647489 2024-09-29 12:30:46.064131             0 
3.51b      1194                  0        0         0       0 5084989952 1504     1504   active+clean+inconsistent 2024-09-29 22:29:58.946472   10718'2215613   10718:3121361   [57,0,42]         57   [57,0,42]             57  10718'2214485 2024-09-29 22:29:58.946402   10718'2214485 2024-09-29 22:29:58.946402             0 
3.614      1171                  0        0         0       0 5002305536 1523     1523   active+clean+inconsistent 2024-09-29 22:06:17.096530   10718'7500492   10718:7964961   [16,42,6]         16   [16,42,6]             16  10718'7494126 2024-09-29 22:06:17.096429   10718'7494126 2024-09-29 22:06:17.096429             0
# 根据相应的pg id修复
ceph pg  repair 3.614

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/809970.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux下操作Nginx相关命令

1、查看Nginx进程 ps -aux | grep nginx圈出的就是Nginx的二进制文件 2、测试Nginx配置文件 /usr/sbin/nginx -t可以看到nginx配置文件位置 3、nginx的使用(启动、重启、关闭) 首先利用配置文件启动nginx。nginx -c /usr/local/nginx/conf/nginx.conf重启服务:service nginx r…

10月8号笔记

1.StringUtil常用方法2.判断不为空:CollectionUtils.isNotEmpty():集合不为空; StringUtils.isNotBlank():String不为空; MapUtils.isNotEmpoty():Map集合判断不为空;3."::"用法:4.getRecords()用法:5.MyBatis-Plus常用方法:6.MyBatis-Plus中Page与IPage的区…

夜莺监控的机器支持挂载到多个业务组了

夜莺开源项目于国庆前夕发布了 v7.4.1 版本,修复了一些 bug,同时也带来了一些新功能。其中最重要的一个功能是:机器支持挂载到多个业务组了。本文将介绍几个重要的变更。 所有变更点feat: 左侧栏业务组新设计 feat: 机器支持了绑定到多个业务组,机器混部的场景,管理机器更…

SS241007C. 步行(walk)

待订正。SS241007C. 步行(walk) 题意 给你一个 \(n \le 3 \times 10^5\) 个结点的树,每个结点有一个权值 \(a_i\)。有 \(m \le 1.5 \times 10^6\) 次询问,每次删除一条边,然后再连上一条边。如果修改后的图不是树输出无解。否则找出一条路径,满足每个点恰好经过 \(a_i\) …

day02_基本的DOS命令

电脑常用快捷键 常用快捷键快捷键 作用CTRL + c 复制CTRL + v 粘贴CTRL + x 剪切CTRL + z 撤销CTRL + s 保存alt + f4 关闭窗口del 删除shift + del 强制删除Windows + r 打开 “运行” 窗口windows + e 打开 “我的文档”ctrl + alt + del 锁定/切换用户/注销/更改密码/任务管…

组态也能开发WEB前端 | uiotos致敬amis、nodered、appsmith、codewave、goview、dataroom、iotrouter、FUXA、乐吾乐

WEB组态开发SCADA、HMI画面、大屏可视化,还比较常见。比如下面: UIOTOS组态示例 那么常规WEB前端功能,组态能否一并做了呢?比如下面这种: UIOTOS前端示例 答案是可以的!UIOTOS支持页面无限嵌套,能实现原型即应用。现在就以一个具体小示例介绍如何实现的。 效果 如下所示…

GUI无代码小示例 - 工作流连线实现0/1连续翻转

效果 如下所示,连续点击按钮,输出0、1、0、1...。 步骤新建页面,拖入组件拖入3个组件:数学计算、输入框、按钮。如下所示: 连线和配置按钮点击 → 函数执行1减去输入,作为函数输出这样,当首次执行时,默认操作数1将减去输入的1,输出0。 函数输出→ 输入框 → 函数输入 …

Java生成条形码(亲测可通过扫码枪扫出)

Java生成条形码(亲测可通过扫码枪扫出) 秃秃爱健身该博客介绍了如何在Java项目中通过barcode4j库生成Code128条形码,解决了条形码扫不出或美观度不足的问题。提供了相关代码示例,包括Maven依赖、工具类和生成条形码的方法,可以自定义条形码的高度、宽度、是否留白和隐藏文…

点“亮”户外应用场景,来看触想高亮显示器TPC-M8的硬实力!

工业显示器作为信息可视化和人机交互的重要媒介,正在越来越多领域担当关键任务,工业显示器的可读性及耐用性,影响应用体验、设备安全和生产效率。尤其在户外,面对高低温、灰尘雨水、强光紫外线等极端因素,常规性能的工业显示器已不足以覆盖户外高风险应用需求。为此,触想…

phpvulhunter工具:静态 php 代码审计

phpvulhunter是一款PHP源码自动化审计工具,通过这个工具,可以对一些开源CMS进行自动化的代码审计,并生成漏洞报告。 1、安装 首先从github上进行获取: git clone https://github.com/OneSourceCat/phpvulhunter2、下载完成后,将工程目录放置于 WAMP 等 PHP-Web 运行环境中…

YOLOv8-seg训练与推理

1.YOLOv8-seg简介 YOLOv8-seg是YOLO系列模型的其中一个版本。YOLOv8-seg在继承YOLO系列模型高效性和准确性的基础上,增加了实例分割的能力。 2.数据集使用的数据集较简单,主要以下目录:images:存放原始图片(1500张),大小为128x128。部分如下: images_json:存放labelme标注的…

易基因: cfMeDIP-seq揭示cfDNA甲基化高效区分原发性和转移性前列腺|Nat Commun

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 前列腺癌(Prostate cancer,PCa)是男性中第二常见的恶性肿瘤,也是全球癌症相关死亡的第三大原因。虽然大多数原发性前列腺癌可以治愈,但转移性前列腺癌患者的5年生存率仍低至30%。大多数患者很快就会发展成…