k8s里node 宕机后如何提高pod迁移速度-编程知识

k8s里node 宕机后如何提高pod迁移速度

news/2025/3/11 1:20:48/文章来源:https://www.cnblogs.com/fengjian2016/p/18237254

大概的配置参数：

node故障后，pod会迁移到正常的node上，迁移时间大概8分钟左右，如果是微服务，注册到nacos，服务不受影响，但是对于其他的服务，
请求中会有大量失败。

需要几个流程：

kubelet 自身会定期更新状态到 apiserver，通过kubelet的参数 node-status-update-frequency 配置上报频率，默认 10s 上报一次。

kube-controller-manager定期去探测kubelet的运行状态，默认5s问kubelet，使用--node-monitor-grace-period参数

kube-controller-manager询问kubelet，如果5分钟没有回复，认为kubelet有问题，node-monitor-grace-period，是kubelet参数node-status-update-frequency的整数倍

如果有问题，故障node节点被设置成污点

node.kubernetes.io/unreachable:NoExecute
node.kubernetes.io/unreachable:NoSchedule

节点被设置了污点，pod节点上还是running，apiserver的参数--default-unreachable-toleration-seconds是驱逐掉时间。

vim /var/lib/kubelet/config.yaml

memorySwap: {}
#修改kubelet向apiserver 汇报时间，由10秒变成4秒
node-status-update-frequency: 4s
nodeStatusReportFrequency: 0s
nodeStatusUpdateFrequency: 0s
rotateCertificates: true
runtimeRequestTimeout: 0s
shutdownGracePeriod: 0s
shutdownGracePeriodCriticalPods: 0s
staticPodPath: /etc/kubernetes/manifests
streamingConnectionIdleTimeout: 0s
syncFrequency: 0s
volumeStatsAggPeriod: 0s

vim /etc/kubernetes/manifests/kube-apiserver.yaml

spec:containers:- command:- kube-apiserver- --advertise-address=192.168.148.131- --allow-privileged=true- --authorization-mode=Node,RBAC- --client-ca-file=/etc/kubernetes/pki/ca.crt- --enable-admission-plugins=NodeRestriction- --enable-bootstrap-token-auth=true- --etcd-cafile=/etc/kubernetes/pki/etcd/ca.crt- --etcd-certfile=/etc/kubernetes/pki/apiserver-etcd-client.crt- --etcd-keyfile=/etc/kubernetes/pki/apiserver-etcd-client.key- --etcd-servers=https://127.0.0.1:2379- --kubelet-client-certificate=/etc/kubernetes/pki/apiserver-kubelet-client.crt- --kubelet-client-key=/etc/kubernetes/pki/apiserver-kubelet-client.key- --kubelet-preferred-address-types=InternalIP,ExternalIP,Hostname- --proxy-client-cert-file=/etc/kubernetes/pki/front-proxy-client.crt- --proxy-client-key-file=/etc/kubernetes/pki/front-proxy-client.key- --requestheader-allowed-names=front-proxy-client- --requestheader-client-ca-file=/etc/kubernetes/pki/front-proxy-ca.crt- --requestheader-extra-headers-prefix=X-Remote-Extra-- --requestheader-group-headers=X-Remote-Group- --requestheader-username-headers=X-Remote-User- --secure-port=6443- --service-account-issuer=https://kubernetes.default.svc.cluster.local- --service-account-key-file=/etc/kubernetes/pki/sa.pub- --service-account-signing-key-file=/etc/kubernetes/pki/sa.key- --service-cluster-ip-range=10.96.0.0/12- --tls-cert-file=/etc/kubernetes/pki/apiserver.crt- --tls-private-key-file=/etc/kubernetes/pki/apiserver.key
    #当node节点为notready或者 unreachable时，5秒钟驱逐掉，默认300秒- --default-unreachable-toleration-seconds=5- --default-not-ready-toleration-seconds=5

vim /etc/kubernetes/manifests/kube-controller-manager.yaml

spec:containers:- command:- kube-controller-manager- --allocate-node-cidrs=true- --authentication-kubeconfig=/etc/kubernetes/controller-manager.conf- --authorization-kubeconfig=/etc/kubernetes/controller-manager.conf- --bind-address=127.0.0.1- --client-ca-file=/etc/kubernetes/pki/ca.crt- --cluster-cidr=10.244.0.0/16- --cluster-name=kubernetes- --cluster-signing-cert-file=/etc/kubernetes/pki/ca.crt- --cluster-signing-key-file=/etc/kubernetes/pki/ca.key- --controllers=*,bootstrapsigner,tokencleaner- --kubeconfig=/etc/kubernetes/controller-manager.conf- --leader-elect=true- --requestheader-client-ca-file=/etc/kubernetes/pki/front-proxy-ca.crt- --root-ca-file=/etc/kubernetes/pki/ca.crt- --service-account-private-key-file=/etc/kubernetes/pki/sa.key- --service-cluster-ip-range=10.96.0.0/12- --use-service-account-credentials=true- --v=5
    # kube-controller-manager 修改成2秒主动探测，默认值5秒- --node-monitor-period=2s
    # 将一个node标记为不健康之前允许其无响应的上线- --node-monitor-grace-period=12s

验证脚本，中间关闭node，查看pod漂移时间

while true; do echo `date +%F-%T`; kubectl get node ;echo "####################################################################"; kubectl describe nodes node2 | grep -A5 Taint;echo "";echo "##############################################################"; kubectl get pod -o wide; sleep 5; done

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/721406.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

day11 Xpath

网页分析有优势，全称XML Path Language一种小型的查询语言优点：可在XML中查询信息支持HTML的查询通过元素和属性进行导航 PY使用需要安装库：安装lxml selector = etree.HTML（html_doc）//实例化对象，实际上就是一个Element类，通过逻辑运算： //div[@id and @class]查找…

智慧社区

智慧社区 # 智慧社区-小程序-欢迎页面-首页-轮播图-公告-信息采集，社区活动，人脸检测，语音识别，心率检测，积分商城-信息采集页面-采集人数-采集详情页面-采集统计页面-人脸检测页面-语音识别页面-积分商城页面-活动-活动列表-报名活动-加载更多-公告-公告列表-我的-信息展…

MainWindows移动View文件夹和使用Window.DataContext单例绑定需要修改的地方

项目结构移动文件夹后需要修改的三个地方 1、App.xaml2、MainWindow.xaml3、MainWindow.xaml.cs单例绑定需要修改的地方 MainWindow.xaml

ClickHouse内幕（2）基础数据结构

ClickHouse以性能好被大家所熟知，而一个数据库的性能优化是一个庞大的系统性工程。本文着眼于ClickHouse内部的基础数据结构，以揭露ClickHouse性能优化的冰山一角。在软件工程中并不是所有的执行路径都需要优化，只有关键执行路径才需要花费大力气进行优化。对于数据库领域来…

from PyQt5 import QtWidgets from PyQt5 import QtCore, QtGui import sys import cv2class ButtonPanel(QtWidgets.QWidget):def __init__(self, *args, **kwargs):super().__init__(*args, **kwargs)select_btn = QtWidgets.QPushButton("图像选择")self.path_lab…

CH32系列MCU SysTick使用与计算

1、关于SysTick CH32F103/203： CH32F103/203为Cortex-M3内核，SysTick是一个24位的向下递减计数器，计数器每计数一次的时间可配置为1/时基。当SysTick重装载数寄存器的值递减到0的时候，产生一次中断。CH32F系列MCU SysTick由4个寄存器控制，具体如下图。具体介绍可参考《CM3…

在线安装 qt 下载安装慢以及安装报错无法下载存档 not found——解决方式

一、下载安装QT的在线下载器可以在 QT 官网下载开源的安装包（需要登陆）或者在各大大学的镜像站中下，比如：mirrors.nju.edu.cn（可选）解压出下载的压缩包，拿到 qt-unified-windows-x64-online.exe/dmg/run 本体在终端中，输入 ./包名 --mirror https://mirror.nju.edu.…

【Linux驱动设备开发详解】11.内存与I/O访问

1.内存管理单元高性能处理器一般会提供一个内存管理单元(MMU),用于辅助操作系统尽心修改内存管理，提供虚拟地址和物理地址的映射、内存访问权限保护和Cache缓存控制等硬件支持。 1.1MMU基本概念 1.1.1 概念含义 1.TLB(Translation Lookaside Buffer): 旁路转换缓存，TLB是MMU…

OOP第二次博客作业

一、前言又做了三次PTA练习，前一次还是之前三次的迭代训练，后面两次又是一个新的模型。//终于是换模型了//题目类型都差不多，更注重类与类之间的联系，增加的内容就是对类的设计更复杂了，类的种类也更多了。但总体的逻辑不变。二、分析第四次判题程序（1）设计与分析本…

HTTP Status 400 – Bad Request

1. 问题2. 原因org.apache.juli.logging.DirectJDKLog:log|Error parsing HTTP request headerNote: further occurrences of HTTP header parsing errors will be logged at DEBUG level.java.lang.IllegalArgumentException: Request header is too largeat org.apache.coyot…

使用jmeter，响应体response body中有两个同名的cookies时，如何获取第二个cookie进行跨线程组使用

如图两个同名cookie：.AspNetCore.Cookies正则表达式提取器引用名称：loginCookie 正则表达式：Set-Cookie: (.AspNetCore.Cookies=.*?;) 模板：$1$（确保正确匹配到第二个 .AspNetCore.Cookies）匹配数字2beanshell后置处理程序 ${__setProperty(loginCookie,${loginCookie…