一次線上k8s節點維護

      網友投稿 1028 2022-05-29

      記一次線上k8s節點維護

      一 背景

      收到測試環境集群告警,登陸K8s集群進行。

      二 故障定位

      2.1 查看pod

      查看kube-system node2節點calico pod異常

      查看詳細信息,查看node2節點沒有存儲空間,cgroup泄露

      2.2 查看存儲

      登陸node2查看服務器存儲信息,目前空間還很充足

      集群使用到的分布式存儲為ceph,因此查看ceph集群狀態

      三 操作

      3.1 ceph修復

      目前查看到ceph集群異常,可能導致node2節點cgroup泄露異常,進行手動修復ceph集群。

      數據的不一致性(inconsistent)指對象的大小不正確、恢復結束后某副本出現了對象丟失的情況。數據的不一致性會導致清理失敗(scrub error)。 CEPH在存儲的過程中,由于特殊原因,可能遇到對象信息大小和物理磁盤上實際大小數據不一致的情況,這也會導致清理失敗。

      由圖可知,pg編號1.7c 存在問題,進行修復。

      pg修復

      ceph pg repair 1.7c

      進行修復后,稍等一會,再次進行查看,ceph集群已經修復

      3.2 進行pod修復

      對異常pod進行刪除,由于有控制器,會重新拉起最新的pod

      查看pod還是和之前一樣,分析可能由于ceph異常,導致node2節點cgroup泄露,網上檢索重新編譯

      Google一番后發現與https://github.com/rootsongjc/kubernetes-handbook/issues/313 這個同學的問題基本一致。

      記一次線上k8s節點維護

      存在的可能有,

      Kubelet 宿主機的 Linux 內核過低 - Linux version 3.10.0-862.el7.x86_64

      可以通過禁用kmem解決

      查看系統內核卻是低版本

      3.3 故障再次定位

      最后,因為在啟動容器的時候runc的邏輯會默認打開容器的kmem accounting,導致3.10內核可能的泄漏問題

      在此需要對no space left的服務器進行 reboot重啟,即可解決問題,出現問題的可能為段時間內刪除大量的pod所致。

      初步思路,可以在今后的集群管理匯總,對服務器進行維修,通過刪除節點,并對節點進行reboot處理

      3.4 對node2節點進行維護

      kubectl cordon node02

      kubectl drain node02 --delete-local-data --ignore-daemonsets --force

      –delete-local-data 刪除本地數據,即使emptyDir也將刪除;

      –ignore-daemonsets 忽略DeamonSet,否則DeamonSet被刪除后,仍會自動重建;

      –force 不加force參數只會刪除該node節點上的ReplicationController, ReplicaSet, DaemonSet,StatefulSet or Job,加上后所有pod都將刪除;

      目前查看基本node2的pod均已剔除完畢

      此時與默認遷移不同的是,pod會先重建再終止,此時的服務中斷時間=重建時間+服務啟動時間+readiness探針檢測正常時間,必須等到1/1 Running服務才會正常。因此在單副本時遷移時,服務終端是不可避免的。

      重啟后node02已經修復完成。

      對node02進行恢復

      恢復node02可以正常調度

      kubectl uncordon node02

      四 反思

      后期可以對部署k8s 集群內核進行升級。

      集群內可能pod的異常,由于底層存儲或者其他原因導致,需要具體定位到問題進行針對性修復。

      參考鏈接

      https://blog.csdn.net/yanggd1987/article/details/108139436

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:linux 配置udev修改權限
      下一篇:前端開發之JavaScript篇——防抖在DOM操作中的應用
      相關文章
      亚洲日韩国产精品第一页一区| 综合亚洲伊人午夜网| 亚洲成AV人片久久| 亚洲成a∨人片在无码2023| 亚洲高清视频免费| 亚洲AV无码久久精品色欲| 亚洲乱码日产精品a级毛片久久| 亚洲国产精品无码久久98| 亚洲人成伊人成综合网久久| 91精品国产亚洲爽啪在线影院| 亚洲av无码乱码国产精品| 国产亚洲精品精华液| 亚洲乱码中文字幕综合| 久99精品视频在线观看婷亚洲片国产一区一级在线| 成人亚洲国产精品久久| 国产精品亚洲色图| 亚洲А∨精品天堂在线| 亚洲av午夜成人片精品电影 | 亚洲精品不卡视频| 老司机亚洲精品影院无码| 老司机亚洲精品影院无码| 亚洲麻豆精品果冻传媒| 久久精品国产亚洲AV大全| 亚洲日产2021三区在线 | 精品久久久久久亚洲中文字幕| 日韩亚洲人成在线| 亚洲成年网站在线观看| 亚洲国产精品无码第一区二区三区| 亚洲午夜无码久久| 欧洲亚洲综合一区二区三区 | 国产精品亚洲а∨天堂2021| 亚洲AV色无码乱码在线观看| 成人亚洲网站www在线观看| 亚洲精品无码你懂的网站| 亚洲人成人77777网站| 国产亚洲欧洲精品| 久久亚洲精品中文字幕| 亚洲成aⅴ人片在线影院八| 亚洲www在线观看| 亚洲AV色欲色欲WWW| 亚洲中久无码不卡永久在线观看|