【案例分享】MapReduce Service元數據庫服務DBservice備實例節點故障
【問題現象】DBservice備實例故障,重啟該實例后顯示恢復中,然后繼續顯示故障,具體現象如下所示:
【可能原因】
1、故障實例節點磁盤空間不足;
2、節點網絡故障;
3、實例配置文件問題;
4、免密問題;
【過程分析】
1、查看Dbserver的磁盤正常掛載,剩余空間充足。排除磁盤空間不足原因。
2、查看etc/hosts 正常,節點間互相Ping正常。節點間網絡正常。
3、查看進程檢查日志log,發現浮動ip異常,如下所示:
4、查看浮動ip日志log,發現腳本傳參有問題
5、查看floatip服務端配置文件,配置文件異常
6、導致浮動ip配置文件異常的原因,通常有主備節點網絡不通、OMM免密失效、SCP無法正常正常執行等原因,導致主備配置無法同步。
7、經確認主備實例網絡正常、SCP操作正常,嘗試從主DBservice節點使用omm ssh登錄備DBservice節點,登錄失敗,如下所示:
由上圖報錯,可以看出是因為OMM密碼過期,導致免密失效,主備間同步失敗、進而導致實例故障。
【解決方案】
方案一:使用如下命令延長OMM用戶密碼有效期(臨時規避)
chage -M '天數' omm
方案二:參考如下方式,設置OMM用戶免密永久有效
1、打開/etc/shadow文件,刪除紅框里面的內容,保存退出
刪除后如下所示:
2、查看修改后的OMM密碼有效期,如下顯示never表示永久有效
EI企業智能 FusionInsight
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。