一個HBase偶現Get慢查詢responseTooSlow的分析定位
現象: 某集群出現的Get的慢查詢,偶然出現,一旦出現時間會在3分鐘以上,一般hbase的get在20ms以內,集群明顯存出現了問題。
定位:
此時RS的日志里面沒有更多的日志,需要打開trace日志才能定位問題
1.在日志里繼續搜索,查詢row=401d54b8de049e2c5adcbc62f66a1c1d:3,搜索到其中一條日志包含callId: 8315573
2.根據callId: 8315573,搜索日志,可以看到的整個rpc持續了3分鐘,確定了此次rpc出現的問題
3.根據RpcServer.FifoWFPBQ.default.handler=19,queue=19,port=16020去搜索,確定對應時間范圍handler處理的過程,通過下面日志可以確定,讀取block花費了3分鐘
4,后續定位就是在HDFS處讀取block慢,這塊排查HDFS,后發現這RS節點對應的其中一個本地磁盤壞了,需要退服DataNode更換磁盤
EI企業智能 智能數據 HBase 表格存儲服務 CloudTable
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。