一次心驚肉跳的服務(wù)器誤刪文件的恢復(fù)過(guò)程
1故事背景
安排一個(gè)妹子在一臺(tái)生產(chǎn)服務(wù)器上安裝Oracle,妹子邊研究邊安裝,感覺(jué)裝的不對(duì),準(zhǔn)備卸載重新安裝。從網(wǎng)上找到卸載方法,其中要執(zhí)行一行命令刪除Oracle的安裝目錄,命令如下:
如果ORACLE_BASE這個(gè)變量沒(méi)有賦值,那命令就變成了
(mysql數(shù)據(jù)庫(kù)不是在運(yùn)行嗎?linux能刪除正在執(zhí)行的文件?反正是徹底刪除了,最后還剩一個(gè)tomcat的log文件,估計(jì)是文件過(guò)大,一時(shí)沒(méi)有刪除成功)
看著妹子自責(zé)的眼神,又是因?yàn)檫@事是我安排她做的,也沒(méi)有跟她講清厲害關(guān)系,沒(méi)有任何培訓(xùn),責(zé)任只能一個(gè)人背了,況且怎么能讓美女背負(fù)這個(gè)責(zé)任呢?
打電話到機(jī)房,將盤掛到另一臺(tái)服務(wù)器上,ssh上去查看文件全部被清,這臺(tái)服務(wù)器運(yùn)行的可是一個(gè)客戶的生產(chǎn)系統(tǒng)啊,已經(jīng)運(yùn)行大半年了,得盡快恢復(fù)啊。
于是找來(lái)脫機(jī)備份的數(shù)據(jù)庫(kù),發(fā)現(xiàn)備份文件只有1kb,里面只有幾行熟悉的mysqldump注釋(難道是crontab執(zhí)行的備份腳本有問(wèn)題),最接盡的備份也是2013年12月份的了,真是屋漏偏逢連夜雨啊。
想起來(lái)一位領(lǐng)導(dǎo)說(shuō)過(guò)的案例:當(dāng)一個(gè)生產(chǎn)系統(tǒng)掛掉以后,發(fā)現(xiàn)所有備份都有問(wèn)題,刻錄的光盤也有劃痕,磁帶機(jī)也壞了(一個(gè)業(yè)界前輩,估計(jì)以前還用光盤做備份了),沒(méi)想到今天真的應(yīng)驗(yàn)到我的身上了,怎么辦??
部門領(lǐng)導(dǎo)知道情況后,已經(jīng)做了最壞的B計(jì)劃:領(lǐng)導(dǎo)親自帶隊(duì)和產(chǎn)品AA周日趕到客戶所在的地市,星期一去領(lǐng)導(dǎo)層溝通;BB和CC去客戶管理員那邊想辦法說(shuō)服客戶。。。
2救命稻草--ext3grep
趕快到網(wǎng)上去查資料進(jìn)行誤刪數(shù)據(jù)恢復(fù),還真找到一款ext3grep能夠恢復(fù)通過(guò)rm -rf刪除的文件,我們磁盤也是ext3格式,且網(wǎng)上有不少的成功案例。
于是燃起了一絲希望,趕快對(duì)盤umount,防止重新寫入補(bǔ)刪文件扇區(qū)。
下載ext3grep,安裝(編譯安裝過(guò)程艱辛?xí)呵也槐恚?/p>
先執(zhí)行掃描文件名命令:
打印出了所有被刪除文件及路徑,心中狂喜,不用執(zhí)行B計(jì)劃了,文件都在呢。
這款軟件不能按目錄恢復(fù)文件,只能執(zhí)行恢復(fù)全部命令:
結(jié)果當(dāng)前盤空間不足,沒(méi)辦法只能恢復(fù)文件,嘗試了幾個(gè)文件,居然部分成功部分失敗
心里不禁一涼,難道是刪除磁盤上被寫過(guò)文件了?恢復(fù)機(jī)率不大了啊,能恢復(fù)幾個(gè)算幾個(gè)吧,說(shuō)不定重要數(shù)據(jù)文件剛好在能恢復(fù)的MYD文件中。
于是先將所有文件名重定向到一個(gè)文件文件中
過(guò)濾出來(lái)所有mysql數(shù)據(jù)庫(kù)的文件名存成,mysqltbname.txt
編寫腳本恢復(fù)文件:
執(zhí)行,大概運(yùn)行了20分鐘,恢復(fù)了40多個(gè)文件,但不夠啊,我們將近100張表,每張表frm,myd,myi三個(gè)文件,怎么說(shuō)也有300多個(gè)左右啊!!
將找回來(lái)的文件附到現(xiàn)有數(shù)據(jù)庫(kù)上,更要文件權(quán)限為777后,重啟mysql,也算是找回一部分?jǐn)?shù)據(jù)了,但客戶重要的考勤簽到數(shù)據(jù)、手機(jī)端上報(bào)數(shù)據(jù)(據(jù)說(shuō)客戶按這些數(shù)據(jù)做員工績(jī)效的)還沒(méi)找回來(lái)啊。
咋 辦?中間又試了另一款工具extundelete,跟ext3grep語(yǔ)法基本一致,原理應(yīng)該也一樣了,但是據(jù)說(shuō)能按目錄恢復(fù),好吧試一試。
果然不出所料,恢復(fù)不出來(lái)!!!!!!!!
那些文件已被破壞了。
跟領(lǐng)導(dǎo)匯報(bào),執(zhí)行B計(jì)劃吧。。。
無(wú)奈之下下班回家(周末了,回去休息一下,想想辦法吧)
3靈機(jī)一動(dòng)binlog
第二天早晨一早就醒了(心里有事啊),背上電腦,去公司(這個(gè)周末算是報(bào)銷了,不挨批,通報(bào),罰款,開(kāi)除就不錯(cuò)了,還過(guò)什么周末啊)。
依舊運(yùn)行ext3grep,extundelete,也就那幾招啊,把系統(tǒng)架到測(cè)試服務(wù)器上,看看數(shù)據(jù)能不能想辦法補(bǔ)一補(bǔ)吧。
在測(cè)試服務(wù)器上進(jìn)行mysqldump,恢復(fù)文件,覆蓋恢復(fù)回來(lái)的文件,給文件加權(quán)限,重啟mysql。
wait,wait,不是有binlog嗎?我們服務(wù)都要求開(kāi)啟binlog,說(shuō)不定能通過(guò)binlog里恢復(fù)數(shù)據(jù)呢?
于是從dump出來(lái)的文件名里找到binlog的文件,一共三個(gè),mysql-binlog0001,mysql-bin.000009,mysql-bin.000010,恢復(fù)一下0001
居然失敗了。。。。。。
再看另兩個(gè)文件,mysql-bin.000010大概幾百M(fèi)B,應(yīng)該靠譜一點(diǎn),執(zhí)行還原命令,居然成功了!!!!!!!!!!!!!
趕快scp到測(cè)試服務(wù)器。
執(zhí)行binlog還原。
輸入密碼,卡住了(好現(xiàn)象),經(jīng)過(guò)漫長(zhǎng)的等待,終于結(jié)束了。
打開(kāi)應(yīng)用,哦,感謝cctv,mtv,數(shù)據(jù)回來(lái)了!!!!!!!!!!!!!!!
4后記
經(jīng)過(guò)此次事故,雖然數(shù)據(jù)很幸運(yùn)能找回來(lái)了,但是過(guò)程卻是驚心動(dòng)迫。
也為自己的錯(cuò)誤所帶來(lái)的后果,給同事和領(lǐng)導(dǎo)帶來(lái)的連帶責(zé)任而后怕。
也希望謹(jǐn)記此次事故,以后不再犯同樣的錯(cuò)誤。
事故反思如下:
本次安排MM進(jìn)行服務(wù)器維護(hù)時(shí)沒(méi)有提前對(duì)她進(jìn)行說(shuō)明厲害情況,自己也未重視,管理混亂,流程混亂。一個(gè)在線的生產(chǎn)系統(tǒng),任何一個(gè)改動(dòng)一定要先謀而后動(dòng)。
自動(dòng)備份出現(xiàn)問(wèn)題,沒(méi)有任何人檢查。脫機(jī)備份人員每次從服務(wù)器上下載1k的文件卻從未重視。需要明確大家在工作崗位上的責(zé)任。
事故發(fā)生后,沒(méi)有及時(shí)發(fā)現(xiàn),造成部分?jǐn)?shù)據(jù)寫入磁盤,造成不可恢復(fù)問(wèn)題。需要編寫應(yīng)用監(jiān)控程序,服務(wù)一旦有異常,短信告警相關(guān)責(zé)任人。
根據(jù)評(píng)論提醒,再加一條:
不能使用root用戶來(lái)操作。應(yīng)該在服務(wù)器上開(kāi)設(shè)不同權(quán)限級(jí)別的用戶。
通過(guò)本次事故,幾位跟這個(gè)項(xiàng)目和事故沒(méi)有任何關(guān)系的同事,主動(dòng)前來(lái)幫忙,查資料,幫測(cè)試,有一位同事還幫忙到晚上1點(diǎn)多鐘進(jìn)行數(shù)據(jù)恢復(fù)測(cè)試。
同時(shí)產(chǎn)品經(jīng)理在想到面向客戶的巨大壓力的情況下,沒(méi)有慌亂而責(zé)怪開(kāi)發(fā)人員和具體操作人,而讓大家能靜下心來(lái)想解決方案。
部門領(lǐng)導(dǎo)也積極主動(dòng)的幫忙想辦法,陪我們加班測(cè)試,實(shí)時(shí)跟蹤事情進(jìn)程。
通過(guò)大家的共同努力,終于事情相對(duì)圓滿結(jié)束,接下來(lái),周一上午進(jìn)行集體反思,總結(jié)經(jīng)驗(yàn)教訓(xùn),這類事故一定盡量大努力進(jìn)行避免。
———— e n d ————
本文所用到的工具鏈接:
1.ext3grep:https://code.google.com/p/ext3grep/
2.extundelete:http://extundelete.sourceforge.net/
功能跟ext3grep差不多,原理應(yīng)該也差不多。只是號(hào)稱可以還原目錄,我這里沒(méi)有試驗(yàn)成功。
本文轉(zhuǎn)載自公眾號(hào)【java學(xué)習(xí)之道】。
MySQL 數(shù)據(jù)庫(kù)
版權(quán)聲明:本文內(nèi)容由網(wǎng)絡(luò)用戶投稿,版權(quán)歸原作者所有,本站不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲或描述失實(shí)的內(nèi)容,請(qǐng)聯(lián)系我們jiasou666@gmail.com 處理,核實(shí)后本網(wǎng)站將在24小時(shí)內(nèi)刪除侵權(quán)內(nèi)容。