一名研發人的“福爾摩斯”破案記
一名研發人的“福爾摩斯”破案記
李洪生
從小我就特別癡迷于各種破案類電視劇和書,比如柯南、狄仁杰、福爾摩斯……驚嘆于他們的推理能力和對破案的熱情。走上工作崗位后,我成了一名GUC無線維護工程師,無意之中也像進入了“破案”現場,抽絲剝繭,透過現象尋找問題的根因,把愛好變成了事業。在這個過程中,除了學習本領守護網絡平安,我還隨著后生命周期產業的變化,經歷了數次轉身和探索。
實戰練習破案基本功
要想快速“破案”,首先得全面掌握各方面的知識,還要有超乎常人的觀察力和洞察力,而這些能力必須在實踐中不斷積累。
2008年4月,我應屆畢業,加入了無線西研GSM大家庭。入職后7個月后從開發部門轉到維護部門,負責語音問題的處理。那個時候的語音問題非常復雜,之前都是由開發的同事負責維護,我到了維護部門后,領導希望我能擋住80%的問題。
印象最深的是2010年初開始的孟加拉A口IP化改造項目。以前無線網元和核心網連接,走的是銅線,而銅線傳輸效率低,成本高。做IP化改造,走光纖網線傳輸,成本就降下來了。這么一改,成本是降了,但整個語音問題復雜度卻直線上升,因為整個語音處理的架構變了。原先在無線側處理的編解碼功能上移到核心網處理;以前單邊的語音處理過程,變成了主被叫相互配合的過程。從手機到基站、到控制器再到核心網,任何一個環節出問題,都可能引起全局的變化。一時間,問題呈爆發式增長,每天都有客戶投訴。
之前處理問題只需要搞清自己的一畝三分地就行,而改造后,如果沒有一個人端到端搞清楚整個語音處理流程,重大問題一來,就只能“歇菜”。
所以,我暗下決心,一定要把整個業務流程摸清楚!接下來,憑借還算自信的自學能力,我一邊繼續手頭工作,一邊找到核心網的設計文檔“啃”起來。整整兩個多月,100多頁上萬字的設計文檔被我嚼了不下十遍,從晦澀難懂到柳暗花明再到漸入佳境,終于把37種組網場景全部背了下來。再后來,面對新問題,我已經可以從全局角度思考,快速定位問題出在哪兒,不管是不是我們領域的都能定位出來。
到2011年末,問題逐漸收斂,那一刻,我感覺整個世界都清靜了。之前所有的辛苦和忙碌都是值得的,不管什么時候,只要肯多學、肯多做,就一定有所得。
破案現場:詭異的兩根線
有了積累,是否就能屢戰屢勝呢?不盡然。快速“破案”的第二個關鍵,就是敢于懷疑,不斷論證。
2012年4月,我收到S國投訴說,有一個區域打電話大概率單通,最嚴重的情況下,每打4個電話,就有1個聽不到聲音。我初步判斷有兩根線連錯了,兩個框之間的連線插錯了端口。
一線同事的辦公地點和客戶房距離較遠,開車需要3個小時,還有安全隱患。他大老遠跑了一趟,檢查后告訴我說連線沒有問題。可我還是隱隱覺得不對勁,于是讓他再去一次,雖然他很不情愿,但還是去了,檢查結果仍然是連線沒問題。
我只好接著定位,找來平臺的同事一起測算,我們的懷疑具體到了可能是哪個板子的哪個端口連線出了問題。
問題投訴的級別越來越高,再次開會討論的時候,代表處的領導全都上線了,我只有破釜沉舟:“請再去一次機房,線都是捆在一起的,很可能捋不出來哪根線插到哪里,線上的標簽也可能貼錯,要帶上剪刀,把扎帶全部剪開,用手一根一根地捋。”
一線的維護經理非常不解:“這個控制器已經交付3個月了,從來沒人動過連線,如果是連線問題,那三個月前就有問題,這么嚴重的問題為什么三個月了都沒人投訴?而且已經去檢查兩次了,都沒有問題,你還說線連錯了,這不是胡扯嗎?”
維護經理的話句句在理,我也沒有足夠的底氣,但還是鼓起勇氣說:“請再去一次,按照我說的方式檢查。”
好在維護經理終于同意了,立刻安排人去現場,拆開捆 綁的線團,一根一根地捋,果然發現有兩根線的確連錯了!線的標簽貼反了,施工人員按照標簽去插線,自然就插錯了。
諸如此類“詭異”的事還有好多,有時候問題可能就發生在我們忽略的一些地方,越是這樣,往往解決起來更難,但解決問題的過程讓人痛并快樂著。
接觸不同類“案子”,做后生命周期產業的多面手
福爾摩斯要想永遠都是“神探”,都要不斷汲取知識,更別說我們了。只有敢于接觸不同的“案子”,探究新的可能性,才能不斷進步。
2017年,我們深耕了6年的語音領域已經非常穩定了,而其他領域,我涉足的機會比較少, 這個時候,一個機會來了。7月,領導找我溝通,問我愿不愿意去印度,交付全球第一個大規模的CloudAir項目。我想,雖然來公司9年,但做的都是非常專業的語音項目,知識面比較窄,聽領導這么一說,我想都沒想就脫口而出“我愿意”!
雖然這是一個全新的領域,但我從小到大都覺得自己學新東西挺快的,所以并沒有犯怵。我很快趕往印度,決心把里面所有的細節和問題都摸個清楚明白,看看到底會有哪些問題。
CloudAir解決方案也叫頻譜共享解決方案,2G、3G、4G都有各自的頻譜,就像廣播、衛星都有自己的頻段,這些頻段不能復用,否則會相互干擾。而現實是,很多運營商的頻譜資源是很有限的,而CloudAir解決方案能實現不同制式間頻譜共享,相當于為運營商節省了大量頻譜資源。可是CloudAir解決方案交付大約要30步,當時工具套路還不成熟,交付起來異常痛苦,誰都沒有把握能把這個項目順利搞定。
剛到一線,我壓力很大,面對新的領域,很多知識都得從頭學習。有時候一線說:“你都四級專家了,這都不懂?”我就坦率地回答:“這個領域我之前接觸的少,我身后還有西安的研發兄弟,我們一起一定能把問題搞定。”
就像一條干涸的小溪遇到奔騰的大海,我抓住一切時間汲取新知識,大學怎么學高等數學,就怎么學交付知識。一邊學,一邊交付,再一邊總結……直到把遇到的所有問題都記下來,然后逐個思考這個問題怎么解決,很快小本本上就密密麻麻記滿了60多個交付中遇到的問題。在一線的四個月,沒有周末的概念,每天想的全是哪個點還不了解,趕快抓緊學。
經過團隊的共同奮戰,上半年的9個重大客戶投訴,下半年迅速收斂到1個。對CloudAir解決方案整體交付結果,客戶很滿意:“沒想到這么復雜的交付方案這么快就收斂了!”對我來說,一線寶貴的交付經驗,也讓我摸清了可能遇到的各種交付問題,回國后我就開始持續進行產品、工具和資料的改進。
終極大案:探索后生命周期運維新模式
2018年底,交付完全球第一個大規模的CloudAir項目后,我又回到了熟悉的維護領域。隨著我守護的GSM產品逐漸進入后生命周期,我們不僅要保障全球海量存量產品的網絡平安,更要不斷地為公司探索后生命周期產品的運維模式,例如現代化改造、平滑退網、自動運維、以及能力持續擴展,跨領域、跨兵種、跨制式等。
生命周期管理與之前的單純維護工作性質發生了很大變化,挑戰比以往更大了,最大的體會就是一定要保持開放和樂觀的心態,積極地擁抱變化。
2019年5月,我們想推動B國某運營商進行控制器現代化改造。起初,產品經理完全不感興趣,溝通時明顯流露出不屑:“現網產品好好的,干嘛要改造?”
為了繼續往前推進,我們根據巡檢和場景庫已有的報告,一遍遍分析B局點,識別出客戶控制器設備老舊、過載、機房分散的問題。
“要是把這些問題的解決和現代化改造結合起來,結果會如何呢?”
這樣的想法為我們爭取到了和產品經理以及客戶對話的機會。客戶點頭認可了我們的建議,但同時也表達了明顯的顧慮:“改造要成本,哪有那么容易?
于是,我們接著從改造技術上深挖,爭取滿足客戶降成本的要求。帶著我們一遍遍優化的方案,經過幾次溝通,事情漸漸出現了轉機。最終,客戶成立了專題組,計劃在三年的時間內,把全網的老舊控制器替換掉。
我喜歡維護和生命周期管理工作,喜歡“破案”帶給我一次次未知挑戰和成就感。如果要問,支撐我一步步推理,摸清所有疑點,找到“案件”真相的原因是什么?那就是:結構思維、抓大放小、深度思考。
結構思維讓我看到全景,抓大放小讓我把有限的精力放到刀刃上,深度思考讓我看到事物的本質。我會在走路、吃飯、坐車……凡是一個人的時候,腦子里不斷地琢磨各種問題。回家后,還會抽時間回憶下當天做的事情,有些還沒想透的問題,就記到紙上,第二天早上從褲兜拿出來看看,找懂的人請教請教。
破案琢磨的過程就是多問幾個“為什么”的過程,問得越淺,解決問題的代價就越大,問得越徹底越深入,抓到問題本質,解決問題的成本就越低。這些也許就是老板說的“思想上的艱苦奮斗”吧!
未來,還會有各種各樣的困難迎接著我,我相信只要思想不懶惰,就沒有什么好怕的,方法總比困難多,只要勤學習、勤思考,總能找到破案的線索,總能找到解決問題的辦法!
本文為《華為人》版權所有,未經允許不得轉載。如需轉載請聯系編輯部hwrb@huawei.com
華為人期刊
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。