IT運維做什么?

      網友投稿 1158 2025-03-31

      一 IT運維的四件要事


      IT服務中最主要也是最基本的服務就是IT運維服務,我們就從這里說起。

      當2014年春節微信紅包派發之際,移動互聯網行業驚呼“微信一個晚上綁定一個億的用戶,干完了支付寶八年的工作”。微信只用一晚上就完成一個億的用戶綁定,按照一晚上8個小時計算,平均每小時微信需要處理1250萬用戶發起的綁定請求,平均每秒鐘微信要處理3472個用戶,同時完成每個用戶的紅包派發流程。凡是參與過2014年微信紅包派發或領取過的人,幾乎都能較為順暢地綁定銀行卡,派發或領取紅包,個人的微信賬號上也能即時顯示每個人所領取的紅包個數和金額等。這套完整的銀行卡綁定和紅包領取流程,用戶的體驗如此完美,其幕后是由一套完備的IT運維服務支撐體系來實現的。這套完備的IT運維服務支撐體系包括強有力的技術平臺,更包括周到的服務流程和應急準備以及以用戶體驗為核心的服務實施。想象一下,正當全民在享受闔家歡樂的祥和春節之際,一臺臺閃著綠燈的服務器在高速地運算著,一位位盡職的運維工程師還在終端前監測著系統的狀態,保障著系統的順暢運行,這些幕后的英雄們創造了又一個移動互聯網的新應用奇跡。

      長期以來人們獲得的一流的IT服務體驗都是由一套完備的IT運維體系來支撐的。這套IT運維支撐體系容易讓人們有一種錯覺,即IT運維服務是以技術為核心的。因為在用戶的眼里,好的IT運維服務總是取決于IT運維服務者技術能力的高低,遇到水平高的工程師常常只需要幾分鐘就能處理完成,而遇到水平低的工程師常常要耐心等上好幾個小時才能解決問題。而這只是事實的一部分,一流的IT服務體驗來自于以用戶服務為核心的戰略,即一個為用戶服務的文化理念、一套標準規范的流程、一套科學有效的服務方法是用戶獲取最佳體驗的基礎,在基礎之上才是技術。我們說當今最具代表性的產品就是蘋果公司的iPhone手機,它為用戶提供的極致體驗是以用戶需求為出發點,借助高科技的創新手段來實現的。

      高效能的IT運維服務者如同一名技藝高超的保健醫生,在用戶眼里是IT技術專家,在內行人眼里是IT服務專家。保健醫生首先是全科醫生,能夠把人當成一個整體來幫助我們預防疾病的產生和治療常見的疾病。IT服務專家正是具備這樣全面的IT系統保健能力,他們能夠把IT技術和IT服務當作一個有機的整體,讓內行人士能感覺到我們有專業的能力為IT系統的健康保駕護航,讓外行人士看到、聽到、感覺到IT服務者能夠在大多數情況下一次性高效率地解決問題。

      那么IT運維服務的主要工作有哪些?這首先要從IT運維服務的目標說起,IT運維服務的簡單目標就是確保所維護的信息化系統安全、高效、平穩地運作。IT服務專家根據這個目標向IT系統使用者提供優質的IT服務,因此IT運維服務人員如做好四件事情,就可以達到事半功倍的效果。四件要事概括來說就是:一是按照IT運維服務的原則做事,IT運維服務的原則即事先講計劃、重承諾,事中講規范、重控制、有反饋,事后重效率、能應急、有保障共八項原則。二是掌握好IT服務的平衡,重點是掌握好主動服務和受理服務平衡的藝術。三是落實信息系統的整體運維服務,信息化系統的整體運維要從做好相關子系統的維護入手,從信息化系統層面來看可分為軟件支撐系統、應用系統、計算機硬件設備以及機房和環境四個子系統。四是將運維服務流程貫穿IT運維過程的始終。IT運維服務流程的核心流程包括:事件流程、問題流程、配置管理流程、變更流程、發布流程。圖1示出了IT運維的四件要事。

      ▲圖1 IT運維的四件要事

      二 IT運維服務的原則

      前面大家了解了IT運維服務的主要工作內容,作為我們IT運維服務者如何做好這份工作呢?運維服務工作看似簡單,不少人認為就是修修電腦、調調軟件等,自比物業,不善總結,結果一年忙到頭,既不被用戶認可也不被老板重視,面對困惑我們多少會問下自己,自己是做得多好呢還是做得少好,是忙點好呢還是閑點好,我們這里要回答:“不!是做到點上才好,怎樣才能做到點上呢?”

      首先是要用心,用心做事才能成功,當然這里面確實有技巧,我們首先要知道IT運維服務的總體原則:事先講計劃、重承諾,事中講規范、重控制、有反饋,事后重效率、能應急、有保障。這幾個方面是相輔相成的,有了計劃才能按照計劃與承諾去開展相關工作,在這個過程中要體現出規范性,并有效控制各種風險,對于服務過程與結果應向用戶進行報告和反饋;同時,整個運維工作應體現出積極的效果,包括運維效率、應急與保障能力等。只有這樣,運維工作才能滿足用戶的需求,并達到預期的效果,實現用戶放心、舒心、開心的目標。

      1 講計劃

      《草船借箭》是我國三國時期的一個故事。周瑜 為陷害*** ,要***在十天之內造好十萬支箭。***算定了大霧之日,便借子敬二十只草船駛往曹營,曹操因疑霧中有埋伏,便令以亂箭射之。待至日高霧散,孔明令收船急回,船輕水急,曹操追之不得,使孔明既安全借得箭,又挫敗了周瑜的暗算,表現了***有膽有識,才智過人。《草船借箭》中***的膽識才智受到后人的贊美,不過我以為諸葛孔明最令人叫絕的是他的這次策劃,因為有這次天衣無縫的策劃,所以胸有成竹,輕輕松松,成績顯著。而策劃用在運維上就是計劃。

      所以,想在運維過程中輕輕松松,又能做到點上,就要重視事先的計劃,計劃來源于和客戶達成的承諾或領導的命令,在整個運維過程中,計劃是整個工作流程的核心,年度計劃(依據服務承諾制定)又是計劃中的龍頭,按照計劃先行的原則,依據本年度工作計劃制定分項工作計劃(如巡檢計劃、監控計劃、培訓計劃等)和時間維度計劃(季度工作計劃、月度工作計劃等),并遵流程、按計劃進行實施和保障。所以,工作計劃是真正運維具體工作的龍頭,它是圍繞實現服務承諾而制定的,各分項工作計劃(如巡檢計劃、監控計劃、培訓計劃等)和時間維度計劃(季度工作計劃、月度工作計劃等),都應以確保實現服務承諾為前提。其中,現場巡檢計劃是運維工作計劃的核心,因為現場巡檢工作具有重要的作用和意義,通過現場巡檢能夠發現系統薄弱環節、關鍵業務節點、存在的隱患,尤其是對制定應急預案及備品備件計劃至關重要。當然,寫得再完美的方案如果不做就等于紙上談兵、水中之月,所以,計劃執行應是重點,企業的成功很多時候是贏在執行,運維體系能否嚴格按照工作計劃執行是運維服務效果能否達標的關鍵因素之一。當然,如果計劃發生變化,那么如何執行也應進行相應更新和變動,以適應工作計劃需要。在運維執行過程中,應嚴格按照流程規范開展運維,并注重控制以降低運維風險。針對運維執行情況,應定期向用戶進行反饋。不過計劃的粗細、時間跨度要依據項目和公司情況而定。

      最后,要將工作計劃的執行效果及運維結果與服務承諾進行對比,對比的結果應作為改進工作計劃的輸入,確保對用戶的承諾能夠達成。在此過程中,運維人員將根據工作需要定期或不定期將運維工作情況向用戶進行反饋與匯報,讓用戶全面了解整個系統運行情況及運維工作情況。因此,總結起來可以說,運維工作執行來源于計劃,受控于流程,輸出于反饋,更新于實踐。

      2 重承諾

      獲得用戶的信任是長期、穩定、深入開展運維工作的基礎和前提,而要獲得用戶的信任,很重要的一點就是講求信用,即重承諾。重承諾是IT運維服務商向用戶提出具體的運維服務承諾,并認真做好運維工作,確保各項運維指標達到標準,從而獲得用戶的信任,讓用戶放心。用戶對運維工作的信任需要長期、耐心、深入地開展工作。

      對于用戶的任何承諾,都應嚴格予以履行,確因特殊原因導致無法履行時,應提前和用戶進行說明和解釋,并獲得對方的諒解。簡單來說,對于用戶不要輕易許諾,而一旦許諾,就要做到。具體體現在以下方面:

      (1)事先和用戶約定服務級別協議(Service Level Agreement,SLA),對于所承諾的服務級別目標應嚴格履行。

      (2)對于給用戶所做的書面或口頭承諾,包括提供的資源、提供的方案、應給與的回復,都應在約定的時間內、按約定的要求予以提供或實現。

      (3)向用戶進行承諾后要認真執行相應的工作任務,確保服務承諾可以達成,重點是給用戶的各種計劃,應按計劃安排予以執行,確需調整應提前向用戶進行說明以調整計劃。

      (4)對用戶做出的書面服務承諾必須達成,當預判對用戶的承諾在既定的時間內可能無法達到時,應提前向用戶解釋,并提出補救措施,以盡量達到服務承諾的標準。

      (5)及時向用戶匯報各項服務承諾達成的情況,讓用戶了解我們對運維承諾的重視和執行力。

      3 講規范

      沒有規矩,不成方圓。運維工作尤其需要注重規范性,講規范就是按照既定的工作流程、禮儀、制度、要求等開展工作,這會讓用戶感受到我們的運維服務是透明的,符合科學流程的。這項工作的價值還體現出服務的一致性,無論用戶在何時向任何運維工程師提出運維服務要求,他們均享受品質一致的運維服務,獲得良好的服務體驗。

      講規范,具有以下好處:

      (1)對于所有運維人員,能夠按照統一的服務規范開展工作,使運維參與者均能形成優良的服務意識,以確保運維服務質量。

      (2)清晰的工作流程能夠使用戶感受到運維服務的專業性、一貫性。

      (3)有效的執行服務流程能夠確保其中的每個角色職責清晰,進而提高運維效率。

      要做到講規范,重點要做好以下工作:

      (1)按照運維管理體系制定完備的運維工作流程,按照流程的角色定義,明確各角色在流程中的職責。

      (2)通過培訓讓全體運維人員熟悉并掌握運維工作規范的要求,通過溝通讓用戶充分理解運維工作流程的執行效果對用戶的重要性。

      (3)運維服務者通過日常工作認真落實各項運維工作流程與規范,借助運維服務管理平臺記錄工作執行的過程與結果。

      (4)運維管理者通過定期匯總分析常見故障和突發事件量及事件完成質量,了解流程規范執行的落實效果,并在此效果基礎上持續改進。

      4 重控制

      重控制是為了控制運維服務質量達到運維服務承諾的要求而開展的工作。主要涉及兩個方面:一是確保運維服務目標按要求達成,二是有效控制運維服務過程中的系統風險。在運維過程中,若不注重控制,將很難保證運維服務結果達到約定的要求,而且,有可能發生一些影響較為惡劣的重大事故,比如業務中斷、數據丟失等。因此,在運維過程中注重控制,將有效規避風險,保障運維服務質量。

      重控制包括關鍵流程節點控制、操作痕跡化管理、變更控制、發布控制、定期回顧并出具服務質量報告等。具體措施包括:

      (1)按照運維服務的特點梳理運維服務流程的關鍵節點,將關鍵節點的日常運維工作文檔化。

      (2)運維過程要體現痕跡化管理,所有事件、變更、發布等環節的處理細節均應被完整記錄下來,作為質量跟蹤的依據。

      (3)對于系統變更,均應受控于變更管理流程;所有變更均應充分評估風險,并在實施前經過嚴格測試,制定好回退機制,確保風險可控的情況下進行變更實施;若因故變更失敗,亦能通過回退機制恢復服務。

      (4)對于系統發布,均應受控于發布管理流程和變更管理流程;所有發布均應提前進行嚴格測試,制定好回退機制,確保風險可控的情況下進行發布實施。在應用部署發布前制定測試方案及運維保障實施方案。

      (5)定期開展事件流程的回顧會議,對于存在的問題或風險進行分析并提出改進措施,并在下一個周期內改善服務質量、規避系統風險,以有效控制整體運維服務質量。

      (6)內部嚴格按照“運維報告機制”進行內部報告和審核,以對相關情況納入跟蹤控制范疇,按照統一口徑進行處理。

      (7)在運維實施過程中定期(如每月或每個季度)進行流程執行過程與結果的檢查與回顧,對于存在的問題或風險進行分析并提出改進措施,可在下一個周期內改善服務質量、規避系統風險,以有效控制整體運維服務質量。

      5 有反饋

      與用戶建立良好的溝通是做好運維服務的關鍵。有反饋主要指運維服務者向用戶及時反饋信息。有反饋就是在做好運維服務的基礎上,讓用戶及時了解我們的工作情況,適當的運維信息反饋給用戶是必不可少的。用戶作為運維服務的消費者也是最終受益者,如果對運維工作不了解或了解不透徹,從某種意義上說是用戶的損失,也是運維服務者對運維服務質量不夠重視的體現。

      向用戶進行必要的反饋,能達到以下目的。

      (1)對于用戶的關切點,包括系統運行狀況、潛在風險情況、運維工作情況等,定期通過書面方式報告給用戶,這充分尊重了用戶的知情權,并且可讓用戶全面了解系統整體情況及運維情況,進而對運維產生信任感。

      (2)對于重大事件的處理進展,定時向用戶進行報告,有利于緩解用戶的緊張和急躁情緒,避免運維工作陷入被動。

      (3)對于用戶提出的需求,按時予以反饋,能讓用戶感到自己的建議和意見獲得足夠的重視,從而建立良好的工作關系。

      做好運維過程中的溝通反饋主要包括以下幾方面。

      (1)定期向用戶出具運維工作情況報告(如周報、月報、年報),向用戶展現系統運行情況、潛在風險分析、隱患發現情況、故障受理情況、其他各類服務情況及運維服務建議等。

      (2)在處理重大事件過程中,按與用戶約定的頻次主動(如每半小時1次)向用戶報告故障的排查情況、處理進展和預計恢復時長等。

      (3)對于各項需要向用戶進行反饋的信息,應事前制定“運維報告機制”,運維服務者都應該按照“運維報告機制”進行內部報告,并有各級管理人員審核,從而可以將相關情況納入內部質量跟蹤控制范疇。同時經過報告和審核的內容要按照報告機制及時向用戶做出口頭或書面等報告。

      (4)對于用戶提出的各類咨詢或服務請求,應在處理過程中及時向用戶報告處理進展或解決建議,積極主動和用戶進行溝通交流。

      6 重效率

      一般來說系統一旦發生故障,用戶往往希望能夠在最短時間內解決,對運維效率提出了很高的要求,盡量減少對業務造成的時間或金錢上的損失。重效率是指在處理各類故障和咨詢服務時,我們始終做到快速響應、迅速處理。這需要運維服務者能夠做到及時響應需求、快速定位故障、安全排除故障。運維服務者如果能夠滿足將重效率和有反饋有效地加以運用,可獲得用戶的充分信賴。

      (1)運維服務者均應樹立“想用戶之所想,急用戶之所急“的觀念,將用戶對解決問題的迫切性放在首要位置。

      (2)運維管理者應該按照科學化的理念測算各類故障級別的平均恢復時長,安排運維工程師對每一個級別的故障排除方案進行反復演練,一旦故障發生能夠熟練地處理故障,快速解決問題,穩妥恢復業務。

      (3)運維質量管理部門通過日常事件處理的服務恢復時長檢查運維事件處理是否能夠達到快速響應和處理的要求。

      (4)建立IT服務管理體系,定期回顧事件處理效率在哪些方面存在改進的空間,定期發起持續改進。

      7 能應急

      對于用戶而言,IT系統僅僅是幫助他們完成業務的工具,只有當用戶使用的過程中出現故障,用戶才會感到運維服務者的重要性。IT運維專家作為IT系統的保健醫生,一方面要預見到系統的故障,另一方面也應該能夠排除故障,這是成為一名IT運維專家的核心要求。對于系統突發的故障,尤其是影響程度高的故障,若能快速應急響應并迅速解決,就會在用戶和我們之間建立充分的信任關系,若所有突發故障均能迅速解決,將使用戶對我們產生信賴感,即在信任的基礎上形成依賴。因此,整個運維服務團隊的應急保障能力至關重要。

      為了體現應急保障能力,可采取以下措施。

      (1)建立應急預案,提前做好各類預判與準備,必要時定期對應急預案進行演練,包括:不同類型事件的應急保障團隊、保障服務方式等,確保一旦突發故障真實發生能夠有條不紊地按照預案進行應急響應和處理。

      (2)配備一定的應急服務裝備,如處理故障的必備工具、排除故障的必需備件、恢復系統的必備軟件、3G無線網卡、精確檢測儀器等,IT運維專家首先是能夠依靠技術手段提升應急保障能力的專家。

      (3)對于信息化系統中包含硬件設備的用戶,我們應該建議用戶儲備必要的備品、備件和備機,一旦突發硬件故障且短時間內無法修復時,能夠利用備品備件先行頂替故障設備,從而盡快恢復業務。

      8 有保障

      運維服務的效果體現為“有保障”,運維隊伍給用戶的感覺簡單來說就是:召之即來,來之能戰,戰之能勝,從而讓用戶對系統放心、對運維放心。如果運維工作是有保障的,就能夠消除用戶的后顧之憂。

      要做到有保障,可采取以下措施。

      (1)通過網絡互動服務、電話服務熱線,現場服務等多種運維服務途徑讓用戶隨時隨地有問題都能夠找到我們。

      IT運維做什么?

      (2)如果IT系統較大或較復雜,運維服務商內部建立起一線、二線、三線的運維梯隊,二線對一線進行支持,三線對二線進行支持;系統開發商、設備供應商都屬于我們的三線支持,必要時能夠給予二線足夠的支持與保障,確保整個運維工作是有保障的。如果IT系統較小或較簡單,運維服務商不一定需要建立完備的一線、二線、三線隊伍,但需要在崗位職責中包含相應的職責,從而確保運維工作流程是閉環的。

      (3)運維服務商內部有完善的軟硬件支撐環境,包括:IT服務管理平臺、電話呼叫系統、網上培訓平臺、全套運維模擬環境、運維協同辦公系統等。

      (4)在重要時期,比如業務高峰期或重點節假日期間制定重點保障預案,嚴格按照保障預案執行,并在結束時向用戶提交重點保障完成情況報告。

      要做好IT運維就要理解這八項原則的要義,如果把IT行業比作江湖,那么知道IT運維需要做什么就是了解江湖的第一課。遵循IT運維服務的原則就好比一門高深的武功,練好武功首先要練好內功,這八項原則就是練好內功的秘籍,練到爐火純青的時候,不但拳腳不能傷其毫發,就用刀劈劍刺亦難傷其毫發。

      三 掌握服務平衡

      IT運維的第一件要事是按照IT運維服務的原則做事,第二件要事就是將這些原則應用到IT運維服務工作當中。IT運維服務工作從服務的發起方來看可以分為主動服務和受理服務。

      我們曾將IT運維專家比作IT系統的保健醫生,保健醫生最重要的能力是“治未病”的能力。在我國關于“治未病”最著名的故事是扁鵲見蔡桓公的故事。有一天,扁鵲進見蔡桓公,在蔡桓公面前站一會兒,說道:“您的皮膚紋理間有點小病,不醫治恐怕要加重。”蔡桓公說:“我沒有病。”扁鵲離開后,蔡桓公說:“醫生喜歡給沒病的人治‘病’,以此作為自己的功勞。”過了十天,扁鵲又進見,他對蔡桓公說:“您的病已到了肌肉和肌膚之間,再不醫治,會更加嚴重的。”蔡桓公不理睬,扁鵲走后,蔡桓公又不高興。過了十天,扁鵲又進見,他對蔡桓公說:“您的病已到了腸胃,再不醫治,會更加嚴重的。”蔡桓公還是不理睬。扁鵲走后,蔡桓公又很不高興。又過了十天,扁鵲再進見時遠遠看了蔡桓公一眼,轉身就跑。蔡桓公特意派人去問他為什么跑,扁鵲說:“皮膚紋理間的病,是燙熨的能力所能達到的;肌肉和肌膚之間的病,是針石的能力所能達到的;腸胃的病,是藥劑的能力所能達到的;病到了骨髓里,那是管轄命的神的事情了,醫生是沒有辦法的。蔡桓公的病現在已到了骨髓,因此我就不再請求給他治病了。”過了五天,蔡桓公身體疼痛,派人去尋找扁鵲,扁鵲已經逃到秦國去了。蔡桓公后來就不治而亡了。

      “治未病”的概念最早出現于《黃帝內經 》,在《素問·四氣調神大論》中提出:“是故圣人不治已病治未病,不治已亂治未亂,此之謂也。夫病已成而后藥之,亂已成而后治之,譬猶渴而穿井,斗而鑄錐,不亦晚乎!”對于IT運維服務而言“治未病”就是主動服務,“治已病”就是受理服務。

      1 主動服務

      主動服務是服務者主動為用戶提供一系列運維服務,其目的是為系統提供防患于未然的維護保養服務,使得系統長期處于一個健康穩定的狀態。主動服務是確保信息化系統安全、高效、平穩運作的有效手段。主動服務還可以讓用戶獲得更好的服務體驗,更好地了解系統的運行狀況和未來需要配備的備機及備件資源等,從而使用戶對服務者產生信賴感。主動服務的形式包括:向用戶提供服務計劃、對IT系統定期巡檢、設計必要的應急預案等。主動服務的工作內容包括:遠程監控、現場巡檢、技術培訓、服務報告、問卷調查等。主動服務完成的效果可以從策略制定、計劃實施、服務評價三個方面進行評價。

      能夠做好主動服務的IT服務者通常是條理性好、目的性強、對IT系統的各子系統了解比較清晰的人。他們會用心地研究IT服務的內容,編制好系統定期養護的計劃。

      2 受理服務

      受理服務是用戶在發生故障時向運維服務者提出服務需求并獲得運維服務的過程,其目的是在信息化系統意外發生故障時得到快速有效的解決,從而減小對業務的影響。受理服務包括受理各類用戶電話請求(故障請求、服務請求、咨詢請求等)、遠程請求和現場服務請求。受理服務標準包含三方面:受理服務分類標準、受理服務處理規范、受理服務效率要求。這些工作將由服務提供商和用戶共同確認,雙方彼此都接受與認可,作為日后執行受理服務的目標與要求。

      服務提供商的資源是有限的,而用戶的需求依據不同的服務類型是有輕重緩急之分的,如何將有限的資源分配給不同類型事件,需要對事件依據一定的策略進行分級,這就形成了受理服務分類標準。在分類標準的基礎上,針對不同類型的事件應有相應的處理規范與子流程,以確保資源得到合理分配,這就形成了受理服務處理規范。而每一事件的處理都有一個完成目標,比如目標恢復時間與目標解決時間,將這些都詳細地一一約定出來,這就形成了受理服務效率要求。這三個部分是有機的整體,也是確保受理服務能夠貼近用戶需求的必要保障。

      (1)受理服務分類標準 對于用戶提出的各類請求,即故障、服務、咨詢及變更等請求(統稱為“受理服務事件”),我們將對其提供的服務稱為受理服務,依據服務提供商在有限資源下,如何最大限度地滿足用戶需求、提升用戶滿意度,我們將受理服務按重要性來進行劃分,重要性主要依據于兩個維度——緊急度與影響度——來判斷,詳見圖2。按照受理服務的重要性可以將服務劃分為若干級(企業可根據自身實際情況劃分等級,推薦為7級),不同級別的受理服務處理的流程與方式也有所不同,因此分類的情況應先取得用戶的認可。

      ▲圖2 受理服務的分類

      (2)受理服務處理規范 受理服務處理規范包括響應時間要求、電話作業規范、事件處理流程三部分,其中:響應時間要求是針對用戶撥入電話的響應速度,將用戶的等待時間限定在一定范圍內;電話作業規范主要約定了電話用語,以使用戶感到整個受理服務過程是熱情、專業、規范的;事件處理流程規定了事件從受理開始到受理結束應經歷的過程,以確保每一事件的服務質量。

      (3)受理服務效率要求 受理服務的效率要求包括目標恢復時間要求與目標解決時間要求,依據受理服務分類與事件類型確定了每一類、每一級事件的目標恢復時間與目標解決時間。

      能夠做好受理服務的IT服務者通常是在平時注意積累與IT運維服務相關知識并且學以致用的人,所以他們在遇到IT故障時可以從容不迫地解決系統的故障,同時還能處理好用戶的情緒。

      3 服務的平衡

      好的IT運維服務能為IT系統提供全方位的維護保養,IT運維專家能夠把IT技術和IT服務當作一個有機的整體,為IT系統安全、高效、平穩的運作而保駕護航。我們將IT運維服務比作保健醫生,那么保健醫生既要能夠“治未病”,也能夠“治已病”。在運維服務工作中,主動服務相當于為IT系統“治未病”,受理服務相當于為IT系統“治已病”。這兩項服務工作都要做,并且要做好!那么主動服務和受理服務在實際工作中的占比應該是多少呢?這需要根據每個企業的實際情況和用戶對IT系統維護的需求而定。

      在現實情況中,我們遇到很多主動服務和受理服務占比不合理的例子。比如當企業的IT系統處在建設期剛結束、運維期剛開始之際,運維人員沒有提前在系統建設期做好準備,沒有及時介入到系統運行的保障當中,那么就容易出現手忙腳亂的局面,疲于應付受理服務而無暇顧及主動服務。要避免這樣的情況發生,最好在系統規劃時期對IT系統的運維需求進行調研,并對IT系統的運維指標進行預先規劃。規劃的主要內容包括運維服務工作量的測算,運維服務中涉及的運維范圍,運維服務中涉及的各子系統的技術資料,以及運維期預測產生的資源需求等。一旦在系統規劃期對運維服務進行了同期規劃,那么在系統建設期能夠及時考慮運維服務的具體需求必然順理成章。當系統建設期進入后期,運維服務團隊及時介入到建設期的收尾工作中,將有利于IT系統平穩順暢地過渡到運維服務期。由于提前介入,運維服務團隊可以有效地開展主動服務工作,切實起到為系統保駕護航的積極作用。進入運維期,按照主動服務的工作內容(主動服務的工作內容包括:遠程監控、現場巡檢、技術培訓、服務報告、問卷調查等)與用戶進行溝通確定當期重點需要執行的主動服務項目,將主動服務工作落實到位。

      主動服務雖然能夠最大限度地防患未然,但不能保證系統不出現意外的故障。比如,系統設備由于使用年限的問題,出現自然老化的現象,系統設備因此產生故障,這就需要我們在受理服務工作上提供必要的保障,確保故障出現時能夠快速響應用戶需求,及時恢復服務。因此受理服務的工作量和工作質量也是衡量運維服務是否達到優良的重要指標。因為主動服務和受理服務的平衡是用戶滿意不可或缺的兩項工作。這就好比武俠小說中的雙劍合璧,所向披靡,如圖3所示。

      ▲圖3 掌握服務平衡

      4 落實整體運維

      IT運維的第一件要事是按照IT運維服務的原則做事,第二件要事是將這些原則應用到IT運維服務工作當中,第三件要事是將運維落實到整個技術系統的每個環節中。為了方便讀者理解,我們將常見的系統抽象為四個子系統來一一介紹,它們分別是軟件支撐系統、應用系統、計算機硬件設備和機房及環境。

      (1) 軟件支撐系統運維 軟件支撐系統是指為應用軟件運行條件的軟件環境包括操作系統、編譯程序 、數據庫管理系統 、中間件、各種高級語言等。如:針對信息系統服務器上部署的操作系統(如Windows、AIX、LINUX、HP)、數據庫(如DB2、Oracle、SQL Server)、中間件(如WebSphere)、數據傳輸軟件(如MQ)等,主要運維工作是提供日常例行檢查、故障排除、系統軟件升級、定期巡檢、數據庫性能調優、系統與中間件部署、系統軟件維護培訓等運維服務。

      (2) 應用系統的運維

      應用系統是指為特定用途所開發并可在生產環境執行的一個或多個應用程序,以及和程序一起產生的數據信息。

      應用系統運維主要包括日常性維護、糾錯性維護、適應性維護、完善性維護、操作性指導和技術培訓、數據完整性維護及數據分析等。日常性維護:信息系統軟件運行狀態監控、日常檢查、故障診斷與排除、日志管理、定期備份、垃圾信息清理、技術支持等日常性工作。糾錯性維護:修正信息系統可能存在的軟件缺陷和錯誤以及其他未曾預見的錯誤等。適應性維護:適應硬件環境和系統軟件的變化而進行的性能檢測調優、系統優化、配置變更等局部性修改。完善性維護:為擴充功能和改善性能而進行的一般性修改。操作性指導:為用戶正常開展業務而提供的操作指導或幫助,指導用戶按運行要求開展業務,并解答用戶提出的各類咨詢。技術培訓:定期組織行業用戶進行與信息系統應用操作與維護相關的技術培訓,提升用戶操作與維護技能。數據完整性維護及數據分析:應用系統安全性維護(安全保障的設備或系統軟件,包括防火墻、入侵防范系統、安全審計系統、防病毒系統、終端安全管理系統等),信息內容服務型維護(包括信息采集、整理、編輯、制作、發布、挖掘、分析和安全管理等)。一般來講,整個運維工作的核心是應用系統的維護,也是最難的部分,特別是對第三方運維商來說。

      (3)計算機硬件設備的運維

      計算機硬件設備是指計算機系統中由電子、機械和光電元件等組成的各種物理裝置的總稱。這些物理裝置按系統結構的要求構成一個有機整體為計算機軟件運行提供物質基礎。簡言之,計算機硬件的功能是輸入并存儲程序和數據,以及執行程序把數據加工成可以利用的形式。從外觀上來看,微機由主機箱和外部設備組成。主機箱內主要包括CPU、內存、主板、硬盤驅動器、光盤驅動器、各種擴展卡、連接線、電源等;外部設備包括鼠標、鍵盤、顯示器、音箱等,這些設備通過接口和連接線與主機相連。

      計算機硬件設備的運維包括針對PC電腦、平板電腦、服務器、存儲設備、網絡交換機以及其他計算機控制設備提供定期巡檢、定期保養、故障診斷與排除以及備件的更換等運維服務。

      (4)機房及環境的運維 計算機機房普遍指的是電信、網通、移動、雙線、電力以及政府或者企業等存放服務器、為用戶以及員工提供IT服務的地方。

      機房環境監測系統是一個綜合計算機網絡技術、數據庫技術、通信技術、自動控制技術、新型傳感技術等構成的計算機網絡,提供一種以計算機技術為基礎、基于集中管理監控模式的自動化、智能化和高效率的技術手段,系統監控對象主要是機房動力和環境設備等設備(如配電、UPS、空調、溫濕度、漏水、煙霧、視頻、門禁、防雷、消防系統等)。

      機房及環境的運維主要針對機房中比較重要的設施(如配電、UPS、空調、溫濕度、防水、煙霧、視頻、門禁、防雷、消防系統等)進行全天候不間斷的監控與預防性維護。

      5 貫穿始終的服務流程

      IT運維的第四件要事是將服務流程貫穿于IT運維過程的始終。IT運維服務流程的核心流程包括:事件流程、問題流程、配置管理流程、變更流程、發布流程,如圖4所示。

      (1) 事件流程 事件是指IT系統運行中,發生的任何不符合標準操作且已經引起或可能引起服務中斷和服務質量下降的IT系統故障。事件處理流程涉及許多IT部門和IT方面的專家。首先是服務熱線,服務熱線(一線)作為事件的受理責任人,確保首問負責制的流程在整個IT運維服務流程中貫穿實施。當服務熱線不能解決發生的事故時,就將其轉移給二線技術支持小組。二線技術支持人員首先需要提供臨時性的解決辦法或補救措施,以盡可能快地恢復服務,避免影響用戶正常業務的開展。然后二線技術支持人員分析事件發生的原因,制定解決方案以徹底恢復服務和業務的正常運行。

      ▲圖4 貫穿始終的服務流程

      (2) 問題流程 問題是指存在某個未知的潛在原因導致一起或多起事件發生。問題經常是分析多個呈現相同癥狀的事件后發現的某種狀態。問題也可以從單個重要的事件中確認一項錯誤。這種錯誤產生的原因雖然未知,但其產生的影響卻可能非常嚴重。問題流程負責解決IT運維運營過程中遇到的所有問題。問題流程包括問題管理和問題控制,其目標在于將由于IT基礎架構的錯誤而導致的問題和事件對業務產生的負面影響減小到最低,以防止與這些錯誤有關的事件再次發生。為了實現這個目標,問題流程調查分析事件的根本原因后采取有關行動改進或糾正這種狀態。

      (3) 配置管理流程 配置管理是指識別和確認IT系統的配置項,記錄和報告配置項狀態和變更請求,檢驗配置項的正確性和完整性等。配置管理流程就是有關如何管理和及時提供準確可靠的IT基礎架構配置信息等活動構成的流程。配置管理不僅僅提供單個IT組件的信息,它還提供有關各個配置項之間關系的信息。這些信息是對IT系統故障影響程度分析的基礎。配置管理流程負責記錄有關IT基礎架構的變更情況,監控IT組件狀態,確保服務管理人員可以清楚地了解各個版本配置項的信息。

      (4) 變更流程 變更是指在維護過程中對IT系統或服務所做的各種改變,包括增補、移除和其他修改。變更流程包括變更處理和變更控制,該流程旨在將有關變更對服務級別承諾中的運維服務績效指標達成而產生的沖突和偏離減小到最低程度。變更流程的實施以變更請求、配置管理數據庫和變更實施進度表為基礎,經過登記變更請求、篩選和接受變更請求、確定優先級和歸類變更請求、制定變更實施計劃、實施變更、評價和終止變更、處理緊急變更和變更活動之后,產生變更管理報告等管理信息。

      (5) 發布流程 發布流程是對經過測試后導入實際應用的新增或修改配置項進行分發和宣傳的管理流程。發布流程涉及到已經定義的IT服務的變更,這些變更通過對一些新應用軟件與升級硬件或新硬件的結合使用來完成。發布流程和變更流程、配置管理流程是緊密結合的,當新發布引起IT基礎架構的變更時,配置管理數據可進行實時的更新,同時發布的內容也要保存到最終軟件庫中。

      本文節選自《IT運維之道》

      內容簡介

      希望本書的有關內容能夠成為IT從業者或即將從事IT運維服務者的指引,為成功遨游于IT運維服務領域奠定基礎。

      李鵬,北京中煙信息技術有限公司,中國信息技術服務標準技術委員會專家,IT運維實驗室行業專家,ISO20000國際認證管理師,從事IT安全及運維管理工作近二十年。近年致力于提升中國本土企業IT治理水平,堅持倡導運用國際先進的IT服務管理理念,結合企業實際開展IT系統的安全及運維管理。

      本文轉載自異步社區

      網絡

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:excel2010表格樣式如何設置(excel中設置表格樣式)
      下一篇:word怎么設置橫向排版
      相關文章
      国产精品亚洲片夜色在线| 亚洲男人av香蕉爽爽爽爽| 狠狠综合久久综合88亚洲| 亚洲AV无码乱码在线观看性色扶| 亚洲欧美国产国产一区二区三区 | 国产成人亚洲精品播放器下载 | 亚洲精品国产品国语在线| 国产亚洲精品国产福利在线观看| 亚洲AV成人精品一区二区三区 | 亚洲AV无码成人专区片在线观看| 久久亚洲成a人片| 亚洲成人在线电影| 亚洲国产美国国产综合一区二区| 亚洲高清在线视频| 久久精品视频亚洲| 亚洲AV日韩精品久久久久久久| 亚洲国产天堂在线观看| 亚洲美女一区二区三区| 久久久久亚洲精品日久生情| 精品亚洲A∨无码一区二区三区| 亚洲视频一区在线播放| 亚洲人成网站18禁止久久影院| 亚洲人成网站日本片| 亚洲中文字幕无码亚洲成A人片| 亚洲精品无码成人| 亚洲Av无码乱码在线znlu| 亚洲成a人在线看天堂无码| 中文字幕在亚洲第一在线| 亚洲av中文无码乱人伦在线咪咕| 亚洲国产高清视频| 亚洲成人黄色网址| 亚洲中文字幕久久久一区| 色噜噜的亚洲男人的天堂| 亚洲天堂在线视频| 亚洲av中文无码乱人伦在线播放| 久久久亚洲裙底偷窥综合| 亚洲综合精品成人| 亚洲色偷拍区另类无码专区| 国产精一品亚洲二区在线播放| 91天堂素人精品系列全集亚洲| 久久精品国产亚洲AV久|