Tungsten Fabric SDN — SmartNIC vRouter
1117
2022-05-29
我們已經成功地應用了人工智能和機器學習來自動化傳統的人工任務和IT操作過程。從異常檢測到自動修復,現在將前沿算法融入到易于使用的工具中,允許組織通過從時間消耗和容易出錯的過程中解放人力簡化操作。
運維人員可能需要幾個小時才能完成的事情,基于AIOps只需幾秒鐘就能完成,而且精度更高。這正被世界500強企業所認可,這些企業正在迅速采用這些技術,以及Gartner等領先的分析師公司,這些公司越來越關注這個問題。在過去幾年中,為了應對數字化轉型給企業帶來的日益增加的系統復雜性,市場上也出現了很多AIOps或者ITOA的產品。
1??????AIOps VS ITOA
正如Flercher所解釋的那樣,AIOps本質上是技術的演進,這些技術以前被歸類為IT運營分析。雖然AIOps與ITOA非常相關,但它代表了一組相當廣泛的功能,主要集中于分析IT操作數據,包括監控、日志分析、安全等。ITOA領域的供應商包含來自CA、EMC、Solarwinds和Zenoss等廠商,但他們在其核心ITOA產品中沒有這種原生的機器學習能力,因此這些廠商并不算是AIOps。
AIOps平臺接收從不同數據源發送過來的IT日志數據,并應用各種形式的算法。通過使用AIOps平臺,IT組織可以實現運維自動化并提升運維實踐,并對其業務服務的性能進行持續的洞察。
2??????AIOps是否重要?
在這篇論文中,?“Applying AIOps to Broader Datasets Will Create Unique Business Insights”?Gartner報告說,2015年全球AIOps支出超過$ 17億。此外,到2020年,大約50%的企業將積極使用AIOps平臺來提供對業務執行和IT運營的洞察,而今天還不足10%。
隨著企業在數字化轉型的過程中經歷了巨大的變化和擴張,企業將被迫在加大運營人數或采用AIOps平臺之間做出選擇。
3??????AIOps平臺關鍵部件
Gartner在論文中描述了AIOps平臺的邏輯架構?“Innovation Insight for Algorithmic IT Operations”,這里我們使用一個簡化的版本以理解AIOps平臺的不同部分如何適合您更廣泛的IT運營需求。
從眾多大公司的IT運維實踐中可以看到,一個企業級IT運營工具鏈的關鍵部件包括:監控生態系統、一個智能檢測系統、一個工單與知識管理系統、一個自動化系統和一個數據湖。
監控生態系統,提供可視化和創建跨物理和虛擬堆棧的日志收集能力。這些工具包括AppDynamic至Solarwinds。一個好的日志收集平臺對于提升運維服務質量非常重要,但是過度負責的日志收集系統有時也會帶來大量的數據噪聲影響IT團隊的工作效率。
數據智能檢測系統,降低數據噪音,實時將分析結果推送給相關運維人員。這是運營團隊在響應運維事件時的第一選項。事實上,運用智能檢測系統能夠讓你在第一時間知道系統內發生了哪些預料之外的問題,并且在最短時間內告訴你如何消除影響,通過應用機器學習和實時計算,智能檢測系統可以做到早發現早響應,比如Moogsoft AIOps
工單與知識庫實現用戶對IT需求的交互式響應,以及IT服務的文檔化管理,通常我們用工單管理所有的問題單,并且會綁定資產庫和服務目錄以及案例庫,從而實現知識積累和能力的不斷提升。之類系統包括諸如ServiceNow和Jira。
自動化系統可以根據具體事件自動應用腳本,以便減少繁重的重復性的勞動。常見的動作包括編排、運行庫自動化和IT自動化。自動化系統包括ansible和Puppet等工具。
最后,數據湖用于故障診斷、ad-hoc查詢以及監控儀表盤。數據湖應包含所有與IT系統相關的數據和日志,數據湖對進行更深入的分析至關重要。數據湖工具包括Splunk版本和ELK。
4??????AIOps平臺是IT運營的下一代解決方案
IT平臺的復雜度和集成度將繼續以指數級增長,而人的能力相對保持不變,從而變成制約業務發展的內在原因,而AIOps可以真正提升運維效率,提升洞察力,讓運維人員關注真正需要關注的事情-用戶滿意度
AI
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。