微認證NAIE AutoML 在硬盤故障檢測上的應用

      網友投稿 863 2022-05-28

      NAIE AutoML 在硬盤故障檢測上的應用

      NAIE平臺AutoML框架具備強大的超參優化引擎、集成學習、可擴展、可復現等關鍵特性,將大大降低機器學習的門檻,顯著提高模型開發的效率。

      AutoML背景

      傳統建模主要痛點:

      門檻高,不穩定 :AI模型構建需要數據科學家的重度參與,建模的效率和模型的效果嚴重依賴建模專家的能力和經驗

      周期長,成本高:建模周期長、模型維護成本高

      專業人才短缺:AI需要大量AI/ML專業人才.

      缺少調參方法:AI/ML模型選擇和調參,尤其是深度學習,完全依靠人力和經驗技巧,費時費力,缺少有效的方法

      AutoML:自動化,降門檻:構建自動機器學習框架(標準化專家最佳實踐,自動化建模過程),提升建模效率,穩定模型質量

      可復制,提高效率:提高算法的可復制性,提高模型的推廣效率

      AutoML技術介紹:方法分類

      AutoML:

      微認證之NAIE AutoML 在硬盤故障檢測上的應用

      機器學習:特征工程,模型選擇和超參優化

      深度學習:神經網絡結構自動搜索和超參優化

      本次課程主要講解機器學習的AutoML

      AutoML技術介紹:自動特征工程:

      數據和特征決定了機器學習的上限,而模型和算法只是逼近這個上限而已

      1.特征編碼:類別特征編碼:onehotEncoder,OrdinalEncoder等

      離散化:K-bins離散化,特征二值化等

      2.特征升維:多項式變化,指數變換,Box-Cox,分位數變換

      a,單特征? b,特征之間

      3.特征降維:

      特征選擇:試圖從原始特征搜索特征的子集,常用有過過濾法,包裝法,基于模型的方法等

      特征投影:將原始特征轉換為新的空間,例如PCA,LDA以及AutoEncoder

      AutoML技術介紹:模型選擇

      配置算法和配置超參

      超參優化算法

      特性介紹-強大的超參優化引擎

      強大的超參優化引擎:

      支持pipeline的超參優化

      支持由數據預處理,特征工程和模型所構成pipeline的超參優化,同時也支持針對模型的超參優化

      支持分布式并行加速

      支持超參的持續學習

      100+50=150

      100+50:第一次運行迭代100次,基于第一次任務再增量迭代50次

      150:最終得到的結果與單次運行迭代150次的結果保持一致

      集成學習:

      單一算法:No Free Lunch

      集成學習:三個臭皮匠頂個諸葛亮

      AutoL特性介紹可擴展

      可擴展

      1.自定義算法模型

      內置通用的幾種算法解決不了所有業務問題

      業務通常由幾個算法組合而成

      2.自定義評估指標

      優化目標要與業務目標保持—致

      業務目標通常與常用的評估指標不一致

      如設備故障檢測場景中,業務指標是滿足誤報率( False alarm rate)<=0.1%情況下,查全率( Fault detection rate)要盡量高。

      3.自定義交叉驗證

      在某些業務中,需要對驗證的毎一折進行操作

      場景應用:分類應用,回歸應用和時序分類應用(重點)

      硬盤故障檢測業務介紹(1)

      1.業務問題

      數據中心硬件故障中有48%為硬盤故障,且在故障發生后才感知,極大影響運維效率和成本

      缺乏有效預測手段,無法提前有計劃進行硬件遷移,硬盤長期處于亞健康狀態影響業務性能;

      2.傳統方案

      當硬盤出現故障后,加入新的硬盤,然后將數據進行恢復。

      硬盤損壞->OSD變化-> CRUSH重新計算-> rebalance->/O增加->影響現網業務

      傳統的方案存在以下缺點:

      1.被動響應:無法提前規劃故障處理窗口,無法避免影響現網業務

      2.數據修復:故障后進行訚雕度數據修復,需要投入大量人力、物力進行數據的恢復

      3.無法預測:無法提前規避故障鄰近時的設備不穩定狀態對業務造成的影響

      硬盤故障檢測業務介紹(2)

      ■AI解決方案

      基于硬盤 SMART特征,通過機器茡習實現硬盤故障提前預測故障時間點,估算欻據修復窗口,梖據負載制定修復計劃,提前進行修復操作

      優點:

      1.主動響應,提前規劃故障處理窗口,將現網業務的影響降到最小

      2.減少大量數據恢復的人力

      3.主動規劃,預測故障時間點,估算數據提前規劃故障的處理窗口,將運維人員被動響應、臨時突發的工作狀態,轉變為主動規劃、統一處理的節奏,提高運維人員的工作生活質量

      ■評估指標

      硬盤Case的業務目標為:FAR<=0.1%,FDR越大越好

      FDR= False detection rate,査全率,即一塊硬盤實際為壞盤,而模型預測為壞盤的概率

      FAR= Fault alarm rate,誤報率,即一塊硬盤實際為好盤,而模型預測為壞盤的概率

      硬盤故障檢測:傳統建模

      step1:數據預處理

      缺失分析:缺失與標簽列的相關性

      如何處理:填充/缺失特征生成/....

      step2:特征工程

      時序特征提取:提取時序的統計特征

      特征選擇:篩選出重要的特征

      step3:模型訓練和評估

      模型選擇:根據經驗選擇模型

      超參選擇:根據數據量和特征數選擇超參

      模型評估:根據業務目標評估模型效果

      機器學習 網絡智能體

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:使用OBSBrowser實現云盤分享體驗
      下一篇:【云端大事件】ASSA實物資產智能盤點,多種盤點解決方案助力企業飛速發展!
      相關文章
      国产成人精品亚洲2020| 亚洲蜜芽在线精品一区| 亚洲一卡2卡3卡4卡5卡6卡| 亚洲第一区视频在线观看| 4444亚洲国产成人精品| 国产亚洲一区二区手机在线观看| 亚洲精品tv久久久久| 亚洲成片观看四虎永久| 亚洲成年人啊啊aa在线观看| 亚洲av成人一区二区三区在线观看| 蜜桃传媒一区二区亚洲AV| 亚洲欧美国产国产一区二区三区| 亚洲日韩一区二区一无码| 亚洲精品无码你懂的| 亚洲AV永久无码天堂影院| 日韩亚洲精品福利| 亚洲日韩在线观看免费视频| 久久久久亚洲AV成人网人人网站| 中文字幕亚洲激情| 国产亚洲人成网站在线观看不卡| 亚洲精品国产字幕久久不卡| 久久亚洲成a人片| 精品日韩亚洲AV无码一区二区三区| 亚洲系列中文字幕| 亚洲综合色7777情网站777| 亚洲区日韩精品中文字幕| 久久亚洲AV成人无码国产最大| 国产亚洲蜜芽精品久久| 久久久久亚洲av毛片大| 亚洲妇熟XXXX妇色黄| 亚洲人成影院在线| 亚洲国产精品无码久久久| 亚洲色图激情文学| 亚洲.国产.欧美一区二区三区| 亚洲国产激情一区二区三区| 中文字幕亚洲乱码熟女一区二区| 亚洲成AV人片在线观看无| 亚洲美女视频一区二区三区| 亚洲首页国产精品丝袜| 国产成人 亚洲欧洲| 中文字幕亚洲不卡在线亚瑟|