CANN 5.0硬核技術搶先看

      網友投稿 620 2025-04-02

      1引言


      2018年9月,CANN 1.0華為昇騰AI使能平臺誕生;

      2020年8月,CANN 3.0版本發布,作為專門面向AI場景的異構計算架構,搭起了上層深度學習框架和底層AI硬件平臺的橋梁,開發效率和性能業界領先,可支撐用戶全方位的人工智能計算訴求。

      在最近一年中,CANN攜手200+所高校/科研所,持續推進AI科研進步;

      在CANN架構加持下,擁有千億參數的盤古AI模型帶來前所未有的商業價值;

      昇騰社區開發者數量從10萬增長到40萬,生態陣營的蓬勃發展…

      2021年12月,CANN5.0版本也將與大家正式見面,通過軟硬件協同優化,該版本將會實現訓練性能再翻倍,憑實力展現AI領域的「中國速度」!

      先放幾個彩蛋,讓大家先睹為快!

      2 核心技術鑄就極致性能

      CANN5.0相比于3.0版本,在典型推理場景,性能可實現30%到140%的提升;大規模集群訓練及常用模型訓練,更可達到性能翻番;

      CANN 5.0性能大幅提升背后的關鍵技術有哪些?

      2.1 任務自動流水

      CANN 5.0硬核技術搶先看

      計算啟動時過長的數據載入操作會阻塞后續計算流水的啟動速度,就好比手機充電電量達到20%才能開機一樣讓人無法接受。

      CANN 5.0將計算指令和數據載入實現多流水并行,該優化允許用戶對載入數據進行分段,當載入數據滿足分段數據量時即刻啟動后續計算邏輯,同時后續數據持續載入,當后續分段數據載入完成且流水空閑時,依次再啟動后續計算,充分發揮昇騰AI處理器多流水并行能力,實現無縫多流水銜接。

      2.2 算子深度融合

      隨著網絡結構的日益復雜,數據在內外存搬運、以及多算子對應多指令帶來的性能開銷已經越發不可忽視。

      CANN 5.0在3.0基礎上識別了更多的融合場景,通過多算子自動融合減少計算節點數,有效減少內存拷貝;并且通過靈活可定制的融合規則讓計算圖中的算子得以最大程度融合,為開發者贏得了更多的計算性能收益。

      2.3 自適應梯度切分

      在大規模集群訓練場景下,通常需要進行成千上萬次迭代計算,每次迭代包括正、反兩個方向的逐層前饋計算。

      大部分同步更新算法要求,在下一輪迭代正向計算開始前,各計算節點間需要同步好梯度數據,完成權重更新。這就會導致在兩輪迭代之間產生等待間隙,即通信拖尾。

      CANN 5.0通過智能梯度切分算法,自動搜索出最優梯度參數切分方式,為梯度傳輸選擇合適的通信時機和通信量,最大限度讓計算和通信并行執行,將通信拖尾時間降至最低,可促使集群訓練達到最優性能。

      2.4 AutoTune智能計算調優

      就像我們不能期待千篇一律的美顏相機能夠修飾出一個絕世美女,類似地,對于不同的網絡,如果全部采用簡單的數據切分策略,往往會導致計算單元無法滿載,性能達不到預期。

      CANN 5.0通過智能化數據切分技術,為網絡量身定制一個最優的切分策略,實現單個計算單元滿載計算,充分利用硬件資源,從而帶來可觀的性能收益。

      同時為了解決調優耗時的問題,CANN 5.0預置了海量模型優化規則,可大大降低調優時長,給用戶帶來卓越的調優體驗。

      3 降低開發者使用門檻

      除了性能上帶來的驚喜,CANN 5.0更是在3.0基礎上進一步簡化了代碼開發和調測方法,助力開發者實現高效AI開發。

      支持模型自動遷移,無需手工修改代碼,一鍵式完成模型移植,即刻暢想昇騰910 AI處理器帶來的澎湃算力。

      支持混合編程,在APP中直接調用算子函數,自動完成編譯加載并執行。

      支持自動生成算子測試代碼,并可一鍵式執行出結果。

      4 使能超大模型,加速創新

      4.1 支持超大參數模型

      近2年來,業界出現了非常多的大模型,例如GPT-3,參數量高達1750億,單獨一個大模型就需要月3TB的存儲空間,而算力需求更是驚人。

      為了解決模型“放得下”的問題,并且以一種友好的、幾乎不用改變原有代碼的方式讓用戶使用,CANN5.0在“AI編譯器”這個層面,在優化器、梯度、權重等各維度進行模型并行訓練。

      通過不同層次的模型并行,將原本放不下的模型,分布式地部署在集群上,并且能夠以較高的算力利用率進行訓練。以83億的Megatron模型為例,從單卡180GB左右的內存需求量降低到16G以下,這樣,超大模型就可以“放得下”了。

      4.2 支持超大圖片計算

      除此之外,在某些應用場景下,還可能遇到超大輸入數據規格的挑戰。

      比如遙感應用領域,往往需要從茫茫大海中定位到一艘船,從廣袤天空里定位到一架飛機,隨著觀測技術的進步,這些遙感圖像的空間分辨率越來越高,平均可達CHW:4*30000*30000甚至更高,單樣本大小往往2-3GB,超大圖片計算已經成為了遙感應用產業發展的「卡脖子」問題。

      CANN 5.0助力武漢大學打造全球首個遙感專用框架LuojiaNet,解決遙感影像“大幅面、多通道”的處理難題。實驗證明,FCN8S模型在處理遙感數據集(圖像分辨率3萬*3萬)時,精度提升顯著。這其中隱藏了大量關鍵技術:

      圖片大,顯存不夠怎么辦?

      充分利用集群優勢,根據數據量和集群規模,完成圖片自動切分,部署到各計算節點。

      特征跨度大,特征丟失,邊緣失真怎么辦?

      在當前切片的卷積運算前,自動計算出具有相鄰切片特征的overlap數據,為當前切片提供上下文信息,保證圖片精度。

      如何高效交換overlap數據?

      借助高效的alltoallv算子在相鄰節點間收發數據,實現無阻塞通信。

      CANN5.0依托自動分解和并行技術,將超大模型的處理同普通模型一樣簡單,相信在CANN5.0版本的助攻下,一定會促使AI產業不斷加速創新,迎來新的爆發期。

      5 ModelZoo全面支持業界主流模型

      ModelZoo是昇騰提供的一個優選模型庫,其裝載的模型能夠直接在昇騰AI處理器上高效執行。目前CANN5.0全面支持包括TensorFlow, PyTorch, ONNX在內的業界主流模型400+,同時算子完備度大幅提升。

      開發者可移步昇騰社區Modelzoo(www.hiascend.com/software/modelzoo)進行體驗。

      6 合眾之力,生態陣營蓬勃發展

      CANN作為人工智能基礎軟件平臺,持續在基礎能力和關鍵技術上不斷突破,但若想走的更遠,唯有合眾人之力。在過去的1年,CANN面向開發者的生態全面展開:

      迄今為止,昇騰社區活躍度較去年提升3倍;當前已匯聚40萬開發者,3千核心開發者,并計劃于2022年發展百萬開發者,1萬核心開發者;累計與超過200家高校研究團隊開展合作,眾智項目貢獻200+個模型及500+個算子。

      聚是一團火,生態建設是使能AI產業持續發展的原動力,通過開發、合作、共贏的方式,CANN將不斷攜手合作伙伴,全方位、多維度支撐AI產業,助力人工智能繁榮發展!

      AI 昇騰

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:將其分成兩個表格(將表格分為兩個)
      下一篇:Excel2010中通過出生日期計算年齡的操作(excel如何通過出生日期計算年齡)
      相關文章
      亚洲精品岛国片在线观看| 亚洲视频在线观看免费视频| 久久久久亚洲AV无码观看| 久久精品国产96精品亚洲 | 亚洲中文字幕无码爆乳av中文| 国产精品无码亚洲精品2021| 亚洲色偷偷色噜噜狠狠99| 亚洲熟妇成人精品一区| 亚洲精品国产av成拍色拍| 亚洲国产欧美日韩精品一区二区三区 | 亚洲第一成年男人的天堂| 亚洲视频精品在线| 日韩亚洲Av人人夜夜澡人人爽| 亚洲综合日韩中文字幕v在线| 亚洲高清日韩精品第一区| 亚洲最大在线视频| 国产成人精品亚洲2020| 亚洲三级在线视频| 亚洲欧洲av综合色无码| 精品国产日韩亚洲一区91| 亚洲精品无码AV中文字幕电影网站 | 亚洲人成人77777网站不卡| 亚洲卡一卡二卡乱码新区| 亚洲一本一道一区二区三区| 亚洲精品无码久久久久A片苍井空 亚洲精品无码久久久久YW | 永久亚洲成a人片777777| 国产国拍亚洲精品mv在线观看| 久久精品亚洲综合专区| 18亚洲男同志videos网站| 亚洲伊人色一综合网| 亚洲一线产品二线产品| 日韩亚洲人成在线综合| 久久久久亚洲av成人无码电影| 黑人精品videos亚洲人| 67pao强力打造67194在线午夜亚洲 | 在线观看亚洲AV每日更新无码| 国产精品亚洲专区无码WEB| 亚洲一区二区高清| 亚洲va中文字幕无码久久| 亚洲欧洲中文日产| 亚洲成a人无码亚洲成av无码|