NVIDIA顯卡硬件技術交流整理
目前萬兆網卡,但是不推薦window平臺,一般使用在服務器,目前是壓縮數據包方式。一個4k/幀大概為4MB
· RDMA技術
對硬件有哪些限制,能否用于以太網絡?
是否依賴網絡帶寬限制,能否達到網絡帶寬的極限傳輸速率?
使用什么協議傳輸數據,是否可靠?
RDMA接收到的數據能否直接被其他進程使用,例如:Unity3D?
單機多卡是否對RDMA的傳輸速率有影響?
答:推薦IB網
· 是否有其他方式可以實現跨工作站的顯存數據共享?
答:暫無,只能底層優化才能解決。
· 硬編碼技術
o 視頻編碼H264、H265能否結合RDMA使用?
答:兩者沒有關系,不能直接硬編碼完碼流直接傳輸到另一臺工作站顯卡內,中間必須過CPU。比如現在海康都沒有這樣的成功案例。國外一個研究機構使用FPGA的工具,直接拍,直接接卡上的芯片,直接PCI傳送出去。吞吐量幾百萬張照片/每秒。
o 目前單卡對H264、H265的編解碼帶寬最高是多少?
答:后續給資料
o 單機多卡對編解碼的帶寬提升是否是倍增,例如:單卡編碼帶寬為160Mbps,雙
卡則為320Mbps?
答:多顯卡編碼芯片均可使用,獨立控制,負載均衡,建議放到一塊CPU上(同一個CPU插槽上管理)
o 顯卡的硬解碼速率是否高于硬編碼,即:硬解碼帶寬高于硬編碼帶寬?
答:看具體使用的芯片
o 顯卡在進行硬編碼、硬解碼時是否會占用顯卡顯存?
答:不看顯存,占用的是CUDA核心(顯卡負載會有變化);專用于硬件碼的推薦Tesla p4(使用在后端),
如果GPU利用率變化不大,可能是你的編碼率不是特別高。
不同顯卡硬解能力不一樣。
o 顯卡硬編碼、硬解碼的分辨率是否有限制,16384?
答:目前最高8K,非標分辨率可能不支持
· 在使用DX執行GPU計算并拷貝數據到內存時,專業卡執行時間穩定,但游戲卡波動較大(1080Ti),游戲卡是否具備動態超頻的特性?
答:專業卡固定頻率運行,游戲卡動態頻率運行,專業卡穩定;(驅動層面差別),游戲卡會出現驅動崩潰、程序卡死、藍屏、最壞是卡燒掉。
N卡游戲卡比A卡數據要好看
Dx的應用在游戲卡上跑,肯定是不如專業卡的
Mosaic拼接在N卡所有功能里面屬于幾個小功能,游戲卡不具備這個功能
· 顯卡是否具有類似于CPU時鐘的功能,可用于跨工作站的幀同步?
答:基于底層開發和利用同步卡進行多工作站同步
單工作站多顯卡
· 使用DX渲染圖形時,如何利用多卡對性能進行提升?
答:多卡是自動做負載均衡的,建議安裝在同一CPU管理的PCI-E插槽
Cuda Nccl GPU多卡優化庫
· 若DX渲染的圖形跨了顯卡,是否對性能有影響,即:一半的圖形在A卡上,另一
半在B卡上?
答:無,多卡是自動做負載均衡的,并發處理的。
· 若使用一張卡(A)做計算,一張卡做渲染(B),當A卡計算完的數據需要拷貝到B卡時,是否需要從系統內存中轉?
答:需要
硬件使用選型
1) P6000可以同時出幾路8K30hz?并且是否可同時進行Mosaic?P6000/5000/4000/2000顯卡如何選擇?
答:可輸出4路8K(dp1.4),并可進行Mosaic拼接,顯卡負載不到100%,目前壓力不大,Nvidia的顯卡DX性能要弱于AMD
2) 雙P6000顯卡性能是否是雙倍提升?
答:雙卡性能提示,后續給網站可查詢官方公布數據,顯存每塊各自占用,并行處理
需補充數據
3) NVIDIA Quadro顯卡單工作站多塊顯卡拼接時是否需要同步卡?
答:需要同步卡,Win10;同步卡主要解決多個顯卡通道的同步;(有可能與軟件也有關系)
4) Mosaic拼接可做的最大分辨率是?
答:linux可做到32K;Windows10,需確認后回復
5) Mosaic拼接和主桌面+擴展桌面兩種模式下相同的使用模式,顯卡壓力是否有區別;
答:顯卡處理方式不一樣,Mosaic壓力變大,更耗資源(整個桌面被拉大,GPU性能吃的更多,多線程與單線程 GPU核心處理上的差異)
6) DP轉成HDMI后進行Mosaic拼接對線材有什么要求?(包括DP轉雙鏈路DVI和DP轉HDMI1.4/2.0)
答:DP轉HDMI需要被動式(只是針對P系列),被動式DVI,目前無推薦品牌型號(最好先接自帶的線再進行轉接)
7) Mosaic拼接后屏幕閃,拼接縫隙撕裂,不同步卡,造成類似問題的原因有哪些?
答:屏幕接口,線材,需實際進行排查測試
8) 對顯卡性能影響最大的因素是?(Mosaic后的分辨率?刷新率?其他等);
答:多方因素,都有影響
9) HP、聯想、DELL的工作站雙顯卡可以不用同步卡?
答:需要,都需要解決通道間的同步
HP、聯想、DELL的工作站是屬于OEM渠道
麗臺是走中國區企業級渠道
10) 驅動是從NVIDIA官網下還是從工作站官網下?版本最新即可?
答:官網,最新
11) 在Win7、Win8.1和Win10中Mosaic后性能不同,是否全是Windows系統自身優化的原因?
答:Windows的毛玻璃,透明效果造成撕裂等,Win10系統更新優化同時,顯卡驅動也和系統做了對接優化,進而提升了性能和效果
12) 顯卡驅動設置中是否有可以的優化的設置?
答:不建議調,可能會對其他程序有影響
13) 自定義分辨率的刷新率高低會對實際的業務應用有多大影響?對顯卡的壓力是否有區別?
答:目前無區別,能測試成功即可
14) Mosaic拼接是否可以使用不同的分辨率來進行Mosaic拼接(AMD專業卡可以,4個通道出來的寬度和高度不一致進行拼接);
答:NVIDIA顯卡要求較高,可給NVIDIA提建議,效果甚微
15) 多工作站,多同步卡分布式投屏的同步性優化建議和方法;
答:可參加CUDA培訓對系統優化
16) NVIDIA是否有出6通道顯卡的計劃(用于拼接屏幕保證通道數量);
答:無,拼接只是NVIDIA的小眾功能
NVIDIA專業卡重點力求通道穩,而不是通道數多,重點在于穩定性。
NVIDIA定位為Ai/機器學習引領這個領域,多屏拼接AMD具有優勢
17) 專業卡的詳細參數哪里查(如,解碼能力,編碼能力能,常見參數都有,但是編碼能力限制查不到);
答:后續給相關資料
18) 驅動顯卡設置介紹,如垂直同步等驅動是否需要做設置?
答:一般不用設置
1)產品對顯卡優化的整體策略:
答:需要提升產品對顯卡性能的利用(完全發揮顯卡的性能),不能單純的升級硬件。這塊國外軟件利用的比較好,國內軟件優化的比較差。
2)目前我們項目上最大的顯存利用到18個G,負載80%左右,產品優化的方向?
答:需要基于CUDA的優化,參加CUDA培訓
1)顯存不夠用的情況下,可以使用物理內存緩沖,減少顯存使用量,減少顯存堆積問題
2)全部調用顯卡核心處理器
顯存滿載,70、80%代表核心沒有全部利用,可能傳輸那個地方存在瓶頸
渲染算法的差別:
1)傳統渲染算法
2)AI算法神經網絡方式分布式渲染
AI算法提速5倍以上,大大降低CUDA計算量和線程使用率(方格圖像算法)
3)A卡與N卡的側重點不一樣:
N卡重點在opengl,同時也支持dx,會考慮均衡
A卡重點在dx
4)A卡、N卡在視頻硬解是存在區別的
可考慮后端方面進行優化,比如硬解
5)P6000,p5000區別
1)P6000->AI算法,深度學習領域
2)p5000Cuda核心數2650??P600Cuda核心數03860
Cuda Nccl GPU分布式并行GPU計算優化庫
5G游戲 Windows
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。