高性能Web動畫和渲染原理系列(2)——渲染管線和CPU渲染(web渲染過程)
示例代碼托管在:http://www.github.com/dashnowords/blogs
博客園地址:《大史住在大前端》原創博文目錄
華為云社區地址:【你要的前端打怪升級指南】
高性能Web動畫和渲染原理系列(2)——渲染管線和CPU渲染一. 高性能動畫二. 像素渲染管線基本渲染流程回流和重繪三. 舊軟件渲染渲染對象(RenderObject)渲染層(RenderLayer)四. 從canvas體會分層優勢不分層的情況分層繪制層的合并五.小結
一. 高性能動畫
動畫的流暢程度通常是以FPS(Frame Per Second,每秒幀率)作為衡量的。在攝像機錄制視頻時每一幀實際上包含了一段時間內的畫面記錄(長曝光攝影的道理相同的),如果畫面里的事物在運動,那么暫停播放時看到的畫面通常都是模糊的,這樣的畫面也被稱為“模糊幀”,加上雙眼“視覺暫留”效果的影響,影視作品一般只要達到24FPS就可以展示出看起來連續運動的畫面;而在頁面的渲染中,每一幀都是由計算機計算渲染出來的精確畫面,幀和幀之間并不存在模糊過渡,所以通常認為需要達到50FPS~60FPS的幀率,才能夠得到較好的觀看體驗。
為了達到盡可能接近60FPS以上的幀率,瀏覽器每一幀的計算和繪制所花費的時間就需要控制在1000/60≈16.6ms以內,根據Google開發者社區提供的資料,開發者最好能夠將所有的工作控制在10ms左右,以便給瀏覽器一些處理內部工作的時間,否則就無法在限定的時間內完成畫面更新,動態的內容就會表現出卡頓,對用戶體驗造成負面影響。下一節就來看一下,在這16ms的時間里,瀏覽器都需要完成哪些任務。
二. 像素渲染管線
基本渲染流程
談起瀏覽器的工作流程,你可能會在大多數文章中見過下面這張圖:
它直觀地描述了瀏覽器如何將HTML文件和CSS樣式文件通過逐步處理最終合成渲染樹并展示在頁面上的過程,當然其中每一步都是非常復雜的,如果你對此還不熟悉,可以通過【瀏覽器的工作原理:新式網絡瀏覽器幕后揭秘】這篇文章進行了解(極力推薦這篇文章!)。但實際上上面的流程里并沒有覆蓋網站的整個生命周期,它只是描述了從用戶獲取到網站首頁和資源文件后到完成首屏渲染這段時間內所做的工作,盡管工作流程幾乎是一致的,但諸如響應用戶的交互動作,在頁面上實現動畫等等內容,只通過上面的宏觀原理圖理解起來還是很困難的。當開發者談及瀏覽器渲染性能的話題時,我們通常會聽到“重排”、“重繪”等術語,實際上它們就是對這后半部分工作的描述,它被稱為“瀏覽器像素渲染管線”,此時就需要祭出Google開發者社區提供的基本原理圖:
編寫在JavaScript代碼中的那些事件-、定時任務等等異步觸發的代碼就會在橙色的部分執行,這部分代碼運行在主線程中,如果有問題的代碼或是執行時間較長的代碼在其中造成了阻塞,后續的幾個步驟就只能等著,這會直接延緩頁面的渲染甚至導致頁面直接崩潰,當JavaScript執行完一個宏任務并清空了當前的微任務隊列后,就會開始UI渲染流程,進入下一個環節。
在Style階段需要找出發生變更的樣式并重新計算相關的尺寸,當然在首屏渲染之前第一次處理CSS樣式時,瀏覽器肯定已經對計算結果進行了緩存,以便在這像素渲染管線處理時節省時間。
計算完樣式本身后,就需要進入Layout階段,重新來計算發生樣式變動的元素應該以怎樣的盒模型尺寸繪制在畫面上的哪個位置,網頁中的基本排版遵循正常文檔流的規則,所以一個元素尺寸變化后,就有可能需要重新計算其父子元素或臨近元素的位置,不難想象這是一個極容易引發蝴蝶效應的環節。完成了Layout布局后,可以看到圖中使用的顏色也發生了變化,因為相對而言它們的開銷就比較輕量了。
Paint階段就是生成像素數據的過程,它會將元素的背景、邊框、陰影等等可見的部分繪制出來,它們可能會被繪制在多個層上。
Composite階段,由于繪制階段生成的畫面可能分布于多個層,那么最終渲染的結果就需要將它們按照一定的順序完成畫面的重疊,這就是瀏覽在合成階段主要的工作,當然這個過程并不一定是由CPU獨自完成的,后面還會講到。當動畫執行時,瀏覽器會不斷創建幀,上面的過程就會反復發生,從而實現幀畫面的不斷變動:
回流和重繪
不同的CSS樣式的性能開銷和造成的影響是不同的,所以上面的像素渲染管路的各個階段并不一定都有工作要做,如果發生變更的元素樣式不會造成布局變化,那么layout階段就不需要做什么工作,如果發生變更的CSS屬性也可以不用重新計算各部分的像素顏色,那么paint階段也就沒有什么工作要做,這樣渲染管路就被簡化成為:
這是我們最期望得到的理想狀態。如果發生變化的CSS屬性導致Layout階段任務量的增加,這類情況就被稱為“回流”或“重排”,如果發生變化的CSS屬性導致了Paint階段任務量的增加,這類情況就被稱為“重繪”,它的開銷相比Layout而言更小,從管線的特征不難明白,“回流”必然會導致“重繪”,但反之則不一定成立。
只通過Composite階段的工作就可以處理的CSS屬性就是opacity(透明度)和transform(變形),它們是各類場景中優先推薦使用的性能最高的特性,transform可以很方便地模擬出位置變化,在可以忽略畫面精度的情況下(例如純色的背景)也可以使用scale來模擬尺寸變化。
所以在滿足需求的前提下,我們當然希望選擇改變性能開銷更小的屬性,以便可以在16ms的時間內完成整個渲染管線的任務,這里所說的性能,通常是指持續修改樣式時的性能開銷,暫不討論低頻的頁面狀態變動。關于CSS屬相詳細的性能開銷,可以在【CSS Triggers】查看詳情,每個瀏覽器的實現上有細微的差別。
opacity和transform的動畫性能開銷最小,并不是因為處理它們造成的影響時工作量減小了,而是因為這兩個屬性造成的影響可以在圖層合成時可以委托給強大的GPU來執行。GPU的基本架構和CPU不同,它擁有更多算術邏輯單元(也就是ALU),這使得它非常適合以并行計算的形式執行計算密集型任務,例如圖形的矩陣變換、人工神經網絡的訓練等等。
而opacity和transform造成的影響,都可以通過改變圖層合成時的參數來進行處理,換句話說就是它可以直接使用之前生成的位圖像素數據的緩存,而不需要再重新計算,也不用更新像素數據緩存,配合上GPU強大的算力,性能自然很能打。
三. 舊軟件渲染
現代瀏覽器多采用軟硬件混合渲染的方式來處理,軟件渲染的方式通常也被成為“舊軟件渲染”(與之相對應的是硬件加速渲染),“舊”只是出現時間比較早,并不表示它已經被硬件渲染所取代。最初的網頁并不是作為完整的應用存在的,而只是用來做一些信息展示,二維渲染的場景居多(因為頁面上大多都是基于“盒模型”的矩形區域和文字包圍盒的計算和繪制),這時使用CPU渲染的性能并不低,“舊軟件渲染”通常使用底層的二維圖形繪制庫,你可以借助HTML Canvas 2D API來類比理解,在canvas畫板上實現的二維動畫,即使在逐幀動畫中進行覆蓋式的全畫布重繪,也能夠保持較高的幀率;對3D圖形學有一定了解的小伙伴都知道,3D渲染引擎只支持點、線和三角形的繪制,所以一個矩形就至少需要2個三角形來表示(當然也可是多個),直觀感覺上就是一種“殺雞用牛刀”的體驗,GPU的算力雖然很牛逼,但通常內存空間非常有限,所以最好只在必要時有節制地使用GPU 。
本節我們先忘掉GPU的加速能力,來看看軟件中需要如何處理頁面渲染。下面以WebKit內核為例來說明一下渲染的基本處理過程以及創建合成層的條件。想要進一步了解的小伙伴可以嘗試閱讀朱永勝的《WebKit技術內幕》一書(不要輕易嘗試,很容易覺得自己不適合搞前端,甚至懷疑人生)。
渲染對象(RenderObject)
在DOM樹解析時,瀏覽器會為可見元素創建一個RenderObject類的實例,用于記錄繪制這個節點需要的一些信息和方法,RenderObject會依據HTML中的DOM結構生成一棵RenderObjectTree,但瀏覽器并沒有直接使用它來生成一張位圖畫面,因為如果這樣做的話,頁面上發生任何變化時,都需要重新計算變更的區域并更新緩存,它的確很節省空間,畢竟只需要緩存一張靜態圖片中各個像素點的顏色數據就可以了,但節省空間的代價就是無法節省時間,這樣的策略會加重重復運算的負擔。
渲染層(RenderLayer)
為了方便處理,WebKit會根據RenderObjectTree來對RenderObject進行按層分類,并最終創建一棵包含多個渲染圖層信息的RenderLayerTree(渲染層樹),兩棵樹中的節點并不是一一對應的,當遍歷RenderObjectTree時,只有符合一定條件的節點(比如獲取了上下文的canvas節點、video節點、具有透明樣式的節點等等,詳細的規則會根據平臺實現不同可能會有變化)會創建出新的RenderLayer節點,而其他的節點只需要添加到祖先節點上已經存在的RenderLayer節點上就可以了。規則如下:
除了根節點以外,一個RenderLayer節點的父親,就是它對應的RenderObject節點的祖先鏈中最近的祖先,且兩者所在的RenderLayer不是同一個。
根據《Webkit技術內幕》一書中的介紹,在軟件渲染中,每一個RenderLayer對象都會有一個后端類,用來存儲該層繪制的結果(但是在硬件渲染中由于合成層的存在,所以并不會為每一個RenderLayer生成后端類),你可以把后端類簡單地理解為結果緩存,CPU會將各個RenderLayer的結果最終渲染為到一張位圖里,然后交給GPU展示,合成的過程也可以在GPU中進行,也就是硬件加速渲染,這里不再展開,但是僅考慮軟件渲染環節的話,RenderLayer樹就已經可以實現目的了。用過photoshop的用戶可能會對分層這種處理形式比較熟悉,它的關鍵點就是在處理有重疊的區域時必須考慮先后順序。
直接看概念可能比較繞,做個簡單的比喻,比如碼農小強的爺爺有自己的房子,然后生了幾個孩子,這些孩子里有的發展的比較好就自己買房單獨住處去了,發展的不太好的只能住在爺爺家里,接著每個孩子又生了一堆孩子,也就是小強這一輩,當然也是發展的有好有差,以碼農小強為例,發展的好的就可以自己買房子住,發展的不好的就得拼爹了,如果他爹有房子,就可以住在爹家,如果很悲劇他爹也沒房子,那他就得和他爹一起住到他爹的爹家里去(說住到墳墓里的你放學別走),RenderObject到RenderLayer的生成過程也是類似的。
四. 從canvas體會分層優勢
Webkit底層的2D渲染使用Skia庫,它是類似于Canvas API的二維圖形繪制庫,為了方便理解軟件渲染的優勢,下面通過Canvas API來看看分層到底帶來了哪些變化,本例中我們先不考慮重新計算布局的情況,僅考慮重繪的工作。以下圖為例(如果不了解canvas動畫繪制,可以參考筆者曾經寫的一篇相關博文【響應式編程的思維藝術 (2)響應式Vs面向對象】):
假設在下面的分析中,地面、天空、山、云和人是分別繪制上去的,人物和云是可以水平運動的,人比山距離觀察者更近。
不分層的情況
在canvas中,使用context.getImageData(x, y, width, height)方法取得畫布上對應矩形區域的像素數據,在不分層的情況下,假設第一次渲染后,使用這個方法將畫布中的像素數據取出來存儲在backUp變量上(像素數據是一個很長的一維數組,按順序逐行存儲著畫面中每個像素點的rgba4個值),也就是只為最終結果建立了一份緩存,此時實際上已經丟失了一部分信息了,例如云和天空、人和天空都有重疊的部分,而重疊部分的像素只保留了最上面一層的值。
當需要繪制逐幀動畫時,問題就來了。人物是運動的,那么程序自然知道下一幀應該將人物繪制在什么地方,但是如果直接繪制,原來的人物仍然會留在圖中,這樣逐幀畫下去,畫面上就會留下一排人物運動的分解畫面,這顯然是不行的;如果把人物先擦掉呢?也是不行的,這樣雖然可以保持畫面上只有一個跑動的人物,但是因為畫面被緩存時,像素已經被覆蓋掉了,如果把人物擦掉,只從緩存的數據中,是無法知道被擦掉的這部分像素點應該被修復成什么樣子的,例如下圖中,緩存中是上一幀的數據復原后的圖,但是如果下一幀人物離開了原位置,原來的畫面就無法利用緩存直接恢復了,例如上圖中紅框中的部分就留下了人物的殘影。
假設在上面的畫面中,人物的大小是100*100,緩存的像素中,其位置是(200,400),假設一幀中它平移了10個像素,那么就可以粗略地認為需要更新的區域是左上角為(200,400),寬110,高100的矩形區域。盡管這個110*100的矩形區域可能只占了整個緩存區域的10%,也就是大部分緩存的像素點還是有效的,但為了修復這部分畫面,程序將不得不重新計算每個對象的繪制結果,然后將這個區域的畫面按照層次重新繪制上去,在上面的示例中,變更區擦除后從下到上依次要繪制天空、山和人物,人物是繪制在最上層的以便可以完整顯示,人物離開后的空白像素也在重繪中被修復。
分層繪制
單幅位圖像素緩存的劣勢其實已經很明顯了,下面再來看看分層的情況,假如上述畫面中的對象分別繪制在不同的canvas畫布上,那么一共就需要5個canvas元素,由于畫布是透明底色的,所以最終顯示結果是疊加而成的。接著為每個canvas層都生成像素數據的緩存,那么在面對同樣的更新場景時,天空、地面、山和云都可以不用操作,而只需要更新人物所在的canvas層,先將受影響的區域擦除,接著重新計算人物的繪制結果并更新單層的緩存,最后將新的結果繪制到目標位置上,相比之下,分層緩存的方案使用了更多的存儲空間來緩存繪制的像素數據,但減少了更新時的計算量,是典型的空間換時間的做法。
層的合并
顯示器上最終呈現的是一幅位圖畫面,所以即使在上面的示例中使用了5個分布在不同層次的canvas標簽,實際上計算機在處理時仍然會對各層的像素數據按層進行合并計算。上面的示例中存在一個很容易發現的優化點,就是無論怎么重繪,實際上山和地面的繪制結果都會擋住對應區域的天空的繪制結果,而且它們都是靜態的,所以天空的緩存數據中,與山和地面重疊的部分實際上沒什么用,如果更新的區域發生在重疊區,那么更新畫面的時候,天空層總是要先繪制一次然后再被更高層的山或者地面覆蓋掉,這時候就可以利用層合并的思想進行優化,也就是直接將天空,山和地面繪制在同個canvas上,它們整體的繪制結果緩存時只需要占用原來1/3的空間(3張位圖變1張了),但對于后續的重繪卻不會造成影響,這樣就可以省掉很大一部分確定沒有用的緩存。當然上面的示例只是比較簡單的情況,在DOM節點渲染結果的處理時有更加復雜的層劃分和層合并的規則,但是優化的思想基本是一樣的。
五.小結
從直接繪制到分層繪制再到層的合并的過程,實際上就是從DOM節點到RenderObject樹再到RenderLayer樹的變換過程,利用canvas的實例就比較容易理解軟件渲染過程中的一些策略了,很多東西你覺得不理解,并不一定是因為它本身有多復雜,只是因為你無法知道它是為了解決什么問題而存在的,實際上當你面對同樣的問題時,可能也會采取類似甚至更好的處理策略,但當我們只看別人描述解決方案時,通常都會感覺到一個東西“特別復雜”或者“特別高大上”,所以請永遠保持謙遜,但也別丟了你的自信。最后分享一個最近很喜歡的冷段子,下一期再見。
問:"從前有一只菜鳥,他特別菜,但是他仍然在飛,請問為什么?"
答:“因為他有一顆勇敢的心!”
javascript
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。