c_learn_2
906
2022-05-29
大家好,我是小林。
很早之前分享過我學計算機網絡和操作系統的心得,詳見:怎么學操作系統和計算機網絡呀?
期間一直有不少讀者問計算機組成原理怎么學,大部分人覺得這個學科跟硬件有關系就非常怕。
計算組成原理確實是分為兩個方向,一個是硬件電路的,一個是軟件程序的。
我自己本身是干開發的,所以我這次分享的機組資料是跟軟化程序有關的,也就是不會涉及到硬件電路的東西,即使你不會數字電路、微機原理也是可以直接學習的。
好了,不多廢話,直接開車了!
學計組有什么用?
我猜應該很多人都有這樣的困惑,就是覺得學計組有什么用?感覺實際工作過程中用不到,感覺理論學了個寂寞。
這個困惑很正常,因為學計組這東西主要是為了搞懂計算機是如何工作的,計算機怎么工作的都是被前輩們實現好的,我們一般也不會參與到造計算機這種工作中。
但是學了計組后,你能看到的視角是和別人不一樣的,而這個不一樣的視角就能在一些關鍵的問題上得到突破。
我這里舉個簡單例子,你覺得下面這兩個 for 循環哪個效率會更高呢?為什么會更高呢?
這個問題的關鍵在于,大家知不知道 CPU Cache 這個東西。
我自己曾經在還沒有學計組的時候,只覺得存儲設備就是我們常見的內存和硬盤,學了后我才發現還有 CPU Cache 這個東西,而能不能充分利用到這個東西,就決定你程序的性能。
CPU Cache 是 CPU 內部的一個緩存,它的讀寫速度遠高于內存,所以它充當內存的緩存角色,當 CPU 要訪問的數據命中了 CPU Cache,就不用去從內存上找數據,就像 MySQL 和 Redis 之間的關系。
CPU Cache 一般會分為三層,分別是 L1 Cache、L2 Cache、L3 Cache ,其中 L1 Cache 和 L2 Cache 是各個 CPU 核心獨立的,剩下的 L3 Cache 是各個核心共享的。
CPU Cache 的數據是從內存中讀取過來的,它是以一小塊一小塊讀取數據的,而不是按照單個數組元素來
讀取數據的,在 CPU Cache 中的,這樣一小塊一小塊的數據,稱為 Cache Line(緩存塊)。
如果 L1 Cache Line 大小是 64 字節,也就意味著 L1 Cache 一次載入數據的大小是 64 字節。
比如,有一個 int array[100] 的數組,當載入 array[0] 時,由于這個數組元素的大小在內存只占 4 字節,不足 64 字節,CPU 就會順序加載數組元素到 array[15] ,意味著 array[0]~array[15] 數組元素都會 被緩存在 CPU Cache 中了,因此當下次訪問這些數組元素時,會直接從 CPU Cache 讀取,而不用再從內 存中讀取,大大提高了 CPU 讀取數據的性能。
CPU Cache 的概念簡單介紹完了,再來說說剛才的 for 循環問題。
我直接說答案:形式一 array[i][j] 執行時間比形式二 array[j][i] 快好幾倍。
之所以有這么大的差距,是因為二維數組 array 所占用的內存是連續的,比如長度 N 的指是 2 的話,那么內存中的數組元素的布局順序是這樣的:
形式一用 array[i][j] 訪問數組元素的順序,正是和內存中數組元素存放的順序一致。當 CPU 訪問 array[0][0] 時,由于該數據不在 Cache 中,于是會「順序」把跟隨其后的 3 個元素從內存中加載到 CPU Cache,這樣當 CPU 訪問后面的 3 個數組元素時,就能在 CPU Cache 中成功地找到數據,這意味著緩存命中率很高,緩存命中的數據不需要訪問內存,這便大大提高了代碼的性能。
而如果用形式二的 array[j][i] 來訪問,則訪問的順序就是:
你可以看到,訪問的方式跳躍式的,而不是順序的,那么如果 N 的數值很大,那么操作 array[j][i] 時,是沒辦法把 array[j+1][i] 也讀入到 CPU Cache 中的,既然 array[j+1][i] 沒有讀取到 CPU Cache,那么就需要從內存讀取該數據元素了。很明顯,這種不連續性、跳躍式訪問數據元素的方式,可能不能充分利用到了 CPU Cache 的特性,從而代碼的性能不高。
那訪問 array[0][0] 元素時,CPU 具體會一次從內存中加載多少元素到 CPU Cache 呢?這個問題,在前面我們也提到過,這跟 CPU Cache Line 有關,它表示 CPU Cache 一次性能加載數據的大小,可以在 Linux 里通過 coherency_line_size 配置查看 它的大小,通常是 64 個字節。
也就是說,當 CPU 訪問內存數據時,如果數據不在 CPU Cache 中,則會一次性會連續加載 64 字節大小的數據到 CPU Cache,那么當訪問 array[0][0] 時,由于該元素不足 64 字節,于是就會往后順序讀取 array[0][0]~array[0][15] 到 CPU Cache 中。順序訪問的 array[i][j] 因為利用了這一特點,所以就會比跳躍式訪問的 array[j][i] 要快。
因此,遇到這種遍歷數組的情況時,按照內存布局順序訪問,將可以有效的利用 CPU Cache 帶來的好處,這樣我們代碼的性能就會得到很大的提升,
CPU Cache 的內容遠不止于我說的這些,還有緩存一致性協議、偽共享、write through 和 write back 的方式等,這些都是非常重要的知識。
計組怎么學?
計算機組成原理會有兩個方向深入的點,一個是面向硬件電路,一個是面向軟件開發的。
我自己本身就是個開發者,所以下面分享的學習資料都是偏向軟件開發點計組原理,對于硬件電路這塊的資料不做介紹,因此不會涉及到數字電路、微機原理等這些課程。
計算機組成原理主要有四大塊內容。
第一大塊,計算機的基本組成,主要包含:
硬件設備組成:CPU、主板、內存、硬盤、顯示器等;
馮諾依曼體系結構:運算器、控制器、存儲器、輸入設備、輸出設備;
計算機性能:CPU 主頻、響應時間、吞吐率
第二塊,計算機的指令和運算,主要包含:
計算機指令:機器碼(編譯 -> 匯編 -> 機器碼、指令格式和跳轉、函數調用和程序棧)、程序的編譯、鏈接、裝載和執行;
計算機運算:二進制編碼(整數、反碼、補碼、浮點數、定點數)、數字電路(門電路、加法器、乘法器);
第三塊,處理器設計,主要包含:
CPU:建立數據通路、面向流水線和設計、控制冒險和數據冒險、分支預測、異常和中斷、并行計算
第四塊,存儲器和 I/O 系統,主要包含:
存儲器的層次結構:SRAM 存儲技術、寄存器、CPU 高速緩存、內存、固態硬盤、機械硬盤;
存儲器和 I/O 系統:虛擬內存、CPU和內存的通信、DMA技術、訪問輸入輸出設備;
CPU 高速緩存:局部性原理、緩存一致性協議、偽共享問題、write through 和 write back;
虛擬存儲:缺頁異常、TLB 加速地址轉化、MMU 虛擬地址和物理地址轉換;
其中第一、第二、第四是對開發者而言是比較重要的內容,而第三部分處理器的設計如果沒時間可以先不用去了解。
別看這些內容很多,就被嚇到了,建議你在學習計算機原理的時候,心里要帶著一個核心的問題去學習:「我們寫的程序是如何在計算機里跑起來的?」
帶著這個問題去學你就不知覺的會把知識點給串起來了,一層層的深入下去,一個知識點一個知識展開。
如果把這個問題能解釋出來,那你對計算機組成原理有了一定的認識了。
計組 - 入門學習
計算機科學速成課
先極力推薦 b 站的《計算機科學速成課》,這個課程是國外錄制的,內容真的是好,視頻的動畫很精美,講課的時候不會很死板,反正就是不看后悔、相見很晚系列。
對于入門計算機組成,可以先看前 10 個視頻,看完這 10 個視頻也就不到 2 個小時,看完前 10 個視頻對計算機的工作方式就有一個基本的了解了。
看完前 10 個視頻就可以開始看書了。
《計算機是怎么樣跑起來》和《程序是怎么跑起來的》
講真,不太建議小白一上來就看那些厚的不行的計算機組成原理的黑皮書,這些書是經典的沒錯,也正是由于它們是經典的,所以這些書的知識體系很全、很多、很厚。
但是這樣很容易讓初學者迷失在里頭,可能剛興致勃勃看幾十頁就放棄了,于是這些厚的不行的書就成為了你們的墊書神器,知識沒學多少,頸椎病倒是治好了。
這兩本不用 1 個月就能看完,因為在看這兩本書的時候,你會看的很順暢,相比學習的心態,你更多的是會帶著「好奇心」的心態去讀。
其中**《程序是怎么跑起來的》是一個「微縮版本」的計算機組成原理**,你可以只選擇看這一本,從這本書的名字也可以知道,它是從計算機是怎么運行程序的視角來講的,然后把涉及到的計算機硬件和它們之間是如何協作的一點一點的給大家帶出來,讓大家能瞬間明白這些計算機硬件的作用。
這本僅僅是入門級別,主要的作用是讓初學者明白計算機組成原理這門課是學什么的,以及梳理主要的知識體系,用了這本書的概念后,在去深入計算機組成的時候,就不會雨里霧里的。
《編碼》
《編碼:隱匿在計算機軟硬件背后的語言》這本書也很不錯,是本科普類的書,非常適合非科班的同學,主要講是計算機工作的原理(二進制編碼、加減法運算、計算機部件、浮點數定點數、處理器等),也就是跟計組息息相關的知識,它的內容很有趣味性,并不想教科書那樣晦澀難懂,絲毫不會讓你感到生硬,讀起來很暢快。
計組 - 深入學習
《計算機組成與設計:硬件 / 軟件接口》
想要深入學習計算機組成原理的同學,我首先推薦《計算機組成與設計:硬件 / 軟件接口》這本書,
這本書確實很厚,差不多 500 多頁,但是**書從來沒有人規定一定要從頭讀到尾,一頁頁的讀的。**重要的不是看完一本書,而是從書上學到多少,解決了什么問題。
大家可以挑這幾個章節看,跟開發者關系比較大的章節:
第一章:計算機抽象以及相關技術,這個章節主要是介紹了計算機組成的思想,可以簡單快讀看,不用重點讀;
第二章:指令,大體上講的是計算機是如果識別和運行指令的,以及代碼到指令的過程;
第三章:計算機的算數運算,介紹的是計算機是如何進行加減乘除法的,以及浮點數的運算;
第五章:層次化存儲,講的是計算機的存儲層次結構,而且重點講的是 CPU Cahe。
計算機組成原理視頻課程
看書覺得很累,也可以結合視頻一起看,這里推薦哈工大的《計算機組成原理》視頻,在 b 站就可以直接看,大家自己去搜索就可以。
看書和看視頻可以相互結合的,比如你看視頻看了計算機指令的內容,然后你可以不用繼續往下看,可以回到一本書上,看書上對應這個章節的內容,這是個很好的學習方法,視頻和書籍相輔相成。
你要是覺得哈工大的計組課程太難,你可以看王道考研的計算機組成原理的視頻課程,同樣 b 站就可以看。
這個視頻雖然是針對考研的,但是也是可以作為學習計組的資料,講的內容不會太深,適合你快速建立計算機組成原理體系,和梳理計組知識的脈絡。
《深入理解計算系統》
另外,在推薦一本《深入理解計算系統》這本書,人稱 CSAPP。
可能大家以為這本書是講操作系統的,我最開始也以為是這樣。后面當我開始啃這本書的時候,發現我大錯特錯,它遠不止我想的那樣。
這本書是從程序員的角度學習計算機系統是如何工作的,通過描述程序是如何映射到計算機系統上,程序是如何執行的,以及程序效率低下的原因,這樣的方式可以讓大家能更好的知道「程序與計算機系統」的關系。
CSAPP 涵蓋的內容非常多,有計算機組成 + 操作系統 + 匯編 + C語言 + Linux系統編程,涉獵的領域比較多,是一本綜合性的書,更是一本程序員修煉內功的指引書。
CSAPP 主要包括以下內容:
信息表示(如何使用二進制表示整型、浮點數等);
C 和匯編語言的學習(通過匯編語言更深入地理解C語言是什么);
計算機體系結構(存儲層次結構、局部性原理、處理器體系結構);
編譯鏈接(C語言如何從文本變成可執行文件、靜態鏈接、動態鏈接);
操作系統的使用(異常控制流、虛擬內存、多個系統調用介紹);
網絡及并發編程(并發的基本概念、網絡相關的系統調用的介紹)。
你會發現有部分內容和《計算機組成與設計:硬件 / 軟件接口》這本書重合了,重合的部分就是重中之重的計算機組成原理知識了,而且內容都是差不多的,你可以看完一本書的內容,然后跳到另外一本看相同章節的內容,多本書的結合可以讓我們更加容易理解。
這兩本書有個區別:
《計算機組成與設計:硬件 / 軟件接口》講的指令格式是 RISC 的;
《深入理解計算系統》講的指令格式是 x86 的;
其他重合的計組知識都大同小異。
CSAPP 的視頻課程是國外老師錄制的,但是在 b 站已經有好人幫我們做了中文字幕,看了這視頻,相當于在國外上了一門計算機課的感覺。
B站地址:https://www.bilibili.com/video/BV1iW411d7hd
如果你是在校生,有了一定 C 語言基礎后,非常建議你就開始看這本書,有精力也可以做做 CSAPP 的 lab。越早開始看,你的收益就越大,因為當計算機體系搭建起來后,你后面再深入每一個課程的時候,你會發現學起來會比較輕松些。
對于已經工作了,但是計算機系統沒有一個清晰認識的讀者,也可以從這本書開始一點一點學起來,這本書是很厚,但是并不一定要把書完完看完,每個章節的知識點還是比較獨立的,有關硬件的章節我們可以選擇跳過。
這就是我學計組的心得啦。
沒學過計租的同學,可以找個時間補補了,提高下自己的「內功」。
干就完啦!
開發者
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。