久久亚洲精品国产亚洲老地址,亚洲AV永久纯肉无码精品动漫,亚洲国产成人久久一区WWW

性能基礎之理解 Linux 系統(tǒng)平均負載和 CPU 使用率

網(wǎng)友投稿 1040 2022-05-28

前言

什么是系統(tǒng)平均負載？

一個類比

多處理器和多核系統(tǒng)

CPU使用率

注意輸入/輸出（I/O）操作

一些技巧

前言

什么是系統(tǒng)平均負載？

一個類比

多處理器和多核系統(tǒng)

CPU使用率

注意輸入/輸出（I/O）操作

一些技巧

前言

做為一個性能測試工程師，每當我們發(fā)現(xiàn)計算機變慢的時候，我們通常的標準姿勢就是執(zhí)行 uptime 或 top 命令，來了解系統(tǒng)的負載情況。

比如像下面這樣，我在命令行里輸入了 uptime 命令，系統(tǒng)會返回一行信息。

appletekimbp:~ apple$ uptime 20:44 up 21 days, 6:41, 2 users, load averages: 2.85 2.33 2.91

但我想問的是，各位同學知道以上每列輸出的含義嗎？

20:44 # 當前時間 up 21 days, 6:41 # 系統(tǒng)運行時間 2 users # 正在登錄用戶數(shù) # 系統(tǒng)的平均負載，分別是1分鐘、5分鐘、15分鐘內(nèi)系統(tǒng)的平均負載 load averages: 2.85 2.33 2.91

這行信息的后半部分，顯示 “l(fā)oad average”，它的意思是"系統(tǒng)的平均載荷"，里面有三個數(shù)字，我們可以從中判斷系統(tǒng)負載是大還是小。

什么是系統(tǒng)平均負載？

我猜一定會有同學會說，平均負載不就是單位時間的 CPU 使用率嗎？上面 2.85，就代表 CPU 使用率是 285%。其實不是這樣的。

CPU 負載值在 Linux 系統(tǒng)中表示正在運行，處于可運行狀態(tài)的平均作業(yè)數(shù)（讀取一組與流程執(zhí)行線程對應的機器語言的程序指令），或者非常重要，休眠但不可中斷（不可交錯的休眠狀態(tài)））。也就是說，要計算 CPU 負載的值，只考慮正在運行或等待分配 CPU 時間的進程。不考慮正常的休眠過程（休眠狀態(tài)），僵尸或停止的過程。

簡單來說，平均負載是指單位時間內(nèi)，系統(tǒng)處于可運行狀態(tài)和不可中斷狀態(tài)的平均進程數(shù)，也就是平均活躍進程數(shù)，它和 CPU 使用率并沒有直接關系。

進程狀態(tài)代碼

R 正在運行或可運行（在運行隊列中）

D 不間斷休眠（通常為IO）

S 可中斷休眠（等待事件完成）

Z 失效/僵尸，終止但未被其父

T 停止，由作業(yè)控制停止信號或因為它被追蹤

[…]

這里先解釋下，可運行狀態(tài)和不可中斷狀態(tài)。

可運行狀態(tài)的進程，指的是正在使用CPU或者正在等待CPU的進程，也就是我們常用 ps 命令看到處于 R 狀態(tài)（Running 或 Runnable）的進程。

不可中斷狀態(tài)的進程，指的是正處于內(nèi)核態(tài)關鍵流程中的進程，并且這些流程是不可打斷的，比如常見是等待硬件設備的 I/O 響應。也就是我們在Ps 命令看到的D狀態(tài)(Uninterruptible Sleep，也稱為 Disk Sleep）的進程。

比如，當一個進程向磁盤讀寫數(shù)據(jù)時，為了保證數(shù)據(jù)的一致性，在得到磁盤回復前，它是不能被其他進程或者中斷打斷的，這個時間的進程就處于不可中斷狀態(tài)。如果此時的進程被打斷，就容易出現(xiàn)磁盤數(shù)據(jù)與進程數(shù)據(jù)不一致的問題。

所以，不可中斷狀態(tài)實際上是系統(tǒng)對進程和硬件設備的一種保護機制。

因此，我們可以簡單理解為，平均負載其實就是平均活躍進程數(shù)。平均活躍進程數(shù)，直觀上的理解就是單位時間內(nèi)的活躍進程數(shù)。

既然平均的是是活躍進程數(shù)，那么理想的是，每個CPU上都剛好運行著一個進程，這樣每個CPU都得到了充分利用。

以下是單核處理器計算機中不同負載值的含義：

0.00：沒有任何作業(yè)正在運行或等待 CPU 執(zhí)行，即 CPU 完全空閑。因此，如果正在運行的程序（進程）需要執(zhí)行任務，它會向 CPU 請求操作系統(tǒng)，并立即為該進程分配 CPU 時間，因為沒有其他進程在競爭它。

0.50：沒有任何作業(yè)在等待，但 CPU 正在處理以前的作業(yè)，并且它正在以 50％的容量進行處理。在這種情況下，操作系統(tǒng)還可以立即將 CPU 時間分配給其他進程，而無需將其置于保持狀態(tài)。

1.00：隊列中沒有作業(yè)，但 CPU 正在以 100％的容量處理先前的作業(yè)，因此如果新進程請求 CPU 時間，則必須將其保留到另一個作業(yè)完成或當前 CPU 插槽時間（例如，CPU tick）到期，操作系統(tǒng)決定哪一個是下一個給定的進程優(yōu)先級。

1.50：CPU 工作在其容量的 100％，15個工作中有5個請求CPU時間，即 33.33％，必須排隊等待其他人耗盡他們分配的時間。因此，一旦超過1.0 的閾值，就可以說系統(tǒng)過載，因為它不能立即處理所請求的 100％的工作。

性能基礎之理解 Linux 系統(tǒng)平均負載和 CPU 使用率

那么很顯然，"load average"的值越低，比如等于0.2或0.3，就說明服務器的工作量越小，系統(tǒng)負載比較低。

一個類比

上面還看太懂怎么辦？沒事，我們來看一個簡單的類比例子。

先假設最簡單的情況，你的計算機只有一個 CPU，所有的運算都必須由這個 CPU 來完成。

那么，我們不妨把這個 CPU 想象成一座大橋，橋上只有一根車道，所有車輛都必須從這根車道上通過。（很顯然，這座橋只能單向通行。）

系統(tǒng)負載為 0，意味著大橋上一輛車也沒有。

系統(tǒng)負載為 0.5，意味著大橋一半的路段有車。

系統(tǒng)負載為 1.0，意味著大橋的所有路段都有車，也就是說大橋已經(jīng)"滿"了。但是必須注意的是，直到此時大橋還是能順暢通行的。

系統(tǒng)負載為 1.7，意味著車輛太多了，大橋已經(jīng)被占滿了（100%），后面等著上橋的車輛為橋面車輛的 70%。以此類推，系統(tǒng)負載 2.0，意味著等待上橋的車輛與橋面的車輛一樣多；系統(tǒng)負載 3.0，意味著等待上橋的車輛是橋面車輛的 2 倍。總之，當系統(tǒng)負載大于 1，后面的車輛就必須等待了；系統(tǒng)負載越大，過橋就必須等得越久。

CPU 的系統(tǒng)負載，基本上等同于上面的類比。大橋的通行能力，就是CPU 的最大工作量；橋梁上的車輛，就是一個個等待 CPU 處理的進程（process）。

如果CPU 每分鐘最多處理100個進程，那么系統(tǒng)負載0.2，意味著CPU在這 1 分鐘里只處理 20 個進程；系統(tǒng)負載 1.0，意味著 CPU 在這 1 分鐘里正好處理 100 個進程；系統(tǒng)負載 1.7，意味著除了 CPU 正在處理的100 個進程以外，還有 70 個進程正排隊等著CPU處理。

為了計算機順暢運行，系統(tǒng)負載最好不要超過 1.0，這樣就沒有進程需要等待了，所有進程都能第一時間得到處理。很顯然，1.0 是一個關鍵值，超過這個值，系統(tǒng)就不在最佳狀態(tài)了，你要動手干預了。

多處理器和多核系統(tǒng)

在具有多個處理器或核心（多個邏輯CPU）的系統(tǒng)中，CPU負載值的含義取決于系統(tǒng)中存在的處理器數(shù)量。因此，具有4個處理器的計算機在達到4.00的負載之前將不會以100％使用，因此在解釋由top，htop或正常運行時間等命令提供的3個負載值時，你必須要做的第一件事就是將它們分開。系統(tǒng)中存在的邏輯CPU數(shù)量，并從中得出結論。

舉個例子，如果你的計算機裝了 2 個 CPU，會發(fā)生什么情況呢？

2 個 CPU，意味著計算機的處理能力翻了一倍，能夠同時處理的進程數(shù)量也翻了一倍。

還是用大橋來類比，兩個 CPU 就意味著大橋有兩根車道了，通車能力翻倍了

所以，2 個CPU表明系統(tǒng)負載可以達到 2.0，此時每個 CPU 都達到 100%的工作量。推廣開來，n 個 CPU 的計算機，可接受的系統(tǒng)負載最大為n.0。

芯片廠商往往在一個 CPU 內(nèi)部，包含多個CPU核心，這被稱為多核CPU。

在系統(tǒng)負載方面，多核 CPU 與多 CPU 效果類似，所以考慮系統(tǒng)負載的時候，必須考慮這臺計算機有幾個 CPU、每個 CPU 有幾個核心。然后，把系統(tǒng)負荷除以總的核心數(shù)，只要每個核心的負荷不超過 1.0，就表明計算機正常運行。

怎么知道電腦有多少個 CPU 核心呢？

延伸閱讀：

性能基礎之CPU、物理核、邏輯核概念與關系

CPU使用率

如果我們觀察在給定時間間隔內(nèi)通過CPU的不同進程，則利用率百分比將表示相對于CPU執(zhí)行與每個進程相對應的指令的那個時間間隔的時間部分。但這種計算只運行的進程，而不是那些正在等待，無論它們是在隊列（可運行狀態(tài)）還是睡著但不可中斷（例如在等待輸入/輸出操作的結束）被認為。

因此，這個指標可以讓我們了解哪些進程最大程度地擠壓CPU，但是如果系統(tǒng)狀態(tài)過載或者未充分利用，則不能給出真實的系統(tǒng)狀態(tài)圖。

現(xiàn)實工作中，我們經(jīng)常容易把平均負載和 CPU 使用率混淆，從上面我們知道平均負載是指單位時間內(nèi)，處于可運行狀態(tài)和不可中斷狀態(tài)的進程數(shù)。所以，它不僅包括正在使用 CPU 的進程，還包括等待 CPU 和等待I/O 的進程。而 CPU使用率，從上面的解釋我們知道是單位時間內(nèi)繁忙程度，跟平均負載并不一定完全對應。比如：

CPU 密集型進程，使用大量 CPU 會導致平均負載升高，這時候兩者是一致的。

I/O 密集型進程，等待 I/O 也會導致平均負載升高，但 CPU 使用率不一定很高。

大量等待 CPU 的進程調度也會導致平均負載很高，此時的 CPU 使用率也會比較高。

注意輸入/輸出（I/O）操作

在本文反復強調了不間斷休眠狀態(tài)非常重要（第一張圖中的D），因為有時你可以在計算機中找到非常高的負載值，然而不同的運行過程使用率相對較低。如果你不考慮這種狀態(tài)，你會發(fā)現(xiàn)情況莫名其妙，你將不知道如何處理它。當進程等待某個資源的釋放并且其執(zhí)行不能被中斷時，例如當它等待不可中斷的 I/O 操作時，進程處于此狀態(tài)完成（并非所有都是不可中斷的）。通常，這種情況是由于磁盤故障，網(wǎng)絡文件系統(tǒng)（如 NFS 故障）或大量使用非常慢的設備（例如USB 1.0 pendrive）而發(fā)生的。

在這種情況下，我們將不得不使用替代工具，如 iostat 或 iotop，它們將指示哪些進程正在執(zhí)行更多的 I/O 操作，以便我們可以殺死這些進程或為它們分配較少的優(yōu)先級（nice 命令）能夠為其他更關鍵的進程分配更多的CPU 時間。

一些技巧

系統(tǒng)過載并超過1.0的負載值有時不是問題，因為即使有一些延遲，CPU也會處理隊列中的作業(yè)，負載將再次降低到1.0以下的值。但是如果系統(tǒng)的持續(xù)負載值大于1，則意味著它無法吸收執(zhí)行中的所有負載，因此其響應時間將增加，系統(tǒng)將變得緩慢且無響應。高于1的高值，尤其是最后5分鐘和15分鐘的負載平均值是一個明顯的癥狀，要么我們需要改進計算機的硬件，通過限制用戶可以對系統(tǒng)的使用來節(jié)省更少的資源，或者除以多個相似節(jié)點之間的負載。

因此，我們提出以下建議：

>=0.70：沒有任何反應，但有必要監(jiān)控 CPU 負載。如果在一段時間內(nèi)保持這種狀態(tài)，就必須在事情變得更糟之前進行調查。

>=1.00：存在問題，您必須找到并修復它，否則系統(tǒng)負載的主要高峰將導致您的應用程序變慢或無響應。

>=3.00：你的系統(tǒng)變得非常慢。甚至很難從命令行操作它來試圖找出問題的原因，因此修復問題需要的時間比我們之前采取的行動要長。你冒的風險是系統(tǒng)會更飽和并且肯定會崩潰。

>=5.00：你可能無法恢復系統(tǒng)。你可以等待奇跡自發(fā)降低負載，或者如果你知道發(fā)生了什么并且可以負擔得起，你可以在控制臺中啟動 kill -9 之類的命令，并祈求它運行在某些時候，以減輕系統(tǒng)負荷并重新獲得其控制權。否則，你肯定別無選擇，只能重新啟動計算機。

參考資料：

[1]：http://www.ruanyifeng.com/blog/2011/07/linux_load_average_explained.html

Linux 任務調度

服務端I/O性能大比拼：Node、PHP、Java、Go">服務端I/O性能大比拼：Node、PHP、Java、Go

1040 2022-05-28

基礎 起步四-循環(huán)結構">java基礎 起步四-循環(huán)結構

1040 2022-05-28

Python 基礎一">Python 基礎一

1040 2022-05-28

性能 基礎之理解 Linux 系統(tǒng)平均負載和 CPU 使用率

服務端I/O性能大比拼：Node、PHP、Java、Go">服務端I/O性能大比拼：Node、PHP、Java、Go

基礎 起步四-循環(huán)結構">java基礎 起步四-循環(huán)結構

Python 基礎一">Python 基礎一

推薦文章

企業(yè)生產(chǎn)管理是什么，企業(yè)生產(chǎn)管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統(tǒng)哪個簡單好用？進銷存系統(tǒng)優(yōu)點

工廠生產(chǎn)管理（工廠生產(chǎn)管理流程及制度）

生產(chǎn)管理軟件，機械制造業(yè)生產(chǎn)管理，制造業(yè)生產(chǎn)過程管理軟件

進銷存軟件和ERP有什么區(qū)別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統(tǒng)？

數(shù)據(jù)庫訂單管理系統(tǒng)有哪些功能？數(shù)據(jù)庫訂單管理系統(tǒng)怎么設計？

什么是數(shù)據(jù)庫管理系統(tǒng)？

最近發(fā)表

熱評文章

零代碼開發(fā)是什么？2022低代碼平臺排行榜">零代碼開發(fā)是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統(tǒng)（智慧進銷存）">智能進銷存庫存管理系統(tǒng)（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

系統(tǒng)的功能有哪些？餐飲服務系統(tǒng)的構成及工作程序">連鎖餐飲管理系統(tǒng)的功能有哪些？餐飲服務系統(tǒng)的構成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接

性能基礎之理解 Linux 系統(tǒng)平均負載和 CPU 使用率

服務端I/O性能大比拼：Node、PHP、Java、Go">服務端I/O性能大比拼：Node、PHP、Java、Go

基礎起步四-循環(huán)結構">java基礎起步四-循環(huán)結構

Python基礎一">Python基礎一

推薦文章

最近發(fā)表

熱評文章

零代碼開發(fā)是什么？2022低代碼平臺排行榜">零代碼開發(fā)是什么？2022低代碼平臺排行榜

進銷存庫存管理系統(tǒng)（智慧進銷存）">智能進銷存庫存管理系統(tǒng)（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

系統(tǒng)的功能有哪些？餐飲服務系統(tǒng)的構成及工作程序">連鎖餐飲管理系統(tǒng)的功能有哪些？餐飲服務系統(tǒng)的構成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接

Python 基礎一">Python 基礎一