国产亚洲精彩视频,亚洲中文字幕无码爆乳,亚洲国产精品无码久久久蜜芽

24 張圖總結 TCP 基礎知識，看完我飄了。（24節氣）

網友投稿 1279 2025-04-02

TCP 是一種面向連接的單播協議，在 TCP 中，并不存在多播、廣播的這種行為，因為 TCP 報文段中能明確發送方和接受方的 IP 地址。

在發送數據前，相互通信的雙方（即發送方和接受方）需要建立一條連接，在發送數據后，通信雙方需要斷開連接，這就是 TCP 連接的建立和終止。

TCP 連接的建立和終止

如果你看過我之前寫的關于網絡層的一篇文章，你應該知道 TCP 的基本元素有四個：即發送方的 IP 地址、發送方的端口號、接收方的 IP 地址、接收方的端口號。而每一方的 IP + 端口號都可以看作是一個套接字，套接字能夠被唯一標示。套接字就相當于是門，出了這個門，就要進行數據傳輸了。

TCP 的連接建立 -> 終止總共分為三個階段

下面我們所討論的重點也是集中在這三個層面。

下圖是一個非常典型的 TCP 連接的建立和關閉過程，其中不包括數據傳輸的部分。

TCP 建立連接 - 三次握手

服務端進程準備好接收來自外部的 TCP 連接，一般情況下是調用 bind、listen、socket 三個函數完成。這種打開方式被認為是被動打開(passive open)。然后服務端進程處于 LISTEN 狀態，等待客戶端連接請求。

客戶端通過 connect 發起主動打開(active open)，向服務器發出連接請求，請求中首部同步位 SYN = 1，同時選擇一個初始序號 sequence ，簡寫 seq = x。SYN 報文段不允許攜帶數據，只消耗一個序號。此時，客戶端進入 SYN-SEND 狀態。

服務器收到客戶端連接后，，需要確認客戶端的報文段。在確認報文段中，把 SYN 和 ACK 位都置為 1 。確認號是 ack = x + 1，同時也為自己選擇一個初始序號 seq = y。這個報文段也不能攜帶數據，但同樣要消耗掉一個序號。此時，TCP 服務器進入 SYN-RECEIVED(同步收到) 狀態。

客戶端在收到服務器發出的響應后，還需要給出確認連接。確認連接中的 ACK 置為 1 ，序號為 seq = x + 1，確認號為 ack = y + 1。TCP 規定，這個報文段可以攜帶數據也可以不攜帶數據，如果不攜帶數據，那么下一個數據報文段的序號仍是 seq = x + 1。這時，客戶端進入 ESTABLISHED (已連接) 狀態

服務器收到客戶的確認后，也進入 ESTABLISHED 狀態。

這是一個典型的三次握手過程，通過上面 3 個報文段就能夠完成一個 TCP 連接的建立。三次握手的的目的不僅僅在于讓通信雙方知曉正在建立一個連接，也在于利用數據包中的選項字段來交換一些特殊信息，交換初始序列號。

一般首個發送 SYN 報文的一方被認為是主動打開一個連接，而這一方通常也被稱為客戶端。而 SYN 的接收方通常被稱為服務端，它用于接收這個 SYN，并發送下面的 SYN，因此這種打開方式是被動打開。

TCP 建立一個連接需要三個報文段，釋放一個連接卻需要四個報文段。

TCP 斷開連接 - 四次揮手

數據傳輸結束后，通信的雙方可以釋放連接。數據傳輸結束后的客戶端主機和服務端主機都處于 ESTABLISHED 狀態，然后進入釋放連接的過程。

TCP 斷開連接需要歷經的過程如下

客戶端應用程序發出釋放連接的報文段，并停止發送數據，主動關閉 TCP 連接。客戶端主機發送釋放連接的報文段，報文段中首部 FIN 位置為 1 ，不包含數據，序列號位 seq = u，此時客戶端主機進入 FIN-WAIT-1(終止等待 1) 階段。

服務器主機接受到客戶端發出的報文段后，即發出確認應答報文，確認應答報文中 ACK = 1，生成自己的序號位 seq = v，ack = u + 1，然后服務器主機就進入 CLOSE-WAIT(關閉等待) 狀態。

客戶端主機收到服務端主機的確認應答后，即進入 FIN-WAIT-2(終止等待2) 的狀態。等待客戶端發出連接釋放的報文段。

這時服務端主機會發出斷開連接的報文段，報文段中 ACK = 1，序列號 seq = v，ack = u + 1，在發送完斷開請求的報文后，服務端主機就進入了 LAST-ACK(最后確認)的階段。

客戶端收到服務端的斷開連接請求后，客戶端需要作出響應，客戶端發出斷開連接的報文段，在報文段中，ACK = 1, 序列號 seq = u + 1，因為客戶端從連接開始斷開后就沒有再發送數據，ack = v + 1，然后進入到 TIME-WAIT(時間等待) 狀態，請注意，這個時候 TCP 連接還沒有釋放。必須經過時間等待的設置，也就是 2MSL 后，客戶端才會進入 CLOSED 狀態，時間 MSL 叫做最長報文段壽命（Maximum Segment Lifetime）。

服務端主要收到了客戶端的斷開連接確認后，就會進入 CLOSED 狀態。因為服務端結束 TCP 連接時間要比客戶端早，而整個連接斷開過程需要發送四個報文段，因此釋放連接的過程也被稱為四次揮手。

TCP 連接的任意一方都可以發起關閉操作，只不過通常情況下發起關閉連接操作一般都是客戶端。然而，一些服務器比如 Web 服務器在對請求作出相應后也會發起關閉連接的操作。TCP 協議規定通過發送一個 FIN 報文來發起關閉操作。

所以綜上所述，建立一個 TCP 連接需要三個報文段，而關閉一個 TCP 連接需要四個報文段。TCP 協議還支持一種半開啟(half-open) 狀態，雖然這種情況并不多見。

TCP 半開啟

TCP 連接處于半開啟的這種狀態是因為連接的一方關閉或者終止了這個 TCP 連接卻沒有通知另一方，也就是說兩個人正在微信聊天，cxuan 你下線了你不告訴我，我還在跟你侃八卦呢。此時就認為這條連接處于半開啟狀態。這種情況發生在通信中的一方處于主機崩潰的情況下，你 xxx 的，我電腦死機了我咋告訴你？只要處于半連接狀態的一方不傳輸數據的話，那么是無法檢測出來對方主機已經下線的。

另外一種處于半開啟狀態的原因是通信的一方關閉了主機電源而不是正常關機。這種情況下會導致服務器上有很多半開啟的 TCP 連接。

TCP 半關閉

既然 TCP 支持半開啟操作，那么我們可以設想 TCP 也支持半關閉操作。同樣的，TCP 半關閉也并不常見。TCP 的半關閉操作是指僅僅關閉數據流的一個傳輸方向。兩個半關閉操作合在一起就能夠關閉整個連接。在一般情況下，通信雙方會通過應用程序互相發送 FIN 報文段來結束連接，但是在 TCP 半關閉的情況下，應用程序會表明自己的想法：“我已經完成了數據的發送發送，并發送了一個 FIN 報文段給對方，但是我依然希望接收來自對方的數據直到它發送一個 FIN 報文段給我”。下面是一個 TCP 半關閉的示意圖。

解釋一下這個過程：

首先客戶端主機和服務器主機一直在進行數據傳輸，一段時間后，客戶端發起了 FIN 報文，要求主動斷開連接，服務器收到 FIN 后，回應 ACK ，由于此時發起半關閉的一方也就是客戶端仍然希望服務器發送數據，所以服務器會繼續發送數據，一段時間后服務器發送另外一條 FIN 報文，在客戶端收到 FIN 報文回應 ACK 給服務器后，斷開連接。

TCP 的半關閉操作中，連接的一個方向被關閉，而另一個方向仍在傳輸數據直到它被關閉為止。只不過很少有應用程序使用這一特性。

同時打開和同時關閉

還有一種比較非常規的操作，這就是兩個應用程序同時主動打開連接。雖然這種情況看起來不太可能，但是在特定的安排下卻是有可能發生的。我們主要講述這個過程。

通信雙方在接收到來自對方的 SYN 之前會首先發送一個 SYN，這個場景還要求通信雙方都知道對方的 IP 地址 + 端口號。

下面是同時打開的例子

如上圖所示，通信雙方都在收到對方報文前主動發送了 SYN 報文，都在收到彼此的報文后回復了一個 ACK 報文。

一個同時打開過程需要交換四個報文段，比普通的三次握手增加了一個，由于同時打開沒有客戶端和服務器一說，所以這里我用了通信雙方來稱呼。

像同時打開一樣，同時關閉也是通信雙方同時提出主動關閉請求，發送 FIN 報文，下圖顯示了一個同時關閉的過程。

同時關閉過程中需要交換和正常關閉相同數量的報文段，只不過同時關閉不像四次揮手那樣順序進行，而是交叉進行的。

聊一聊初始序列號

也許是我上面圖示或者文字描述的不專業，初始序列號它是有專業術語表示的，初始序列號的英文名稱是Initial sequence numbers (ISN)，所以我們上面表示的 seq = v，其實就表示的 ISN。

在發送 SYN 之前，通信雙方會選擇一個初始序列號。初始序列號是隨機生成的，每一個 TCP 連接都會有一個不同的初始序列號。RFC 文檔指出初始序列號是一個 32 位的計數器，每 4 us（微秒） + 1。因為每個 TCP 連接都是一個不同的實例，這么安排的目的就是為了防止出現序列號重疊的情況。

當一個 TCP 連接建立的過程中，只有正確的 TCP 四元組和正確的序列號才會被對方接收。這也反應了 TCP 報文段容易被偽造的脆弱性，因為只要我偽造了一個相同的四元組和初始序列號就能夠偽造 TCP 連接，從而打斷 TCP 的正常連接，所以抵御這種攻擊的一種方式就是使用初始序列號，另外一種方法就是加密序列號。

TCP 狀態轉換

我們上面聊到了三次握手和四次揮手，提到了一些關于 TCP 連接之間的狀態轉換，那么下面我就從頭開始和你好好梳理一下這些狀態之間的轉換。

首先第一步，剛開始時服務器和客戶端都處于 CLOSED 狀態，這時需要判斷是主動打開還是被動打開，如果是主動打開，那么客戶端向服務器發送 SYN 報文，此時客戶端處于 SYN-SEND 狀態，SYN-SEND 表示發送連接請求后等待匹配的連接請求，服務器被動打開會處于 LISTEN 狀態，用于監聽 SYN 報文。如果客戶端調用了 close 方法或者經過一段時間沒有操作，就會重新變為 CLOSED 狀態，這一步轉換圖如下

這里有個疑問，為什么處于 LISTEN 狀態下的客戶端還會發送 SYN 變為 SYN_SENT 狀態呢？

知乎看到了車小胖大佬的回答，這種情況可能出現在 FTP 中，LISTEN -> SYN_SENT 是因為這個連接可能是由于服務器端的應用有數據發送給客戶端所觸發的，客戶端被動接受連接，連接建立后，開始傳輸文件。也就是說，處于 LISTEN 狀態的服務器也是有可能發送 SYN 報文的，只不過這種情況非常少見。

處于 SYN_SEND 狀態的服務器會接收 SYN 并發送 SYN 和 ACK 轉換成為 SYN_RCVD 狀態，同樣的，處于 LISTEN 狀態的客戶端也會接收 SYN 并發送 SYN 和 ACK 轉換為 SYN_RCVD 狀態。如果處于 SYN_RCVD 狀態的客戶端收到 RST 就會變為 LISTEN 狀態。

這兩張圖一起看會比較好一些。

這里需要解釋下什么是 RST

這里有一種情況是當主機收到 TCP 報文段后，其 IP 和端口號不匹配的情況。假設客戶端主機發送一個請求，而服務器主機經過 IP 和端口號的判斷后發現不是給這個服務器的，那么服務器就會發出一個 RST 特殊報文段給客戶端。

因此，當服務端發送一個 RST 特殊報文段給客戶端的時候，它就會告訴客戶端沒有匹配的套接字連接，請不要再繼續發送了。

RST：（Reset the connection）用于復位因某種原因引起出現的錯誤連接，也用來拒絕非法數據和請求。如果接收到 RST 位時候，通常發生了某些錯誤。

上面沒有識別正確的 IP 端口是一種導致 RST 出現的情況，除此之外，RST 還可能由于請求超時、取消一個已存在的連接等出現。

位于 SYN_RCVD 的服務器會接收 ACK 報文，SYN_SEND 的客戶端會接收 SYN 和 ACK 報文，并發送 ACK 報文，由此，客戶端和服務器之間的連接就建立了。

這里還要注意一點，同時打開的狀態我在上面沒有刻意表示出來，實際上，在同時打開的情況下，它的狀態變化是這樣的。

為什么會是這樣呢？因為你想，在同時打開的情況下，兩端主機都發起 SYN 報文，而主動發起 SYN 的主機會處于 SYN-SEND 狀態，發送完成后，會等待接收 SYN 和 ACK ，在雙方主機都發送了 SYN + ACK 后，雙方都處于 SYN-RECEIVED(SYN-RCVD) 狀態，然后等待 SYN + ACK 的報文到達后，雙方就會處于 ESTABLISHED 狀態，開始傳輸數據。

好了，到現在為止，我給你敘述了一下 TCP 連接建立過程中的狀態轉換，現在你可以泡一壺茶喝點水，等著數據傳輸了。

好了，現在水喝夠了，這時候數據也傳輸完成了，數據傳輸完成后，這條 TCP 連接就可以斷開了。

現在我們把時鐘往前撥一下，調整到服務端處于 SYN_RCVD 狀態的時刻，因為剛收到了 SYN 包并發送了 SYN + ACK 包，此時服務端很開心，但是這時，服務端應用進程關閉了，然后應用進程發了一個 FIN 包，就會讓服務器從 SYN_RCVD -> FIN_WAIT_1 狀態。

然后把時鐘調到現在，客戶端和服務器現在已經傳輸完數據了，此時客戶端發送了一條 FIN 報文希望斷開連接，此時客戶端也會變為 FIN_WAIT_1 狀態，對于服務器來說，它接收到了 FIN 報文段并回復了 ACK 報文，就會從 ESTABLISHED -> CLOSE_WAIT 狀態。

位于 CLOSE_WAIT 狀態的服務端會發送 FIN 報文，然后把自己置于 LAST_ACK 狀態。處于 FIN_WAIT_1 的客戶端接收 ACK 消息就會變為 FIN_WAIT_2 狀態。

這里需要先解釋一下 CLOSING 這個狀態，FIN_WAIT_1 -> CLOSING 的轉換比較特殊

CLOSING 這種狀態比較特殊，實際情況中應該是很少見，屬于一種比較罕見的例外狀態。正常情況下，當你發送FIN 報文后，按理來說是應該先收到（或同時收到）對方的 ACK 報文，再收到對方的 FIN 報文。但是 CLOSING 狀態表示你發送 FIN 報文后，并沒有收到對方的 ACK 報文，反而卻也收到了對方的 FIN 報文。

什么情況下會出現此種情況呢？其實細想一下，也不難得出結論：那就是如果雙方在同時關閉一個鏈接的話，那么就出現了同時發送 FIN 報文的情況，也即會出現 CLOSING 狀態，表示雙方都正在關閉連接。

FIN_WAIT_2 狀態的客戶端接收服務端主機發送的 FIN + ACK 消息，并發送 ACK 響應后，會變為 TIME_WAIT 狀態。處于 CLOSE_WAIT 的客戶端發送 FIN 會處于 LAST_ACK 狀態。

這里不少圖和博客雖然在圖上畫的是 FIN + ACK 報文后才會處于 LAST_ACK 狀態，但是描述的時候，一般通常只對于 FIN 進行描述。也就是說 CLOSE_WAIT 發送 FIN 才會處于 LAST_ACK 狀態。

所以這里 FIN_WAIT_1 -> TIME_WAIT 的狀態也就是接收 FIN 和 ACK 并發送 ACK 之后，客戶端處于的狀態。

然后位于 CLOSINIG 狀態的客戶端這時候還有 ACK 接收的話，會繼續處于 TIME_WAIT 狀態，可以看到，TIME_WAIT 狀態相當于是客戶端在關閉前的最后一個狀態，它是一種主動關閉的狀態；而 LAST_ACK 是服務端在關閉前的最后一個狀態，它是一種被動打開的狀態。

上面有幾個狀態比較特殊，這里我們向西解釋下。

TIME_WAIT 狀態

通信雙方建立 TCP 連接后，主動關閉連接的一方就會進入 TIME_WAIT 狀態。TIME_WAIT 狀態也稱為 2MSL 的等待狀態。在這個狀態下，TCP 將會等待最大段生存期(Maximum Segment Lifetime, MSL) 時間的兩倍。

這里需要解釋下 MSL

MSL 是 TCP 段期望的最大生存時間，也就是在網絡中存在的最長時間。這個時間是有限制的，因為我們知道 TCP 是依靠 IP 數據段來進行傳輸的，IP 數據報中有 TTL 和跳數的字段，這兩個字段決定了 IP 的生存時間，一般情況下，TCP 的最大生存時間是 2 分鐘，不過這個數值是可以修改的，根據不同操作系統可以修改此值。

基于此，我們來探討 TIME_WAIT 的狀態。

當 TCP 執行一個主動關閉并發送最終的 ACK 時，TIME_WAIT 應該以 2 * 最大生存時間存在，這樣就能夠讓 TCP 重新發送最終的 ACK 以避免出現丟失的情況。重新發送最終的 ACK 并不是因為 TCP 重傳了 ACK，而是因為通信另一方重傳了 FIN，客戶端經?；匕l送 FIN，因為它需要 ACK 的響應才能夠關閉連接，如果生存時間超過了 2MSL 的話，客戶端就會發送 RST，使服務端出錯。

TCP 超時和重傳

沒有永遠不出錯誤的通信，這句話表明著不管外部條件多么完備，永遠都會有出錯的可能。所以，在 TCP 的正常通信過程中，也會出現錯誤，這種錯誤可能是由于數據包丟失引起的，也可能是由于數據包重復引起的，甚至可能是由于數據包失序引起的。

TCP 的通信過程中，會由 TCP 的接收端返回一系列的確認信息來判斷是否出現錯誤，一旦出現丟包等情況，TCP 就會啟動重傳操作，重傳尚未確認的數據。

TCP 的重傳有兩種方式，一種是基于時間，一種是基于確認信息，一般通過確認信息要比通過時間更加高效。

所以從這點就可以看出，TCP 的確認和重傳，都是基于數據包是否被確認為前提的。

TCP 在發送數據時會設置一個定時器，如果在定時器指定的時間內未收到確認信息，那么就會觸發相應的超時或者基于計時器的重傳操作，計時器超時通常被稱為重傳超時(RTO)。

但是有另外一種不會引起延遲的方式，這就是快速重傳。

TCP 在每次重傳一次報文后，其重傳時間都會加倍，這種"間隔時間加倍"被稱為二進制指數補償(binary exponential backoff) 。等到間隔時間加倍到 15.5 min 后，客戶端會顯示

Connection closed by foreign host.

TCP 擁有兩個閾值來決定如何重傳一個報文段，這兩個閾值被定義在 RFC[RCF1122] 中，第一個閾值是 R1，它表示愿意嘗試重傳的次數，閾值 R2 表示 TCP 應該放棄連接的時間。R1 和 R2 應至少設為三次重傳和 100 秒放棄 TCP 連接。

這里需要注意下，對連接建立報文 SYN 來說，它的 R2 至少應該設置為 3 分鐘，但是在不同的系統中，R1 和 R2 值的設置方式也不同。

在 Linux 系統中，R1 和 R2 的值可以通過應用程序來設置，或者是修改 net.ipv4.tcp_retries1 和 net.ipv4.tcp_retries2 的值來設置。變量值就是重傳次數。

tcp_retries2 的默認值是 15，這個充實次數的耗時大約是 13 - 30 分鐘，這只是一個大概值，最終耗時時間還要取決于 RTO ，也就是重傳超時時間。tcp_retries1 的默認值是 3 。

對于 SYN 段來說，net.ipv4.tcp_syn_retries 和 net.ipv4.tcp_synack_retries 這兩個值限制了 SYN 的重傳次數，默認是 5，大約是 180 秒。

Windows 操作系統下也有 R1 和 R2 變量，它們的值被定義在下方的注冊表中

HKLM\System\CurrentControlSet\Services\Tcpip\Parameters HKLM\System\CurrentControlSet\Services\Tcpip6\Parameters

其中有一個非常重要的變量就是 TcpMaxDataRetransmissions，這個 TcpMaxDataRetransmissions 對應 Linux 中的 tcp_retries2 變量，默認值是 5。這個值的意思表示的是 TCP 在現有連接上未確認數據段的次數。

快速重傳

我們上面提到了快速重傳，實際上快速重傳機制是基于接收端的反饋信息來觸發的，它并不受重傳計時器的影響。所以與超時重傳相比，快速重傳能夠有效的修復丟包情況。當 TCP 連接的過程中接收端出現亂序的報文（比如 2 - 4 - 3）到達時，TCP 需要立刻生成確認消息，這種確認消息也被稱為重復 ACK。

當失序報文到達時，重復 ACK 要做到立刻返回，不允許延遲發送，此舉的目的是要告訴發送方某段報文失序到達了，希望發送方指出失序報文段的序列號。

還有一種情況也會導致重復 ACK 發給發送方，那就是當前報文段的后續報文發送至接收端，由此可以判斷當前發送方的報文段丟失或者延遲到達。因為這兩種情況導致的后果都是接收方沒有收到報文，但是我們卻無法判斷到底是報文段丟失還是報文段沒有送達。因此 TCP 發送端會等待一定數目的重復 ACK 被接受來決定數據是否丟失并觸發快速重傳。一般這個判斷的數量是 3，這段文字表述可能無法清晰理解，我們舉個例子。

如上圖所示，報文段 1 成功接收并被確認為 ACK 2，接收端的期待序號為 2，當報文段 2 丟失后，報文段 3。失序到達，但是與接收端的期望不匹配，所以接收端會重復發送冗余 ACK 2。

這樣，在超時重傳定時器到期之前，接收收到連續三個相同的 ACK 后，發送端就知道哪個報文段丟失了，于是發送方會重發這個丟失的報文段，這樣就不用等待重傳定時器的到期，大大提高了效率。

SACK

在標準的 TCP 確認機制中，如果發送方發送了 0 - 10000 序號之間的數據，但是接收方只接收到了 0 -1000, 3000 - 10000 之間的數據，而 1000 - 3000 之間的數據沒有到達接收端，此時發送方會重傳 1000 - 10000 之間的數據，實際上這是沒有必要的，因為 3000 后面的數據已經被接收了。但是發送方無法感知這種情況的存在。

如何避免或者說解決這種問題呢？

為了優化這種情況，我們有必要讓客戶端知道更多的消息，在 TCP 報文段中，有一個 SACK 選項字段，這個字段是一種**選擇性確認(selective acknowledgment)**機制，這個機制能告訴 TCP 客戶端，用我們的俗語來解釋就是：“我這里最多允許接收 1000 之后的報文段，但是我卻收到了 3000 - 10000 的報文段，請給我 1000 - 3000 之間的報文段”。

但是，這個選擇性確認機制的是否開啟還受一個字段的影響，這個字段就是 SACK 允許選項字段，通信雙方在 SYN 段或者 SYN + ACK 段中添加 SACK 允許選項字段來通知對端主機是否支持 SACK，如果雙方都支持的話，后續在 SYN 段中就可以使用 SACK 選項了。

這里需要注意下：SACK 選項字段只能出現在 SYN 段中。

偽超時和重傳

在某些情況下，即使沒有出現報文段的丟失也可能會引發報文重傳。這種重傳行為被稱為偽重傳(spurious retransmission) ，這種重傳是沒有必要的，造成這種情況的因素可能是由于偽超時(spurious timeout)，偽超時的意思就是過早的判定超時發生。造成偽超時的因素有很多，比如報文段失序到達，報文段重復，ACK 丟失等情況。

檢測和處理偽超時的方法有很多，這些方法統稱為檢測算法和響應算法。檢測算法用于判斷是否出現了超時現象或出現了計時器的重傳現象。一旦出現了超時或者重傳的情況，就會執行響應算法撤銷或者減輕超時帶來的影響，下面是幾種算法，此篇文章暫不深入這些實現細節

重復 SACK 擴展- DSACK

Eifel 檢測算法

前移 RTO 恢復 - F-RTO

Eifel 響應算法

包失序和包重復

上面我們討論的都是 TCP 如何處理丟包的問題，我們下面來討論一下包失序和包重復的問題。

包失序

數據包的失序到達是互聯網中極其容易出現的一種情況，由于 IP 層并不能保證數據包的有序性，每個數據包的發送都可能會選擇當前情況傳輸速度最快的鏈路，所以很有可能出現發送了 A - > B -> C 的三個數據包，到達接收端的數據包順序是 C -> A -> B 或者 B -> C -> A 等等。這就是包失序的一種現象。

在包傳輸中，主要分為兩種鏈路：正向鏈路（SYN）和反向鏈路（ACK）

如果失序發生在正向鏈路，TCP 是無法正確判斷數據包是否丟失的，數據的丟失和失序都會導致接收端收到無序的數據包，造成數據之間的空缺。如果這種空缺不夠大的話，這種情況影響不大；但是如果空缺比較大的話，可能會導致偽重傳。

如果失序發生在反向鏈路，就會使 TCP 的窗口前移，然后收到重復而應該被丟棄的 ACK，導致發送端出現不必要的流量突發，影響可用網絡帶寬。

回到我們上面討論的快速重傳，由于快速重傳是根據重復 ACK 推斷出現丟包而啟動的，它不用等到重傳計時器超時。由于 TCP 接收端會對接收到的失序報文立刻返回 ACK，所以網絡中任何一個失序到達的報文都可能會造成重復 ACK。假設一旦收到 ACK，就會啟動快速重傳機制，當 ACK 數量激增，就會導致大量不必要的重傳發生，所以快速重傳應該達到重復閾值(dupthresh) 再觸發。但是在互聯網中，嚴重的失序并不常見，因此 dupthresh 的值可以設置的盡量小，一般來說 3 就能處理絕大部分情況。

包重復

包重復也是互聯網中出現很少的一種情況，它指的是在網絡傳輸過程中，包可能會出現傳輸多次的情況，當重傳生成時，TCP 可能會出現混淆。

包的重復可以使接收端生成一系列的重復 ACK，這種情況可以使用 SACK 協商來解決。

TCP 數據流和窗口管理

我們在 40 張圖帶你搞懂 TCP 和 UDP 這篇文章中知道了可以使用滑動窗口來實現流量控制，也就是說，客戶端和服務器可以相互提供數據流信息的交換，數據流的相關信息主要包括報文段序列號、ACK 號和窗口大小。

圖中的兩個箭頭表示數據流方向，數據流方向也就是 TCP 報文段的傳輸方向。可以看到，每個 TCP 報文段中都包括了序列號、ACK 和窗口信息，可能還會有用戶數據。TCP 報文段中的窗口大小表示接收端還能夠接收的緩存空間的大小，以字節為單位。這個窗口大小是一種動態的，因為無時無刻都會有報文段的接收和消失，這種動態調整的窗口大小我們稱之為滑動窗口，下面我們就來具體認識一下滑動窗口。

滑動窗口

TCP 連接的每一端都可以發送數據，但是數據的發送不是沒有限制的，實際上，TCP 連接的兩端都各自維護了一個發送窗口結構 (send window structure) 和接收窗口結構 (receive window structure)，這兩個窗口結構就是數據發送的限制。

發送方窗口

下圖是一個發送方窗口的示例。

在這幅圖中，涉及滑動窗口的四種概念：

已經發送并確認的報文段：發送給接收方后，接收方回回復 ACK 來對報文段進行響應，圖中標注綠色的報文段就是已經經過接收方確認的報文段。

已經發送但是還沒確認的報文段：圖中綠色區域是經過接收方確認的報文段，而淺藍色這段區域指的是已經發送但是還未經過接收方確認的報文段。

等待發送的報文段：圖中深藍色區域是等待發送的報文段，它屬于發送窗口結構的一部分，也就是說，發送窗口結構其實是由已發送未確認 + 等待發送的報文段構成。

窗口滑動時才能發送的報文段：如果圖中的 [4,9] 這個集合內的報文段發送完畢后，整個滑動窗口會向右移動，圖中橙色區域就是窗口右移時才能發送的報文段。

滑動窗口也是有邊界的，這個邊界是 Left edge 和 Right edge，Left edge 是窗口的左邊界，Right edge 是窗口的右邊界。

當 Left edge 向右移動而 Right edge 不變時，這個窗口可能處于 close 關閉狀態。隨著已發送的數據逐漸被確認從而導致窗口變小時，就會發生這種情況。

當 Right edge 向右移動時，窗口會處于 open 打開狀態，允許發送更多的數據。當接收端進程讀取緩沖區數據，從而使緩沖區接收更多數據時，就會處于這種狀態。

還可能會發生 Right edge 向左移動的情況，會導致發送并確認的報文段變小，這種情況被稱為糊涂窗口綜合癥，這種情況是我們不愿意看到的。出現糊涂窗口綜合癥時，通信雙方用于交換的數據段大小會變小，而網絡固定的開銷卻沒有變化，每個報文段中有用數據相對于頭部信息的比例較小，導致傳輸效率非常低。

這就相當于之前你明明有能力花一天時間寫完一個復雜的頁面，現在你花了一天的時間卻改了一個標題的 bug，大材小用。

每個 TCP 報文段都包含ACK 號和窗口通告信息，所以每當收到響應時，TCP 接收方都會根據這兩個參數調整窗口結構。

TCP 滑動窗口的 Left edge 永遠不可能向左移動，因為發送并確認的報文段永遠不可能被取消，就像這世界上沒有后悔藥一樣。這條邊緣是由另一段發送的 ACK 號控制的。當 ACK 標號使窗口向右移動但是窗口大小沒有改變時，則稱該窗口向前滑動。

如果 ACK 的編號增加但是窗口通告信息隨著其他 ACK 的到達卻變小了，此時 Left edge 會接近 Right edge。當 Left edge 和 Right edge 重合時，此時發送方不會再傳輸任何數據，這種情況被稱為零窗口。此時 TCP 發送方會發起窗口探測，等待合適的時機再發送數據。

接收方窗口

接收方也維護了一個窗口結構，這個窗口要比發送方的簡單很多。這個窗口記錄了已經接收并確認的數據，以及它能夠接收的最大序列號。接收方的窗口結構不會存儲重復的報文段和 ACK，同時接收方的窗口也不會記錄不應該收到的報文段和 ACK。下面是 TCP 接收方的窗口結構。

與發送端的窗口一樣，接收方窗口結構也維護了一個 Left edge 和 Right edge。位于 Left edge 左邊的被稱為已經接收并確認的報文段，位于 Right edge 右邊的被稱為不能接收的報文段。

對于接收端來說，到達序列號小于 Left efge 的被認為是已經重復的數據，需要丟棄。超過 Right edge 的被認為超出處理范圍。只有當到達的報文段等于 Left edge 時，數據才不會被丟棄，窗口才能夠向前滑動。

接收方窗口結構也會存在零窗口的情況，如果某個應用進程消耗數據很慢，而 TCP 發送方卻發送了大量的數據給接收方，會造成 TCP 緩沖區溢出，通告發送方不要再發送數據了，但是應用進程卻以非常慢的速度消耗緩沖區的數據（比如 1 字節），就會告訴接收端只能發送一個字節的數據，這個過程慢慢持續，造成網絡開銷大，效率很低。

我們上面提到了窗口存在 Left edge = Right edge 的情況，此時被稱為零窗口，下面我們就來具體研究一下零窗口。

零窗口

TCP 是通過接收端的窗口通告信息來實現流量控制的。通告窗口告訴了 TCP ，接收端能夠接收的數據量。當接收方的窗口變為 0 時，可以有效的阻止發送端繼續發送數據。當接收端重新獲得可用空間時，它會給發送端傳輸一個窗口更新告知自己能夠接收數據了。窗口更新一般是純 ACK ，即不帶任何數據。但是純 ACK 不能保證一定會到達發送端，于是需要有相關的措施能夠處理這種丟包。

如果純 ACK 丟失的話，通信雙方就會一直處于等待狀態，發送方心想拉垮的接收端怎么還讓我發送數據！接收端心想天殺的發送方怎么還不發數據！為了防止這種情況，發送方會采用一個持續計時器來間歇性的查詢接收方，看看其窗口是否已經增長。持續計時器會觸發窗口探測，強制要求接收方返回帶有更新窗口的 ACK。

窗口探測包含一個字節的數據，采用的是 TCP 丟失重傳的方式。當 TCP 持續計時器超時后，就會觸發窗口探測的發送。一個字節的數據能否被接收端接收，還要取決于其緩沖區的大小。

擁塞控制

有了 TCP 的窗口控制后，使計算機網絡中兩個主機之間不再是以單個數據段的形式發送了，而是能夠連續發送大量的數據包。然而，大量數據包同時也伴隨著其他問題，比如網絡負載、網絡擁堵等問題。TCP 為了防止這類問題的出現，使用了擁塞控制機制，擁塞控制機制會在面臨網絡擁塞時遏制發送方的數據發送。

擁塞控制主要有兩種方法

端到端的擁塞控制: 因為網絡層沒有為運輸層擁塞控制提供顯示支持。所以即使網絡中存在擁塞情況，端系統也要通過對網絡行為的觀察來推斷。TCP 就是使用了端到端的擁塞控制方式。IP 層不會向端系統提供有關網絡擁塞的反饋信息。那么 TCP 如何推斷網絡擁塞呢？如果超時或者三次冗余確認就被認為是網絡擁塞，TCP 會減小窗口的大小，或者增加往返時延來避免。

網絡輔助的擁塞控制: 在網絡輔助的擁塞控制中，路由器會向發送方提供關于網絡中擁塞狀態的反饋。這種反饋信息就是一個比特信息，它指示鏈路中的擁塞情況。

下圖描述了這兩種擁塞控制方式

TCP 擁塞控制

如果你看到這里，那我就暫定認為你了解了 TCP 實現可靠性的基礎了，那就是使用序號和確認號。除此之外，另外一個實現 TCP 可靠性基礎的就是 TCP 的擁塞控制。如果說

TCP 所采用的方法是讓每一個發送方根據所感知到的網絡的擁塞程度來限制發出報文段的速率，如果 TCP 發送方感知到沒有什么擁塞，則 TCP 發送方會增加發送速率；如果發送方感知沿著路徑有阻塞，那么發送方就會降低發送速率。

但是這種方法有三個問題

TCP 發送方如何限制它向其他連接發送報文段的速率呢？

一個 TCP 發送方是如何感知到網絡擁塞的呢？

當發送方感知到端到端的擁塞時，采用何種算法來改變其發送速率呢？

我們先來探討一下第一個問題，TCP 發送方如何限制它向其他連接發送報文段的速率呢？

我們知道 TCP 是由接收緩存、發送緩存和變量(LastByteRead, rwnd，等)組成。發送方的 TCP 擁塞控制機制會跟蹤一個變量，即擁塞窗口(congestion window) 的變量，擁塞窗口表示為 cwnd，用于限制 TCP 在接收到 ACK 之前可以發送到網絡的數據量。而接收窗口(rwnd) 是一個用于告訴接收方能夠接受的數據量。

一般來說，發送方未確認的數據量不得超過 cwnd 和 rwnd 的最小值，也就是

LastByteSent - LastByteAcked <= min(cwnd,rwnd)

由于每個數據包的往返時間是 RTT，我們假設接收端有足夠的緩存空間用于接收數據，我們就不用考慮 rwnd 了，只專注于 cwnd，那么，該發送方的發送速率大概是 cwnd/RTT 字節/秒。通過調節 cwnd，發送方因此能調整它向連接發送數據的速率。

一個 TCP 發送方是如何感知到網絡擁塞的呢？

這個我們上面討論過，是 TCP 根據超時或者 3 個冗余 ACK 來感知的。

當發送方感知到端到端的擁塞時，采用何種算法來改變其發送速率呢 ?

這個問題比較復雜，且容我娓娓道來，一般來說，TCP 會遵循下面這幾種指導性原則

如果在報文段發送過程中丟失，那就意味著網絡擁堵，此時需要適當降低 TCP 發送方的速率。

一個確認報文段指示發送方正在向接收方傳遞報文段，因此，當對先前未確認報文段的確認到達時，能夠增加發送方的速率。為啥呢？因為未確認的報文段到達接收方也就表示著網絡不擁堵，能夠順利到達，因此發送方擁塞窗口長度會變大，所以發送速率會變快

帶寬探測，帶寬探測說的是 TCP 可以通過調節傳輸速率來增加/減小 ACK 到達的次數，如果出現丟包事件，就會減小傳輸速率。因此，為了探測擁塞開始出現的頻率， TCP 發送方應該增加它的傳輸速率。然后慢慢使傳輸速率降低，進而再次開始探測，看看擁塞開始速率是否發生了變化。

在了解完 TCP 擁塞控制后，下面我們就該聊一下 TCP 的擁塞控制算法(TCP congestion control algorithm) 了。TCP 擁塞控制算法主要包含三個部分：慢啟動、擁塞避免、快速恢復，下面我們依次來看一下

慢啟動

當一條 TCP 開始建立連接時，cwnd 的值就會初始化為一個 MSS 的較小值。這就使得初始發送速率大概是 MSS/RTT 字節/秒，比如要傳輸 1000 字節的數據，RTT 為 200 ms ，那么得到的初始發送速率大概是 40 kb/s 。實際情況下可用帶寬要比這個 MSS/RTT 大得多，因此 TCP 想要找到最佳的發送速率，可以通過慢啟動(slow-start) 的方式，在慢啟動的方式中，cwnd 的值會初始化為 1 個 MSS，并且每次傳輸報文確認后就會增加一個 MSS，cwnd 的值會變為 2 個 MSS，這兩個報文段都傳輸成功后每個報文段 + 1，會變為 4 個 MSS，依此類推，每成功一次 cwnd 的值就會翻倍。如下圖所示

發送速率不可能會一直增長，增長總有結束的時候，那么何時結束呢？慢啟動通常會使用下面這幾種方式結束發送速率的增長。

如果在慢啟動的發送過程出現丟包的情況，那么 TCP 會將發送方的 cwnd 設置為 1 并重新開始慢啟動的過程，此時會引入一個 ssthresh(慢啟動閾值) 的概念，它的初始值就是產生丟包的 cwnd 的值 / 2，即當檢測到擁塞時，ssthresh 的值就是窗口值的一半。

第二種方式是直接和 ssthresh 的值相關聯，因為當檢測到擁塞時，ssthresh 的值就是窗口值的一半，那么當 cwnd > ssthresh 時，每次翻番都可能會出現丟包，所以最好的方式就是 cwnd 的值 = ssthresh ，這樣 TCP 就會轉為擁塞控制模式，結束慢啟動。

慢啟動結束的最后一種方式就是如果檢測到 3 個冗余 ACK，TCP 就會執行一種快速重傳并進入恢復狀態。

擁塞避免

24 張圖總結 TCP 基礎知識，看完我飄了。（24節氣）

當 TCP 進入擁塞控制狀態后，cwnd 的值就等于擁塞時值的一半，也就是 ssthresh 的值。所以，無法每次報文段到達后都將 cwnd 的值再翻倍。而是采用了一種相對保守的方式，每次傳輸完成后只將 cwnd 的值增加一個 MSS，比如收到了 10 個報文段的確認，但是 cwnd 的值只增加一個 MSS。這是一種線性增長模式，它也會有增長逾值，它的增長逾值和慢啟動一樣，如果出現丟包，那么 cwnd 的值就是一個 MSS，ssthresh 的值就等于 cwnd 的一半；或者是收到 3 個冗余的 ACK 響應也能停止 MSS 增長。如果 TCP 將 cwnd 的值減半后，仍然會收到 3 個冗余 ACK，那么就會將 ssthresh 的值記錄為 cwnd 值的一半，進入快速恢復狀態。

快速恢復

在快速恢復中，對于使 TCP 進入快速恢復狀態缺失的報文段，對于每個收到的冗余 ACK，cwnd 的值都會增加一個 MSS 。當對丟失報文段的一個 ACK 到達時，TCP 在降低 cwnd 后進入擁塞避免狀態。如果在擁塞控制狀態后出現超時，那么就會遷移到慢啟動狀態，cwnd 的值被設置為 1 個 MSS，ssthresh 的值設置為 cwnd 的一半。

我自己肝了六本 PDF，全網傳播超過10w+ ，微信搜索「程序員cxuan」關注公眾號后，在后臺回復 cxuan ，領取全部 PDF，這些 PDF 如下

六本 PDF 鏈接

TCP/IP

總結助手？">總結助手？

1279 2025-04-02

總結 助手在哪里開啟？（助手在哪里打開）">總結 助手在哪里開啟？（助手在哪里打開）

1279 2025-04-02

基礎題總結和習題提示">Matlab基礎題總結和習題提示

1279 2025-04-02

24 張圖 總結 TCP 基礎知識，看完我飄了。（24節氣）

總結助手？">總結助手？

總結 助手在哪里開啟？（助手在哪里打開）">總結 助手在哪里開啟？（助手在哪里打開）

基礎題總結和習題提示">Matlab基礎題總結和習題提示

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

定制家居數字化管理模式：提升品質、智能化和個性化的未

智能定制家居管理系統：重新定義家庭生活方式

友情鏈接

24 張圖總結 TCP 基礎知識，看完我飄了。（24節氣）

總結助手？">總結助手？

總結助手在哪里開啟？（助手在哪里打開）">總結助手在哪里開啟？（助手在哪里打開）

基礎題總結和習題提示">Matlab基礎題總結和習題提示

推薦文章

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

友情鏈接

24 張圖總結 TCP 基礎知識，看完我飄了。（24節氣）

總結助手在哪里開啟？（助手在哪里打開）">總結助手在哪里開啟？（助手在哪里打開）

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦