性能 分析之公有云 網絡帶寬導致 TPS 低 RT 高

網友投稿 799 2022-05-30

背景介紹

分析過程

背景介紹

分析過程

背景介紹

今天在壓力過程中，一兄弟說壓力上不去了，TPS 隨著用戶數的增加居然沒有一點上升的趨勢，響應時間倒是樂呵呵的上去了。結果如下（大概的數據，當時我只是隨手記在了本子上，主要看趨勢）：

兩個同事為了這個瓶頸在哪里找了大半天時間，因為之前我說過，系統瓶頸的分析要找到具體的原因才能跟其他團隊溝通，不然別人問起來為什么回答不上來，顯得團隊能力不夠強似的。

后來他們實在沒招了，過來問我。描述大概如下：

他們查了數據庫的資源，覺得沒什么問題，SQL 執行時間還是挺快的，每秒近 2 萬的 sql。

查了被測主機的情況，只有 us CPU 用的高，50%左右；

查了應用的進程的狀態，也打了 java thread dump 來看，看到有大量的 connection 等待。如下圖所示：

上面是全是 object.wait 狀態的，還有一些 running 的是這樣的：

- locked <0x000000066885da80> (a java.io.BufferedInputStream)

分析過程

看到這些數據，我想既然數據庫有這么多連接都在等待，那就查查數據庫的連接和 session 的狀態。

居然只有幾個 threads running，多刷了幾遍，最多的也是只有10個左右。然后又回到應用里去查看應用主機和數據庫主機之間的 TCP 連接

netstat -naop|grep 4001|wc -l 314

多刷了幾次，也是說有 300 多是建立連接的，當然有些已經是 keepalive 狀態了。但是 ESTABLISHED 的狀態也是很多的連接。

看來這個 JDBC 有點多呀。但是這邊多，數據庫里在忙的卻沒那么多。如果

性能分析之公有云網絡帶寬導致 TPS 低 RT 高

到這里為止，和連接有關的東西，還有一個沒有查，就是網絡狀態。于是 iftop 一下。

網絡流量 200 M左右應該算是比較正常。

但是為什么幾個線程梯度都是這么多網絡流量？如果是JDBC太多導致系統切換過多而 TPS 上不去，那為什么中斷不多呢？或者是帶寬就這樣多？

帶寬就這么多嗎？有這個意識之后，我就讓人把壓力停了，先測一下網絡帶寬。然后就 iperf 了一下，結果帶寬只有 300 多M。嗯？怎么只有 300 多M？又被公有云給公有了嗎？

于是就把數據中心的人叫過來問了一下，他們說這個共享的帶寬，可能 300M 已經不算小了。

為了驗證這一點，做了如下測試：

看來公有云的網絡吞吐量確實只能這樣了。

后續還是到準生產上玩吧。

數據庫網絡

標簽：性能分析公有云網絡

服務端I/O性能大比拼：Node、PHP、Java、Go">服務端I/O性能大比拼：Node、PHP、Java、Go

799 2022-05-30

屏幕 錄制">關于屏幕 錄制

799 2022-05-30

excel求和與計算器求和相差0.01（excel求和0.00）

799 2022-05-30

<tfoot id="qkugy"></tfoot>

<fieldset id="qkugy"></fieldset>

<ul id="qkugy"></ul>

性能 分析之公有云 網絡帶寬導致 TPS 低 RT 高

服務端I/O性能大比拼：Node、PHP、Java、Go">服務端I/O性能大比拼：Node、PHP、Java、Go

屏幕 錄制">關于屏幕 錄制

excel求和與計算器求和相差0.01（excel求和0.00）

推薦文章

企業生產管理是什么，企業生產管理軟件

進盤點進銷存軟件排行榜前十名

進銷存系統哪個簡單好用？進銷存系統優點

工廠生產管理（工廠生產管理流程及制度）

生產管理軟件，機械制造業生產管理，制造業生產過程管理軟件

進銷存軟件和ERP有什么區別？進銷存與erp軟件理解

進銷存如何進行庫存管理

如何利用excel制作銷售訂單管理系統？

數據庫訂單管理系統有哪些功能？數據庫訂單管理系統怎么設計？

什么是數據庫管理系統？

最近發表

熱評文章

零代碼開發是什么？2022低代碼平臺排行榜">零代碼開發是什么？2022低代碼平臺排行榜

進銷存庫存管理 系統（智慧進銷存）">智能進銷存庫存管理系統（智慧進銷存）

在線文檔哪家強？8款在線文檔編輯軟件推薦">在線文檔哪家強？8款在線文檔編輯軟件推薦

WPS2016怎么繪制簡單的價格表?

系統的功能有哪些？餐飲服務系統的構成及工作程序">連鎖餐飲管理系統的功能有哪些？餐飲服務系統的構成及工

進銷存庫存管理盤點">簡單進銷存庫存管理盤點

友情鏈接