服務端技術進階(四)一篇文讀懂分布式系統本質:高吞吐、高可用、可擴展

      網友投稿 960 2022-05-29

      #服務端技術進階( 四)一篇文讀懂分布式系統本質:高吞吐、高可用、可擴展

      ##承載量是分布式系統存在的原因

      當一個互聯網業務獲得大眾歡迎的時候,最顯著碰到的技術問題,就是服務器非常繁忙。當每天有1000萬個用戶訪問你的網站時,無論你使用什么樣的服務器硬件,都不可能只用一臺機器就承載的了。因此,在互聯網程序員解決服務器端問題的時候,必須要考慮如何使用多臺服務器,為同一種互聯網應用提供服務,這就是所謂“分布式系統”的來源。

      然而,大量用戶訪問同一個互聯網業務,所造成的問題并不簡單。從表面上看,要能滿足很多用戶來自互聯網的請求,最基本的需求就是所謂性能需求:用戶反應網頁打開很慢,或者網游中的動作很卡等等。而這些對于“服務速度”的要求,實際上包含的部分卻是以下幾個:高吞吐、高并發、低延遲和負載均衡。

      高吞吐意味著你的系統可以同時承載大量的使用用戶。這里關注的整個系統能同時服務的用戶數。這個吞吐量肯定是不可能用單臺服務器解決的,因此需要多臺服務器協作,才能達到所需要的吞吐量。而在多臺服務器的協作中,如何才能有效的利用這些服務器,不致于其中某一部分服務器成為瓶頸,從而影響整個系統的處理能力,這就是一個分布式系統在架構上需要仔細權衡的問題。

      高并發是高吞吐的一個延伸需求。當我們在承載海量用戶的時候,我們當然希望每個服務器都能盡其所能的工作,而不要出現無謂的消耗和等待的情況。然而,軟件系統并不是簡單的設計就能對同時處理多個任務,做到“盡量多”的處理。很多時候,我們的程序會因為要選擇處理哪個任務,而導致額外的消耗。這也是分布式系統解決的問題。

      低延遲對于人數稀少的服務來說不算什么問題。然而,如果我們需要在大量用戶訪問的時候,也能很快的返回計算結果,這就要困難的多。因為除了大量用戶訪問可能造成請求在排隊外,還有可能因為排隊的長度太長,導致內存耗盡、帶寬占滿等空間性的問題。如果因為排隊失敗而采取重試的策略,則整個延遲會變的更高。所以分布式系統會采用很多請求分揀和分發的做法,盡快的讓更多的服務器來處理用戶的請求。但是,由于一個數量龐大的分布式系統,必然需要把用戶的請求經過多次的分發,整個延遲可能會因為這些分發和轉交的操作,變得更高,所以分布式系統除了分發請求外,還要盡量想辦法減少分發的層次數,以便讓請求能盡快的得到處理。

      由于互聯網業務的用戶來自全世界,因此在物理空間上可能來自各種不同延遲的網絡和線路,在時間上也可能來自不同的時區,所以要有效的應對這種用戶來源的復雜性,就需要把多個服務器部署在不同的空間來提供服務。同時,我們也需要讓同時發生的請求,有效的讓多個不同服務器承載。所謂的負載均衡,就是分布式系統與生俱來需要完成的功課。

      由于分布式系統幾乎是解決互聯網業務承載量問題的最基本方法,所以作為一個服務器端程序員,掌握分布式系統技術就變得異常重要了。然而,分布式系統的問題并非是學會用幾個框架和使用幾個庫就能輕易解決的。因為當一個程序在一個電腦上運行,變成了在無數個電腦上同時協同運行,在開發、運維上都會帶來很大的差別。

      ##分布式系統提高承載量的基本手段

      ###分層模型(路由、代理)

      使用多臺服務器來協同完成計算任務,最簡單的思路就是讓每個服務器都能完成全部的請求,然后把請求隨機的發給任何一個服務器處理。最早期的互聯網應用中,DNS輪詢就是這樣的做法:當用戶輸入一個域名試圖訪問某個網站,這個域名會被解釋成多個IP地址中的一個,隨后這個網站的訪問請求就被發往對應IP的服務器了,這樣多個服務器(多個IP地址)就能一起解決處理大量的用戶請求。

      然而,單純的請求隨機轉發,并不能解決一切問題。比如我們很多互聯網業務,都是需要用戶登錄的。在登錄某一個服務器后,用戶會發起多個請求,如果我們把這些請求隨機的轉發到不同的服務器上,那么用戶登錄的狀態就會丟失,造成一些請求處理失敗。簡單的依靠一層服務轉發是不夠的,所以我們會增加一批服務器,這些服務器會根據用戶的Cookie,或者用戶的登錄憑據,來再次轉發給后面具體處理業務的服務器。

      除了登錄的需求外,我們還發現,很多數據是需要數據庫來處理的,而我們的這些數據往往都只能集中到一個數據庫中,否則在查詢的時候就會丟失其他服務器上存放的數據結果。所以往往我們還會把數據庫單獨出來成為一批專用的服務器。

      至此,我們就會發現,一個典型的三層結構出現了:接入、邏輯、存儲。然而,這種三層結果并不就能包醫百病。例如,當我們需要讓用戶在線互動(網游就是典型),那么分割在不同邏輯服務器上的在線狀態數據,是無法知道對方的,這樣我們就需要專門做一個類似互動服務器的專門系統,讓用戶登錄的時候也同時記錄一份數據到它那里,表明某個用戶登錄在某個服務器上,而所有的互動操作要先經過這個互動服務器才能正確地把消息轉發到目標用戶的服務器上。

      又例如,當我們在使用網上論壇(BBS)系統的時候,我們發的文章不可能只寫入一個數據庫里,因為太多人的閱讀請求會拖死這個數據庫。我們常常會按論壇板塊來寫入不同的數據庫,又或者是同時寫入多個數據庫。這樣把文章數據分別存放到不同的服務器上,才能應對大量的操作請求。然而,用戶在讀取文章的時候,就需要有一個專門的程序,去查找具體文章在哪一個服務器上,這時候我們就要架設一個專門的代理層,把所有的文章請求先轉交給它,由它按照我們預設的存儲計劃,去找對應的數據庫獲取數據。

      根據上面的例子來看,分布式系統雖然具有三層典型的結構,但是實際上往往不止有三層,而是根據業務需求,會設計成多個層次的。為了把請求轉交給正確的進程處理,我們設計很多專門用于轉發請求的進程和服務器。這些進程我們常常以Proxy或者Router來命名,一個多層結構常常會具備各種各樣的Proxy進程。這些代理進程,很多時候都是通過TCP來連接前后兩端。然而,TCP雖然簡單,但是卻存在發生故障后不易恢復的問題。而且TCP的網絡編程也是有點復雜的。——所以,人們設計出更好進程間通訊機制:消息隊列。

      盡管通過各種Proxy或者Router進程能組建出強大的分布式系統,但是其管理的復雜性也是非常高的。所以人們在分層模式的基礎上想出了更多的方法,來讓這種分層模式的程序變得更簡單高效。

      ##并發模型(多線程、異步)

      當我們在編寫服務器端程序時會明確地知道大部分的程序都是會處理同時到達的多個請求的。因此我們不能好像Hello World那么簡單的從一個簡單的輸入計算出輸出來。因為我們會同時獲得很多個輸入,需要返回很多個輸出。在這些處理的過程中,往往我們還會碰到需要“等待”或“阻塞”的情況,比如我們的程序要等待數據庫處理結果,等待向另外一個進程請求結果等等……如果我們把請求一個挨著一個的處理,那么這些空閑的等待時間將白白浪費,造成用戶的響應延時增加,以及整體系統的吞吐量極度下降。

      所以在如何同時處理多個請求的問題上,業界有2個典型的方案。一種是多線程,一種是異步。在早期的系統中,多線程或多進程是最常用的技術。這種技術的代碼編寫起來比較簡單,因為每個線程中的代碼都肯定是按先后順序執行的。但是由于同時運行著多個線程,所以你無法保障多個線程之間的代碼的先后順序。這對于需要處理同一個數據的邏輯來說,是一個非常嚴重的問題,最簡單的例子就是顯示某個新聞的閱讀量。兩個++操作同時運行,有可能結果只加了1,而不是2。所以多線程下,我們常常要加很多數據的鎖,而這些鎖又反過來可能導致線程的死鎖。

      因此異步回調模型在隨后比多線程更加流行,除了多線程的死鎖問題外,異步還能解決多線程下,線程反復切換導致不必要開銷的問題:每個線程都需要一個獨立的棧空間,在多線程并行運行的時候,這些棧的數據可能需要來回的拷貝,這額外消耗了CPU。同時由于每個線程都需要占用棧空間,所以在大量線程存在的時候,內存的消耗也是巨大的。而異步回調模型則能很好的解決這些問題,不過異步回調更像是“手工版”的并行處理,需要開發者自己去實現如何“并行”的問題。

      異步回調基于非阻塞的I/O操作(網絡和文件),這樣我們就不用在調用讀寫函數的時候“卡”在那一句函數調用,而是立刻返回“有無數據”的結果。而Linux的epoll技術,則利用底層內核的機制,讓我們可以快速的“查找”到有數據可以讀寫的連接\文件。由于每個操作都是非阻塞的,所以我們的程序可以只用一個進程就可以處理大量并發的請求。因為只有一個進程,所以所有的數據處理,其順序都是固定的,不可能出現多線程中,兩個函數的語句交錯執行的情況,因此也不需要各種“鎖”。從這個角度看,異步非阻塞的技術大大簡化了開發的過程。由于只有一個線程,也不需要有線程切換之類的開銷,所以異步非阻塞成為很多對吞吐量、并發有較高要求的系統首選。

      ##緩沖技術

      在互聯網服務中,大部分的用戶交互都是需要立刻返回結果的,所以對于延遲有一定的要求。而類似網絡游戲之類服務,延遲更是要求縮短到幾十毫秒以內。所以為了降低延遲,緩沖是互聯網服務中最常見的技術之一。

      早期的WEB系統中,如果每個HTTP請求的處理,都去數據庫(MySQL)讀寫一次,那么數據庫很快就會因為連接數占滿而停止響應。因為一般的數據庫支持的連接數都只有幾百,而WEB應用的并發請求輕松能到幾千。這也是很多設計不良的網站在訪問數量驟增就卡死的最直接原因。為了盡量減少對數據庫的連接和訪問,人們設計了很多緩沖系統——把從數據庫中查詢的結果存放到更快的設施上,如果沒有相關聯的修改,就直接從這里讀。

      最典型的WEB應用緩沖系統是Memcache。由于PHP本身的線程結構是不帶狀態的。早期PHP本身甚至連操作“堆”內存的方法都沒有,所以那些持久的狀態就一定要存放到另外一個進程里。而Memcache就是一個簡單可靠的存放臨時狀態的開源軟件。很多PHP應用現在的處理邏輯都是先從數據庫讀取數據,然后寫入Memcache;當下次請求來的時候,先嘗試從Memcache里面讀取數據,這樣就有可能大大減少對數據庫的訪問。

      然而Memcache本身是一個獨立的服務器進程,這個進程自身并不帶特別的集群功能。也就是說這些Memcache進程并不能直接組建成一個統一的集群。如果一個Memcache不夠用,我們就要手工用代碼去分配,哪些數據應該去哪個Memcache進程。——這對于真正的大型分布式網站來說,管理一個這樣的緩沖系統,是一個很繁瑣的工作。

      因此人們開始考慮設計一些更高效的緩沖系統:從性能上來說,Memcache的每筆請求都要經過網絡傳輸才能去拉取內存中的數據。這無疑是有一點浪費的,因為請求者本身的內存,也是可以存放數據的。——這就是促成了很多利用請求方內存的緩沖算法和技術,其中最簡單的就是使用LRU算法,把數據放在一個哈希表結構的堆內存中。

      而Memcache不具備集群功能也是一個痛點。于是很多人開始設計,如何讓數據緩存分布到不同的機器上。最簡單的思路是所謂讀寫分離,也就是緩存每次寫,都寫到多個緩沖進程上記錄,而讀則可以隨機讀任何一個進程。在業務數據有明顯的讀寫不平衡差距上,效果是非常好的。

      然而,并不是所有的業務都能簡單的用讀寫分離來解決問題,比如一些在線互動的互聯網業務,比如社區、游戲。這些業務的數據讀寫頻率并沒很大的差異,而且也要求很低的延遲。因此人們又再想辦法,把本地內存和遠端進程的內存緩存結合起來使用,讓數據具備兩級緩存。同時,一個數據不再同時存在所有的緩存進程上,而是按一定規律分布在多個進程上。——這種分布規律使用的算法,最流行的就是所謂“一致性哈希”。這種算法的好處是,當某一個進程失效掛掉,不需要把整個集群中所有的緩存數據重新修改一次位置。你可以想象一下,如果我們的數據緩存分布,是用簡單的以數據ID對進程數取模,那么一旦進程數變化,每個數據存放的進程位置都可能變化,這對于服務器的故障容忍是不利的。

      Orcale公司旗下有一款叫Coherence的產品,是在緩存系統上設計比較好的。這個產品是一個商業產品,支持利用本地內存緩存和遠程進程緩存協作。集群進程是完全自管理的,還支持在數據緩存所在進程進行用戶自定義的計算(處理器功能),這就不僅僅是緩存了,還是一個分布式的計算系統。

      ##存儲技術(NoSQL)

      相信CAP理論大家已經耳熟能詳,然而在互聯發展的早期,大家都還在使用MySQL的時候,如何讓數據庫存放更多的數據,承載更多的連接,很多團隊都是絞盡腦汁。甚至于有很多業務主要的數據存儲方式是文件,數據庫反而變成是輔助的設施了。

      附:CAP原則又稱CAP定理,指的是在一個分布式系統中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分區容錯性),三者不可得兼。

      然而,當NoSQL興起,大家突然發現,其實很多互聯網業務,其數據格式是如此簡單,很多時候根本不需要關系型數據庫那種復雜的表格。對于索引的要求往往也只是根據主索引搜索。而更復雜的全文搜索,本身數據庫也做不到。所以現在相當多的高并發互聯網業務首選NoSQL來做存儲設施。最早的NoSQL數據庫有MongoDB等,現在最流行的似乎就是Redis了。甚至有些團隊把Redis也當成緩沖系統的一部分,實際上也是認可Redis的性能優勢。

      NoSQL除了更快、承載量更大以外,更重要的特點是這種數據存儲方式只能按照一條索引來檢索和寫入。這樣的需求約束帶來了分布上的好處,我們可以按照這條主索引來定義數據存放的進程(服務器)。這樣一個數據庫的數據就能很方便的存放在不同的服務器上。在分布式系統的必然趨勢下,數據存儲層終于也找到了分布的方法。

      ##布式系統在可管理性上造成的問題

      分布式系統并不是簡單的把一堆服務器一起運行起來就能滿足需求的。對比單機或少量服務器的集群,有一些特別需要解決的問題等待著我們。

      ###硬件故障率

      所謂分布式系統,肯定就不是只有一臺服務器。假設一臺服務器的故障時間是1%,那么當你有100臺服務器的時候,那就幾乎總有一臺是在故障狀態的。雖然這個比方不一定很準確,但是,**當你的系統所涉及的硬件越來越多,硬件的故障也會從偶然事件變成一個必然事件。**一般我們在寫功能代碼的時候,是不會考慮到硬件故障的時候應該怎么辦的。而如果在編寫分布式系統的時候,就一定需要面對這個問題了。否則,很可能只有一臺服務器出故障,整個數百臺服務器的集群都工作不正常了。

      除了服務器自己的內存、硬盤等故障,服務器之間的網絡線路故障更加常見。而且這種故障還有可能是偶發的,或者是會自動恢復的。面對這種問題,如果只是簡單的把“出現故障”的機器剔除出去,那還是不夠的。因為網絡可能過一會兒就又恢復了,而你的集群可能因為這一下的臨時故障,丟失了過半的處理能力。

      如何讓分布式系統在各種可能隨時出現故障的情況下,盡量的自動維護和維持對外服務,成為了編寫程序時就要考慮的問題。由于要考慮到這種故障的情況,所以我們在設計架構的時候,也要有意識地預設一些冗余、自我維護的功能。這些都不是產品上的業務需求,完全就是技術上的功能需求。能否在這方面提出對的需求,然后正確的實現,是服務器端程序員最重要的職責之一。

      ###資源利用率優化

      分布式系統的集群包含了很多服務器,當這樣一個集群的硬件承載能力到達極限的時候,最自然的想法就是增加更多的硬件。然而,一個軟件系統并不是通過“增加”硬件就可以輕松提高承載性能的。因為軟件在多個服務器上的工作需要復雜細致的協調工作。在對一個集群擴容的時候,我們往往會要停掉整個集群的服務,然后修改各種配置,最后才能重新啟動一個加入了新的服務器的集群。

      由于在每個服務器的內存里,都可能會有一些用戶使用的數據,所以如果冒然在運行的時候,就試圖修改集群中提供服務的配置,很可能會造成內存數據的丟失和錯誤。因此,運行時擴容在對無狀態的服務是比較容易的,比如增加一些Web服務器。但如果是在有狀態的服務上,比如網絡游戲,幾乎是不可能進行簡單運行時擴容的。

      分布式集群除了擴容,還有縮容的需求。當用戶人數下降,服務器硬件資源出現空閑的時候,我們往往需要這些空閑的資源能利用起來,放到另外一些新的服務集群里去。縮容和集群中有故障需要容災有一定類似之處,區別是縮容的時間點和目標是可預期的。

      由于分布式集群中的擴容、縮容,以及希望盡量能在線操作,這導致了非常復雜的技術問題需要處理,比如集群中互相關聯的配置如何正確高效的修改、如何對有狀態的進程進行操作、如何在擴容縮容的過程中保證集群中節點之間通信的正常。作為服務器端程序員,會需要花費大量的精力來應對多個進程的集群狀態變化造成的一系列問題。

      ###軟件服務內容更新

      服務端技術進階(四)一篇文讀懂分布式系統本質:高吞吐、高可用、可擴展

      現在都流行用敏捷開發模式中的“迭代”,來表示一個服務不斷的更新程序,滿足新的需求,修正BUG。如果我們僅僅管理一臺服務器,那么更新這一臺服務器上的程序是非常簡單的:只要把軟件包拷貝過去,然后修改下配置就好。但是如果你要對成百上千的服務器去做同樣的操作,就不可能每臺服務器登錄上去處理。

      服務器端的批量程序安裝部署工具,是每個分布式系統開發者都需要的。然而,我們的安裝工作除了拷貝二進制文件和配置文件外,還會有很多其他的操作需要完成。比如打開防火墻、建立共享內存文件、修改數據庫表結構、改寫一些數據文件等等……甚至有一些還要在服務器上安裝新的軟件。

      如果我們在開發服務器端程序的時候,就考慮到軟件更新、版本升級的問題,那么我們對于配置文件、命令行參數、系統變量的使用,就會預先做一定的規劃,這能讓安裝部署的工具運行更快,可靠性更高。

      除了安裝部署的過程,還有一個重要的問題,就是不同版本間數據的問題。我們在升級版本的時候,舊版本程序生成的一些持久化數據一般都是舊的數據格式;而我們的升級版本中如果涉及到了修改的數據格式,比如數據表結構,那么這些舊格式的數據都要轉換改寫成新版本的數據格式才行。這導致了我們在設計數據結構的時候,就要考慮清楚這些表格的結構,是用最簡單直接的表達方式來讓將來的修改更簡單;還是一早就預計到修改的范圍,專門預設一些字段,或者使用其他形式存放數據。

      除了持久化數據以外,如果存在客戶端程序(如手機APP),這些客戶端程序的升級往往不能和服務器同步,如果升級的內容包含了通信協議的修改,這就造成了我們必須為不同的版本部署不同的服務器端系統的問題。為了避免同時維護多套服務器,我們在軟件開發的時候,往往傾向于所謂“版本兼容”的協議定義方式。而怎樣設計的協議才能有很好的兼容性,又是服務器端程序需要仔細考慮的問題。

      ###數據統計和決策

      一般來說,分布式系統的日志數據都是被集中到一起,然后統一進行統計的。然而,當集群的規模達到一定程度的時候,這些日志的數據量會變得非常恐怖。很多時候,統計一天的日志量要消耗計算機運行一天以上的時間。所以,日志統計這項工作,也變成一門非常專業的活動。

      經典的分布式統計模型,有Google的Map Reduce模型。這種模型既有靈活性,也能利用大量服務器進行統計工作。但是缺點是易用性往往不夠好,因為這些數據的統計和我們常見的SQL數據表統計有非常大的差異,所以我們最后還是常常把數據丟到MySQL里面去做更細層面的統計。

      由于分布式系統日志數量的龐大,以及日志復雜程度的提高。我們變得必須要掌握類似Map Reduce技術,才能真正的對分布式系統進行數據統計。而且我們還需要想辦法提高統計工作的工作效率。

      ![這里寫圖片描述](https://img-blog.csdnimg.cn/img_convert/e415b30dbbbc5ab4a2c1175b0e899fa7.png) ![這里寫圖片描述](https://img-blog.csdnimg.cn/img_convert/5ea7f92a4b50d8465587c45e4b34108a.png) ![這里寫圖片描述](https://img-blog.csdnimg.cn/img_convert/f26b6c802951d54cd92c22204011ed16.png)

      任務調度 分布式

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:前端基礎知識第一章---HTML
      下一篇:小飛機大戰外星人的小游戲的全部源代碼(硬肝) PS:各模塊名和代碼中需要的圖片放在了文章最后,方便各位學習。
      相關文章
      亚洲色偷偷偷鲁综合| 亚洲国产专区一区| 国产亚洲婷婷香蕉久久精品| 亚洲 综合 国产 欧洲 丝袜| 亚洲欧美第一成人网站7777| 国产成人精品日本亚洲18图 | 亚洲精品免费在线视频| 久久久久亚洲AV无码永不| 亚洲今日精彩视频| 久久精品国产亚洲AV嫖农村妇女| 亚洲2022国产成人精品无码区| 亚洲AV无码码潮喷在线观看| 亚洲gv猛男gv无码男同短文| 亚洲精品线在线观看| 亚洲国产二区三区久久| 亚洲综合一区二区国产精品| 久久久亚洲欧洲日产国码是AV| 亚洲精品视频在线播放| 亚洲国产成人久久77| 国产成人亚洲精品| 亚洲人成网站在线播放2019| 亚洲日韩一区二区一无码| 日韩国产欧美亚洲v片| 国产成人不卡亚洲精品91| 亚洲成人国产精品| 亚洲综合日韩久久成人AV| 国产日韩亚洲大尺度高清| 亚洲视频在线播放| 亚洲国产成人资源在线软件| 成人亚洲国产va天堂| 久久久久久久久无码精品亚洲日韩| 日韩精品亚洲专区在线观看| 国产亚洲成人久久| 国产亚洲精品国产| 亚洲精品视频久久| 亚洲欧美成aⅴ人在线观看| 国产AV日韩A∨亚洲AV电影| 中文字幕亚洲乱码熟女一区二区 | 国产精品xxxx国产喷水亚洲国产精品无码久久一区 | 国产精品手机在线亚洲| 精品亚洲成α人无码成α在线观看 |