怎么去除網址(怎樣去除圖片上的網址)
878
2022-05-28
關于RabbitMQ
出身:誕生于金融行業的消息隊列
語言:Erlang
協議:AMQP(Advanced Message Queuing Protocol 高級消息隊列協議)
關鍵詞:內存隊列,高可用,一條消息
隊列結構
Producer/Consumer:生產者消費者
Exchange:交換器,可以理解為隊列的路由邏輯,交換器主要有三種,圖中是Direct交換器
Queue:隊列
Binding:綁定關系,實際是交換器上映射隊列的規則
發送和消費一條消息
在上圖的模式下,交換器的類型為Direct,偽代碼表示消息的生產和消費
#消息發送方法 #messageBody?消息體 #exchangeName?交換器名稱 #routingKey?路由鍵 publishMsg(messageBody,exchangeName,routingKey){ ?...... } #消息發送 publishMsg("This?is?a?warning?log","exchange","log.warning");
RoutingKey=log.warning,和隊列A與交換器的綁定一致,所以消息被路由到了隊列A上。
對于消息消費而言,消費者直接指定要消費的隊列即可,比如指定消費隊列A的數據。
需要注意的是,在消費者消費完成數據后,返回給RabbitMq ACK消息,RabbitMq會刪掉隊列中的該條信息。
在Exchange這個模塊上,RabbitMq主要支持了Direct,Fanout,Topic三種路由模式,RabbitMq在路由模式上下功夫,也說明了他在設計上想要滿足多樣化的需求。
Direct和Fanout模式比較好理解,類似于單播和廣播模式,Topic模式比較有意思,它支持自定義匹配規則,按照規則把所有滿足條件的消息路由到指定隊列,能夠幫助開發者靈活應對各類需求。
RabbitMQ的消息默認是在內存里的,實際上不光是消息,Exchange路由等信息實際都在內存中。內存的優點是高性能,問題在于故障后無法恢復。所以RabbitMQ也支持持久化的存儲,也就是寫磁盤。
要在RabbitMQ中持久化消息,要同時滿足三個條件:
消息投體時使用持久化投遞模式
目標交換器是配置為持久化的
目標隊列是配置為持久化的
RabbitMQ持久化消息的方式是常見的寫日志方式:
當一條持久化消息發送到持久化的Exchange上時,RabbitMQ會在消息提交到日志文件后,才發送響應。
一旦這條消息被消費后,RabbitMQ會將會把日志中該條消息標記為等待垃圾收集,之后會從日志中清除。
如果出現故障,自動重建Exchange,Bindings和Queue,同時通過重播持久化日志來恢復消息。
消息持久化的優缺點很明顯,擁有故障恢復能力的同時,也帶來了性能的急劇下降。同時,由于RabbitMQ默認情況下是沒有冗余的,假設一個持久化節點崩潰,一致到該節點恢復前,消息和隊列都無法恢復。
1.發后即忘
RabbitMQ默認發布消息是不會返回任何結果給生產者的,所以存在發送過程中丟失數據的風險。
2.AMQP事務
AMQP事務保證RabbitMQ不僅收到了消息,并成功將消息路由到了所有匹配的訂閱隊列,AMQP事務將使得生產者和RabbitMQ產生同步。
雖然事務使得生產者可以確定消息已經到達RabbitMQ中的對應隊列,但是卻會降低2~10倍的消息吞吐量。
3.發送方確認
開啟發送方確認模式后,消息會有一個唯一的ID,一旦消息被投遞給所有匹配的隊列后,會回調給發送方應用程序(包含消息的唯一ID),使得生產者知道消息已經安全到達隊列了。
如果消息和隊列是配置成了持久化,這個確認消息只會在隊列將消息寫入磁盤后才會返回。如果RabbitMQ內部發生了錯誤導致這條消息丟失,那么RabbitMQ會發送一條nack消息,當然我理解這個是不能保證的。
這種模式由于不存在事務回滾,同時整體仍然是一個異步過程,所以更加輕量級,對服務器性能的影響很小。
RabbitMQ RPC
一般的異步服務間,可能會用兩組隊列實現兩個服務模塊之前的異步通信,有趣的是RabbitMQ就內建了這個功能。
RabbitMQ支持消息應答功能,每個AMQP消息頭中有一個Reply_to字段,通過該字段指定消息返回到的隊列名稱(這是一個私有隊列)消息的生產者可以監聽該字段對應的隊列。
RabbitMQ集群的設計目標:
允許消費者和生產者在RabbitMQ節點崩潰的情況下繼續運行
能過通過添加節點來線性擴展消息通信吞吐量
從實際結果看,RabbitMQ完成設計目標上并不十分出色,主要原因在于默認的模式下,RabbitMQ的隊列實例子只存在在一個節點上(雖然后續也支持了鏡像隊列),既不能保證該節點崩潰的情況下隊列還可以繼續運行,也不能線性擴展該隊列的吞吐量。
集群結構
RabbitMQ內部的元數據主要有:
隊列元數據-隊列名稱和屬性
交換器元數據-交換器名稱,類型和屬性
綁定元數據-路由信息
雖然RabbitMQ的隊列實際只會在一個節點上,但元數據可以存在各個節點上。舉個例子來說,當創建一個新的交換器時,RabbitMQ會把該信息同步到所有節點上,這個時候客戶端不管連接的那個RabbitMQ節點,都可以訪問到這個新的交換器,也就能找到交換器下的隊列。
如上圖所示,隊列A的實例實際只在一個RabbitMQ節點上,其它節點實際存儲的是只想該隊列的指針。
為什么RabbitMQ不在各個節點間做復制了,《RabbitMQ實戰》給出了兩個原因:
存儲成本-RabbitMQ作為內存隊列,復制對存儲空間的影響,畢竟內存是昂貴而有限的
性能損耗-發布消息需要將消息復制到所有節點,特別是對于持久化隊列而言,性能的影響會很大
我理解成本這個原因并不完全成立,復制并不一定要復制到所有節點,比如一個隊列可以只做兩個副本,復制帶來的內存成本可以交給使用方來評估,畢竟在內存中沒有堆積的情況下,實際上隊列是不會占用多大內存的。
還有一點是RabbitMQ本身并沒有保證消息消費的有序性,所以實際上隊列被Partition到各個節點上,這樣才能真正達到線性擴容的目的(以RabbitMQ的現狀來說,單隊列實際是無法擴容的,只有在業務層做切分)。
注:RabbitMQ集群中的節點可以是內存節點也可以是磁盤節點,但要求至少有一個磁盤節點,這樣出現故障時才能恢復數據。
鏡像隊列
RabbitMQ自己也考慮到了我們之前分析的單節點長時間故障無法恢復的問題,所以RabbitMQ 2.6.0之后它也支持了鏡像隊列,換個說法也就是副本。
除了發送消息,所有的操作實際都在主拷貝上,從拷貝實際只是個冷備(默認的情況下所有RabbitMQ節點上都會有鏡像隊列的拷貝),如果使用消息確認模式,RabbitMQ會在主拷貝和從拷貝都安全的接受到消息時才通知生產者。
從這個結構上來看,如果從拷貝的節點掛了,實際沒有任何影響,如果主拷貝掛了,那么會有一個從新選主的過程,這也是鏡像隊列的優點,除非所有節點都掛了,才會導致消息丟失。重新選主后,RabbitMQ會給消費者一個消費者取消通知(Consumer Cancellation),讓消費者重連新的主拷貝。
1.RabbitMQ結構
AMQPQueue:負責AMQP協議相關的消息處理,包括接收消息,投遞消息,Confirm消息等
BackingQueue:提供AMQQueue調用的接口,完成消息的存儲和持久化工作
BackingQueue由Q1,Q2,Delta,Q3,Q4五個子隊列構成,在Backing中,消息的生命周期有四個狀態:
Alpha:消息的內容和消息索引都在RAM中。(Q1,Q4)
Beta:消息的內容保存在Disk上,消息索引保存在RAM中。(Q2,Q3)
Gamma:消息的內容保存在Disk上,消息索引在DISK和RAM上都有。(Q2,Q3)
Delta:消息內容和索引都在Disk上。(Delta)
這里以持久化消息為例(可以看到非持久化消息的生命周期會簡單很多),從Q1到Q4,消息實際經歷了一個RAM->DISK->RAM這樣的過程,BackingQueue這么設計的目的有點類似于Linux的Swap,當隊列負載很高時,通過將部分消息放到磁盤上來節省內存空間,當負載降低時,消息又從磁盤回到內存中,讓整個隊列有很好的彈性。因此觸發消息流動的主要因素是:1.消息被消費;2.內存不足。
RabbitMQ會更具消息的傳輸速度來計算當前內存中允許保存的最大消息數量(Traget_RAM_Count),當:內存中保存的消息數量+等待ACK的消息數量>Target_RAM_Count時,RabbitMQ才會把消息寫到磁盤上,所以說雖然理論上消息會按照Q1->Q2->Delta->Q3->Q4的順序流動,但是并不是每條消息都會經歷所有的子隊列以及對應的生命周期。
從RabbitMQ的Backing Queue結構來看,當內部不足時,消息要經歷多個生命周期,在Disk和RAM之間置換,者實際會降低RabbitMQ的處理性能(后續的流控就是關聯的解決方法)。
2.鏡像隊列結構
所有對鏡像隊列主拷貝的操作,都會通過Guarented Multicasting(GM)同步到各個Salve節點,Coodinator負責組播結果的確認。
GM是一種可靠的組播通信協議,保證組組內的存活節點都收到消息。
GM的主播并不是由Master節點來負責通知所有Slave的(目的是為了避免Master壓力過大,同時避免Master失效導致消息無法最終Ack),RabbitMQ把一個鏡像隊列的所有節點組成一個鏈表,由主拷貝發起,由主拷貝最終確認通知到了所有的Slave,而中間由Slave接力的方式進行消息傳播。
從這個結構來看,消息完成整個鏡像隊列的同步耗時理論上是不低的,但是由于RabbitMQ消息的消息確認本身是異步的模式,所以整體的吞吐量并不會受到太大影響。
當RabbitMQ出現內存(默認是0.4)或者磁盤資源達到閾值時,會觸發流控機制,阻塞Producer的Connection,讓生產者不能繼續發送消息,直到內存或者磁盤資源得到釋放。
RabbitMQ基于Erlang/OTP開發,一個消息的生命周期中,會涉及多個進程間的轉發,這些Erlang進程之間不共享內存,每個進程都有自己獨立的內存空間,如果沒有合適的流控機制,可能會導致某個進程占用內存過大,導致OOM。因此,要保證各個進程占用的內容在一個合理的范圍,RabbitMQ的流控采用了一種信用證機制(Credit),為每個進程維護了四類鍵值對:
{credit_from,From}-該值表示還能向消息接收進程From發送多少條消息
{credit_to,To}-表示當前進程再接收多少條消息,就要向消息發送進程增加Credit數量
credit_blocked-表示當前進程被哪些進程block了,比如進程A向B發送消息,那么當A的進程字典中{credit_from,B}的值為0是,那么A的credit_blocked值為[B]
credit_deferred-消息接收進程向消息發送進程增加Credit的消息列表,當進程被Block時會記錄消息信息,Unblock后依次發送這些消息
如圖所示,A進程當前可以發送給B的消息有100條,每發一次,值減1,直到為0,A才會被Block住。B消費消息后,會給A增加新的Credit,這樣A才可以持續的發送消息。這里只畫了兩個進程,多進程串聯的情況下,這中影響也就是從底向上傳遞的。
想學習Java工程化、分布式架構、高并發、高性能、深入淺出、微服務架構、Spring,MyBatis,Netty源碼分析等技術可以加群:479499375,群里有阿里大牛直播講解技術,以及Java大型互聯網技術的視頻免費分享給大家,歡迎進群一起深入交流學習。
總結
注:本文基于的RabbitMQ材料可能較為陳舊,新的RabbitMQ可能會有不同的功能特性
整體來看,RabbitMQ的功能比較豐富(可惜沒有看到延遲,優先級等功能),更適用于偏實時的業務場景,與Kafka這樣的隊列定位上有明顯的區別。它本身應該是一個簡單健壯的組件,但如果要應用在一個大規模的分布式系統中,實際還是需要做一些外部的再次開發,以解決我們前面提到的隊列存儲單點,流控等問題。直觀上看它的運維成本是會比較高的,需要使用方有一定的經驗。
END
看完本文有收獲?請轉發分享給更多人關注「后端開發者社區」,提升Java技能關注后端開發者社區微信公眾號,后臺回復:碼農大禮包?可以獲取最新整理的技術資料一份。涵蓋Java?框架學習、架構師學習等! 文章有幫助的話,在看,轉發吧。 謝謝支持喲 (*^__^*)
RabbitMQ 鏡像服務
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。