【高并發】緩存最關心的問題是什么?有哪些類型?回收策略和算法?
大家好,我是冰河~~

往往開始做一個項目時,不會過多的考慮性能問題,以快速迭代功能為主。后續隨著業務的快速發展,系統運行的性能越來越慢,此時,就需要對系統進行相應的優化,而效果最顯著的就是給系統加上緩存。那么,問題來了,當你為系統加上緩存時,有沒有考慮過使用緩存需要注意哪些事項呢?
緩存命中率
緩存命中率是從緩存中讀取數據的次數與總讀取次數的比率,命中率越高越好。緩存命中率=從緩存中讀取次數 / (總讀取次數 (從緩存中讀取次數 + 從慢速設備上讀取次數))。這是一個非常重要的監控指標,如果做緩存,則應通過監控這個指標來看緩存是否工作良好。
緩存類型
緩存類型總體上來看,可以分為:堆緩存、堆外緩存、磁盤緩存和分布式緩存。
堆內存
使用Java堆內存來存儲對象。使用堆緩存的好處是沒有序列化/反序列化,是最快的緩存。缺點也很明顯,當緩存的數據量很大時,GC(垃圾回收)暫停時間會變長,存儲容量受限于堆空間大小。一般通過軟引用/弱引用來存儲緩存對象。即當堆內存不足時,可以強制回收這部分內存釋放堆內存空間。一般使用堆緩存存儲較熱的數據。可以使用Guava Cache、Ehcache 3.x、 MapDB實現。
堆外內存
即緩存數據存儲在堆外內存,可以減少GC暫停時間(堆對象轉移到堆外,GC掃描和移動的對象變少了),可以支持更多的緩存空間(只受機器內存大小限制,不受堆空間的影響)。但是,讀取數據時需要序列化/反序列化。因此,會比堆緩存慢很多。可以使用Ehcache 3.x、 MapDB實現。
磁盤緩存
即緩存數據存儲在磁盤上,在JVM重啟時數據還存在,而堆/堆外緩存數據會丟失,需要重新加載。可以使用Ehcache 3.x、MapDB實現。
分布式緩存
分布式緩存可以使用ehcache-clustered(配合Terracotta server)實現Java進程間分布式緩存。也可以使用Memcached、Redis實現。
使用分布式緩存時,有兩種模式如下:
單機模式:存儲最熱的數據到堆緩存,相對熱的數據到堆外緩存,不熱的數據到磁盤緩存。
集群模式:存儲最熱的數據到堆緩存,相對熱的數據到對外緩存,全量數據到分布式緩存。
緩存回收策略
緩存的回收策略總體上來說包含:基于空間的回收策略、基于容量(空間)的回收策略、基于時間的回收策略和基于對象引用的回收策略。
基于空間
基于空間指緩存設置了存儲空間,如設置為10MB,當達到存儲空間上限時,按照一定的策略移除數據。
基于容量
基于容量指緩存設置了最大大小,當緩存的條目超過最大大小時,按照一定的策略移除舊數據。
基于時間
TTL(Time To Live):存活期,即緩存數據從創建開始直到到期的一個時間段(不管在這個時間段內有沒有被訪問,緩存數據都將過期)。
TTI(Time To Idle):空閑期,即緩存數據多久沒被訪問后移除緩存的時間。
基于對象引用
軟引用:如果一個對象是軟引用,則當JVM堆內存不足時,垃圾回收器可以回收這些對象。軟引用適合用來做緩存,從而當JVM堆內存不足時,可以回收這些對象騰出一些空間供強引用對象使用,從而避免OOM。
弱引用:當垃圾回收器回收內存時,如果發現弱引用,則將它立即回收。相對于軟引用,弱引用有更短的生命周期。
注意:只有在沒有其他強引用對象引用弱引用/軟引用對象時,垃圾回收時才回收該引用。即如果有一個對象(不是弱引用/軟引用對象)引用了弱引用/軟引用對象,那么垃圾回收時不會回收該弱引用/軟引用對象。
回收算法
使用基于空間和基于容量的緩存會使用一定的策略移除舊數據,通常包含:FIFO算法、LRU算法和LFU算法。
FIFO(First In First Out):先進先出算法,即先放入緩存的先被移除。
LRU(Least Recently Used):最近最少使用算法,時間時間距離現在最久的那個被移除。
LFU(Least Frequently Used):最不常用算法,一定時間段內使用次數(頻率)最少的那個被移除。
實際應用中基于LRU的緩存居多。
好了,今天就聊到這兒吧!別忘了點個贊,給個在看和轉發,讓更多的人看到,一起學習,一起進步!!
Java JDK 任務調度 分布式 多線程
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。