計算機領域多處地方用到緩存,比如說為了緩解CPU和內存之間的速度不匹配問題,我們往往通過增加一級、二級、三級緩存,CPU先從緩存中取指令,如果取不到,再從內存中取,并更新緩存,同時,根據程序的局部性原理,使得大部分情況下緩存都會命中。
創新互聯云計算的互聯網服務提供商,擁有超過13年的服務器租用、大邑服務器托管、云服務器、網站空間、網站系統開發經驗,已先后獲得國家工業和信息化部頒發的互聯網數據中心業務許可證。專業提供云主機、網站空間、國際域名空間、VPS主機、云服務器、香港云服務器、免備案服務器等。
目前,Web應用的核心數據通常存放在數據庫中,比如說用戶信息、訂單信息、交易信息等,同時,數據庫和編程語言是無關的,通過SQL交互,Java、Php等語言寫的程序需要訪問數據庫,執行業務邏輯,展示結果給用戶。但是數據庫有一定的局限性,譬如:1.數據庫連接是非常 "昂貴 "的資源,為了復用這些資源,目前采用連接池技術,2. 連接池的連接數是有限的,如果用戶過多,勢必要等待,3. 讀寫數據時需要加鎖。
通過上述介紹,我們知道一個大型系統中數據庫往往會成為瓶頸,我們不能每次訪問都訪問數據庫,尤其是在多用戶,大并發的情況下。面對這種情況,我們通常采用何種方法呢?在計算機行業中的所有問題,都可以通過增加一個抽象層來解決。那么,針對數據庫這個瓶頸,我們可以在應用層和數據庫層增加一層,即緩存層。
如果你是某某大型公司的首席架構師,現在公司需要自研一套緩存系統,你應該怎么設計呢?我想在設計之前應該想好以下幾個問題:
目前常見的數據格式有序列化對象、XML、JSON、字符串(key,value)和基本的數據結構,其中針對Java語言的序列化對象有序列化和反序列化,而Google研發的protobuf是和語言無關的,比如說Python將某對象序列化,Java能將這個對象進行反序列化。
考慮到公司有很多后端小組,并且使用不同的編程語言,這就要求我們自研的緩存系統應該和編程語言無關,基于此,我們需要制定一套協議來支持各種語言。客戶端如何使用這套協議?最常見的就是客戶端/服務器模型。首先,服務器監聽請求;接著,客戶端發送請求,獲得響應,其中客戶端發送的請求就是協議;最后,基于Socket通信。比如說:set 'name' 'mukedada'
、get name
。
緩存服務器端在啟動的時候,應該設置緩存大小,當緩存被沾滿時,采用LRU算法。
對于大型應用服務器,單機的緩存服務器是支撐不了的。那么,就需要對緩存服務器進行水平擴展(即增刪服務器,當活動結束后,就需要考慮刪減服務器),那么用什么算法讓數據相對平均的分配到每臺服務器?同時,這個算法應該放在客戶端還是服務端呢?
它的典型應用是Memcached,Memcached使用的是一致性Hash算法,在介紹它之前,我們先來看一下余數算法。對于用戶要存儲的(key,value),計算key的整數哈希值,然后對服務器的數目求余,這樣來確定存儲服務器。這個方法存在一個致命的問題:當服務器個數發送變化時,余數會發生變化,這樣一來需要重新到數據庫獲取數據。
為了加深大家的理解,舉個具體的實例:假設有3臺服務器0、1、2,key1、key2的hash值分別是100,99,對應的余數分別是1和0,也就是說它們分別存放于編號為1和0的服務器中,現在如果增加一臺服務器3,那么它們的余數也會隨之發生變化,100%4 = 0,99%4 = 3,但是它們在0、3號服務器卻找不到對應的數據。
為了解決余數算法存在的問題,我們的先輩們提出了分布式一致性hash算法。它思路就是當服務器個數發生變化時,盡可能的減少影響。譬如:當我們新增node5,只影響局部范圍內的key,而余數算法則影響全局。
但是它也存在分布不均勻的問題,導致有的服務器上緩存的數據多,有的少。一種方法就是虛擬節點,也就是說讓一個服務器化身為多個虛擬節點,分布到環上。Memcache采用的就是這種方法。
另一種方法就是Hash槽。Redis采用的就是這種方法,在介紹路由實現時會詳細介紹該方法。
代理實現
代理程序放在服務器端,它的典型案例有Twemproxy和Codis。它的基本思想:應用程序向Proxy發送請求,Proxy通過一定算法計算得到數據應該從哪個節點獲取,并且返回響應給客戶端。為了防止Proxy出現單點故障,可以通過集群等方式實現Proxy高可用。
CRC16(key)%16384
求余,最終會落到0~16383這個區間的槽中。但是,每當新增一個節點時,需要從原先的每個節點中獲取hash槽,這時需要涉及數據遷移的過程。如果在數據遷移的過程中有一個用戶請求,這個時候該怎么辦?目前一種解決方法是讓node1和node4的持有相同的槽,但是設置不同的狀態,例如node1的槽的狀態設置為正在遷移,而node4的狀態是正在導入,首先將請求交給node1,如果node1中有數據則直接返回,如果沒有則交給ndoe4。如下圖所示。
同時,我們注意到node1、node2等存在單點故障,為增加可用性,我們對每個node使用主從模式。數據首先寫入到master節點,之后有兩種方式,方式一,直接將結果返回給客戶端,然后將master節點數據同步到slave從節點中,這樣做的好處就是響應周期短,缺點是可能存在數據不一致的情況,即master節點將結果返回給客戶端之后,還沒來得及將數據同步到slave節點中就發生故障,那么這部分數據就會丟失。方式二,數據寫入到master節點之后,需要將數據同步到slave節點成功之后,再將結果返回給客戶端,這種方式保證了數據強一致性,但是用戶需要更長的時間來等待。
用戶每次訪問緩存都沒有命中,導致每次請求都要訪問數據庫,這就是緩存擊穿問題,出現這種情況導致緩存沒起效果,反而增加了系統消耗。針對這個問題,一般諸如雙十一等活動都會在活動開始之前將用戶信息預先存放到緩存中。
另外有需要云服務器可以了解下創新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業上云的綜合解決方案,具有“安全穩定、簡單易用、服務可用性高、性價比高”等特點與優勢,專為企業上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
網頁名稱:漫談Web緩存架構-創新互聯
網站URL:http://vcdvsql.cn/article44/gijee.html
成都網站建設公司_創新互聯,為您提供移動網站建設、定制網站、網站收錄、建站公司、App開發、品牌網站制作
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯