bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

如何理解Netflix的信息處理架構-創新互聯

本篇內容介紹了“如何理解Netflix的信息處理架構”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

成都創新互聯主營陸川網站建設的網絡公司,主營網站建設方案,App定制開發,陸川h5小程序制作搭建,陸川網站營銷推廣歡迎陸川等地區企業咨詢

Netflix是一家在線影片租賃提供商,該公司連續五次被評為顧客最滿意的網站,在過去的7年中,Netflix流媒體服務從偶爾有數千用戶在線觀看發展到了數百萬用戶平均每月觀看超過20億個小時的規模。Netflix之所以能夠如此成功,離不開對用戶行為數據的收集與分析,那么Netflix會收集哪些數據,這些數據會用來做什么,其處理架構又是什么呢?

事實上,當用戶開始在Netflix的網站上觀看電影或者電視節目的時候,Netflix的數據系統會創建一個“觀看會話(view)”,描述該會話的所有事件信息都會被收集起來。該觀看會話數據架構能夠應對從用戶體驗到數據分析的諸多場景,其中最主要的場景有三個:

用戶看了哪些視頻?系統需要知道每一個用戶的所有觀看歷史,以便于為用戶推薦相關的視頻內容,同時在頁面上的“最近觀看”一欄中顯示觀看歷史。用戶所看的內容對于用戶興趣的衡量,產品和內容的決定非常重要。
用戶從哪里離開了視頻?對于每一個電影或者電視節目,Netflix會記錄每一個用戶都看到了哪里,從哪個時間點離開的。這使得Netflix的用戶能夠在同一個或者另一個設備上繼續觀看視頻。
當前帳戶現在還在觀看哪些視頻?家庭成員間的帳戶共享使得任何人可以在任何時候觀看自己喜歡的視頻,但是這也意味著當帳戶同時在線數超限的時候,必須要有人放棄觀看。針對這種場景,Netflix的觀看會話數據系統會收集每一個會話的周期性信號以便于決定某個成員是否還在觀看相關視頻。
這些場景的實現離不開強大而穩定的數據處理系統,Netflix目前的系統架構由早期的單數據庫應用程序演變而來,當時的主要需求是能夠低延遲地為用戶提供視頻服務,同時還能夠處理來自于數百萬Netflix流設備的快速增長的數據集。在過去3年多的時間里,Netflix一直在不斷地改進該架構,現在這套系統每天能夠處理千億左右的事件。

當前的架構圖如下:
如何理解Netflix的信息處理架構

整個架構最主要的接口是觀看會話服務,它分為有狀態層和無狀態層兩部分。有狀態層在內存中存有所有活動視圖的新數據。通過對用戶帳戶ID進行mod N的模運算,數據被簡單地劃分為N個有狀態的節點。當有狀態的節點上線的時候,系統會通過一個位置選擇流程決定哪部分數據屬于它們。所有的持久化數據都存儲在Cassandra中,在Cassandra之上有一個Memcached用來保證低延遲的讀取路徑,但是采用這種方式會話數據有可能會過時,同時如果一個有狀態的節點出現了錯誤,那么1/n的瀏覽數據將不能讀寫。無狀態層的引入正是為了解決這一問題,它提升了系統的可用性,當有狀態的節點無法訪問的時候,該層會將過時的數據反饋給用戶。

但是即使是做了諸多改進,以上架構依然存在一些缺陷:

雖然有狀態層使用一個簡單的、服從熱點分布的分片技術,但是Cassandra層并不服從這些熱點;同時,如果將其從一個AWS Region移動到多個AWS Region上運行,那么必須定制一種機制來實現分布在不同Region上的狀態層之間的狀態通信,極大地增加了系統的復雜性。
對于觀看會話服務,它封裝了會話數據的收集、處理和提供功能,隨著系統的演變,功能的增多,該服務的責任也越來越多,增加了運維的難度。
雖然Memcached提供了非常好的吞吐量和延遲特性,但是使用一種能夠為一等數據類型和操作(例如append)提供原生支持的技術能夠更好地滿足相關需求。
為了擴展系統滿足下一個數量級的需要,Netflix正在重新思考自己的基礎架構,新系統在設計時考慮的主要設計原則包括:

可用性比一致性更重要。
微服務。對于有狀態架構中柔和在一起的組件,根據它們的主要目的分離成單獨的服務——或收集、處理或提供數據。將狀態管理功能托管到持久化層,讓應用程序層無狀態,同時組件之間通過事件隊列解耦。
混合持久化。使用多種持久化技術,利用每一種方案的優勢。使用Cassandra實現高容量、低延遲的寫。使用Redis實現高容量、低延遲的讀。
遵循以上原則的新架構實現如下:
如何理解Netflix的信息處理架構

當然,這個架構圖也僅僅是Netflix目前的設計圖,至于實現到何種程度了,我們還未可知。Netflix表示對關鍵系統進行重新架構以使其能夠擴展到下一個數量級是一項非常困難的工作,需要長時間的開發、測試和驗證,同時遷移也不是那么容易。但是以這些架構原則為指導,Netflix相信他們正在構建的下一代系統能夠滿足自己大規模、快速增長的需要。


“如何理解Netflix的信息處理架構”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注創新互聯網站,小編將為大家輸出更多高質量的實用文章!

網站欄目:如何理解Netflix的信息處理架構-創新互聯
瀏覽地址:http://vcdvsql.cn/article38/phspp.html

成都網站建設公司_創新互聯,為您提供網站制作網站排名商城網站全網營銷推廣外貿網站建設用戶體驗

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

綿陽服務器托管