如下圖所示,從邏輯上來看,Hive包含了3大部分。
創新互聯堅持“要么做到,要么別承諾”的工作理念,服務領域包括:成都網站建設、成都做網站、企業官網、英文網站、手機端網站、網站推廣等服務,滿足客戶于互聯網時代的安遠網站設計、移動媒體設計的需求,幫助企業找到有效的互聯網解決方案。努力成為您成熟可靠的網絡建設合作伙伴!
用戶操作Hive的接口主要有三個:CLI,Client 和 WUI。
其中最常用的是CLI,Cli啟動的時候,會同時啟動一個Hive副本。
Client是Hive的客戶端,用戶連接至Hive Server。在啟動 Client模式的時候,需要指出Hive Server所在節點,并且在該節點啟動Hive Server。而客戶端則又可以分為三種Thrift Client,JDBC Client,ODBC Client。
Web Interface是通過瀏覽器訪問Hive。
實現了session handler,在JDBC/ODBC接口上實現了執行和獲取信息的API。
該組件用于對不同的查詢表達式做解析查詢,語義分析,最終會根據從metastore中查詢到的表和分區元數據生成一個execution plain。
該組件會執行由compiler創建的execution。其中plan從數據結構上來看,是一個DAG,該組件會管理plan的不同stage與組件中執行這些plan之間的依賴。
Hive的metastore組件是hive元數據集中存放地。該組件存儲了包括變量表中列和列類型等結構化的信息以及數據倉庫中的分區信息(包括列和列類型信息,讀寫數據時必要的序列化和反序列化信息,數據被存儲在HDFS文件中的位置)。
Metastore組件包括兩個部分:metastore services和Meta storage database。
使用遠程的metastore services,可以讓metastore services和hive services運行在不同的進程里,這樣也保證了hive的穩定性,提升了hive services的效率。
流程大致步驟為:
解析用戶提交的Hive語句->對其進行解析->分解為表、字段、分區等Hive對象
根據解析到的信息構建對應的表、字段、分區等對象,從SEQUENCE_TABLE中獲取構建對象的最新的ID,與構建對象信息(名稱、類型等等)一同通過DAO方法寫入元數據庫的表中,成功后將SEQUENCE_TABLE中對應的最新ID+5。
實際上常見的RDBMS都是通過這種方法進行組織的,其系統表中和Hive元數據一樣顯示了這些ID信息。通過這些元數據可以很容易的讀取到數據。
優化器是一個不斷更新的組件,大部分plan的轉移都是通過優化器完成的。
新聞標題:hive基本架構
網頁鏈接:http://vcdvsql.cn/article42/gjshec.html
成都網站建設公司_創新互聯,為您提供用戶體驗、定制開發、品牌網站制作、服務器托管、做網站、
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯