




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、大數(shù)據(jù)高級課程,第2課:kudu的基礎(chǔ)架構(gòu),講師:Black,基礎(chǔ)架構(gòu),Kudu功能,功能1:主從架構(gòu)包括主、T服務(wù)器,通常3個主從功能2個示例,3個副本中的2個或5個副本中的3個讀取功能可以在leadertablet出現(xiàn)故障時通過只讀follower tablets提供服務(wù),也可以在leader停機時根據(jù)raft機制重新選擇leader功能3:水平擴展功能4:功能5: MapReduce、Spark、Impala和其他Hadoop8:查詢的數(shù)據(jù)是支持SQL的結(jié)構(gòu)化模型。對于開發(fā)語言C Columnar Data Store ReadEfficiency分析查詢,可以讀取單列或列的一部分,并忽
2、略其他列Data Compression。由于指定列僅包含一種類型的數(shù)據(jù),因此壓縮可以在從磁盤讀取較少的塊時完成查詢,同時具有從列讀取數(shù)據(jù)的效率。一張表是數(shù)據(jù)在Kudu中的存儲位置。表格具有綱要和全域排序primarykey(主要索引鍵)。Table是table連續(xù)segment,具有Tablets、Kudu概念和術(shù)語,tablet(段)table是其他數(shù)據(jù)存儲引擎或關(guān)系數(shù)據(jù)庫分區(qū)。在一段時間內(nèi),tablet的復(fù)制副本將復(fù)制到多個tserver服務(wù)器。其中一個被視為leader tablet。所有復(fù)制副本都可以提供讀取服務(wù),并且在寫入時需要tablet服務(wù)的一組tablet server之間必
3、須保持一致。表分為多個表,分布在徐璐的其他表服務(wù)器上,以最大化并行度操作;表分為Kudu中名為RowSets的較小單元,RowSets分為兩個MemRowSets、DiskRowSet和memrowset對于給定的tablet,一個tabletserver充當(dāng)leader,另一個tablet server充當(dāng)該table tollower的副本。只有Leader提供每個服務(wù)的寫入請求,leader和followers提供每個服務(wù)的讀取請求。Leader在選舉中使用Raft協(xié)議。一個tabletserver可以服務(wù)多個tablets,一個table tserver可以服務(wù)多個table tser
4、ver。主節(jié)點跟蹤所有tablets、tabletservers、catalog tables和其他與群集相關(guān)的元數(shù)據(jù)。在給定時間點只能有一個主節(jié)點(例如leader)工作?,F(xiàn)在,leader消失后,選舉新的master,并使用Raft協(xié)議進行選舉。master還控制客戶端的元數(shù)據(jù)操作(metadataoperations)。例如,創(chuàng)建新表時,將請求從客戶端內(nèi)部發(fā)送到主服務(wù)器。主節(jié)點將新表的元數(shù)據(jù)寫入catalog table,并調(diào)整在tablet server上創(chuàng)建tablet的過程。所有master的元數(shù)據(jù)都存儲在一個tablet中,可以復(fù)制到所有其他候選對象的master中。Tablet
5、server以設(shè)置的時間間隔向master發(fā)送心跳(默認值為每秒一次)。主節(jié)點作為文件存儲在磁盤上。Kudu概念和術(shù)語Raft Consensus Algorithm Kudu使用Raft Consensus Algorithm作為確保常規(guī)tablet和master數(shù)據(jù)的容錯和一致性的手段。已通過Raft協(xié)議從tablet的多個復(fù)制副本中選擇了leader。leader接受請求并將數(shù)據(jù)寫入其他follower拷貝。寫入的數(shù)據(jù)在大多數(shù)拷貝中永久化后,將向客戶確認。給定的N個副本集(通常是3個或5個)最多可以允許寫入(N-1)或2個無效副本。目錄表Catalog Table是Kudu中元數(shù)據(jù)的中心
6、位置。存儲有關(guān)Tables和tablets的信息。此目錄表格可以直接讀取,也可以不寫入。相反,只能通過對客戶端API公開的元數(shù)據(jù)操作進行訪問。Catalog tables存儲兩種類型的元數(shù)據(jù):Tables table schemas、locations、and States Tablets現(xiàn)有tablet的列表、每個tablet復(fù)制副本所在的tablet server、tablet的當(dāng)前狀態(tài)和啟動、Kudu-impleINSERT數(shù)據(jù)可以使用與使用HDFS或HBase持久性的所有其他Impala表相同的語法插入到Impala的Kudu表中。UPDATE/DELETE Impala支持UPDATE和DELETESQL命令逐行或批量修改Kudu表中的現(xiàn)有數(shù)據(jù)。選擇SQL命令的語法與現(xiàn)有標準盡可能兼容。除了簡單的DELETE或UPDATE命令外,F(xiàn)ROM還可以指定子查詢中帶有子句的復(fù)雜連接。Kudu-Impala集成功能和靈活分區(qū)類似于Hive中的表分區(qū)。Kudu允許通過hash或range動態(tài)地預(yù)分區(qū)到預(yù)定義數(shù)量的tablets,以便在群集中均勻分布寫入和寫入,還可以通過任意數(shù)量的primarykey列、hashes和可選的list of split rows進行分區(qū)。并行掃描(Parallel Scan) Impala使用的Kudu客戶端可以通過多個tabl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 麗江云南麗江市交通運輸綜合行政執(zhí)法支隊執(zhí)法輔助人員招聘6人筆試歷年參考題庫及參考答案詳解一套
- 6月六級考試試題及答案
- 2025焊接車間租賃合同范本
- 2025公司終止勞動合同協(xié)議書(范本)
- JTE-013-Standard-生命科學(xué)試劑-MCE
- 2025共同經(jīng)營工程合同模板
- 2025年安徽省馬鞍山市中考三模數(shù)學(xué)試題
- 第22課《偉大的悲劇》第一課時(教學(xué)設(shè)計)-七年級語文下冊同步備課系列(部編版)
- 歷史人物研究專題試卷及答案解析
- 城市居民用氣協(xié)議
- 某市道路客運班線管理臺賬
- DB37-T 1854-2020 山東省化工裝置安全試車工作規(guī)范-(高清版)
- 消防檔案范本(企業(yè)類)
- 消防安全管理評分表
- 國際足聯(lián)球員經(jīng)紀人規(guī)則
- 電梯更換鋼絲繩施工方案
- 植物保護學(xué)考試復(fù)習(xí)資料
- 科學(xué)二年級第二學(xué)期雙減期末綜合測評方案
- 6.醫(yī)院感染綜合性監(jiān)測制度
- 貫徹三標一規(guī)范咨詢工作計劃
- 定語從句語法講解
評論
0/150
提交評論