




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、大數(shù)據(jù)高級(jí)課程,第2課:kudu的基礎(chǔ)架構(gòu),講師:Black,基礎(chǔ)架構(gòu),Kudu功能,功能1:主從架構(gòu)包括主、T服務(wù)器,通常3個(gè)主從功能2個(gè)示例,3個(gè)副本中的2個(gè)或5個(gè)副本中的3個(gè)讀取功能可以在leadertablet出現(xiàn)故障時(shí)通過(guò)只讀follower tablets提供服務(wù),也可以在leader停機(jī)時(shí)根據(jù)raft機(jī)制重新選擇leader功能3:水平擴(kuò)展功能4:功能5: MapReduce、Spark、Impala和其他Hadoop8:查詢的數(shù)據(jù)是支持SQL的結(jié)構(gòu)化模型。對(duì)于開發(fā)語(yǔ)言C Columnar Data Store ReadEfficiency分析查詢,可以讀取單列或列的一部分,并忽
2、略其他列Data Compression。由于指定列僅包含一種類型的數(shù)據(jù),因此壓縮可以在從磁盤讀取較少的塊時(shí)完成查詢,同時(shí)具有從列讀取數(shù)據(jù)的效率。一張表是數(shù)據(jù)在Kudu中的存儲(chǔ)位置。表格具有綱要和全域排序primarykey(主要索引鍵)。Table是table連續(xù)segment,具有Tablets、Kudu概念和術(shù)語(yǔ),tablet(段)table是其他數(shù)據(jù)存儲(chǔ)引擎或關(guān)系數(shù)據(jù)庫(kù)分區(qū)。在一段時(shí)間內(nèi),tablet的復(fù)制副本將復(fù)制到多個(gè)tserver服務(wù)器。其中一個(gè)被視為leader tablet。所有復(fù)制副本都可以提供讀取服務(wù),并且在寫入時(shí)需要tablet服務(wù)的一組tablet server之間必
3、須保持一致。表分為多個(gè)表,分布在徐璐的其他表服務(wù)器上,以最大化并行度操作;表分為Kudu中名為RowSets的較小單元,RowSets分為兩個(gè)MemRowSets、DiskRowSet和memrowset對(duì)于給定的tablet,一個(gè)tabletserver充當(dāng)leader,另一個(gè)tablet server充當(dāng)該table tollower的副本。只有Leader提供每個(gè)服務(wù)的寫入請(qǐng)求,leader和followers提供每個(gè)服務(wù)的讀取請(qǐng)求。Leader在選舉中使用Raft協(xié)議。一個(gè)tabletserver可以服務(wù)多個(gè)tablets,一個(gè)table tserver可以服務(wù)多個(gè)table tser
4、ver。主節(jié)點(diǎn)跟蹤所有tablets、tabletservers、catalog tables和其他與群集相關(guān)的元數(shù)據(jù)。在給定時(shí)間點(diǎn)只能有一個(gè)主節(jié)點(diǎn)(例如leader)工作?,F(xiàn)在,leader消失后,選舉新的master,并使用Raft協(xié)議進(jìn)行選舉。master還控制客戶端的元數(shù)據(jù)操作(metadataoperations)。例如,創(chuàng)建新表時(shí),將請(qǐng)求從客戶端內(nèi)部發(fā)送到主服務(wù)器。主節(jié)點(diǎn)將新表的元數(shù)據(jù)寫入catalog table,并調(diào)整在tablet server上創(chuàng)建tablet的過(guò)程。所有master的元數(shù)據(jù)都存儲(chǔ)在一個(gè)tablet中,可以復(fù)制到所有其他候選對(duì)象的master中。Tablet
5、server以設(shè)置的時(shí)間間隔向master發(fā)送心跳(默認(rèn)值為每秒一次)。主節(jié)點(diǎn)作為文件存儲(chǔ)在磁盤上。Kudu概念和術(shù)語(yǔ)Raft Consensus Algorithm Kudu使用Raft Consensus Algorithm作為確保常規(guī)tablet和master數(shù)據(jù)的容錯(cuò)和一致性的手段。已通過(guò)Raft協(xié)議從tablet的多個(gè)復(fù)制副本中選擇了leader。leader接受請(qǐng)求并將數(shù)據(jù)寫入其他follower拷貝。寫入的數(shù)據(jù)在大多數(shù)拷貝中永久化后,將向客戶確認(rèn)。給定的N個(gè)副本集(通常是3個(gè)或5個(gè))最多可以允許寫入(N-1)或2個(gè)無(wú)效副本。目錄表Catalog Table是Kudu中元數(shù)據(jù)的中心
6、位置。存儲(chǔ)有關(guān)Tables和tablets的信息。此目錄表格可以直接讀取,也可以不寫入。相反,只能通過(guò)對(duì)客戶端API公開的元數(shù)據(jù)操作進(jìn)行訪問。Catalog tables存儲(chǔ)兩種類型的元數(shù)據(jù):Tables table schemas、locations、and States Tablets現(xiàn)有tablet的列表、每個(gè)tablet復(fù)制副本所在的tablet server、tablet的當(dāng)前狀態(tài)和啟動(dòng)、Kudu-impleINSERT數(shù)據(jù)可以使用與使用HDFS或HBase持久性的所有其他Impala表相同的語(yǔ)法插入到Impala的Kudu表中。UPDATE/DELETE Impala支持UPDATE和DELETESQL命令逐行或批量修改Kudu表中的現(xiàn)有數(shù)據(jù)。選擇SQL命令的語(yǔ)法與現(xiàn)有標(biāo)準(zhǔn)盡可能兼容。除了簡(jiǎn)單的DELETE或UPDATE命令外,F(xiàn)ROM還可以指定子查詢中帶有子句的復(fù)雜連接。Kudu-Impala集成功能和靈活分區(qū)類似于Hive中的表分區(qū)。Kudu允許通過(guò)hash或range動(dòng)態(tài)地預(yù)分區(qū)到預(yù)定義數(shù)量的tablets,以便在群集中均勻分布寫入和寫入,還可以通過(guò)任意數(shù)量的primarykey列、hashes和可選的list of split rows進(jìn)行分區(qū)。并行掃描(Parallel Scan) Impala使用的Kudu客戶端可以通過(guò)多個(gè)tabl
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年部編版二年級(jí)上冊(cè)語(yǔ)文分層教學(xué)計(jì)劃
- 半導(dǎo)體廠重要環(huán)境因素控制措施
- 機(jī)場(chǎng)跑道施工進(jìn)度計(jì)劃和進(jìn)度保證措施
- 四年級(jí)健康與安全教育方案計(jì)劃
- 2024-2025學(xué)年度網(wǎng)絡(luò)安全保護(hù)計(jì)劃
- 2025年小學(xué)五年級(jí)科學(xué)教學(xué)信息化發(fā)展計(jì)劃
- 小學(xué)科學(xué)教研計(jì)劃課外拓展
- 口腔診所前臺(tái)接待話術(shù)及工作流程
- 五年級(jí)下冊(cè)體育課程安全保障計(jì)劃
- 以建模教學(xué)為翼展數(shù)學(xué)應(yīng)用之翅:探索數(shù)學(xué)教育新路徑
- 河南省鄭州市第十七中學(xué)2025年英語(yǔ)七年級(jí)第二學(xué)期期末質(zhì)量跟蹤監(jiān)視試題含答案
- 設(shè)備技改項(xiàng)目管理制度
- 浙江萬(wàn)泰公司安全設(shè)施試運(yùn)行總結(jié)報(bào)告
- 2025至2030中國(guó)天然水晶手鐲行業(yè)商業(yè)模式及發(fā)展前景與投資報(bào)告
- 應(yīng)急救援無(wú)人機(jī)系統(tǒng)應(yīng)用解析
- 復(fù)讀班課堂管理制度
- 關(guān)于教育減負(fù)的議論文
- 2025至2030年中國(guó)電力大數(shù)據(jù)行業(yè)市場(chǎng)動(dòng)態(tài)分析及發(fā)展前景研判報(bào)告
- 2025年安徽省中考英語(yǔ)試卷(含答案)
- 思想道德與法治2023年版電子版教材-1
- 2025至2030年中國(guó)側(cè)背光源行業(yè)投資前景及策略咨詢報(bào)告
評(píng)論
0/150
提交評(píng)論