版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、Google在線文檔,Google云計(jì)算應(yīng)用場景,1,Google地圖,Google云計(jì)算應(yīng)用場景,2,Google郵件,Google云計(jì)算應(yīng)用場景,3,Google日歷,Google云計(jì)算應(yīng)用場景,4,Google Wave 信息分享、協(xié)作、發(fā)布平臺,Google云計(jì)算應(yīng)用場景,5,隸屬于PaaS的Google云計(jì)算 屬于部署在云端的應(yīng)用執(zhí)行環(huán)境 支持Python和Java兩種語言 通過SDK提供Google的各種服務(wù),如圖形、MAIL和數(shù)據(jù)存儲等 用戶可快速、廉價(jià)(可免費(fèi)使用限定的流量和存儲)地部署自己開發(fā)的應(yīng)用(如創(chuàng)新的網(wǎng)站、游戲等),Google云計(jì)算應(yīng)用場景,6,應(yīng)用場景特點(diǎn),Goo
2、gle云計(jì)算應(yīng)用場景,應(yīng)用(功能實(shí)現(xiàn))在云端 存儲在云端 計(jì)算在云端,7,Google云計(jì)算平臺技術(shù)架構(gòu) 文件存儲,Google Distributed File System,GFS 并行數(shù)據(jù)處理MapReduce 分布式鎖Chubby 結(jié)構(gòu)化數(shù)據(jù)表BigTable,Google如何實(shí)現(xiàn)?,8,Google云計(jì)算原理,分布式文件系統(tǒng)GFS Google Distributed File System,9,什么是文件系統(tǒng)? FAT, FAT32, NTFS, EXT, 用于持久地存儲數(shù)據(jù)的系統(tǒng) 通常覆蓋在底層的物理存儲介質(zhì)上 硬盤、CD、磁帶等 數(shù)據(jù)組織的基本單元:文件 具有文件名(1.txt
3、) 通常支持層次化嵌套(目錄結(jié)構(gòu)),文件系統(tǒng)基礎(chǔ),10,文件路徑 文件與目錄的結(jié)合,用于定位文件 絕對路徑,/home/aaron/foo.txt 相對路徑,docs/someFile.doc 規(guī)范路徑 定位文件的最短絕對路徑 /home/aaron/foo.txt, /home/./home/aaron/./foo.txt 所有規(guī)范路徑的集合構(gòu)成了文件系統(tǒng)的目錄結(jié)構(gòu),文件系統(tǒng)基礎(chǔ),11,文件系統(tǒng)的存儲內(nèi)容 主要內(nèi)容:用戶的實(shí)際數(shù)據(jù) 元數(shù)據(jù):驅(qū)動器元數(shù)據(jù)與文件元數(shù)據(jù),文件系統(tǒng)基礎(chǔ),12,文件分塊存儲,文件系統(tǒng)基礎(chǔ),13,文件系統(tǒng)設(shè)計(jì)的考慮因素 最小存儲單元 較小可減少浪費(fèi)空間,較大則可提高文件
4、順序讀取速度(隨機(jī)訪問呢?) 文件系統(tǒng)的設(shè)計(jì)目標(biāo)是提高訪問速度還是提高使用率? 文件系統(tǒng)的安全性 多用戶環(huán)境下的文件安全 讀/寫權(quán)限分配 文件附帶訪問控制列表(ACL) 文件系統(tǒng)緩存 提高文件系統(tǒng)讀寫效率,文件系統(tǒng)基礎(chǔ),14,Google需要一個(gè)支持海量存儲的文件系統(tǒng) 購置昂貴的分布式文件系統(tǒng)與硬件?,Google設(shè)計(jì)GFS的動機(jī),是否可以在一堆廉價(jià)且不可靠的硬件上構(gòu)建可靠的分布式文件系統(tǒng)?,15,為什么不使用當(dāng)時(shí)現(xiàn)存的文件系統(tǒng)? Google所面臨的問題與眾不同 不同的工作負(fù)載,不同的設(shè)計(jì)優(yōu)先級(廉價(jià)、不可靠的硬件) 需要設(shè)計(jì)與Google應(yīng)用和負(fù)載相符的文件系統(tǒng),Google設(shè)計(jì)GFS的動
5、機(jī),16,GFS的假設(shè)與目標(biāo),硬件出錯(cuò)是正常而非異常 系統(tǒng)應(yīng)當(dāng)由大量廉價(jià)、易損的硬件組成 必須保持文件系統(tǒng)整體的可靠性 主要負(fù)載是流數(shù)據(jù)讀寫 主要用于程序處理批量數(shù)據(jù),而非與用戶的交互或隨機(jī)讀寫 數(shù)據(jù)寫主要是“追加寫”,“插入寫”非常少 需要存儲大尺寸的文件 存儲的文件尺寸可能是GB或TB量級,而且應(yīng)當(dāng)能支持存儲成千上萬的大尺寸文件,17,將文件劃分為若干塊(Chunk)存儲 每個(gè)塊固定大小(64M) 通過冗余來提高可靠性 每個(gè)數(shù)據(jù)塊至少在3個(gè)數(shù)據(jù)塊服務(wù)器上冗余 數(shù)據(jù)塊損壞概率? 通過單個(gè)master來協(xié)調(diào)數(shù)據(jù)訪問、元數(shù)據(jù)存儲 結(jié)構(gòu)簡單,容易保持元數(shù)據(jù)一致性 無緩存 Why?,GFS的設(shè)計(jì)思路
6、,18,單一Master, 若干ChunkServer,GFS的架構(gòu),1、文件存儲方式 2、數(shù)據(jù)讀寫流程,GFS的架構(gòu)有什么問題嗎?,19,20,分布式系統(tǒng)設(shè)計(jì)告訴我們: 這是單點(diǎn)故障 這是性能瓶頸 GFS的解決辦法 單點(diǎn)故障問題,單一Master問題,采用多個(gè)(如3個(gè))影子Master節(jié)點(diǎn)進(jìn)行熱備,一旦主節(jié)點(diǎn)損壞,立刻選舉一個(gè)新的主節(jié)點(diǎn)服務(wù),21,GFS的解決辦法 性能瓶頸問題,單一Master問題,盡可能減少數(shù)據(jù)存取中Master的參與程度,不使用Master讀取數(shù)據(jù),僅用于保存元數(shù)據(jù),客戶端緩存元數(shù)據(jù),采用大尺寸的數(shù)據(jù)塊(64M),數(shù)據(jù)修改順序交由Primary Chunk Server
7、完成,Simple, and good enough!,22,存儲元數(shù)據(jù) 文件系統(tǒng)目錄管理與加鎖 與ChunkServer進(jìn)行周期性通信 發(fā)送指令,搜集狀態(tài),跟蹤數(shù)據(jù)塊的完好性 數(shù)據(jù)塊創(chuàng)建、復(fù)制及負(fù)載均衡 對ChunkServer的空間使用和訪問速度進(jìn)行負(fù)載均衡,平滑數(shù)據(jù)存儲和訪問請求的負(fù)載 對數(shù)據(jù)塊進(jìn)行復(fù)制、分散到ChunkServer上 一旦數(shù)據(jù)塊冗余數(shù)小于最低數(shù),就發(fā)起復(fù)制操作,Master節(jié)點(diǎn)的任務(wù),23,垃圾回收 在日志中記錄刪除操作,并將文件改名隱藏 緩慢地回收隱藏文件 與傳統(tǒng)文件刪除相比更簡單、更安全 陳舊數(shù)據(jù)塊刪除 探測陳舊的數(shù)據(jù)塊,并刪除,Master節(jié)點(diǎn)的任務(wù),24,采用中
8、心服務(wù)器模式 可以方便地增加Chunk Server Master掌握系統(tǒng)內(nèi)所有Chunk Server的情況,方便進(jìn)行負(fù)載均衡 不存在元數(shù)據(jù)的一致性問題,GFS架構(gòu)的特點(diǎn),25,不緩存數(shù)據(jù) GFS的文件操作大部分是流式讀寫,不存在大量的重復(fù)讀寫,使用Cache對性能提高不大 Chunk Server上的數(shù)據(jù)存取使用本地文件系統(tǒng),如果某個(gè)Chunk讀取頻繁,文件系統(tǒng)具有Cache 從可行性看,Cache與實(shí)際數(shù)據(jù)的一致性維護(hù)也極其復(fù)雜,GFS架構(gòu)的特點(diǎn),?,26,在用戶態(tài)下實(shí)現(xiàn) 直接利用Chunk Server的文件系統(tǒng)存取Chunk,實(shí)現(xiàn)簡單 用戶態(tài)應(yīng)用調(diào)試較為簡單,利于開發(fā) 用戶態(tài)的GFS
9、不會影響Chunk Server的穩(wěn)定性 提供專用的訪問接口 未提供標(biāo)準(zhǔn)的POSIX訪問接口 降低GFS的實(shí)現(xiàn)復(fù)雜度,GFS架構(gòu)的特點(diǎn),27,GFS的容錯(cuò)方法,GFS的容錯(cuò)機(jī)制 Chunk Server容錯(cuò) 每個(gè)Chunk有多個(gè)存儲副本(通常是3個(gè)),分別存儲于不通的服務(wù)器上 每個(gè)Chunk又劃分為若干Block(64KB),每個(gè)Block對應(yīng)一個(gè)32bit的校驗(yàn)碼,保證數(shù)據(jù)正確(若某個(gè)Block錯(cuò)誤,則轉(zhuǎn)移至其他Chunk副本),28,GFS的容錯(cuò)方法,GFS的容錯(cuò)機(jī)制 Master容錯(cuò) 三類元數(shù)據(jù):命名空間(目錄結(jié)構(gòu))、Chunk與文件名的映射以及Chunk副本的位置信息 前兩類通過日志提供容錯(cuò),Chunk副本信息存儲于Chunk Server,Master出現(xiàn)故障時(shí)可恢復(fù),29,GFS的性能,30,超過50個(gè)GFS集群 每個(gè)集
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年食堂信息化管理及服務(wù)外包合同5篇
- 2025年度購物中心物業(yè)管理員勞動合同3篇
- 二零二五版泰康人壽保險(xiǎn)產(chǎn)品推廣合同范本3篇
- 2025年度木工項(xiàng)目投資與建設(shè)合同4篇
- 2025年度定制化木模板木方定制加工及銷售合同4篇
- 印刷材料的科技創(chuàng)新與應(yīng)用考核試卷
- 2025版老舊建筑幕墻改造升級合同范文4篇
- 2025年醫(yī)療病例管理協(xié)議
- 2025年度美發(fā)店客戶滿意度調(diào)查與服務(wù)提升合同8篇
- 2025年食堂檔口租賃及市場營銷合作合同范本3篇
- 電纜擠塑操作手冊
- 浙江寧波鄞州區(qū)市級名校2025屆中考生物全真模擬試卷含解析
- IATF16949基礎(chǔ)知識培訓(xùn)教材
- 【MOOC】大學(xué)生創(chuàng)新創(chuàng)業(yè)知能訓(xùn)練與指導(dǎo)-西北農(nóng)林科技大學(xué) 中國大學(xué)慕課MOOC答案
- 勞務(wù)派遣公司員工考核方案
- 基礎(chǔ)生態(tài)學(xué)-7種內(nèi)種間關(guān)系
- 2024年光伏農(nóng)田出租合同范本
- 《阻燃材料與技術(shù)》課件 第3講 阻燃基本理論
- 2024-2030年中國黃鱔市市場供需現(xiàn)狀與營銷渠道分析報(bào)告
- 新人教版九年級化學(xué)第三單元復(fù)習(xí)課件
- 江蘇省南京鼓樓區(qū)2024年中考聯(lián)考英語試題含答案
評論
0/150
提交評論