




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、操作系統(tǒng)前沿技術分布式系統(tǒng)陳然 3140103431 2016/12/7 目錄緒論3分布式系統(tǒng)介紹5分布式系統(tǒng)與集中式系統(tǒng)5分布式系統(tǒng)與集群5分布式系統(tǒng)的主要特征6分布式系統(tǒng)的設計理念81. 分布式系統(tǒng)對服務器硬件要求很低82. 分布式系統(tǒng)強調(diào)橫向可擴展性83. 分布式系統(tǒng)不允許單點失效94. 分布式系統(tǒng)盡可能減少節(jié)點間通訊開銷10分布式系統(tǒng)實例11緒論第25屆ACM操作系統(tǒng)原理研討會(SOSP15)于2015年在美國加尼福尼亞州舉辦。本次會議對操作系統(tǒng)的前沿技術進行了探究,涉及到的領域從高性能事務處理系統(tǒng)的研究到其實際實現(xiàn)的形式說明;從能量感知系統(tǒng)技術到全球范圍內(nèi)的分布式系統(tǒng)研究;從bug尋
2、找到大數(shù)據(jù)研究。而對分布式系統(tǒng)的探討,又在本次研討會中占據(jù)了重要的地位。本次研討的十個議題,四個都和分布式系統(tǒng)有關,可見其重要性。分布式系統(tǒng)介紹分布式系統(tǒng)與集中式系統(tǒng)在了解分布式系統(tǒng)之前,需要先了解一下與之相對應的集中式系統(tǒng)是什么樣的。集中式系統(tǒng)用一句話概括就是:一個主機帶多個終端。終端沒有數(shù)據(jù)處理能力,僅負責數(shù)據(jù)的錄入和輸出。而運算、存儲等全部在主機上進行?,F(xiàn)在的銀行系統(tǒng),大部分都是這種集中式的系統(tǒng),此外,在大型企業(yè)、科研單位、軍隊、政府等也有分布。集中式系統(tǒng)最大的特點也是缺點就是部署結(jié)構(gòu)非常簡單,由于采用單機部署。很可能帶來系統(tǒng)大而復雜、難于維護、發(fā)生單點故障(單個點發(fā)生故障的時候會波及到
3、整個系統(tǒng)或者網(wǎng)絡,從而導致整個系統(tǒng)或者網(wǎng)絡的癱瘓)、擴展性差等問題。因此分布式系統(tǒng)應運而生。分布式系統(tǒng)是一個硬件或軟件組件分布在不同的網(wǎng)絡計算機上,彼此之間僅僅通過消息傳遞進行通信和協(xié)調(diào)的系統(tǒng)。簡單來說就是一群獨立計算機集合共同對外提供服務,但是對于系統(tǒng)的用戶來說,就像是一臺計算機在提供服務一樣。分布式意味著可以采用更多的普通計算機(相對于昂貴的大型機)組成分布式集群對外提供服務。計算機越多,CPU、內(nèi)存、存儲資源等也就越多,能夠處理的并發(fā)訪問量也就越大。分布式系統(tǒng)與集群分布式是指在多臺不同的服務器中部署不同的服務模塊,通過遠程調(diào)用協(xié)同工作,對外提供服務。集群是指在多臺不同的服務器中部署相同應
4、用或服務模塊,構(gòu)成一個集群,通過負載均衡設備對外提供服務。簡單的說,分布式就是把一個大型應用分解成10個不同的小的應用,分配給10個計算機進行處理。而集群是同時讓10臺計算機處理10個相同的10個應用。分布式系統(tǒng)的主要特征分布性分布式系統(tǒng)中的多臺計算機之間在空間位置上可以隨意分布,系統(tǒng)中的多臺計算機之間沒有主、從之分,即沒有控制整個系統(tǒng)的主機,也沒有受控的從機。透明性系統(tǒng)資源被所有計算機共享。每臺計算機的用戶不僅可以使用本機的資源,還可以使用本分布式系統(tǒng)中其他計算機的資源(包括CPU、文件、打印機等)。同一性系統(tǒng)中的若干臺計算機可以互相協(xié)作來完成一個共同的任務,或者說一個程序可以分布在幾臺計算
5、機上并行地運行。通信性系統(tǒng)中任意兩臺計算機都可以通過通信來交換信息??赏卣剐钥赏卣剐允欠植际较到y(tǒng)的最大特點,它能夠適應需求變化而擴展。企業(yè)級應用需求經(jīng)常隨時間而不斷變化,它必須要能適應需求的變化,即具有可擴展性。和集中式系統(tǒng)相比,分布式系統(tǒng)的性價比更高、處理能力更強、可靠性更高、也有很好的擴展性,可以讓多臺服務器協(xié)同工作,完成單臺服務器無法處理的高并發(fā)的大數(shù)據(jù)量的任務。例如,在處理大型應用時,如果采用集中式計算,需要耗費相當長的時間來完成。分布式計算將該應用分解成許多小的部分,分配給多臺空閑計算機進行處理。這樣可以節(jié)約整體計算時間,大大提高計算效率。分布式系統(tǒng)的設計理念1. 分布式系統(tǒng)對服務器
6、硬件要求很低這一點主要現(xiàn)在如下兩個方面:· 對服務器硬件可靠性不做要求,允許服務器硬件發(fā)生故障,硬件的故障由軟件來容錯。所以分布式系統(tǒng)的高可靠性是由軟件來保證。· 對服務器的性能不做要求,不要求使用高頻CPU、大容量內(nèi)存、高性能存儲等等。因為分布式系統(tǒng)的性能瓶頸在于節(jié)點間通訊帶來的網(wǎng)絡開銷,單臺服務器硬件性能再好,也要等待網(wǎng)絡IO。一般而言,互聯(lián)網(wǎng)公司的大型數(shù)據(jù)中心都是選用大量廉價的PC服務器而不是用幾臺高性能服務器搭建分布式集群,以此來降低數(shù)據(jù)中心成本。比如,Google對于數(shù)據(jù)中心的成本控制做到了極致:所有服務器一律不要機箱;主板完全定制,只要最基本的組件,早期的定制主
7、板連電源開關和USB接口都不要;在主板上加裝隔離帶把CPU單獨隔出來,讓冷風只吹CPU,不吹內(nèi)存、硬盤等不需要降溫的組件,最大限度降低冷卻電力消耗。2. 分布式系統(tǒng)強調(diào)橫向可擴展性橫向可擴展性是指通過增加服務器數(shù)量來提升集群整體性能??v向可擴展性是指提升每臺服務器性能進而提升集群整體性能??v向可擴展性的上限非常明顯,單臺服務器的性能不可能無限提升,而且跟服務器性能相比,網(wǎng)絡開銷才是分布式系統(tǒng)最大的瓶頸。橫向可擴展性的上限空間比較大,集群總能很方便地增加服務器。而且分布式系統(tǒng)會盡可能保證橫向擴展帶來集群整體性能的線性提升。比如有10臺服務器組成的集群,橫向擴展為100臺同樣服務器的集群,那么整體
8、分布式系統(tǒng)性能會提升為接近原來的10倍?;ヂ?lián)網(wǎng)公司的數(shù)據(jù)中心,一般一個分布式系統(tǒng)橫向擴展的上限在萬臺服務器左右。Google數(shù)據(jù)中心的基本單元:CELL,由兩萬臺左右服務器組成,每個CELL由一套分布式管理系統(tǒng)BORG,統(tǒng)一管理,每個數(shù)據(jù)中心都由多個CELL組成。3. 分布式系統(tǒng)不允許單點失效單點失效是指,某個應用服務只有一份實例運行在某一臺服務器上,這臺服務器一旦掛掉,那么這個應用服務必然也受影響而掛掉,導致整個服務不可用。例如,某網(wǎng)站后臺如果只在某一臺服務器上運行一份,那這臺服務器一旦宕機,該網(wǎng)站服務必然受影響而不可用。再比如,如果所有數(shù)據(jù)都存在某一臺服務器上,那一旦這臺服務器壞了,所有數(shù)
9、據(jù)都不可訪問。因為分布式系統(tǒng)的服務器都是廉價的PC服務器,硬件不能保證100%可靠,所以分布式系統(tǒng)默認每臺服務器隨時都可能發(fā)生故障掛掉。同時分布式系統(tǒng)必須要提供高可靠服務,不允許出現(xiàn)單點失效,因此分布式系統(tǒng)里運行的每個應用服務都有多個運行實例跑在多個節(jié)點上,每個數(shù)據(jù)點都有多個備份存在不同的節(jié)點上。這樣一來,多個節(jié)點同時發(fā)生故障,導致某個應用服務的所有實例都掛掉、或某個數(shù)據(jù)點的多個備份都不可讀的概率大大降低,進而有效防止單點失效。通常情況,不要讓服務器滿負荷運行,服務器長時間滿負荷運行的話,出故障的概率顯著升高。所以分布式系統(tǒng)采用一大堆中低性能的PC服務器,盡可能把負載均攤到所有服務器上,讓每臺
10、服務器的負載都不高,保證集群整體穩(wěn)定性。4. 分布式系統(tǒng)盡可能減少節(jié)點間通訊開銷如前所述,分布式系統(tǒng)的整體性能瓶頸在于內(nèi)部網(wǎng)絡開銷。目前網(wǎng)絡傳輸?shù)乃俣冗€趕不上CPU讀取內(nèi)存或硬盤的速度,所以減少網(wǎng)絡通訊開銷,讓CPU盡可能處理內(nèi)存的數(shù)據(jù)或本地硬盤的數(shù)據(jù),能顯著提高分布式系統(tǒng)的性能。典型的例子就是Hadoop MapReduce,把計算任務分配到要處理的數(shù)據(jù)所在的節(jié)點上運行,從而避免在網(wǎng)絡上傳輸數(shù)據(jù)。分布式系統(tǒng)實例這里我選擇的實例是Hadoop的HDFS,Hadoop是一個很經(jīng)典的MapReduce的開源實現(xiàn)的系統(tǒng)架構(gòu),能夠分布式運行且復制數(shù)據(jù),也可以在一個集群上運行多個進程,管理由用戶創(chuàng)建的并行任務,低成本且可擴展。Hadoop集群排序1TB的數(shù)據(jù)只花了209秒。Hadoop實現(xiàn)了一個分布式文件系統(tǒng)HDFS,它的文件存儲原理如下:(圖片摘自網(wǎng)絡)假設一個文件如圖由紅綠藍三個數(shù)據(jù)塊組成,將該文件寫入HDFS這三塊首先在namenode中登記元數(shù)據(jù),哪個數(shù)據(jù)塊在哪個服務器上:黃色
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 科學保護眼睛課件
- 培訓學校心肺復蘇課件
- 高血壓健康教育
- 人教小學語文五下課件
- 2025年廣東省中考語文適應性試卷含答案
- 大課魅力溝通林佳梅
- 2025年公司級安全培訓考試試題及答案(奪冠系列)
- 2025項目管理人員年度安全培訓考試試題附參考答案【黃金題型】
- 2024-2025安全培訓考試試題帶答案(典型題)
- 2025企業(yè)安全管理人員安全培訓考試試題附參考答案【研優(yōu)卷】
- 中國加速康復外科臨床實踐指南2021
- 山東省大教育聯(lián)盟學校2024-2025學年高三下學期開學檢測化學試題(原卷版+解析版)
- 2025教科版六年級科學下冊全冊教案【含反思】
- DB43T-稻-再-油生產(chǎn)技術規(guī)程
- 中國慢性冠脈綜合征患者診斷及管理指南2024版解讀
- 課件:《科學社會主義概論(第二版)》第五章
- DB36∕T 1720-2022 牧草裹包青貯技術規(guī)程
- 基于BIM技術的建筑工程安全管理應用與探討
- 基于深度學習的電力系統(tǒng)故障恢復與優(yōu)化方法研究
- 大數(shù)據(jù)與人工智能營銷知到智慧樹章節(jié)測試課后答案2024年秋南昌大學
- 第20課 清朝君主專制的強化(導學案)(原卷版)
評論
0/150
提交評論