分析:亞馬遜的云計算有多大_第1頁
分析:亞馬遜的云計算有多大_第2頁
分析:亞馬遜的云計算有多大_第3頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

分析:亞馬遜的云計算有多大

原因很簡單。亞馬遜的在線零售業(yè)務(wù),是一個700億美金的龐然大物,大雖大,但耗費現(xiàn)金并不多。JeffBezos,亞馬遜的創(chuàng)始人兼CEO,對于利潤的興趣很小,對于改變世界的興趣倒是很大。然而,云計算畢竟是這個世界上,資本最為密集的行業(yè)之一。Google可以在數(shù)據(jù)中心上花費幾百億美金而毫不心痛,背后有壟斷性業(yè)務(wù)“搜索引擎”的支撐。Microsoft,則在桌面軟件和數(shù)據(jù)中心軟件方面有著壟斷的地位,錢袋一樣深不可測,自然也一樣敢于一擲千金。Google和Microsoft在燒錢上的本事,無人能及。但他們的基礎(chǔ)設(shè)施和平臺服務(wù),面對亞馬遜時的競爭力,還是令人生疑。但若從長期來看,亞馬遜能否跟得上google和microsoft的腳步,卻很成問題了。于是,AWS的副總裁,卓越的工程師,JamesHamilton透露了AWS云的規(guī)模和范圍。目的自然為了告訴大家,亞馬遜的領(lǐng)先地位以及對云計算的決心。最重要的,永遠(yuǎn)是規(guī)模。做在線零售的亞馬遜,當(dāng)然清楚這個。亞馬遜很少談及公有云,因為在亞馬遜的理論中,云計算就不該是私有云。亞馬遜認(rèn)為,長期來看,公有云的巨大規(guī)模,意味著大部分的組織和機構(gòu)都不需要運營自己的數(shù)據(jù)中心。在AWS的Re:Invent大會上,jassy又一次強調(diào),自云計算業(yè)務(wù)開始以來,他和亞馬遜的CTOWernerVogels就支持這個論點。(亞馬遜為美國中央情報局建設(shè)過一個特殊的AWS私有云,簽署了為期10年,6.6億美金的合同。但那只不過是一個例外。云計算本質(zhì)上還應(yīng)該是公有的)。JassyandVogels的信念很簡單:只有覆蓋了全區(qū)域,具備大容量,提供最豐富功能的云,才能勝出。會有一些例外,比如說金融服務(wù)云,或者那種100%運行特殊硬件和軟件的巨型計算中心。公有云的資源不僅足夠好,而且一定會超越大部分的私有云。AWS將底層的計算能力、存儲和網(wǎng)絡(luò)功能,抽象出來,這樣開發(fā)者就可以專注于應(yīng)用開發(fā)。抽象出來的資源,要么形成純粹的基礎(chǔ)設(shè)施,要么在其上繼續(xù)抽象出一層平臺服務(wù),便于進(jìn)一步實現(xiàn)自動化部署和對中間件、數(shù)據(jù)庫和支持應(yīng)用的其他服務(wù)的管理。但這并不是說底層的基礎(chǔ)設(shè)施不重要。實際上,亞馬遜投入了巨大資金,用來設(shè)計和建設(shè)數(shù)據(jù)中心,并優(yōu)化各方面的設(shè)施從內(nèi)存條到數(shù)據(jù)中心的墻壁?;A(chǔ)設(shè)施確實重要,絕對能夠形成競爭優(yōu)勢。網(wǎng)絡(luò)的事,比服務(wù)器還麻煩和許多超級數(shù)據(jù)中心一樣,亞馬遜的服務(wù)器,剛開始也是從一線的服務(wù)器制造商那里購買。亞馬遜成了rackablesystem(現(xiàn)在是SGI旗下公司)最大的客戶。后來,亞馬遜決定自行制造系統(tǒng),以便針對自己的工作性質(zhì)進(jìn)行精確調(diào)優(yōu)。尤為重要的,是為了能夠與其數(shù)據(jù)中心、電力、制冷系統(tǒng)嚴(yán)絲合縫的配合。數(shù)據(jù)中心在與時俱進(jìn)的發(fā)展,系統(tǒng)也需要步調(diào)一致的前進(jìn)。過去,亞馬遜在其基礎(chǔ)設(shè)施的規(guī)模問題上,只含糊其辭,從不給出準(zhǔn)確的數(shù)據(jù)。從2004年開始,AWS每一天都要安裝足夠多的服務(wù)器以支撐亞馬遜的在線零售業(yè)務(wù)。那個時候,亞馬遜的收入規(guī)模,僅為70億美金,僅為現(xiàn)在的1/10?!叭ツ臧l(fā)生的那些變化?”Hamilton反問道,然后開玩笑說:“我們都執(zhí)行過365次了?!睋Q句話說,去年AWS增添了足夠多的容量,以支撐2.55萬億的在線零售業(yè)務(wù)。那么,AWS到底容量多大?答案是:比很多人想的還要大。下面就是關(guān)于服務(wù)器的計算了。亞馬遜在全球11個地區(qū)擁有數(shù)據(jù)中心。每一個地區(qū)擁有最少2個可用區(qū),這樣所有地區(qū)一共擁有28個可用區(qū)。(包括兩周前在德國法蘭克福啟動的新地區(qū))這些可用區(qū)為本地的工作負(fù)荷,提供隔離的和冗余的能力。類似那種串聯(lián)或者分層的容錯系統(tǒng),在數(shù)據(jù)中心和服務(wù)的層次上工作,而不是在兩個系統(tǒng)之間嚴(yán)格步調(diào)一致。每個可用區(qū)最少有一個數(shù)據(jù)中心,有些則多達(dá)6個數(shù)據(jù)中心。(2013年1月,Hamilton在Re:Invent會議上說,僅只美東地區(qū)便有超過10個數(shù)據(jù)中心,但在2014年的Re:Invent會議上他的演講中,又說沒有可用區(qū)擁有超過6個數(shù)據(jù)中心。)目的是為了讓客戶能夠構(gòu)建自己的應(yīng)用,運行在不同的可用區(qū)上,以實現(xiàn)本地數(shù)據(jù)保護(hù)。更進(jìn)一步,實現(xiàn)跨地區(qū)部署,達(dá)到更高層次的可用性。亞馬遜通過增加新的數(shù)據(jù)中心,以為每個可用區(qū)提升容量?;旧希推髽I(yè)客戶增加的機架一樣,數(shù)據(jù)中心實際上就是AWS的新機架。好了,這一切都還是很有意思的。Hamilton說AWS的每一個區(qū)域都最少有兩個可用區(qū),每個可用區(qū)則最少有1個數(shù)據(jù)中心。然后他又補充說,一個典型的數(shù)據(jù)中心最少有5萬臺服務(wù)器,有的超過8萬臺。另外,數(shù)據(jù)中心的規(guī)模效益在到達(dá)頂峰后便即下降。隨著規(guī)模擴大,在某一個點,數(shù)據(jù)中心的邊際成本開始上升,而不是下降。更重要的是,在到達(dá)某一個數(shù)值后,一旦發(fā)生災(zāi)難型事故導(dǎo)致數(shù)據(jù)中心失效,則殃及的“爆炸半徑”太大,使得過多的負(fù)載無法轉(zhuǎn)移。做一點計算吧。假設(shè)AWS有28個可用分區(qū),每一個數(shù)據(jù)中心只有5萬服務(wù)器。這是AWS基礎(chǔ)設(shè)施最小的容量了。這樣,全球共有140萬服務(wù)器。如果你不相信,說每個分區(qū)有8萬臺服務(wù)器(我們知道這不是真的,只不過設(shè)置一個錯誤的最高界線),那么就是224萬機器。為了更準(zhǔn)確的猜測AWS基礎(chǔ)設(shè)施的規(guī)模,你必須猜測可用區(qū)中,數(shù)據(jù)中心數(shù)量的分布情況。我認(rèn)為很少情況下,只有一個數(shù)據(jù),大部分都是2個數(shù)據(jù)中心,擁有更多數(shù)據(jù)中心的情況則越來越少,直到到達(dá)最大值6個數(shù)據(jù)中心。我把數(shù)據(jù)擺弄來擺弄去,覺得28個分區(qū),一共87個數(shù)據(jù)中心這樣的估算還是靠譜的。每個分區(qū)平均3個數(shù)據(jù)中心還要多一點。如果假設(shè)每個可用區(qū)平均6萬5千個服務(wù)器,那么你會看到數(shù)值很大:564萬服務(wù)器。如果平均5萬服務(wù)器,則降低到全球420萬機器。如果假設(shè)每個可用區(qū)的數(shù)據(jù)中心少一些-比如平均2個-那么一共280萬臺機器。由此,答案是AWS可能擁有280萬到560萬服務(wù)器。我也意識到很可能誤差很大,可是也只能這樣猜測了??偟膩碚f,規(guī)模是巨大的。還不止這些,亞馬遜還投入了巨大資金,制造自有的網(wǎng)絡(luò)設(shè)備,并建設(shè)了私有網(wǎng)絡(luò),從而把所有數(shù)據(jù)中心連接在一起形成一個巨大的全球集群。這是Hamilton談起來最興奮的東西,因為網(wǎng)絡(luò)是計算能力最大的瓶頸?!皩ξ覀兌?,網(wǎng)絡(luò)互聯(lián)是當(dāng)前最大的危機”Hamilton解釋道“網(wǎng)絡(luò)建設(shè)的成本,與所有其它設(shè)備的成本都相關(guān),不斷攀升。在這方面是反摩爾定律的。我們所有的設(shè)備都在降低成本,我們也在壓低價格,但網(wǎng)絡(luò)成本則反向而行。這是個大問題。往前再看遠(yuǎn)幾年,網(wǎng)絡(luò)的問題越發(fā)嚴(yán)重。同時網(wǎng)絡(luò)是反摩爾定律的,網(wǎng)絡(luò)建設(shè)對計算能力的占比也在上升?!盚amilton說,部分原因,是由于每一代的cpu都帶來更多的計算能力,而每單元計算能力的成本則在下降。越來越多的人,做越來越多的數(shù)據(jù)分析,而數(shù)據(jù)分析工作對網(wǎng)絡(luò)的需求巨大,給網(wǎng)絡(luò)帶來巨大壓力。(這是因為數(shù)據(jù)分析,和超級計算機的運作一樣,在節(jié)點之間要進(jìn)行大量通信,也就是所謂的“東西流量”。而另一種“南北流量”則是web應(yīng)用從服務(wù)器上請求一點數(shù)據(jù)并在互聯(lián)網(wǎng)上顯示出來。二者區(qū)別很大。)所以約五年前,當(dāng)問題剛剛出現(xiàn)時,AWS設(shè)計了自己的網(wǎng)絡(luò)路由器并去原廠制造硬件,并組建團隊在硬件上開發(fā)網(wǎng)絡(luò)軟件。亞馬遜從定制網(wǎng)絡(luò)設(shè)備中學(xué)習(xí)到的第一件事,和它很久以前從服務(wù)器和存儲中學(xué)到的一樣:如果你用極簡主義理念,自主制造所需的設(shè)備,那么就會便宜很多?!皟H僅網(wǎng)絡(luò)設(shè)備的服務(wù)合同,常常就要幾千萬美金?!钡幢銓amilton而言,也是頗為驚奇的事:網(wǎng)絡(luò)的可用性上升了,而不是下降。這是因為AWS交換機和路由器只具備AWS在網(wǎng)絡(luò)上所需的功能。但商業(yè)網(wǎng)絡(luò)操作系統(tǒng),則必須覆蓋所有可能需要的場景和協(xié)議,因而往往需要幾千萬行的代碼,從而帶來維護(hù)上的困難?!拔覀兊脑O(shè)備更可靠,因為我不需要面對那些更麻煩的問題。能完成任務(wù)的,就是好方法?!绷硪患?,亞馬遜,尤其是AWS熱衷于測試并收集運行數(shù)據(jù)。當(dāng)亞馬遜第一次測試自己的網(wǎng)絡(luò)時,用了8000臺服務(wù)器,容量3兆瓦的數(shù)據(jù)中心。而這個數(shù)據(jù)中心的建設(shè)成本約為4千萬美金。任何一家最大的網(wǎng)絡(luò)設(shè)備提供商都做不到,但AWS可以,而且做到了。嚴(yán)格來說,亞馬遜是從自己那里租了這巨大規(guī)模的數(shù)據(jù)中心用以測試,在幾個月里花費了幾十萬美金。今天亞馬遜所有網(wǎng)絡(luò)都在使用這自有的網(wǎng)絡(luò)軟件。與擁有軟件和詳細(xì)測試一樣重要的是,亞馬遜持續(xù)開發(fā)代碼并投入生產(chǎn)。“也許開始的時候確實差一點,但確實越來越好?!焙唵蝸碚f,這就是超級系統(tǒng)的獨特之處??偸菑暮喡?,到還湊活,一直到完善狀態(tài)。走一條穩(wěn)定、革新的路,當(dāng)然這條路會時時被新的理念打斷均衡的過程。AWS當(dāng)前有11個地區(qū),2年前是9個地區(qū),還將增加更多以接近客戶,并滿足業(yè)務(wù)上對政府管轄權(quán)的需求。(德國地區(qū)就是因為德國的商業(yè)機構(gòu)和政府機構(gòu),不能在愛爾蘭存儲數(shù)據(jù)而創(chuàng)建的)這是他們分布的位置:所有的地區(qū)都連接在一起,通過私有光纖通道,而不是通過購買第三方的通道。原因很簡單:這樣做,不會因為運營商的問題而導(dǎo)致網(wǎng)絡(luò)帶寬缺乏,而且網(wǎng)絡(luò)是你自己的,你清楚知道網(wǎng)絡(luò)的效率。也更加經(jīng)濟,對于亞馬遜這么大的規(guī)模,自己擁有網(wǎng)絡(luò),在每個字節(jié)上的單位價格一定更便宜。另外,自有的網(wǎng)絡(luò)也比較快,亞馬遜不會緩沖自己的流量。而運營商遇到過載的時候,就會對流量進(jìn)行緩沖?!案煽?、更經(jīng)濟、也更少延遲”Hamilton這樣說。美東地區(qū),弗吉尼亞州的阿什本,共有5個可用區(qū)。這些可用區(qū)都是受保護(hù)的區(qū)域,各自分離并隔開幾公里,由高速、低延遲網(wǎng)絡(luò)連接。這樣一來,同步的復(fù)制就是可能的,而且地理上的隔離足夠遠(yuǎn),兩個可用區(qū)(存儲數(shù)據(jù)和應(yīng)用的多個版本)同時出現(xiàn)事故的可能性就很小??捎脜^(qū)單元由光纖聯(lián)接,使用密集型波分復(fù)用傳送數(shù)據(jù)包。在美東地區(qū),一共有82864條光纖。可用區(qū)在延遲方面通常都小于1毫秒,絕對小于2毫秒;這個速度是可以進(jìn)行同步數(shù)據(jù)復(fù)制的。要知道,固態(tài)硬盤的數(shù)據(jù)保存也要在1-2毫秒之間。企業(yè)經(jīng)常在關(guān)鍵應(yīng)用上,通常都會進(jìn)行跨區(qū)域復(fù)制。但在麻煩一些的場景中,比方說,一個數(shù)據(jù)中心在紐約,一個在洛杉磯,則延遲大約為74毫秒。這種情況下,就無法進(jìn)行同步復(fù)制,這就意味著一次失敗,數(shù)據(jù)就會在到達(dá)備份系統(tǒng)的傳輸途中丟失。這樣一來,就只能使用日志恢復(fù),而這則要花費數(shù)天時間了。這就是為什么亞馬遜在2000年要發(fā)明可用區(qū)。這種方法一定程度上,更加昂貴,但災(zāi)難恢復(fù)更快??捎脜^(qū)在美東地區(qū)有25Tb/sec的帶寬,為了應(yīng)用的可靠性,這個花費還是值得的。對于在線零售商來說,這肯定是必須的。想像一下你開車去沃爾瑪,而整個庫存卻都空了。如果發(fā)生了愚蠢的錯誤,例如負(fù)載均衡失效,則可用區(qū)中的一個就會承擔(dān)負(fù)荷并繼續(xù)工作,重建同步隨即便可開始。讓我們進(jìn)入一個可用區(qū)看看。美東地區(qū)的可用區(qū)中,每個數(shù)據(jù)中心之間網(wǎng)絡(luò)傳輸只需1/4毫秒,而且沒有一個數(shù)據(jù)中心跨越2個分區(qū)。實際上,如上所述,一個可用區(qū)可以有多個數(shù)據(jù)中心,美東看上去有10個數(shù)據(jù)中心,而據(jù)說有些可用區(qū)有多達(dá)6個數(shù)據(jù)中心??捎脜^(qū)中有多個冗余交換中心。這樣,即使亞馬遜丟掉一個交換中心和多個可用區(qū),一切都還可以正常運行。進(jìn)入一個可用區(qū)的數(shù)據(jù)中心,如上所述,有50000服務(wù)器,有時候還會多達(dá)80000機器。一個aws數(shù)據(jù)中心大概在25兆瓦到30兆瓦之間,如果一共有87個數(shù)據(jù)中心,則總共有2.17吉瓦(2.17個十億瓦)到2.6吉瓦電力消耗。Hamilton說亞馬遜可以運行60兆瓦的數(shù)據(jù)中心,但問題是,從2000個機架到2500個機架,成本并不會降低很多,而且災(zāi)難范圍,也就是他所說的“爆炸半徑”,太巨大?!皬哪硞€點開始,價值降低而成本升高。在我們看來,這大概就是正確的數(shù)字了”Hamilton這樣評價亞馬遜為數(shù)據(jù)中心定義的大小。記下來吧,競爭對手們。一個單獨的數(shù)據(jù)中心,有高達(dá)102Tb/sec帶寬的分配,這是美東地區(qū)的可用區(qū)之間的帶寬的4倍。Hamilton補充說數(shù)據(jù)中心內(nèi)部的帶寬還要“遠(yuǎn)超”102Tb/sec。再到一個機架里看看,到一個服務(wù)器和虛擬網(wǎng)卡里看看。網(wǎng)卡支持SR-IOV,這是PCI-Express協(xié)議的擴展。PCI-Express協(xié)議對物理網(wǎng)絡(luò)設(shè)備的資源進(jìn)行虛擬化。SR-IOV繞過操作系統(tǒng)上運行的通常軟件協(xié)議棧,以及網(wǎng)絡(luò)驅(qū)動和支撐他

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論