多圖技術(shù)貼:深入淺出解析大數(shù)據(jù)平臺架構(gòu)_第1頁
多圖技術(shù)貼:深入淺出解析大數(shù)據(jù)平臺架構(gòu)_第2頁
多圖技術(shù)貼:深入淺出解析大數(shù)據(jù)平臺架構(gòu)_第3頁
多圖技術(shù)貼:深入淺出解析大數(shù)據(jù)平臺架構(gòu)_第4頁
多圖技術(shù)貼:深入淺出解析大數(shù)據(jù)平臺架構(gòu)_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

目錄:什么是大數(shù)據(jù)Hadoop介紹-HDFS、MR、Hbase大數(shù)據(jù)平臺應(yīng)用舉例-騰訊公司的大數(shù)據(jù)平臺架構(gòu)“就像望遠(yuǎn)鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀測微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式……”。大數(shù)據(jù)的4V特征-來源公司的“大數(shù)據(jù)”隨著公司業(yè)務(wù)的增長,大量和流程、規(guī)則相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)也爆發(fā)式增長。比如:1、業(yè)務(wù)系統(tǒng)現(xiàn)在平均每天存儲20萬張圖片,磁盤空間每天消耗100G;2、平均每天產(chǎn)生簽約視頻文件6000個,每個平均250M,磁盤空間每天消耗1T;……三國里的“大數(shù)據(jù)”“草船借箭”和大數(shù)據(jù)有什么關(guān)系呢?對天象的觀察是基于一種對風(fēng)、云、溫度、濕度、光照和所處節(jié)氣的綜合分析這些數(shù)據(jù)來源于多元化的“非結(jié)構(gòu)”類型,并且數(shù)據(jù)量較大,只不過這些數(shù)據(jù)輸入到的不是電腦,而是人腦并最終通過計算分析得出結(jié)論。Google分布式計算的三駕馬車GoogleFileSystem用來解決數(shù)據(jù)存儲的問題,采用N多臺廉價的電腦,使用冗余(也就是一份文件保存多份在不同的電腦之上)的方式,來取得讀寫速度與數(shù)據(jù)安全并存的結(jié)果。Map-Reduce說穿了就是函數(shù)式編程,把所有的操作都分成兩類,map與reduce,map用來將數(shù)據(jù)分成多份,分開處理,reduce將處理后的結(jié)果進(jìn)行歸并,得到最終的結(jié)果。BigTable是在分布式系統(tǒng)上存儲結(jié)構(gòu)化數(shù)據(jù)的一個解決方案,解決了巨大的Table的管理、負(fù)載均衡的問題。Hadoop體系架構(gòu)Hbase——分布式數(shù)據(jù)存儲系統(tǒng)

Client:使用HBaseRPC機制與HMaster和HRegionServer進(jìn)行通信Zookeeper:協(xié)同服務(wù)管理,HMaster通過Zookeepe可以隨時感知各個HRegionServer的健康狀況HMaster:

管理用戶對表的增刪改查操作HRegionServer:HBase中最核心的模塊,主要負(fù)責(zé)響應(yīng)用戶I/O請求,向HDFS文件系統(tǒng)中讀寫數(shù)據(jù)HRegion:Hbase中分布式存儲的最小單元,可以理解成一個TableHStore:HBase存儲的核心。由MemStore和StoreFile組成。HLog:每次用戶操作寫入Memstore的同時,也會寫一份數(shù)據(jù)到HLog文件還有哪些NoSQL產(chǎn)品?

為什么要使用NoSQL?一個高并發(fā)網(wǎng)站的DB進(jìn)化史關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-基本變換

關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-內(nèi)嵌變換

關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-分割變換

關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-內(nèi)聯(lián)變換

Hadoop2.0MapReduce:

JobTracker:協(xié)調(diào)作業(yè)的運行。

TaskTracker:運行作業(yè)劃分后的任務(wù)。大數(shù)據(jù)的技術(shù)領(lǐng)域騰訊大數(shù)據(jù)現(xiàn)狀(資料來自2014.4.11騰訊分享日大會)

騰訊大數(shù)據(jù)平臺產(chǎn)品架構(gòu)騰訊大數(shù)據(jù)平臺與業(yè)務(wù)平臺的關(guān)系公司數(shù)據(jù)處理平臺的基礎(chǔ)架構(gòu)公司

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論