版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、騰訊數(shù)據(jù)能輸出之路Agenda概覽基礎(chǔ)平臺任務(wù)調(diào)度云化Part01概覽發(fā)展歷程20092011201320152010201220142016TDW v0.1發(fā)布搭建第個(gè)hadoop集群 智勝廣告上線發(fā)布騰訊大數(shù)據(jù)套件TBDS V1.0TDBank上線全面代替原有外購商業(yè)產(chǎn)品 發(fā)布機(jī)器學(xué)習(xí)平臺TeslaTRC正式開放TDW開源Gaia單集群實(shí)現(xiàn)8800臺Docker on Gaia發(fā)布TPR全實(shí)時(shí)流程上線 上線2500臺Spark集群 大數(shù)據(jù)私有云平臺數(shù)智3.0發(fā)布云市場細(xì)分私有云公有云單租戶公有云多租戶大數(shù)據(jù)平臺能力數(shù)據(jù)敏感性客戶免運(yùn)維、彈性需求客戶成本極敏感、數(shù)據(jù)融合訴求數(shù)智略產(chǎn)品家族圖譜
2、數(shù)據(jù)分析引擎機(jī)器學(xué)習(xí)引擎離線計(jì)算多維分析引擎資源調(diào)度管理(CPU、GPU)搜索MPP分布式存儲(HDFS、Ceph)AngelMarianaMLGraph數(shù)據(jù)接入引擎大規(guī)模任務(wù)調(diào)度Tesla實(shí)時(shí)計(jì)算TDP/Spark StreamingGE數(shù)據(jù)可視化文智NLP開放推薦洞察分析熱力圖語音識別AAI優(yōu)圖識別FR小云客服ICS輿情iData游戲大數(shù)據(jù)平臺MTA移動(dòng)分析平臺燈塔移動(dòng)運(yùn)營平臺信鴿Push地圖位置大數(shù)據(jù)更多數(shù)智方略行業(yè)產(chǎn)品站式、全流程大數(shù)據(jù)服務(wù)平臺數(shù)智產(chǎn)品特點(diǎn)高度集成化,接入、存儲、離線/實(shí)時(shí)計(jì)算、機(jī)器學(xué)習(xí)、可視化展現(xiàn)服務(wù)提供可拖拽式的支持分鐘級調(diào)度的任務(wù)調(diào)度系統(tǒng)提供高性能多維分析引擎提供
3、全局設(shè)備、組件、任務(wù)緯度的運(yùn)維系統(tǒng)數(shù)智產(chǎn)品優(yōu)勢站式 門戶30+深度優(yōu)化組件統(tǒng)數(shù)據(jù) 安全管控源于社區(qū),完美兼容,平滑過渡全開放API數(shù)智家族圖譜用戶開發(fā)及應(yīng)用系統(tǒng)洛子任務(wù)調(diào)度IDEIDEA黃金眼數(shù)據(jù)采集TDBank算法應(yīng)用平臺Tesla圖計(jì)算機(jī)器學(xué)習(xí)AngelMariana流處理Stream SQL多維分析Hermes分布式數(shù)據(jù)庫PGXZ批處理MapReduceSparkPig流式計(jì)算TStorm資源調(diào)度管理DockerOnGaia(GPU、CPU)分布式存儲HDFSCephKV系統(tǒng)HBaseTDE數(shù)智數(shù)據(jù)平臺架構(gòu)管理控制臺服務(wù)器大數(shù)據(jù)套件 組件層騰訊自研社區(qū)改造版社區(qū)版本公有云私有云非云化環(huán)境
4、大數(shù)據(jù)套件 服務(wù)層統(tǒng)日志中心統(tǒng)權(quán)限管控組件協(xié)調(diào)器Rest API運(yùn)行時(shí)/工作流管理部署.!I控?cái)?shù)Lhotse任務(wù)調(diào)度PGXZ HIVEPIGEasyCountSparkMapReduceTStormHDFSKafka/TubeDockerOnGaiaTDEHermesHBaseTPG黃金眼 報(bào)表展示據(jù)接入TDBANKTRE廣告推薦處理能Gaia業(yè)務(wù) 在線 系統(tǒng)存儲MR數(shù)據(jù)產(chǎn)品精準(zhǔn)推薦/秒級.!I控/多 維分析/用戶畫像/數(shù)據(jù)接入7萬億條2資0源0調(diào)0度0臺HDFS2/P5G0/HPBase/離2線0計(jì)P算5實(shí)萬時(shí)億計(jì)算TRC 條任務(wù)5調(diào)0度0萬次&工 作流Lhotse3數(shù)0據(jù)0分億發(fā)次Part
5、02基礎(chǔ)平臺盾點(diǎn)1.資源管理YARN vs I層(Infrastructure)數(shù)據(jù)存儲HDFS vs I層(Infrastructure)云基礎(chǔ)設(shè)施14Cluster Operating System(GAIA)Docker DaemonDocker DaemonHost OSHost OSServer(PM/VM)Server(PM/VM)Docker DaemonHost OSServer(PM/VM)Docker DaemonHost OSServer(PM/VM)Batch jobHPC MPIONLINESTREAMINGSERVICEmonitordeployDocker on
6、Gaia騰訊Gaia運(yùn)營現(xiàn)狀p 8800:單集群節(jié)點(diǎn)數(shù)p 20w+:調(diào)度能力覆蓋20w個(gè)核p 8k:作業(yè)并發(fā)度數(shù)p 2500:資源池個(gè)數(shù)p 0.2ms:container平均調(diào)度匹配時(shí)間p 1.3億:日運(yùn)行container數(shù)p 120w: 日運(yùn)行作業(yè)數(shù)p 95%:峰值vcore、memory使用率DockerOnGaia解決什么問題?資源共享異構(gòu)環(huán)境共存動(dòng)態(tài)擴(kuò)縮容容災(zāi)容錯(cuò)自動(dòng)化運(yùn)維鍵式部署:申請資源后提交app,剩余事情交給dockerongaia用戶聚焦業(yè)務(wù)灰度運(yùn)營以container為單位進(jìn)行升級、回滾等操作Gaia Scalable FairScheduler多業(yè)務(wù)共享公平的使用集群資
7、源 保證各自業(yè)務(wù)的quota保證高優(yōu)先級作業(yè)搶占 Service batch集群整體資源利用率cpu和memory-intensive的作業(yè)混布 大作業(yè)和小作業(yè)混布Service和batch混布可擴(kuò)展性調(diào)度吞吐Gaia 服務(wù)注冊與發(fā)現(xiàn)Gaia 資源控制接MemoryNetwork IODisk spaceCPUGaia 資源管理緯度增加資源維度更多的資源管理緯度 彈性的CPU控制彈性的內(nèi)存控制彈性的磁盤容星控制 彈性的網(wǎng)絡(luò)出帶寬控制 彈性的網(wǎng)絡(luò)入帶寬控制 彈性的Disk IO控制 Buffer IO控制Gaia - EMCSoftlimitEMC Elastic Memory Control(
8、彈性內(nèi)存控制)1)不會觸發(fā)系統(tǒng)oom kill:使用了 container機(jī)制,且task_cgroup是hardlimit。2)可以容納更多container: 可按照平均值分配container。3) 作業(yè)失敗率大大降低:container 之間是softlimit機(jī)制。4) 對用戶資源評估能力要求降低/cgroupstask_cgroupscgroup 1container 1container ncontainer 2cgroup 1cgroup 1attachattachattachcallBackFuncnm_cgroupdn_cgroupsys_cgroupGaia kill p
9、olicyhardlimitGaia - EMCGaia - EMCGaia 絡(luò)帶寬管控1)TC+cgroups相結(jié)合的方式控 制。2) container之間的網(wǎng)絡(luò)帶寬可以 相互borrow,可以充分利用網(wǎng)絡(luò)資 源。3)內(nèi)核實(shí)現(xiàn)專門控制網(wǎng)絡(luò)入帶寬 的cgroup controller,獸力netrx subsystemRoot class(1:)container 2attachcontainer 1child class ncontainer nattachborrowchild class 1child class 2attachattachGaia 絡(luò)帶寬設(shè)計(jì)目標(biāo)在某個(gè)cgroup網(wǎng)絡(luò)
10、繁忙時(shí),能保 證其設(shè)定配額不會被其他cgroup擠 占在某個(gè)cgroup沒有用滿其配額時(shí), 其他cgroup可以自動(dòng)使用其空閑的部 分帶寬在多個(gè)cgroup分享其他cgroup的空 閑帶寬時(shí),優(yōu)先級高的優(yōu)先; 優(yōu)先級 相同時(shí), 配額大的占用多,配額小的 占用少盡星減少為了流控而主動(dòng)丟包Gaia 絡(luò)帶寬隊(duì)列: 不獸力隊(duì)列, 對每個(gè)報(bào)文直接在正常代碼路徑上進(jìn)行決策Cgroup區(qū)分(標(biāo)記): 在正常處理流程中,報(bào)文查找到目標(biāo)socket結(jié)構(gòu)之后,根據(jù)socket的owner process來確定cgroup報(bào)文決策: 令牌桶 + 共享令牌池 + 顯式借令牌專利2013107167896 - 種保證速
11、率和充分利用空余帶寬的流星調(diào)度方法限速方式: ECN標(biāo)記 + TCP滑窗 + 丟包專利201310743471.7 - 通過接收端主機(jī)標(biāo)記ECN進(jìn)行網(wǎng)絡(luò)入流星限速的方法專利2013107175144 - 根據(jù)令牌桶的水位調(diào)整TCP通告窗口的網(wǎng)絡(luò)入流星主動(dòng)限速方法Gaia Disk IO對buffer io失控。cgroup通過識別pid,控制磁盤io。但在buffer io中,失去了 原有的pid信息,導(dǎo)致不可控。Gaia Disk IO三個(gè)cgroup,分別配置“保證帶寬”為40, 60, 80 kB/s, 模擬磁盤的帶寬為180kB/sGaia 其他CPU管控Cpu share+cpuse
12、t結(jié)合管控NM和DN進(jìn)程納入container管理容器中資源顯示問題通過FUSE實(shí)現(xiàn)用戶態(tài)的文件系統(tǒng)使用cgroup的數(shù)據(jù)統(tǒng)計(jì)container實(shí)際資源使用生成仿真的meminfo、stats、diskstats、cpuinfo等文 件,并綁定mount到container中Container數(shù)據(jù)存儲使用hostvolume存儲不需要保留的數(shù)據(jù);使用Ceph RBD存儲需要保留的數(shù)據(jù):使用Ceph volume plugin 為每個(gè)container分配個(gè)RBD存儲 目錄Docker Registry改造基于hdfs的存儲,實(shí)現(xiàn)無限容星基于tpg修改registry為無狀態(tài)的多registry server的負(fù)載均衡Docker熱升級功能Part03任務(wù)調(diào)度云化云化收益環(huán)境致運(yùn)行環(huán)境鏡像化環(huán)境隔離容器間運(yùn)行環(huán)境隔離版本管理通過構(gòu)建新鏡像
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度“唐代書法與繪畫藝術(shù)品收藏與投資合同”3篇
- 2025年度體育賽事VI視覺形象合同3篇
- 2024簡約合同封面圖片
- 2025年度文化旅游景區(qū)場地經(jīng)營權(quán)出讓協(xié)議2篇
- 2025年度城市綜合體拆遷補(bǔ)償與開發(fā)合同4篇
- 2025便利店加盟店品牌保護(hù)及知識產(chǎn)權(quán)合同范本3篇
- 2024年03月廣東興業(yè)銀行廣州分行春季校園招考筆試歷年參考題庫附帶答案詳解
- 2024版股權(quán)轉(zhuǎn)讓委托的協(xié)議書
- 專業(yè)會計(jì)咨詢與服務(wù)協(xié)議精簡版版B版
- 2025年二零二五食堂工作人員聘用與食品安全培訓(xùn)及考核合同
- GB/T 14040-2007預(yù)應(yīng)力混凝土空心板
- 帶狀皰疹護(hù)理查房課件整理
- 奧氏體型不銹鋼-敏化處理
- 作物栽培學(xué)課件棉花
- 交通信號控制系統(tǒng)檢驗(yàn)批質(zhì)量驗(yàn)收記錄表
- 弱電施工驗(yàn)收表模板
- 絕對成交課件
- 探究基坑PC工法組合鋼管樁關(guān)鍵施工技術(shù)
- 國名、語言、人民、首都英文-及各地區(qū)國家英文名
- API SPEC 5DP-2020鉆桿規(guī)范
- 組合式塔吊基礎(chǔ)施工專項(xiàng)方案(117頁)
評論
0/150
提交評論