下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、多級隊列調(diào)度算法可視化界_【數(shù)據(jù)篇】數(shù)據(jù)加的開源任務(wù)調(diào)度系統(tǒng)解決案DolphinS。前數(shù)據(jù)從來不是獨存在的,對數(shù)據(jù)進處理的過程為數(shù)據(jù)加,數(shù)據(jù)加流程之間是存在依賴關(guān)系的,為了解決定時和依賴問題,我們引了任務(wù)調(diào)度系統(tǒng)。在數(shù)據(jù)平臺中,任務(wù)調(diào)度系統(tǒng)負責(zé)管理任務(wù)的啟動時間,任務(wù)之間的依賴關(guān)系,保證數(shù)據(jù)加流程能正確運。除了定時功能,任務(wù)調(diào)度系統(tǒng)對于任務(wù)之間的依賴處理使得調(diào)度更加靈活。同流程內(nèi)的任務(wù)可以通過連線實現(xiàn)依賴;不同流程之間可以通過設(shè)置流程間的依賴關(guān)系結(jié)合來實現(xiàn)依賴。Apache Dolphin Scheduler 是個分布式去中化,易擴展的可視化DAG作流任務(wù)調(diào)度系統(tǒng)。致于解決數(shù)據(jù)處理流程中錯綜復(fù)
2、雜的依賴關(guān)系,使調(diào)度系統(tǒng)在數(shù)據(jù)處理流程中開箱即。DolphinScheduler 系統(tǒng)架構(gòu)Dolphin Scheduler 1.3.x 的系統(tǒng)架構(gòu)圖如下所:Dolphin Scheduler 1.3.x01 MasterServer的系統(tǒng)架構(gòu)由以下服務(wù)組成:MasterServer采分布式中設(shè)計理念,MasterServer主要負責(zé) DAG 任務(wù)切分、任務(wù)提交監(jiān)控,并同時監(jiān)聽其它MasterServer和WorkerServer的健康狀態(tài)。MasterServer服務(wù)啟動時向Zookeeper注冊臨時節(jié)點,通過監(jiān)聽Zookeeper臨時節(jié)點變化來進容錯處理。MasterServer基于net
3、ty提供監(jiān)聽服務(wù)該服務(wù)內(nèi)主要包含:Distributed Quartz分布式調(diào)度組件,主要負責(zé)定時任務(wù)的啟停操作,當(dāng)quartz調(diào)起任務(wù)后,Master內(nèi)部會有線程池具體負責(zé)處理任務(wù)的后續(xù)操作MasterSchedulerThread是個掃描線程,定時掃描數(shù)據(jù)庫中的 command 表,根據(jù)不同的命令類型進不同的業(yè)務(wù)操作MasterExecThread主要是負責(zé)DAG任務(wù)切分、任務(wù)提交監(jiān)控、各種不同命令類型的邏輯處理MasterTaskExecThread主要負責(zé)任務(wù)的持久化02 WorkerServerWorkerServer也采分布式中設(shè)計理念,WorkerServer主要負責(zé)任務(wù)的執(zhí)和提
4、供志服務(wù)。WorkerServer服務(wù)啟動時向Zookeeper注冊臨時節(jié)點,并維持跳。WorkerServer基于netty提供監(jiān)聽服務(wù)該服務(wù)內(nèi)包含:FetchTaskThread主要負責(zé)不斷從Task Queue中領(lǐng)取任務(wù),并根據(jù)不同任務(wù)類型調(diào)TaskScheduleThread對應(yīng)執(zhí)器LoggerServer是個RPC服務(wù),提供志分查看、刷新和下載等功能03 ZooKeeperZooKeeper服務(wù),系統(tǒng)中的MasterServer和WorkerServer節(jié)點都通過ZooKeeper來進集群管理和容錯,另外系統(tǒng)還基于ZooKeeper進事件監(jiān)聽和分布式鎖04 Task Queue提供任
5、務(wù)隊列的操作,前隊列也是基于Zookeeper來實現(xiàn)05 Alert提供告警相關(guān)接,接主要包括告警兩種類型的告警數(shù)據(jù)的存儲、查詢和通知功能。其中通知功能為郵件通知06 APIAPI接層,主要負責(zé)處理前端UI層的請求。該服務(wù)統(tǒng)提供RESTfulapi向外部提供請求服務(wù)。接包括作流的創(chuàng)建、定義、查詢、修改、發(fā)布、下線、啟動、停、暫停、恢復(fù)、從該節(jié)點開始執(zhí)等等07 UI系統(tǒng)的前端頁,提供系統(tǒng)的各種可視化操作界為什么選擇 DS相信不少都使過 crontab 這個 Linux 系統(tǒng)帶的調(diào)度具,crontab 配置簡單、使便。crontab作為定時調(diào)度來啟動些服務(wù)之類的挺便的,但隨著調(diào)度任務(wù)的量級增加,相
6、互之間存在依賴關(guān)系也是較復(fù)雜,這時候crontab作為調(diào)度具就不能滿我們對數(shù)據(jù)我們在整合數(shù)據(jù)加的過程中發(fā)現(xiàn)按照 crontab 調(diào)度來整合的話邏輯處理太復(fù)雜,作量太,不容易定位到問題,后期維護起來也較困難。后來也查了好種解決案,最終選擇了Dolphin Scheduler,Apache Dolphin Scheduler是個分布式去中化,易擴展的可視化DAG作流任務(wù)調(diào)度系統(tǒng)我們可以通過使 DS 完成帶調(diào)度的數(shù)據(jù)加01 DS的易性Dolphin Scheduler 具有圖形化界,通過圖形化操作界使開發(fā)更簡潔可以在畫布添加數(shù)據(jù)相關(guān)組件實現(xiàn)數(shù)據(jù)加,然后通過組件之間的連線確定任務(wù)依賴,在圖形界我們也可
7、以很直觀的看到樹形圖、特圖、任務(wù)狀態(tài)統(tǒng)計和流程狀態(tài)統(tǒng)計展,還可以通過單個流程狀態(tài)快速定位到問題節(jié)點查看志解決問題02 DS的可性Dolphin Scheduler 持集群 HA ,通過配置 ZooKeeper 實現(xiàn) Master 和 Worker 的去中化設(shè)計,通過提服務(wù)節(jié)點的容錯能實現(xiàn)服務(wù)的可03 DS持多種任務(wù)類型Dolphin Scheduler 持許多任務(wù)類型:Shell,MR,Spark,F(xiàn)link,SQL(MySQL,Postgre SQL,hive,Spark SQL,Oracle等),DataX,Sqoop,Python,Sub_Process,Procedure等04 DS操
8、作類型的多樣性我們可以通過 Dolphin Scheduler 實現(xiàn)流程定時調(diào)度、依賴調(diào)度、動調(diào)度、暫停/停/恢復(fù),同時持失敗重試/告警功能,從節(jié)點恢復(fù)失敗、重跑等功能05 DS的參數(shù)設(shè)置Dolphin Scheduler持流程的全局參數(shù)設(shè)置和流程下的每個節(jié)點的定義參數(shù)設(shè)置06 DS的補數(shù)操作Dolphin Scheduler 持補數(shù),包括串補數(shù)、并補數(shù)2種模式。串補數(shù):指定時間范圍內(nèi),從開始期結(jié)束期依次執(zhí)補數(shù),只成條流程實例;并補數(shù):指定時間范圍內(nèi),多天同時進補數(shù),成N條流程實例07 DS的社區(qū)活躍Dolphin Scheduler 作為款中國團隊開發(fā)的開源架構(gòu),他的社區(qū)是?;钴S的,我們可以直接在GitHub上提交的問題,還可以在為微信群和眾多開發(fā)者起討論問題,社區(qū)活躍的優(yōu)點在于般你遇到的問題別可能已經(jīng)遇到過了,只需要描述清楚你的問題對號座基本上很快都能解決或定位到問題這邊列2個在使DS過程中覺得常實的功能:1、依賴設(shè)置我們可以通過 DEPENDENT 管理流程之間的運關(guān)系,特別是在某些特殊情況下批次期為T-1的流程A依賴T-2、T-N或某個范圍
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年汽車維修保養(yǎng)服務(wù)收費標準協(xié)議書2篇
- 2025-2030年中國自動支票打字機專用色帶市場發(fā)展?jié)摿εc投資策略建議報告
- 2025-2030年中國空氣預(yù)熱器市場競爭格局及前景趨勢預(yù)測報告新版
- 2025-2030年中國離子膜燒堿市場發(fā)展狀況及營銷戰(zhàn)略研究報告
- 2025-2030年中國濕度傳感系統(tǒng)行業(yè)前景趨勢展望及投資潛力分析報告
- 2025年度鋁材產(chǎn)品綠色包裝設(shè)計合同8篇
- 二零二五年度金融產(chǎn)品銷售合同第三方風(fēng)險評估與擔(dān)保服務(wù)協(xié)議4篇
- 二零二五版建筑工程中途退場合同解除及后續(xù)工程協(xié)議3篇
- 二零二五年度跨境社交媒體營銷服務(wù)合同2篇
- 2025年度小產(chǎn)權(quán)房屋買賣合同線上糾紛解決服務(wù)合同3篇
- AQ/T 2061-2018 金屬非金屬地下礦山防治水安全技術(shù)規(guī)范(正式版)
- 2024年湖北三江航天江河化工科技有限公司招聘筆試沖刺題(帶答案解析)
- 采購人員管理制度
- 礦卡司機安全教育考試卷(帶答案)
- SYT 6963-2013 大位移井鉆井設(shè)計指南
- 合同增項補充協(xié)議書范本
- 產(chǎn)后抑郁癥的護理查房
- 五年級上冊數(shù)學(xué)脫式計算300題及答案
- 循環(huán)系統(tǒng)練習(xí)試題(含答案)
- 2024年江蘇護理職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 昭通土豆市場調(diào)研報告
評論
0/150
提交評論