版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
作業(yè)調(diào)度系統(tǒng)曙光信息產(chǎn)業(yè)(北京)有限公司作業(yè)調(diào)度系統(tǒng)曙光信息產(chǎn)業(yè)(北京)有限公司1內(nèi)容任務(wù)管理系統(tǒng)概述作業(yè)調(diào)度系統(tǒng)PBS作業(yè)調(diào)度系統(tǒng)作業(yè)調(diào)度系統(tǒng)的使用內(nèi)容任務(wù)管理系統(tǒng)概述2機(jī)群使用中的問題機(jī)群結(jié)構(gòu)的松散性(單一系統(tǒng)映象)節(jié)點(diǎn)類型的差別(CPU類型、內(nèi)存大小、數(shù)量等)系統(tǒng)資源豐富(節(jié)點(diǎn)/CPU)用戶不同類型的作業(yè)(串行/并行)用戶可以使用資源的限制機(jī)群使用中的問題機(jī)群結(jié)構(gòu)的松散性(單一系統(tǒng)映象)3任務(wù)管理系統(tǒng)的功能單一系統(tǒng)映象機(jī)群松散的結(jié)構(gòu)的整合系統(tǒng)資源整合異構(gòu)系統(tǒng)的整合多用戶的管理用戶提交的任務(wù)的統(tǒng)一安排,避免沖突用戶權(quán)限的管理非授權(quán)用戶的控制任務(wù)管理系統(tǒng)的功能單一系統(tǒng)映象4任務(wù)管理系統(tǒng)的簡(jiǎn)史任務(wù)管理系統(tǒng)的簡(jiǎn)史5任務(wù)管理系統(tǒng)的分類基于進(jìn)程級(jí)別的調(diào)度由機(jī)群中的操作系統(tǒng)或者運(yùn)行時(shí)Runtime內(nèi)部支持,對(duì)運(yùn)行的作業(yè)進(jìn)行監(jiān)控;以實(shí)現(xiàn)機(jī)群內(nèi)的透明調(diào)度、以及自動(dòng)優(yōu)化進(jìn)程的分配和平衡負(fù)載基于作業(yè)級(jí)別的調(diào)度這種方式由獨(dú)立的作業(yè)管理系統(tǒng)實(shí)現(xiàn)。該系統(tǒng)通過專門的入口,接收用戶提交的任務(wù),送入相應(yīng)的隊(duì)列等待調(diào)度;并在適當(dāng)?shù)臅r(shí)機(jī)分配資源,為任務(wù)創(chuàng)建作業(yè),將作業(yè)提入運(yùn)行,在作業(yè)運(yùn)行結(jié)束后完成收尾工作,并提供記帳功能。管理員和用戶還可以在機(jī)群中查詢并預(yù)訂符合要求的資源,,從而實(shí)現(xiàn)對(duì)作業(yè)和資源的全程交互控制。任務(wù)管理系統(tǒng)的分類基于進(jìn)程級(jí)別的調(diào)度6任務(wù)管理系統(tǒng)的比較任務(wù)管理系統(tǒng)的比較7內(nèi)容任務(wù)管理系統(tǒng)概述作業(yè)調(diào)度系統(tǒng)PBS作業(yè)調(diào)度系統(tǒng)作業(yè)調(diào)度系統(tǒng)的使用內(nèi)容任務(wù)管理系統(tǒng)概述8作業(yè)管理的組成資源管理器:管理集群的硬件資源及認(rèn)證信息等隊(duì)列管理器:管理當(dāng)前所有已提交但還未完成的作業(yè)調(diào)度器:為作業(yè)分配資源作業(yè)管理的組成資源管理器:管理集群的硬件資源及認(rèn)證信息等9作業(yè)管理系統(tǒng)的結(jié)構(gòu)作業(yè)管理系統(tǒng)的結(jié)構(gòu)10作業(yè)特性比較作業(yè)特性比較11內(nèi)容任務(wù)管理系統(tǒng)概述作業(yè)調(diào)度系統(tǒng)PBS作業(yè)調(diào)度系統(tǒng)作業(yè)調(diào)度系統(tǒng)的使用內(nèi)容任務(wù)管理系統(tǒng)概述12PBS作業(yè)調(diào)度系統(tǒng)PBS最初由NASA的Ames研究中心開發(fā),為了提供一個(gè)能滿足異構(gòu)計(jì)算網(wǎng)絡(luò)需要的軟件包。它力求提供對(duì)批處理的初始化和調(diào)度執(zhí)行的控制,允許作業(yè)在不同主機(jī)間的路由。PBS作業(yè)調(diào)度系統(tǒng)PBS最初由NASA的Ames研究中心開13PBS的技術(shù)特色力求控制對(duì)批處理的初始化和調(diào)度執(zhí)行,允許作業(yè)在不同主機(jī)間的路由。獨(dú)立的調(diào)度模塊存有各個(gè)可用的排隊(duì)作業(yè)、運(yùn)行作業(yè)和系統(tǒng)資源使用信息,并且允許系統(tǒng)管理員定義資源和每個(gè)作業(yè)可使用的數(shù)量。在作業(yè)調(diào)度策略上,PBS提供了默認(rèn)的公平共享和獨(dú)占FIFO調(diào)度策略,還提供了TCL、BACL、C三種過程語言和調(diào)度類,與定義了一些調(diào)度需要的函數(shù)和完整的API,方便實(shí)現(xiàn)新的調(diào)度策略。提供文件傳送,F(xiàn)ileStage-in和Stage-out。滿足POSIX1003.2d標(biāo)準(zhǔn),支持作業(yè)依賴,和完整的安全認(rèn)證。提供用戶映射功能,使PBS能用于用戶不一致的系統(tǒng)中。PBS的技術(shù)特色力求控制對(duì)批處理的初始化和調(diào)度執(zhí)行,允許作業(yè)14PBS的結(jié)構(gòu)PBS的結(jié)構(gòu)15PBS的組成服務(wù)器:pbs_server調(diào)度器:pbs_sched執(zhí)行器:pbs_mom命令行:用戶腳本,管理命令等PBS的組成服務(wù)器:pbs_server16PBS的基本原理PBS的基本原理17PBS的優(yōu)缺點(diǎn)支持系統(tǒng)級(jí)檢查點(diǎn)功能(需底層操作系統(tǒng)支持)很好的大規(guī)模擴(kuò)展性獨(dú)立的調(diào)度模塊**支持作業(yè)依賴符合POSIX1003.2d標(biāo)準(zhǔn)-只支持Unix類操作系統(tǒng)-多集群協(xié)作功能有限-不支持用戶級(jí)檢查點(diǎn)功能PBS的優(yōu)缺點(diǎn)支持系統(tǒng)級(jí)檢查點(diǎn)功能(需底層操作系統(tǒng)支持)18術(shù)語節(jié)點(diǎn)(node)
一個(gè)單一的操作系統(tǒng)映像,一個(gè)統(tǒng)一的虛擬內(nèi)存映像一個(gè)個(gè)或多個(gè)cpu,一個(gè)或多個(gè)IP地址的計(jì)算機(jī)系統(tǒng)被稱之為一個(gè)節(jié)點(diǎn)。通常執(zhí)行主機(jī)(executionhost)也被稱之為節(jié)點(diǎn)。節(jié)點(diǎn)屬性
隊(duì)列、服務(wù)器和節(jié)點(diǎn)都有與自己相關(guān)的屬性,這些屬性提供控制信息。與節(jié)點(diǎn)相關(guān)的屬性有:狀態(tài)、類型、虛擬處理器的個(gè)數(shù)、作業(yè)列表(本節(jié)點(diǎn)被分配給的作業(yè))以及節(jié)點(diǎn)的特性?!?/p>
節(jié)點(diǎn)特性
為了提供一組節(jié)點(diǎn)的分配的方法,零個(gè)或者多個(gè)特性被賦給每個(gè)節(jié)點(diǎn)。這個(gè)特性不過是一串對(duì)于PBS沒有含義的字母和數(shù)字的組合(第一個(gè)字符必須是字母)。術(shù)語節(jié)點(diǎn)(node)19PBS安裝解壓源文件包
[root@node1/public]#tar-zxvfopenpbs-2.3.16.tar.gz編譯設(shè)置
[root@node1/public/OpenPBS_2.3.16]#./configure--enable-gui--set-server_home=/var/spool/pbs--enable-docs--x-libraries=/usr/X11R6/lib64
其中,--x-libraries=/usr/X11R6/lib64是在X86_64(AMD64或EM64T)上安裝時(shí),需要指明系統(tǒng)64位庫(kù)的位置。編譯安裝
[root@node1/public/OpenPBS_2.3.16]#make [root@node1/public/OpenPBS_2.3.16]#makeinstallPBS安裝解壓源文件包20PBS在機(jī)群上安裝
由于節(jié)點(diǎn)系統(tǒng)相同,因而可以用如下SHELLscript在node2~node8上安裝;
PBS在機(jī)群上安裝 由于節(jié)點(diǎn)系統(tǒng)相同,因而可以用如下SHEL21服務(wù)進(jìn)程配置和啟動(dòng)文件系統(tǒng)配置文件/etc/pbs.conf #!/bin/sh pbs_home=/var/spool/pbs指定系統(tǒng)的pbs的設(shè)置的目錄位置 pbs_exec=/usr/local指定pbs可執(zhí)行程序的目錄位置 start_server=1 start_sched=1當(dāng)為1是表示守護(hù)進(jìn)程啟動(dòng),0為守護(hù)進(jìn)程不啟動(dòng) start_mom=1
系統(tǒng)啟動(dòng)腳本/etc/init.d/openpbs
Server的系統(tǒng)啟動(dòng)腳本/etc/init.d/pbs_serverScheduler系統(tǒng)啟動(dòng)腳本/etc/init.d/pbs_schedMom系統(tǒng)啟動(dòng)腳本/etc/init.d/pbs_mom服務(wù)進(jìn)程配置和啟動(dòng)文件系統(tǒng)配置文件/etc/pbs.conf22Server端設(shè)置初始化server:(第一次運(yùn)行或者重新配置) /usr/local/sbin/pbs_server–tcreateServer配置目錄 /var/spool/pbs/server_priv/節(jié)點(diǎn)屬性聲明:/var/spool/pbs/nodes
node2R220Anp=2 node3R220Anp=2 node4dualcorenp=4 node5dualcorenp=4 node6R4280Anp=4 node7R4280Anp=4Server端設(shè)置初始化server:(第一次運(yùn)行或者重新23mom端設(shè)置mom配置目錄:/var/spool/pbs/mom_priv/mom配置文件:/var/spool/pbs/mom_priv/config
mom端設(shè)置mom配置目錄:/var/spool/pb24Server端的動(dòng)態(tài)設(shè)置PBS要能正常運(yùn)行還需要通過qmgr命令的server進(jìn)行配置,設(shè)置一些屬性。輸入qmgr命令進(jìn)入配置交互命令。下面是讓PBS可以正常運(yùn)行的一些步驟。Server端的動(dòng)態(tài)設(shè)置PBS要能正常運(yùn)行還需要通過qmgr25qmgr命令(管理員使用)輸入qmgr進(jìn)入交互式模式后即可輸入各種命令
qmgr動(dòng)作:對(duì)象類型和操作符
qmgr命令(管理員使用)輸入qmgr進(jìn)入交互式模式后即可輸26PBS隊(duì)列設(shè)置導(dǎo)入server配置文件: [root@node1root]#qmgr<queue.conf輸出配置文件: [root@node1root]#qmgr–c“printserver”>queue.conf配置文件例子:
PBS隊(duì)列設(shè)置導(dǎo)入server配置文件:27Scheduler調(diào)度行為配置Scheduler的行為由配置目錄下的sched_priv/sched_config文件進(jìn)行控制Sort_by關(guān)鍵字控制調(diào)度算法可以選擇的選項(xiàng)為
no_sort,shortest_job_first,longest_job_first,smallest_memory_first,largest_memory_first,high_priority_first,low_priority_first,multi_sort,fair_share,large_walltime_first,short_walltime_first修改這個(gè)文件后重新啟動(dòng)scheduler即可。Scheduler調(diào)度行為配置Scheduler的行為由配置28內(nèi)容任務(wù)管理系統(tǒng)概述作業(yè)調(diào)度系統(tǒng)PBS作業(yè)調(diào)度系統(tǒng)作業(yè)調(diào)度系統(tǒng)的使用內(nèi)容任務(wù)管理系統(tǒng)概述29PBS的使用步驟準(zhǔn)備:編寫描述改作業(yè)的腳本,包括作業(yè)名,需要的資源等。提交:使用qsub命令將該作業(yè)提交給PBS服務(wù)器排隊(duì):服務(wù)器將該任務(wù)排入適當(dāng)?shù)年?duì)列調(diào)度:服務(wù)器檢查各工作節(jié)點(diǎn)的狀態(tài)是否符合該作業(yè)的要求,并進(jìn)行調(diào)度。執(zhí)行:當(dāng)條件滿足時(shí),作業(yè)被發(fā)給相應(yīng)的執(zhí)行服務(wù)器執(zhí)行。程序運(yùn)行時(shí)執(zhí)行服務(wù)器會(huì)收集程序的標(biāo)準(zhǔn)輸出和標(biāo)準(zhǔn)錯(cuò)誤流,等程序結(jié)束時(shí),將這些信息返回給用戶。查詢和調(diào)整:當(dāng)作業(yè)在運(yùn)行時(shí),用戶可以使用qstat進(jìn)行狀態(tài)查詢。用戶發(fā)現(xiàn)作業(yè)提交錯(cuò)誤時(shí),可以使用qdel刪除正在運(yùn)行的作業(yè)。查看結(jié)果:使用文本編輯軟件vi或者系統(tǒng)命令cat,less等查看輸出及錯(cuò)誤信息顯示。PBS的使用步驟準(zhǔn)備:編寫描述改作業(yè)的腳本,包括作業(yè)名,需要30PBS的基本命令在PBS系統(tǒng)中,用戶使用qsub命令提交用戶程序。用戶運(yùn)行程序的命令及PBS環(huán)境變量設(shè)置組成PBS作業(yè)腳本,作業(yè)腳本使用如下格式提交到PBS系統(tǒng)運(yùn)行:PBS的基本命令在PBS系統(tǒng)中,用戶使用qsub命令提交31qsub運(yùn)行參數(shù)qsub運(yùn)行參數(shù)32PBS作業(yè)腳本注釋,以“#”開頭PBS指令,以“#PBS”開頭SHELL命令PBS作業(yè)腳本注釋,以“#”開頭33PBS的環(huán)境變量PBS的環(huán)境變量34PBS作業(yè)腳本注釋,以“#”開頭PBS指令,以“#PBS”開頭SHELL命令PBS作業(yè)腳本注釋,以“#”開頭35PBS作業(yè)腳本舉例PBS作業(yè)腳本舉例36一個(gè)復(fù)雜的PBS作業(yè)腳本一個(gè)復(fù)雜的PBS作業(yè)腳本37查詢和取消作業(yè)查詢和取消作業(yè)38查詢作業(yè)運(yùn)行的位置查詢作業(yè)運(yùn)行的位置39錯(cuò)誤處理作業(yè)提交后處于排隊(duì)狀態(tài)
沒有可用的節(jié)點(diǎn),也就是節(jié)點(diǎn)資源被其他作業(yè)使用;節(jié)點(diǎn)處于忙狀態(tài);調(diào)度器失效;指定的節(jié)點(diǎn)失效,或者節(jié)點(diǎn)上的mom失效作業(yè)提交后異常結(jié)束
腳本文件使用的是windows格式腳本中使用一些命令路徑問題腳本退出但是作業(yè)沒有退出用戶使用的文件的權(quán)限問題處理方法的原則是查看作業(yè)的標(biāo)準(zhǔn)輸入和標(biāo)準(zhǔn)錯(cuò)誤輸出的結(jié)果錯(cuò)誤處理作業(yè)提交后處于排隊(duì)狀態(tài)40錯(cuò)誤處理(續(xù))如果環(huán)境配置錯(cuò)誤,可能導(dǎo)致作業(yè)反復(fù)在等待狀態(tài)和運(yùn)行狀態(tài)轉(zhuǎn)換,可以通過“qdel作業(yè)號(hào)”將該作業(yè)刪除再重新配置環(huán)境???/p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年行政單位水域資源轉(zhuǎn)讓合同范本3篇
- 2025年廣西桂禹工程咨詢有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年山東商投控股集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年度個(gè)人車位租賃合同協(xié)議書(智能充電系統(tǒng))4篇
- 2025年度個(gè)人理財(cái)產(chǎn)品購(gòu)買合同范本8篇
- 2025年四川廣晶光電科技有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年江蘇弘景規(guī)劃建設(shè)有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年福建華僑大學(xué)建筑設(shè)計(jì)院泉州有限責(zé)任公司招聘筆試參考題庫(kù)附帶答案詳解
- 2025年度個(gè)人農(nóng)產(chǎn)品批發(fā)買賣合同模板4篇
- 二零二五版股權(quán)抵押融資租賃合同示范文本3篇
- 春節(jié)家庭用電安全提示
- 醫(yī)療糾紛預(yù)防和處理?xiàng)l例通用課件
- 廚邦醬油推廣方案
- 乳腺癌診療指南(2024年版)
- 高三數(shù)學(xué)寒假作業(yè)1
- 保險(xiǎn)產(chǎn)品創(chuàng)新與市場(chǎng)定位培訓(xùn)課件
- (完整文本版)體檢報(bào)告單模版
- 1例左舌鱗癌手術(shù)患者的圍手術(shù)期護(hù)理體會(huì)
- (完整)100道兩位數(shù)加減兩位數(shù)口算題(難)
- 鋼結(jié)構(gòu)牛腿計(jì)算
- 2023-2024學(xué)年重慶市兩江新區(qū)四上數(shù)學(xué)期末質(zhì)量檢測(cè)試題含答案
評(píng)論
0/150
提交評(píng)論