北京師范大學并行計算實驗室作業(yè)調(diào)度_第1頁
北京師范大學并行計算實驗室作業(yè)調(diào)度_第2頁
北京師范大學并行計算實驗室作業(yè)調(diào)度_第3頁
北京師范大學并行計算實驗室作業(yè)調(diào)度_第4頁
北京師范大學并行計算實驗室作業(yè)調(diào)度_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

北京師范大學并行計算實驗室作業(yè)調(diào)度主要內(nèi)容一、作業(yè)提交流程二、WEB作業(yè)提交及管理三、命令行作業(yè)提交及管理四、常見問題及錯誤作業(yè)提交流程作業(yè)提交一覽Ssh至登錄節(jié)點(0)新建工作目錄(mkdirtest)進入工作目錄(cdtest編輯作業(yè)提交腳本(vi)提交作業(yè)腳本(qsub)查看作業(yè)運行狀態(tài)(qstat)WEB作業(yè)提交-基本屬性1. 作業(yè)提交基本屬性:0:8080/TSJMWEB作業(yè)提交-基本屬性作業(yè)提交基本屬性介紹作業(yè)名稱

自定義作業(yè)名稱,用于區(qū)分該作業(yè)與其他作業(yè)(必填,英文)2. 隊列

選擇作業(yè)所要提交的隊列(必選)資源(必填,串行作業(yè)為1:1)

作業(yè)運行所需要的資源。以節(jié)點數(shù):核數(shù)形式列出

如2:4,即需要2個節(jié)點,每個節(jié)點4個核心注意:節(jié)點數(shù)不要超過5,每節(jié)點核心不要超過10工作目錄

指定作業(yè)運行的工作目錄。作業(yè)運行產(chǎn)生的中間數(shù)據(jù)將存放在此目錄作業(yè)提交腳本(必填)

指定作業(yè)提交腳本(也可以在線編輯)WEB作業(yè)提交-高級屬性1. 作業(yè)提交高級屬性刪除線表示不常用作業(yè)提交高級屬性介紹選擇網(wǎng)絡(luò)

集群中多套網(wǎng)絡(luò)時,選擇作業(yè)運行所在網(wǎng)絡(luò)(IB,千兆)2. 正確輸出

作業(yè)的正確輸出文件路徑(默認輸出在工作目錄下)錯誤輸出

作業(yè)的錯誤輸出文件路徑(默認輸出在工作目錄下)報警

可以選擇是否要在作業(yè)開始、結(jié)束或發(fā)生故障時報警檢查點

指定作業(yè)是否設(shè)置檢查點,以及作業(yè)添加檢查點時間間隔(只支持串行作業(yè))WEB作業(yè)管理作業(yè)列表:當前登錄用戶所有已提交作業(yè)刪除線表示不常用作業(yè)管理操作說明運行

使作業(yè)無需排隊,直接運行(需要管理員權(quán)限)2. 停止、釋放

使作業(yè)暫時停止、恢復(fù)作業(yè)運行刪除

刪除一個作業(yè)保存檢查點

手動保存當前時刻作業(yè)檢查點獲取檢查點、從檢查點恢復(fù)

獲取所有已保存檢查點,可以從中選擇一個檢查點恢復(fù)作業(yè)運行WEB作業(yè)管理作業(yè)管理右鍵操作WEB作業(yè)管理查看作業(yè)詳細信息WEB作業(yè)管理查看作業(yè)輸出WEB作業(yè)管理查看作業(yè)調(diào)度日志命令行作業(yè)提交準備一、注意先要申請帳號,獲得帳號后,通過遠程登錄,執(zhí)行以下操作,完成無密碼訪問配置:1:”cp/opt/ssh/ssh-configure/hostfile.”2:”/opt/ssh/ssh-configure/step1.expusername”3:”/opt/ssh/ssh-configure/step2.expusernamepassword”二、服務(wù)器集群節(jié)點信息:刀片節(jié)點cu01~cu05胖節(jié)點:fatGPU節(jié)點:gpu管理節(jié)點:mu01(禁止在管理節(jié)點上運行自己的任務(wù))命令行作業(yè)提交qsubxx.sh-lnodes=2:ppn=4

需要2個節(jié)點,每個節(jié)點上4核-epath

錯誤信息輸出的路徑-opath

正常輸出信息輸出的路徑 -qbatch

作業(yè)提交隊列(目前有batch和gpu兩個隊列)作業(yè)提交串行腳本編寫-N作業(yè)名

-lnodes=2:ppn=4需要2個節(jié)點,每個節(jié)點4個核-lnodes=cu01指定具體計算節(jié)點cu01-lnodes=cu01+cu02指定具體節(jié)點cu01,cu02注意:提交作業(yè)時,1個作業(yè)不要占用集群所有資源。如當前6個節(jié)點每個節(jié)點12個核,不要使用nodes=

作業(yè)腳本xx.sh編寫如下:#PBS–Njob_name#PBS–lnodes=2:ppn=4#PBS–Pzhangsansleep1000作業(yè)提交并行腳本編寫(拷貝下面粗體腳本內(nèi)容,存儲為xx.sh)#/bin/bashEXEC=“/home/【你的用戶名】/【可執(zhí)行文件】"ARGS=""echo$PBS_NODEFILEcat$PBS_NODEFILE>~/nodefileNP=`cat$PBS_NODEFILE|wc-l`/opt/intel/impi/08/intel64/bin/mpirun-hostfile~/nodefile-np$NP$EXEC$ARGScat~/nodefile注意:一般情況只要復(fù)制上面的腳本,修改紅色部分就可以了。不要用中文作業(yè)提交查詢

qstat無參數(shù)查詢所有作業(yè)信息-B查詢服務(wù)器狀態(tài)-Q查詢隊列狀態(tài)-n查詢每個作業(yè)的基本信息

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論