XX系統(tǒng)巡檢方案_第1頁
XX系統(tǒng)巡檢方案_第2頁
XX系統(tǒng)巡檢方案_第3頁
XX系統(tǒng)巡檢方案_第4頁
XX系統(tǒng)巡檢方案_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、XX 系統(tǒng)巡檢報告(xxx 年度第 x 季度)系統(tǒng)名稱:XX系統(tǒng) 巡檢日期:編寫:編寫日期審核:審核日期批準:批準日期目錄 TOC o 1-5 h z HYPERLINK l bookmark2 o Current Document 、概述 3 HYPERLINK l bookmark4 o Current Document 、巡檢方案 3 HYPERLINK l bookmark6 o Current Document 1 數據庫方面 3 HYPERLINK l bookmark8 o Current Document 數據庫服務器(硬件)基本信息:3 HYPERLINK l bookmar

2、k10 o Current Document 數據庫配置 4 HYPERLINK l bookmark12 o Current Document 1.3數據庫檢查內容 5 HYPERLINK l bookmark14 o Current Document 1.4數據庫檢查總結 6 HYPERLINK l bookmark16 o Current Document 2 應用服務器方面 6 HYPERLINK l bookmark18 o Current Document 應用服務器(硬件)基本信息:6 HYPERLINK l bookmark20 o Current Document 應用服務器

3、檢查內容 7 HYPERLINK l bookmark22 o Current Document 應用服務器檢查總結 9 HYPERLINK l bookmark24 o Current Document 3XX 系統(tǒng)業(yè)務檢查9 HYPERLINK l bookmark26 o Current Document 業(yè)務檢查內容 9 HYPERLINK l bookmark28 o Current Document 業(yè)務檢查總結 9 HYPERLINK l bookmark30 o Current Document 4XX 系統(tǒng)特色檢查11 HYPERLINK l bookmark32 o Cur

4、rent Document 4.1 日終批次情況檢查11 HYPERLINK l bookmark34 o Current Document 4.2 業(yè)務統(tǒng)計檢查12 HYPERLINK l bookmark36 o Current Document 5 網絡通訊部分 12 HYPERLINK l bookmark38 o Current Document 5.1 網絡通信檢查內容 12 HYPERLINK l bookmark40 o Current Document 網絡通信檢查總結 13 HYPERLINK l bookmark42 o Current Document 6 熱備/冷備部

5、分13 HYPERLINK l bookmark44 o Current Document 6.1 熱備/冷備檢查內容 13 HYPERLINK l bookmark46 o Current Document 熱備/冷備檢查總結 13 HYPERLINK l bookmark48 o Current Document 7 系統(tǒng)性能評估 13一、概述合同名稱:合同編號:巡檢地點:巡檢人員:巡檢時間及安排:2巡檢目標:檢查 XX 系統(tǒng)本期巡檢重點:1、檢查數據庫參數,是否有問題。2、檢查應用服務器狀況是否正常。3、監(jiān)控系統(tǒng)的日常運行,包括操作系統(tǒng),數據庫,應用服務,網絡。4、監(jiān)控一線操作人員登陸業(yè)

6、務系統(tǒng),業(yè)務使用系統(tǒng)情況。5、檢查服務器可用資源,包括內存,CPU,磁盤的使用情況,以及數據的備份情況。 建議:在非業(yè)務時間(19:00-24:00 之間)操作應用服務器 (A、 B 機分別執(zhí)行) ap.bat, 數據庫服務器 db.bat、 db_stat.bat、 yw.bat、 ts.bat二、巡檢方案1 數據庫方面數據庫服務器(硬件)基本信息:序號項目名稱檢查方法參考值實際結果1機器名登錄數據庫服務器,執(zhí)行 db.bat腳本中的命令 ipconfig /all,在網絡信息中 查看機器名DongChanYW-dblDongChanYW-db12用途(生產,測試, 開發(fā)生產生產生產3所在城

7、市,物理位置(機房,遠程)機房機房機房4硬件供貨商5型號IBM,9133-55AIBM,8233-E8B6操作系統(tǒng)登錄數據庫服務器,執(zhí)行 db.bat腳本中的命令verWindows_NTWindows_NT7操作系統(tǒng)版本登錄數據庫服務器,執(zhí)行 db.bat腳本中的命令 echo %OS%Microsoft Windows/版本 6.1.7601Microsoft Windows/版本 6.1.76018內存登錄數據庫服務器,打開任 務管理器,選擇性能標簽頁7936 MB8191 MB9CPU個數登錄數據庫服務器,打開任 務管理器,選擇性能標簽頁4410剩余磁盤空間(in %)登錄數據庫服務器

8、,命令行 打開diskmgmt.msc查看磁盤 使用情況卷文件系統(tǒng)狀態(tài)可用 C: NTFS狀態(tài)良好30%卷文件系統(tǒng)狀態(tài)可用 C: NTFS狀態(tài)良好30% 系統(tǒng)保留NTFS狀態(tài)良 好74%E: NTFS狀態(tài)良好60%11處理器數(由實例使 用)打開SQLServer服務器面板 查看4412總服務器內存K3)打開SQLServer服務器面板 查看3147776314777613可用性需求(系統(tǒng)使 用時間)正常正常數據庫配置生產庫:序號項目名稱檢查方法參考值實際結果1實例名查看實例名稱DB12數據庫名SCFDBSCFDB3版本打開SQLServer服務器面板, 查看數據庫版本10.50.160600

9、.14表空間信息執(zhí)彳丁 db_stat.bat腳本正常正常1.3 數據庫檢查內容序號檢查項目方法檢查項目描述參考值實際結果1打開sqlserver管 理面板,選擇日志, 檢查數據庫日志文 件中是否有系統(tǒng)錯 誤信息。查看 sqlserverlog 日期 log 文件中11月31日后是否有錯 誤碼,要查看錯誤碼的相關解 釋可參考sqlserver幫助文檔正常正常2檢查表空間使用情 況,評估數據庫表 空間的使用情況 方法:執(zhí)行 db stat.bat 腳本執(zhí)行命令后可查看到保留空 間、使用空間、索引使用空 間、未用空間正常正常3檢查每晚的備份是否成功目前采用虛擬機整機備份檢 查備份是否正常備份正常。

10、備份正常。4監(jiān)控數據庫性能: 執(zhí)行db_stat_connection. bat,統(tǒng)計物理連接 數情況, 執(zhí)行db stat lock.bat , 檢查是否存在死 鎖,并解鎖主要關注以下幾項:1、查看物理連接數是否在正 常范圍內2、檢查是否存在死鎖在業(yè)務高峰期取6次快 照得到以下結論:1、當前連接的應用程序 的最大連接數48在系 統(tǒng)范圍設置范圍內 (0-90)2、未檢測到死鎖。在業(yè)務高峰期恥次快照得 到以下結論1、當前連接的應用程序的 最大連接數23在系統(tǒng)范圍 設置范圍內(0-103)2、未檢測到死鎖5檢查數據庫配置信息:執(zhí)行db.bat腳本通過提取的配置信息結合數 據庫表空間使用情況分析數

11、據庫是否滿足目前的系統(tǒng)要 求。正常正常6檢查數據庫基礎數 據方法:執(zhí)行base data.bat 腳 本通過提取的基礎數據結合業(yè) 務配置流程等,分析基礎數據 是否滿足目前的系統(tǒng)要求正常經過檢測分析得到如下結 論:正常7查看業(yè)務繁忙時數 據庫cpu及內存使 用情況方法: 打開命令彳丁,輸入 taskmgr.exe, 打開 任務管理器,選擇“性能”標簽項, 并截圖保存(根據 統(tǒng)計語句獲得業(yè)務cpu的平均使用率低于30%。正常正常系統(tǒng)統(tǒng)計的數據量 得到每天的業(yè)務咼 峰時間段,在這個 時間段內執(zhí)行6 次)。1.4數據庫檢查總結通過對收集到的數據庫信息分析得出以下結論:1、關于數據庫連接數,本系統(tǒng)eb服

12、務器was設置的最大數據庫連接數為00個,而目前業(yè)務高峰 期的數據庫最大連接數為20 個,也就是在當前業(yè)務高峰期間,數據庫的最大連接數只占到系統(tǒng)設置20的% 左右,完全滿足系統(tǒng)業(yè)務需求。2 、未檢測到有死鎖現象,數據庫運行良好。2 應用服務器方面2.1應用服務器(硬件)基本信息:序號項目名稱檢查方法參考值實際結果1腳本中的ipconfig /all,在網絡 信息中查看機器名DongChanYW-app1DongChan YW-app12用途(生產,測試, 開發(fā))生產生產生產3所在城市,物理位 置(機房,遠程)機房機房機房4硬件供貨商5型號6操作系統(tǒng)登錄應用服務器,執(zhí)行pbat 腳本中的命令ec

13、ho %OS%Windows_NTWindows_NT7操作系統(tǒng)版本登錄應用服務器,執(zhí)行p.batMicrosoft Windows/版本 6.1.7601Microsoft Windows/版本 6.1.76018內存登錄應用服務器,打開任務管 理器性能標簽4095 MB4095 MB9CPU個數登錄應用服務器,打開任務管 理器性能標簽2210剩余磁盤空間(in %)登錄數據庫服務器命令行打 開diskmgmt.msc查看磁盤使 用情況卷文件系統(tǒng)狀態(tài)可用 C: NTFS狀態(tài)良好30%卷文件系統(tǒng)狀態(tài)可用C: NTFS狀態(tài)良好79% 系統(tǒng)保留NTFS狀態(tài)良好 72%E: NTFS狀態(tài)良好94%1

14、1可用性需求(系統(tǒng)13*713*72.2應用服務器檢查內容序號檢查項目方法檢查項目描述參考值實際結果1檢查所有應用服務 器標準輸岀和錯誤 輸岀日志。 查看錯誤日志(E:/IBM/WebSphe re/AppServer/prof iles/AppSrvOl/log s/serverl/ScfOut. log)中是否有錯誤 代碼,如果存在,根 據日志中錯誤信息 檢杳檢查是否存在錯誤日志正常正常2查看業(yè)務繁忙時應 用服務器的CPU以及 內存使用情況。 方法: 打開命令彳丁,輸入 taskmgr.exe 打任 務管理器,選擇“性 能”標簽項,并截圖 保存。根據統(tǒng)計語句獲得 業(yè)務系統(tǒng)統(tǒng)計的數 據量得到

15、每天的業(yè) 務高峰時間段,在這 個時間段內執(zhí)行6 次(根據統(tǒng)計語句獲 得業(yè)務系統(tǒng)統(tǒng)計的打開任務管理器性能頁面查 看系統(tǒng)資源使用情況是否正 常CPU的平均使用率低 于 30%。CPU的平均使用率 低于30%。數據量得到每天的 業(yè)務高峰時間段,在 這個時間段內執(zhí)行 數次)。3查看應用服務器進 程狀態(tài)方法:執(zhí)行ap.bat 腳本中的%SystemRoot%/system32/tasklist查看當前是否有was進程在 運行正常正常4主要參數/配置 方法:1、ebsphere 服務器處理線程數。打開管 理控制臺,依次打開 目錄樹,應用程序服 務器 serverl 線程池WebContainer,查看 取

16、大大小2、JVM虛擬機堆大 小,服務器應用程 序服務器 -server1- 進程定 義-java虛擬機,查 看初始堆大小和最 大堆大小的值3、Web容器傳輸鏈,應用程序服務器 serverl Web 容器 傳輸鏈WCInboundDefault HTTP入站通道 (HTTP 2),查看最 大持久請求數4、數據源- Microsoft SQL Server JDBC Driver Appl 查看連接數據庫的 服務器的IP地址, 并點“測試連接” 連接成功;點“連接 池屬性”,查看最大 連接數檢查Web容器線程池大小、 Java虛擬機堆大小、 每個連接最大持久請求數數 據庫連接池最大連接數1、We

17、b容器線程池502、Java虛擬機堆大小 256M-1024M3、Web容器最大持久 請求數1004、數據庫連接池最大 連接數1001、Web容器線程池502、Java虛擬機堆大 小 256M-1024M3、Web容器最大持 久請求數1004、數據庫連接池 最大連接數100應用服務器檢查總結通過應用服務器檢查分析得出以下結論 應用服務器各項檢查正常。3 XX 系統(tǒng)業(yè)務檢查業(yè)務檢查內容1、非業(yè)務時間(建議在19:00-24:00之間),登錄數據庫服務器執(zhí)行以下腳本:1)通過執(zhí)行腳本yw.bat可以分析得到每天的業(yè)務操作高峰大約在幾點鐘的每天的業(yè)務量。2、執(zhí)行表數據量統(tǒng)計腳本db_stat.bat

18、,得到目前各個表數據量。3、查看WAS連接數據庫的物理連接數,可以在數據庫服務器上每間隔一段時間執(zhí)行 db_connection.bat查看當前數據庫連接數?;蛘叩卿沇as控制臺,進入性能查看器,選擇數據源,查看目前連接池打開的物理連接。業(yè)務檢查總結1. 最近一星期內每天每小時的業(yè)務流水量:時間2013-04-102013-04-112013-04-122013-04-132013-04-1480110092101010222311195990121101013352001492256152428616240021722000718012000190200020010002100000結論:通

19、過上表可以看出業(yè)務高峰期集中在(時間段):10:0012:002.最近一星期內每天的業(yè)務流水量:日期申請筆數2013-04-1092013-04-11202013-04-1222013-04-13122013-04-146日期通信筆數2013-04-103982013-04-115102013-04-12272013-04-13372013-04-14792結論:通過上表可以看出日平均業(yè)務量較少3.業(yè)務高峰期數據庫連接數執(zhí)行時間2013-04-10 10:002013-04-10 10:202013-04-10 11:002013-04-10 14:002013-04-1014:302013-

20、04-1015:00物理連接數161816192018結論:通過上表可以看出在業(yè)務高峰期數據庫連接數大概為18 個左右數據量統(tǒng)計收集數據表的數據量和統(tǒng)計信息,據此進行重整規(guī)則優(yōu)化,必要時制定數據清理方案,需要關注的大表及記錄數如下:結論:目前以上為紀錄數均未超過20 萬,暫不需對歷史數據遷移。4 XX 系統(tǒng)特色檢查4.1日終批次情況檢查提取最近一周終批處理日志,分析批次運行情況,檢查每一步運行是否成功,以及每一步運行時間。1)7 月-9 月批次總耗時時間抽樣:日期處理類型是否成功開始時間結束時間用時(毫秒)2013-01-05日終批次成功2013-01-05 23:00:302013-01-0

21、5 23:00:3771422013-01-21日終批次成功2013-01-21 23:00:232013-01-21 23:00:3071722013-02-02日終批次成功2013-02-02 23:00:182013-02-02 23:00:2466412013-02-29日終批次成功2013-02-29 23:00:282013-02-29 23:00:3572032013-03-01日終批次成功2013-03-01 23:00:332013-03-01 23:00:4062502013-03-09日終批次成功2013-03-09 23:00:292013-04-09 23:00:35

22、56412)1月-3月批次各任務的平均時間(毫彳秒)如下:模塊1月2月3月跌破監(jiān)管下限預警104910381052價格波動異常預警960980973流轉頻率預警393742未巡庫提示959996SCF庫存信息同步CMS402399403跌破監(jiān)管下限預警(監(jiān)管公司設定上浮值)4543393) 1月-3月批次涉及關聯系統(tǒng)接口通訊情況:日期CMS2013-1-01正常2013-1-20正常2013-2-04正常2013-2-22正常2013-3-01正常2013-3-10正常結論:日終批次運行正常,批次中涉及關聯接口通訊正常4.2業(yè)務統(tǒng)計檢查執(zhí)行ts.bat,檢查業(yè)務統(tǒng)計情況,包括按申請類型(出質入

23、庫、換貨、調價、監(jiān)管下限調整等)查詢業(yè)務 申請統(tǒng)計情況,分析目前動產業(yè)務系統(tǒng)承載能力。業(yè)務申請統(tǒng)計情況:業(yè)務類型代碼總筆數綁定規(guī)則修改申請232監(jiān)管協(xié)議終止申請9259日常入庫申請22210換貨通知申請905調價申請(快速)9711追加出質申請07510提貨申請031押品監(jiān)管下限設定申請25130換貨申請0453岀質入庫申請02250調價申請9872押品監(jiān)管下限調整申請18761結論:各業(yè)務種類申請數據量不大,系統(tǒng)能夠支撐正常業(yè)務處理。5網絡通訊部分5.1網絡通信檢查內容序號檢查項目操作命令或檢查方法參考值實際結果1數據庫服務器通訊檢查ping數據庫服務器IP正常發(fā)送和收到數據包正常發(fā)送和收到

24、數據包2應用服務器A通訊檢查ping應用服務器IP正常發(fā)送和收到數據包正常發(fā)送和收到數據包3應用服務器B通訊檢查ping應用服務器IP正常發(fā)送和收到數據包正常發(fā)送和收到數據包4HTTP服務器A通訊檢查ping HTTP所在服務器IP正常發(fā)送和收到數據包正常發(fā)送和收到數據包5HTTP服務器B通訊檢查ping HTTP所在服務器IP正常發(fā)送和收到數據包正常發(fā)送和收到數據包5.2網絡通信檢查總結6 熱備/冷備部分6.1 熱備/冷備檢查內容序號檢查項目操作命令或檢查方法參考值實際結果1熱備軟件的可用性1)在CAMA監(jiān)控系統(tǒng)查看備份是否 成功,是否定期正常運行。2)檢查備份目錄下是否有近一周 備份數據。

25、備份執(zhí)行成功虛擬機整機備份2備份方式及策略1)備份方式:每天零晨3: 00執(zhí) 行執(zhí)行聯機熱備份備份方式和策 略合理虛擬機整機備份熱備/冷備檢查總結7 系統(tǒng)性能評估1)通過 任務管理器及系統(tǒng)信息信息界面,檢查服務器目前內存、CPU個數及頻率, 通過磁盤管理器檢查目前磁盤空間的使用情況。 通過任務管理器檢查服務器平穩(wěn)運行情況下,虛擬內存的使用情況。分析目前內存,CPU,硬盤空間是否滿足業(yè)務系統(tǒng)的要求。 總結:根據獲取的硬盤信息分析,應用服務器及數據庫服務器部份文件系統(tǒng)占用磁盤空間較大,按 照目前的業(yè)務增量,后續(xù)可能會導致磁盤空間不夠,建議增加磁盤空間。系統(tǒng)運行的線程數量沒有 超出CPU上限,cpu平均空閑率達到90%。2)通過db.bat中執(zhí)行sql腳本獲取數據庫版本 檢查數據庫的補丁版本及實例是否啟動并正常運行 總結:數據庫運行情況良好。3)通過db.bat中執(zhí)行sql腳本獲取數據庫表空間使用情況 檢查數據庫表空間的狀態(tài)是否正常,及使用情況。 總結:數據庫表空間的使用情況正常。4)檢查近期的備份是否正常,分析備份策略是否合理??偨Y:備份情況正常,備份方式和策略合理。5)通過db.bat中的命令提起快照信息,分析數據庫的發(fā)生的死鎖數及緩沖池的命中率。 總結:沒有檢測到互斥鎖定升級,也沒有檢測到死鎖。緩

最新文檔

評論

0/150

提交評論