綜合運維管理系統(tǒng)實施培訓技術方案_第1頁
綜合運維管理系統(tǒng)實施培訓技術方案_第2頁
綜合運維管理系統(tǒng)實施培訓技術方案_第3頁
綜合運維管理系統(tǒng)實施培訓技術方案_第4頁
綜合運維管理系統(tǒng)實施培訓技術方案_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第 PAGE 3頁共 NUMPAGES 55頁目錄 TOC o 1-3 h z u HYPERLINK l _Toc466908954 第1章 項目概況 PAGEREF _Toc466908954 h 3 HYPERLINK l _Toc466908955 1.1. 項目總體背景 PAGEREF _Toc466908955 h 3 HYPERLINK l _Toc466908956 1.2. 系統(tǒng)維護內容 PAGEREF _Toc466908956 h 3 HYPERLINK l _Toc466908957 1.3. 項目的總體思路 PAGEREF _Toc466908957 h 3 HYPE

2、RLINK l _Toc466908958 1.3.1. 整體思路 PAGEREF _Toc466908958 h 3 HYPERLINK l _Toc466908959 1.3.2. 達到的效果 PAGEREF _Toc466908959 h 3 HYPERLINK l _Toc466908960 1.4. 總體要求 PAGEREF _Toc466908960 h 3 HYPERLINK l _Toc466908961 1.5. 需求分析 PAGEREF _Toc466908961 h 3 HYPERLINK l _Toc466908962 1.6. 建設目標 PAGEREF _Toc466

3、908962 h 3 HYPERLINK l _Toc466908963 第2章 綜合運維管理系統(tǒng)功能 PAGEREF _Toc466908963 h 3 HYPERLINK l _Toc466908964 2.1. 綜合運維系統(tǒng)架構圖 PAGEREF _Toc466908964 h 3 HYPERLINK l _Toc466908965 2.2. 綜合監(jiān)控 PAGEREF _Toc466908965 h 3 HYPERLINK l _Toc466908966 2.2.1. 綜合監(jiān)控的優(yōu)勢和亮點 PAGEREF _Toc466908966 h 3 HYPERLINK l _Toc4669089

4、67 2.2.2. 管理監(jiān)控與值班監(jiān)控的功能 PAGEREF _Toc466908967 h 3 HYPERLINK l _Toc466908968 2.2.3. 設備運行的功能 PAGEREF _Toc466908968 h 3 HYPERLINK l _Toc466908969 2.2.4. 線路流量的功能 PAGEREF _Toc466908969 h 3 HYPERLINK l _Toc466908970 2.3. 主機系統(tǒng)服務資源管理 PAGEREF _Toc466908970 h 3 HYPERLINK l _Toc466908971 2.3.1. 系統(tǒng)和通用應用數(shù)據(jù)采集 PAGE

5、REF _Toc466908971 h 3 HYPERLINK l _Toc466908972 2.3.2. 主機管理 PAGEREF _Toc466908972 h 3 HYPERLINK l _Toc466908973 2.3.3. 數(shù)據(jù)庫管理 PAGEREF _Toc466908973 h 3 HYPERLINK l _Toc466908974 2.3.4. 中間件管理 PAGEREF _Toc466908974 h 3 HYPERLINK l _Toc466908975 2.3.5. 應用管理 PAGEREF _Toc466908975 h 3 HYPERLINK l _Toc4669

6、08976 2.4. 存儲管理 PAGEREF _Toc466908976 h 3 HYPERLINK l _Toc466908977 2.4.1. 存儲管理的優(yōu)勢和亮點 PAGEREF _Toc466908977 h 3 HYPERLINK l _Toc466908978 2.4.2. 部署方式 PAGEREF _Toc466908978 h 3 HYPERLINK l _Toc466908979 2.5. 故障告警管理 PAGEREF _Toc466908979 h 3 HYPERLINK l _Toc466908980 2.5.1. 故障管理的優(yōu)勢和亮點 PAGEREF _Toc4669

7、08980 h 3 HYPERLINK l _Toc466908981 2.5.2. 我司故障管理詳細介紹 PAGEREF _Toc466908981 h 3 HYPERLINK l _Toc466908982 2.5.3. 基線數(shù)據(jù)管理的功能 PAGEREF _Toc466908982 h 3 HYPERLINK l _Toc466908983 2.5.4. 告警日志查詢的功能 PAGEREF _Toc466908983 h 3 HYPERLINK l _Toc466908984 2.5.5. 輔助查詢的功能 PAGEREF _Toc466908984 h 3 HYPERLINK l _To

8、c466908985 2.5.6. ARP干擾設置的功能 PAGEREF _Toc466908985 h 3 HYPERLINK l _Toc466908986 2.5.7. 其他告警 PAGEREF _Toc466908986 h 3 HYPERLINK l _Toc466908987 2.6. 報表管理 PAGEREF _Toc466908987 h 3 HYPERLINK l _Toc466908988 2.6.1. 報表管理的優(yōu)勢和亮點 PAGEREF _Toc466908988 h 3 HYPERLINK l _Toc466908989 2.6.2. 報表內容說明 PAGEREF _

9、Toc466908989 h 3 HYPERLINK l _Toc466908990 2.6.3. 報表展現(xiàn)類別說明 PAGEREF _Toc466908990 h 3 HYPERLINK l _Toc466908991 2.6.4. 報表提供方式 PAGEREF _Toc466908991 h 3 HYPERLINK l _Toc466908992 2.7. 機房管理 PAGEREF _Toc466908992 h 3 HYPERLINK l _Toc466908993 2.8. 統(tǒng)一監(jiān)控平臺 PAGEREF _Toc466908993 h 3 HYPERLINK l _Toc4669089

10、94 2.8.1. 服務拓撲展現(xiàn)功能說明 PAGEREF _Toc466908994 h 3 HYPERLINK l _Toc466908995 2.8.2. 運行展現(xiàn)功能說明 PAGEREF _Toc466908995 h 3 HYPERLINK l _Toc466908996 2.8.3. 告警展現(xiàn)功能說明 PAGEREF _Toc466908996 h 3 HYPERLINK l _Toc466908997 2.9. 系統(tǒng)管理 PAGEREF _Toc466908997 h 3 HYPERLINK l _Toc466908998 2.9.1. 系統(tǒng)管理的優(yōu)勢和亮點 PAGEREF _To

11、c466908998 h 3 HYPERLINK l _Toc466908999 2.9.2. 用戶管理的功能 PAGEREF _Toc466908999 h 3 HYPERLINK l _Toc466909000 2.9.3. 用戶操作審計的功能 PAGEREF _Toc466909000 h 3 HYPERLINK l _Toc466909001 2.9.4. 當前在線用戶的功能 PAGEREF _Toc466909001 h 3 HYPERLINK l _Toc466909002 2.9.5. 當前用戶編輯的功能 PAGEREF _Toc466909002 h 3 HYPERLINK l

12、 _Toc466909003 2.9.6. 網(wǎng)管郵件發(fā)送帳號的功能 PAGEREF _Toc466909003 h 3 HYPERLINK l _Toc466909004 2.10. 交通運維管理功能 PAGEREF _Toc466909004 h 3 HYPERLINK l _Toc466909005 2.10.1. 服務臺 PAGEREF _Toc466909005 h 3 HYPERLINK l _Toc466909006 2.10.2. 事件管理 PAGEREF _Toc466909006 h 3 HYPERLINK l _Toc466909007 2.10.3. 問題管理 PAGER

13、EF _Toc466909007 h 3 HYPERLINK l _Toc466909008 2.10.4. 變更管理 PAGEREF _Toc466909008 h 3 HYPERLINK l _Toc466909009 2.10.5. 發(fā)布管理 PAGEREF _Toc466909009 h 3 HYPERLINK l _Toc466909010 2.10.6. 資產配置管理 PAGEREF _Toc466909010 h 3 HYPERLINK l _Toc466909011 2.10.7. 作業(yè)管理 PAGEREF _Toc466909011 h 3 HYPERLINK l _Toc4

14、66909012 2.10.8. 知識管理 PAGEREF _Toc466909012 h 3 HYPERLINK l _Toc466909013 2.10.9. 服務級別管理 PAGEREF _Toc466909013 h 3 HYPERLINK l _Toc466909014 2.10.10. 排班管理 PAGEREF _Toc466909014 h 3 HYPERLINK l _Toc466909015 2.11. 硬件&基礎軟件 PAGEREF _Toc466909015 h 3 HYPERLINK l _Toc466909016 2.11.1. 硬件構成 PAGEREF _Toc46

15、6909016 h 3 HYPERLINK l _Toc466909017 2.11.2. 故障恢復 PAGEREF _Toc466909017 h 3 HYPERLINK l _Toc466909018 第3章 項目管理與實施計劃 PAGEREF _Toc466909018 h 3 HYPERLINK l _Toc466909019 3.1. 項目總則 PAGEREF _Toc466909019 h 3 HYPERLINK l _Toc466909020 3.2. 項目組織機構 PAGEREF _Toc466909020 h 3 HYPERLINK l _Toc466909021 3.2.1

16、. 組織架構保證 PAGEREF _Toc466909021 h 3 HYPERLINK l _Toc466909022 3.2.2. 人員穩(wěn)定 PAGEREF _Toc466909022 h 3 HYPERLINK l _Toc466909023 3.3. 項目進度計劃 PAGEREF _Toc466909023 h 3 HYPERLINK l _Toc466909024 3.4. 項目范圍內容 PAGEREF _Toc466909024 h 3 HYPERLINK l _Toc466909025 3.5. 項目實施地點 PAGEREF _Toc466909025 h 3 HYPERLINK

17、 l _Toc466909026 3.6. 項目進度管理 PAGEREF _Toc466909026 h 3 HYPERLINK l _Toc466909027 3.7. 項目合同變更管理 PAGEREF _Toc466909027 h 3 HYPERLINK l _Toc466909028 3.8. 項目質量管理 PAGEREF _Toc466909028 h 3 HYPERLINK l _Toc466909029 3.9. 服務內容 PAGEREF _Toc466909029 h 3 HYPERLINK l _Toc466909030 3.10. 項目管理 PAGEREF _Toc4669

18、09030 h 3 HYPERLINK l _Toc466909031 3.11. 項目交付成果 PAGEREF _Toc466909031 h 3 HYPERLINK l _Toc466909032 3.12. 實施準備 PAGEREF _Toc466909032 h 3 HYPERLINK l _Toc466909033 3.13. 實施人員清單 PAGEREF _Toc466909033 h 3 HYPERLINK l _Toc466909034 3.14. 實施工作進度計劃 PAGEREF _Toc466909034 h 3 HYPERLINK l _Toc466909035 3.15

19、. 實施技術資料 PAGEREF _Toc466909035 h 3 HYPERLINK l _Toc466909036 第4章 培訓方案 PAGEREF _Toc466909036 h 3 HYPERLINK l _Toc466909037 4.1. 培訓總論 PAGEREF _Toc466909037 h 3 HYPERLINK l _Toc466909038 4.2. 培訓內容 PAGEREF _Toc466909038 h 3 HYPERLINK l _Toc466909039 4.2.1. 培訓課程表 PAGEREF _Toc466909039 h 3 HYPERLINK l _To

20、c466909040 4.2.2. 課程內容簡介 PAGEREF _Toc466909040 h 3第 PAGE 55頁共 NUMPAGES 55頁第 PAGE 4頁共 NUMPAGES 55頁項目概況系統(tǒng)維護內容 xxx轄區(qū)內道路上總隊與支隊自建視為所有科技管控設備、執(zhí)法站的科技設備及系統(tǒng),統(tǒng)一到云南省公安廳交通管理警察總隊布置的科技信息化相關平臺。項目的總體思路整體思路項目要在整體統(tǒng)一規(guī)劃的基礎上,采取分階段、分步驟的策略對現(xiàn)有的信息系統(tǒng)進行建設,實現(xiàn)網(wǎng)絡設備的集中監(jiān)管和維護,通過集中部署管理方式、實現(xiàn)對網(wǎng)絡設備的集中監(jiān)管,全面建成實現(xiàn)一體化統(tǒng)一信息系統(tǒng)交通運維系統(tǒng)平臺,實現(xiàn)整個道路交通管

21、理基礎設施的集中監(jiān)控、集中管理和集中維護,全面提高交通管理基礎設施運行、管理和維護水平。達到的效果綜合運維管理系統(tǒng)的全面建設,將為基于信息化系統(tǒng)的各項業(yè)務和工作的順利開展提供堅實的技術支撐,為交警日常工作提供良好環(huán)境和堅實的基礎保障,交通管理部門作為項目成果的使用者、管理者和直接受益者,將從不同角度和層面感受到項目所產生的變革,具體價值體現(xiàn)為:給予交通管理部門一個全局化的管理視角,能夠杜絕信息系統(tǒng)運轉過程中的黑箱現(xiàn)象,避免管理死角的出現(xiàn)。通過簡單直觀的圖形管控手段替代傳統(tǒng)上不直觀、不友好的管理界面,通過圖形、動畫、數(shù)據(jù)等多媒體手段的集成全方位展現(xiàn)整體信息系統(tǒng)動態(tài)運轉情況,讓管理人員對信息系統(tǒng)的

22、運行情況做到全局掌握和實時了解,及時發(fā)現(xiàn)異?;騿栴},從而迅速介入和及時處理,做到問題早發(fā)現(xiàn)、早解決,提高對設備運行管理質量和保障能力。提供對多廠商、跨平臺異構交通管理系統(tǒng)的統(tǒng)一管理支持,由管理平臺屏蔽它們的底層差異性,采取統(tǒng)一的管理維護方式,從而簡化管理、降低管理難度,避免重復投資導致的資金浪費,實現(xiàn)經(jīng)濟好省。管理覆蓋全面,實現(xiàn)對構成的各要素、各環(huán)節(jié)進行全面監(jiān)控,主要是數(shù)據(jù)交換平臺(網(wǎng)絡)、安全,管理平臺開放的體系架構和高度的可擴展性不但能夠充分滿足當前的管理需要,而且能夠充分適應未來管理發(fā)展的變化,快速實現(xiàn)對新技術、產品的支持和適應,保護現(xiàn)有投資,實現(xiàn)向后兼容性。提供豐富的展現(xiàn)和分析手段,資

23、源使用、系統(tǒng)負荷壓力分布一目了然,為有效評估和科學評價提供幫助,確保資源的分配與使用更加科學合理;提高交通管理部門響應速度和支持保障能力,具備從容應對各種突發(fā)事件的能力,通過統(tǒng)一平臺的主動檢測監(jiān)控,實現(xiàn)各種問題的及時發(fā)現(xiàn)、分析、定位并提供一系列管理手段幫助實現(xiàn)故障的快速診斷和精確定位,幫助管理維護人員迅速鎖定故障根原因,從而采取正確的措施迅速排障,最大限度降低故障對業(yè)務運轉的影響;為多部門、多專業(yè)進行高效協(xié)同提供統(tǒng)一平臺,使不同崗位和專業(yè)的管理人員,各司其職,相互協(xié)調,相互監(jiān)督,運轉流暢,使信息運維管理工作步入管理規(guī)范化、管理科學化和辦公現(xiàn)代化的軌道;詳實的運行維護數(shù)據(jù)為推行量化的精細管理奠定

24、了基礎,解決了交通管理部門進行有效績效考評的困難,為上級部門和主管領導客觀評價交通管理部門的工作成效提供了有力的論據(jù),也有助于交通管理部門客觀檢查、審視自身工作,總結成績、經(jīng)驗,發(fā)現(xiàn)不足,制定改進計劃,持續(xù)改進、提高和優(yōu)化信息管理維護工作;準確掌握問題、故障的多發(fā)點,從設計、運行、管理等多環(huán)節(jié)切入尋找影響系統(tǒng)正常、穩(wěn)定和可靠運轉的關鍵因素,為深入優(yōu)化、升級、改造提供有力的數(shù)據(jù)支持,從而確保信息管理和決策的科學性。集成安全管理,統(tǒng)一管理監(jiān)控入口,及時捕捉影響系統(tǒng)安全的各種風險因素,提高信息系統(tǒng)整體安全性和堅固性;變被動的響應為主動監(jiān)控;變事后修復為事前預防;變復雜操作維護為簡單管理;變孤立分散管

25、理為集中統(tǒng)一管理;全面扭轉交通管理部門在運維工作中被動局面,借助于統(tǒng)一信息內網(wǎng)監(jiān)管平臺的有力支撐,有力推動交通管理部門朝著“全面實現(xiàn)以預防為主、修復為輔的主動式管理”的目標邁進。該項目建設完成后,將會對運行維護和管理水平的整體提高發(fā)揮積極的推動和促進作用,做到故障早發(fā)現(xiàn)、早解決,確保計算機網(wǎng)絡連續(xù)、可靠、安全運行,降低發(fā)生故障的可能性,提高信息運維部門的運行管理水平和服務保障能力,為信息運維綜合監(jiān)管系統(tǒng)的持續(xù)建設與深入應用提供強有力的支持與保障??傮w要求結合項目特點綜合運維管理系統(tǒng)要求如下:實時掌握網(wǎng)絡性能數(shù)據(jù)和故障信息,其中性能數(shù)據(jù)的獲取時間不高于5分鐘,告警數(shù)據(jù)的獲取時間不高于30秒。按時

26、間段(天/周/月/季度/年)統(tǒng)計分析網(wǎng)絡運行情況,支持設備性能和鏈路性能圖表。實現(xiàn)全路段系統(tǒng)匯總運行的統(tǒng)計分析,例如CPU平均使用情況、內存最大使用情況等。分析數(shù)據(jù)可以層層下鉆,看到各個網(wǎng)絡設備相關指標的分析情況。也可以分析某段時間內不同區(qū)域不同指標的情況。實時監(jiān)控、展現(xiàn)網(wǎng)絡設備關鍵指標的變化情況。 支持統(tǒng)一告警臺視圖展現(xiàn),可將監(jiān)控的所有的內容所產生的事件匯總到統(tǒng)一的展現(xiàn)界面,并可通過事件的點擊追溯到事故資源的詳細指標信息中。核心網(wǎng)絡實時監(jiān)控和分析展現(xiàn)是對核心網(wǎng)絡數(shù)據(jù)深入統(tǒng)計分析,更好地了解核心網(wǎng)絡系統(tǒng)的運行狀況、分析異常數(shù)據(jù)變動的原始數(shù)據(jù)原因。核心網(wǎng)絡分析展現(xiàn)通過數(shù)據(jù)抽取對業(yè)務數(shù)據(jù)進行分析結

27、果展現(xiàn),同時提供分析所需要的細粒度數(shù)據(jù)和匯總數(shù)據(jù)。網(wǎng)絡實時監(jiān)控和分析展現(xiàn)能按時間段(天/周/月/季度/年)統(tǒng)計分析網(wǎng)絡指標的情況,分析數(shù)據(jù)可在時間維度逐層向下查看詳細數(shù)據(jù)。(1)系統(tǒng)需提供多種統(tǒng)計分析手段,如排序、同比、環(huán)比等而無需輸入任何分析公式(2)監(jiān)控信息刷新頻率可以按照用戶的需要進行靈活調整(3)滿足實時抽取關鍵數(shù)據(jù),按日批量和增量抽取明細數(shù)據(jù)(4)監(jiān)控信息刷新頻率可以按照用戶的需要進行靈活調整需求分析根據(jù)需求來看,實際運維工作中是有一些管理工具進行監(jiān)控工作。但是從實際運維管理工作需求角度出發(fā),現(xiàn)有的管理工具存在較多的問題,這種問題體現(xiàn)在工具相互之間缺乏關聯(lián)性,工具的非定制性導致采集數(shù)

28、據(jù)和的實際運維工作存在較大的偏差,因此對于綜合運維管理系統(tǒng)需求集中體現(xiàn)在以下幾個方面:所有交通管理設備均納入綜合運維管理系統(tǒng)管理綜合運維管理系統(tǒng)首先需要的是將所有交通管理設備均納入管理,這是運維工作管理的基礎和核心。只有當所有設備都在管理范圍內,對其進行的監(jiān)控、告警、統(tǒng)計、分析、報表才有實際意義。目前雖然有了一些監(jiān)控工具,但從實際情況來看,并未將所有設備納入監(jiān)控范圍,從監(jiān)控本身角度存在較大的缺失。全面增強的基礎監(jiān)控KPI網(wǎng)絡管理系統(tǒng)必須擺脫依賴于原有工具來開展運維工作的情況,需要根據(jù)自身運維管理工作特點,有目的有計劃的展開各類管理對象的專題分析,比如網(wǎng)絡設備監(jiān)控、鏈路監(jiān)控、服務器監(jiān)控、數(shù)據(jù)庫監(jiān)

29、控等,通過梳理現(xiàn)有的監(jiān)控指標尤其是全國范圍內用戶對上述設備的管理指標,建立健全對基礎監(jiān)控的KPI庫,將各類風險納入到綜合運維管理系統(tǒng)中,實現(xiàn)綜合運維管理系統(tǒng)及時、快速、有效的對各類故障進行事前可知、事中可控、事后可查的目標。建設目標根據(jù)局現(xiàn)狀和需求進行統(tǒng)籌規(guī)劃,本著“從實際需要出發(fā),保護已有投資”的原則,將目前已有的、針對網(wǎng)絡的分散式監(jiān)控管理系統(tǒng),以及數(shù)據(jù)處理中心的動力集中到一個統(tǒng)一的監(jiān)控系統(tǒng),并以適當?shù)男问竭M行集中展現(xiàn),為運維人員進行系統(tǒng)、設備的監(jiān)控、故障定位、故障診斷和解決等運維工作提供信息來源。實現(xiàn)集中統(tǒng)一的事件監(jiān)控、集中統(tǒng)一的性能監(jiān)控,從而實現(xiàn)綜合運維管理系統(tǒng)的各項業(yè)務功能要求。利用綜

30、合運維管理系統(tǒng)全面主動反映個業(yè)務系統(tǒng)的運行健康情況,通過多種分析手段為合理有效地分配各運維人員和值班人員的人員調度,為制定設備升級、擴容方案提供決策支持。通過綜合運維管理系統(tǒng)對業(yè)務核心數(shù)據(jù)進行分析和實時監(jiān)控,并實現(xiàn)豐富、科學、美觀的展示。綜合運維管理系統(tǒng)功能我司系統(tǒng)采用層次化設計,對系統(tǒng)的各個層面進行了建模和抽象,使得各結構層面之間既相互獨立,又相互關聯(lián),最大程度上提高了系統(tǒng)運行的效率。綜合運維系統(tǒng)架構圖我司平臺的架構圖如下:從上圖,可以直觀的看出我司模塊清晰,層次分明。各模塊之間既相互獨立,又互相關聯(lián),共同實現(xiàn)了對被管對象的集中監(jiān)控和管理,另外也通過WEB方式為用戶進行了統(tǒng)一的展現(xiàn)。綜合監(jiān)控

31、綜合監(jiān)控部分主要是對系統(tǒng)各個監(jiān)控對象進行快速瀏覽時使用,適合用戶查看管理對象的日常運行情況,操作簡單,界面直觀明了。通過全網(wǎng)設備負載、線路流量自動TOP N排序,主動告訴用戶哪些設備需要關注,全網(wǎng)運行的隱患在哪里。綜合監(jiān)控功能包括:管理監(jiān)控、值班監(jiān)控、設備運行、線路流量、峰值流量、環(huán)境監(jiān)控、告警總覽、服務總覽。綜合監(jiān)控的優(yōu)勢和亮點綜合監(jiān)控是我司系統(tǒng)對所有被管對象的一個綜合展示窗口,展現(xiàn)直觀方便、關聯(lián)性強。支持全網(wǎng)設備負載自動TOP N排序,主動告訴用戶哪些設備需要關注,全網(wǎng)運行的隱患在哪里。提供可配置功能,在一個界面上可以配置多個可視化項目。用戶可以配置自己個性化的監(jiān)控首頁,這樣就可以讓用戶把

32、自己最關心的東西,一進系統(tǒng)就能馬上看到。通過業(yè)務視圖展現(xiàn)各類服務邏輯,并對服務系統(tǒng)的諸多業(yè)務關鍵參數(shù)(KPI)進行監(jiān)控,作為服務管理的基礎。全網(wǎng)線路流量TOP N排序和峰值流量的展現(xiàn),告訴用戶當前網(wǎng)絡的主要流量有哪些、在哪里。全網(wǎng)告警預覽。讓用戶一幕了然了解網(wǎng)絡中的問題所在。自動生成全網(wǎng)設備運行統(tǒng)計率報表。方便用戶了解全網(wǎng)的設備運行狀況。管理監(jiān)控與值班監(jiān)控的功能對于不同的管理人員對于數(shù)據(jù)指標的查看需求也有區(qū)別,我司系統(tǒng)提供了詳細和簡單兩種不同的管理信息界面,對于值班員偏重于信息的關聯(lián),對于運維人員更偏重于信息指標的完整。對于值班員和管理者需要查詢的實時信息也是不同類型,系統(tǒng)按照管理要求提供了快

33、捷值班監(jiān)控和管理監(jiān)控兩個頁面。值班監(jiān)控可通過定制化配置用戶所關心關鍵指標,并實時數(shù)據(jù)展現(xiàn),而管理監(jiān)控則著重于從網(wǎng)絡、服務、業(yè)務三個方面呈現(xiàn)實時管理效果。設備運行的功能展現(xiàn)整體系統(tǒng)設備運行情況,并展現(xiàn)CPU/MEM設備TOPN的當前狀態(tài)線路流量的功能展現(xiàn)整體系統(tǒng)設備運行情況,并展現(xiàn)流量/幀流量設備TOPN的當前狀態(tài)主機系統(tǒng)服務資源管理通過我司綜合管理平臺,主要是在用戶環(huán)境中實現(xiàn)對主機系統(tǒng)及相關系統(tǒng)的綜合管理,包括:所有被管信息的收集、系統(tǒng)管理、數(shù)據(jù)庫和中間件的管理、存儲系統(tǒng)的管理、資源信息庫管理、統(tǒng)一監(jiān)控平臺(對第三方管理軟件的整合)。數(shù)據(jù)采集是針對不同的對象所采用的不同采集方式,包括SNMP、

34、SYSLOG、業(yè)務和應用仿真、透明Agent等。對象抽象化層主要負責獲取對象的信息,將它們抽象成管理對象,向上屏蔽不同交通管理對象的差異。業(yè)務層主要提供具體的應用功能,如服務拓撲管理、報表分析和流程管理等。訪問層用戶展示管理信息、暴露管理功能,用戶通過它發(fā)出管理命令,執(zhí)行日常管理任務。支持的主機類型有:WindowsIBM AIXHP-UNIXSolarisLinux(REDHATSUSE)FreeBSDCentOSNovell TUR64系統(tǒng)和通用應用數(shù)據(jù)采集我司綜合管理平臺支持通過SYSLOG、命令集/透明AGENT、SNMP、端口應用仿真等多種監(jiān)測方式監(jiān)測服務器,可以獲取遠程服務器的系統(tǒng)

35、資源,我司支持對Windows、UNIX、Linux、AIX、Solaris、HPUX等多種服務器系統(tǒng)管理和監(jiān)視,對服務器操作系統(tǒng)的運行狀態(tài)和性能數(shù)據(jù),包括服務器的CPU負載、內存利用率、應用進程、文件系統(tǒng)、文件體積等信息的分析與監(jiān)視。管理和監(jiān)視服務器上各應用服務的運行狀態(tài)和性能數(shù)據(jù),包括Ema、HTTP、FTP、EMA、Apache/IIS、數(shù)據(jù)庫、DNS、DHCP服務以及各中間件等。如下圖所示:進程狀態(tài)分析服務器進程控制對整個服務器的運行至關重要,會影響到其操作系統(tǒng)的正常運行和關鍵服務的正常運行,所以實時掌握服務器的所有進程運行情況是很有必要的。正常情況下運行著大量的系統(tǒng)進程和應用進程。它

36、們在運行過程中會消耗服務器的資源,甚至一些非法的進程可以造成服務器的癱瘓,所以服務器的進程管理也是很有必要的。首先就是進程的數(shù)量,第一,如果服務器里運行著的進程過多,勢必會占用大量系統(tǒng)資源,進程數(shù)量越多,造成服務器不穩(wěn)定的可能性就越大,所以監(jiān)視所有進程的總數(shù)量可以幫助用戶及時了解到服務器的資源情況,出現(xiàn)異常,也可以第一時間讓用戶了解到他必須現(xiàn)在去看看到底發(fā)生了什么事?第二,相同名字的進程數(shù)量過多,大部分時間意味著病毒爆發(fā),所以監(jiān)視同名進程的數(shù)量也是很有意義的。我們提供了進程數(shù)量的監(jiān)視,時刻監(jiān)視服務器所有進程數(shù)量或進程名字和設置匹配的進程數(shù)量,當出現(xiàn)異常時會在第一時間內提醒用戶,保證用戶盡早發(fā)現(xiàn)

37、問題、解決問題,避免更嚴重的故障發(fā)生。我司綜合管理平臺能夠以表格的方式實時顯示服務器的所有進程運行情況,包括進程名稱、CPU利用時間、CPU占用情況、當前內存占用情況、運行狀態(tài)等等,為用戶分析服務器的當前運行情況提供詳細的實時數(shù)據(jù)來源。我司綜合管理平臺支持對服務器上的應用進程情況進行監(jiān)視,支持使用*和?的通配符統(tǒng)計符合條件的應用進程的數(shù)量,當該數(shù)量超過/小于指定的閾值時,系統(tǒng)將觸發(fā)告警。我司綜合管理平臺也可以直接監(jiān)視某些特定名稱的進程的活動狀態(tài)。系統(tǒng)中的某一活動著的進程可能對用戶非常重要,所以用戶會關心這個進程是否一直在進程列表中,我們稱這樣的進程為“關鍵進程”;當這些進程出現(xiàn)在進程表中或者不

38、出現(xiàn)在進程表中時,系統(tǒng)將自動觸發(fā)告警,提醒管理人員及時處理。我司綜合管理平臺提供對指定進程進行CPU利用率、內存利用率不間斷監(jiān)視的功能。每一個進程都會占用系統(tǒng)資源,如CPU、內存,當某一個進程或某幾個進程占用的CPU過高時,會影響到整個服務器的運行,使得運行速度變慢,使得其他進程因為分享不到CPU而無法正常運行;某些進程如果存在內存泄露等問題,會不斷申請內存,導致系統(tǒng)內存溢出。我司綜合管理平臺自動每分鐘從服務器上獲取最新的進程運行數(shù)據(jù),提供各進程的運行趨勢分析圖,包括進程的CPU占用趨勢圖、物理內存利用率趨勢圖,方便管理人員查看各進程一段時間以來的運行情況。文件系統(tǒng)分析很多的應用服務都需要使用

39、磁盤空間進行數(shù)據(jù)的存儲和處理,所以一般情況下,服務器的磁盤空間應該保持一定的空白容量,當磁盤空間低于可控制下限時,用戶應該馬上進行相應處理,避免磁盤空間被占滿后關鍵服務不能正常運行的情況發(fā)生。而且磁盤空間被占滿也有可能是病毒引起的,這需要管理人員第一時間就要掌握到,盡量避免病毒的擴散和維護關鍵服務的正常運行。文件系統(tǒng)分析主要提供服務器上各文件系統(tǒng)的空間大小和使用情況(已用空間、剩余空間、利用率)以及文件系統(tǒng)的名稱、類型等基本信息。管理人員可以指定系統(tǒng)的刷新間隔,自動以一定的頻率從服務器上讀取文件系統(tǒng)信息和參數(shù),便于服務器文件系統(tǒng)的狀態(tài)監(jiān)視和處理。CPU利用率1、服務器CPU的利用率,可針對系統(tǒng)

40、的每個CPU分別分析其相應的利用率;2、服務器當前進程列表所占用的CPU利用率,CPU使用時間;3、顯示服務器CPU性能(分進程顯示)實時變化情況和歷史變化趨勢;4、服務器CPU閾值告警,當服務器CPU負載過大/小,能產生報警;5、服務器進程CPU占用閾值告警,當進程占用CPU過大/小,能產生報警;內存利用率1、服務器內存的利用率;2、服務器當前進程列表所占用的內存利用情況,內存利用率;3、顯示服務器內存利用率(分進程顯示)實時變化情況和歷史變化趨勢;4、服務器內存利用率閾值告警,當服務器內存利用率過大/小,能產生報警;5、服務器進程內存利用率閾值告警,當進程占用內存過大/小,能產生報警;硬盤

41、性能分析我司綜合管理平臺可以收集磁盤性能I/O狀態(tài)信息。幫助用戶分析磁盤讀取的繁忙程度,由于磁盤I/O信息是影響系統(tǒng)性能的常見因素,進而得到對優(yōu)化整個系統(tǒng)性能的參考指標。服務器日志查詢、分析我司綜合管理平臺采用syslog、WMI、telnet、ssh的方式來讀取所監(jiān)控服務器的日志,并可按分鐘、小時、日等方式對日志進行查詢與分析。主機管理提供對WINDOWS、AIX、LINUX、Solaris等主機系統(tǒng)進行全方位的監(jiān)測和管理,幫助用戶及時了解到各類系統(tǒng)的KPI的運行狀態(tài)??梢躁P聯(lián)告警系統(tǒng),對主機關鍵指標的異常狀態(tài)進行告警,讓用戶可以及時的知道并進行處理??梢躁P聯(lián)告警系統(tǒng),對主機的異常進程,或進

42、程的異常狀態(tài)進行告警,讓用戶可以及時的知道并進行處理。支持動態(tài)數(shù)據(jù)流轉圖,可以圖形化展現(xiàn)CPU負載、內存使用率、硬盤容量、應用進程、文件占用空間、網(wǎng)絡流量等信息。取數(shù)方式靈活,支持Agent和Agentless兩種方式供用戶選擇。數(shù)據(jù)展現(xiàn)方式多樣、層層遞進物理拓樸圖、監(jiān)控總覽、數(shù)據(jù)流轉圖、業(yè)務拓樸圖。我司綜合管理平臺提供對WINDOWS、AIX、LINUX、Solaris等主機系統(tǒng)的多方面監(jiān)測和管理:對Windows操作系統(tǒng)主要可以監(jiān)控如下內容:服務器的配置信息:自動獲取服務器名稱、IP地址、系統(tǒng)版本、CPU個數(shù)、磁盤大小、內存大小等;服務器的運行狀態(tài):服務器運行狀態(tài)、服務器磁盤狀態(tài)、網(wǎng)卡狀態(tài)

43、、進程總數(shù)服務器CPU運行情況:CPU用戶時間百分比、CPU系統(tǒng)時間百分比、CPU運行隊列進程個數(shù)服務器內存使用情況:內存利用率、虛擬內存(交換區(qū))的使用率、交換SWAP分區(qū)頁數(shù)量(換入/換出);服務器磁盤運行指標:磁盤空間利用率、磁盤讀/寫速率、磁盤TPS指標。服務器文件管理指標:各文件系統(tǒng)分區(qū)的使用率和空閑空間、指定的關鍵文件是否存在和當前大小;服務器關鍵進程運行指標:包括進程ID、進程名、進程狀態(tài)、占用CPU時間、內存占用大小等;服務器日志告警:檢查服務器的關鍵日志文件,提取相關的錯誤日志信息(Warning/error/fa)并生成告警;實時監(jiān)控操作系統(tǒng),數(shù)據(jù)庫和應用系統(tǒng)中制定的日志文

44、件,并可根據(jù)其中的特定信息,執(zhí)行用戶預定義的操作;HA狀態(tài)監(jiān)控,對HA的狀態(tài)、系統(tǒng)間切換和節(jié)點間切換等狀態(tài)進行主動監(jiān)測,并記錄每一次發(fā)生切換發(fā)生的時間、相關服務器名稱等信息。對系統(tǒng)服務進行監(jiān)控,對重要服務的運行故障進行實時告警。下圖是我司綜合管理平臺對Windows監(jiān)控的界面:對AIX、Solaris、Linux等類Unix系統(tǒng)主要可以監(jiān)控如下內容:服務器的配置信息:獲取服務器名稱、IP地址、系統(tǒng)版本、CPU個數(shù)、磁盤大小、內存大小等;服務器的運行狀態(tài):服務器運行狀態(tài)、服務器磁盤狀態(tài)、網(wǎng)卡狀態(tài)、進程總數(shù)服務器CPU運行情況:CPU用戶時間百分比、CPU系統(tǒng)時間百分比、CPU運行隊列進程個數(shù)服務

45、器內存使用情況:內存利用率、虛擬內存(交換區(qū))的使用率、交換SWAP分區(qū)頁數(shù)量(換入/換出);服務器磁盤運行指標:磁盤空間利用率、磁盤讀/寫速率、磁盤TPS指標。服務器文件管理指標:各文件系統(tǒng)分區(qū)的使用率和空閑空間、指定的關鍵文件是否存在和當前大??;服務器關鍵進程運行指標:包括進程ID、進程名、進程狀態(tài)、占用CPU時間、內存占用大小等;服務器日志告警:檢查服務器的關鍵日志文件,提取相關的錯誤日志信息(Warning/error/fa)并生成告警;實時監(jiān)控操作系統(tǒng),數(shù)據(jù)庫和應用系統(tǒng)中制定的日志文件,并可根據(jù)其中的特定信息,執(zhí)行用戶預定義的操作;HACMP狀態(tài)監(jiān)控:對HACMP的狀態(tài)、系統(tǒng)間切換和

46、節(jié)點間切換等狀態(tài)進行主動監(jiān)測,并記錄每一次發(fā)生切換發(fā)生的時間、相關服務器名稱等信息。對CICS Region的監(jiān)控:通過監(jiān)控相關的日志(Prepare日志、Comm交通管理日志、Abort日志等)、并輔以模擬連接(將連接結果發(fā)送到我司綜合管理平臺),我們可以做到對P系統(tǒng)主機上CICS的狀態(tài)和隊列進行監(jiān)控。下圖是我司綜合管理平臺對AIX系統(tǒng)監(jiān)控的界面數(shù)據(jù)庫管理可以實現(xiàn)對多種數(shù)據(jù)庫的監(jiān)控和管理,方便用戶對多種業(yè)務平臺進行統(tǒng)一管理。實現(xiàn)對數(shù)據(jù)庫容量、命中率、會話信息、日志信息等實現(xiàn)全面監(jiān)控,并為用戶提供直觀的數(shù)據(jù)報表,方便掌握數(shù)據(jù)庫的運行狀態(tài)。可以關聯(lián)告警系統(tǒng),對數(shù)據(jù)庫關鍵指標的異常狀態(tài)進行告警,讓

47、用戶可以及時的知道并進行處理。支持動態(tài)數(shù)據(jù)流轉圖,可圖形化多角度動態(tài)全方位展現(xiàn)數(shù)據(jù)庫諸如CPU、緩存、表空間、鎖、緩存、讀寫速度多種信息。我司綜合管理平臺可以對服務器上的DB2 、ORACLE、SQLSERVER、SYBASE、INFORMIX等數(shù)據(jù)庫系統(tǒng)提供狀態(tài)監(jiān)測和管理。數(shù)據(jù)庫服務監(jiān)視主要是對大型數(shù)據(jù)庫系統(tǒng)的性能、事務、連接等性能數(shù)據(jù)進行監(jiān)視。我司綜合管理平臺通過JDBC連接到指定的大型數(shù)據(jù)庫服務上,執(zhí)行管理人員指定的SQL語句,然后對所獲得的結果進行分析處理,如果大于指定的閾值,則自動觸發(fā)數(shù)據(jù)庫服務監(jiān)視告警。通過SQL語言對數(shù)據(jù)庫的系統(tǒng)表進行監(jiān)視,可以對數(shù)據(jù)庫的表空間(空閑率)進行容量規(guī)

48、劃,并能夠對表空間的使用情況進行定期分析和預警;可以實時監(jiān)控當前連接數(shù)據(jù)庫的會話,并能夠在連接數(shù)據(jù)庫出現(xiàn)問題觸發(fā)告警;可以獲取會話級的數(shù)據(jù)庫運行性能參數(shù),并對性能參數(shù)進行關聯(lián)性分析,進行告警監(jiān)測;可以處理數(shù)據(jù)庫的事務提交數(shù)、事務回滾數(shù)、順序掃描總數(shù)、排序總數(shù)、排序所使用的最大磁盤空間等系統(tǒng)運行狀態(tài)參數(shù)的監(jiān)測和告警;可以對數(shù)據(jù)庫的磁盤IO參數(shù)如讀取數(shù)、緩沖區(qū)讀取數(shù)、寫入數(shù)、緩沖區(qū)寫入數(shù)等數(shù)據(jù)進行監(jiān)測;可以對數(shù)據(jù)庫的內存使用率、數(shù)據(jù)庫容量、交易量、數(shù)據(jù)庫連接數(shù)、進程狀態(tài)、數(shù)據(jù)庫資源使用率等信息進行監(jiān)測;我司綜合管理平臺可以對數(shù)據(jù)庫的表空間(空閑率)進行容量規(guī)劃,并能夠對表空間的使用情況進行定期分析

49、和預警??梢蕴幚頂?shù)據(jù)庫中的各數(shù)據(jù)表的記錄數(shù)、鎖模式、索引、Extents、總頁數(shù)、使用頁數(shù)等性能指標進行監(jiān)測。可以對數(shù)據(jù)庫的交易日志進行監(jiān)視。由于生產環(huán)境使用的是IBM的DB2數(shù)據(jù)庫,現(xiàn)以DB2為例介紹監(jiān)控內容DB2高可用性災難恢復(HADR)狀態(tài)監(jiān)控和告警數(shù)據(jù)庫狀態(tài):監(jiān)聽器是否工作,數(shù)據(jù)庫是否工作;數(shù)據(jù)庫的基本配置信息:數(shù)據(jù)庫名、版本、32/64位、并行狀態(tài)、歸檔模式、歸檔目錄,基本配置等。數(shù)據(jù)庫進程監(jiān)測信息:進程占用CPU時間、內存大小、數(shù)據(jù)庫進程總數(shù);數(shù)據(jù)庫自身告警信息:獲取數(shù)據(jù)庫的告警信息并告警;數(shù)據(jù)庫SGA監(jiān)測信息:高速緩沖區(qū)大小、重做日志緩沖區(qū)大小、共享池大小、數(shù)據(jù)字典緩存大小、共

50、享庫緩存大小、SQL緩存大??;數(shù)據(jù)庫SGA性能監(jiān)測:高速緩沖區(qū)命中率、共享庫緩存命中率、共享數(shù)據(jù)字典緩存命中率、磁盤排序/內存排序比率;實時SQL監(jiān)測:要求能夠捕捉瞬時的或一段時間內(比如五分鐘內)執(zhí)行的SQL語句,使管理員可以有效地獲取關于正在執(zhí)行的事務的詳細信息; 前十條性能最差的SQL語句等。數(shù)據(jù)庫表空間運行監(jiān)測:制定表空間的使用空間大小,表空間使用率等、表空間碎片F(xiàn)SFI比率、讀/寫表空間平均時間;數(shù)據(jù)庫表空間配置信息:表空間名稱、初始大小、Next擴展值大小、擴展次數(shù);數(shù)據(jù)庫文件性能:數(shù)據(jù)文件名、數(shù)據(jù)文件大小、狀態(tài)、讀寫次數(shù)、讀寫時間;數(shù)據(jù)庫回滾段監(jiān)測:回滾段名、回退段當前大小、命中

51、率(取得次數(shù)和等待次數(shù)的比率),壓縮次數(shù);數(shù)據(jù)庫會話信息監(jiān)測:會話ID、用戶名、占用CPU時間、內存排序次數(shù)、掃描表次數(shù)、讀寫次數(shù)、提交次數(shù)、所占用游標數(shù)、緩沖區(qū)命中率、已連接的用戶數(shù)、空閑的連接數(shù);數(shù)據(jù)庫會話安全監(jiān)測:判斷是否有未經(jīng)授權的IP地址、用戶、時間段、使用特殊工具訪問數(shù)據(jù)庫的行為;數(shù)據(jù)庫資源鎖監(jiān)測:監(jiān)測數(shù)據(jù)庫資源鎖的情況,對超過鎖定時間、鎖過濾條件的資源鎖生成相應告警。對參數(shù)和性能的管理,我司同時都支持實時運行數(shù)據(jù)流轉圖和詳細數(shù)據(jù)表查詢功能,同時支持對查詢的數(shù)據(jù)進行歷史記錄分析和告警管理。中間件管理實現(xiàn)對不同種類中間件信息的實現(xiàn)全面監(jiān)控,并為用戶提供直觀的數(shù)據(jù)報表,方便掌握中間件的

52、運行狀態(tài)。支持與業(yè)務管理的聯(lián)動??梢躁P聯(lián)告警系統(tǒng),對中間件關鍵指標的異常狀態(tài)進行告警,讓用戶可以及時的知道并進行處理。我司綜合管理平臺支持對常用的中間件系統(tǒng)進行監(jiān)控和管理,如:WebLogic、MQ、Websphere,分述如下:1、WebLogic監(jiān)控對weblogic支持但不限于如下管理指標:監(jiān)控描述監(jiān)控描述WebLogic 數(shù)據(jù)庫連接池WebLogic WEB應用監(jiān)測指標名稱當前激活會話數(shù)服務器名稱最大會話數(shù)當前容量會話總數(shù)活動連接數(shù)WebLogic EJB監(jiān)測指標活動連接比名稱等待連接數(shù)類型最大可用數(shù)激活次數(shù)泄露連接數(shù)鈍化次數(shù)最大等待時間緩存ejb個數(shù)連接池最大容量Weblogic J

53、TA事務ejb池名稱JTA事務總回滾比例ejb池類型資源錯誤回滾比例使用的ejb個數(shù)應用錯誤回滾比例空閑ejb個數(shù)系統(tǒng)錯誤回滾比例超時ejb個數(shù)WebLogic JVM監(jiān)控等待ejb個數(shù)當前虛擬機運行時空閑堆棧ejb事務名稱當前虛擬機運行時堆棧大小ejb事務類型堆棧利用率提交的事務總數(shù)WebLogic Servlet監(jiān)測回滾得事務總數(shù)名稱超時得事務總數(shù)平均執(zhí)行時間Weblogic 運行隊列信息最大執(zhí)行時間對象名稱執(zhí)行次數(shù)當前空閑執(zhí)線程計數(shù)WebLogic基本配置信息隊列中最長的等待時間服務器名稱服務請求總數(shù)(吞吐量)服務器運行的Weblogic版本隊列中等待的請求數(shù)(隊列長度)服務器監(jiān)聽端口服

54、務器運行狀態(tài)對參數(shù)和性能的管理,我司同時都支持實時運行數(shù)據(jù)流轉圖和詳細數(shù)據(jù)表查詢功能,同時支持對查詢的數(shù)據(jù)進行歷史記錄分析和告警管理。2、Websphere監(jiān)控對websphere支持但不限于如下管理指標:接口變更JVMWebSphere的JVM信息事務WebShpher的事務信息JDBCWebSphere的JDBC連接池線程池WebSphere的線程池信息系統(tǒng)信息WebSphere的系統(tǒng)信息WebWebsphere的Web信息ServletWebShpher的Servlet信息對參數(shù)和性能的管理,我司同時都支持實時運行數(shù)據(jù)流轉圖和詳細數(shù)據(jù)表查詢功能,同時支持對查詢的數(shù)據(jù)進行歷史記錄分析和告警

55、管理。3、MQ監(jiān)控MQ_BaseinfoMQ隊列管理器基本信息MQ_QueuesMQ隊列列表、名稱MQ_QueueStatMQ隊列狀態(tài)、深度、IPPROCS、OPPROCS、UNCOMMQ_ChannelsMQ通道列表、名稱、INDOUBT、SUBSTATE、LASTSEQNO、CURSEQNO、MCASTATMQ_ChstatusMQ通道狀態(tài)、本地隊列及通道(包括集群通道)、死信隊列滿對MQ支持但不限于如下管理指標:對參數(shù)和性能的管理,我司同時都支持實時運行數(shù)據(jù)流轉圖和詳細數(shù)據(jù)表查詢功能,同時支持對查詢的數(shù)據(jù)進行歷史記錄分析和告警管理。應用管理應用仿真式的監(jiān)控方式,“一語中的”的告訴客戶行還

56、是不行??梢詫崟r管理和監(jiān)視這些應用的配置和連接等信息,并可以通過數(shù)據(jù)表、圖例等方式實時的進行展現(xiàn),真實的反映這些應用的運行情況。統(tǒng)提供各種基礎信息服務如FTP服務、POP3服務、SMTP服務、TCP端口、流媒體服務以及DNS、DHCP、目錄服務等的監(jiān)視,可以對這些服務的有效性、服務狀態(tài)等實施集中、實時的監(jiān)視。關聯(lián)告警系統(tǒng),及時的告訴用戶什么應用出現(xiàn)了問題,幫助用戶及時處理。存儲管理存儲管理的優(yōu)勢和亮點全面管理FC-SAN 異構管理,支持多廠商 全面支持FC各類型產品可視化動態(tài)展現(xiàn)拓撲圖方式顯示網(wǎng)絡,明確清晰 管理到位,支持盤陣組件監(jiān)管 主動式故障管理 高頻監(jiān)控設備狀態(tài) 主動告知,故障及時處理

57、可落地的管理實踐 組件生命周期管理,到期主動提醒 運維信息明確,提高故障處理便捷性 部署方式存儲環(huán)境監(jiān)控要求:FC交換機、磁盤陣列接入IP網(wǎng)絡,且組件服務器IP可達;安裝有HBA卡的主機,必須安裝Provider,并對外開放相關SMI-S協(xié)議接口;IP網(wǎng)絡中需要假設一臺代理機,用于監(jiān)管和配置磁盤陣列,此機上需要安裝有盤陣provider,同廠商的provider一般能監(jiān)控46個盤陣,所以當用戶環(huán)境中同一產品的provider超過4個,可能需要部署多個代理機;組件服務器用于安裝存儲、Vmware管理的系統(tǒng),支持虛擬機方式;可與我司共用一個數(shù)據(jù)庫,在監(jiān)控量合適的情況下,數(shù)據(jù)庫服務器可與我司安裝在一

58、臺物理機上。故障告警管理故障管理是事前管理的有效手段之一,故障管理能對來自網(wǎng)絡設備、主機、數(shù)據(jù)庫、存儲系統(tǒng)、網(wǎng)管系統(tǒng)本身以及其它硬、軟件系統(tǒng)等所產生的事件進行歸類。用戶可以根據(jù)自定義的等級條件來劃分事件的等級,還可以將事件歸類到具體的事件組中,并且可以根據(jù)定義的行為執(zhí)行條件來執(zhí)行某事件產生時所對應的動作(例如在客戶端發(fā)出報警聲音、自動發(fā)送 E-ma 通知負責人等)。故障管理功能包括:網(wǎng)絡告警、服務告警、環(huán)境告警、基線數(shù)據(jù)管理、告警日志查詢、負載設置和ARP干擾功能。故障管理的優(yōu)勢和亮點支持聯(lián)動告警,提高用戶對于故障的響應速度。支持符合告警,為客戶提供了“智能化”的運維監(jiān)控平臺,提高運維效率,可

59、以根據(jù)客戶的關注給出不同的告警設置方案。提供告警事件的壓縮、事件組合和抑制、對外接、送功能。針對網(wǎng)絡、主機、流量、各類系統(tǒng)軟件、業(yè)務系統(tǒng)各類KPI指標均可提供告警功能?!岸〞r體檢”“有疾病預兆時全面檢查”的啟發(fā)式告警方式。比如說,對于一個關鍵業(yè)務,事先設定好一個關鍵監(jiān)控點(告警觸發(fā)點),平時只監(jiān)控這個點,當這個點越過閾值時,系統(tǒng)會全面采集該關鍵監(jiān)控點相關的所有的基礎信息(包括網(wǎng)絡、服務器、數(shù)據(jù)庫、中間件、機房環(huán)境信息等),減輕了數(shù)據(jù)采樣對網(wǎng)絡的壓力,降低了輪詢在業(yè)務高峰時段對業(yè)務本身的影響,所有的設置可由客戶設定,避免了“黑盒子”效應。對告警劃分層次之后有助于效率的提高,這樣一來客戶就不必為繁

60、多的無關告警所苦惱了。支持基線告警。支持自定義時間段,方便用戶根據(jù)實際情況發(fā)出告警。短信平臺強大,接口眾多。對非法IP地址進行ARP干擾,拒絕黑客、網(wǎng)絡掃描等異常行為,為穩(wěn)定的網(wǎng)絡運行保駕護航。我司故障管理詳細介紹事前的運維管理我司注重運行維護的管理,偏向于事前管理而非事后管理,因此特別強化了基于事件的故障管理與故障預警管理。設備失效固然是嚴重故障,但 我司產品的設計并非讓用戶被動地等待“出事”,絕大多數(shù)告警項的設計是為了建立“預警”機制。例如,對一條千兆網(wǎng)絡連接300M的流量不算大事件,但是如果考慮到日常的流量一般不會超過100M,這就是“事件”,通過設置流量告警上限同時結合延時設置 (過濾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論