智慧運(yùn)維管理平臺(tái)技術(shù)方案_第1頁
智慧運(yùn)維管理平臺(tái)技術(shù)方案_第2頁
智慧運(yùn)維管理平臺(tái)技術(shù)方案_第3頁
智慧運(yùn)維管理平臺(tái)技術(shù)方案_第4頁
智慧運(yùn)維管理平臺(tái)技術(shù)方案_第5頁
已閱讀5頁,還剩85頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、技術(shù)方案目錄錄2目1.運(yùn)維軟件的.91.1.運(yùn)維管理的三個(gè)轉(zhuǎn)變91.2.智慧運(yùn)維給用戶的價(jià)值101.2.1.落實(shí)等級(jí)化管理101.2.2.落實(shí)管理經(jīng)驗(yàn)積累111.2.3.從數(shù)據(jù)挖掘?qū)崿F(xiàn)隱患分析121.2.4.支持持續(xù)管理建設(shè)131.3.智能運(yùn)維的特色功能141.3.1.智能拓?fù)?41.3.2.智能. 151.3.3.智能基線151.3.4.智能策略161.4.項(xiàng)目效益分析171.4.1.管理效益171.4.2.實(shí)現(xiàn)綠色模式171.5.北塔軟件公司介紹181.5.1.創(chuàng)新181.5.2.大量優(yōu)質(zhì)案例192/91技術(shù)方案1.5.3.參與標(biāo)準(zhǔn)制訂191.5.4.服務(wù)能力191.5.5.競爭力192.

2、整體技術(shù)方案介紹202.1.建設(shè)目標(biāo)202.1.1.建設(shè)思路202.1.2.建設(shè)內(nèi)容202.2.方案介紹212.3.方案詳細(xì)介紹222.3.1.平臺(tái)介紹222.3.1.1.分布式器232.3.1.2.運(yùn)行摘要242.3.1.3.日常運(yùn)維252.3.1.3.1.運(yùn)維等級(jí)管理252.3.1.3.2.停機(jī)檢修管理262.3.1.3.3.軟件操作審計(jì)272.3.2.智能運(yùn)維引擎272.3.2.1.運(yùn)用等級(jí)概念實(shí)現(xiàn)差異化管理272.3.2.2.學(xué)習(xí)基線實(shí)現(xiàn)業(yè)務(wù)異常. 282.3.2.3.智能策略實(shí)現(xiàn)管理實(shí)例落地282.3.3.系統(tǒng)智能運(yùn)維303/91技術(shù)方案2.3.3.1.預(yù)置智維管理方案302.3.3

3、.2.智維. 302.3.3.3.智維越界提醒策略312.3.3.4.客戶化分析策略定制322.3.4.故障管理322.3.4.1.告警管理332.3.4.1.1.便捷的規(guī)則設(shè)置332.3.4.1.2.高效的告警提醒機(jī)制332.3.4.1.3.清晰的告警. 342.3.4.2.知識(shí)庫管理352.3.5.網(wǎng)絡(luò)管理352.3.5.1.網(wǎng)絡(luò)拓?fù)涔芾?52.3.5.1.1.拓?fù)渖?52.3.5.1.2.拓?fù)鋱D展現(xiàn)362.3.5.1.3.個(gè)性化拓?fù)?62.3.5.1.4.結(jié)果展現(xiàn)直觀362.3.5.1.5.界面美觀362.3.5.1.6.操作便捷372.3.5.2.UPS 管理382.3.5.2.1.

4、性能382.3.5.2.2.內(nèi)容384/91技術(shù)方案2.3.5.3.網(wǎng)絡(luò)配置管理382.3.5.4.網(wǎng)絡(luò)管理報(bào)表392.3.6.系統(tǒng)類管理392.3.6.1.主機(jī)管理392.3.6.1.1.標(biāo)準(zhǔn)主機(jī)日志管理412.3.6.2.數(shù)據(jù)庫管理422.3.6.2.1.Oracle-RAC 管理452.3.6.3.中間件管理462.3.6.4.標(biāo)準(zhǔn)應(yīng)用管理492.3.6.5.設(shè)備性能分析502.3.6.6.系統(tǒng)報(bào)表512.3.7.虛擬化管理522.3.7.1.呈現(xiàn)虛擬化對象健康性522.3.7.2.預(yù)防容量枯竭542.3.7.3.保障容量有效使用542.3.7.4.明細(xì)容量分配552.3.7.5.發(fā)現(xiàn)和

5、解決性能瓶頸552.3.7.6.虛擬機(jī)性能分析562.3.7.6.1.智能運(yùn)維策略572.3.7.6.2.虛擬機(jī)可刪除592.3.8.管理605/91技術(shù)方案2.3.8.1.設(shè)備硬件狀態(tài)管理602.3.8.2.空間使用管理612.3.8.3.設(shè)備性能管理622.3.9.業(yè)務(wù)管理632.3.9.1.透明展現(xiàn)業(yè)務(wù)關(guān)系632.3.9.2.綜合評(píng)價(jià)業(yè)務(wù)健康642.3.9.3.業(yè)務(wù)視角管理基礎(chǔ)設(shè)施642.3.10.機(jī)房管理662.3.10.1.機(jī)房布線管理682.3.10.2.機(jī)房可視化巡檢682.3.11.報(bào)表與分析692.3.11.1.性能趨勢分析692.3.11.2.基礎(chǔ)管理報(bào)表692.3.11.

6、3.快速報(bào)表定制702.3.12.專項(xiàng)運(yùn)維702.3.12.1.設(shè)備性能管理712.3.12.2.線路性能管理712.3.13.將來可擴(kuò)展管理項(xiàng)722.3.13.1.系統(tǒng)巡檢732.3.13.2.數(shù)據(jù)快照分析743.項(xiàng)目管理766/91技術(shù)方案3.1.項(xiàng)目總則763.2.項(xiàng)目組織機(jī)構(gòu)763.2.1.組織架構(gòu)保證763.2.2.穩(wěn)定763.3.項(xiàng)目進(jìn)度計(jì)劃773.4.項(xiàng)目范圍內(nèi)容773.5.項(xiàng)目實(shí)施地點(diǎn)783.6.項(xiàng)目進(jìn)度管理783.7.項(xiàng)目合同變更管理783.8.項(xiàng)目質(zhì)量管理793.9.服務(wù)內(nèi)容803.10.項(xiàng)目管理803.11.項(xiàng)目交付成果804.實(shí)施方案834.1.實(shí)施計(jì)劃安排844.2.

7、技術(shù)支持要求844.2.1.實(shí)施團(tuán)隊(duì)資質(zhì)844.2.2.培訓(xùn)854.2.3.知識(shí)轉(zhuǎn)移和交付854.3.驗(yàn)收854.3.1.到貨驗(yàn)收857/91技術(shù)方案4.3.2.系統(tǒng)驗(yàn)收864.3.2.1.驗(yàn)收目的864.3.2.2.驗(yàn)收范圍864.3.2.3.期望目標(biāo)864.3.2.4.驗(yàn)收報(bào)告875.售后服務(wù)885.1.服務(wù). 885.2.服務(wù)內(nèi)容885.2.1.升級(jí)服務(wù)885.2.2.標(biāo)準(zhǔn)支持服務(wù)895.2.3.現(xiàn)場巡檢服務(wù)906.附錄:季度巡檢報(bào)告樣稿918/91技術(shù)方案1. 運(yùn)維軟件的1.1. 運(yùn)維管理的三個(gè)轉(zhuǎn)變近年來,國內(nèi) IT 應(yīng)用系統(tǒng)建設(shè)經(jīng)歷了基礎(chǔ)硬件環(huán)境建設(shè)、系統(tǒng)應(yīng)用建設(shè)、數(shù)據(jù)大集中階段等多

8、個(gè)階段。面對業(yè)務(wù)部門對信息支撐能力要求日益提高,信息部門管理工作也逐步從大建設(shè)、大發(fā)展階段進(jìn)化到精細(xì)化管理階段,從過去強(qiáng)調(diào)網(wǎng)絡(luò)建設(shè)、應(yīng)用建設(shè)和系統(tǒng)建設(shè),逐步認(rèn)識(shí)到增強(qiáng)管理能力的重要性。傳統(tǒng)的運(yùn)維管理雖然具備一定的設(shè)備管理能力,但從實(shí)踐中有發(fā)現(xiàn)了很多弊端。這些弊端包括管理設(shè)備究竟該管那些關(guān)鍵指標(biāo)(KPI)?確定 KPI 后運(yùn)維管理給出的具體數(shù)值又代表什么含義?設(shè)備是正常的?故障的?還是只是需要注意下?最痛苦的是用戶會(huì)發(fā)現(xiàn)管設(shè)備節(jié)約的人力都投入到使用運(yùn)維管理系統(tǒng)中,那么運(yùn)維管理系統(tǒng)帶給用戶的價(jià)值在哪里呢?綜上所述,傳統(tǒng)運(yùn)維管理軟件的弊端必然帶來新的,這種趨勢包含以下三個(gè)方向:1)人工運(yùn)維向自動(dòng)智能

9、運(yùn)維轉(zhuǎn)變傳統(tǒng)運(yùn)維工作是以人工處理為主,通過各種專業(yè)的人對系統(tǒng)進(jìn)行檢查的方式來發(fā)現(xiàn)系統(tǒng)中存在的問題。隨著系統(tǒng)復(fù)雜性和建設(shè)規(guī)模不斷增大,各種復(fù)雜設(shè)備對人的要求越來越高。初級(jí)的運(yùn)維管理系統(tǒng)應(yīng)運(yùn)而生,這類系統(tǒng)是以“工具”的形式出現(xiàn),即“我不知道該看什么指標(biāo),該管什么設(shè)備,反正我都可以管,具體怎么管用戶定”。系統(tǒng)投運(yùn)后,大量的工作都需要用戶完成,轉(zhuǎn)變不外乎從登錄設(shè)備操作改變到登錄運(yùn)維系統(tǒng)進(jìn)行操作。這樣的運(yùn)維管理系統(tǒng)一旦部署,用戶的工作量并沒有任何改變,對這類管理系統(tǒng)最大體會(huì)就是難用。因此,用戶也迫切希望建設(shè)具有自動(dòng)管理能力,更像一個(gè)高水平的“管家”幫助用戶全方位的各類系統(tǒng)的運(yùn)行狀況,及時(shí)給出異常提醒和操

10、作建議。2)閥值管理向趨勢管理轉(zhuǎn)變閾值管理也是傳統(tǒng)運(yùn)維管理系統(tǒng)的特征。通過設(shè)置設(shè)備運(yùn)行的固定閾值,來界定設(shè)備處于正常和故障兩種狀態(tài)。然而事實(shí)上,閥值管理很難對實(shí)際的運(yùn)維管理工作有指導(dǎo)意義。這是因?yàn)橛捎诟黝愒O(shè)備都承載了各種業(yè)務(wù),由于每個(gè)用戶實(shí)際業(yè)務(wù)不同,即便完全相同的設(shè)備的運(yùn)行指9/91技術(shù)方案標(biāo)也呈現(xiàn)出不同的負(fù)載變化。另外運(yùn)維管理系統(tǒng)的價(jià)值體現(xiàn)是“防患于未然”,采用固定閾值的結(jié)果是兩個(gè),要么設(shè)備故障了才告警,要么一堆告警而設(shè)備完全正常。這兩種會(huì)導(dǎo)致用戶處理各種故障或者對故障提醒麻木。這些都導(dǎo)致運(yùn)維管理的價(jià)值沒有體現(xiàn)。因此真正的管理應(yīng)遵循設(shè)備本身的實(shí)際運(yùn)行狀態(tài)情況,“貼身”描繪出各個(gè)設(shè)備各個(gè)時(shí)間

11、段的性能變化情況,并根據(jù)變化情況建立跟蹤曲線,通過跟蹤曲線可以真正建立趨勢管理視角,依據(jù)設(shè)備運(yùn)行數(shù)據(jù)變化情況來做趨勢分析和,準(zhǔn)確把握設(shè)備處于健康狀態(tài)、亞健康狀態(tài)和“生病”狀態(tài)。所以趨勢管理才是用戶真正需要的運(yùn)維管理。3)通用平臺(tái)向全面開放的專屬平臺(tái)轉(zhuǎn)變雖然大多數(shù)用戶建設(shè)信息系統(tǒng)時(shí)采用的設(shè)備、技術(shù)都有相似性,但是系統(tǒng)的復(fù)雜性、耦合性、環(huán)境多樣性都導(dǎo)致每個(gè)用戶的運(yùn)維管理重點(diǎn)與難點(diǎn)是存在較多的差異。這種差異既有實(shí)際環(huán)境中帶來的各種現(xiàn)實(shí)問題,也有不同發(fā)展階段不同運(yùn)維要求帶來的實(shí)際問題。這些都要求運(yùn)維管理系統(tǒng)提供全面、深入的管理能力同時(shí)還需要具備開放性,能夠根據(jù)用戶自身運(yùn)維經(jīng)驗(yàn)提供“私人專屬”的定制運(yùn)維

12、策略能力,將用戶歷史的運(yùn)維經(jīng)驗(yàn),目前的管理重點(diǎn)都通過智能運(yùn)維策略自動(dòng)實(shí)現(xiàn),真正實(shí)現(xiàn)即兼顧全面的綜合運(yùn)維管理要求又能充分兼顧用戶個(gè)性化運(yùn)維訴求。綜上所述,以大量 KPI 庫為,以閾值管理來區(qū)別設(shè)備正常或者故障,以通用標(biāo)準(zhǔn)為訴求點(diǎn)的舊運(yùn)維管理系統(tǒng)已經(jīng)越來越難以適應(yīng)用戶管理要求。具備自動(dòng)學(xué)習(xí)功能,可以完整學(xué)習(xí)各類設(shè)備日常運(yùn)行狀況,根據(jù)基線數(shù)據(jù)自動(dòng)運(yùn)維,主動(dòng)匯報(bào)設(shè)備異常,可以根據(jù)用戶真實(shí)管理要求進(jìn)行定制策略智慧運(yùn)維管理平臺(tái)將成為用戶選擇的主流。1.2. 智慧運(yùn)維給用戶的價(jià)值1.2.1.落實(shí)等級(jí)化管理管理上劃分優(yōu)先級(jí)是被普遍認(rèn)可的方式,優(yōu)先級(jí)劃分能實(shí)現(xiàn)管理投入的合理分配,對于運(yùn)維管理同樣適用,通過對按照

13、所在業(yè)務(wù)重要度區(qū)分其對應(yīng)的管理等級(jí),比如關(guān)乎生產(chǎn)系統(tǒng)的資源劃分成一級(jí),內(nèi)部辦公系統(tǒng)相關(guān)劃分成設(shè)備;對于一級(jí)設(shè)備意味著更為密集的數(shù)據(jù)采集和更低的閾值,對于異常更為敏感,故障處理上要求更為嚴(yán)格,后期的管理數(shù)據(jù)統(tǒng)計(jì)需要單獨(dú)列項(xiàng)統(tǒng)計(jì)。10/91技術(shù)方案常規(guī)運(yùn)維軟件中僅僅是對于將管理對象簡單的劃分了不同等級(jí),僅是為了界面上進(jìn)行統(tǒng)計(jì),沒有落實(shí)到具體運(yùn)維過程中;真正落地的等級(jí)化管理必須要做到如下幾點(diǎn):u按照業(yè)務(wù)劃分管理u實(shí)現(xiàn)對于不同等級(jí)不同的周期和閾值u對于不同等級(jí)定義不同等級(jí)和處置方案u對于不同等級(jí)進(jìn)行不同角度的統(tǒng)計(jì)和報(bào)表分析u能便捷的調(diào)整等級(jí),并應(yīng)用相應(yīng)等級(jí)的管理規(guī)則智慧運(yùn)維平臺(tái)以等級(jí)為進(jìn)行管理區(qū)分,內(nèi)

14、置不同等級(jí)的管理解決方案,從下到上貫徹等級(jí)化,差異化管理模式。1、預(yù)置不同的指標(biāo)方案和策略,落實(shí)差異化方式,按需提供技術(shù)基礎(chǔ),同時(shí)為大節(jié)點(diǎn)管理提供理論可能;2、預(yù)置不同等級(jí)的不同風(fēng)險(xiǎn)閾值的設(shè)定,落實(shí)差異化管理和要求;3、為高級(jí)別設(shè)備自動(dòng)生成統(tǒng)計(jì)報(bào)表,使用戶能方便的關(guān)注報(bào)表數(shù)據(jù);4、支持方便的界面等級(jí)顯示方式,在不同界面均能方便的區(qū)分不同的等級(jí),便于管理視野的日常落地。1.2.2.落實(shí)管理經(jīng)驗(yàn)積累從本世紀(jì)初,企業(yè)用戶開始重視 IT 環(huán)境的運(yùn)維管理,10 多年的運(yùn)維歷程造就了一批運(yùn)維的同時(shí),長期的運(yùn)維工作也促成企業(yè)用戶總結(jié)處理其具有自身業(yè)務(wù)特色的管理方法,這些方法包11/91技術(shù)方案括大到流程的本

15、地化,小到具體管理指標(biāo)的定義;如何實(shí)現(xiàn)此類管理經(jīng)驗(yàn)的落實(shí)呢?智慧運(yùn)維平臺(tái)提供處置知識(shí)管理,通過對用戶日常故障處置方法的收集,經(jīng)驗(yàn)積累,自動(dòng)反饋到相同故障的處置過程中。通過系統(tǒng)提供的智能策略機(jī)制,將用戶對于某些異常分析的人工方式自動(dòng)化,比如對于主機(jī)高負(fù)載的排查,一般的操作邏輯是確定主機(jī)負(fù)載超過風(fēng)險(xiǎn)閾值情況是偶發(fā)還是一直存在,然后分析每一次出現(xiàn)高負(fù)載的進(jìn)程是否一致,通過人工智能找到具體的異常進(jìn)程,關(guān)閉該進(jìn)程或者卸載相關(guān)軟件,同時(shí)對于該進(jìn)程的設(shè)定,達(dá)到事前;智慧運(yùn)維平臺(tái)通過策略實(shí)現(xiàn)這一系列動(dòng)作,包括對歷史多點(diǎn)對比,對于進(jìn)程的,異常進(jìn)程的智能,乃至告警的建議;通過策略體制調(diào)用系統(tǒng)的各項(xiàng)零散功能,將用戶

16、問題分析方式,快速自動(dòng)化。1.2.3.從數(shù)據(jù)挖掘?qū)崿F(xiàn)隱患分析傳統(tǒng)運(yùn)維領(lǐng)域,的關(guān)注點(diǎn)在于即時(shí)狀態(tài)的,能對于異常的即時(shí)、準(zhǔn)確通知;而隨著廠商技術(shù)的不斷提高,設(shè)備的告警越來越少,特別是一些新建機(jī)房,可能一也不能沒有幾個(gè)告警,難道運(yùn)維就不再重要了嗎?恰恰相反,當(dāng)設(shè)備故障減少后,正好為 IT 運(yùn)維創(chuàng)造價(jià)值提供了客觀條件,IT 運(yùn)維需要將的時(shí)間和精力放在挖掘?qū)嵗龜?shù)據(jù),發(fā)現(xiàn)業(yè)務(wù)隱患,提高業(yè)務(wù)運(yùn)行效率。12/91技術(shù)方案智慧運(yùn)維平臺(tái)提供了強(qiáng)大的歷史能力,可以實(shí)現(xiàn) 45 萬 KPI 的指標(biāo)數(shù)據(jù)不壓縮1 年;同時(shí)提供詳盡靈活的數(shù)據(jù)分析工具,可以實(shí)現(xiàn)單設(shè)備 1 年、1 季度、1 月、1 周整體趨勢分析,從歷史層面分

17、析出業(yè)務(wù)運(yùn)行規(guī)律,方便的發(fā)現(xiàn)業(yè)務(wù)運(yùn)行異常;多指標(biāo)相對分析,實(shí)現(xiàn)管理對象的縱向比較,找到影響具體的異常指標(biāo)集。通過對歷史分析,為管理方式改進(jìn)提供基礎(chǔ)數(shù)據(jù),貼合業(yè)務(wù)指標(biāo)變化的規(guī)律,整合人力,實(shí)現(xiàn)關(guān)鍵時(shí)段重點(diǎn)關(guān)注的優(yōu)先級(jí)理念;為用戶年度管理數(shù)據(jù)的統(tǒng)計(jì)提供可能,配合北塔快速報(bào)表開發(fā)能力,使符合用戶管理實(shí)踐的事后報(bào)為可能。智慧運(yùn)維平臺(tái)貫徹時(shí)段管理的理念,提供了拓?fù)渖险w的 CPU 趨勢分析,對近幾周的整體性能均值做比較,便于發(fā)現(xiàn)業(yè)務(wù)的偏離情況;使用歷史作為檢測閾值,實(shí)現(xiàn)更為合理的業(yè)務(wù)使用情況;提供整體高低負(fù)載分析,實(shí)現(xiàn)整體回顧,合理評(píng)價(jià)。1.2.4.支持持續(xù)管理建設(shè)智慧運(yùn)維平臺(tái)以平臺(tái)化架構(gòu)設(shè)計(jì),可以靈活

18、定制用戶管理需求,實(shí)現(xiàn)用戶管理的可持續(xù)化建設(shè);智慧運(yùn)維平臺(tái)為用戶多種開發(fā)集成方式包含如下幾種技術(shù)實(shí)現(xiàn):u 增加具有用戶獨(dú)有設(shè)備的管理,通過合作開發(fā),智慧運(yùn)維平臺(tái)可以集成用戶自行開發(fā)的方式,融入智慧運(yùn)維平臺(tái)中進(jìn)行統(tǒng)一的管理;13/91技術(shù)方案u整合具有本特色的管理指標(biāo)集,實(shí)現(xiàn)下級(jí)的快速部署,和統(tǒng)一化管理;u用戶管理經(jīng)驗(yàn)的策略化,實(shí)現(xiàn)用戶先進(jìn)管理分析方式的自動(dòng)化處理;u報(bào)表定制,快速導(dǎo)入報(bào)表模板,實(shí)現(xiàn)客戶報(bào)表的快速實(shí)現(xiàn)和更新,使用戶報(bào)表的變更不再成為運(yùn)維軟件的痛苦;使用戶的管理意志在軟件中得到持續(xù)體現(xiàn)。1.3. 智能運(yùn)維的特色功能1.3.1.智能拓?fù)湎到y(tǒng)采用北塔先進(jìn)的、且得到近 5000 個(gè)現(xiàn)場驗(yàn)

19、證的發(fā)現(xiàn)算法,智能發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備和設(shè)備間的真實(shí)線路,準(zhǔn)確而快速的完成拓?fù)涞臉?gòu)建。網(wǎng)絡(luò)拓?fù)淠芮逦宫F(xiàn)網(wǎng)絡(luò)的關(guān)系,自動(dòng)布局;并能提供“圓形”“樹形”多種拓?fù)湔宫F(xiàn)方式,便于用戶根據(jù)業(yè)務(wù)關(guān)系快速調(diào)整到用戶需要的展現(xiàn)方式,同時(shí)將管理對象的實(shí)時(shí)性能和告警信息通過圖標(biāo)的不同狀態(tài)展現(xiàn)給用戶。智慧運(yùn)維平臺(tái)拓?fù)涔芾聿粌H是,拓?fù)浣Y(jié)構(gòu)的展現(xiàn)方式,更是用戶的智能幫手;于業(yè)務(wù)承載的主機(jī),系統(tǒng)同樣提供了系統(tǒng)拓?fù)?,不僅提供全局狀態(tài)界面,同時(shí)也講拓?fù)鋱D作為全局分析工具,實(shí)現(xiàn)對于管理對象增長趨勢的全域分析,包含對全域設(shè)備的 CPU 業(yè)務(wù)應(yīng)用情況的分析,整體智能分析業(yè)務(wù)上一段時(shí)間內(nèi)使用的整體趨勢變化,以紅、黃、綠作為不同區(qū)段的顯示,

20、使用戶能清晰辨識(shí)歷史增長異常。14/91技術(shù)方案1.3.2.智能是運(yùn)維管理的基礎(chǔ),只有實(shí)現(xiàn)了穩(wěn)定和準(zhǔn)確,用戶才能管理,當(dāng)?shù)牧亢偷恼_性得不到保證,運(yùn)維只能是理論而已。研發(fā)的新一代智能平臺(tái) DGO,該平臺(tái)實(shí)現(xiàn)智慧運(yùn)維平臺(tái)采用北塔,容錯(cuò)功能,擴(kuò)展功能,與設(shè)備相關(guān)的取值事項(xiàng)均有該平臺(tái)完成。u均衡命令:該平臺(tái)通過智能,智能分配被管理對象的口令,忙閑配合,實(shí)現(xiàn)保證數(shù)據(jù)取值的前提下,對于設(shè)備的最??;u智能錯(cuò)誤處置:平臺(tái)通過智能,對于被管理對象取值異常進(jìn)行智能,避免由于網(wǎng)絡(luò)突發(fā)異常造成的出錯(cuò)誤報(bào)和頻繁造成的設(shè)備;uDGO 提供豐富的擴(kuò)展接口,可方便的接入用戶自行開發(fā)的探針,實(shí)現(xiàn)用戶管理對象的便捷增加。1.3

21、.3.智能基線傳統(tǒng)運(yùn)維關(guān)于被管對象“警戒值”,而一旦超過警戒值意味著一定程度的“損失”已經(jīng)發(fā)生,有沒有辦法在提前一點(diǎn)發(fā)現(xiàn)風(fēng)險(xiǎn)呢?有多種,通過業(yè)務(wù)基線的偏離異常就是其中一種。智慧運(yùn)維平臺(tái)能根據(jù)歷史自動(dòng)生成基線,并可按照業(yè)務(wù)變化規(guī)律,形成以日基線、周基線的數(shù)據(jù)對比,一旦實(shí)時(shí)數(shù)據(jù)大于基線比對點(diǎn)一定范圍,即生成智維,便于分析;當(dāng)出現(xiàn)多次越界后,系統(tǒng)主動(dòng)通知用戶,提示運(yùn)維風(fēng)險(xiǎn)。15/91技術(shù)方案基線方式的引入,降低了用戶對于“警戒值”的識(shí)別難度,使設(shè)置符合用戶業(yè)務(wù)實(shí)際的閾值成為簡單、可執(zhí)行的事情;同時(shí)基線的方式,符合用戶周期性業(yè)務(wù)穩(wěn)定的實(shí)際情況,真正落實(shí)用戶對于業(yè)務(wù)風(fēng)險(xiǎn)檢測。1.3.4.智能策略智慧運(yùn)維

22、平臺(tái)引入策略管理概念,架構(gòu)上為策略提供各個(gè)功能的調(diào)用接口,方便的實(shí)現(xiàn)軟件各種處理邏輯的協(xié)同處置;方便實(shí)現(xiàn)用戶對于管理方法的落地。策略的分為觸發(fā)、分析、處置三個(gè)部分,通過全面的智能運(yùn)維,實(shí)現(xiàn)對于各項(xiàng)關(guān)鍵節(jié)點(diǎn)的智維,包含單點(diǎn)、多點(diǎn)觸發(fā);多單指標(biāo)歷史分析、多指標(biāo)對比分析等方式,實(shí)現(xiàn)合理結(jié)論的分析,以提示、告警通知、自動(dòng)報(bào)表的各項(xiàng)輸出方式給出用戶最終處置建議。系統(tǒng)預(yù)置多款智能策略,實(shí)現(xiàn)全面檢測、智能、全面分析;包含對所有智維規(guī)則的策略,越界次數(shù)警示;包含對 CPU 負(fù)載過高的深入分析策略,可實(shí)現(xiàn)一站式,異常進(jìn)程的分析識(shí)別。智慧運(yùn)維平臺(tái)支持快速策略定制,便于用戶實(shí)現(xiàn)個(gè)性化管理需求,落實(shí)符合管理實(shí)踐的自動(dòng)

23、化分析。16/91技術(shù)方案1.4. 項(xiàng)目效益分析自動(dòng)智慧運(yùn)維平臺(tái)的上線將實(shí)現(xiàn)管理和兩方面的效益:1.4.1.管理效益自動(dòng)智慧運(yùn)維平臺(tái)的上線可帶來如下運(yùn)維管理效應(yīng):u透明化管理:通過對信息的透明化實(shí)現(xiàn)對信息的統(tǒng)一和智能管理,實(shí)現(xiàn)自動(dòng)化的信息和管理能力。u主動(dòng)運(yùn)維:即時(shí)的故障告警幫助管理即時(shí)了解安全和運(yùn)行隱患,實(shí)現(xiàn)真正的事前管理,變?yōu)橹鲃?dòng)。u全面降低誤操作可能:運(yùn)維管理和安全都從手動(dòng)的方式轉(zhuǎn)變?yōu)橄到y(tǒng)自動(dòng)、安全、可以跟蹤的行為,手動(dòng)的方式大量減少將極大降低誤操作的可能性,極大增加信息化設(shè)施的穩(wěn)定性。u提高效率:系統(tǒng)提供易用易操作的、處理、分析關(guān)聯(lián)分析能力,快速幫助運(yùn)維管理了解問題、分析問題、問題、輔

24、助管理解決問題,提高處理問題的效率,為信息化的可靠運(yùn)行保駕護(hù)航。u綜合分析能力:總體把握,提高效益,信息各個(gè)環(huán)節(jié)對業(yè)務(wù)的影響,提高信息設(shè)施質(zhì)量和降低運(yùn)維管理工作強(qiáng)度,最終為提高科技部的價(jià)值服務(wù)。1.4.2.實(shí)現(xiàn)綠色模式通過實(shí)施自動(dòng)智慧運(yùn)維平臺(tái)將會(huì)帶來非常大的和回報(bào)。我們來算一筆帳,我們在網(wǎng)絡(luò)中采用了自動(dòng)智慧運(yùn)維平臺(tái)后將產(chǎn)生什么樣的。自動(dòng)智慧運(yùn)維平臺(tái)可以實(shí)現(xiàn)對所有網(wǎng)絡(luò)、主機(jī)的安全和運(yùn)維工作 7*24 小時(shí)不間斷自動(dòng),代替以往人工檢查的方法。按照 200 個(gè)管理對象預(yù)計(jì),每個(gè)對象運(yùn)行情況檢查大約需要 10 分鐘;全部檢查一遍需要約 83.2 工時(shí)。以每天系統(tǒng)運(yùn)行情況檢查一遍,每工時(shí)/人按 15 元

25、計(jì)算,每年可以節(jié)省人力成本約 455520 元。17/91技術(shù)方案自動(dòng)智慧運(yùn)維平臺(tái)上線后,隨著運(yùn)維管理水平的提高,整個(gè)信息系統(tǒng)故障的解決時(shí)間會(huì)縮短,并且由于管理水平的提高,信息系統(tǒng)非計(jì)劃停機(jī)時(shí)間也會(huì)減少,提高業(yè)務(wù)部門滿意度,提升行業(yè)形象,為用戶帶來短期和長期的效益無法估量。自動(dòng)智慧運(yùn)維平臺(tái)將帶來如下的綠色模式:u系統(tǒng)可以減少運(yùn)行維護(hù)的日常巡檢工作強(qiáng)度,可以合理安排。u北塔的性能數(shù)據(jù)和處理辦法預(yù)計(jì)可以減少大量的運(yùn)算服務(wù)器和設(shè)備。u系統(tǒng)對信息系統(tǒng)運(yùn)行和安全隱患進(jìn)行評(píng)估,減小了信息系統(tǒng)故障造成的科技部系統(tǒng)中斷影響面,按評(píng)估結(jié)果進(jìn)行故障排查。1.5. 北塔軟件公司介紹上海北塔軟件(簡稱北塔軟件)是專業(yè)

26、從事 IT 運(yùn)維管理研發(fā)、銷售、咨詢和服務(wù)的高新技術(shù)軟件企業(yè),致力于為中國用戶提供從網(wǎng)絡(luò)管理、IT 基礎(chǔ)架構(gòu)管理到業(yè)務(wù)服務(wù)管理的全面優(yōu)質(zhì)解決方案。通過優(yōu)質(zhì)的解決方案,北塔軟件不斷拓展各個(gè)行業(yè)用戶,累計(jì)取得超過 5000 家用戶的規(guī)模應(yīng)用。這些規(guī)模應(yīng)用讓北塔軟件的不斷改進(jìn),始終處于運(yùn)維行業(yè)領(lǐng)先水平。2014 年北塔軟件登陸國內(nèi)新三板市場,為公司持續(xù)良性發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。北塔軟件也深知服務(wù)對用戶的重要性,在所有省會(huì)城市都建立了專門的服務(wù)團(tuán)隊(duì),由此建立了最大的運(yùn)維管理技術(shù)服務(wù)團(tuán)隊(duì),為用戶提供更快捷、更周到的服務(wù)。1.5.1.創(chuàng)新北塔立內(nèi)運(yùn)維管理實(shí)際需要,研發(fā),堅(jiān)定不移走創(chuàng)新,形成了完全符合國內(nèi)用戶使

27、用體驗(yàn)的專業(yè) IT 運(yùn)維管理。完整覆蓋網(wǎng)絡(luò)、主機(jī)、數(shù)據(jù)庫、中間件、應(yīng)用、業(yè)務(wù)、機(jī)房、虛擬化、等各個(gè) IT 設(shè)備領(lǐng)域。通過北塔專業(yè)的研發(fā)團(tuán)隊(duì),向用戶提供豐富的支撐和精細(xì)化的指標(biāo)管理能力,完全滿足用戶對各種 IT 設(shè)備的管理要求。隨著北塔業(yè)務(wù)的不斷發(fā)展,北塔收獲了超過 23 個(gè)著作權(quán),3 個(gè)發(fā)明專利,承擔(dān)和地方科研項(xiàng)目,這些都是北塔強(qiáng)大的研發(fā)實(shí)力的體現(xiàn)。18/91技術(shù)方案1.5.2.大量優(yōu)質(zhì)案例北塔軟件深知用戶的需求所在,秉承“為用戶創(chuàng)造價(jià)值”的服務(wù),持續(xù)完善和貫徹符合國際標(biāo)準(zhǔn)的項(xiàng)目管理和質(zhì)量管理體系。多年來,已在、電力、石油、教育、傳媒、企業(yè)等各行業(yè)開展實(shí)踐應(yīng)用,協(xié)助用戶提升了 IT 運(yùn)維管理水

28、平,并以高品質(zhì)、高性價(jià)比贏得了用戶的廣泛信任。目前,已有超過 5000 家的用戶使用北塔軟件系列 IT 運(yùn)維管理。1.5.3.參與標(biāo)準(zhǔn)制訂2010 年,北塔軟件加入 ITSS(服務(wù)標(biāo)準(zhǔn)工作組)。作為副組長成員,肩負(fù)行業(yè)責(zé)任感,參與了研究并建立服務(wù)標(biāo)準(zhǔn)體系,制定服務(wù)領(lǐng)域的相關(guān)標(biāo)準(zhǔn)等方面工作,并積極投身于規(guī)范和引導(dǎo)服務(wù)業(yè)的發(fā)展歷程中。1.5.4.服務(wù)能力公司總部設(shè)于上海,現(xiàn)有員工超過 300 人,在上海、北京、廣州、成都、西安、沈陽設(shè)有六大和服務(wù)中心,在三十幾個(gè)主要城市均設(shè)有分支機(jī)構(gòu)和常駐,為用戶提供高效、快捷的本地化服務(wù)和支持。1.5.5.競爭力北塔軟件不斷加大研發(fā)、技術(shù)、服務(wù)和等方面的投入,強(qiáng)

29、化以”研發(fā)、技術(shù)、創(chuàng)新“三大實(shí)力為主的競爭力,緊跟技術(shù)的發(fā)展與用戶的需求,不斷為廣大用戶提供高性價(jià)比的與服務(wù),幫助用戶創(chuàng)造價(jià)值,持續(xù)站在國內(nèi)同領(lǐng)域的巔峰位置。19/91技術(shù)方案2. 整體技術(shù)方案介紹2.1. 建設(shè)目標(biāo)2.1.1.建設(shè)思路結(jié)合國內(nèi)外信息化管理平臺(tái)發(fā)展特點(diǎn),信息化現(xiàn)狀和用戶實(shí)際需求,自動(dòng)智慧運(yùn)維平臺(tái)主要從以下兩個(gè)方面進(jìn)行建設(shè):l建設(shè)全面的基礎(chǔ)設(shè)施管理本次管理平臺(tái)需要提供全面的基礎(chǔ)設(shè)施管理,這些管理內(nèi)容包括網(wǎng)絡(luò)設(shè)備、設(shè)備、服務(wù)器(含小機(jī))、數(shù)據(jù)庫、中間件、標(biāo)準(zhǔn)應(yīng)用等設(shè)備。在管理設(shè)備的基礎(chǔ)上還包括對 IP 地址管理、設(shè)備配置管理、服務(wù)器硬件管理、進(jìn)程管理等內(nèi)容。通過全面的基礎(chǔ)設(shè)施管理,

30、能夠建設(shè)一個(gè)具備全面和精細(xì)的管理平臺(tái)。l建設(shè)自動(dòng)智慧運(yùn)維管理平臺(tái)全面基礎(chǔ)管理之上,通過自動(dòng)學(xué)習(xí),跟蹤設(shè)備運(yùn)行狀態(tài),自動(dòng)建立設(shè)備“健康”。依據(jù)設(shè)備的運(yùn)行狀態(tài)學(xué)習(xí),建立全面的數(shù)據(jù)基線,基于自動(dòng)運(yùn)維理念,自動(dòng)對設(shè)備的運(yùn)行異常進(jìn)行提醒。異常提醒的同時(shí)還同步給出操作建議。整個(gè)系統(tǒng)還能做到開放運(yùn)維,可以將用戶的運(yùn)維經(jīng)驗(yàn)通過智能策略的方式加入到運(yùn)維管理平臺(tái),更好滿足用戶“私人定制”系統(tǒng)的要求。2.1.2.建設(shè)內(nèi)容具體建設(shè)內(nèi)容如下:u系統(tǒng)平臺(tái),包括管理平臺(tái)、智能運(yùn)維引擎和多用戶支持引擎。u網(wǎng)絡(luò)管理,包括網(wǎng)絡(luò)設(shè)備管理、網(wǎng)絡(luò)拓?fù)涔芾?、網(wǎng)絡(luò)性能管理、網(wǎng)絡(luò)配置管理等內(nèi)容。u應(yīng)用管理,包括服務(wù)器管理、數(shù)據(jù)庫管理、中間件

31、管理和標(biāo)準(zhǔn)應(yīng)用管理,建設(shè)系統(tǒng)拓?fù)鋱D、主機(jī)日志管理等內(nèi)容。u虛擬化管理,包括宿主機(jī)管理、虛擬機(jī)管理、虛擬化性能管理、虛擬化容量管理和虛擬化拓?fù)涔芾怼?0/91技術(shù)方案u 告警管理,包括建設(shè)設(shè)備運(yùn)行基線、異常提示、處置經(jīng)驗(yàn)管理和智能巡檢等內(nèi)容。u 報(bào)表管理,包括網(wǎng)絡(luò)管理、應(yīng)用報(bào)表和虛擬化面各類運(yùn)行報(bào)表、故障報(bào)表等統(tǒng)計(jì)信息,還包括對網(wǎng)絡(luò)和應(yīng)用的數(shù)據(jù)快照功能。2.2. 方案介紹在目前這個(gè) IT 技術(shù)大發(fā)展的,各行各業(yè)越來越倚重 IT 作為生產(chǎn)平臺(tái),各種新技術(shù)運(yùn)用使業(yè)務(wù)運(yùn)行更便捷的同時(shí),業(yè)務(wù) IT 系統(tǒng)的運(yùn)維部門帶來的巨大的。隨著企業(yè)發(fā)展,IT 運(yùn)維部門也在不斷的摸索最佳運(yùn)維方式,逐漸形成了一些具有企業(yè)

32、特色的運(yùn)維經(jīng)驗(yàn)和問題分析方式,而業(yè)界的運(yùn)維軟件往往無法實(shí)現(xiàn)對于企業(yè)運(yùn)維方式的很好兼容,導(dǎo)致IT 部門無法將管理理論轉(zhuǎn)化成最佳生產(chǎn)力,提高管理效率,降低運(yùn)維成本。北塔 BTSO(Betasoft Smart Operation & Maintenance,北塔智慧運(yùn)維平臺(tái))作為北塔軟件最新一代的運(yùn)維管理軟件,秉承北塔多年管理經(jīng)驗(yàn)結(jié)合平臺(tái)化開發(fā)方式,在滿足用戶對于基本狀態(tài)和性能無人值守及實(shí)時(shí)展示的基本運(yùn)維需求的同時(shí),智能抓取關(guān)鍵性能數(shù)據(jù),根據(jù)預(yù)置策略進(jìn)行數(shù)據(jù)分析和聯(lián)動(dòng)處置;同時(shí)提供強(qiáng)大的平臺(tái)能力和開發(fā)能力,能將用戶個(gè)性化的分析方式和處置方式快速實(shí)現(xiàn)策略化,以期實(shí)現(xiàn)用戶管理效率的最大化提升。

33、21/91技術(shù)方案2.3. 方案詳細(xì)介紹2.3.1.平臺(tái)介紹BTSO 采用平臺(tái)化設(shè)計(jì),以 DGO(Data Gather Ocean)為平臺(tái),基礎(chǔ)平臺(tái)構(gòu)建功能平臺(tái);以告警、報(bào)表、智能運(yùn)維、license強(qiáng)大的功能平臺(tái);具體的管理作為基于平臺(tái)的管理功能,具備以接口為中心的設(shè)計(jì)模式。系統(tǒng)提供強(qiáng)大的擴(kuò)展能力,支持管理能力的自由擴(kuò)展:u平臺(tái)支持用戶個(gè)性化程序的快速兼容,實(shí)現(xiàn)管理指標(biāo)的快速擴(kuò)展;u服務(wù)器支持無縫擴(kuò)展,支持多個(gè)器同時(shí)部署;u支持管理策略的快速擴(kuò)展,實(shí)現(xiàn)用戶管理方式落地;u支持用戶個(gè)性化報(bào)表的快速擴(kuò)展,實(shí)現(xiàn)各種具備企業(yè)特征報(bào)表數(shù)據(jù)和展現(xiàn)方式。22/91技術(shù)方案2.3.1.1. 分布式器對于包

34、含多個(gè)分支機(jī)構(gòu)的企事業(yè),由于分支機(jī)構(gòu)之間的網(wǎng)絡(luò),單一的器已經(jīng)不能覆蓋,為此 BTSO 提供可擴(kuò)展的廣域網(wǎng)器,最多支持 20 個(gè)分支機(jī)構(gòu)的分布部署,對于分支和總部之間的線路要求降到最低,可用 1M 的帶寬,并支持廣域網(wǎng)等線路穩(wěn)定性較差的環(huán)境,并支持加密方式;u器具有的處理功能,在器完成自行的發(fā)現(xiàn)工作。u在部署完成后,可進(jìn)行自由擴(kuò)展器數(shù)量;u支持對于固定器的管理對象進(jìn)行禁訪設(shè)置,規(guī)避由于管理對象本身協(xié)議的造成業(yè)務(wù)影響;23/91技術(shù)方案2.3.1.2. 運(yùn)行摘要對于一款軟件來說,其最大的價(jià)值是能替代運(yùn)維(值班員)實(shí)現(xiàn)不間斷的,當(dāng)系統(tǒng)成為用戶的必備管理工具時(shí),每次進(jìn)入系統(tǒng)有一個(gè)概要性的說明,成為軟件

35、的必要。運(yùn)維主管登陸一次即可綜合性的顯示了 24 小時(shí)內(nèi)的系統(tǒng)運(yùn)行變化趨勢,通過列出了運(yùn)維重點(diǎn)關(guān)注內(nèi)容;通過對本界面的閱讀,可快速掌握最近 24 小時(shí)的運(yùn)維概況,實(shí)現(xiàn)運(yùn)維工作的快速銜接。u當(dāng)前實(shí)時(shí)運(yùn)維狀況,需要重點(diǎn)關(guān)注當(dāng)前還處于告警狀態(tài)的最近需要的停機(jī)計(jì)劃虛擬化環(huán)境目前的整合密度,概要性反映虛擬利用的有效性u(píng)最近 24 小時(shí)運(yùn)維系統(tǒng)的設(shè)置變動(dòng),便于用戶了解“未”時(shí)段的重要的變動(dòng)統(tǒng)計(jì)重要的方式變動(dòng)統(tǒng)計(jì)已恢復(fù)的告警信息u了解昨日關(guān)鍵指標(biāo)波動(dòng)最大的 5 個(gè),便于本日重點(diǎn)分析24/91技術(shù)方案主機(jī) CPU 波動(dòng)分析網(wǎng)絡(luò)設(shè)備 CPU 波動(dòng)統(tǒng)計(jì)線路流量均值波動(dòng)統(tǒng)計(jì)2.3.1.3. 日常運(yùn)維在運(yùn)維過程中,運(yùn)

36、維系統(tǒng)在進(jìn)行規(guī)律性監(jiān)測,但是由于業(yè)務(wù)上的定期整修、環(huán)境的變化,管理要求的提高均需要運(yùn)維管理對于系統(tǒng)運(yùn)維工作進(jìn)行干預(yù)操作,為了更好的實(shí)現(xiàn)日常運(yùn)維的各項(xiàng)管理,BTSO 提供日常運(yùn)維菜單,為用戶提供場景化工作,包括對現(xiàn)行方式的查看、對智維巡查過程的關(guān)注、調(diào)整計(jì)劃,審計(jì)運(yùn)維配置修改過程。2.3.1.3.1.運(yùn)維等級(jí)管理等級(jí)管理是實(shí)現(xiàn)差異化管理的一個(gè)具體,按照不同等級(jí)實(shí)現(xiàn)不同的方式是等級(jí)管理的具體落實(shí);作為等級(jí)管理的主要頁面,全局顯示了所有等級(jí)的設(shè)備數(shù)量,以及不同等級(jí)的方式,包含智維規(guī)則、告警規(guī)則;同時(shí)設(shè)備的管理優(yōu)先級(jí)不是固定不變的,本界面為用戶提供了快速等級(jí)切換的統(tǒng)一配置功能。25/91技術(shù)方案2.3

37、.1.3.2.停機(jī)檢修管理停機(jī)檢修是每個(gè)企業(yè)中不可避免的運(yùn)維場景,檢修時(shí)段的是沒有意義,而且會(huì)導(dǎo)致相關(guān)誤告警;BTSO 將停機(jī)作為基本運(yùn)維場景,用戶可以按照在系統(tǒng)中制定停機(jī)計(jì)劃,比如網(wǎng)絡(luò)設(shè)備停機(jī)、主機(jī)停機(jī),系統(tǒng)自動(dòng)根據(jù)關(guān)聯(lián)關(guān)系對于相關(guān)聯(lián)的線路和承載軟件自動(dòng)列入計(jì)劃。計(jì)劃執(zhí)行前,系統(tǒng)可以以郵件、多種方式通知管理員做好相關(guān)保存?zhèn)浞莨ぷ?。?jì)劃執(zhí)行時(shí),系統(tǒng)自動(dòng)相關(guān)設(shè)備與軟件的告警項(xiàng)目;計(jì)劃結(jié)束后,系統(tǒng)自動(dòng)啟用告警;相關(guān)統(tǒng)計(jì)中自動(dòng)將停機(jī)內(nèi)容進(jìn)行去除,以設(shè)備正常進(jìn)行計(jì)算。同時(shí)提供了 admin 賬號(hào)補(bǔ)填停機(jī)計(jì)劃的過程,此項(xiàng)過程為了保障由于臨時(shí)性停機(jī)過程,而出現(xiàn)的錯(cuò)誤統(tǒng)計(jì)現(xiàn)象。26/91技術(shù)方案2.3.1.

38、3.3.軟件操作審計(jì)BTSO 用于評(píng)價(jià) IT 環(huán)境中的各個(gè)管理,為了體現(xiàn)公平合理,相關(guān)的評(píng)價(jià)規(guī)則的設(shè)置需要得到,所以提供了軟件操作審計(jì),為管理者能清晰的查閱到對于設(shè)置變更、規(guī)則變更、報(bào)表規(guī)則變更的情況,強(qiáng)大的搜索系統(tǒng),為用戶異常操作提供助力。2.3.2.智能運(yùn)維引擎2.3.2.1. 運(yùn)用等級(jí)概念實(shí)現(xiàn)差異化管理運(yùn)用等級(jí)概念實(shí)現(xiàn)差異化管理 BTSO 精選各類管理對象的關(guān)鍵狀態(tài)、性能指標(biāo),以不同管理等級(jí)為數(shù)據(jù)集,實(shí)現(xiàn)一個(gè)等級(jí)的一個(gè)管理方案,包含預(yù)置智維檢測指標(biāo)、預(yù)置報(bào)表、預(yù)置策略檢測等;實(shí)現(xiàn)加入即可的簡單運(yùn)維方式。BTSO 也支持用戶根據(jù)業(yè)務(wù)系統(tǒng)的重要性,將管理上相同重要性的不同管理對象設(shè)置為同一等

39、級(jí),性新設(shè)、修訂管理指標(biāo)集合,修訂密度、閾值,指定性處置策略,在不同等級(jí)間實(shí)施差異化管理;27/91技術(shù)方案圖:智維引擎工作示意2.3.2.2.學(xué)習(xí)基線實(shí)現(xiàn)業(yè)務(wù)異常在日常運(yùn)維管理務(wù)管理的復(fù)雜性要遠(yuǎn)高于設(shè)備管理的復(fù)雜性,它不是簡單的表現(xiàn)為好壞、通斷,而是更復(fù)雜為可用性問題,可用性也是由一批關(guān)鍵指標(biāo)的,但指標(biāo)的正常與否,不能簡單地以固定閾值來對比,要結(jié)合真實(shí)業(yè)務(wù)情況的波動(dòng)來。BTSO 提供智能基線方式,支持智能基線的自動(dòng)學(xué)習(xí),通過對正常狀態(tài)下指標(biāo)的“歷史表現(xiàn)”,加以調(diào)整后作為基準(zhǔn)線,與以后同樣時(shí)段的實(shí)時(shí)指標(biāo)做對比,如果誤差在范圍內(nèi),那么判定為正常,否則為越界,越界次數(shù)越多,會(huì)導(dǎo)致系統(tǒng)的可用性嚴(yán)重下

40、降,情況下導(dǎo)致系統(tǒng)不可正常使用;以此作為業(yè)務(wù)異常的;系統(tǒng)提供日、周兩種基線方式,周基線的形成是以前幾個(gè)穩(wěn)定的周歷史數(shù)據(jù)為基礎(chǔ),通過智能算法,將相同時(shí)間點(diǎn)的多個(gè)數(shù)據(jù),歸并成一個(gè)基準(zhǔn)數(shù)據(jù),并以此為方式形成周基線。使用基線時(shí),將實(shí)時(shí)數(shù)據(jù)和基線相同時(shí)間點(diǎn)進(jìn)行比對,實(shí)現(xiàn)周一和周末的區(qū)別、上午 8 點(diǎn)和下午 4點(diǎn)的業(yè)務(wù)區(qū)別。2.3.2.3. 智能策略實(shí)現(xiàn)管理實(shí)例落地BTSO 將運(yùn)維數(shù)據(jù)產(chǎn)生且具有固定分析和處理邏輯的運(yùn)維方法,歸類為智能策略需要處28/91技術(shù)方案理的方法;通過策略的應(yīng)用,可以進(jìn)一步提高運(yùn)維效率和運(yùn)行成效。BTSO 內(nèi)置了眾多的智維策略,提供標(biāo)準(zhǔn)的管理實(shí)例落地,通過客戶化開發(fā)實(shí)現(xiàn)用戶處理經(jīng)驗(yàn)

41、的快速落地;系統(tǒng)對于所有管理指標(biāo)均可實(shí)現(xiàn)基礎(chǔ)分析方法,當(dāng)發(fā)現(xiàn)異常后,及時(shí)了解該異常指標(biāo)的管理意義和影響范圍,以及歷史情況,這樣將原本專業(yè)性過強(qiáng)的指標(biāo)一下子拉進(jìn)到可理解可運(yùn)維的角度;系統(tǒng)對于主機(jī)類兩個(gè)重要問題“負(fù)載過高”“內(nèi)存泄露”進(jìn)行了專項(xiàng)分析,這兩個(gè)問題特征,進(jìn)程分析,進(jìn)一步造成這兩個(gè)問題的具體業(yè)務(wù)進(jìn)程,為用戶解決系統(tǒng)問題提供有數(shù)據(jù)、有結(jié)論的;系統(tǒng)對于數(shù)據(jù)的性能問題“內(nèi)核延遲”“設(shè)備延遲”做了專項(xiàng)分析,另外對于集群、宿主機(jī)、虛擬機(jī)、數(shù)據(jù)的 24 個(gè)關(guān)鍵性能指標(biāo)提供自動(dòng)分析,當(dāng)發(fā)現(xiàn)異常越界比例過高時(shí),系統(tǒng)會(huì)主動(dòng)以專題性分析報(bào)告的方式告知用戶,列出歷史分析數(shù)據(jù),便于用戶更深入了解問題本質(zhì) ,同時(shí)

42、給出了具體解決這個(gè)問題的方案,從而使用戶在第一時(shí)間能將影響范圍縮到最?。煌ㄓ弥笜?biāo)越界策略,如同上述數(shù)據(jù)庫指標(biāo)一樣,通過對于歷史數(shù)據(jù)的分析回顧,智能分析出指標(biāo)與歷史基準(zhǔn)(具體風(fēng)險(xiǎn)閾值的差異),主動(dòng)提示用戶異常風(fēng)險(xiǎn),并同時(shí)告知該指標(biāo)的意義以及異常的處理建議;該策略可覆蓋所有類型的指標(biāo),包括主機(jī)、網(wǎng)絡(luò)、數(shù)據(jù)庫等,用戶也可通過該策略關(guān)注業(yè)務(wù)相關(guān)的特殊指標(biāo),以完成策略的本地化應(yīng)用;29/91技術(shù)方案圖:異常情況分析與處理建議2.3.3.系統(tǒng)智能運(yùn)維傳統(tǒng)系統(tǒng)的方式為告警,但是面對設(shè)備日趨完善,管理對象超過閾值的告警越來越少,如何實(shí)現(xiàn)運(yùn)維價(jià)值的最大化呢?這是擺在運(yùn)維管理主管面前的最大課題。北塔公司結(jié)合用戶運(yùn)

43、維實(shí)際情況,發(fā)現(xiàn)運(yùn)維價(jià)值最大化的方式有如下方面:u通過事前隱患智能分析,主動(dòng)排除,即時(shí)通知,將故障發(fā)生概率降到最低;u對于部分故障實(shí)現(xiàn)自動(dòng)化分析和處置,縮短故障處置周期,避免損失擴(kuò)大化;u落實(shí)每個(gè)運(yùn)維主管的對于自身企業(yè)的個(gè)性化管理要求;BTSO 適時(shí)推出了智能運(yùn)維管理,為用戶落實(shí)如上 3 點(diǎn)訴求,提供管理功能。2.3.3.1.預(yù)置智維管理方案BTSO管理方式就是智能化管理,智能化的理論基礎(chǔ)是北塔十幾年的運(yùn)維經(jīng)驗(yàn)和幾千家用戶的管理實(shí)踐,為把這些管理方案推送到用戶現(xiàn)場,BTSO 提供了智能運(yùn)維模板。智維模板按照管理等級(jí),預(yù)置了不同管理對象的管理方案,方案包含如下技術(shù)點(diǎn):u內(nèi)置監(jiān)測方案,包含指標(biāo)的多

44、寡,具體指標(biāo)的周期、監(jiān)測閾值,便于對系統(tǒng)自行巡檢相關(guān)數(shù)據(jù);u提供了預(yù)置告警規(guī)則給用戶進(jìn)行選擇,用戶可以根據(jù)業(yè)務(wù)管理實(shí)踐的不同啟用相應(yīng)的告警管理規(guī)則;u提供常見管理報(bào)表,并生成高級(jí)別對象的管理報(bào)表。通過上述智維模板,使軟件無需復(fù)雜配置,安裝就能對進(jìn)行基礎(chǔ)運(yùn)維。2.3.3.2. 智維對于預(yù)置方案,BTSO 不僅提供自動(dòng)檢測過程,也提供了前端巡查功能,使用戶能實(shí)時(shí)了解到智維的實(shí)時(shí)動(dòng)態(tài);對于智維巡查結(jié)果,以方式存在,此類并整描述了故障或異常,所以 BTSO 推薦以統(tǒng)計(jì)角度進(jìn)行評(píng)價(jià),以越界比例作為觀測的切入點(diǎn)。同時(shí)系統(tǒng)提供詳盡智維分析工具,包含智維信息的統(tǒng)計(jì)、智維異常分布、歷史值檢查等,結(jié)合此類工具實(shí)現(xiàn)

45、異常的關(guān)聯(lián)分析和確認(rèn)。30/91技術(shù)方案2.3.3.3. 智維越界提醒策略BTSO 預(yù)置多種預(yù)置策略,基礎(chǔ)策略是對于內(nèi)置方案的提醒策略,對于智維越界,當(dāng)系統(tǒng)發(fā)現(xiàn)內(nèi)置檢測指標(biāo),越界超出安全頻率后,主動(dòng)推送到頁面前端,通知管理員,系統(tǒng)發(fā)現(xiàn)了異常。提示內(nèi)容中包含最近 3 日,發(fā)生異常的次數(shù)并且給出該指標(biāo)的歷史曲線;同時(shí)給出該指標(biāo)的詳細(xì)定義,清晰的列明,該指標(biāo)是什么,異常后影響什么,一般的解決方案是什么。同時(shí)可對該指標(biāo)進(jìn)行快速設(shè)置告警,便于后期管理中,出現(xiàn)了相同問題后能通過、郵件通知離線用戶。31/91技術(shù)方案2.3.3.4. 客戶化分析策略定制BTSO 的智能策略基于平臺(tái)化接口體系,作為軟件的,其可

46、以調(diào)用 BTSO 軟件的各個(gè)方面,包含基礎(chǔ)數(shù)據(jù)的,指標(biāo)的計(jì)算,各類對象的綜合分析,并可以實(shí)現(xiàn)通知、報(bào)表、下發(fā)等處置策略的調(diào)用。北塔軟件基于 BTSO,通過合作開發(fā)的模式,可以實(shí)現(xiàn)用戶管理策略的自動(dòng)化,使每個(gè)用戶能使用上“貼心”的運(yùn)維軟件。2.3.4.故障管理對管理對象按照預(yù)置的風(fēng)險(xiǎn)閾值進(jìn)行檢測,并實(shí)時(shí)通知到管理員處,是運(yùn)維系統(tǒng)必備功能,也是傳統(tǒng)上運(yùn)維軟件的價(jià)值所在;而在傳統(tǒng)上故障管理在應(yīng)用上經(jīng)常會(huì)遇到如下問題:u設(shè)置告警的范圍選擇,用戶總是期望無死角,但是所有 KPI 的高頻必然導(dǎo)致管理設(shè)備的異常負(fù)載增加,這要求運(yùn)維廠商能提供合理的告警范圍推薦;u告警規(guī)則的自動(dòng)設(shè)置,往往用戶對于告警的規(guī)則和檢

47、測標(biāo)準(zhǔn)時(shí)一致的,如何實(shí)現(xiàn)相同標(biāo)準(zhǔn)的推廣,這要求運(yùn)維軟件對于規(guī)則設(shè)置的易用性;u告警的經(jīng)驗(yàn)如何總結(jié)和繼承,告警處理經(jīng)驗(yàn)?zāi)艿玫郊皶r(shí),并能在下次出現(xiàn)同問題時(shí),即時(shí)推送,便于有效提高故障處置效率。32/91技術(shù)方案BTSO 系統(tǒng)提供了靈活的告警設(shè)置、精確的告警檢測,多樣告警推送方式、簡單的告警經(jīng)驗(yàn)積累方式,實(shí)現(xiàn)用戶有效及時(shí)得到故障信息。2.3.4.1. 告警管理2.3.4.1.1.便捷的規(guī)則設(shè)置告警永遠(yuǎn)是運(yùn)維中最基礎(chǔ)的功能,對于運(yùn)維而言,總是期望告警不產(chǎn)生,那樣意味著系統(tǒng)正穩(wěn)定運(yùn)行;為了給用戶提供這個(gè)可靠的信息,BTSO 提供便捷的告警設(shè)置實(shí)現(xiàn)大面積的監(jiān)管設(shè)置;在設(shè)置界面為重點(diǎn)指標(biāo)實(shí)現(xiàn)詳盡的指標(biāo)說明,

48、使用戶面對具體技術(shù)指標(biāo)能更為合理的進(jìn)行配置。u系統(tǒng)提供多種預(yù)置告警規(guī)則u支持以 IP 為方式,為未納入管理設(shè)備規(guī)則化的告警規(guī)則u支持為某一個(gè)存在的對象為樣本,批量設(shè)置進(jìn)程、硬盤的子對象的告警u支持以 IP 網(wǎng)段方式和等級(jí)方式顯示告警的設(shè)置u支持以多種通知方式,靈活給不同的u支持對告警通知內(nèi)容恢復(fù)內(nèi)容的自定義,滿足用戶對于業(yè)務(wù)化通知內(nèi)容的實(shí)現(xiàn)2.3.4.1.2.高效的告警提醒機(jī)制BTSO 為了讓用戶能快速識(shí)別告警信息,以不同顏分不同的告警等級(jí),并在運(yùn)行摘要和頁面框架中重點(diǎn)突出顯示。用戶登陸系統(tǒng)均可了解昨日告警的處理情況,目前發(fā)生且需要處理的告警數(shù)量,同時(shí)可以看到具體告警實(shí)時(shí)條目。以及本日的停機(jī)計(jì)

49、劃,為一天的工作提供基礎(chǔ)信息。當(dāng)長期打開頁面時(shí),系統(tǒng)通過框架上的顏別顯示不同的等級(jí)告警,使值班能快速了解到具體的告警展現(xiàn)。同時(shí)系統(tǒng)提供、郵件方式,為線下管理員提供最及時(shí)的告警信息。33/91技術(shù)方案2.3.4.1.3.清晰的告警為了使告警信息更為有效,系統(tǒng)提供靈活、清晰的告警歷史界面,界面中列出了不僅列舉了歷史告警的各個(gè)字段,同時(shí)給出告警統(tǒng)計(jì)分析信息,為用戶以告警角度對現(xiàn)有對象的信息進(jìn)行評(píng)價(jià)。u系統(tǒng)提供告警時(shí)長、和累計(jì)次數(shù)為索引條件統(tǒng)計(jì),為用戶提供這個(gè)維度出現(xiàn)告警最多的管理對象和具體異常點(diǎn);u提供重復(fù)告警統(tǒng)計(jì),以及統(tǒng)計(jì)時(shí)段內(nèi)最長、平均、累積的告警時(shí)長,為用戶提供告警規(guī)則有效性評(píng)估u提供處置經(jīng)驗(yàn)的編輯功能,為用戶快速積累處置經(jīng)驗(yàn)提供管理,下一次相同問題出現(xiàn)時(shí),提供處置參考;34/91技術(shù)方案2.3.4.2. 知識(shí)庫管理用戶在長期的運(yùn)維過程中,一般均會(huì)有一些管理預(yù)案,但是如何實(shí)現(xiàn)管理經(jīng)驗(yàn)的長期積累呢?BTSO 提供處置知識(shí)庫,通過對處置預(yù)案的積累,出現(xiàn)問題后能快速實(shí)現(xiàn)信息傳導(dǎo),將處置預(yù)案真正落實(shí)到實(shí)際操作過程中。2.3.5.網(wǎng)絡(luò)管理2.3.5.1. 網(wǎng)絡(luò)拓?fù)涔芾?.3.5.1.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論