服務水平管理和服務水平協(xié)議_第1頁
服務水平管理和服務水平協(xié)議_第2頁
服務水平管理和服務水平協(xié)議_第3頁
服務水平管理和服務水平協(xié)議_第4頁
服務水平管理和服務水平協(xié)議_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

服務水平管理和服務水平合同服務水平管理和服務水平合同(SLA)-09-2008:04:37標簽:HYPERLINKSLA[HYPERLINK推送到技術圈]本文描述面對高可用性網(wǎng)絡的服務水平管理和服務水平合同(SLA)。它涉及服務水平管理的成功因素以及幫您評定成功與否的性能指標。本文以一種國際性的網(wǎng)絡具體描述遵從高可用性業(yè)務工作組擬定的最佳方案指導原則的SLA。

作者:汪澍服務水平管理概述

網(wǎng)絡公司始終以來都通過構(gòu)建堅實的網(wǎng)絡基礎設施及主動解決每個業(yè)務問題來滿足不停擴展的網(wǎng)絡規(guī)定。當業(yè)務異常中斷時,公司將構(gòu)建新流程、管理功效或基礎設施來避免這類故障再次發(fā)生。然而,由于快速變更及日益增加的可用性規(guī)定,我們現(xiàn)在需要改善模式來預先避免意外故障并快速修復網(wǎng)絡。許多服務供應商和公司始終都試圖更加好地定義服務水平方便實現(xiàn)商業(yè)目的。

核心成功因素

SLA的核心成功因素用來定義支持成功構(gòu)建可獲得的服務水平及維護SLA的重要要素。要成為合格的核心成功因素,流程或流程環(huán)節(jié)必須能夠改善SLA質(zhì)量并從整體上提高網(wǎng)絡的可用性。核心成功因素還應含有可測量性,方便使公司能夠判斷:與定義的程序相比,它所獲得的成功程度。

性能指標

性能指標提供了公司測量核心成功因素的機制。您普通需要每月審查一次,以確保服務水平定義或SLA運行良好。網(wǎng)絡運行小組及必要的工具組可實施下列測量原則。

注意:對于沒有SLA的公司,我們建議您同時實施服務水平定義、服務水平審核及測量原則。

性能指標涉及:統(tǒng)計的服務水平定義或SLA,涉及可用性、性能、主動業(yè)務應答時間、排障目的及問題升級等。月度網(wǎng)絡服務水平審核會議,審核對服務水平的執(zhí)行狀況并實施改善。性能指標測量原則,涉及可用性、性能、按優(yōu)先級劃分的業(yè)務應答時間、按優(yōu)先級劃分的排障時間以及其它可測量的SLA參數(shù)。服務水平管理流程

面對服務水平管理的高級別流程重要涉及兩組:

1.定義網(wǎng)絡服務水平

2.創(chuàng)立并維護SLA

實施服務水平管理

實施服務水平管理涉及十六步,分為下列兩個重要范疇:定義網(wǎng)絡服務水平—環(huán)節(jié)1-6創(chuàng)立并維護SLA—環(huán)節(jié)7-16定義網(wǎng)絡服務水平

網(wǎng)絡管理人員需要定義支持、管理并測量網(wǎng)絡的重要規(guī)則。服務水平為全部網(wǎng)絡人員提供目的并可用作整體業(yè)務質(zhì)量的測量原則。您也可將服務水平定義用作網(wǎng)絡資源預算工具以及投資于更高服務質(zhì)量的證據(jù)。它們還提供評定供應商及運行商的體現(xiàn)的辦法。

如果沒有服務水平定義和測量,公司不可能制訂明確的目的。服務與否滿意由顧客決定,在應用、服務器/客戶機運行或網(wǎng)絡支持方面并無明顯差距。由于公司對最后成果沒有把握,因此很難作預算。最后,網(wǎng)絡公司在提高網(wǎng)絡及支持模式方面都趨向于選擇被動應答,而非主動防止的方式。

我們建議采用下列環(huán)節(jié)來構(gòu)建并支持服務水平模式:分析技術目的及限制因素。擬定可用性預算。創(chuàng)立具體統(tǒng)計核心應用網(wǎng)絡特性的應用資料庫。定義可用性、性能衡量原則及通用術語。創(chuàng)立服務水平定義,涉及可用性、性能、業(yè)務應答時間、排障平均時、故障檢測、升級門限及上報途徑。收集測量原則并監(jiān)控服務水平定義。第1步:分析技術目的及限制因素

開始分析技術目的和限制因素的最佳方式是集體討論或研究技術目的與規(guī)定。由于這些人都有特定的業(yè)務目的,因此有時這有助于規(guī)定其它IT技術人員參加討論。技術目的涉及可用性級別、吞吐量、抖動、延遲、應答時間、可用性規(guī)定、新特性的推出、新應用的推出、安全性、可管理性及成本等。隨即,公司應研究限制因素,方便使用可用資源實現(xiàn)這些目的。您可為每個目的創(chuàng)立帶有對限制因素解釋的工作表。最初看似大多數(shù)目的都無法實現(xiàn)。隨即劃分目的的優(yōu)先級或減少對仍可滿足商業(yè)規(guī)定的目的的盼望值。

例如,您制訂的可用性級別可能是99.999%,或每年5分鐘的故障停機時間。實現(xiàn)這一目的存在大量限制因素,如硬件的單點故障、遠程位置中的故障硬件的平均修復時間(MTTR)、運行商可靠性、預先故障檢測、高變更率及現(xiàn)在網(wǎng)絡容量限制等。因此,您需要將這個目的調(diào)節(jié)到更加易于實現(xiàn)的級別。下個章節(jié)中介紹的可用性模式可幫您制訂現(xiàn)實的目的。

您可能也考慮在限制因素相對較少的網(wǎng)絡領域提供可用性。當網(wǎng)絡公司公布業(yè)務的可用性原則時,公司中的各業(yè)務部門可能發(fā)現(xiàn)無法接受這個級別的可用性。這自然而然引發(fā)對SLA的討論,或為可滿足商業(yè)規(guī)定的模式進行投資/做預算。

擬定全部限制因素或風險的工作涉及要實現(xiàn)技術目的。根據(jù)實現(xiàn)抱負目的的最大風險或影響方面劃分限制因素的優(yōu)先級。這可協(xié)助公司擬定網(wǎng)絡改善計劃的優(yōu)先次序,并擬定解決限制因素的難易程度。限制因素分三類:網(wǎng)絡技術、故障恢復能力和配備生命周期方案,涉及:規(guī)劃、設計、實施和運行現(xiàn)在的話務負載或應用行為網(wǎng)絡技術、故障恢復能力及配備限制因素是指與現(xiàn)在技術、硬件、鏈路、設計或配備有關的任何限制因素或風險。技術限制因素指技術本身造成的任何限制。例如,現(xiàn)在沒有一種技術允許冗余網(wǎng)絡環(huán)境中實現(xiàn)少于1秒的聚合時間,而這恰恰是維持整個網(wǎng)絡上的話音連接的核心。另一種例子是數(shù)據(jù)通過地面鏈路時的原始速度,大概是100英里/毫秒。

網(wǎng)絡硬件故障恢復能力風險調(diào)查應集中在硬件拓撲、分級體系、模塊化、冗余、MTBF及定義的途徑這幾方面。網(wǎng)絡鏈路限制因素應強調(diào)公司網(wǎng)絡鏈路及運行商連接。鏈路限制因素可能涉及鏈路冗余和多樣性、媒介限制、布線基礎設施、本地環(huán)路連接性以及長距離連接性。設計限制因素與網(wǎng)絡的物理或邏輯設計有關,涉及從為設備可用空間到路由合同實施的可擴展性等各個方面。您應在配備、可用性、可擴展性、性能及容量方面考慮全部合同和媒介設計。動態(tài)主機配備合同(DHCP)、域名系統(tǒng)(DNS)、防火墻、合同轉(zhuǎn)換及網(wǎng)絡地址轉(zhuǎn)換等網(wǎng)絡業(yè)務限制因素也應列入考慮之列。

生命周期方案定義用于實現(xiàn)解決方案的統(tǒng)一布署、檢測和修復故障、避免容量或性能問題以及配備一致性和模塊化的網(wǎng)絡流程和管理。您需要認真考慮這個領域,由于專業(yè)技術和流程普通是造成不可用性的最大影響因素。網(wǎng)絡生命周期指規(guī)劃、設計、實施和運行周期。在每個階段中,您都必須理解性能管理、配備管理、故障管理及安全性等網(wǎng)絡管理功效。思科NSA高可用性服務部(HAS)提供網(wǎng)絡生命周期評定服務,擬定與網(wǎng)絡生命周期方案有關的現(xiàn)在網(wǎng)絡可用性限制因素。

現(xiàn)在的話務量或應用限制因素只是指現(xiàn)在話務和應用的影響。

不幸的是,許多應用都帶有大量需要謹慎管理的限制因素。現(xiàn)在應用的抖動、延遲、吞吐量及帶寬規(guī)定普通帶有許多限制因素。編寫應用的方式也可能產(chǎn)生某些限制因素。匯編應用資料庫可幫您更加好地理解這些問題;下文將介紹這一特性。研究現(xiàn)在的可用性、話務、容量及性能還可協(xié)助網(wǎng)絡管理人員理解現(xiàn)在的服務水平目的及風險。這一工作常通過名為網(wǎng)絡基準制訂的流程來完畢,該流程可幫您定義規(guī)定時段內(nèi)(普通是一種月)的平均網(wǎng)絡性能、可用性或容量。這些信息普通用于容量規(guī)劃和趨勢分析,但也可用來理解服務水平問題。

下面的工作表使用了上述目的/限制因素辦法來實現(xiàn)避免安全性攻擊或回絕服務攻擊(DoS)的目的。您也可使用該工作表來決定可最大程度地減少安全性攻擊的業(yè)務范疇。風險或限制因素限制因素類型潛在影響可用的DoS檢測工具無法檢測出全部DoS攻擊類型。技術/故障恢復能力高不含有對告警做出對應所需的人員和流程。生命周期方案高現(xiàn)在網(wǎng)絡接入方略未加執(zhí)行。生命周期方案普通如果運用帶寬擁塞來發(fā)動攻擊,則現(xiàn)在的低帶寬互聯(lián)網(wǎng)連接成為限制因素。網(wǎng)絡容量普通協(xié)助避免攻擊的現(xiàn)在安全性配備不完善。技術/故障恢復能力普通第2步:擬定可用性預算

可用性預算是盼望在定義的兩點間出現(xiàn)的、理論上的網(wǎng)絡可用性。精確的理論信息可在多個方面發(fā)揮作用:公司可將其視為內(nèi)部可用性目的,并且能夠立刻定義偏離并進行補救。網(wǎng)絡規(guī)劃人員可使用這些信息來擬定系統(tǒng)的可用性,以確保設計滿足商業(yè)規(guī)定。造成不可用性或故障停機的因素涉及軟硬件故障、電源和環(huán)境問題、鏈路或運行商故障、網(wǎng)絡設計、人為錯誤或缺少流程等。在評定網(wǎng)絡的整體可用性預算時,您必須嚴格評定上述的全部參數(shù)。

如果公司現(xiàn)在正在測量可用性,則可能不需要可用性預算。用可用性測量原則作為基準來評定服務水平定義使用的現(xiàn)在服務水平。然而,您可將兩者進行對比,方便理解潛在的理論可用性與實際測量成果間的差距。

可用性指產(chǎn)品或業(yè)務在需要時投入運行的可能性。參見下列定義:

a.可用性

¨1-(總的連接中斷時間)/(總服務連接時間)

¨1-[總和(業(yè)務中斷期間受影響的連接數(shù)量X業(yè)務中斷時間)]/(運行的連接數(shù)量X運行時間)

b.不可用性

1-由下列因素造成的可用性或總的連接中斷時間:軟硬件故障、電源和環(huán)境問題、鏈路和運行商故障、網(wǎng)絡設計、顧客錯誤及流程故障等。

c.硬件可用性

首先需要研究的領域是潛在硬件故障及其對不可用性的影響。要擬定這方面的影響,公司應理解全部網(wǎng)絡組件的MTBF以及MTTR,以擬定兩點間的途徑中全部設備的潛在硬件問題。如果網(wǎng)絡采用模塊化和分級體系構(gòu)造,則幾乎任意兩點間的硬件可用性都是相似的。MTBF信息可用于全部思科組件,并且可根據(jù)請求、向本地客戶經(jīng)理提供。CiscoNSAHAS項目還使用一種工具來協(xié)助擬定硬件可用性及網(wǎng)絡途徑,即使在系統(tǒng)中存在模塊冗余、機底冗余及途徑冗余時也能夠使用這種工具。硬件可靠性的一種重要因素是MTTR。公司應評定它們修復故障硬件的速度。如果公司未制訂備用方案,只依賴于原則CiscoSMARTnet?合同,則潛在的評定硬件更換時間為24小時。在帶有核心冗余但不帶有接入。

冗余的典型LAN環(huán)境中,適宜的可用性是99.99%,平均修復時間是4-小時。

d.軟件可用性

下一種需要研究的領域是軟件故障。出于測量的目的,思科將軟件故障定義為由軟件錯誤引發(fā)的設備冷啟動。思科已經(jīng)開發(fā)出許多流程來協(xié)助理解軟件的可用性;然而,更新的版本尚需一段時間進行測量,并且我們認為它的可用性不及普通的布署軟件。IOS11.2版(18)等普通布署軟件經(jīng)測量,證明含有99.9999%的可用性。這個數(shù)字是基于修復時間為六分鐘(路由器重新裝載的時間)的思科路由器的實際冷啟動次數(shù)來計算的。采用不同版本的公司,可用性將隨著復雜性的增加、互操作性的增強以及排障時間的縮短略有減少。采用最新軟件版本的公司,不可用性將有所提高。不可用性的分派也相稱廣泛,這意味著客戶將感覺到很高的不可用性或靠近普通布署版本的可用性。

e.環(huán)境和電源的可用性

您還必須考慮環(huán)境和電源的可用性問題。環(huán)境問題與將設備保持在特定的運行溫度范疇內(nèi)的冷卻系統(tǒng)的故障有關。當溫度大大超出技術指標時,許多思科設備只是停止運轉(zhuǎn),而不會損害全部硬件。出于可用性預算的目的,您必須將電源考慮在內(nèi),由于它是造成本領域中不可用性的重要因素。

即使電源故障是造成網(wǎng)絡不可用性的重要因素,但對它的討論還是受到限制,這是由于無法進行精確的、理論上的電源分析。公司必須基于所在地區(qū)的經(jīng)驗、電源備份功效以及實施的流程,對其設備的電源可用性的大概測量成果進行評定,以確保為全部設備提供含有一致質(zhì)量的電源。

基于保守的預計,我們能夠認為配備了備用發(fā)電機、不間斷供電電源(UPS)系統(tǒng)并采用合格電源實施流程的公司,可實現(xiàn)高達六個九(99.9999%)的可用性,而未配備這些系統(tǒng)的公司,其可用性僅為99.99%,或者說每年有36分鐘的故障停機時間。固然,您可根據(jù)公司的觀察或?qū)嶋H數(shù)據(jù)來調(diào)節(jié)這些數(shù)值,使其更真實地反映公司的具體狀況。

f.鏈路或運行商故障

鏈路和運行商故障是影響WAN環(huán)境中的可用性的重要因素。切記:WAN環(huán)境只是同公司網(wǎng)絡遭遇同樣可用性問題的其它網(wǎng)絡,涉及:軟硬件故障、顧客錯誤及電源故障等。

許多運行商網(wǎng)絡都已經(jīng)開始對系統(tǒng)進行可用性預算,但獲得這些信息并不容易。切記,運行商的可用性確保級別極少基于或根本不基于實際可用性預算。這些確保級別有時只是用來提高運行商出名度的營銷和銷售辦法。在某些狀況下,這些網(wǎng)絡還公布看似互相突出的可用性統(tǒng)計數(shù)據(jù)。切記,這些統(tǒng)計數(shù)據(jù)可能只合用于完全冗余的核心網(wǎng)絡,而不作為造成不可用性的因素(不可用性由本地環(huán)路接入引發(fā)),本地環(huán)路接入才是WAN網(wǎng)絡中不可用性的重要因素。

對WAN環(huán)境進行可用性評定應基于實際的運行商信息以及WAN連接的冗余級別。如果公司擁有多個大樓入口設施,冗余本地環(huán)路供應商、同時光網(wǎng)絡(SONET)本地接入、以及分布在多個地區(qū)的冗余長途運行商,則WAN的可用性將得到明顯增強。

電話業(yè)務是WAN環(huán)境中、非冗余網(wǎng)絡連接相稱精確的可用性預算。使用類似于本文所描述的可用性預算辦法進行測量,電話業(yè)務的端到端連接的可用性預算大概為99.94%。這種辦法業(yè)已成功應用于數(shù)據(jù)環(huán)境中,成果基本相似,現(xiàn)在正被用作服務供應商有線網(wǎng)絡中分組有線規(guī)程的預算。如果將該數(shù)值用于完全冗余的系統(tǒng),則我們能夠假定,WAN可用性會靠近99.9999%。固然,由于成本及可用性問題,現(xiàn)在極少有哪家公司布署了分布在多個地區(qū)且完全冗余的WAN系統(tǒng),因此應使用適宜的判斷辦法測定這種功效。

LAN環(huán)境中不太可能發(fā)生鏈路故障,然而,規(guī)劃人員可能但愿假定連接器斷開或松動會引發(fā)短時間的故障停機。對LAN網(wǎng)絡而言,保守的可用性預計約為99.9999%,或大概30秒故障停機/年。

g.網(wǎng)絡設計

網(wǎng)絡設計是影響可用性的另一種重要因素。不可擴展的設計、設計錯誤及網(wǎng)絡聚合時間都會對可用性產(chǎn)生負面影響。

注意:出于本文的目的,我們將在下面的篇幅中描述不可擴展的設計或設計錯誤。

網(wǎng)絡設計被限定在可測量的數(shù)值上(基于網(wǎng)絡中造成話務重新路由的軟硬件故障)。這些數(shù)值普通被稱作“系統(tǒng)故障切換時間”,并且是系統(tǒng)中自治愈合同功效的影響因素。

使用與系統(tǒng)計算相似的辦法便可計算可用性。然而,它只有在網(wǎng)絡故障切換時間滿足網(wǎng)絡應用規(guī)定時才有效。如果故障切換時間能夠接受,則不把它計算在內(nèi)。如果故障切換時間不能接受,則計算時必須將其考慮在內(nèi),例如:預計或?qū)嶋H的故障切換時間為30秒的環(huán)境中下的IP話音(VoIP)。在這個例子中,顧客只是掛斷電話,并有可能重新?lián)芙小n櫩捅囟〞⑦@30秒看作是非可用時段,但在可用性預算時卻未加考慮。

根據(jù)系統(tǒng)故障切換時間來計算不可用性時要著眼于理論的軟硬件可用性以及冗余途徑,由于故障切換將出現(xiàn)在這個領域。您必須理解可能發(fā)生故障并造成冗余途徑中出現(xiàn)故障切換的設備數(shù)量,這些設備的MTBF以及故障切換時間。一種簡樸的例子就是,冗余的相似設備中,每臺設備的MTBF為35433小時,故障切換時間為30秒。用35,433除以8766(年平均小時數(shù),涉及閏年),我們能夠看出該設備每四年出現(xiàn)一次故障。如果使用30秒作為故障切換時間,我們便能夠假設:由于故障切換,每臺設備每年平均停機7.5秒。由于顧客可能會跨兩條途徑,因此需要將此成果乘以2,即:每年15秒。當以秒/每年進行計算時,這個簡樸系統(tǒng)中由于故障切換引發(fā)的可用性的計算成果為99.99999785%。由于可能出現(xiàn)故障切換的網(wǎng)絡中的冗余設備數(shù)量,在其它環(huán)境中,這個數(shù)字可能還要略高些。

h.顧客錯誤和流程

顧客錯誤和流程可用性問題是造成公司和運行商網(wǎng)絡中不可用性的重要因素。約80%的不可用性問題是由于無法檢測錯誤、變化故障及性能問題造成的。

公司在制訂可用性預算時,不樂意接受顧客錯誤和流程引發(fā)的不可用性是其它全部理論上的不可用性的四倍這一實施,然而,多種證據(jù)一致表明,這種狀況存在于許多環(huán)境中。下面我們將具體論述不可用性的這個方面。

由于您無法從理論上計算由顧客錯誤和流程引發(fā)的不可用性數(shù)量,我們建議您在制訂公司力求完美的可用性預算時不將其考慮在內(nèi)。但公司必須理解其流程和專業(yè)技術水平中現(xiàn)在所面臨的可用性風險。透徹地理解了這些風險及克制因素之后,網(wǎng)絡規(guī)劃人員便有可能將這些問題引發(fā)的一定數(shù)量的不可用性考慮在內(nèi)。CiscoNSAHAS項目進一步研究了這些問題,并可協(xié)助公司理解由于流程、顧客錯誤或?qū)I(yè)技術問題引發(fā)的不可用性。

i.制訂最后的可用性預算

您可將以前定義的全部領域的可用性相乘來決定整個可用性預算。這種辦法普通合用于任意兩點間的連接相類似的同機種環(huán)境,如:分級體系模塊化LAN環(huán)境或分級體系原則WAN環(huán)境等。

這下面的例子中,為分級體系模塊化LAN環(huán)境擬定了可用性預算。該環(huán)境為全部網(wǎng)絡組件都配備了備用發(fā)電機和UPS系統(tǒng),并對電源進行適宜的管理。公司未使用VoIP,也不但愿將軟件故障切換時間考慮在內(nèi)。估算成果以下:兩個端點間的硬件途徑可用性=99.99%使用GD軟件可靠性作為基準的軟件可用性=99.9999%帶有備用系統(tǒng)的環(huán)境和電源可用性=99.999%考慮LAN環(huán)境中的鏈路故障的可用性=99.9999%未將系統(tǒng)故障切換時間計算在內(nèi)的可用性=100%認為不存在顧客錯誤和流程缺點的可用性=100%公司但愿達成的最后可用性預算是:0.9999X0.999999X0.999999X0.999999=0.999896,或99.9896%的可用性。如果我們將顧客或流程錯誤引發(fā)的潛在不可用性考慮在內(nèi),并假設其引發(fā)的不可用性是技術因素引發(fā)的可用性的四倍,則最后可用性預算是99.95%。

對這個例子的分析使我們理解到,LAN可用性在99.95%與99.989%之間?,F(xiàn)在,這些數(shù)值能夠用作網(wǎng)絡公司的服務水平目的。能夠測量系統(tǒng)中的可用性并擬定上述六個領域分別引發(fā)的不可用性百分率來計算其它數(shù)值。這使公司能夠?qū)獭⑦\行商、流程和人員進行適宜評定。這些數(shù)值也可用來設立業(yè)務盼望值。如果您對99.95%與99.989%之間的可用性不滿意,可投資更多資源來獲得抱負的可用性級別。

網(wǎng)絡管理人員理解每個特定可用性級別的故障停機時間將大有協(xié)助。計算任何可用性級別的年故障停機時間(分鐘)的公式以下:

故障停機(分鐘)/年=525600—(可用性級別X5256)

如果可用性級別是99.95%,則成果是525600。(99.95X5256),或者相稱于222.8分鐘的故障停機。對于上述可用性定義,這等于網(wǎng)絡中全部業(yè)務連接的平均故障停機時間。

第3步:創(chuàng)立應用資料庫

應用資料庫可協(xié)助網(wǎng)絡公司理解并定義每個應用的網(wǎng)絡服務水平規(guī)定。這有助于確保網(wǎng)絡支持每個應用規(guī)定及整體網(wǎng)絡業(yè)務。當應用或服務器組指出網(wǎng)絡存在問題時,應用資料庫還可用作網(wǎng)絡服務支持的書面基準。最后,應用資料庫可將性能及可用性等應用規(guī)定與真實的網(wǎng)絡業(yè)務目的或現(xiàn)在限制因素進行對比,來調(diào)節(jié)網(wǎng)絡業(yè)務目的,使其與商業(yè)規(guī)定保持一致。這不僅對服務水平管理很重要,并且對整個網(wǎng)絡設計也相稱重要。

每次向網(wǎng)絡中添加新應用時都應創(chuàng)立應用資料庫。您還可能需要在IT應用部門、服務器管理部門以及組網(wǎng)部門間達成合同,方便為現(xiàn)有及全新業(yè)務創(chuàng)立應用資料庫,完畢用于商業(yè)應用及系統(tǒng)應用的應用資料庫。商業(yè)應用可能涉及電子郵件、文獻傳輸、Web瀏覽、醫(yī)療圖象解決或制造等。系統(tǒng)應用可能涉及軟件分發(fā)、顧客鑒權(quán)、網(wǎng)絡備份及網(wǎng)絡管理等。

網(wǎng)絡分析員及應用或服務器支持應用小組應負責創(chuàng)立應用資料庫。新應用可能規(guī)定使用合同分析程序以及含有延遲模擬功效的WAN模擬程序來適宜地劃分應用規(guī)定的特性。這有助于擬定必要帶寬、應用可用性的最大延遲及抖動規(guī)定。只要您含有所需服務器,便可在實驗室環(huán)境中開展這項工作。在VoIP等其它狀況下,涉及抖動、延遲及帶寬在內(nèi)的網(wǎng)絡規(guī)定會較好地公布,且無需再進行實驗室測試。應用資料庫應涉及下列項目:應用名稱應用類型新應用業(yè)務重要性可用性規(guī)定使用的合同和端口預計的顧客帶寬(kbps)顧客數(shù)量和位置文獻傳輸規(guī)定(涉及時間、量及端點)網(wǎng)絡故障停機影響延遲、抖動及可用性規(guī)定應用資料庫的目的是理解應用的商業(yè)規(guī)定、業(yè)務核心性以及帶寬、延遲及抖動等網(wǎng)絡規(guī)定。另外,網(wǎng)絡公司還應理解網(wǎng)絡故障停機的影響。在某些狀況下,您可能需要重啟應用或服務器,這將大幅度延長總的應用故障停機時間。完畢應用資料庫后,您可將全部網(wǎng)絡功效進行對比,并協(xié)助調(diào)節(jié)網(wǎng)絡服務水平,使其與商業(yè)和應用規(guī)定相一致。

第4步:定義可用性及性能原則

可用性及性能原則為公司制訂業(yè)務盼望值??筛鶕?jù)不同網(wǎng)絡區(qū)域或特定應用進行定義這些原則。還能夠擬定來回延遲、抖動、最大吞吐量、帶寬承諾及總體可擴展性等方面的性能。另外,為了制訂業(yè)務盼望值,公司還應謹慎定義每個業(yè)務原則,方便使致力于網(wǎng)絡工作的顧客及IT工作組能夠全方面理解業(yè)務原則以及他們與應用或服務器管理規(guī)定的關系。顧客及IT工作組還應理解如何測量業(yè)務原則。

以前服務水平定義環(huán)節(jié)的成果能夠協(xié)助制訂原則。這時,網(wǎng)絡公司應明確理解現(xiàn)在網(wǎng)絡所面臨的風險和限制因素及應用行為,并進行理論上的可用性分析或制訂可用性基準。定義業(yè)務原則合用的地理區(qū)域或應用領域,可能涉及園區(qū)LAN、本國WAN、外聯(lián)網(wǎng)及合作伙伴連接等。在某些狀況下,公司在相似區(qū)域內(nèi)的服務水平目的可能有所不同。這對公司或服務器供應商來說并不罕見。這時,它們普通基于各自的業(yè)務規(guī)定制訂不同的服務水平原則。這些在同一地理區(qū)域或服務區(qū)域中的原則有金牌、銀牌和銅牌之分。定義業(yè)務原則參數(shù)??捎眯约皝砘匮舆t是最常見的網(wǎng)絡業(yè)務原則。根據(jù)需要,還能夠涉及最大吞吐量、最低帶寬承諾、抖動、接受的錯誤率以及可擴展性功效。當審核用于測量辦法的業(yè)務參數(shù)時要特別謹慎。無論參數(shù)與否涉及在SLA中,公司都應考慮出現(xiàn)問題或業(yè)務不一致性時,如何測量并證明業(yè)務參數(shù)的可行性。完畢對業(yè)務領域和業(yè)務參數(shù)的定義后,您可使用以前環(huán)節(jié)獲得的信息來構(gòu)建業(yè)務原則圖。公司還需要定義可能使顧客和IT工作組產(chǎn)生混淆的區(qū)域。例如,來回ping的最長應答時間與在遠程位置單擊回車鍵啟動特定應用的

最長應答時間有很大區(qū)別。下表列出了美國采用的性能目的:網(wǎng)絡區(qū)域可用性目的管理辦法平均網(wǎng)絡應答時間目的可接受的最常應答時間應答時間管理辦法LAN99.99%受影響的顧客時間5毫秒內(nèi)10毫秒來回ping應答WAN99.9%受影響的顧客時間100毫秒內(nèi)(來回ping)150毫秒來回ping應答核心WAN及外聯(lián)網(wǎng)99.95%受影響的顧客時間100毫秒內(nèi)(來回ping)150毫秒來回ping應答第5步:定義網(wǎng)絡業(yè)務

這是實現(xiàn)基本的服務水平管理的最后一步;它定義您實施用于實現(xiàn)服務水平目的的被動/主動流程和管理功效。最后文獻普通被稱作“運行支持計劃”。大多數(shù)應用支持計劃只涉及被動支持規(guī)定。在高可用性環(huán)境中,公司必須考慮采用主動的管理流程,方便在網(wǎng)絡故障發(fā)生前對其進行隔離并加以解決解決??偟膩碚f,最后文獻應:描述用于實現(xiàn)服務水平目的的被動和主動流程介紹業(yè)務流程的管理方式介紹測量業(yè)務目的和業(yè)務流程的方式本部分將描述許多服務供應商和公司均需考慮的主動和被動業(yè)務定義的實例。構(gòu)建服務水平定義的目的是創(chuàng)立滿足可用性及性能目的的業(yè)務。為了實現(xiàn)上述目的,公司必須構(gòu)建業(yè)務,并謹記現(xiàn)在的技術限制因素、可用性預算及應用資料庫。特別是,公司應定義并構(gòu)建始終能夠在可用性模式規(guī)定的時間內(nèi)快速擬定并排除故障的業(yè)務。公司還必須定義可快速識別并解決潛在業(yè)務問題的業(yè)務,如果無視這些問題,將對可用性及性能產(chǎn)生負面影響。

實現(xiàn)抱負的服務水平非一朝一夕之事。專業(yè)水準低、現(xiàn)在流程限制或人員不合格等缺點將妨礙公司實現(xiàn)抱負的原則或目的,即使在完畢對以前業(yè)務環(huán)節(jié)的分析后也是如此。沒有一種辦法可將所需服務水平與抱負目的精確匹配。為了適應現(xiàn)實狀況,公司應測量業(yè)務原則及用于支持業(yè)務原則的業(yè)務參數(shù)。如果沒有達成業(yè)務目的,公司應運用業(yè)務測量原則來協(xié)助理解問題。在許多狀況下,可適宜增加預算以改善支持業(yè)務,并使這些改善功效成為實現(xiàn)抱負業(yè)務目的的必要條件。公司可能會逐步進行多次調(diào)節(jié)(涉及業(yè)務目的或業(yè)務定義),以使網(wǎng)絡業(yè)務與商業(yè)規(guī)定保持一致。

例如,當目的遠遠高于99.9%可用性時,公司可能只實現(xiàn)了99%的可用性。在服務及支持測量原則方面,公司代表發(fā)現(xiàn)硬件替代約需要24小時,遠遠高出最初的預計的4小時。另外,公司還發(fā)現(xiàn)主動管理功效受到無視且故障的冗余網(wǎng)絡設計沒有及時修復。公司發(fā)現(xiàn)的問題尚有缺少實施改善的員工等。因此,考慮減少現(xiàn)在服務目的后,公司便投資購置實現(xiàn)抱負服務水平所需的其它資源。業(yè)務定義應同時涉及主動和被動支持定義。被動定義規(guī)定公司如何解決根據(jù)顧客投訴或網(wǎng)絡管理功效中擬定已經(jīng)發(fā)生的問題。主動定義描述公司如何擬定并解決潛在的網(wǎng)絡問題,涉及修復故障的“備用”網(wǎng)絡組件、錯誤檢測、容量門限問題及升級問題等。下列提供主動與被動服務水平定義實例。

被動服務水平定義

下列的服務水平領域普通使用協(xié)助臺數(shù)據(jù)庫統(tǒng)計數(shù)據(jù)進行測量并定時審計。下表顯示公司故障嚴重程度的實例。請注意:此表不涉及解決新業(yè)務請求的方式,這項工作可通過SLA或其它應用資料庫編制及性能假設分析來完畢。如果通過相似的支持流程進行解決,新業(yè)務請求能夠數(shù)據(jù)嚴重級別5。嚴重級別1嚴重級別2嚴重級別3嚴重級別4嚴重的業(yè)務影響

LAN顧客或服務器部分停機

嚴重的WAN站點故障停機網(wǎng)絡功效的丟失或降級對業(yè)務造成嚴重影響,可能需要運行應變方法

園區(qū)LAN故障停機;5-99名顧客受到影響

國內(nèi)WAN站點故障停機

國際WAN站點故障停機

嚴重影響性能某些特定的網(wǎng)絡功效丟失或降級,如:冗余丟失等

園區(qū)LAN性能受到影響LAN冗余丟失對公司無業(yè)務影響的功效查詢或故障完畢問題嚴重性級別定義之后,定義或研究創(chuàng)立業(yè)務應答定義的支持流程??偟膩碚f,業(yè)務應答定義規(guī)定采用分級支持構(gòu)造,以及協(xié)助臺軟件支持系統(tǒng)來運用故障票跟蹤問題。同時還應為每個優(yōu)先級故障的應答時間和解決時間、按優(yōu)先級劃分的呼喊數(shù)量以及應答解決質(zhì)量制訂測量原則。定義支持流程可協(xié)助定義公司內(nèi)部每個支持級別的目的及其任務與責任。這有助于公司理解用于每個支持級別的資源規(guī)定及專業(yè)技術水平。下表舉例闡明了分級支持構(gòu)造及其問題解決指導原則。支持級別職責目的第1級支持專職協(xié)助臺支持

接聽支持電話、發(fā)放故障票、15分鐘內(nèi)解決問題、統(tǒng)計故障票并上報到第2級支持解決40%的入局呼喊第2級支持隊列監(jiān)控、網(wǎng)絡管理、工作站管理

為擬定的軟件故障發(fā)放故障票

實施

接聽第1級、供應商的電話,并上報到第3級支持

對呼喊負責,直到排障為止在第2級解決全部呼喊第3級支持必須立刻為第2級提供優(yōu)先級為1的全部故障所需的支持

同旨在SLA解決期限內(nèi)協(xié)助解決全部第2級未排除的故障不直接對故障負責下一步是擬定業(yè)務應答及排障業(yè)務定義。它為如何快速排障(涉及硬件更換在內(nèi))制訂了目的。為這個領域制訂目的是非常重要的,由于業(yè)務應答及恢復時間直會接影響網(wǎng)絡的可用性。問題解決時間也要與可用性預算保持一致。如果在制訂可用性預算時未將大量高嚴重級別的故障考慮在內(nèi),則公司隨即將需開展大量工作來理解這類故障的本源及可能的彌補辦法。詳見下表:問題嚴重級別協(xié)助臺應答第2級應答現(xiàn)場第2級硬件更換解決問題1立刻上報到第2級,網(wǎng)絡運行部經(jīng)理5分鐘2小時2小時4小時2立刻上報到第2級,網(wǎng)絡運行部經(jīng)理5分鐘4小時4小時8小時315分鐘2小時12小時24小時36小時415分鐘4小時3天3天6天除業(yè)務應答及業(yè)務排障外,還需制訂上報規(guī)定。上報表有助于確保將可用資源集中用于解決嚴重影響業(yè)務的問題??偟膩碚f,如果分析員集中精力解決問題時,他們極少重視運用其它資源來解決問題。定義何時需要其它資源有助于增進管理層對問題的認識,并有助于促成將來的主動測量或防止性測量。詳見下表:過去的時間嚴重級別1嚴重級別2嚴重級別3嚴重級別45分鐘網(wǎng)絡運行部經(jīng)理、第3級支持、聯(lián)網(wǎng)部主管1小時及時告知網(wǎng)絡運行部經(jīng)理、第3級支持、聯(lián)網(wǎng)部主管及時告知網(wǎng)絡運行部經(jīng)理、第3級支持、聯(lián)網(wǎng)部主管2小時上報副總裁、及時告知主任及網(wǎng)絡運行部經(jīng)理4小時向副總裁、主管、運行部經(jīng)理、第3級支持提交本源分析,向CEO告知未排除的故障上報副總裁,及時告知主管及網(wǎng)絡運行部經(jīng)理24小時

網(wǎng)絡運行部經(jīng)理5天網(wǎng)絡運行部經(jīng)理迄今為止,服務水平定義始終集中在運行支持部門如何在問題發(fā)生后對其采用被動方法上。運行部門數(shù)年前便制訂出了涉及上述相似內(nèi)容的運行支持計劃。然而,該方案中無視了部門如何識別問題以及他們將識別哪些故障等內(nèi)容。比較成熟的網(wǎng)絡公司試圖制訂預先擬定的網(wǎng)絡問題百分率目的來解決這個問題,而不是通過顧客故障報告或投訴來被動地擬定故障。

下表列出了公司對主動支持功效和被動支持功效的整體測量目的。網(wǎng)絡領域主動故障識別率被動故障識別率LAN80%20%WAN80%20%這為擬定更多的主動支持定義開了一種好頭,由于它測量起來很簡樸、也很容易,特別在主動檢測工具可自動生成故障票。這尚有助于將網(wǎng)絡管理工具/信息集中用于主動排障,而不是在故障發(fā)生后被動地查找本源。然而,這種辦法的重要問題在于它無法定義主動支持規(guī)定。這普通會造成主動支持管理功效間的差距并造成更大的可用性風險。

主動服務水平定義

更全方面的制訂服務水平定義辦法涉及,更具體地解釋如何7x24全天候地監(jiān)控網(wǎng)絡,以及運行部門如何7x24全天候?qū)σ讯x的網(wǎng)絡管理站(NMS)門限做出響應。鑒于管理信息站(MIB)數(shù)量的不擬定性以及提供MIB的網(wǎng)絡管理信息數(shù)量與網(wǎng)絡的運行狀況有關,因此這看上去是一項無法完畢的任務。同時,完畢這項任務需大量資源且代價非常高昂。不幸的是,這些缺點大大妨礙了我們對主動業(yè)務定義的實施,而這種實施從本質(zhì)上來說非常簡樸輕松,且只合用于可用性或性能風險極大的網(wǎng)絡。如果公司隨即看到了基本主動業(yè)務定義的價值,那么只要采用分階段實施的辦法,就能夠逐步添加更多變量,但不會對業(yè)務產(chǎn)生重大影響。

全部運行支持方案中均應涉及第一種領域的主動業(yè)務定義。該業(yè)務定義只是簡樸論述運行部門如何識別不同網(wǎng)絡區(qū)域中的網(wǎng)絡或鏈路故障并對此做出響應。沒有這個定義(或管理支持),公司可能碰到支持不穩(wěn)定、無法達成顧客盼望等問題,最后會減少網(wǎng)絡可用性。

下表顯示了公司如何針對鏈路/設備故障制訂服務定義。該實例中的公司在每天的不同時段及網(wǎng)絡區(qū)域方面有著不同的告知和響應規(guī)定。網(wǎng)絡設備或鏈路故障檢測辦法5x8

告知7x24

告知5x8

排障7x24

排障核心LANSNMP設備和鏈路輪詢陷阱NOC創(chuàng)立故障票、向負責LAN的人員發(fā)出尋呼自動向負責LAN的人員發(fā)出尋呼、LAN負責人員為核心LAN隊列創(chuàng)立故障票NOC在15分鐘內(nèi)派出LAN分析員、根據(jù)業(yè)務應答定義解決問題立刻研究并排除優(yōu)先級1和2的故障、優(yōu)先級3和4的故障排隊等待次日上午排除國內(nèi)

WANSNMP設備和鏈路輪詢陷阱NOC創(chuàng)立故障票、向負責WAN的人員發(fā)出尋呼自動向負責WAN的人員發(fā)出尋呼、WAN負責人員為核心WAN隊列創(chuàng)立故障票NOC在15分鐘內(nèi)派出WAN分析員、根據(jù)業(yè)務應答定義排障立刻研究并排除優(yōu)先級1和2的故障、優(yōu)先級3和4的故障排隊等待次日上午排除外聯(lián)網(wǎng)SNMP設備和鏈路輪詢陷阱NOC創(chuàng)立故障票、向負責合作伙伴的人員發(fā)出尋呼自動向負責合作伙伴的人員發(fā)出尋呼,合作伙伴負責人員為合作伙伴隊列創(chuàng)立故障票NOC在15分鐘內(nèi)派出合作伙伴分析員、根據(jù)業(yè)務應答定義排障立刻研究并排除優(yōu)先級1和2的故障、優(yōu)先級3和4的故障排隊等待次日上午排除其它的主動服務水平定義可分成兩類:網(wǎng)絡錯誤和容量/性能問題。只有少數(shù)網(wǎng)絡公司擁有這兩個領域的服務水平定義。因此,這些問題常被無視或無法得到統(tǒng)一解決。這對某些網(wǎng)絡環(huán)境的影響可能不大,但高可用性環(huán)境普通都需要一致的主動業(yè)務管理。

網(wǎng)絡公司但愿實現(xiàn)主動業(yè)務定義的因素諸多,重要是他們尚未基于可用性風險、可用性規(guī)劃及應用問題對主動業(yè)務定義進行規(guī)定分析,致使主動業(yè)務定義的規(guī)定及優(yōu)勢不明確,這重要是由于需要更多的資源。

第二個因素是要平衡能夠運用現(xiàn)有及新定義的資源來實施的主動管理數(shù)量。但生成這些告警就可能對可用性或性能產(chǎn)生嚴重影響。您還必須考慮事件關聯(lián)管理或流程,以確保不就同樣的問題生成多個主動故障票。最后一種因素在于:創(chuàng)立一組全新的主動告警經(jīng)常會生成以前未檢測出的初始信息流。運行部門必須為解決這些最初問題以及增加短期資源做好準備,方便解決這些以前未檢測出的問題。

第一類主動服務水平定義是網(wǎng)絡錯誤。網(wǎng)絡錯誤還可細分為系統(tǒng)錯誤(涉及軟硬件錯誤)、合同錯誤、媒介控制錯誤、精確性錯誤及環(huán)境警告。制訂服務水平定義首先要要大致理解如何檢測出這類問題、由誰負責解決問題以及故障的影響。必要時在服務水平定義中添加特定的信息或問題。您可能還需要在下列領域開展更多工作以確保成功定義:第1、2和3級支持的責任運用運行部門能夠有效開展的主開工作量來平衡網(wǎng)絡管理信息的優(yōu)先級按規(guī)定進行培訓方便確保支持人員能夠有效地解決定義的告警擬定事件關聯(lián)辦法以確保不為同樣的問題生成多個故障票統(tǒng)計特定信息或告警,以協(xié)助識別屬于第1級支持級別的事件下表是用于網(wǎng)絡錯誤的服務水平實例,協(xié)助您明確理解誰負責發(fā)送主動網(wǎng)絡故障告警、如何擬定故障以及故障影響。根據(jù)上文所述,公司尚需開展更多工作以確保成功。故障類型檢測辦法門限采用的行動軟件故障(軟件造成的故障停機)每天都使用系統(tǒng)日志查看程序?qū)徍讼到y(tǒng)日志信息

由第2級支持完畢發(fā)生任何優(yōu)先級0、1和2的故障

發(fā)生100多起優(yōu)先級3(或更高)的故障審查問題、創(chuàng)立故障票并在新問題出現(xiàn)或問題需要特別注意時派出人員解決硬件故障(硬件造成的故障停機)每天都使用系統(tǒng)日志查看程序?qū)徍讼到y(tǒng)日志信息

由第2級支持完畢任何第0、1和2優(yōu)先級別的故障的發(fā)生

發(fā)生100多起優(yōu)先級3(或更高)的故障審核問題、創(chuàng)立故障票并在新問題出現(xiàn)或問題需要特別注意時差遣人員解決合同錯誤(只合用于IP路由合同)使用系統(tǒng)日志查看程序每日審核系統(tǒng)日志信息

由第2級支持完畢發(fā)生任何優(yōu)先級0、1和2的故障

發(fā)生100多起第3優(yōu)先級(或更高)故障審核問題、創(chuàng)立故障票并在新問題出現(xiàn)或問題需要特別注意時派出人員解決媒介控制故障(只限于FDDI、POS及快速以太網(wǎng))使用系統(tǒng)日志查看程序每日審核系統(tǒng)日志信息

由第2級支持完畢任何第0、1和2優(yōu)先級別的故障的發(fā)生

發(fā)生100多起優(yōu)先級3(或更高)的故障審核問題、創(chuàng)立故障票并在新問題出現(xiàn)或問題需要特別注意時派出人員解決環(huán)境信息(電源和溫度)使用系統(tǒng)日志查看程序每日審核系統(tǒng)日志信息

由第2級支持完畢任何信息對新問題創(chuàng)立故障票并差遣有關人員解決問題精確度錯誤(鏈路輸入錯誤)每五分鐘進行一次SNMP輪詢

NOC受理的門限事件輸入或輸出錯誤

任何鏈路上、每5分鐘出現(xiàn)一次錯誤對新問題創(chuàng)立故障票并派出第2級支持人員解決問題另一類主動服務水平是性能及容量。真正的性能和容量管理涉及例外狀況管理、基準制訂與趨勢分析以及假設分析。服務水平定義只定義需要調(diào)查或更新的性能及容量的例外門限以及平均門限。隨即,能夠以某種方式將這些門限應用到三種性能和容量管理流程中。

容量及性能服務水平定義可細分成幾個類別:網(wǎng)絡鏈路、網(wǎng)絡設備、端到端性能及應用性能。制訂這些領域的服務水平定義需要含有與設備容量、媒介容量、QoS特性及應用規(guī)定的特定領域有關的淵博技術知識。出于這個因素,我們建議網(wǎng)絡設計師通過供應商輸入的信息制訂與性能和容量有關的服務水平定義。

與網(wǎng)絡錯誤相似,為容量和性能制訂服務水平定義首先應大致理解如何檢測這類故障、由誰負責排障以及故障的影響。必要時向服務水平定義中添加特定的信息或問題。您可能還需要在下列領域開展更多工作以確保成功:明確理解應用性能規(guī)定基于業(yè)務規(guī)定及總成本,對公司重要的門限值進行進一步的技術研究預算周期以內(nèi)和以外的升級規(guī)定第1、2和3級支持的責任運用運行部門能夠有效開展的主開工作量平衡的網(wǎng)絡管理信息的優(yōu)先級及危急程度按規(guī)定進行培訓方便確保支持人員理解信息或告警,并可有效地解決所定義的狀況擬定事件關聯(lián)辦法以確保不為同樣的問題生成多個故障票統(tǒng)計特定信息或告警,以協(xié)助識別屬于第1級支持的事件下表是面對鏈路使用狀況的服務水平定義實例,協(xié)助您明確理解誰負責發(fā)送主動網(wǎng)絡故障告警、如何擬定故障以及故障影響。公司仍需開展上面定義的更多工作以確保成功。網(wǎng)絡領域/媒介檢測辦法門限采用的行動園區(qū)LAN骨干及分派鏈路五分鐘進行一次SNMP輪詢

核心及分派鏈路上的RMON例外陷阱每五分鐘的使用率為50%

通過例外陷阱實現(xiàn)90%的使用率向性能和容量電子郵件別名發(fā)送電子郵件告知

安排小組組解決問題或制訂升級計劃國內(nèi)WAN鏈路五分鐘進行一次SNMP輪詢每五分鐘的使用率為75%向性能電子郵件別名發(fā)送電子郵件告知

安排工作組評定QoS規(guī)定或為重復出現(xiàn)的故障制訂升級計劃外聯(lián)網(wǎng)WAN鏈路五分鐘進行一次SNMP輪詢每五分鐘的使用率為65%向性能和容量電子郵件別名發(fā)送電子郵件告知

安排工作組評定QoS規(guī)定或為重復出現(xiàn)的故障制訂升級計劃下表給出了設備容量和性能門限的服務水平定義,以確保您創(chuàng)立對避免出現(xiàn)網(wǎng)絡故障或可用性問題故意義、很有用的門限。這是一種非常重要的領域,由于未檢測出的設備控制板資源問題可對網(wǎng)絡造成嚴重影響。設備重要信息檢測辦法門限采用的行動Cisco7500CPU、內(nèi)存、顯卡五分鐘進行一次SNMP輪詢

面對CPU的RMON告知五分鐘內(nèi)的CPU使用率門限是75%,達成99%時,運用RMON發(fā)出告知五分鐘內(nèi)的內(nèi)存使用率門限是50%、顯卡使用率門限是99%向性能和容量電子郵件別名工作組發(fā)送電子郵件告知方便解決問題或制訂升級計劃RMONCPU為99%,發(fā)放故障票并向第2級支持人員發(fā)送尋呼Cisco2600CPU、內(nèi)存、五分鐘進行一次SNMP輪詢五分鐘內(nèi)的CPU使用率門限是75%五分鐘內(nèi)的內(nèi)存使用率門限是50%向性能和容量電子郵件別名工作組發(fā)送電子郵件告知方便解決問題或制訂升級計劃Catalyst?5000背板使用狀況、內(nèi)存五分鐘進行一次SNMP輪詢背板使用率門限是50%

內(nèi)存使用率門限是75%向性能和容量電子郵件別名工作組發(fā)送電子郵件告知方便解決問題或制訂升級計劃LightStream?1010ATM

switchCPU、內(nèi)存五分鐘進行一次SNMP輪詢CPU使用率門限是65%

內(nèi)存使用率門限是50%向性能和容量電子郵件別名工作組發(fā)送電子郵件告知方便解決問題或制訂升級計劃下表給出了端到端性能和容量的服務水平定義。這些門限值普通基于應用規(guī)定,但也可用于批示某類網(wǎng)絡性能或容量問題。由于測量網(wǎng)絡中任意兩點間的性能需要大量資源并會帶來大量的網(wǎng)絡開銷,因此大多數(shù)有性能服務水平的公司都只創(chuàng)立少數(shù)性能定義。這些端到端的性能問題也可能出現(xiàn)在鏈路或設備容量門限中。我們建議根據(jù)地理位置制訂普通定義。必要時需添加某些核心站點及鏈路。網(wǎng)絡領域/媒介測量辦法門限采用的行動園區(qū)LAN無

不會出現(xiàn)問題

很難測量整個LAN基礎設施始終確保10-毫秒或更短的來回響應時間或向性能和容量電子郵件別名工作組發(fā)送電子郵件告知方便解決問題或制訂升級計劃國內(nèi)WAN鏈路現(xiàn)在只使用互聯(lián)網(wǎng)監(jiān)視器(IPM)和ICMP回聲完畢從SF到NY以及從SF到芝加哥的測量五分鐘內(nèi)平均來回應答時間為75-毫秒向性能電子郵件別名工作組發(fā)送電子郵件告知,方便評定QoS規(guī)定或為重復出現(xiàn)的故障制訂升級計劃舊金山到東京現(xiàn)在只使用互聯(lián)網(wǎng)監(jiān)視器(IPM)和ICMP回聲完畢從舊金山到布魯塞爾的測量五分鐘內(nèi)平均來回應答時間為250-毫秒向性能電子郵件別名工作組發(fā)送電子郵件告知,方便評定QoS規(guī)定或為重復出現(xiàn)的故障制訂升級計劃舊金山到布魯塞爾現(xiàn)在只使用互聯(lián)網(wǎng)監(jiān)視器(IPM)和ICMP回聲完畢從舊金山到布魯塞爾的測量五分鐘內(nèi)平均來回應答時間為175-毫秒向性能電子郵件別名工作組發(fā)送電子郵件告知,方便評定QoS規(guī)定或為重復出現(xiàn)的故障制訂升級計劃服務水平定義的最后一種領域是應用性能。由于服務器本身的性能和容量可能是應用性能的最大影響因素,因此應用性能的服務水平定義普通由應用或服務器管理部門制訂。網(wǎng)絡公司可通過為應用性能創(chuàng)立服務水平定義獲得巨大收益,由于:服務水平定義及測量有助于消除部門間的沖突。如果已為核心應用配備了QoS并將其它話務視為可選,則每個應用的服務水平定義都非常重要。如果您選擇創(chuàng)立并測量應用性能,最佳不要測量服務器本身的性能。這將有助于將網(wǎng)絡故障與應用或服務器故障辨別開來。使用運行在思科路由器上的探針或系統(tǒng)可用性代理軟件以及控制數(shù)據(jù)包類型及測量頻率的IPM控制。

下表給出了用于應用性能的簡樸服務水平定義。應用測量辦法門限采用的行動公司資源規(guī)劃(ERP)應用

TCP端口1529

布魯塞爾到SF使用IPM測量端口1529來回性能來完畢從布魯塞爾到舊金山的測量,布魯塞爾網(wǎng)關到SFO網(wǎng)關2五分鐘內(nèi)平均來回應答時間為175-毫秒向性能電子郵件別名工作組發(fā)送電子郵件告知,方便評定問題或為重復出現(xiàn)的問題制訂升級計劃RP應用

TCP端口1529

東京到SF使用IPM測量端口1529來回性能來完畢從布魯塞爾到舊金山的測量布魯塞爾網(wǎng)關到SFO網(wǎng)關2五分鐘內(nèi)平均來回應答時間為200-毫秒向性能電子郵件別名工作組發(fā)送電子郵件告知,方便評定問題或為重復出現(xiàn)的問題制訂升級計劃客戶支持應用

TCP端口1702

悉尼到SF使用IPM測量端口1702來回性能來完畢從悉尼到舊金山的測量悉尼網(wǎng)關到SFO網(wǎng)關1五分鐘內(nèi)平均來回應答時間為250-毫秒向性能電子郵件別名工作組發(fā)送電子郵件告知,方便評定問題或為重復出現(xiàn)的問題制訂升級計劃第6步:收集測定原則和監(jiān)控

服務水平定義本身并無多大價值,只有在公司收集測定原則和監(jiān)控與否成功時才干體現(xiàn)出價值。在定義核心服務水平的過程中要定義其測定方法和報告方式。測定服務水平可擬定公司與否在實現(xiàn)目的,還能夠擬定造成可用性和性能問題的根本因素。另外,在選擇服務水平定義的測定辦法時,還要考慮到定義的目的。有關更多信息請參閱“制訂和維護服務水平合同(SLA)”。

監(jiān)控服務水平需要定時召開總結(jié)會議以對業(yè)務進行階段性的討論,普通每月召開一次這樣的會議。討論內(nèi)容涉及全部測定原則以及這些原則與否與目的一致。如果存在不一致,找出問題的根本因素,并進行改善。討論內(nèi)容還應涉及現(xiàn)在的計劃和具體案例的進展狀況。

制訂和維護服務水平合同

服務水平定義是抱負的構(gòu)成部分,由于它有助于在整個公司范疇內(nèi)建立一種統(tǒng)一的服務質(zhì)量和提高可用性。下一步是作為一項改善成果的服務水平合同,這是由于通過這一步能夠?qū)⒐灸康暮统杀疽?guī)定直接與業(yè)務質(zhì)量相協(xié)調(diào)統(tǒng)一。然后,合理計劃的服務水平合同能夠作為一種模式來提高效率、質(zhì)量,并通過保持清晰的業(yè)務網(wǎng)絡維護和故障排除過程來協(xié)調(diào)顧客與支持部門之間的關系。

服務水平合同含有下列幾方面的優(yōu)點:服務水平合同建立了雙方業(yè)務責任制,也就是說,顧客和應用部門對網(wǎng)絡業(yè)務都有責任。如果雙方不采用行動來為具體業(yè)務建立一種服務水平合同;或不與網(wǎng)絡部門就業(yè)務影響問題進行交流,那么,雙方事實上對所發(fā)生的問題都有責任。服務水平合同有助于擬定原則工具和滿足業(yè)務規(guī)定所需的資源。不通過服務水平合同來擬定工作人數(shù)和所使用的工具普通只能人為地預計。在這種狀況下,從事某一業(yè)務的工作人員可能過剩并造成過多支出;也可能局限性而造成無法滿足公司目的的規(guī)定。調(diào)節(jié)服務水平合同有助于實現(xiàn)最優(yōu)化的合理分派。

以文獻形式存在的服務水平合同提供一種更簡樸精確的辦法來擬定業(yè)務級別的盼望值。

定義了業(yè)務級別之后,我們推薦采用下列環(huán)節(jié)來編制服務水平合同:

7.滿足服務水平合同的必要條件。

8.擬定服務水平合同所涉及的有關各方。

9.擬定業(yè)務組分。

10.理解顧客業(yè)務需求和目的。

11.擬定每個部門所需的服務水平合同。

12.選擇服務水平合同的格式。

13.成立服務水平合同工作組。

14.召開工作組會議并草擬服務水平合同。

15.商討服務水平合同。

16.測定和監(jiān)控服務水平合同與否符合規(guī)定。第7步:滿足服務水平合同的必要條件

IT服務水平合同編制領域的專業(yè)人士擬定了服務水平合同成功的3個必要條件。遺憾的是,不能滿足這些客觀規(guī)定的公司在服務水平合同的進程中可能會碰到問題,這些公司還應考慮服務水平合同流程中的潛在問題。如果聯(lián)網(wǎng)部門能夠定義滿足基本業(yè)務規(guī)定的業(yè)務級別,即使未執(zhí)行服務水平合同,也不會帶來害處。

下列是服務水平合同流程的必要條件:公司必須含有面對業(yè)務的文化。公司必須將顧客需要放在首位,還要恪守優(yōu)先權(quán)自上而下的業(yè)務承諾以完全理解顧客需要和想法。

進行顧客滿意度調(diào)查,并開展以顧客為中心的業(yè)務計劃。

另外一種業(yè)務指標是公司將公司目的擬定為業(yè)務或顧客支持滿意度。這種狀況是很普遍的,這是由于,IT部門現(xiàn)在與整個公司的成功親密有關。

由于服務水平合同流程重要是基于顧客需要和公司需求來改善業(yè)務,因此服務文化就顯得格外重要。如果公司在過去未執(zhí)行這一環(huán)節(jié),那么在進行服務水平合同方面的工作時會有一定的難度。全部IT活動必須以顧客和業(yè)務計劃為中心。公司的遠景規(guī)劃或工作闡明必須與顧客和業(yè)務計劃相一致,然后為涉及服務水平合同在內(nèi)的全部IT活動指導方向。經(jīng)常出現(xiàn)的狀況是,公司已布署好網(wǎng)絡來滿足特定規(guī)定,而聯(lián)網(wǎng)部門卻看不到目的或后續(xù)業(yè)務的需求。在這種狀況下,已經(jīng)為網(wǎng)絡事先做好了預算,這種預算可能遠遠高于或遠遠低于現(xiàn)在的需要,從而造成最后的失敗。

在顧客和業(yè)務計劃與IT活動相一致的狀況下,聯(lián)網(wǎng)部門能夠更容易地與新業(yè)務應用的布署、新業(yè)務和其它業(yè)務需求保持一致。業(yè)務關系和實現(xiàn)公司目的的共同關注焦點都非常清晰,并且全部部門都團結(jié)協(xié)作。您必須努力滿足服務水平合同流程和合同方面的規(guī)定。首先必須要努力掌握服務水平合同流程以編制有效的合同。

另首先,必須遵照合同的業(yè)務規(guī)定。不要奢望無需每個參加者的投入和承諾就能建立一種含有高效力的服務水平合同。這種承諾還必須來自管理部門和與服務水平合同流程有關的全部人員。

第8步:擬定服務水平合同所涉及的有關各方

公司級網(wǎng)絡服務水平合同在很大程度上依賴于網(wǎng)絡單元、服務器管理單元、協(xié)助臺支持、應用單元和顧客需求。普通狀況下,服務水平合同流程涉及到每個領域的管理部門。在公司指定基本的被動支持服務水平合同時,此方案起到較好的作用。規(guī)定更高可用性的公司在服務水平合同流程中可能需要技術支持以解決這方面的問題(如:可用性預算、性能限制、應用信息管理和主動管理能力)。對于主動管理服務水平合同方面的問題,我們建議成立一種由網(wǎng)絡設計師和應用設計師構(gòu)成的技術小組。技術支持小組能夠?qū)W(wǎng)絡可用性和運行能力、實現(xiàn)具體目的所需要的資源進行非常精確的計算。服務供應商的服務水平合同普通不需要顧客的參加,這是由于,編制服務水平合同的唯一目的是獲得超出其它服務供應商的競爭優(yōu)勢。在某些狀況下,上層管理以高可用性和高性能級別來編制這些服務水平合同以宣傳服務,并為內(nèi)部員工提供內(nèi)部目的。其它供應商將注意力集中在改善可用性的技術方面上,他們通過編制內(nèi)部測定和管理的高效業(yè)務級別定義來實現(xiàn)這一點。在其它狀況下,這兩方面的努力會同時發(fā)生,但沒必要結(jié)合在一起,或為了同一目的而進行。

服務水平合同中所涉及各方的選擇將基于服務水平合同的目的。可能的某些目的以下:實現(xiàn)被動支持業(yè)務目的通過定義主動的服務水平合同來獲得最高級別的可用性宣傳或推銷一種服務產(chǎn)品第9步:擬定服務單元

重要業(yè)務和支持服務水平合同普通由許多部分構(gòu)成,其中涉及支持級別、測定方法、服務水平合同調(diào)和的上報途徑和總體預算事宜。

用于高可用性環(huán)境的業(yè)務單元應涉及主動業(yè)務定義和被動目的。

其它具體內(nèi)容涉及下列方面:現(xiàn)場支持正常工作時間和非工作時間的服務程序優(yōu)先權(quán)定義,涉及問題類型、最遲解決問題的時間、解決問題的最長時間和上報程序。按重要程度排列的所支持產(chǎn)品或業(yè)務專業(yè)技術盼望支持、性能級別盼望值、狀態(tài)報告和故障解決方案的顧客責任地理或業(yè)務單元支持級別問題和規(guī)定故障管理辦法和程序(呼喊跟蹤系統(tǒng))協(xié)助臺目的網(wǎng)絡故障監(jiān)測和業(yè)務響應網(wǎng)絡可用性測定和報告網(wǎng)絡容量、性能測定和報告沖突解決程序為執(zhí)行服務水平合同提供資金網(wǎng)絡應用或服務的服務水平合同可根據(jù)顧客組規(guī)定和業(yè)務重要性而有其它規(guī)定。網(wǎng)絡部門必須認真聽取這些業(yè)務規(guī)定并開發(fā)適合整體支持構(gòu)造的專門解決方案。公司不應將重要業(yè)務只針對于某些個人或部門,這一點非常重要,因此對總體支持文化的適應也就很重要。在多數(shù)狀況下,這些附加規(guī)定能夠納入“解決方案”類中。這樣的例子涉及基于業(yè)務需求的白金級、金級和銀級解決方案。有關具體業(yè)務需求,請參閱下列示例。

注意:為了維護和改善統(tǒng)一的業(yè)務文化,支持構(gòu)造、上報途徑、協(xié)助臺程序、測定和優(yōu)先權(quán)定義在很大程度上應是相似的。寬帶規(guī)定和burst(突發(fā))能力性能規(guī)定服務質(zhì)量規(guī)定和定義建立解決方案原則的可用性規(guī)定和冗余度監(jiān)控和報告規(guī)定、辦法和流程為應用和業(yè)務單元升級原則為滿足預算外規(guī)定融資或交叉付費方法。例如,您可覺得WAN站點連接創(chuàng)立解決方案類別。向站點提供含有雙路T1業(yè)務的白金級解決方案。由不同的運行商分別提供一條T1線。站點應配備2個路由器以確保T1或路由器發(fā)生故障時站點不會發(fā)生停機現(xiàn)象。金級業(yè)務有2個路由器,但是將使用備份“幀中繼”。該解決方案在停機時段內(nèi)提供有限的寬帶。銀級解決方案只有一種路由器和一套載波業(yè)務。針對不同優(yōu)先級別考慮這些解決方案以擬定故障票。.如果停機規(guī)定優(yōu)先級為1或2的故障票,有些公司可能需要白金級或金級解決方案。顧客公司然后能夠投資購置所規(guī)定的業(yè)務級別。下表闡明了提供3種業(yè)務級別的公司,這些級別基于外聯(lián)網(wǎng)連接的業(yè)務需求。解決方案白金級金級銀級設備WAN連接冗余路由器核心站點備份冗余路由器無設備

冗余WAN冗余T1連接,多載波含有“幀中繼”備份的T1連接無WAN冗余寬帶規(guī)定與突發(fā)Burst含有用于burst(突發(fā))的負載共享冗余T1非負載共享“幀中繼”(只用于核心業(yè)務應用);“幀中繼”64K(只用于CIR)最多為:T1性能始終為100.ms來回響應時間或不大于此值。響應時間100ms或不大于盼望值的99.9%響應時間100ms或少于盼望值的99%可用性規(guī)定99.99%99.95%99.9%停機時協(xié)助臺優(yōu)先權(quán)優(yōu)先權(quán)1:重要業(yè)務服務故障優(yōu)先權(quán)2:會影響業(yè)務的服務故障優(yōu)先權(quán)3:

業(yè)務連接故障第10步:理解客戶業(yè)務需求和目的

此環(huán)節(jié)予以服務水平合同編制人員很大的信任。通過理解多種業(yè)務組的需求,早期的服務水平合同文獻更靠近于業(yè)務需求和但愿的成果。設法理解顧客業(yè)務停機帶來的損失,預計生產(chǎn)力、收入和顧客信譽方面的損失。請切記,即使只是和幾個人的連接也能夠嚴重地影響到收入。在這種狀況下,確保顧客理解可能發(fā)生的可用性和性能方面的風險,從而使公司更加好地理解所需要的業(yè)務等級。如果缺少這一步,會有許多顧客只是規(guī)定百分之百的可用性。

服務水平合同編制人員還應理解業(yè)務目的和公司發(fā)展速度方便適應網(wǎng)絡升級、工作量和預算。理解將要使用的應用程序也很有協(xié)助。公司最佳是有每個應用程序的應用信息文獻,如果沒有,考慮一下與否能夠?qū)贸绦蜻M行技術評定以擬定與網(wǎng)絡有關的問題。第11步:擬定每個部門所規(guī)定的服務水平合同

重要支持服務水平合同應涉及重要業(yè)務單元和功效組的規(guī)定,如網(wǎng)絡運行、服務器運行和應用程序支持組。這些組應基于業(yè)務需求和它們在支持過程中所起的作用來給擬定??紤]多方面規(guī)定尚有助于建立一種公平的整體支持解決方案而不偏向或優(yōu)先考慮特定部門的需求。這有助于支持部門為各個組提供最佳的服務,這是一種支撐公司整體服務文化的方案。例如,顧客可能堅持他的應用在公司范疇內(nèi)是最重要的,而事實上,該應用故障所帶來的停機損失在收入、生產(chǎn)力減少和顧客信譽方面大大不大于其它部門的應用。

公司內(nèi)不同的業(yè)務部門將有不同的規(guī)定。網(wǎng)絡服務水平合同的一種目的應是實現(xiàn)一種可適應不同業(yè)務級別的總體格式。這些規(guī)定普通是:可用性、服務質(zhì)量、性能和平均修復時間。在網(wǎng)絡服務水平合同中,這些變量通過下列辦法來進行解決:為各業(yè)務應用分派不同優(yōu)先級來調(diào)節(jié)服務質(zhì)量,針對多種網(wǎng)絡問題的平均修復時間來定義協(xié)助臺優(yōu)先次序,開發(fā)有助于解決多種可用性和性能規(guī)定的解決方案原則。一種加工公司的簡樸解決方案示例以下表所示(可在可用性、服務質(zhì)量和性能方面添加信息):業(yè)務部門應用故障損失停機時的故障優(yōu)先權(quán)服務器和網(wǎng)絡規(guī)定加工公司資源規(guī)劃高1最高冗余度顧客支持客戶服務高1最高冗余度工程文獻服務器,專用集成電路設計中2局域網(wǎng)核心構(gòu)件冗余度銷售文獻服務器中2局域網(wǎng)核心冗余度第12步:選擇服務水平合同的格式

服務水平合同的格式可根據(jù)部門或公司的規(guī)定不同而有所變化。下面是一種推薦的網(wǎng)絡服務水平合同示例的要點:合同目的合同有關方合同目的所提供的服務和所支持的產(chǎn)品協(xié)助臺服務和呼喊跟蹤用于定義平均修復時間的基于業(yè)務影響的故障嚴重性定義用于定義服務質(zhì)量的核心業(yè)務優(yōu)先權(quán)根據(jù)可用性和性能規(guī)定定義的解決方案類別培訓規(guī)定容量規(guī)劃規(guī)定上報規(guī)定報告提供的網(wǎng)絡解決方案新解決方案規(guī)定不受支持的產(chǎn)品和應用狀況業(yè)務方略工作時間提供的支持非工作時間支持的定義假期業(yè)務內(nèi)容聯(lián)系電話號碼工作量預測投訴解決業(yè)務授權(quán)原則顧客和部門安全責任故障管理程序呼喊開始(顧客和自動呼喊)第一級響應和呼喊修復率呼喊跟蹤和歷史統(tǒng)計呼入方責任故障診療和呼喊關閉規(guī)定網(wǎng)絡管理故障監(jiān)測和業(yè)務響應故障解決類別或定義遺留故障解決上報方略故障轉(zhuǎn)移責任嚴重故障和意外狀況呼喊解決服務質(zhì)量目的質(zhì)量定義測定定義質(zhì)量目的根據(jù)故障優(yōu)先權(quán)開始解決故障前的平均等待時間根據(jù)故障優(yōu)先權(quán)來解決故障的平均時間根據(jù)故障優(yōu)先權(quán)來更換硬件的平均時間網(wǎng)絡可用性和性能管理容量管理擴容質(zhì)量報告人員配備和預算.人員配備模式運行預算合同維護一致性審視時間表性能報告和審視報告測定原則的調(diào)節(jié)定時服務水平合同更新同意附件與正表呼喊流程圖上報原則網(wǎng)絡解決方案原則報通告例第13步:成立服務水平合同工作組

下一步是擬定服務水平合同工作組的組員,其中涉及小組領導。工作組能夠涉及顧客、業(yè)務單位或職能部門經(jīng)理或各地區(qū)的代表。這些人員向各自的工作組報告服務水平合同方面的問題。經(jīng)理和核心服務水平合同單元的決策人應加入該組。參加人員能夠涉及管理和技術兩方面的人員,這些人有助于定義與服務水平合同有關的技術問題和作出IT.級別的決策(即,協(xié)助臺部門經(jīng)理、服務器運行部經(jīng)理、應用部經(jīng)理和網(wǎng)絡運行部經(jīng)理)。

網(wǎng)絡服務水平合同工作組還應由應用推廣部和業(yè)務部代表構(gòu)成,以在網(wǎng)絡服務水平合同方面達成一致,此合同涉及多個應用和業(yè)務部門。工作組有權(quán)對網(wǎng)絡的重要業(yè)務進程、業(yè)務、可用性和單個業(yè)務的性能規(guī)定進行安排。這方面的信息將用于為多種會影響業(yè)務的故障類型創(chuàng)立優(yōu)先權(quán),為網(wǎng)上的重要業(yè)務分派優(yōu)先級,并創(chuàng)立基于業(yè)務規(guī)定的將來原則聯(lián)網(wǎng)解決方案。第14步:召開工作組會議和草擬服務水平合同

工作組應首先編制工作組章程。章程應規(guī)定服務水平合同的目的、計劃、和時間框架。接下來,工作組將編寫具體工作計劃,并擬定計劃表和編寫及執(zhí)行服務水平合同的時間表。該工作組還應編寫根據(jù)支持原則測定支持級別的報告程序。最后一步是編寫服務水平合同草案。

聯(lián)網(wǎng)服務水平合同工作組最初應每七天召開一次見面會以編寫服務水平合同。編寫并同意服務水平合同后,工作組能夠每月甚至每季度召開一次會議以對服務水平合同進行增補。

第15步:商討服務水平合同

編寫服務水平合同的最后一步是最后協(xié)商和訂立。這一步涉及以下內(nèi)容:審視草案商討內(nèi)容編輯和修訂文獻獲得最后同意在最后版本送交管理部門審批之前,審視草案、商討內(nèi)容和修訂的工作能夠重復進行多次。

.從網(wǎng)絡部經(jīng)理的角度來看,商討能夠測定的預期成果是相稱重要的。

設法吸引其它有關部門的人員來支持性能和可用性合同。這還涉及質(zhì)量定義、測定辦法定義和質(zhì)量目的。請記住,增加業(yè)務相稱于額外開支。確保顧客組理解增加級別的業(yè)務將收取費用,并由顧客自己擬定這與否是核心業(yè)務需求。您能夠很容易地執(zhí)行服務水平合同諸多方面的成本分析(如:硬件更換時間)。

第16步:測定和監(jiān)控服務水平合同與否符合規(guī)定

測定服務水平合同與否符合規(guī)定和報告成果是服務水平合同流程的重要方面,由于這有助于確保長久的持續(xù)性和成果。我們普通建議,服務水平合同的任何重要構(gòu)成部分都是可測定的,并在執(zhí)行服務水平合同前擬定對的的測定方法。然后每月召開顧客和支持部門間的會議以審核測定方法、找出問題的根本因素,并提出解決方案以滿足或超出業(yè)務級別規(guī)定。這有助于改善服務水平合同流程,使它當代質(zhì)量改善計劃相似。

對于公司內(nèi)管理部門是如何評定服務水平合同及其整體業(yè)務級別管理,下列小節(jié)提供了更多的具體信息。

業(yè)務級別管理性能指標

業(yè)務級別管理性能指標將業(yè)務級別作為一種衡量成功的辦法來提供監(jiān)控它的機制。這使公司能夠?qū)I(yè)務問題作出快速反映,并對影響業(yè)務或業(yè)務環(huán)境中的停機損失問題有一種更清晰的理解。如果沒有測定業(yè)務級別定義,將對以前完畢的工作產(chǎn)生消極的影響,這是由于公司被迫處在被動局面。沒有人會說服務真好,相反,會有諸多顧客說服務滿足不了規(guī)定。因此,業(yè)務級別管理性能指標是業(yè)務級別管理的重要條件,這是由于它提供辦法來充足理解現(xiàn)有服務級別,并根據(jù)現(xiàn)在問題進行調(diào)節(jié)。這是提供主動支持和改善質(zhì)量的基礎。當公司對問題進行根本分析并改善質(zhì)量時,這將是提高可用性、性能和所提供服務的質(zhì)量的最佳途徑。例如,考慮下列實例。

某公司收到越來越多的投訴說網(wǎng)絡經(jīng)常出現(xiàn)長時間的故障。通過測定可用性,該公司發(fā)現(xiàn)重要問題是一小部分WAN站點。更進一步的研究發(fā)現(xiàn)大部分問題出現(xiàn)在這以小部分WAN站點上。公司發(fā)現(xiàn)問題并解決了這個問題。公司然后擬定可用性的業(yè)務等級目的,并與顧客組訂立合同。后來的故障測定過程根據(jù)服務水平合同的不適應性而變得很快。人們因此認為網(wǎng)絡部門是含有很強的專業(yè)作風和技術的隊伍,是公司的財產(chǎn)。該部門很自然地從被動變?yōu)橹鲃樱⒂兄诠咎岣呓?jīng)濟效益。遺憾的是,今天的大多數(shù)聯(lián)網(wǎng)部門的業(yè)務級別定義很有限,并無性能指標。成果是,他們用大量的時間用來應付顧客投訴或故障,而不是主動找出根本因素并開發(fā)滿足業(yè)務需要的網(wǎng)絡服務。

通過下列服務水平合同性能指標來擬定業(yè)務級別管理進程的成功與否:以文獻形式存在的業(yè)務級別定義或服務水平合同,服務水平合同涉及可用性、性能、被動業(yè)務響應時間、故障解決方案目的和問題上報程序。性能指標測定原則,其中涉及可用性、性能、各優(yōu)先權(quán)的業(yè)務響應時間,各優(yōu)先級的解決時間和其它可測定的服務水平合同參數(shù)審視業(yè)務級別執(zhí)行狀況和整治工作的每月網(wǎng)絡業(yè)務級別管理睬議以文獻形式存在的服務水平合同或業(yè)務級別定義

第1個性能指標只是具體闡明服務水平合同或業(yè)務級別定義的文獻。業(yè)務級別定義的首要目的應是可用性和性能,由于這是重要的顧客需求。

第2個目的很重要,這是由于它們有助于定義可用性或性能級別的實現(xiàn)途徑。例如:如果公司含有挑戰(zhàn)性的可用性和性能目的,則防止發(fā)生故障和在出現(xiàn)故障時快速解決將非常重要。

.第2個目的有助于定義實現(xiàn)盼望可用性和性能級別所需的進程。

被動輔助目的涉及:各呼喊優(yōu)先權(quán)的被動業(yè)務響應時間故障解決目的或平均修復時間問題上報流程主動的輔助目的涉及:設備故障或鏈路故障監(jiān)測網(wǎng)絡故障監(jiān)測容量或性能問題監(jiān)測重要目的、性能和可用性的業(yè)務級別定義應涉及:

目的目的是如何測定的測定可用性和性能的責任方可用性和性能目的的責任方不一致性進程在可能的狀況下,我們推薦,負責測定的人員和負責成果的人員應是不同的人員,以避免利益沖突。由于存在添加、移動和更改方面的錯誤,未監(jiān)測到的故障或可用性測定問題,因此還要經(jīng)常地調(diào)節(jié)可用性數(shù)值。業(yè)務級別定義還涉及修改成果的程序以協(xié)助提高精確性,并避免不對的的調(diào)節(jié)。有關測定可用性和性能的辦法方面的信息,請參閱下一小節(jié)。

在擬定IT范疇內(nèi)的問題之后,公司要對這些問題或網(wǎng)絡進行響應,被動型輔助目的的業(yè)務級別定義對于公司在這方面的響應方式進行定義。其中,IT范疇內(nèi)的問題涉及:故障優(yōu)先級定義各故障優(yōu)先級的業(yè)務響應時間故障排除目的或平均修復時間故障報告流程普通狀況下,這些目的定義指定時間內(nèi)的故障負責人和在什么狀況下他們應停止手中的工作來完畢指定的工作。與其它業(yè)務級別定義相似,業(yè)務級別文獻也應具體論述目的的測定辦法、測定負責方和不一致性解決流程。

主動式輔助目的的業(yè)務定義對公司提供主動支持的方式進行了定義,其中涉及:網(wǎng)絡故障、鏈路故障和設備故障的識別,網(wǎng)絡故障狀況和網(wǎng)絡容量門限。由于質(zhì)量主動管理有助于排除故障和快速修復故障,因此需要擬定宣傳主動管理的目的。普通狀況下,通過擬定建立和解決的主動式案例的目的數(shù)量來完畢這一工作,其中,所解決的主動式案例是基于未告知顧客的狀況。許多公司在協(xié)助臺軟件中建立了標志以據(jù)此來區(qū)別主動式案例和被動式案例。業(yè)務級別文獻還應涉及有關目的測定方式、測定責任方和不一致進程方面的信息。

性能指標測定原則

我們普通推薦,任何定義的業(yè)務級別目的應是可測定的,從而使公司能夠測定業(yè)務級別,找出影響可用性和性能重要目的的根本因素,改善針對具體目的的工作辦法??傊瑴y定目的只是一種工具,使網(wǎng)絡管理者能夠管理業(yè)務等級的持續(xù)性,并根據(jù)業(yè)務規(guī)定改善工作質(zhì)量。

遺憾的是,許多公司不收集可用性、性能和其它測定數(shù)據(jù)。公司將其歸因于沒有能力來提供精確性、成本、網(wǎng)絡費用和可用的資源。

這些因素能夠影響測定業(yè)務的能力,但是公司應將注意力集中在整體目的上以管理并改善業(yè)務質(zhì)量。許多公司能夠建立低成本、低費用的測定原則,即使這些原則不能提供絕對的精確性,但能夠滿足重要目的的規(guī)定。

測定可用性和性能是業(yè)務級別測定原則經(jīng)常無視的一種環(huán)節(jié)。成功地使用這些測定原則地公司運用2種非常簡樸的辦法。一種是從網(wǎng)絡的核心位置向邊沿發(fā)送Internet控制信息合同主機連通性測試信息包(InternetControlMessageProtocol(ICMP)pingpackets)。通過這種辦法還能夠獲得某些性能數(shù)據(jù)。成功使用這種辦法的公司還將類似設備組合為“可用性”組。如局域網(wǎng)設備或本地區(qū)辦公設備。由于公司對于不同的地理或重要業(yè)務地區(qū)公司普通有不同的業(yè)務級別目的,因此這方面就更加引人注目。這能夠使測定原則部門通過可用性組來均分全部設備,從而達成合理的效果。

其它計算可用性的成功辦法是使用故障票和稱為“受影響顧客分鐘(IUM)”的測定方法。此辦法對受到停機影響的顧客數(shù)量進行統(tǒng)計,并將該數(shù)值與停機時間相乘。用總時間占該時間段的比例形式來表達此數(shù)值時,這種辦法很容易計算出可用性。無論這2種狀況中的哪一種,這都有助于識別和測定故障的根本因素,方便使改善工作更有針對性。根本因素類別涉及硬件問題、軟件問題、鏈路和載波問題、電源和環(huán)境問題、更改失敗和顧客錯誤。

可測定的被動支持目的涉及:各呼喊優(yōu)先權(quán)的被動業(yè)務響應時間故障排除目的或平均修復時間故障排除目的,即MTTR問題上報時間通過從協(xié)助臺數(shù)據(jù)庫生成報告來測定被動式支持目的,其中涉及下列內(nèi)容:最初生成報告的時間(或輸入到數(shù)據(jù)庫的時間)故障負責人收到呼喊的時間故障上報的時間故障解決完畢的時間這些測定原則可能規(guī)定管理部門的干預以在數(shù)據(jù)庫中適宜地輸入故障信息,并實時對故障信息進行更新。在某些狀況下,公司可覺得網(wǎng)絡事件或電子郵件請求自動生成故障票。這有助于擬定生成故障的精確開始時間。

通過這種測定原則生成的報告通過根據(jù)優(yōu)先權(quán)、工作組和工作人員來對故障進行分類,以協(xié)助擬定潛在問題。

由于測定主動式支持進程規(guī)定監(jiān)控主動式工作并對某些效率測定值進行計算,因此難度比較大。這方面的工作還做得極少。然而,很明顯,只有少部分人事實上向協(xié)助臺報告網(wǎng)絡故障,并且很明顯需要時間來對故障進行解釋,或?qū)栴}歸結(jié)為與網(wǎng)絡有關的問題。由于冗余設備或鏈路的故障對終端顧客的影響較小,因此不是全部的主動式案例都對可用性產(chǎn)生直接的影響。

公司因業(yè)務規(guī)定和潛在的可用性隱患而執(zhí)行主動式業(yè)務級別定義或合同。然后根據(jù)主動式案例與被動式案例的數(shù)量或比例進行測定,被動式案例是由顧客生成的。測定每個部分的主動式案例數(shù)量是一種較好的理念。這些類別將涉及故障設備、故障鏈路、網(wǎng)絡錯誤和容量超限。還應通過可用性模式來進行某些工作以擬定對可用性的影響,可用性是通過執(zhí)行主動式業(yè)務定義來實現(xiàn)的。業(yè)務級別管理審核

業(yè)務級別管理與否成功的另一種測定辦法是業(yè)務級別管理審視。無論服務水平合同與否可用,都要執(zhí)行這一步。通過測定負責人和提供定義的業(yè)務級別在每月一次的例會上對業(yè)務級別管理進行審視。當涉及到服務水平合同時,顧客組也能夠加入進來。會議的目的是審視測定的業(yè)務級別定義的性能,并進行對應的整治。

每個會議應有一種擬定的工作計劃,其中涉及:指定時間段內(nèi)測定的業(yè)務級別的審視某一部分所擬定的改善計劃的審視現(xiàn)在業(yè)務級別測定原則需要根據(jù)現(xiàn)在的測定原則對改善方案進行討論隨著時間的推移,公司還能夠分析業(yè)務級別適應性趨勢以擬定部門的效率。此進程不屬于質(zhì)量范疇或質(zhì)量改善程序。會議有助于針對具體問題,并根據(jù)根本因素來擬定解決方案。

業(yè)務級別管理摘要

總之,業(yè)務級別管理逐步使公司從被動支持模式變?yōu)橹鲃又С帜J?,在這種模式下,網(wǎng)絡可用性和業(yè)務級別由業(yè)務規(guī)定來擬定,而不是由近來的一系列故障來擬定。該進程有助于建立一種不停提高業(yè)務級別的環(huán)境,并提高公司的競爭力。另外,業(yè)務級別管理還是主動網(wǎng)絡管理的最重要構(gòu)成部分。因此,我們極力建議在任何網(wǎng)絡規(guī)劃和設計過程中都采用業(yè)務級別管理,并在最新定義的網(wǎng)絡構(gòu)造中采用。這能夠使公司在開始階段就能對的地執(zhí)行解決方案,并使故障時間和重復工作量降到最低。[原創(chuàng)]大話服務目錄

大話服務目錄

下列純屬于我個人的理解,并不基于ITIL理論,在沒有接觸ITIL之前,我腦中的認為的服務目錄就是如此,下列所講的都是基于一種有一定規(guī)模的運維服務商而言,并不適

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論