基礎(chǔ)設(shè)施維護(hù)方案說明_第1頁
基礎(chǔ)設(shè)施維護(hù)方案說明_第2頁
基礎(chǔ)設(shè)施維護(hù)方案說明_第3頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基礎(chǔ)設(shè)施維護(hù)方案一、概述運(yùn)行維護(hù),由維護(hù)及定檢兩部分內(nèi)容組成。維護(hù)定檢不僅是在問題出現(xiàn)時(shí)能迅速地定位、解決問題; 而更重要的是在故障產(chǎn)生前,能夠通過例行的巡檢工作及時(shí)發(fā)現(xiàn)故障隱患、消除故障隱患, 使設(shè)備長期穩(wěn)定地運(yùn)行。 對設(shè)備良好、 有效的維護(hù), 不僅能夠減少設(shè)備的故障率,并且可以延長設(shè)備的使用壽命。維護(hù)定檢的基本原則就是在例行維護(hù)定檢工作中及時(shí)發(fā)現(xiàn)、 解決問題, 防患于未然。 如果維護(hù)人員能在故障發(fā)生之前, 在例行巡檢之中, 及時(shí)檢測到故障的先兆, 將故障解決在萌芽期, 這樣不但可以避免故障發(fā)生后,由于搶修的慌亂、 業(yè)務(wù)中斷所造成的經(jīng)濟(jì)損失; 而且還可以避免故障嚴(yán)重化對整個(gè)設(shè)備所造成的損傷,

2、 從而降低板件更換等維護(hù)費(fèi)用, 延長設(shè)備的使用壽命。而這一切, 不但要求維護(hù)人員有深厚的功底,豐富的維護(hù)經(jīng)驗(yàn),還要有洞察秋毫的高度敏感性。二、總則為基礎(chǔ)設(shè)施的連續(xù)性和信息安全性,制定有效的運(yùn)行維護(hù)策略來保證服務(wù)交付的質(zhì)量,兼顧運(yùn)行維護(hù)過程(及時(shí)和規(guī)范)和運(yùn)行維護(hù)結(jié)果(可用和安全),實(shí)現(xiàn)“事前防范,風(fēng)險(xiǎn)前移;事中控制,快速響應(yīng);事后改進(jìn),持續(xù)評估”的持續(xù)改進(jìn)原則。2.1可用性采取適當(dāng)措施, 確保按服務(wù)協(xié)議提供長期、持續(xù)的滿足需求的優(yōu)質(zhì)服務(wù),保持服務(wù)對象符合 SLA 的可用性要求。包括:a) 在服務(wù)實(shí)施時(shí), 建立相關(guān)的作業(yè)流程和響應(yīng)機(jī)制, 必要時(shí)按需方要求制定系統(tǒng)冗余和備份規(guī)范,以滿足需方對可用性

3、的要求;b) 進(jìn)行合理的人員崗位設(shè)置和職責(zé)定義,保證專人專崗并設(shè)置人員備份;c) 配備具有相應(yīng)能力的人員和必要的工具, 并定期進(jìn)行專業(yè)培訓(xùn), 以提高服務(wù)可用性。人員能力具體要求;d) 選擇適用的運(yùn)行維護(hù)技術(shù),以保證服務(wù)的可用性;e) 根據(jù)運(yùn)行維護(hù)服務(wù)級別要求, 必要時(shí)應(yīng)建立體系架構(gòu)的關(guān)鍵健康檢查點(diǎn), 并配備相應(yīng)的運(yùn)行維護(hù)工具,以保證服務(wù)水平。運(yùn)行維護(hù)工具等級;f) 根據(jù)服務(wù)要求配備足夠的資源,避免由于資源的缺失導(dǎo)致對服務(wù)的可用性帶來影響。2.2安全性采取各種安全手段或措施, 有效控制數(shù)據(jù)中心運(yùn)行維護(hù)服務(wù)的各個(gè)環(huán)節(jié), 保護(hù)數(shù)據(jù)中心運(yùn)行維護(hù)服務(wù)中的物理安全、網(wǎng)絡(luò)安全、系統(tǒng)安全、應(yīng)用安全和數(shù)據(jù)安全。

4、包括:a) 建立適當(dāng)?shù)男畔踩芾頇C(jī)制,以規(guī)范數(shù)據(jù)中心運(yùn)行維護(hù)服務(wù)人員的信息安全行為;b)對運(yùn)行維護(hù)服務(wù)人員采取有效的信息安全管理措施,如進(jìn)行人員背景調(diào)查、簽訂安全保密協(xié)議等;c)對運(yùn)行維護(hù)服務(wù)人員進(jìn)行相關(guān)安全管理及安全要求培訓(xùn),并進(jìn)行適當(dāng)?shù)臋z查,以確保服務(wù)人員了解并遵守?cái)?shù)據(jù)中心安全、保密相關(guān)規(guī)定;d)充分關(guān)注數(shù)據(jù)中心業(yè)務(wù)安全需求,結(jié)合信息安全技術(shù)與管理標(biāo)準(zhǔn),進(jìn)行適當(dāng)?shù)陌踩u估,提供相應(yīng)的安全建議,并對服務(wù)對象進(jìn)行適當(dāng)?shù)谋O(jiān)控和保護(hù);e)對數(shù)據(jù)中心安全進(jìn)行監(jiān)控、分析, 把安全風(fēng)險(xiǎn)控制在可接受范圍內(nèi),防止安全事件發(fā)生;f) 建立有效的安全通報(bào)機(jī)制,以及時(shí)通報(bào)安全事件相關(guān)情況和相應(yīng)防范處理措施等。2

5、.3及時(shí)性采取適當(dāng)?shù)氖侄未_保提供滿足SLA 時(shí)間指標(biāo)要求的運(yùn)行維護(hù)服務(wù)。包括:a) 對事件、問題、 變更建立明確的分級策略,并與服務(wù)窗口時(shí)間、響應(yīng)時(shí)間等指標(biāo)相匹配;b) 建立可確保滿足需方要求的溝通聯(lián)絡(luò)機(jī)制, 保持溝通渠道通暢, 以實(shí)現(xiàn)對服務(wù)需求的及時(shí)響應(yīng);c) 建立有效的服務(wù)資源調(diào)度機(jī)制及與服務(wù)相關(guān)方的協(xié)同機(jī)制,配置必要的備品備件,以提供及時(shí)的服務(wù)保障;d) 特殊時(shí)間段(如法定節(jié)假日或重大事件等),應(yīng)提升響應(yīng)級別,提供必要的現(xiàn)場支持;e) 建立有效機(jī)制,周期性對事件級別定義進(jìn)行更新,以確保定義準(zhǔn)確有效。2.4規(guī)范性建立適當(dāng)?shù)姆?wù)管理流程、服務(wù)活動(dòng)指導(dǎo)文件或?qū)嵤┮?guī)則,以保證服務(wù)過程的規(guī)范運(yùn)作。

6、包括:a) 建立有效的服務(wù)管理流程文件,以保證服務(wù)過程實(shí)施規(guī)范性;b) 建立或遵循需方的數(shù)據(jù)中心相關(guān)管理制度,如出入場管理制度、安??刂浦贫鹊?;c) 對于例行操作服務(wù),應(yīng)制定詳細(xì)、可操作的技術(shù)手冊,以降低操作風(fēng)險(xiǎn);d) 對于非例行操作服務(wù)(響應(yīng)支持、優(yōu)化改善、調(diào)研評估) ,應(yīng)在實(shí)施前,制定詳細(xì)的實(shí)施方案,并進(jìn)行風(fēng)險(xiǎn)評估及分析,采取相應(yīng)的風(fēng)險(xiǎn)規(guī)避措施和回退手段;e) 在服務(wù)過程中進(jìn)行的任何活動(dòng), 應(yīng)建立服務(wù)檔案, 可形成服務(wù)報(bào)告, 保留完整的服務(wù)記錄。三、服務(wù)對象與交付說明3.1服務(wù)對象及內(nèi)容( 1 ) 定期對硬件設(shè)備進(jìn)行巡檢、 保養(yǎng),以保障設(shè)備運(yùn)行正常 (具體設(shè)備范圍因合同而異,基本包括電力系

7、統(tǒng)、 空調(diào)系統(tǒng)、 安防系統(tǒng)、 網(wǎng)絡(luò)系統(tǒng)、 監(jiān)控系統(tǒng)以及綜合布線系統(tǒng)等) ;( 2 ) 定期升級配套軟件的版本;( 3 ) 協(xié)助采購人制訂安全策略,定期檢查、排除風(fēng)險(xiǎn),保障設(shè)備及網(wǎng)絡(luò)環(huán)境安全;( 4 ) 針對重要設(shè)備,實(shí)時(shí)監(jiān)控運(yùn)行狀況,及時(shí)發(fā)現(xiàn)故障、排除故障;( 5 ) 針對周期性巡檢發(fā)現(xiàn)的安全隱患進(jìn)行防范和處理;( 6 ) 提供配件維修、更換服務(wù)( 7 ) 系統(tǒng)重部署及調(diào)試:新機(jī)上架協(xié)助及系統(tǒng)移位協(xié)助。( 8 ) 協(xié)助采購人,規(guī)范硬件管理維護(hù)標(biāo)準(zhǔn)化工作。3.2交付內(nèi)容服務(wù)交付內(nèi)容包括調(diào)研評估、例行操作、響應(yīng)支持和優(yōu)化改善四類,其中:a)b)調(diào)研評估服務(wù): 根據(jù)需方、 服務(wù)相關(guān)方或系統(tǒng)運(yùn)行的需求

8、,對服務(wù)對象的運(yùn)行狀況、運(yùn)行環(huán)境進(jìn)行現(xiàn)狀調(diào)研、系統(tǒng)分析和評估并提出相應(yīng)的建議和服務(wù)方案;例行操作服務(wù): 按照約定條件觸發(fā)或預(yù)先規(guī)定的常態(tài)服務(wù),分為監(jiān)控、 預(yù)防性檢查和常規(guī)作業(yè);1) 監(jiān)控: 指采用各類工具和技術(shù), 對服務(wù)對象的動(dòng)態(tài)指標(biāo)、 靜態(tài)指標(biāo)、運(yùn)行狀況和發(fā)展趨勢等進(jìn)行記錄、分析和告警;2) 預(yù)防性檢查: 保證服務(wù)對象的持續(xù)正常運(yùn)行, 根據(jù)服務(wù)對象的監(jiān)控記錄、 運(yùn)行條件和運(yùn)行狀況進(jìn)行檢查和趨勢分析,發(fā)現(xiàn)其脆弱性,以便消除或改進(jìn);3) 常規(guī)作業(yè):對數(shù)據(jù)中心服務(wù)對象進(jìn)行的日常維護(hù),包括定期保養(yǎng)、配置備份、數(shù)據(jù)備份、恢復(fù)、定期重啟等活動(dòng),以保證服務(wù)對象的穩(wěn)定運(yùn)行。c) 響應(yīng)支持服務(wù): 根據(jù)響應(yīng)的前

9、提不同, 分為事件驅(qū)動(dòng)響應(yīng)、 服務(wù)請求響應(yīng)和應(yīng)急響應(yīng);1) 事件驅(qū)動(dòng)響應(yīng): 由于不可預(yù)測原因?qū)е路?wù)對象整體或部分性能下降、功能喪失,觸發(fā)將服務(wù)對象恢復(fù)到正常狀態(tài)的服務(wù)活動(dòng)。事件驅(qū)動(dòng)響應(yīng)的處理過程首先爭取在最短的時(shí)間內(nèi)恢復(fù)服務(wù)或啟用備份資源,維持服務(wù)的持續(xù)提供,并應(yīng)對事件做出分析、明確誘發(fā)事件的原因和影響的范圍,采取有效的防控措施,減少類似事件的再次發(fā)生。事件驅(qū)動(dòng)響應(yīng)的觸發(fā)條件包括外部事件、系統(tǒng)事件和安全事件三種;2) 服務(wù)請求響應(yīng): 由于需方提出各類服務(wù)請求, 引發(fā)的需要針對服務(wù)對象、 服務(wù)等級做出調(diào)整或修改的響應(yīng)型服務(wù)。 服務(wù)請求響應(yīng)需要根據(jù)總體服務(wù)策略并參考已有的 SLA/ SOW 做出

10、判斷,對服務(wù)的實(shí)施進(jìn)行影響評估,制定詳細(xì)的實(shí)施方案和回退措施,并在條件允許的情況下執(zhí)行實(shí)施方案和回退方案的測試。變更型響應(yīng)服務(wù)實(shí)施完成后,應(yīng)進(jìn)行總結(jié),確認(rèn)已達(dá)到預(yù)期的目標(biāo)。此類響應(yīng)可能涉及服務(wù)等級變更、服務(wù)范圍變更、技術(shù)資源變更、服務(wù)提供方式變更等;3) 應(yīng)急響應(yīng):指在出現(xiàn)跨越預(yù)定的應(yīng)急響應(yīng)閾值的重大事件、 發(fā)生重大自然災(zāi)害、由于政府部門發(fā)出行政指令或需方提出要求時(shí),應(yīng)當(dāng)啟動(dòng)應(yīng)急處理程序。d) 優(yōu)化改善服務(wù):包括適應(yīng)性改進(jìn)、增強(qiáng)性改進(jìn)和預(yù)防性改進(jìn)三種類型;1) 適應(yīng)性改進(jìn): 為保持服務(wù)對象在已變化或正在變化的環(huán)境中可持續(xù)運(yùn)行而實(shí)施的改造;2) 增強(qiáng)性改進(jìn): 根據(jù)運(yùn)行需求或由于服務(wù)對象的缺陷,

11、采取相應(yīng)改進(jìn)措施增強(qiáng)數(shù)據(jù)中心的安全性、可用性和可靠性;3) 預(yù)防性改進(jìn): 檢測和糾正服務(wù)對象運(yùn)行過程中潛在的問題或缺陷,以降低系統(tǒng)風(fēng)險(xiǎn),滿足未來可靠運(yùn)行的需求。四、運(yùn)行維護(hù)交付內(nèi)容4.1服務(wù)對象服務(wù)對象包括空調(diào)系統(tǒng)(精密空調(diào)系統(tǒng)、新風(fēng)系統(tǒng)) 、電力系統(tǒng)(供配電系統(tǒng)、統(tǒng)、發(fā)電機(jī)系統(tǒng)) 、安防系統(tǒng)(防雷接地系統(tǒng)、消防系統(tǒng)、視頻監(jiān)控系統(tǒng)和門禁系統(tǒng))UPS 系、網(wǎng)絡(luò)系統(tǒng)及設(shè)備、 PC 服務(wù)器、小型機(jī)等服務(wù)器以及綜合布線系統(tǒng)。4.2調(diào)研評估基礎(chǔ)設(shè)施調(diào)研評估服務(wù)內(nèi)容包含但不限于:a)空調(diào)系統(tǒng)(精密空調(diào)系統(tǒng)、新風(fēng)系統(tǒng)):機(jī)房環(huán)境指標(biāo)分析及改進(jìn)建議、機(jī)房熱點(diǎn)分析及布置改進(jìn)建議、機(jī)房送風(fēng)、 回風(fēng)方式改進(jìn)建議,新

12、風(fēng)風(fēng)量、 風(fēng)壓指標(biāo)分析及改進(jìn)建議;輔助制冷單元配置建議等;b) 電力系統(tǒng)(供配電系統(tǒng)、 UPS 系統(tǒng)、發(fā)電機(jī)系統(tǒng)) :機(jī)柜供電分析及改進(jìn)建議、機(jī)房回路調(diào)整分析調(diào)整建議、機(jī)房擴(kuò)容建議等;發(fā)電機(jī)負(fù)荷分析及調(diào)整建議等;UPS運(yùn)行分析及擴(kuò)容建議,超過設(shè)計(jì)使用壽命的電池更換建議、整流直流電容、逆變交流電容等;c)安防系統(tǒng)(防雷接地系統(tǒng)、消防系統(tǒng)、視頻監(jiān)控系統(tǒng)和門禁系統(tǒng)):防雷接地系統(tǒng)分析及改進(jìn)建議、消防系統(tǒng)現(xiàn)狀分析和改進(jìn)建議(按照當(dāng)?shù)叵拦芾聿块T管理要求)、視頻監(jiān)控系統(tǒng)的分析和改進(jìn)建議、門禁系統(tǒng)的分析和改進(jìn)建議等;d) 綜合布線系統(tǒng)等:光纖、銅纜容量、使用效率分析;應(yīng)用環(huán)境及性能分析;數(shù)量、路由改進(jìn)或擴(kuò)

13、容建議;級別提升建議等。e) 機(jī)房電源使用效率:通過對機(jī)房 PUE 連續(xù)監(jiān)測分析,提供機(jī)房能效改進(jìn)建議,包括但不限于:空調(diào)系統(tǒng)優(yōu)化(消除機(jī)房熱點(diǎn)、冷熱通道遏制、改善送回風(fēng)、使用節(jié)能型設(shè)備等)、電力系統(tǒng)優(yōu)化(回路優(yōu)化、使用節(jié)能型設(shè)備等) 、實(shí)施容量管理(對機(jī)柜的電力容量、制冷容量及空間容量進(jìn)行統(tǒng)籌管理,以充分利用資源)等。f) 網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備調(diào)研評估: (整體或局部)網(wǎng)絡(luò)實(shí)際負(fù)荷與承載能力分析; (整體或局部) 網(wǎng)絡(luò)預(yù)期負(fù)荷與承載能力分析與建議; (整體或局部)網(wǎng)絡(luò)架構(gòu)分析與建議; (整體或局部)網(wǎng)絡(luò)路由策略分析與建議; (整體或局部)網(wǎng)絡(luò)安全策略分析與建議; (整體或局部)網(wǎng)絡(luò)配置調(diào)優(yōu)分析與建

14、議等。g) 服務(wù)器調(diào)研評估: 服務(wù)器負(fù)載情況分析; 服務(wù)器安全策略分析; 服務(wù)器的高可用性分析;服務(wù)器性能分析及調(diào)整建議。4.3例行操作基礎(chǔ)設(shè)施的例行操作服務(wù)包括:監(jiān)控、預(yù)防性檢查、常規(guī)作業(yè)。4.3.1監(jiān)控對基礎(chǔ)設(shè)施的監(jiān)控內(nèi)容參見表1 ,包括但不限于:表 1 基礎(chǔ)設(shè)施監(jiān)控內(nèi)容表服務(wù)對象監(jiān)控內(nèi)容空調(diào)系統(tǒng)(精密空環(huán)境溫度、環(huán)境濕度、出風(fēng)溫度、回風(fēng)溫度,告警情況等調(diào)系統(tǒng)、新風(fēng)系統(tǒng))供配電系統(tǒng):電流、電壓、功率因數(shù)、有功功率、無功功率、諧波等電力系統(tǒng)(供配電系統(tǒng)、 UPS 系統(tǒng)、發(fā)電機(jī):啟停情況、電流、電壓、負(fù)載率、控制系統(tǒng)供電情況等UPS: 輸入電流電壓、輸出電流電壓、頻率、負(fù)載率、溫度、報(bào)警情發(fā)電

15、機(jī)系統(tǒng))況、電池充電 / 放電電壓等電源使用效率: PUE 值(通過監(jiān)控軟件監(jiān)測或計(jì)算得出)防雷接地系統(tǒng):浪涌保護(hù)器、避雷器狀態(tài)等安防系統(tǒng)(防雷接消防系統(tǒng):消防控制系統(tǒng)狀態(tài)、氣體滅火鋼瓶壓力、滅火器有效期地系統(tǒng)、消防系統(tǒng)、檢查視頻監(jiān)控系統(tǒng)和門禁系統(tǒng))視頻監(jiān)控系統(tǒng) : 告警情況、監(jiān)控錄像等門禁系統(tǒng):門禁狀態(tài)、告警情況網(wǎng)絡(luò)設(shè)備的健康狀況、整體運(yùn)行狀態(tài)、各項(xiàng)硬件資源開銷狀況鏈路健康狀況如端到端時(shí)延變化、鏈路端口工作穩(wěn)定性、鏈路負(fù)載百分比、部署路由策略情況下端到端選路變化、路由條目變化網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備管理權(quán)限用戶的行為審計(jì)設(shè)備軟件配置變動(dòng)審計(jì)設(shè)備日志審計(jì)安全事件審計(jì)服務(wù)器整體運(yùn)行狀態(tài)服務(wù)器電源工作狀態(tài)服

16、務(wù)器服務(wù)器 CPU 工作狀態(tài)服務(wù)器內(nèi)存工作狀態(tài)服務(wù)器硬盤工作狀態(tài)服務(wù)器網(wǎng)絡(luò)端口工作狀態(tài)4.3.2預(yù)防性檢查在監(jiān)控服務(wù)的基礎(chǔ)上對基礎(chǔ)設(shè)施進(jìn)行預(yù)防性檢查。包括:性能檢查和脆弱性檢查?;A(chǔ)設(shè)施預(yù)防性檢查內(nèi)容參見表2 ,包括但不限于:表 2 基礎(chǔ)設(shè)施預(yù)防性檢查內(nèi)容表服務(wù)對象性能檢查內(nèi)容脆弱性檢查內(nèi)容機(jī)房熱點(diǎn)情況、 室內(nèi)機(jī)漏水高壓壓力、低壓壓力(風(fēng)冷系統(tǒng)) ,冷凍檢查、室外風(fēng)機(jī)運(yùn)轉(zhuǎn)情況、精密空調(diào)水壓力、溫度,冷卻水壓力、溫度(水空 調(diào)加濕罐陽極棒檢查、 過濾網(wǎng)冷系統(tǒng)),風(fēng)機(jī)運(yùn)行情況,灰塵情況等系統(tǒng)檢查等風(fēng)機(jī)運(yùn)行情況、風(fēng)速,預(yù)處理系統(tǒng)工作新風(fēng)系統(tǒng)過濾網(wǎng)檢查、風(fēng)壓差檢查狀態(tài),上下水情況等導(dǎo)線、器件發(fā)熱情況,

17、防浪配電系統(tǒng)接地電阻、零序電流、器件發(fā)熱情況等涌器件情況等電 力發(fā)電機(jī)轉(zhuǎn)速、發(fā)熱情況等油位,吸氣、排煙通道等系統(tǒng)器件發(fā)熱情況、電池情況(外觀、非免UPS 系統(tǒng)器件、導(dǎo)線發(fā)熱情況,電池維護(hù)電池檢查液位、 接線柱)、檢查通風(fēng)放電時(shí)間、通風(fēng)情況等情況(風(fēng)扇、入氣口、出氣口)等防雷接地系引下線檢查、 接地匯接排檢接地電阻測試統(tǒng)查啟動(dòng)瓶、管道開關(guān)、氣體壓消防系統(tǒng)鋼瓶壓力、有效期、探頭污染等力等安 防視頻監(jiān)控系畫面清晰度 (不同照度情況下) 、錄像硬監(jiān)控系統(tǒng)運(yùn)行狀態(tài)、 監(jiān)控死系統(tǒng)統(tǒng)盤(磁帶)容量、云臺運(yùn)行等角問題等門禁系統(tǒng)與消防系統(tǒng)和視服務(wù)器、控制器、讀卡器、門磁等工作頻監(jiān)控系統(tǒng)的聯(lián)動(dòng)檢查 (如門禁系統(tǒng)狀

18、態(tài)果有此功能) ,異常情況報(bào)警檢查線纜兩端應(yīng)貼有識別標(biāo)簽,綜合布線系統(tǒng)光纖、銅纜鏈路測試,性能測試等標(biāo)志要與實(shí)際拓?fù)鋱D完全一致設(shè)備機(jī)身、板卡或模塊的工作情況CPU 使用峰值情況內(nèi)存使用峰值情況是否需要升級系統(tǒng)微碼主要端口的利用率設(shè)備鏈路的冗余度要求鏈路的健康狀態(tài),包括 IP 包傳輸時(shí)延、網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備安全事件周期性整理分析IP 包丟失率、 IP 包誤差率、無效IP 包設(shè)備生命周期評估(包括攻擊性 IP 包、欺騙性IP 包、垃圾 IP 包等)備件可用性周期性檢查檢查其它的關(guān)鍵指標(biāo)項(xiàng),例如各類關(guān)鍵表項(xiàng)、會(huì)話連接數(shù)等服務(wù)器資源分配是否超過預(yù)定閥值服務(wù)器的資源分配情況和策略服務(wù)器關(guān)鍵部件是否滿足CPU

19、 使用峰值情況運(yùn)行冗余度要求內(nèi)存使用峰值情況服務(wù)器關(guān)鍵部件的微碼版服務(wù)器文件系統(tǒng)空間使用情況本是否需要升級IO 讀寫情況服務(wù)器關(guān)鍵部件鏈路的冗網(wǎng)絡(luò)流量情況等余度要求與存儲(chǔ)的鏈路性能測試服務(wù)器硬盤是否 RAID保護(hù)服務(wù)器文件空間使用是否達(dá)到預(yù)定閥值4.3.3常規(guī)作業(yè)基礎(chǔ)設(shè)施的常規(guī)作業(yè)包括基礎(chǔ)類操作、測試類操作和數(shù)據(jù)類操作,其中:a) 基礎(chǔ)類操作:按服務(wù)管理手冊的有關(guān)規(guī)定,執(zhí)行設(shè)備的日常運(yùn)行、維護(hù)和保養(yǎng);b) 測試類操作: 按服務(wù)管理手冊的有關(guān)規(guī)定, 對基礎(chǔ)設(shè)施各系統(tǒng)功能、 性能進(jìn)行測試;c) 數(shù)據(jù)類操作:按事先規(guī)定的程序,對基礎(chǔ)設(shè)施運(yùn)行日志、記錄等數(shù)據(jù)進(jìn)行操作?;A(chǔ)設(shè)施常規(guī)作業(yè)內(nèi)容參見表 3 ,

20、包括但不限于:表 3 基礎(chǔ)設(shè)施常規(guī)作業(yè)內(nèi)容表服務(wù)對象基礎(chǔ)類操作測試類操作數(shù)據(jù)類操作啟停機(jī)、清洗更換濾運(yùn)行日志備份,報(bào)漏水報(bào)警測試、周期性主精密空調(diào)網(wǎng)、清洗更換加濕系備切換 / 應(yīng)急演練等警記錄備份、清除空調(diào)系統(tǒng)、清潔冷凝器等等統(tǒng)啟停機(jī)、清洗更換濾運(yùn)行記錄備份(如新風(fēng)系統(tǒng)消防聯(lián)動(dòng)測試網(wǎng)等果有)配電系統(tǒng)除塵、合閘、分閘等互投測試等運(yùn)行記錄備份運(yùn)行日志備份,報(bào)空載測試、帶載測試、切發(fā)電機(jī)更換三濾、清潔等警記錄備份、清除電力系換演練等等統(tǒng)旁路測試、電池放電測試、運(yùn)行日志備份,報(bào)UPS 系統(tǒng)旁路、清潔等周期性主備切換 / 應(yīng)急演警記錄備份、清除練等等接地端子、匯流排緊防雷接地運(yùn)行記錄備份(如固,浪涌、防

21、雷保護(hù)接地電阻測試系統(tǒng)果有)器復(fù)原等報(bào)警記錄備份、清消防系統(tǒng)探頭清洗等啟動(dòng)測試、探頭測試等除出入記錄導(dǎo)出、備安防系器件靈敏度、畫面清晰度視頻監(jiān)控視頻監(jiān)控頭清潔,云份,監(jiān)控圖像記錄統(tǒng)(不同照度情況下) 、云臺系統(tǒng)臺保養(yǎng)備份、清除,報(bào)警運(yùn)行等記錄備份、清除等門禁系統(tǒng)與消防系統(tǒng)和視運(yùn)行日志備份,報(bào)頻監(jiān)控系統(tǒng)的聯(lián)動(dòng)檢查測門禁系統(tǒng)門禁授權(quán)等警記錄備份、清除試(如果有此功能) ,掉電等測試布線系統(tǒng)拓?fù)鋱D數(shù)綜合布線系統(tǒng)線路跳接等鏈路測試、性能測試據(jù)更新服務(wù)對象基礎(chǔ)類操作測試類操作數(shù)據(jù)類操作設(shè)備操作系統(tǒng)軟件備份及存檔系統(tǒng)微碼升級設(shè)備軟件配置備份及存檔監(jiān)控系統(tǒng)日志備份及存檔網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備監(jiān)控系統(tǒng)日志數(shù)據(jù)分析與報(bào)

22、告生成網(wǎng)絡(luò)配置變更文件的審核網(wǎng)絡(luò)配置變更的操作網(wǎng)絡(luò)配置變更的記錄系統(tǒng)微碼升級配置文件備份服務(wù)器過期日志和文件系統(tǒng)空間清理服務(wù)器硬盤RAID 配置檢查(如有RAID控制器)更換控制器電池(如有RAID控制器)4.4響應(yīng)支持4.4.1事件驅(qū)動(dòng)響應(yīng)針對設(shè)備的軟、 硬件故障引起的業(yè)務(wù)中斷或運(yùn)行效率無法滿足正常運(yùn)行要求,而進(jìn)行的響應(yīng)服務(wù),包括但不限于:a)空調(diào)系統(tǒng):故障排查、 關(guān)閉部分機(jī)組以維持機(jī)房最低溫濕度指標(biāo)、關(guān)閉新風(fēng)系統(tǒng)等;b) 電力系統(tǒng): 配電系統(tǒng)包括故障排查、 投入備用電源回路、 關(guān)閉非重要回路等;發(fā)電機(jī)系統(tǒng)包括故障排查、啟動(dòng)發(fā)電機(jī)、油料補(bǔ)充等; UPS 系統(tǒng)包括故障排查、旁路系統(tǒng)、關(guān)閉非重要

23、輸出等;c) 安防系統(tǒng): 防雷接地系統(tǒng)包括浪涌保護(hù)器復(fù)原、更換,接地電阻降阻等;消防系統(tǒng)包括故障排查、系統(tǒng)啟動(dòng)、報(bào)警聯(lián)動(dòng)、疏散警示等;視頻監(jiān)控系統(tǒng)包括故障排查、監(jiān)控頭或硬盤更換、檢查告警、數(shù)據(jù)恢復(fù)等;門禁系統(tǒng)包括故障排查、手動(dòng)開啟或關(guān)閉門禁系統(tǒng)、檢查告警或監(jiān)控記錄等;d) 綜合布線系統(tǒng):線纜更換等。e) 網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備事件驅(qū)動(dòng)響應(yīng)故障定位;停止、啟動(dòng)進(jìn)程;中斷、連通網(wǎng)絡(luò)連接;關(guān)閉、啟動(dòng)端口;網(wǎng)絡(luò)備件更換;更改、恢復(fù)配置。f) 服務(wù)器事件驅(qū)動(dòng)響應(yīng)服務(wù)器重啟;更換故障部件,包括主板、電源、 CPU 、內(nèi)存、硬盤等;服務(wù)器關(guān)鍵部件微碼升級;服務(wù)器硬盤RAID 配置修復(fù)。4.4.2服務(wù)請求響應(yīng)根據(jù)應(yīng)用

24、系統(tǒng)運(yùn)行需要或需方、服務(wù)相關(guān)方的請求,而進(jìn)行的響應(yīng)服務(wù), 包括但不限于:a) 空調(diào)系統(tǒng):調(diào)整溫度、濕度參數(shù)等,調(diào)整新風(fēng)量等;b)電力系統(tǒng):配電系統(tǒng)包括增減回路、增減供電類型(如直流、110V )等;分支回路相位調(diào)整等;發(fā)電機(jī)為指定負(fù)載供電等;UPS 系統(tǒng)包括旁路操作、為指定負(fù)載供電等;c)安防系統(tǒng): 防雷接地系統(tǒng)包括新設(shè)備接地等;消防系統(tǒng)包括增減終端設(shè)備、檢查及提供告警及監(jiān)控記錄、備份或清除記錄等;視頻監(jiān)控系統(tǒng)包括調(diào)整攝像機(jī)位置、增加攝像機(jī),增加錄像機(jī)容量等;門禁系統(tǒng)包括增加、刪減、變更門禁權(quán)限等;d) 綜合布線系統(tǒng):鏈路跳接、跳線更換,布線擴(kuò)容等。e) 網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備服務(wù)請求響應(yīng)增加、降低網(wǎng)

25、絡(luò)接入的數(shù)量或速度;更改網(wǎng)絡(luò)設(shè)備配置;啟動(dòng)、關(guān)閉端口或服務(wù);更換、更新或升級設(shè)備硬件或軟件。f) 服務(wù)器服務(wù)請求響應(yīng)服務(wù)器設(shè)備搬遷;服務(wù)器設(shè)備停機(jī)演練;服務(wù)器設(shè)備清潔維護(hù)等。4.5優(yōu)化改善4.5.1適應(yīng)性改進(jìn)根據(jù)應(yīng)用系統(tǒng)特點(diǎn)和運(yùn)行需求,對基礎(chǔ)設(shè)施進(jìn)行調(diào)整,包括但不限于:a) 空調(diào)系統(tǒng):調(diào)整溫濕度參數(shù)等、調(diào)整機(jī)組位置、增減新風(fēng)風(fēng)量等;b) 電力系統(tǒng): 配電系統(tǒng)包括更換開關(guān)、 導(dǎo)線以適配負(fù)載容量等, 發(fā)電機(jī)包括調(diào)整啟動(dòng)方式等;c) 安防系統(tǒng): 調(diào)整防雷接地系統(tǒng)、 消防系統(tǒng)、視頻監(jiān)控系統(tǒng)和門禁系統(tǒng), 以適應(yīng)應(yīng)用系統(tǒng)的變化;d) 綜合布線系統(tǒng):調(diào)整綜合布線系統(tǒng),以適應(yīng)應(yīng)用系統(tǒng)的變化。e) 網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)

26、備適應(yīng)性改進(jìn)路由策略調(diào)整;設(shè)備或鏈路負(fù)載調(diào)整;安全策略調(diào)整;監(jiān)控對象覆蓋范圍調(diào)整;局部交換優(yōu)化;局部冗余優(yōu)化。f) 服務(wù)器適應(yīng)性改進(jìn)服務(wù)器硬盤RAID 配置調(diào)整;服務(wù)器網(wǎng)絡(luò)、光纖鏈路冗余調(diào)整;服務(wù)器電源供電接入冗余調(diào)整。4.5.2增強(qiáng)性改進(jìn)根據(jù)應(yīng)用系統(tǒng)的特點(diǎn)和運(yùn)行需求,通過對基礎(chǔ)設(shè)施的運(yùn)行記錄、趨勢的分析, 對基礎(chǔ)設(shè)施進(jìn)行調(diào)整、擴(kuò)容或升級,包括但不限于:a) 空調(diào)系統(tǒng):增減精密空調(diào)機(jī)組、增減APU 單元,增加新風(fēng)機(jī)組、預(yù)處理裝置等;b)電力系統(tǒng):配電系統(tǒng)包括增加回路、增加ATS 設(shè)備等; UPS 系統(tǒng)包括增加主機(jī)數(shù)量、增加電池?cái)?shù)量等;c) 安防系統(tǒng):防雷接地系統(tǒng)包括增加冗余引下線、接地裝置,降

27、低接地電阻阻值等;消防系統(tǒng)包括增加傳感器和噴頭數(shù)量, 更換高性能控制主機(jī); 視頻監(jiān)控和門禁系統(tǒng)包括增加報(bào)警聯(lián)動(dòng)、增加終端數(shù)量、增加存儲(chǔ)容量等;d) 綜合布線系統(tǒng):線路擴(kuò)容、更換高性能布線等。e) 網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備增強(qiáng)性改進(jìn)硬件容量變化,如網(wǎng)絡(luò)設(shè)備硬件、軟件升級、帶寬升級等;整體網(wǎng)絡(luò)架構(gòu)變動(dòng);網(wǎng)絡(luò)架構(gòu)容量變化,如網(wǎng)絡(luò)子系統(tǒng)的增減等;系統(tǒng)功能變化,如新增功能區(qū)、新增安全系統(tǒng)、新增審計(jì)系統(tǒng)等;路由協(xié)議應(yīng)用及部署調(diào)整;整體安全策略收緊;交換優(yōu)化;冗余優(yōu)化。f) 服務(wù)器增強(qiáng)性改進(jìn)為本服務(wù)器從存儲(chǔ)系統(tǒng)上分配更大空間;服務(wù)器 CPU 個(gè)數(shù)增加;服務(wù)器內(nèi)存容量增加;服務(wù)器磁盤空間擴(kuò)容;服務(wù)器網(wǎng)卡和HBA 接口卡

28、增加等。4.5.3預(yù)防性改進(jìn)根據(jù)對基礎(chǔ)設(shè)施的運(yùn)行記錄、 趨勢的分析, 結(jié)合應(yīng)用系統(tǒng)的需求, 發(fā)現(xiàn)基礎(chǔ)設(shè)施的脆弱點(diǎn),有針對性地進(jìn)行改進(jìn)性作業(yè),包括但不限于:a) 空調(diào)系統(tǒng):調(diào)整機(jī)組位置,調(diào)整出回風(fēng)方式等;b) 電力系統(tǒng): 配電系統(tǒng)包括更換開關(guān)、 更換導(dǎo)線、調(diào)整回路等; 發(fā)電機(jī)包括更換或添加高標(biāo)號油料等;c) 安防系統(tǒng): 防雷接地系統(tǒng)包括焊接點(diǎn)加固、 防腐處理等; 消防系統(tǒng)包括消防系統(tǒng)預(yù)防性改進(jìn)(按照當(dāng)?shù)叵拦芾聿块T管理要求) ;視頻監(jiān)控和門禁系統(tǒng)包括門禁系統(tǒng)支持與消防系統(tǒng)和視頻監(jiān)控系統(tǒng)的聯(lián)動(dòng);d) 綜合布線系統(tǒng):弱電線纜與強(qiáng)電線纜的物理隔離,鼠患排查等。e) 網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備增強(qiáng)性改進(jìn)配置參數(shù)優(yōu)化

29、, 例如關(guān)閉不必要的服務(wù)、打開缺省的增強(qiáng)功能、加快三層網(wǎng)絡(luò)路由收斂速度、加快二層網(wǎng)絡(luò)生成樹收斂速度等;安全優(yōu)化,例如密碼加密,TELNET控制等;提高軟件配置命令可讀性。f) 服務(wù)器預(yù)防性改進(jìn)檢查服務(wù)器硬盤RAID配置,及時(shí)修復(fù)或更換故障硬盤;增加服務(wù)器網(wǎng)卡、光纖卡以及鏈路冗余情況;增加服務(wù)器電源供電模塊冗余。五、服務(wù)管理制度規(guī)范5.1 服務(wù)時(shí)間(1) 接收服務(wù)請求和咨詢:在 5*8 小時(shí)工作時(shí)間內(nèi)設(shè)置由專人職守的熱線電話,接聽內(nèi)部的服務(wù)請求,并記錄服務(wù)臺事件處理結(jié)果。(2) 在非工作時(shí)間設(shè)置有專人 7*24 小時(shí)接聽的移動(dòng)電話熱線, 用于解決內(nèi)部的技術(shù)問題以及接聽 7*24 小時(shí)機(jī)房監(jiān)控人員

30、的機(jī)房突發(fā)情況匯報(bào)。(3) 服務(wù)響應(yīng)時(shí)間:故障級別響應(yīng)時(shí)間故障解決時(shí)間備注I 級: 屬于緊急問題;其具體現(xiàn)象為:系統(tǒng)30 分鐘, 2 小時(shí)內(nèi)12具體時(shí)間因小時(shí)以內(nèi)崩潰導(dǎo)致業(yè)務(wù)停止、數(shù)據(jù)丟失。提交故障處理方案項(xiàng)目而定II 級: 屬于嚴(yán)重問題;其具體現(xiàn)象為:出現(xiàn)30 分鐘, 2 小時(shí)內(nèi)具體時(shí)間因24部分部件失效、 系統(tǒng)性能下降但能正常運(yùn)行,小時(shí)以內(nèi)項(xiàng)目而定提交故障處理方案不影響正常業(yè)務(wù)運(yùn)作。III 級:屬于較嚴(yán)重問題;其具體現(xiàn)象為:出具 體 時(shí) 間 因30 分鐘, 2 小時(shí)內(nèi)現(xiàn)系統(tǒng)報(bào)錯(cuò)或警告,但業(yè)務(wù)系統(tǒng)能繼續(xù)運(yùn)行48 小時(shí)以內(nèi)項(xiàng)目而定提交故障處理方案且性能不受影響。IV 級:屬于普通問題;其具體現(xiàn)

31、象為:系統(tǒng)具 體 時(shí) 間 因30 分鐘, 2 小時(shí)內(nèi)技術(shù)功能、安裝或配置咨詢,或其他顯然不5 天內(nèi)項(xiàng)目而定提交故障處理方案影響業(yè)務(wù)的預(yù)約服務(wù)。技術(shù)支持人員在解決故障時(shí),會(huì)最大限度保護(hù)好數(shù)據(jù),做好故障恢復(fù)的文檔,力爭恢復(fù)到故障點(diǎn)前的業(yè)務(wù)狀態(tài)。對于“系統(tǒng)癱瘓,業(yè)務(wù)系統(tǒng)不能運(yùn)轉(zhuǎn)”的故障級別,如果不能于12 小時(shí)內(nèi)解決故障,將在合同小時(shí)內(nèi)提出應(yīng)急方案,確保業(yè)務(wù)系統(tǒng)的運(yùn)行。故障解決后24小時(shí)內(nèi),提交故障處理報(bào)告。說明故障種類、故障原因、 故障解決中使用的方法及故障損失等情況。5.2行為規(guī)范(1) 遵守用戶的各項(xiàng)規(guī)章制度,嚴(yán)格按照用戶相應(yīng)的規(guī)章制度辦事。(2) 與用戶運(yùn)行維護(hù)體系其他部門和環(huán)節(jié)協(xié)同工作,密

32、切配合, 共同開展技術(shù)支持工作。(3) 出現(xiàn)疑難技術(shù)、業(yè)務(wù)問題和重大緊急情況時(shí),及時(shí)向負(fù)責(zé)人報(bào)告。(4) 現(xiàn)場技術(shù)支持時(shí)要精神飽滿,穿著得體,談吐文明, 舉止莊重。 接聽電話時(shí)要文明禮貌,語言清晰明了,語氣和善。(5) 遵守保密原則。對被支持單位的網(wǎng)絡(luò)、主機(jī)、系統(tǒng)軟件、應(yīng)用軟件等的密碼、核心參數(shù)、業(yè)務(wù)數(shù)據(jù)等負(fù)有保密責(zé)任,不得隨意復(fù)制和傳播。5.3現(xiàn)場服務(wù)支持規(guī)范運(yùn)維服務(wù)人員要做到耐心、細(xì)心、熱心的服務(wù)。工作要做到事事有記錄、事事有反饋、重大問題及時(shí)匯報(bào)。嚴(yán)格遵守工作作息時(shí)間,嚴(yán)格按照服務(wù)工作流程操作。(1) 現(xiàn)場支持工程師應(yīng)著裝整潔、言行禮貌大方,技術(shù)專業(yè),操作熟練、嚴(yán)謹(jǐn)、規(guī)范;現(xiàn)場支持時(shí)必須遵守用戶單位的相關(guān)規(guī)章制度。(2) 現(xiàn)場支持工程師在進(jìn)行現(xiàn)場支持工作時(shí)必須在保證數(shù)據(jù)和系統(tǒng)安全的前提下開展工作。(3) 現(xiàn)場支持時(shí)出現(xiàn)暫時(shí)無法解決的故障或其他新的故障時(shí), 應(yīng)告知用戶并及時(shí)上報(bào)負(fù)責(zé)人,尋找其他解決途徑。(4) 故障解決后, 現(xiàn)場支持工程師要詳細(xì)記錄問題的發(fā)生時(shí)間、 地點(diǎn)、提出人和問題描述, 并形成書面文檔, 必要時(shí)應(yīng)向用戶介紹故障出現(xiàn)的原因及預(yù)防方法和解決技巧。5.4問題記錄規(guī)范根據(jù)使用人員提出問題的類別,將問題分為咨詢類問題和系統(tǒng)缺陷類問題二類:咨詢類問題是指通過服務(wù)熱線或現(xiàn)場解疑等方式能夠當(dāng)場解決用戶提出的問題,具有問題解答直接、快速和實(shí)時(shí)的特點(diǎn),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論