IT運維管理工作實施細則_第1頁
IT運維管理工作實施細則_第2頁
IT運維管理工作實施細則_第3頁
IT運維管理工作實施細則_第4頁
IT運維管理工作實施細則_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

IT運維管理工作實施細則目錄1、總則 42、編制方法 43、運維服務管理體系 43.1運維服務管理對象 43.2運維系統(tǒng)功能框架 53.3運維管理組織結構 53.3.1項目負責人 63.3.2項目經理 63.3.3技術主管 73.3.4服務臺 73.3.5網(wǎng)絡管理員 83.3.5應用、數(shù)據(jù)庫管理員 83.3.7終端管理員 83.4運維服務流程 93.4.1項目運維服務工作流程圖 103.4.2服務臺 103.4.3事件管理 113.4.4工單管理 113.4.5問題管理 113.4.6變更管理 123.4.7配置管理 123.4.8知識庫管理 123.4.9統(tǒng)計及工作報告 124、運維服務內容 134.1服務目標 134.2 IT資產統(tǒng)計服務 134.3網(wǎng)絡、安全系統(tǒng)運維服務 134.4主機、存儲系統(tǒng)運維服務 144.5數(shù)據(jù)庫系統(tǒng)運維服務 154.6中間件運維服務 154.7終端、外設運維服務 165、應急服務響應措施 165.1應急預案實施基本流程 175.2突發(fā)事件應急策略 176、服務管理制度規(guī)范 186.1服務時間 186.2行為規(guī)范 181、總則xxxxxxxxx發(fā)展有限公司成立系統(tǒng)技術部,統(tǒng)一承擔臨xxxxxxxx及其下屬公司投資建設的信息化項目的運行維護工作。系統(tǒng)技術部為進入運行維護階段的信息化項目成立運維項目組,項目組由項目經理負責,并配備相應的維護工程師。為了做好項目的運行維護工作,加強內部管理,特制定本規(guī)定。本規(guī)定的作用對象為IT運維項目組的項目經理及全部維護工程師。2、編制方法本實施細則包括IT運維服務全生命周期管理方法、管理標準/規(guī)范、管理模式、管理支撐工具、管理對象以及基于流程的管理方法。本實施細則以ITIL/ISO20000為基礎,以xxxxxxx信息化項目的運維為目標,以管理支撐工具為手段,以流程化、規(guī)范化、標準化管理為方法,以全生命周期的PDCA循環(huán)為提升途徑,體現(xiàn)了對IT運維服務全過程的體系化管理。3、運維服務管理體系運維服務管理體系規(guī)定了IT運維活動涉及的各類實體,以及這些實體間的相互關系。相關的實體按照IT運維服務管理體系進行有機組織,并協(xié)調工作,按照服務協(xié)議要求提供不同級別的IT運維服務。3.1運維服務管理對象運維服務管理對象包括基礎設施、應用系統(tǒng)、用戶、供應商、以及IT運維部門和人員,具體內容如下:(1)基礎設施包括網(wǎng)絡、主機系統(tǒng)、存儲/備份系統(tǒng)、終端系統(tǒng)、安全系統(tǒng)、以及機房動力環(huán)境等。(2)應用系統(tǒng)包括內部辦公系統(tǒng)、門戶網(wǎng)站、面向公眾的應用系統(tǒng)等。(3)用戶包括使用如上IT應用系統(tǒng)的用戶。(4)供應商包括基礎設施和應用系統(tǒng)的供應商以及IT運維服務的供應商。(5)運維部門和人員包括內部參與IT運維活動的相關部門和人員,以及提供IT運維服務的企業(yè)和相關人員。3.2運維系統(tǒng)功能框架根據(jù)建設單位的系統(tǒng)結構和業(yè)務開展需要,運維項目組將xxxxx項目的維護框架分為9個具體組成部分,分別為:服務臺、時間管理。工單管理、問題管理、變更管理、配置管理、工程師考核、知識庫管理、統(tǒng)計、系統(tǒng)管理等9個子項。而具體運維流程將以此為依據(jù)開展工作。3.3運維管理組織結構本運維項目的運維管理結構位三層模式,具體如下圖所示。由項目負責人與甲方進行業(yè)務范圍接洽,并將溝通結果向下傳遞。項目經理負責項目的整體運維工作,包括各種制度的制定和實施。運維工程師則在項目經理的指導下開展維護工作。3.3.1項目負責人職責:負責項目商務、整體協(xié)調事宜。職位描述:1)、整體負責建設單位運維項目服務計劃的制定,領導項目經理并安排項目工作,指導項目經理完成具體維護工作,每周聽取項目經理的工作匯報,負責考核項目經理工作完成情況。2)、協(xié)助建設單位完成新增項目的調研、方案設計并指導項目經理進行具體實施。3.3.2項目經理職責:規(guī)劃、執(zhí)行、完善信息化項目的運維工作,指導網(wǎng)絡、數(shù)據(jù)庫維護工程師開展工作。職位描述:1、根據(jù)公司戰(zhàn)略目標,指導下屬工程師開展客戶服務工作,確保運維工作能夠滿足客戶的實際需要;2、建立和持續(xù)完善運維管理體系,優(yōu)化運維流程流程,解決運維服務中出現(xiàn)的特殊問題;3、規(guī)劃并提升運維工程師專業(yè)服務能力,在整體上提高客戶滿意度;4、制定和持續(xù)完善績效考核體系;5、制定整理運維項目的應急預案系統(tǒng),并指導運維工程師實施;6、提高自身專業(yè)技能,在業(yè)務方面給予網(wǎng)絡管理員和數(shù)據(jù)庫管理員指導。3.3.3技術主管職責:應用、數(shù)據(jù)庫管理,oracle性能調優(yōu),實現(xiàn)應用負載均衡。職位描述:技術主管非項目常駐人員,根據(jù)項目需要進行專業(yè)方面指導;負責數(shù)據(jù)庫性能分析與調優(yōu),數(shù)據(jù)庫運行狀態(tài)監(jiān)控,及時發(fā)現(xiàn)異常并快速處理。熟練掌握Oracle10G的RAC技術,能夠實現(xiàn)部署及調優(yōu)。掌握WAS、Weblogic、Tomcat、websphere等中間件的工作原理,能夠實現(xiàn)部署調優(yōu)及故障解決。熟練掌握red-flag、redhat等linux操作系統(tǒng),部署oracle10g、mysql數(shù)據(jù)庫。熟練掌握dataguard技術,保證oracle數(shù)據(jù)庫冗災、數(shù)據(jù)保護、故障恢復。負責應用負載均衡的部署和調試。負責指導數(shù)據(jù)庫工程師管理員開展工作。3.3.4服務臺職責:故障電話受理,文檔管理。職位描述負責IT業(yè)務的救助電話的受理工作;故障處理的發(fā)起人,同時進行維護工程師指派,跟蹤事件處理狀態(tài);進行維護故障統(tǒng)計、用戶滿意度統(tǒng)計、工作報表輸出等工作;協(xié)助項目經理,進行文檔整理、歸類、保存等工作。3.3.5網(wǎng)絡管理員職責:維護建設單位網(wǎng)絡系統(tǒng)正常,解決網(wǎng)絡相關故障。職位描述:1、對現(xiàn)有服務器、局域網(wǎng)絡及機房、配線間的日常管理維護;2、對信息安全建設提出相關建議,確保網(wǎng)絡的安全;3、保證外網(wǎng)光纖線路正常,保證局域網(wǎng)運行正常;4、對網(wǎng)絡系統(tǒng)和網(wǎng)絡設備的運行狀態(tài)進行監(jiān)控;5、熟練掌握域策略設置、DHCP、DNS、FTP服務器、NTFS權限設置等;6、編寫網(wǎng)絡部分的應用處理預案并實施。7、工作認真、細致,積極主動有條理性,具有良好的溝通能力及團隊合作精神.3.3.5應用、數(shù)據(jù)庫管理員職責:維護建設單位業(yè)務系統(tǒng)運行正常,解決應用和數(shù)據(jù)庫故障。職位描述:1、監(jiān)測業(yè)務系統(tǒng)運行狀況,應用、數(shù)據(jù)庫性能監(jiān)視及優(yōu)化,作必要調整;2、規(guī)劃不同數(shù)據(jù)的生命周期,制訂備份、恢復、遷移和災備策略,根據(jù)業(yè)務的需要執(zhí)行數(shù)據(jù)轉換及遷移等操作;3、保證應用和數(shù)據(jù)庫系統(tǒng)的安全性、完整性和運行效率。4、負責數(shù)據(jù)庫平臺的整體架構及解決方案的制定和實施;5、工作認真、細致,積極主動有條理性,具有良好的溝通能力及團隊合作精神.3.3.7終端管理員職責:維護建設單位桌面系統(tǒng)運行正常,解決終端、外設故障。職位描述:1、各部門電腦、打印機、傳真機的維護;2、對各部門職員進行電腦相關的技術支持及培訓工作;3、精通WindowsXP及Office的使用,能夠熟練使用Excel2003、Excel2007及以上版本,能夠制作相應教程對其他部門員工進行培訓3.4運維服務流程IT運維服務管理流程涉及服務臺、事件管理、問題管理、配置管理、變更管理、發(fā)布管理、服務級別管理、財務管理、能力管理、可用性管理、服務持續(xù)性管理、知識管理及供應商管理等,隨著運維活動的不斷深入和持續(xù)改進,其他流程可能會逐步獨立并規(guī)范。3.4.1項目運維服務工作流程圖3.4.2服務臺服務臺是支持IT運維服務的核心功能,與各個流程聯(lián)系密切。所有管理流程都要通過服務臺為用戶提供單點聯(lián)系,解答用戶的相關問題和需求,或為用戶尋求相應的支持人員。在本系統(tǒng)中,服務臺是接收各種來源服務請求和相關信息反饋的唯一入口和出口,同時服務臺還負責一般請求、通過知識庫(歷史事件)能夠解決的請求;他也是復雜問題二線處理的橋梁。3.4.3事件管理事件管理流程的主要目標是盡快恢復IT服務提供并減少其對業(yè)務的不利影響,盡可能保證最好的IT服務質量和可用性等級。事件管理流程通常涉及事件的偵測和記錄、事件的分類和支持、事件的調查和診斷、事件的解決和恢復以及事件的關閉。本系統(tǒng)把所有服務請求和報警歸結為事件。事件管理是提供服務臺和事件管理者對于事件記錄、處理、查詢、審核、派發(fā)等功能。它也包括通過和第三方IT監(jiān)控系統(tǒng)對接,把其發(fā)送報警形成事件的功能。3.4.4工單管理工單管理:工單是IT現(xiàn)場運維、二線支持的任務載體,運維工程依據(jù)所接收工單進行IT運維工作。工單管理是對工單實現(xiàn)創(chuàng)建、變更、查詢?yōu)g覽、派發(fā)、監(jiān)督等功能的模塊。3.4.5問題管理問題管理流程的主要目標是預防問題和事故的再次發(fā)生,并將未能解決的事件的影響降低到最小。問題管理流程包括診斷事件根本原因和確定問題解決方案所需要的活動,通過合適的控制過程,尤其是變更管理和發(fā)布管理,負責確保解決方案的實施。問題管理還將維護有關問題、應急方案和解決方案的信息。問題管理是針對已處理事件的遺留問題或處理事件的方案只是治標不治本的不能徹底解決問題而考慮的模塊。根據(jù)事件、及處理方案,問題處理人經過調查、診斷并提出最終解決方法。3.4.6變更管理變更管理實現(xiàn)所有IT基礎設施和應用系統(tǒng)的變更,變更管理應記錄并對所有要求的變更進行分類,應評估變更請求的風險、影響和業(yè)務收益。其主要目標是以對服務最小的干擾實現(xiàn)有益的變更。變更管理是要對重大IT資源的新增、變更、升級等IT運維活動進行審核的功能,以免這些活動對現(xiàn)有IT資源的可用性造成沒有必要的影響和破壞;同時,他還要實現(xiàn)在工單中產生的變化進行后審計的功能。3.4.7配置管理配置管理流程負責核實IT基礎設施和應用系統(tǒng)中實施的變更以及配置項之間的關系是否已經被正確記錄下來;確保配置管理數(shù)據(jù)庫能夠準確地反映現(xiàn)存配置項的實際版本狀態(tài)。配置管理實際上是全部IT資源的統(tǒng)一管理的功能,包括IT資源整個生命周期的參數(shù)或配置的變化記錄的管理。管理信息主要涉及分類、型號、版本、位置,狀態(tài)、相關資料等基本信息還包括核心參數(shù)等3.4.8知識庫管理知識庫管理:知識庫是提供給IT運維人員重要的技術資料內容,他匯集在工作的遇到的典型案例歸納總結的知識要點和全面實用資料手冊。在本系統(tǒng)中,知識庫管理提供便于使用的人機接口、快速查詢的技術手段和維護手段。3.4.9統(tǒng)計及工作報告運維管理系統(tǒng)提供一線解決率統(tǒng)計、客戶滿意度統(tǒng)計、按分類的事件匯總統(tǒng)計、工作報告生成的功能,按照一定格式根據(jù)事件數(shù)據(jù)、工單數(shù)據(jù)、問題數(shù)據(jù)、配置數(shù)據(jù)、變更數(shù)據(jù)可以幫助運維管理者能把運維的所做的工作內容清晰的羅列出來。4、運維服務內容4.1服務目標運維項目組提供的運行維護服務包括,信息系統(tǒng)相關的主機設備、操作系統(tǒng)、數(shù)據(jù)庫和存儲設備的運行維護服務,保證用戶現(xiàn)有的信息系統(tǒng)的正常運行,降低整體管理成本,提高網(wǎng)絡信息系統(tǒng)的整體服務水平。同時根據(jù)日常維護的數(shù)據(jù)和記錄,提供用戶信息系統(tǒng)的整體建設規(guī)劃和建議,更好的為用戶的信息化發(fā)展提供有力的保障。用戶信息系統(tǒng)的組成主要可分為兩類:硬件設備和軟件系統(tǒng)。硬件設備包括網(wǎng)絡設備、安全設備、主機設備、存儲設備等;軟件設備可分為操作系統(tǒng)軟件、典型應用軟件(如:數(shù)據(jù)庫軟件、中間件軟件等)、業(yè)務應用軟件等。服務項目范圍覆蓋的信息系統(tǒng)資源以下方面的關鍵狀態(tài)及參數(shù)指標:運行狀態(tài)、故障情況配置信息可用性情況及健康狀況性能指標IT資產統(tǒng)計服務服務內容包括:硬件設備型號、數(shù)量、版本等信息統(tǒng)計記錄軟件產品型號、版本和補丁等信息統(tǒng)計記錄網(wǎng)絡結構、網(wǎng)絡路由、網(wǎng)絡IP地址統(tǒng)計記錄綜合布線系統(tǒng)結構圖的繪制其它附屬設備的統(tǒng)計記錄4.3網(wǎng)絡、安全系統(tǒng)運維服務從網(wǎng)絡的連通性、網(wǎng)絡的性能、網(wǎng)絡的監(jiān)控管理三個方面實現(xiàn)對網(wǎng)絡系統(tǒng)的運維管理。設備基礎性能檢測:cpu、內存使用情況監(jiān)測;設備日志查看;設備snmp狀態(tài);測試Ping,tracert等工具的連通性;網(wǎng)絡安全策略應用是否正常;Internet帶寬流量的實時監(jiān)測;網(wǎng)絡拓撲鏈路狀態(tài)監(jiān)測;異常網(wǎng)絡數(shù)據(jù)包流量;Dos、ddos等網(wǎng)絡攻擊情況監(jiān)測;Internet線路的誤碼率、丟包率監(jiān)測;4.4主機、存儲系統(tǒng)運維服務提供的主機、存儲系統(tǒng)的運維服務包括:主機、存儲設備的日常監(jiān)控,設備的運行狀態(tài)監(jiān)控,故障處理,操作系統(tǒng)維護,補丁升級等內容。進行監(jiān)控管理的內容包括:CPU性能管理;內存使用情況管理;硬盤利用情況管理;系統(tǒng)進程管理;主機性能管理;實時監(jiān)控主機電源、風扇的使用情況及主機機箱內部溫度;監(jiān)控主機硬盤運行狀態(tài);監(jiān)控主機網(wǎng)卡、陣列卡等硬件狀態(tài);監(jiān)控主機HA運行狀況;主機系統(tǒng)文件系統(tǒng)管理;監(jiān)控存儲交換機設備狀態(tài)、端口狀態(tài)、傳輸速度;監(jiān)控備份服務進程、備份情況(起止時間、是否成功、出錯告警);監(jiān)控記錄磁盤陣列、磁帶庫等存儲硬件故障提示和告警,并及時解決故障問題;對存儲的性能(如高速緩存、光纖通道等)進行監(jiān)控。4.5數(shù)據(jù)庫系統(tǒng)運維服務提供的數(shù)據(jù)庫運行維護服務是包括主動數(shù)據(jù)庫性能管理,數(shù)據(jù)庫的主動性能管理對系統(tǒng)運維非常重要。通過主動式性能管理可了解數(shù)據(jù)庫的日常運行狀態(tài),識別數(shù)據(jù)庫的性能問題發(fā)生在什么地方,有針對性地進行性能優(yōu)化。同時,密切注意數(shù)據(jù)庫系統(tǒng)的變化,主動地預防可能發(fā)生的問題。進行監(jiān)控管理的內容包括:數(shù)據(jù)庫基本信息:文件系統(tǒng)、碎片、死鎖、CPU占用率較大或時間較長的SQL語句。表空間使用信息監(jiān)測;數(shù)據(jù)庫文件I/0讀寫情況;Session連接數(shù)量監(jiān)控;數(shù)據(jù)庫監(jiān)聽運行狀態(tài)監(jiān)測;查看每日數(shù)據(jù)備份、數(shù)據(jù)同步是否正常;報警日志監(jiān)測;對表和索引進行Analyze,檢查表空間碎片;檢測數(shù)據(jù)庫后臺進程;數(shù)據(jù)庫對象的空間擴展情況監(jiān)測;4.6中間件運維服務中間件管理是指對BEAWeblogic、tomcat、MQ等中間件的日常維護管理和監(jiān)控工作,提高對中間件平臺事件的分析解決能力,確保中間件平臺持續(xù)穩(wěn)定運行。中間件監(jiān)控指標包括配置信息管理、故障監(jiān)控、性能監(jiān)控。執(zhí)行線程:監(jiān)控中間件配置執(zhí)行線程的空閑數(shù)量。JVM內存:JVM內存曲線正常,能夠及時的進行內存空間回收。JDBC連接池:連接池的初始容量和最大容量應該設置為相等,并且至少等于執(zhí)行線程的數(shù)量,以避免在運行過程中創(chuàng)建數(shù)據(jù)庫連接所帶來的性能消耗。檢查中間件日志文件是否有異常報錯如果有中間件集群配置,需要檢查集群的配置是否正常。4.7終端、外設運維服務負責對終端PC、筆記本以及工作站的操作系統(tǒng)、應用軟件和硬件的維護,解決使用人員在應用過程中遇到的問題并進行簡單培訓,完成打印機等其他外設的故障處理工作。5、應急服務響應措施運維項目組制定了詳盡的應急處理預案,整個流程嚴謹而有序。但在服務維護過程中,意外情況將難以完全避免。我們將對項目實施的突發(fā)風險進行詳細分析,并且針對各類突發(fā)事件,設計了相應的預防與解決措施,同時提供了完整的應急處理流程。5.1應急預案實施基本流程已解決已解決擴大應急發(fā)現(xiàn)故障啟動應急預案,并通知領導按事件流程處理初步判定故障恢復聯(lián)系技術支持處理聯(lián)系開發(fā)人員或廠家工程師現(xiàn)場處理一般事件突發(fā)事件總結,修訂應急預案已解決未解決突發(fā)事件應急組未解決已解決匯報進度匯報進度匯報增援記錄5.2突發(fā)事件應急策略(1)值班人員平時應做好應急事件的監(jiān)控工作,對于突發(fā)事件應認真分析、準確判定故障發(fā)生的數(shù)據(jù)域,負責跟蹤該事件直至其結束。對于不在運維中心的故障,應在第一時間內通知負責人去現(xiàn)場處理,密切關注事件流程及進展情況,并做好登記工作上報領導。(2)正常情況下,要求值班人員在10分鐘內進行事件確認。如果屬于一般事件則按照事件流程進行分派處理,否則應迅速啟動《應急預案》,并嚴格按照《應急預案》所規(guī)定的步驟快速實施應急處置,及時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論