信息系統(tǒng)運維項目方案.doc_第1頁
信息系統(tǒng)運維項目方案.doc_第2頁
信息系統(tǒng)運維項目方案.doc_第3頁
信息系統(tǒng)運維項目方案.doc_第4頁
信息系統(tǒng)運維項目方案.doc_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、信息系統(tǒng)運維服務方案2009 年6月目錄1服務內容 .31.1信息資產統(tǒng)計服務 .31.2網絡、安全系統(tǒng)運維服務.31.3主機、存儲系統(tǒng)運維服務.61.4數據庫系統(tǒng)運維服務 .91.5中間件運維服務 .102運維服務流程 .123服務管理制度規(guī)范 .143.1服務時間 .143.2行為規(guī)范 .153.3現場服務支持規(guī)范 .153.4問題記錄規(guī)范 .154應急服務響應措施 .174.1應急基本流程 .174.2預防措施 .174.3突發(fā)事件應急策略 .181 服務內容1.1 信息資產統(tǒng)計服務此項服務為基本服務,包含在運行維護服務中,幫助我們對用戶現有的信息資產情況進行了解,更好的提供系統(tǒng)的運行維

2、護服務。服務內容包括:? 硬件設備型號、數量、版本等信息統(tǒng)計記錄? 軟件產品型號、版本和補丁等信息統(tǒng)計記錄? 網絡結構、網絡路由、網絡 IP 地址統(tǒng)計記錄? 綜合布線系統(tǒng)結構圖的繪制? 其它附屬設備的統(tǒng)計記錄1.2 網絡、安全系統(tǒng)運維服務從網絡的連通性、網絡的性能、網絡的監(jiān)控管理三個方面實現對網絡系統(tǒng)的運維管理。網絡、安全系統(tǒng)基本服務內容:序號服務模塊內容描述提供方1現場備件安裝配合用戶進行,按備件到達現場公司時間工程師到達現場2現場軟件升級首先分析軟件升級的必要性和風公司險,配合用戶進行軟件升級按服務級別: 724 小時公司3 現場故障診斷58 小時4電話遠程技術支持724 小時公司5問題管

3、理系統(tǒng)對遇到的問題進行匯總和發(fā)布公司網絡核心交換機巡視典型作業(yè)計劃書系統(tǒng)管理單位:維保單位:設備名:設備型號:管理 IP:檢查內容參考標準檢查結果檢查結論巡視方法描述巡檢周期硬件電源運行狀態(tài)正常異常運行風扇運行狀態(tài)正常異常狀態(tài)模塊運行狀態(tài)正常異常系統(tǒng)VLAN狀態(tài)正常異常運行配置狀態(tài)正常異常狀態(tài)檢查OSPF狀態(tài)正常異常日志日志狀態(tài)正常異常檢查其他正常異常檢查正常異常內容正常異常(1) 用戶現場技術人員值守公司可根據用戶的需求提供長期的用戶現場技術人員值守服務,保證網絡的實時連通和可用,保障接入交換機、 匯聚交換機和核心交換機的正常運轉。 現場值守的技術人員每天記錄網絡交換機的端口是否可以正常使用

4、, 網絡的轉發(fā)和路由是否正常進行,交換機的性能檢測, 進行整體網絡性能評估, 針對網絡的利用率進行優(yōu)化并提出網絡擴容和優(yōu)化的建議?,F場值守人員還進行安全設備的日常運行狀態(tài)的監(jiān)控,對各種安全設備的日志檢查,對重點事件進行記錄, 對安全事件的產生原因進行判斷和解決, 及時發(fā)現問題,防患于未然。同時能夠對設備的運行數據進行記錄,形成報表進行統(tǒng)計分析,便于進行網絡系統(tǒng)的分析和故障的提前預知。具體記錄的數據包括:? 配置數據? 性能數據? 故障數據(2) 現場巡檢服務現場巡檢服務是公司對客戶的設備及網絡進行全面檢查的服務項目,通過該服務可使客戶獲得設備運行的第一手資料,最大可能地發(fā)現存在的隱患,保障設備

5、穩(wěn)定運行。同時,公司將有針對性地提出預警及解決建議,使客戶能夠提早預防,最大限度降低運營風險。巡檢包括的內容如下:編號巡檢內容硬件運行狀態(tài)檢查項目1單板狀態(tài)檢查電源模塊狀態(tài)檢查風扇狀態(tài)檢查整機指示燈狀態(tài)檢查機框防塵網檢查機房溫度、濕度檢查設備地線檢查軟件運行情況檢查項目2設備運行情況檢查網絡報文分析設備對接運行狀況檢查路由運行情況檢查3網絡整體運行情況調查網絡運行問題調查網絡變更情況調查網絡歷史故障調查(3) 網絡運行分析與管理服務網絡運行分析與管理服務是指公司工程師通過對網絡運行狀況、網絡問題進行周期性檢查、分析后, 為客戶提出指導性建議的一種綜合性高級服務,其內容包括:服務內容服務優(yōu)點向客

6、戶提供網絡專家電話號碼。保證重大問題第一連線至網絡專家。網絡專家組每周與客戶進行不少于2 小時的以最小成本保證及時解答客戶關心的技術問電話技術交流題,并就某一領域技術問題展開深層次溝通。每月向客戶提交CASE 匯總分析報告,并可使客戶了解網絡歷史故障情況以及故障預防擴展到每年17 次(月度、季度、年度)建議,最大程度減少網絡故障隱患,更高效的進行網絡管理。(4) 重要時刻專人值守服務公司深刻知道保證重要時刻設備穩(wěn)定運行對客戶成功尤為關鍵,因此,公司可對客戶提供重要時刻的專人現場值守支持,包括政府客戶的重大會議期間、金融客戶的年終結算日、 運營商客戶的生產網重大割接或其它任何客戶認為可能對其業(yè)務

7、運營產生重大影響的時刻。如需專人值守,客戶需至少提前3 周與授權服務商客戶服務經理聯系。對每位合約客戶, 授權服務商均需按事先合同約定提供專人值守服務。客戶如需超出合同約定范圍的更多值守支持,需額外支付相應人力和差旅費用。1.3 主機、存儲系統(tǒng)運維服務公司提供的主機、存儲系統(tǒng)的運維服務包括:主機、存儲設備的日常監(jiān)控,設備的運行狀態(tài)監(jiān)控,故障處理,操作系統(tǒng)維護,補丁升級等內容。主機存儲系統(tǒng)基本服務內容:序號服務模塊內容描述提供方1現場備件安裝配合用戶進行。 按備件到達現場時間工程設備廠商、師到達現場公司消除軟件漏洞給系統(tǒng)帶來的安全隱患,并公司2補丁服務對安裝補丁所引起的系統(tǒng)連鎖反應進行合理的平衡

8、。3升級服務對系統(tǒng)進行軟件或硬件的升級,以改進、公司完善現有系統(tǒng)或消除現有系統(tǒng)的漏洞。按服務級別: 724 小時公司4 現場故障診斷58 小時5電話遠程技術支持724 小時公司6問題管理系統(tǒng)對遇到的問題進行匯總和發(fā)布公司對客戶系統(tǒng)的括主機、存儲設備、 操作系7 系統(tǒng)優(yōu)化統(tǒng)、提供優(yōu)化服務。公司現場值守人員可進行監(jiān)控管理的內容包括:? CPU 性能管理;? 內存使用情況管理;? 硬盤利用情況管理;? 系統(tǒng)進程管理;? 主機性能管理;? 實時監(jiān)控主機電源、風扇的使用情況及主機機箱內部溫度;? 監(jiān)控主機硬盤運行狀態(tài);? 監(jiān)控主機網卡、陣列卡等硬件狀態(tài);? 監(jiān)控主機 HA 運行狀況;? 主機系統(tǒng)文件系統(tǒng)

9、管理;? 監(jiān)控存儲交換機設備狀態(tài)、端口狀態(tài)、傳輸速度;? 監(jiān)控備份服務進程、備份情況(起止時間、是否成功、出錯告警) ;? 監(jiān)控記錄磁盤陣列、磁帶庫等存儲硬件故障提示和告警,并及時解決故障問題;? 對存儲的性能(如高速緩存、光纖通道等)進行監(jiān)控。小型機系統(tǒng)巡檢典型作業(yè)計劃書(HP 服務器部分)系統(tǒng)管理單位:XX 供電公司設備名:設備型號設備序列號管理 IP:硬件運行狀態(tài)系統(tǒng)檢查系統(tǒng)性能檢查數據庫運行狀態(tài)集群檢查存儲檢查檢查內容參考標準檢查結果狀態(tài)是否正常巡檢方法描述巡檢周期電源指示燈正常異常面板指示燈正常異常內置磁帶機正常異常CPU 狀態(tài)正常異常內存狀態(tài)正常異常磁盤狀態(tài)正常異常網卡狀態(tài)正常異常

10、HBA 卡運行狀態(tài)正常異常系統(tǒng)日志正常異常Mail正常異常文件系統(tǒng),包括磁盤正常異常卷剩余空間硬件檢測正常異常交換分區(qū)正常異常固件版本正常異常補丁包版本正常異常系統(tǒng)鏡像正常異常存儲磁盤正常異常存儲驅動正常異常進程狀態(tài)正常異常CPU 利用率正常異常內存利用率正常異常磁盤 I/O 性能正常異常數據庫安裝目錄正常異常數據庫進程狀態(tài)正常異常集群進程狀態(tài)正常異常集群日志正常異常存儲設備故障燈狀態(tài)正常異常SAN 交換機端口狀態(tài)正常異常存儲交換機環(huán)境狀態(tài)正常異常系統(tǒng)故障報告正常異常1.4 數據庫系統(tǒng)運維服務公司提供的數據庫運行維護服務是包括主動數據庫性能管理,數據庫的主動性能管理對系統(tǒng)運維非常重要。 通過主

11、動式性能管理可了解數據庫的日常運行狀態(tài),識別數據庫的性能問題發(fā)生在什么地方,有針對性地進行性能優(yōu)化。同時,密切注意數據庫系統(tǒng)的變化,主動地預防可能發(fā)生的問題。公司提供的數據庫運行維護服務還包括快速發(fā)現、診斷和解決性能問題,在出現問題時,及時找出性能瓶頸,解決數據庫性能問題,維護高效的應用系統(tǒng)。公司的數據庫運行維護服務,主要工作是使用技術手段來達到管理的目標,以系統(tǒng)最終的運行維護為目標,提高用戶的工作效率。具體數據庫運行維護監(jiān)控的基本服務內容包括:序號服務模塊內容描述提供方每周 7 天,每天 24 小時支持中心電話,電子郵件答詢,以滿足業(yè)務發(fā)展的需要。Oracle 產品技術專家直接同客戶對話,

12、幫助解決客1Oracle 數據庫戶提出的疑難問題。公司7*24 電話支持服務根據問題的嚴重程度, 將優(yōu)先解決客戶認為是關鍵而緊急的任務。對客戶提出的一般性問題進行技術咨詢、指導。定期的客戶管理報告 , 避免問題再度發(fā)生。數據庫宕機2Oracle 數據庫產品數據壞塊公司現場服務響應影響業(yè)務不能進行的產品問題軟件產品的更新及維護。對系統(tǒng)的配置及運作框架提出建議,以幫助您得到一個更堅強可靠的運作環(huán)境Oracle 數據庫產品降低系統(tǒng)潛在的風險,包括數據丟失、安全漏洞、3系統(tǒng)崩潰、性能降低及資源緊張公司系統(tǒng)健康檢查檢查并分析系統(tǒng)日志及跟蹤文件,發(fā)現并排除數據庫系統(tǒng)錯誤隱患檢查數據庫系統(tǒng)是否需要應用最新的

13、補丁集序號服務模塊內容描述提供方檢查數據庫空間的使用情況協助進行數據庫空間的規(guī)劃管理檢查數據庫備份的完整性監(jiān)控數據庫性能確認系統(tǒng)的資源需求明確您系統(tǒng)的能力及不足優(yōu)化 Oracle Server的表現通過改善系統(tǒng)環(huán)境的穩(wěn)定性來降低潛在的系統(tǒng)宕機時間分析用戶的應用類型和用戶行為評價并修改 ORACLE 數據庫的參數設置評價并調整 ORACLE 數據庫的數據分布4Oracle 數據庫產品評價應用對硬件和系統(tǒng)的使用情況,并提出建議公司性能調優(yōu)利用先進的性能調整工具實施數據庫的性能調整培訓用戶有關性能調整的概念提供用戶完整的性能調整報告和解決方法1.5 中間件運維服務中間件管理是指對 BEA Weblo

14、gic、MQ 等中間件的日常維護管理和監(jiān)控工作,提高對中間件平臺事件的分析解決能力,確保中間件平臺持續(xù)穩(wěn)定運行。中間件監(jiān)控指標包括配置信息管理、故障監(jiān)控、性能監(jiān)控。執(zhí)行線程:監(jiān)控 WebLogic 配置執(zhí)行線程的空閑數量。JVM 內存: JVM 內存曲線正常,能夠及時的進行內存空間回收。JDBC 連接池:連接池的初始容量和最大容量應該設置為相等,并且至少等于執(zhí)行線程的數量,以避免在運行過程中創(chuàng)建數據庫連接所帶來的性能消耗。檢查 WEBLOG 日志文件是否有異常報錯如果有 WEBLOG集群配置,需要檢查集群的配置是否正常。2 運維服務流程公司建議用戶采用的服務方式為兩種:一種為技術人員現場值守,

15、另一種是定期巡檢結合故障現場服務。技術人員現場值守運行維護服務的基本操作流程如下圖所示:IT資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資定期巡檢結合故障現場運行維護服務的基本操作流程如下圖所示:IT資資資資資資資資資資資資資資資資資資7*24 資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資MICROSOFT CORPORATION資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資資

16、資資資資資資資資3 服務管理制度規(guī)范3.1 服務時間(1) 接收服務請求和咨詢:在 5*8 小時工作時間內設置由專人職守的熱線電話,接聽內部的服務請求,并記錄服務臺事件處理結果。(2) 在非工作時間設置有專人 7*24 小時接聽的移動電話熱線,用于解決內部的技術問題以及接聽 7*24 小時機房監(jiān)控人員的機房突發(fā)情況匯報。(3) 服務響應時間:故障級別響應時間故障解決時間I 級:屬于緊急問題; 其具體現象為: 系統(tǒng)崩30 分鐘, 2 小時內12 小時以內潰導致業(yè)務停止、數據丟失。提交故障處理方案II 級: 屬于嚴重問題;其具體現象為:出現30分鐘, 2 小時內部分部件失效、 系統(tǒng)性能下降但能正常

17、運行,24 小時以內提交故障處理方案不影響正常業(yè)務運作。III 級:屬于較嚴重問題;其具體現象為:出30分鐘, 2 小時內現系統(tǒng)報錯或警告,但業(yè)務系統(tǒng)能繼續(xù)運行48 小時以內提交故障處理方案且性能不受影響。IV 級:屬于普通問題;其具體現象為:系統(tǒng)30分鐘, 2 小時內技術功能、安裝或配置咨詢,或其他顯然不5 天內提交故障處理方案影響業(yè)務的預約服務。技術支持人員在解決故障時,會最大限度保護好數據,做好故障恢復的文檔,力爭恢復到故障點前的業(yè)務狀態(tài)。對于“系統(tǒng)癱瘓,業(yè)務系統(tǒng)不能運轉”的故障級別,如果不能于 12 小時內解決故障,公司將在16 小時內提出應急方案,確保業(yè)務系統(tǒng)的運行。故障解決后24

18、小時內,提交故障處理報告。說明故障種類、故障原因、故障解決中使用的方法及故障損失等情況。3.2 行為規(guī)范(1) 遵守用戶的各項規(guī)章制度,嚴格按照用戶相應的規(guī)章制度辦事。(2) 與用戶運行維護體系其他部門和環(huán)節(jié)協同工作,密切配合,共同開展技術支持工作。(3) 出現疑難技術、業(yè)務問題和重大緊急情況時,及時向負責人報告。(4) 現場技術支持時要精神飽滿,穿著得體,談吐文明,舉止莊重。接聽電話時要文明禮貌,語言清晰明了,語氣和善。(5) 遵守保密原則。對被支持單位的網絡、主機、系統(tǒng)軟件、應用軟件等的密碼、核心參數、業(yè)務數據等負有保密責任,不得隨意復制和傳播。3.3 現場服務支持規(guī)范運維服務人員要做到耐

19、心、細心、熱心的服務。工作要做到事事有記錄、事事有反饋、重大問題及時匯報。嚴格遵守工作作息時間, 嚴格按照服務工作流程操作。(1) 現場支持工程師應著裝整潔、言行禮貌大方,技術專業(yè),操作熟練、嚴謹、規(guī)范;現場支持時必須遵守用戶單位的相關規(guī)章制度。(2) 現場支持工程師在進行現場支持工作時必須在保證數據和系統(tǒng)安全的前提下開展工作。(3) 現場支持時出現暫時無法解決的故障或其他新的故障時,應告知用戶并及時上報負責人,尋找其他解決途徑。(4) 故障解決后,現場支持工程師要詳細記錄問題的發(fā)生時間、地點、提出人和問題描述,并形成書面文檔,必要時應向用戶介紹故障出現的原因及預防方法和解決技巧。3.4 問題

20、記錄規(guī)范根據使用人員提出問題的類別,將問題分為咨詢類問題和系統(tǒng)缺陷類問題二類:咨詢類問題是指通過服務熱線或現場解疑等方式能夠當場解決用戶提出的問題,具有問題解答直接、 快速和實時的特點, 該問題到現場支持人員處即可中止,對于該類問題的記錄可使用咨詢類問題記錄模版進行記錄。 系統(tǒng)缺陷類問題是指使用人員提出的問題涉及到系統(tǒng)相應環(huán)節(jié)的確認修改, 需要經過逐級提交、診斷、確認、處理和回復等環(huán)節(jié), 處理解決需要項目組的分析確認, 問題有解決方案后,將解決方案反饋給用戶。具體提交流程如下:(1) 問題提交。應用信息系統(tǒng)的用戶發(fā)現屬于系統(tǒng)缺陷類的問題時,填寫系統(tǒng)缺陷類問題提交單,提交服務支持中心。(2) 問

21、題分析。服務中心接到用戶提交的問題單,要組織相應人員對問題單中描述的問題進行分析研判, 確定問題的類型 (技術問題、業(yè)務問題或者操作問題 )。屬于技術問題, 提交服務中心技術人員對存在的問題提出具體的處理意見和建議; 屬于業(yè)務問題,提交服務中心業(yè)務人員進行處理;屬于操作問題,可安排相關人員對問題提出人進行解釋,并將系統(tǒng)缺陷類問題提交單轉為系統(tǒng)咨詢類問題提交單。(3) 問題確認、解決。服務中心的技術人員和業(yè)務人員收到系統(tǒng)缺陷類問題提交單后,對提交的問題進行歸類匯總和分析、確認??梢越鉀Q的,明確問題解決的具體處理建議和措施,經主管領導簽字同意后,交實施人員進行解決方案的實施。服務人員確認是否解決,

22、并將解決方法附在系統(tǒng)缺陷類問題提交單上反饋給問題提出人員。(4) 問題上報。 服務人員收到經業(yè)務或技術人員確認的系統(tǒng)缺陷類問題提交單后,上報服務中心。(5) 問題回復。服務中心根據提交問題的進行分析,制定解決方案并進行實施的解決,同時做好變更記錄。將解決方案匯總后及時向問題提交單位或問題交辦單位作出回復,并將分析過程和問題產生原因一并提交。4 應急服務響應措施公司已經針對本項目制定了詳盡的設計、應急處理預案,整個流程嚴謹而有序。但是,在服務維護過程中,意外情況將難以完全避免。下面,我們將對項目實施的突發(fā)風險進行詳細分析,并且針對各類突發(fā)事件, 設計了相應的預防與解決措施,同時提供了完整的應急處

23、理流程。4.1 應急基本流程出現突發(fā)情況問題報告單報項目經理項目經理協調、處理處理記錄采取措施避免類似事件發(fā)生情況通報單結束維護服務應急處理流程4.2 預防措施針對上門服務過程中可能遇到的各種各樣的風險,公司總結多年維護服務經驗,針對一些可能出現的情況,制定了一系列預防處理措施,舉例如下:類型事件預防措施處理無法啟動軟件可執(zhí)行文上門人員提前準備好各將應用軟件數據文件備件類需維護軟件安裝程序份后,重新安裝應用軟件軟件打開過程中或運行上門人員準備好安裝程判斷出錯原因,備份數序,操作系統(tǒng)優(yōu)化和修補中異常錯誤關閉據,采取相關修復措施軟件,查殺病毒軟件操作系統(tǒng)使用者本機操作系統(tǒng)異準備好系統(tǒng)檢查程序及告知

24、使用者錯誤原因可類型事件預防措施處理?;蛳到y(tǒng)資源占用嚴重修補程序,以及查殺病毒能類型,提出解決方案,軟件經使用者認可后采取相應措施B/S 結構系統(tǒng), IE 瀏覽器準備流氓軟件清理程序、檢查 IE 瀏覽器選項設修復瀏覽器軟件、查殺病異?;驘o法下載控件置,分析原因進行修復毒軟件檢查網絡流量,流量異網絡或服B/S 結構系統(tǒng)網絡流量異判斷服務器是否異常,否常小則報修網絡服務務器?;蚍掌鞯卿洰惓t準備殺毒軟件商,流量異常大則查殺病毒4.3 突發(fā)事件應急策略系統(tǒng)運維應急方案是對中斷或嚴重影響業(yè)務的故障,如宕機、數據丟失、業(yè)務中斷等,進行快速響應和處理, 在最短時間內恢復業(yè)務系統(tǒng), 將損失降到最低。在系統(tǒng)維護過程中,突發(fā)事件的出現將是很難完全避免的,針對這種情況, 公司設計了完善的突發(fā)事件應急策略。系統(tǒng)巡檢人員要定期規(guī)范檢查各硬件設備的運轉情況和應用軟件運行情況,同時做好日常的數據增量備份和定期全備份。 對發(fā)現的問題在報各級負責人的同時,要協調相關資源分析問題根源, 確定解決方案和臨時解決措施, 避免造成更大的影響。問題得到穩(wěn)定或徹底解決

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論