城商行數(shù)據(jù)中心運維轉(zhuǎn)型分析_第1頁
城商行數(shù)據(jù)中心運維轉(zhuǎn)型分析_第2頁
城商行數(shù)據(jù)中心運維轉(zhuǎn)型分析_第3頁
城商行數(shù)據(jù)中心運維轉(zhuǎn)型分析_第4頁
城商行數(shù)據(jù)中心運維轉(zhuǎn)型分析_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

城商行數(shù)據(jù)中心運維轉(zhuǎn)型分析

一、銀行數(shù)據(jù)中心運維的發(fā)展和演進

近年來,隨著移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、AI技術(shù)等金融科技業(yè)態(tài)逐步向傳

統(tǒng)金融領(lǐng)域滲透,銀行業(yè)務(wù)系統(tǒng)越來越龐大,系統(tǒng)之間的關(guān)聯(lián)越來越復雜,金

融科技的不斷發(fā)展一方面為傳統(tǒng)銀行業(yè)的跨越升級插上了騰飛的翅膀,另一方

面也給數(shù)據(jù)中心運維帶來了極大挑戰(zhàn)。業(yè)務(wù)的高速增長始終離不開運維的強有

力支撐,作為一名在銀行數(shù)據(jù)中心系統(tǒng)運維體系從業(yè)十來年的IT工作者,歷經(jīng)

了銀行數(shù)據(jù)中心從部件級運維到一體化發(fā)展的各個階段,數(shù)據(jù)中心的內(nèi)涵也從

單一數(shù)據(jù)存儲場所向智慧運營不斷演進。

(一)單一數(shù)據(jù)存儲階段

在單一數(shù)據(jù)存儲階段,數(shù)據(jù)中心的運維重點是服務(wù)器、存儲和網(wǎng)絡(luò),主要承擔

的功能是數(shù)據(jù)存儲和管理,集中存儲了銀行的業(yè)務(wù)數(shù)據(jù)。處于此階段的數(shù)據(jù)中

心功能比較單一,整體可用性低,業(yè)務(wù)連續(xù)性要求不高,僅僅便于數(shù)據(jù)的集中

存放和管理,面向單套業(yè)務(wù)系統(tǒng)的存儲和應(yīng)用,運維管理粗放,資源臺帳不

清,運維人員時刻處于“火線”邊緣。

(二)數(shù)據(jù)集成管理階段

數(shù)據(jù)集成管理階段是數(shù)據(jù)中心運維管理的轉(zhuǎn)型階段,此時數(shù)據(jù)中心組織專門的

人員進行集中維護,注重運維效率,為業(yè)務(wù)系統(tǒng)提供有效支撐。有些做得比較

好的數(shù)據(jù)中心已經(jīng)開始集成CMDB,自動化集成ITSM流程,通過云服務(wù)實現(xiàn)自

動化的服務(wù)交付,對系統(tǒng)維護上升到了管理的高度,從事中干預、事后處理慢

慢過渡到事前預防。業(yè)務(wù)連續(xù)性要求較高,IT系統(tǒng)的可用性已經(jīng)作為部門KPI

列入年度考核,數(shù)據(jù)中心要求有較高的穩(wěn)定性和可靠性。

(三)智慧運營階段

處于智慧運營階段的數(shù)據(jù)中心,從注重運維效率轉(zhuǎn)變?yōu)楦幼⒅剡\維質(zhì)量,業(yè)

務(wù)與科技深度融合,業(yè)務(wù)系統(tǒng)對數(shù)據(jù)中心的運維要求已不僅僅是支撐,而是提

供安全、持續(xù)、穩(wěn)定、有效的科技服務(wù),此階段的數(shù)據(jù)中心已經(jīng)演進成了金融

服務(wù)提供中心,服務(wù)流程趨于規(guī)范化、標準化、統(tǒng)一化,并通過信息技術(shù)實現(xiàn)

自動化管理。數(shù)據(jù)中心集成、管理和維護了各種資源,從技術(shù)運維轉(zhuǎn)向了技術(shù)

運營,實現(xiàn)基礎(chǔ)設(shè)施和服務(wù)實時交付,保證計算資源價值最大化。數(shù)據(jù)中心高

可用性和業(yè)務(wù)連續(xù)性要求高,重要信息系統(tǒng)應(yīng)用級災備覆蓋率達到100%,且具

備有效的異地數(shù)據(jù)級災備,災備接管時間為分鐘級。

二、城商行運維的痛點分析

中小型城商行受制于資產(chǎn)規(guī)模、科技投入、科技人才匱乏等因素,在科技人員

配置和資金投入時一般都是重開發(fā)輕運維,運維管理粗放,這就不可避免地暴

露了很多運維的問題和痛點。

(一)運維制度不規(guī)范

中小型城商行處于運維發(fā)展的初級階段,運維制度、操作流程、應(yīng)急預案、災

難恢復計劃書等制度性文件制定之后就束之高閣,沒有及時根據(jù)實際情況進行

修訂更新,使得運維工作無章可循,運維操作做不到規(guī)范化、標準化。運維制

度不規(guī)范的數(shù)據(jù)中心,人人都有一套運維標準,同樣的事情不同人處理都存在

差異,各崗位職責邊界界定不清,崗位之間協(xié)同性差,做事互相推諉,甚至怕

擔責任少做少錯,緊急問題得不到有效處置,從而運維事故頻發(fā),帶來極大的

安全隱患。

(二)運維流程不合理

如果制度是“心臟”,那流程就是“血液”,它貫穿整個工作范疇,引導運維

工作,界定具體的管理職責,運維流程的有效性和可操作性直接影響了運維質(zhì)

量和運維效率。數(shù)據(jù)中心需要制定切合自身的、實用的流程,缺乏有效流程管

理的數(shù)據(jù)中心,故障響應(yīng)時間慢,故障定界定位難,故障處理缺乏統(tǒng)一有序步

調(diào),問題跟蹤方式自成一派。缺乏流程指引就擺脫不了“煙囪式”運維,或

“救火式”運維,每位運維人員都是無頭蒼蠅一般的“救火隊員”,增加了人

為操作風險。

如今大多數(shù)中小型城商行的數(shù)據(jù)中心都部署了各類運維支撐工具或平臺,比如

ITSNk自動監(jiān)控平臺、堡壘機、日志管理平臺、災備切換平臺等,但大多數(shù)運

維場景下,這些工具平臺各自為政,沒有串聯(lián)形成體系,相互之間缺乏有效的

流程進行編排和管理,流程和工具的銜接存在斷層,協(xié)同調(diào)用依賴人工進行,

增加了運維投入但卻沒有簡化運維。

(三)運維技術(shù)水平低

在實際操作層,技術(shù)是運維的骨骼,強硬的技術(shù)實力是運維體系的底座支撐。

近年來,中小型城商行業(yè)務(wù)迅猛發(fā)展,基礎(chǔ)設(shè)施快速膨脹增加了運維管理的復

雜度,業(yè)務(wù)系統(tǒng)對"基礎(chǔ)設(shè)施提出了更高的運維服務(wù)要求。多設(shè)備、多廠家、

多產(chǎn)品導致運維復雜度攀升,為達到高效運維,就必須利用技術(shù)手段為不同技

術(shù)路線的系統(tǒng)環(huán)境提供統(tǒng)一的服務(wù)接口,整合事件處理、變更管理、服務(wù)請

求、配置管理等多項流程,將流程和操作一體化,同時還需要熟悉多平臺、多

業(yè)務(wù)、多工具的復合型運維人才。

但現(xiàn)實情況是,中小型城商行在運維投入上捉襟見肘,大多數(shù)運維手段還停留

在人工階段,自動化運維平臺沒有充分發(fā)揮應(yīng)有的效能,還需過多的人工干

預;在人才聘用方面,低于行業(yè)平均水平的薪資無法留住高技能人才,人員管

理不規(guī)范、晉引通道不清晰、行業(yè)地位低,造成運維人員變動大,維護人員技

能較低。

(四)應(yīng)急管理不高效

銀行業(yè)務(wù)具有較高的實時性和穩(wěn)定性要求,一些面向客戶、涉及賬務(wù)處理且時

效性要求較高的業(yè)務(wù)處理類、渠道類和涉及客戶風險等業(yè)務(wù)的管理類信息系統(tǒng)

已長期處于嚴格的監(jiān)管之下,若這些重要系統(tǒng)發(fā)生非計劃內(nèi)中斷,高效的應(yīng)急

管理顯得尤為重要。受限于自身原因,中小型城商行的應(yīng)急管理體系建設(shè)還不

夠全面,沒有形成自上而下的合力,產(chǎn)生了許多突出的問題。

1、風險防范意識不高

中小型城商行主要關(guān)注主營業(yè)務(wù)發(fā)展,普遍缺乏信息系統(tǒng)風險防范意識,從上

到下對信息系統(tǒng)的應(yīng)急管理都不夠重視,容易滋生信息系統(tǒng)重大安全事件,嚴

重威脅銀行的正常生產(chǎn)經(jīng)營,造成聲譽風險。

2、災備體系不清晰

應(yīng)急管理的一個重要組成部分就是災備管理,中小型城商行災備建設(shè)的主要目

的,是為了進行災備演練從而應(yīng)對監(jiān)管檢查,缺乏對災備體系的統(tǒng)籌思考和總

體架構(gòu)設(shè)計,這將導致災備系統(tǒng)架構(gòu)不清晰,延展性差,災備資源只能在演練

時使用,正常生產(chǎn)時間段得不到合理利用。

3、系統(tǒng)應(yīng)急預案不完善

應(yīng)急預案可用性不強,是中小型城商行的通病。大多數(shù)應(yīng)急預案流于形式,組

織架構(gòu)不清晰,職責分工不明確,可執(zhí)行性不強;甫些應(yīng)急預案只專注與操作

細節(jié),缺乏總體規(guī)劃和統(tǒng)籌安排;經(jīng)過了數(shù)次真實環(huán)境下的應(yīng)急演練之后,沒

有及時總結(jié)經(jīng)驗教訓,同步更新應(yīng)急預案。

三、城商行運維轉(zhuǎn)型的思考和對策

鑒于以上痛點分析,中小型城商行要實現(xiàn)運維轉(zhuǎn)型,必須要從根本上打破困

局。首先從思想上統(tǒng)一認識,從管理層開始自上而下認可運維工作的重要性;

然后制定并及時維護相關(guān)規(guī)章制度和操作流程,規(guī)范運維操作人員行為,降低

操作風險;最后才是最近提得比較多的,利用技術(shù)手段建設(shè)集中整合運維平

臺,實現(xiàn)運行、監(jiān)控、變更、應(yīng)急等流程一體化、自動化、智能化,達到智慧

運營的目的。具體的思考和對策如下:

(一)戰(zhàn)略層面一管理層關(guān)注

大部分中小型城商行均沒有配備專職CIO,信息科技部在銀行高級管理層眼里

僅僅是一個巨大的“成本中心”,不會產(chǎn)生實際效益,科技的重要性并沒有滲

透至管理層。隨著銀行業(yè)務(wù)的快速發(fā)展,信息科技風險以及由此帶來的衍生風

險并不亞于系統(tǒng)性金融風險,監(jiān)管部門對銀行信息科技的監(jiān)管也日趨嚴格。若

高級管理層可以從戰(zhàn)略層面重視信息科技,將業(yè)務(wù)與科技深度融合,關(guān)注科技

體制健康有序發(fā)展,科技賦能業(yè)務(wù),組建訓練有素的科技團隊,就能有效規(guī)避

各類生產(chǎn)運行風險,助力業(yè)務(wù)系統(tǒng)持續(xù)穩(wěn)定運行。數(shù)據(jù)中心是業(yè)務(wù)系統(tǒng)的總后

方,科技部領(lǐng)導也應(yīng)重視數(shù)據(jù)中心運維管理,為數(shù)據(jù)中心運維提供動能和驅(qū)動

力。

除了要重視運維,管理層也應(yīng)該為數(shù)據(jù)中心運維提供切實可行的指導思想,主

要表現(xiàn)在以下五個方面:一是標準化,要求完善制度制定和修訂,一切工作按

制度執(zhí)行,有章可循,在操作上嚴格要求規(guī)范化、標準化。二是自動化,進一

步提高監(jiān)控、配置、作業(yè)調(diào)度等工具使用,提升運維自動化水平,降低人員操

作失誤率和風險。三是集約化,深入推進“大運行”,并統(tǒng)籌考慮數(shù)據(jù)中心運

維一體化管理工作。四是自主化,加強人員培養(yǎng)和崗位技能考核,對關(guān)鍵系

統(tǒng)、關(guān)鍵崗位逐步實現(xiàn)自主運維。五是精細化,在運維工作的各個方面,不斷

量化,力求用數(shù)字說話,加大量化考核力度。

(二)戰(zhàn)術(shù)層面一做合規(guī)的事

以戰(zhàn)略規(guī)劃為指導思想,戰(zhàn)術(shù)層面需做到數(shù)據(jù)中心即應(yīng)用,在轉(zhuǎn)型過程中逐步

將數(shù)據(jù)中心運維流程合理合規(guī)化,實行運維的“全生命周期”管理,實現(xiàn)運維

體系自身的價值。主要表現(xiàn)為:一是提質(zhì),數(shù)據(jù)中心制定服務(wù)化,標準化的運

維流程,主動性預測預防,最小化的應(yīng)用中斷,減少系統(tǒng)故障率,提升業(yè)務(wù)系

統(tǒng)的用戶體驗度。二是增收,構(gòu)建應(yīng)用差異化計費體系,體現(xiàn)運維體系管道能

力,加快商業(yè)變現(xiàn)增加收益。三是增效,通過自動化設(shè)計提升運維效率、集約

化設(shè)計提升數(shù)據(jù)中心整體資源利用率和復用率,增加CPU算力負載和網(wǎng)絡(luò)負載

效率。四是降本,機器不是來取代人,而是將寶貴的人力成本投入到高價值領(lǐng)

域,通過自主化運維提升人員素質(zhì),加速人才轉(zhuǎn)型,降低綜合成本。

(三)實操層面一正確地做事

運維過程中出現(xiàn)的問題中,人為操作問題和流程設(shè)計問題各占40%,技術(shù)問題

占20%。因此,在實操層面,如何正確地做事,需要從運維人員、運維流程和

運維技術(shù)三方面進行討論。

1、運維人員

運維人員包括行內(nèi)運維人員和運維外包人員,人員組織架構(gòu)是核心,并且不斷

動態(tài)調(diào)整。從依賴廠商到自主可控,從標準化到腳本化,從半自動化到自動

化,不管如何調(diào)整,最終方向都是要培養(yǎng)自己的運維力量,做到自主運維。具

體需要做到分工明確、權(quán)責分明、及時響應(yīng)。運維人員要有貢任,有擔當,提

高自身技術(shù)能力,不過分依賴外包,不惹事,也不怕事。

2、運維流程

首先,運維工作中的每一個步驟都要有流程、有審批、可監(jiān)控、可追溯,與工

作相關(guān)的流程和規(guī)定,一定要經(jīng)常地,反復地修訂、調(diào)整,牢記于心;其次,

充分利用流程,理清崗位職責的邊界,完善標準化流程,對部門能提供的變更

能力做嚴格的梳理;最后,一定要嚴格遵守流程,流程正確+結(jié)果正確才是正

確,流程錯誤+結(jié)果正確仍然是錯誤,是態(tài)度問題;流程正確+結(jié)果錯誤是可以

原諒的,最多算能力問題。要建立流程來應(yīng)對“沒有流程”的場景,并且嚴格

遵守。

3、運維技術(shù)

運維技術(shù)就是運維工具,是各個廠家最熱衷于討論的主題,正如筆者前面所

提,運維技術(shù)稍遜于運維人員和運維流程,在運維管理中處于比較重要的地

位。良好的技術(shù)手段可以集成現(xiàn)有的分散流程,使得人員工作更加高效、更易

于培訓和控制,還可以減少手工重復性操作的成本,提升對操作的控制性。

各廠家五花八門的運維技術(shù)歸結(jié)到一點,就是通過統(tǒng)一管理實現(xiàn)數(shù)據(jù)中心工具

(技術(shù))、流程和制度間創(chuàng)新性融合,構(gòu)建統(tǒng)一的運維管理技術(shù)平臺,完成設(shè)

備選型、規(guī)劃、上架、故障處置、變更、調(diào)優(yōu)、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論