數(shù)據(jù)中心日常運維及應(yīng)急處理方案_第1頁
數(shù)據(jù)中心日常運維及應(yīng)急處理方案_第2頁
數(shù)據(jù)中心日常運維及應(yīng)急處理方案_第3頁
數(shù)據(jù)中心日常運維及應(yīng)急處理方案_第4頁
數(shù)據(jù)中心日常運維及應(yīng)急處理方案_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)據(jù)中心日常運維及應(yīng)急處理方案數(shù)據(jù)中心日常運維及應(yīng)急處理方案/NUMPAGES6數(shù)據(jù)中心日常運維及應(yīng)急處理方案數(shù)據(jù)中心日常運維及應(yīng)急處理方案數(shù)據(jù)中心日常運維及應(yīng)急處理方案

數(shù)據(jù)中心要保持穩(wěn)定的運行,需要大量的專業(yè)技術(shù)人員。一般承擔重要業(yè)務(wù)的數(shù)據(jù)中心都是有人24小時值守,無人值守的數(shù)據(jù)中心一般只能承擔不重要業(yè)務(wù),完全無人管理運維的數(shù)據(jù)中心幾乎沒有。所以數(shù)據(jù)中心日常運維工作煩瑣,但又很重要。隨著人們的工作生活對數(shù)據(jù)的完全依賴,承載數(shù)據(jù)計算、運行的數(shù)據(jù)中心正發(fā)揮著越來越重要的作用,這更突顯出運維工作的重要。當一個數(shù)據(jù)中心建成投產(chǎn)后,運維工作就開始了,一直到數(shù)據(jù)中心的生命周期結(jié)束。一般我們可以將數(shù)據(jù)中心的運維工作分為四大類:一是日常檢查類;二是應(yīng)用變更、部署類;三是軟、硬件升級類;四是突發(fā)故障處理類,下面就來詳細說一說這些運維工作,讓大家對運維工作有個了解。1、數(shù)據(jù)中心日常運維工作、日常檢查“千里之堤,潰于蟻穴”。任何的故障在出現(xiàn)之前都可能會有所表現(xiàn),小的隱患不消除,可能導(dǎo)致重大的故障出現(xiàn),所以數(shù)據(jù)中心日常的例行檢查工作枯燥,但也很重要,可以及時發(fā)現(xiàn)一些運行中的隱患。根據(jù)數(shù)據(jù)中心承載業(yè)務(wù)重要性的不同,要對數(shù)據(jù)中心里的所有運行的設(shè)備進行例行檢查。一些數(shù)據(jù)中心設(shè)備廠商提供了檢查軟件,比如網(wǎng)管軟件,安全防護軟件等。可以利用這些軟件對數(shù)據(jù)中心網(wǎng)絡(luò)[注]進行檢查,看日志是否有異常告警,網(wǎng)絡(luò)是否出現(xiàn)過短時中斷,端口是否出現(xiàn)UP/DOWN等。通過網(wǎng)絡(luò)探測軟件看網(wǎng)絡(luò)質(zhì)量如何。檢查服務(wù)器應(yīng)用服務(wù)是否正常,CPU內(nèi)存等利用率是否正常。對應(yīng)用業(yè)務(wù)進行檢查,比如如果有搜索業(yè)務(wù),就可以通過服務(wù)器進行單詞搜索,看搜索的結(jié)果和延遲是否在正常的范圍之內(nèi)。這些檢查每日都要重復(fù)檢查,一旦有異常及時處理與消除,必要時將重要業(yè)務(wù)切換到備用環(huán)境中,然后排除后再切回。對數(shù)據(jù)中心的機房環(huán)境也要進行檢查,環(huán)境的溫度、濕度、灰塵是否合乎要求??照{(diào)、供電系統(tǒng)進行運行良好,設(shè)備運行是否過熱,地板、天窗、消防、監(jiān)控都是檢查的部分。不合理的地方要及時進行整改,而不應(yīng)該偷懶。經(jīng)常到一些數(shù)據(jù)中心,就會發(fā)現(xiàn)值班運維人員很多都抱著電腦在瀏覽網(wǎng)頁,打游戲。對于日常檢查應(yīng)付一下,甚至根本不去檢查,只要沒有出現(xiàn)故障,就打游戲消耗時間,這樣數(shù)據(jù)中心出現(xiàn)故障是遲早的事。一旦出現(xiàn)故障就毛手毛腳,甚至哪個業(yè)務(wù)走的哪個設(shè)備,哪個端口哪個網(wǎng)線都不清楚,本來一個小故障可能因為不熟悉導(dǎo)致大故障,因此日常檢查絕不能應(yīng)付,雖然需要不斷重復(fù),但卻很重要,在持續(xù)的檢查過程中,將會對數(shù)據(jù)中心的理解越來越深,這樣每次檢查都會有新的發(fā)現(xiàn),在檢查中進行學(xué)習(xí)。2、數(shù)據(jù)中心日常運維工作、應(yīng)用變更數(shù)據(jù)中心承載的業(yè)務(wù)不會是一成不變的,隨著業(yè)務(wù)的多樣化,經(jīng)常要對業(yè)務(wù)進行調(diào)整,包括服務(wù)器和網(wǎng)絡(luò)的設(shè)置。因此要對服務(wù)器和網(wǎng)絡(luò)設(shè)備操作很熟悉,主要需要掌握服務(wù)器命令和網(wǎng)絡(luò)協(xié)議。要根據(jù)應(yīng)用的需要,做出變更。這時就對運維人員提出了更高的要求,不僅是對數(shù)據(jù)中心原有業(yè)務(wù)要非常熟悉,還要對新上的應(yīng)用業(yè)務(wù)有正確的理解,這樣才能在不影響原有業(yè)務(wù)的基礎(chǔ)上做調(diào)整。這樣的應(yīng)用變更每個月可能都要做幾次,是數(shù)據(jù)中心運維人員的必修課,突顯了一個技術(shù)人員的基本技能水平。這時要對設(shè)備操作命令比較熟悉,懂得如何實現(xiàn)業(yè)務(wù),要經(jīng)常和設(shè)備廠商的技術(shù)人員打交道,通過交流盡快掌握設(shè)備操作方法。同時,由于設(shè)備廠商對應(yīng)用業(yè)務(wù)缺乏了解,這就需要運維人員在應(yīng)用業(yè)務(wù)和設(shè)備具體實現(xiàn)之間做好協(xié)調(diào),處理。以最快的時間和最小的代價完成應(yīng)用業(yè)務(wù)部署。3、數(shù)據(jù)中心日常運維工作、軟硬件升級數(shù)據(jù)中心的設(shè)備一般運行周期是五年,不斷地有設(shè)備需要逐漸淘汰進行更換,也有一些設(shè)備因為存在軟件缺陷需要升級,因此軟硬件升級也是運維工作的一部分,尤其是軟硬件出現(xiàn)故障時,就必須要進行更換。有時為了不影響業(yè)務(wù),往往還需要設(shè)備廠商提供軟件補丁來解決問題。數(shù)據(jù)中心的設(shè)備成百上千,出現(xiàn)軟硬件故障很正常,所以要不斷地進行軟硬件升級,這類工作往往都要在業(yè)務(wù)量最少的凌晨之后進行,運維人員通宵熬夜是常有的事,運維人員要有一個良好的身體素質(zhì),否則會吃不消。軟硬件升級時需要做好回退機制,以防升級出現(xiàn)問題時無法回退,業(yè)務(wù)長時間無法恢復(fù)。當接手數(shù)據(jù)中心運維工作就會發(fā)現(xiàn),怎么會有那么多的升級,幾乎每個月都要有升級操作,熬夜升級工作成了運維人員的家常便飯。4、數(shù)據(jù)中心日常運維工作、突發(fā)故障沒有任何一個數(shù)據(jù)中心是不出故障的,在數(shù)據(jù)中心運行的過程中都會出現(xiàn)這樣那樣的問題。這時就顯示出運維人員的高技能水平,根據(jù)統(tǒng)計百分之八十的故障都是人為故障,所以運維人員的水平高低往往決定了一個數(shù)據(jù)中心運行的穩(wěn)定程度。另外對于突發(fā)故障,高水平的運維人員可以靜下心來冷靜分析故障的觸發(fā)原因,迅速找到解決的方法,如果在短時間內(nèi)找不到解決方法,也可以通過切換到備用設(shè)備上先恢復(fù)業(yè)務(wù),再進行分析。這時擁有高水平的運維人員對于一個數(shù)據(jù)中心至關(guān)重要,在關(guān)鍵時刻就能派上用場。雖然這些工作看起來有些平常

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論