it運維個人述職報告.doc_第1頁
it運維個人述職報告.doc_第2頁
it運維個人述職報告.doc_第3頁
it運維個人述職報告.doc_第4頁
it運維個人述職報告.doc_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

it運維個人述職報告 導語:運維,這里指互聯(lián)網(wǎng)運維,通常屬于技術(shù)部門,與研發(fā)、測試、系統(tǒng)管理同為互聯(lián)網(wǎng)產(chǎn)品技術(shù)支撐的4大部門,這個劃分在國內(nèi)和國外以及大小公司間都會多少有一些不同。下面是為你準備的it運維個人述職報告,希望對你有幫助! 運維工程師對一個公司來說是非常重要的崗位,它本身所覆蓋的運維職責就很重要,所以,運維對其它關(guān)聯(lián)工種必須非常了解熟悉:網(wǎng)絡(luò)、系統(tǒng)、系統(tǒng)開發(fā)、存儲,安全,DB等。作為一個運維工程師我認為是集合網(wǎng)絡(luò)、系統(tǒng)、開發(fā)工作于一身的“復(fù)合型人才”,就如有些公司把一些合同采購都納入了運維職責范圍,還有如IDC網(wǎng)絡(luò)規(guī)劃也納入運維職責。 一.運維工程師崗位職責 1、參與設(shè)計、審核、優(yōu)化公司IT系統(tǒng)以及各應(yīng)用系統(tǒng)的體系架構(gòu); 2、全面負責公司運維項目的系統(tǒng)升級、擴容需求與資源落實,配合開發(fā)需求,測試、調(diào)整運維平臺; 3、負責網(wǎng)絡(luò)以及服務(wù)器的網(wǎng)絡(luò)設(shè)置、維護和優(yōu)化、網(wǎng)絡(luò)的安全監(jiān)控、系統(tǒng)性能管理和優(yōu)化、網(wǎng)絡(luò)性能管理和優(yōu)化; 4、建立面向開發(fā)部門,業(yè)務(wù)部門的服務(wù)流程和服務(wù)標準; 5、負責IT運維相關(guān)流程的規(guī)劃、設(shè)計、推行、實施和持續(xù)改進; 6、響應(yīng)及解決客戶的技術(shù)要求、疑問以及系統(tǒng)使用過程中遇到的各種問題; 7、負責日常網(wǎng)絡(luò)及各子系統(tǒng)管理維護。 8、負責設(shè)計并部署相關(guān)應(yīng)用平臺,并提出平臺的實施、運行報告。 9、負責配合開發(fā)搭建測試平臺,協(xié)助開發(fā)設(shè)計、推行、實施和持續(xù)改進。 10、負責相關(guān)故障、疑難問題排查處理,編制匯總故障、問題,定期提交匯總報告。 11、負責網(wǎng)絡(luò)監(jiān)控和應(yīng)急反應(yīng),以確保網(wǎng)絡(luò)系統(tǒng)有7*24小時的持續(xù)運作能力。 12、負責日常系統(tǒng)維護,及監(jiān)控,提供IT軟硬件方面的服務(wù)和支持,保證系統(tǒng)的穩(wěn)定。 13、負責服務(wù)過程中問題現(xiàn)象和處理方案的收集撰寫,形成知識庫,并對知識庫進行維護更新; 14、及時反饋技術(shù)處理過程中的異常情況,及時向部門負責人、服務(wù)開發(fā)PM、客戶經(jīng)理等相關(guān)人員報警;同時,主動協(xié)調(diào)資源推動問題解決; 15、定期對所有服務(wù)問題進行分析,并對服務(wù)效率有影響的問題提供反饋意見,提升服務(wù)支持團隊專業(yè)度; 二.怎樣才算是一個合格的運維工程師 1、保證服務(wù)達到要求的線上標準,如99.9%;保證線上穩(wěn)定,這是運維工程師的基本責職所在。 2、不斷的提升應(yīng)用的可靠性與健壯性、性能優(yōu)化、安全提升;這方面非??简炛鲃有院蛣?chuàng)新思維。 3、網(wǎng)站各層面監(jiān)控、統(tǒng)計的覆蓋度,軟件、硬件、運行狀態(tài),能監(jiān)控的都需要監(jiān)控統(tǒng)計,避免監(jiān)控死角、并能實時了解應(yīng)用的運轉(zhuǎn)情況。 4、通過創(chuàng)新思維解決運維效率問題;目前各公司大部份運維主要工作還是依賴人工操作干預(yù),需要盡可能的解放雙手。 5、運維知識的積累與沉淀、文檔的完備性,運維是一個經(jīng)驗性非常強的崗位,好的經(jīng)驗與陷阱都需積累下來,避免重復(fù)性范錯。 6、計劃性和執(zhí)行力;工作有計劃,計劃后想法設(shè)法達到目標,不找借口。 7、自動化運維;能對日常機械化工作進行提煉、設(shè)計并開發(fā)成工具、系統(tǒng),能讓系統(tǒng)自動完成的盡量依靠系統(tǒng);讓大家更多的時間用于思考、創(chuàng)新思維、做自已喜歡的事情。以上只是技術(shù)上的一些層面,當然個人意識也是很重要的。 三.運維管理注意事項 1、配置管理 (1)it資產(chǎn)配置管理:對it資產(chǎn)生命周期進行管理,包括分類統(tǒng)計、預(yù)購、選購審核、轉(zhuǎn)移審核、報廢審核,保證配置管理正確率達標; (2)建設(shè)案例庫:累積和提煉工程師的事件處理經(jīng)驗制作成案例,并持續(xù)豐富運維案例庫供查詢,案例覆蓋已知事件的比率達標,不斷提高運維工程師工作效率; (3)it系統(tǒng)配置信息管理:定期更新網(wǎng)絡(luò)及應(yīng)用系統(tǒng)描述信息及技術(shù)支持信息配置,保證最新;將配置文檔上傳至服務(wù)器端,方便團隊其他運維人員進行查看和操作。 2、監(jiān)控 主要包括故障監(jiān)控和性能、流量、負載等狀態(tài)監(jiān)控,這些監(jiān)控關(guān)系到集群的健康運行,及潛在問題的及時發(fā)現(xiàn)與干預(yù); (1)、服務(wù)故障、狀態(tài)監(jiān)控:主要是對服務(wù)器自身、上層應(yīng)用、關(guān)聯(lián)服務(wù)數(shù)據(jù)交互監(jiān)控;例如針對前端webserver,我們就可以有很多種類型的監(jiān)控,像zabbix,nagios,cacti等監(jiān)控程序。 (2)、其它就是集群狀態(tài)類的監(jiān)控或統(tǒng)計,為我們合理管理調(diào)優(yōu)集群提供數(shù)據(jù)參考、包括服務(wù)瓶頸、性能問題、異常流量、攻擊等問題。 3、故障管理 (1)、硬件故障問題;對于成百上千或上萬機器的N多集群,服務(wù)器死機、硬件故障概率是非常大的,幾乎每時每刻都有服務(wù)硬件問題,死機、硬盤損壞、電源、內(nèi)存、交換機。針對這種情況,我們在設(shè)計網(wǎng)站架構(gòu)時需要充分考慮到這些問題,并將其視為常態(tài);更多的依靠應(yīng)用的冗余機制來規(guī)避這種風險,給系統(tǒng)工程師足夠?qū)捲5奶幚頃r間。(如google不是號稱同時死800臺機器,服務(wù)不會受到任何影響嗎);這就是考驗運維工程師及網(wǎng)站架構(gòu)師功能的地方了,好的設(shè)計能達到google所描述自恢復(fù)能力,如gfs,糟糕的設(shè)計那就是一臺服務(wù)器的死機可能會造成大面積服務(wù)的連鎖故障反映,直接對用戶拒絕響應(yīng)。 (2)、應(yīng)用故障問題;可能是某一bug被觸發(fā)、或某一性能閥值被超越、攻擊等情況不一而定,但重要的一點,是要有對這些問題的預(yù)防性措施,不能想當然,它不會出問題,如真出問題了,如何應(yīng)對?這需要運維工程師平時做足功夫,包括應(yīng)急響應(yīng)速度、故障處理的科學性、備用方案的有效等。 4、問題管理 對事件進行統(tǒng)計分析,找出疑難、重復(fù)發(fā)生的事件,納入問題管理流程,分析問題產(chǎn)生的根本原因,確定可能解決的方案,需要修改網(wǎng)絡(luò)或應(yīng)用系統(tǒng)配置時提交變更申請觸發(fā)變更管理流程。 5、安全管理 (1)、操作人員隨時監(jiān)控中心設(shè)備運行狀況,發(fā)現(xiàn)異常情況應(yīng)立即按照應(yīng)急預(yù)案規(guī)程進行操作,并及時上報和詳細記錄。 (2)、未經(jīng)批準,不得在機房設(shè)備上隨意編寫、修改、更換各類軟件系統(tǒng)及更改設(shè)備參數(shù)配置; (3)、服務(wù)器系統(tǒng)的維護、增刪、配置的更改,必須按規(guī)定詳細記入相關(guān)記錄,并對各類記錄和檔案存檔。 (4)、機房工作人員應(yīng)恪守保密制度,不得擅自泄露信息資料與數(shù)據(jù)。 (5)、嚴禁在機房計算機設(shè)備上做與工作無關(guān)的事情(如聊天、玩游戲),對外來存儲設(shè)備(如U盤、移動硬盤等),做到先殺病毒后使用。 (6)、機房嚴禁亂拉接電源,應(yīng)不定期對機房內(nèi)設(shè)置的消防器材、煙霧報警、恒溫設(shè)備進行檢查,保障機房安全。 6、自動化運維 自動化:簡而言之,就是將我們?nèi)粘J謩舆M行的一些工作通過工具,系統(tǒng)自動來完成,解放我們的雙手及枯燥的重復(fù)性勞動,例如:沒有工具前,我們安裝系統(tǒng)需要一臺一臺裸機安裝,如2000臺,可能需要10人/10天,搞爛N張光盤,人力成本更大,而現(xiàn)在通過自動化工具,只需幾個簡單命令就能搞定、還有如機器人類程序,自動完成以往每天人工干預(yù)的工作,使其自動完成、匯報結(jié)果,并具備一定的專家系統(tǒng)能力,能做一些簡單的是/非判斷、優(yōu)化選擇等,這些好處非常明顯不再多說, 資料共享平臺 應(yīng)該說,自動化運維是運維工程師職業(yè)化的一個追求,利已利公,雖然這是一個異常艱巨的任務(wù):不斷變更的業(yè)務(wù)、不規(guī)范化的應(yīng)用設(shè)計、開發(fā)模式、網(wǎng)絡(luò)架構(gòu)變更、IDC變更、規(guī)范變動等因素,都可能會對現(xiàn)有自動化系統(tǒng)產(chǎn)生影響,所以需要模塊化、接口化、變因參數(shù)化等因此,自動化相關(guān)工作,是運維工程師的核心重點工作之一,也是價值的體現(xiàn)。 四、總結(jié) 綜上所述,做一個好的運維工程師,除了具備良好的綜合技能水平,還要有一個負責任的工作態(tài)度,這也是優(yōu)秀運維工程師具備的素質(zhì)。因為對于運維工程師而言,每一次故障的發(fā)生都不是小事,很可能會影響公司線上業(yè)務(wù)的穩(wěn)定性,甚至直接導致公司的經(jīng)濟損失,所以我認為對待工作中發(fā)生的故障以及事件要秉著一個“小事件,大處理”的原則,將發(fā)生的故障扼殺到搖籃里,慢慢地積

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論