puting云計(jì)算-.0培訓(xùn)2運(yùn)維_第1頁(yè)
puting云計(jì)算-.0培訓(xùn)2運(yùn)維_第2頁(yè)
puting云計(jì)算-.0培訓(xùn)2運(yùn)維_第3頁(yè)
puting云計(jì)算-.0培訓(xùn)2運(yùn)維_第4頁(yè)
puting云計(jì)算-.0培訓(xùn)2運(yùn)維_第5頁(yè)
已閱讀5頁(yè),還剩108頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

前言本章主要闡述了云數(shù)據(jù)中心中運(yùn)維的一些基本知識(shí),并簡(jiǎn)單介紹了云數(shù)據(jù)中心運(yùn)維的工作內(nèi)容技術(shù)第1頁(yè)?2018目標(biāo)學(xué)完本課程后,您將能夠:了解運(yùn)維工作的重要性了解常見的運(yùn)維場(chǎng)景了解運(yùn)維工作內(nèi)容技術(shù)第2頁(yè)?2018運(yùn)維背景運(yùn)維角色運(yùn)維工作內(nèi)容故障處理技術(shù)第3頁(yè)?2018數(shù)據(jù)中心管理的服務(wù)水平難以保證IT問題故障定位復(fù)雜缺乏資源

管理能力缺乏混合云管理能力業(yè)務(wù)管理粗放業(yè)務(wù)上線時(shí)間長(zhǎng)達(dá)30天以上無(wú)法精確匹配客戶的組織和流程模型管理成本高70%的數(shù)據(jù)中心采用了3種以上的管理工具?用巨大,減緩了數(shù)據(jù)中心的建設(shè)資源利用不合理資源利用率低,存在能耗的浪費(fèi)無(wú)法及時(shí)識(shí)別擴(kuò)容需求技術(shù)第4頁(yè)?2018運(yùn)維工作的重要性云計(jì)算是IT產(chǎn)業(yè)的第三次

,帶來了降本增效、彈性擴(kuò)展等

技術(shù)層面的價(jià)值,所有用戶的應(yīng)用都運(yùn)行在云計(jì)算的基礎(chǔ)之上,運(yùn)維工作保證了用戶的業(yè)務(wù)有穩(wěn)定的運(yùn)行環(huán)境。技術(shù)第5頁(yè)?2018數(shù)據(jù)中心運(yùn)維的目標(biāo)合規(guī)性可用性經(jīng)濟(jì)性服務(wù)性技術(shù)第6頁(yè)?2018數(shù)據(jù)中心架構(gòu)計(jì)算資源網(wǎng)絡(luò)資源資源應(yīng)用域服務(wù)域云通信管理部署服務(wù)應(yīng)用服務(wù)數(shù)據(jù)庫(kù)服務(wù)數(shù)據(jù)分析&AI服務(wù)安全服務(wù)網(wǎng)絡(luò)服務(wù)服務(wù)計(jì)算服務(wù)通信資源池應(yīng)用資源池關(guān)系型數(shù)據(jù)庫(kù)安全資源池對(duì)象資源池網(wǎng)絡(luò)資源池塊資源池物理資源池虛擬資源池資源池基礎(chǔ)設(shè)施安全資源技術(shù)第7頁(yè)?2018云運(yùn)維架構(gòu)計(jì)算資源網(wǎng)絡(luò)資源資源運(yùn)維層服務(wù)域云通信管理部署服務(wù)應(yīng)用服務(wù)數(shù)據(jù)庫(kù)服務(wù)數(shù)據(jù)分析&AI服務(wù)安全服務(wù)網(wǎng)絡(luò)服務(wù)服務(wù)計(jì)算服務(wù)通信資源池應(yīng)用資源池關(guān)系型數(shù)據(jù)庫(kù)安全資源池對(duì)象資源池網(wǎng)絡(luò)資源池塊資源池物理資源池虛擬資源池資源池基礎(chǔ)設(shè)施安全資源輔助工具OperationCenter云運(yùn)維管理Portal系統(tǒng)資源管理容量管理租戶資源管理儀表管理告警管理運(yùn)維安全性能管理敏捷報(bào)表FusionCare

G-ray

eSightELKFusionNetDoctorUpdateTool技術(shù)第8頁(yè)?2018運(yùn)維對(duì)象運(yùn)維對(duì)象子對(duì)象描述基礎(chǔ)設(shè)施服務(wù)器設(shè)備例如RH2288設(shè)備例如V3系列網(wǎng)絡(luò)設(shè)備例如交換機(jī)、資源池計(jì)算資源池計(jì)算資源池提供虛擬化計(jì)算資源,如:

、

pute、VMware,資源池資源池提供虛擬化

資源,如:FusionStorage

Block、SAN網(wǎng)絡(luò)資源池Neutron+、SDN云服務(wù)計(jì)算、

、等例如ECS、EVS、VPC、HWAF、RDS等云服務(wù)實(shí)例例如CES實(shí)例、CCS實(shí)例等應(yīng)用OS、DB、中間件等技術(shù)第9頁(yè)?2018運(yùn)維背景運(yùn)維角色運(yùn)維工作內(nèi)容故障處理技術(shù)第10頁(yè)?2018運(yùn)維場(chǎng)景-角色及其職責(zé)故障發(fā)現(xiàn)日常優(yōu)化分析歷史性能/報(bào)表分析故障定界日常工作目標(biāo)快速、及時(shí)發(fā)現(xiàn)問題對(duì)問題進(jìn)行初步定界完成定界的問題派發(fā)工單閉環(huán)問題處理過程關(guān)注內(nèi)容工單派發(fā)關(guān)注內(nèi)容故障處理工作目標(biāo)問題快速處理定期了解數(shù)據(jù)中心健康情況,進(jìn)行優(yōu)化分析并給出建議資產(chǎn)管理風(fēng)險(xiǎn)告警風(fēng)險(xiǎn)系統(tǒng)管理員關(guān)注內(nèi)容工作目標(biāo)做為超級(jí)管理員,配置系統(tǒng)管理系統(tǒng)報(bào)表分析系統(tǒng)配置安全管理員關(guān)注內(nèi)容工作目標(biāo)做為安全管理員,用戶管理日志審計(jì)License管理用戶管理日志分析技術(shù)第11頁(yè)?2018運(yùn)維場(chǎng)景-日常運(yùn)維檢查告警每周派發(fā)工單驗(yàn)證告警自動(dòng)清除查看待辦處理告警處理簡(jiǎn)單告警未解決問題簡(jiǎn)單問題報(bào)表導(dǎo)出性能/容量查看系統(tǒng)管理員運(yùn)維報(bào)表分析日常技術(shù)第12頁(yè)?2018系統(tǒng)管理員配置告警機(jī)制查看拓?fù)涮幚砗?jiǎn)單告警收到告警通知、發(fā)現(xiàn)異常、客戶反饋問題派發(fā)工單檢查告警是否自動(dòng)清除查看待辦查看異常對(duì)象詳情未解決問題解決問題配置告警機(jī)制檢查告警列表查看異常對(duì)象的

告警或性能完成初步定位處理完畢

關(guān)閉工單處理告警運(yùn)維場(chǎng)景-故障處理技術(shù)第13頁(yè)?2018運(yùn)維場(chǎng)景-實(shí)時(shí)的方式以獲取更及時(shí)的性能信息對(duì)于重要的設(shè)備或服務(wù)器,可以采用實(shí)時(shí)使用

也可以導(dǎo)出性能數(shù)據(jù)以進(jìn)一步分析/查看結(jié)果導(dǎo)出數(shù)據(jù)配置實(shí)時(shí)

視圖技術(shù)第14頁(yè)?2018運(yùn)維場(chǎng)景-報(bào)表查看/管理員創(chuàng)建周期性報(bào)表創(chuàng)建報(bào)表系統(tǒng)定時(shí)生成報(bào)表

并發(fā)送到郵箱配置報(bào)表Log選擇報(bào)表類型、報(bào)表資源、統(tǒng)計(jì)指標(biāo)等配置報(bào)表Log選擇報(bào)表類型、報(bào)表資源、統(tǒng)計(jì)指標(biāo)等生成報(bào)表分析數(shù)據(jù)中心整體運(yùn)行情況管理員技術(shù)第15頁(yè)?2018運(yùn)維場(chǎng)景-日志審計(jì)安全管理員運(yùn)維主管查看日志查看日志詳情確認(rèn)問題并匯報(bào)處理并記錄和歸檔相關(guān)結(jié)果完成任務(wù)處理決策正常異常技術(shù)第16頁(yè)?2018運(yùn)維背景運(yùn)維角色日常運(yùn)維工作內(nèi)容故障處理技術(shù)第17頁(yè)?2018前期準(zhǔn)備工作賬戶信息賬戶管理環(huán)境信息資料準(zhǔn)備系統(tǒng)/網(wǎng)絡(luò)信息人力矩陣健康檢查環(huán)境備件盤點(diǎn)技術(shù)第18頁(yè)?2018運(yùn)維工作內(nèi)容(1)-運(yùn)維工具部署運(yùn)維工具包括:第

工具,如:Putty、WinSCP、TeamView等自研工具,如:FusionCare、ManageOne等技術(shù)第20頁(yè)?2018運(yùn)維工作內(nèi)容(2)-系統(tǒng)升級(jí)系統(tǒng)升級(jí)可分為設(shè)計(jì)階段和實(shí)施階段。設(shè)計(jì)階段內(nèi)容包括:升級(jí)需求分析、制定升級(jí)方案(信息收集、

Checklist編寫、升級(jí)時(shí)長(zhǎng)評(píng)估、升級(jí)方式確定、升級(jí)影響和風(fēng)

險(xiǎn)評(píng)估、詳細(xì)升級(jí)步驟、升級(jí)驗(yàn)證方案、升級(jí)失敗應(yīng)急方案、

升級(jí)失敗回退方案)、升級(jí)方案評(píng)審。實(shí)施階段內(nèi)容包括:驗(yàn)證信息、準(zhǔn)備升級(jí)包、Checklist驗(yàn)證、備份、創(chuàng)建升級(jí)工程、執(zhí)行升級(jí)任務(wù)、檢查升級(jí)進(jìn)度、提交升級(jí)工程、清理升級(jí)數(shù)據(jù)、保存升級(jí)報(bào)告、檢查升級(jí)效果、更新局點(diǎn)信息技術(shù)第21頁(yè)?2018運(yùn)維工作內(nèi)容(3)-設(shè)備巡檢設(shè)備類型檢查項(xiàng)目頻率服務(wù)器設(shè)備狀態(tài)指示燈是否正常兩小時(shí)1、定期進(jìn)行Fusion

ServerTools檢查健康,了解系統(tǒng)的運(yùn)行狀況;2、對(duì)檢查出的結(jié)果進(jìn)行分析,對(duì)不合格項(xiàng)進(jìn)行處理;同時(shí)對(duì)于所列出指標(biāo)要特別關(guān)注;3、導(dǎo)出檢查結(jié)果,進(jìn)行綜合對(duì)比分析,了解指標(biāo)走勢(shì),提前識(shí)別風(fēng)險(xiǎn);4、 和郵件服務(wù)器系統(tǒng)對(duì)接,將檢查結(jié)果自動(dòng)郵件發(fā)送。每月設(shè)備狀態(tài)指示燈是否正常兩小時(shí)通過導(dǎo)出“運(yùn)行數(shù)據(jù)與系統(tǒng)日志”檢查

設(shè)備的健康度。1、征得客戶同意后在業(yè)務(wù)量低的時(shí)候操作;2、參照健康檢查工具的說明文檔,完成 巡檢,查看工具生成的結(jié)果,輸出巡檢報(bào)告;3、提交報(bào)告給客戶,向客戶提出改進(jìn)建議;4、檢查數(shù)據(jù) 的使用情況,了解當(dāng)前 資源使用情況以及各個(gè)LUN的使用情況;5、檢查業(yè)務(wù)運(yùn)行狀態(tài),如RAID、LUN、資源池等狀態(tài)。每月網(wǎng)絡(luò)設(shè)備狀態(tài)指示燈是否正常并且呈綠色兩小時(shí)檢查網(wǎng)路設(shè)備的運(yùn)行情況,鏈路狀態(tài)。1、征得客戶同意后在業(yè)務(wù)量低的時(shí)候操作;2、參照完成網(wǎng)絡(luò)巡檢,并輸出巡檢報(bào)告;3、提交報(bào)告給客戶,向客戶提出改進(jìn)建議。每月UPS設(shè)備UPS、市電倒換測(cè)試是否成功每月負(fù)載不大于85%兩小時(shí)查看運(yùn)行日志是否有異常兩小時(shí)輸出、輸入電壓是否正常兩小時(shí)配電設(shè)備電壓范圍是否正常兩小時(shí)配電柜狀態(tài)是否正常兩小時(shí)環(huán)境

采樣數(shù)據(jù)是否正常兩小時(shí)空調(diào)設(shè)備機(jī)房溫度濕度是否正常兩小時(shí)查看運(yùn)行日志是否有異常兩小時(shí)備件備件庫(kù)房環(huán)境,符合

環(huán)境要求;備件數(shù)量,滿足設(shè)備

的需要。每月技術(shù)第22頁(yè)?2018運(yùn)維工作內(nèi)容(4)-云平臺(tái)巡檢巡檢工具檢查項(xiàng)目頻率FusionCare日常巡檢(設(shè)置為定期自動(dòng)執(zhí)行,并在CNA或管理節(jié)點(diǎn)有變動(dòng)時(shí)更新巡檢列表)(選擇收集時(shí)間段為業(yè)務(wù)低峰進(jìn)行收集)每天深度巡檢(手工執(zhí)行,并在CNA或管理節(jié)點(diǎn)有變動(dòng)時(shí)更新巡檢列表)(選擇收集時(shí)間段為業(yè)務(wù)低峰進(jìn)行收集)每周升級(jí)前檢查(手工執(zhí)行,可對(duì)VM的熱遷移前提條件等進(jìn)行檢查)事件觸發(fā)信息收集(選擇收集時(shí)間段為業(yè)務(wù)低峰進(jìn)行收集)每季度ManageOneService

Center健康檢查(手工執(zhí)行)每月ManageOneOperation

Center健康檢查(手工執(zhí)行)每月ManageOneOperation

Center告警檢查(手工執(zhí)行)每天FusionSphereOpenStack

CPSWebUI日常巡檢(設(shè)置為定期自動(dòng)執(zhí)行,并在CNA或管理節(jié)點(diǎn)有變動(dòng)時(shí)更新巡檢列表)每周eSight檢查eSight相關(guān)進(jìn)程的運(yùn)行狀態(tài),及時(shí)發(fā)現(xiàn)并解決異常,保障eSight系統(tǒng)高效運(yùn)行。如果eSight進(jìn)程出現(xiàn)異常,與該進(jìn)程相關(guān)的

服務(wù)將無(wú)法正常運(yùn)行。每周災(zāi)備檢查災(zāi)備平臺(tái)運(yùn)行狀態(tài)每周技術(shù)第23頁(yè)?2018運(yùn)維工作內(nèi)容(5)-日志和告警處理告警等級(jí):一級(jí)問題:(Critical)立即處理二級(jí)問題:(Warning)立即處理三級(jí)問題:(Major)三天內(nèi)完成四級(jí)問題:(Information)七天內(nèi)完成并清理日志收集:、

AFusionSphere

OpenStackManageOneeSight技術(shù)第24頁(yè)?2018運(yùn)維工作內(nèi)容(6)-性能與容量類別檢查項(xiàng)目頻率注釋網(wǎng)絡(luò)需求ManageOne每年復(fù)查建議最低帶寬100M,網(wǎng)絡(luò)延時(shí)在100ms內(nèi)ManageOne與下層組件及其各組件

通訊每年復(fù)查建議最低帶寬100M,網(wǎng)絡(luò)延時(shí)在100ms內(nèi)eSight服務(wù)端與客戶端帶寬每年復(fù)查eSight服務(wù)器與客戶端間帶寬最低2M,建議10M以上性能基線處理器使用率實(shí)時(shí) ,使用OC檢查告警信息適用于GuestOS、Host

OS、Dom0/DomU處理器隊(duì)列實(shí)時(shí) ,使用OC檢查告警信息適用于Guest

OS、Host

OS、Dom0/DomU磁盤I/O實(shí)時(shí) ,使用OC檢查告警信息適用于GuestOS、Host

OS、Dom0/DomU內(nèi)存實(shí)時(shí) ,使用OC檢查告警信息適用于GuestOS、Host

OS、Dom0/DomU換頁(yè)空間實(shí)時(shí) ,使用OC檢查告警信息適用于Guest

OS、Host

OS、Dom0/DomU網(wǎng)絡(luò)實(shí)時(shí) ,使用OC檢查告警信息適用于GuestOS、Host

OS、Dom0/DomU技術(shù)第25頁(yè)?2018運(yùn)維工作內(nèi)容(6)-性能與容量類別檢查項(xiàng)目頻率注釋容量基線處理器每月檢查適用于Host

OS與云平臺(tái)各組件,對(duì)超出閾值的需要考慮進(jìn)行擴(kuò)容內(nèi)存每月檢查適用于Host

OS與云平臺(tái)各組件,對(duì)超出閾值的需要考慮進(jìn)行擴(kuò)容磁盤每月檢查適用于Host

OS與云平臺(tái)各組件,對(duì)超出閾值的需要考慮進(jìn)行擴(kuò)容網(wǎng)絡(luò)每月檢查適用于Host

OS與云平臺(tái)各組件,對(duì)超出閾值的需要考慮進(jìn)行擴(kuò)容License云計(jì)算產(chǎn)品License有效期每月檢查L(zhǎng)icense異?;蚴Ш笠皶r(shí)處理,否則影響系統(tǒng)的穩(wěn)定運(yùn)行網(wǎng)絡(luò)產(chǎn)品License有效期每月檢查產(chǎn)品License有效期每月檢查技術(shù)第26頁(yè)?2018運(yùn)維工作內(nèi)容(7)-可用性管理數(shù)據(jù)備份災(zāi)備演練Guest虛擬機(jī)重啟管理節(jié)點(diǎn)主備倒換生命周期檢查應(yīng)急事故處理故障演練技術(shù)第27頁(yè)?2018運(yùn)維工作內(nèi)容(8)-安全管理檢查項(xiàng)目具體描述頻率注釋賬戶角色權(quán)限定義必須使用最下權(quán)限使用原則,嚴(yán)禁對(duì)非管理賬戶賦予管理員權(quán)限每季度每季度對(duì)當(dāng)前環(huán)境賬戶列表進(jìn)行審視,清除離職或失效賬戶,重新審核賬戶權(quán)限是否符合最小權(quán)限原則安全設(shè)置檢查所有 策略設(shè)置每季度原則上不允許修改默認(rèn) 策略與修改原則首次登陸系統(tǒng)需要修改 ;定時(shí)修改90天使用最近4次使用的 作為新云平臺(tái)接入安全嚴(yán)禁將云平臺(tái)管理網(wǎng)段地址 至公網(wǎng),避免受到每季度共享賬戶檢查嚴(yán)禁使用共享賬戶,各管理員需創(chuàng)建個(gè)人賬戶,以便后續(xù)審計(jì)每季度日志CLOUD

Stack解決方案中各系統(tǒng)每季度檢測(cè)、漏洞掃描條件與工具請(qǐng)定期檢查每天發(fā)現(xiàn) 立刻處理;發(fā)現(xiàn) 及時(shí)修復(fù)安全補(bǔ)丁更新定期檢查產(chǎn)品通告,發(fā)現(xiàn)更新安全補(bǔ)丁根據(jù)緊急級(jí)別進(jìn)行根性每月技術(shù)第28頁(yè)?2018運(yùn)維工作內(nèi)容(9)-重大活動(dòng)保障技術(shù)第29頁(yè)?2018運(yùn)維背景運(yùn)維角色日常運(yùn)維工作內(nèi)容故障處理技術(shù)第30頁(yè)?2018故障處理故障處理是運(yùn)維工作之一,是最重要的工作,云數(shù)據(jù)中心故障處理具有以下特點(diǎn):突發(fā)性復(fù)雜性綜合性技術(shù)第31頁(yè)?2018故障處理流程用戶發(fā)現(xiàn)故障收運(yùn)維

到工單或故障通知聯(lián)系故障反饋人員了解情況發(fā)現(xiàn)故障記錄處理過程形成組織過程資產(chǎn)故障定位及排查關(guān)聯(lián)系相

確定故障技術(shù)第32頁(yè)?2018本章總結(jié)運(yùn)維背景運(yùn)維角色日常運(yùn)維工作內(nèi)容故障處理技術(shù)第33頁(yè)?2018謝謝?2018技術(shù)云計(jì)算運(yùn)維產(chǎn)品前言本章主要描述了幾款和云數(shù)據(jù)中心相關(guān)的運(yùn)維工具并介紹了其主要功能和應(yīng)用場(chǎng)景?2018第1頁(yè)技術(shù)目標(biāo)學(xué)完本課程后,您將能夠:了解

云計(jì)算運(yùn)維工作中常用到的工具了解

配套的云計(jì)算運(yùn)維工具的使用場(chǎng)景?2018第2頁(yè)技術(shù)1.2.云計(jì)算所涉產(chǎn)品及運(yùn)維方式運(yùn)維產(chǎn)品概覽?2018第3頁(yè)技術(shù)數(shù)據(jù)中心架構(gòu)計(jì)算資源網(wǎng)絡(luò)資源資源應(yīng)用域服務(wù)域云通信管理部署服務(wù)應(yīng)用服務(wù)數(shù)據(jù)庫(kù)服務(wù)數(shù)據(jù)分析&AI服務(wù)安全服務(wù)網(wǎng)絡(luò)服務(wù)服務(wù)計(jì)算服務(wù)通信資源池應(yīng)用資源池關(guān)系型數(shù)據(jù)庫(kù)安全資源池對(duì)象資源池網(wǎng)絡(luò)資源池塊資源池物理資源池資源池虛擬資源池基礎(chǔ)設(shè)施安全資源?2018第4頁(yè)技術(shù)云計(jì)算所涉產(chǎn)品IP類路由器、交換機(jī)、IT類硬件服務(wù)器、FusionSphere

pute、FusionSphereOM、ManageOne、FusionStorage、BCManager、FusionAccess?2018第5頁(yè)技術(shù)運(yùn)維方式(1)IP類命令行()Web界面查看設(shè)備面板工具

管理()?2018第6頁(yè)技術(shù)運(yùn)維方式(2)IT類硬件Web界面()命令行設(shè)備面板工具

管理()?2018第7頁(yè)技術(shù)運(yùn)維方式(3)IT類)Web界面(

)命令行(有需求)工具

管理(工具輔助排錯(cuò)()?2018第8頁(yè)技術(shù)1.云計(jì)算所涉產(chǎn)品及運(yùn)維方式2.運(yùn)維產(chǎn)品概覽eSightFusionToolG-rayFusionNetDoctor?2018第9頁(yè)技術(shù)eSight產(chǎn)品特點(diǎn)?2018第10頁(yè)技術(shù)eSight邏輯架構(gòu)?2018第11頁(yè)技術(shù)eSight計(jì)算網(wǎng)絡(luò)資源管理功能服務(wù)器管理管理網(wǎng)絡(luò)管理?2018第12頁(yè)技術(shù)eSight虛擬資源管理功能?2018第13頁(yè)技術(shù)1.2.云計(jì)算所涉產(chǎn)品及運(yùn)維方式運(yùn)維產(chǎn)品概覽eSightFusionToolG-rayFusionNetDoctor?2018第14頁(yè)技術(shù)安裝簡(jiǎn)單綠色安裝,解壓即可運(yùn)行,方便快捷使用方便提供向?qū)绞褂梅椒ǎ床襟E簡(jiǎn)單操作即可進(jìn)行檢查結(jié)果清晰明顯檢查結(jié)果顯示明顯,檢查報(bào)告可郵件回傳02.01.03.FusionTool

(1)

-

FusionCare?2018第15頁(yè)技術(shù)FusionCare的功能健康檢查支持巡檢的部件:FusionSphereOpenStack、OM、ManageOne、云服務(wù)、FusionStorage、

pute、FusionManager和FusionAccess.支持的巡檢模式:實(shí)時(shí)巡檢、定時(shí)巡檢、周期巡檢。支持巡檢結(jié)果報(bào)告導(dǎo)出。巡檢內(nèi)容分類:OS狀態(tài)、可靠性巡檢、可用性巡檢、業(yè)務(wù)資源巡檢等CLOUD

Stack解決方案不包括FusionManager和FusionAccess。信息收集支持信息收集的部件:FusionSphereOpenStack、OM、ManageOne、FusionStorage

Block、pute、FusionManager和FusionAccess.支持的信息收集模式:按收集項(xiàng)收集、按場(chǎng)景收集、按組件收集。支持信息收集結(jié)果

。CLOUD

Stack解決方案不包括FusionManager和FusionAccess。?2018第16頁(yè)技術(shù)FusionCare健康檢查流程健康檢查流程登陸FusionCare刪除節(jié)點(diǎn)選擇檢查項(xiàng)按周定時(shí)按月定時(shí)郵件發(fā)送選擇節(jié)點(diǎn)執(zhí)行健康檢查首次登陸修改添加節(jié)點(diǎn)選擇各節(jié)點(diǎn)檢查項(xiàng)立即執(zhí)行修改節(jié)點(diǎn)指定時(shí)間查看故障詳情查看節(jié)點(diǎn)詳情導(dǎo)出報(bào)告參考處理建議處理不合格項(xiàng)處理檢查結(jié)果?2018第17頁(yè)技術(shù)FusionCare信息收集流程信息收集流程首次登陸修改登陸FusionCare添加節(jié)點(diǎn)修改節(jié)點(diǎn)刪除節(jié)點(diǎn)選擇節(jié)點(diǎn)選擇各節(jié)點(diǎn)檢查項(xiàng)選擇檢查項(xiàng)選擇收集時(shí)間執(zhí)行健康檢查日志刪除收集任務(wù)處理檢查結(jié)果?2018第18頁(yè)技術(shù)FusionTool

-

UpdateToolUpdateTool是一款用來為

云計(jì)算產(chǎn)品進(jìn)行升級(jí)和打補(bǔ)丁的工具?2018第19頁(yè)技術(shù)UpdateTool支持的產(chǎn)品?2018第20頁(yè)技術(shù)以SFTP的方式將升級(jí)包推送到待升級(jí)的節(jié)點(diǎn)上。分發(fā)

包升級(jí)前檢查升級(jí)提交此步驟必須在分發(fā)包成功之后進(jìn)行,目的是檢查當(dāng)前環(huán)境的狀態(tài)是否允許進(jìn)行升級(jí)操作。升級(jí)完成后,業(yè)務(wù)驗(yàn)證無(wú)問題,并且進(jìn)行了一段時(shí)間的觀察,可以進(jìn)行提交操作,主機(jī)是清理環(huán)境上殘留的臨時(shí)文件。升級(jí)最關(guān)鍵的步驟,必須在升級(jí)檢查后,升級(jí)工具調(diào)用產(chǎn)品提供的升級(jí) 進(jìn)行升級(jí)操作?;赝酥饕褂脠?chǎng)景為升級(jí)失敗后,將環(huán)境恢復(fù)到升級(jí)前的狀態(tài)。UpdateTool升級(jí)流程?2018第21頁(yè)技術(shù)升級(jí)報(bào)告的主要功能是生成本次升級(jí)結(jié)果的匯總報(bào)告,方便了解本次升級(jí)的總體信息。UpdateTool升級(jí)報(bào)告?2018第22頁(yè)技術(shù)1.2.云計(jì)算所涉產(chǎn)品及運(yùn)維方式運(yùn)維產(chǎn)品概覽eSightFusionToolG-rayFusionNetDoctor?2018第23頁(yè)技術(shù)G-ray簡(jiǎn)介云化產(chǎn)品采用服務(wù)化框架,大規(guī)模分布式集群設(shè)計(jì),分布在數(shù)以千計(jì)的服務(wù)器,橫跨多個(gè)數(shù)據(jù)中心,如何快速的發(fā)現(xiàn)系統(tǒng)性能瓶頸,快速定位恢復(fù)故障,滿足服務(wù)等級(jí)協(xié)議(SLA)巨大的

。G-ray系統(tǒng)

服務(wù)請(qǐng)求,可視化的還原請(qǐng)求在分布式系統(tǒng)中的執(zhí)行軌跡和狀態(tài),支撐故障和性能瓶頸的快速定界?2018第24頁(yè)技術(shù)通過拓?fù)鋱D確定故障?2018第25頁(yè)技術(shù)Trace詳細(xì)信息?2018第26頁(yè)技術(shù)1.2.云計(jì)算所涉產(chǎn)品及運(yùn)維方式運(yùn)維產(chǎn)品概覽eSightFusionToolG-rayFusionNetDoctor?2018第27頁(yè)技術(shù)FusionNetDoctor簡(jiǎn)介FusionNetDoctor是面向運(yùn)維

的,虛擬網(wǎng)絡(luò)領(lǐng)域的斷流檢測(cè)工具。當(dāng)租戶虛擬機(jī)間的網(wǎng)絡(luò)不通時(shí),運(yùn)維

通過FusionNetDoctor工具的Web頁(yè)面查詢,就能快速定位到故障的具

置?2018第28頁(yè)技術(shù)FusionNetDoctor功能東西向:支持租戶的2臺(tái)虛擬機(jī)之間流量檢測(cè)南北向:支持租戶的虛擬機(jī)到外部網(wǎng)絡(luò)之間的流量檢測(cè),當(dāng)前版本支持EIP,

,融合ELB包檢測(cè):支持租戶的虛擬機(jī)到外部網(wǎng)絡(luò)之間的

包檢測(cè)。虛擬機(jī)信息獲?。阂绘I化獲取虛擬機(jī)相關(guān)信息?2018第29頁(yè)技術(shù)FusionNetDoctor使用流程登陸FusionNetDoctor頁(yè)面根據(jù)檢測(cè)場(chǎng)景,選擇所檢測(cè)的流量查看輸出結(jié)果?2018第30頁(yè)技術(shù)FusionNetDoctor輸出結(jié)果顯示?2018第31頁(yè)技術(shù)本章總結(jié)本章主要介紹對(duì)運(yùn)維工具及方式做了簡(jiǎn)單的介紹,并著重介紹了

云計(jì)算配套運(yùn)維工具功能及應(yīng)用場(chǎng)景?2018第32頁(yè)技術(shù)謝謝?2018技術(shù)云計(jì)算運(yùn)維詳述前言本章主要介紹了

云計(jì)算解決方案中運(yùn)維功能,并從系統(tǒng)管理員及VDC管理員角度描述了各自的運(yùn)維工作內(nèi)容?2018第1頁(yè)技術(shù)目標(biāo)學(xué)完本課程后,您將能夠:了解

云計(jì)算的運(yùn)維技術(shù)了解系統(tǒng)管理員在

云計(jì)算中的主要運(yùn)維工作了解

云計(jì)算為VDC管理員的運(yùn)維工作提供的服務(wù)?2018第2頁(yè)技術(shù)1.2.私有云場(chǎng)景運(yùn)維架構(gòu)私有云場(chǎng)景管理員層面運(yùn)維3.私有云場(chǎng)景租戶自運(yùn)維?2018第3頁(yè)技術(shù)運(yùn)維功能全景圖?2018第4頁(yè)技術(shù)化全景云數(shù)據(jù)中心的運(yùn)行狀提供

化全景

況,從基于單個(gè)設(shè)備的功能,

對(duì)象覆蓋物理設(shè)備、資源池、云資源、VDC與租戶應(yīng)用,主動(dòng)向基于業(yè)務(wù)的分析

,幫助企業(yè)降低IT成本,提升運(yùn)維效率。體系概述:1.2.5.物理設(shè)備 :支持對(duì)數(shù)據(jù)中心服務(wù)器、以及網(wǎng)絡(luò)設(shè)備等硬件設(shè)備進(jìn)行

管理,提供告警、資源、拓?fù)浜托阅艿热轿荒芰?,幫助用戶?duì)于硬件問題進(jìn)行快速定位和處理故障。資源池

:支持對(duì)計(jì)算、

、網(wǎng)絡(luò)以及大數(shù)據(jù)資源池的

和分析,幫助用戶高效合理使用資源,發(fā)現(xiàn)潛在的風(fēng)險(xiǎn)和問題,并提出改進(jìn)措施或指導(dǎo)建議。云資源:提供云資源告警、資源、拓?fù)浜托阅艿热轿荒芰?,幫助用戶?duì)于云資源保障問題進(jìn)行塊定界定位。VDC

:提供基于VDC的綜合分析評(píng)估能力,幫助用戶合理使用資源,最終達(dá)到提升資源使

用率的目的。租戶應(yīng)用 :以應(yīng)用的視角來

資源,從容量,負(fù)載等各個(gè)方面對(duì)應(yīng)用的資源使用情況進(jìn)行持續(xù)的評(píng)估,針對(duì)關(guān)鍵業(yè)務(wù)進(jìn)行全方位的保障。?2018第5頁(yè)技術(shù)多級(jí)云管理?2018第6頁(yè)技術(shù)配置中心?2018第7頁(yè)技術(shù)操作配置中心?2018第8頁(yè)技術(shù)1.2.3.私有云場(chǎng)景運(yùn)維架構(gòu)私有云場(chǎng)景管理員層面運(yùn)維私有云場(chǎng)景租戶自運(yùn)維?2018第9頁(yè)技術(shù)云服務(wù)性能系統(tǒng)架構(gòu)?2018第10頁(yè)技術(shù)物理設(shè)備性能管理,提供告警、資源、拓?fù)浜托阅艿热轿槐O(jiān)支持對(duì)數(shù)據(jù)中心服務(wù)器、 以及網(wǎng)絡(luò)設(shè)備等硬件設(shè)備進(jìn)行控能力,幫助用戶對(duì)于硬件問題進(jìn)行快速定位和處理故障?2018第11頁(yè)技術(shù)資源池

:總體概覽全面了解資源池資源占用、容量、負(fù)載等情況,幫助用戶高效合理使用資源,發(fā)現(xiàn)潛在的風(fēng)險(xiǎn)和問題,并提出改進(jìn)措施或指導(dǎo)建議?2018第12頁(yè)技術(shù)云資源能力,幫助用戶對(duì)于云資源保障問題進(jìn)行塊定界提供云資源告警、資源、拓?fù)浜托阅艿热轿欢ㄎ弧?2018第13頁(yè)技術(shù)VDC提供基于VDC的綜合分析評(píng)估能力,幫助用戶合理使用資源,最終達(dá)到提升資源使用率的目的。?2018第14頁(yè)技術(shù)租戶應(yīng)用以應(yīng)用的視角來

資源,從容量,負(fù)載等各個(gè)方面對(duì)應(yīng)用的資源使用情況進(jìn)行持續(xù)的評(píng)估,針對(duì)關(guān)鍵業(yè)務(wù)進(jìn)行全方位的保障。1.全局掌控租戶應(yīng)用整體負(fù)載情況2.關(guān)鍵應(yīng)用狀態(tài)一目了然針對(duì)具體應(yīng)用,從負(fù)載,資源消耗,故障以及關(guān)聯(lián)拓?fù)涞染S度對(duì)應(yīng)用進(jìn)行全方位保障?2018第15頁(yè)技術(shù)多級(jí)云

管理功能,提供全局的云資源查詢、統(tǒng)計(jì)、管理能力多云管理是完成省、分支等多級(jí)云

運(yùn)維的服務(wù)按“云”粒度展示資源池容量信息、資源數(shù)量信息、告警統(tǒng)計(jì)信息、資源池負(fù)載信息掌握全局資源使用情況,多個(gè)云資源使用情況進(jìn)行橫向比對(duì)分析?2018第16頁(yè)技術(shù)告警集中查看提供多種機(jī)制針對(duì)不同場(chǎng)景提供相應(yīng)段對(duì)告警進(jìn)行壓縮,使得故障定位更精準(zhǔn),提升運(yùn)維效率告警跟因分析重復(fù)告警匯聚閃斷或振蕩匯聚?2018第17頁(yè)技術(shù)運(yùn)營(yíng)分析管理員通過ManageOne運(yùn)維面對(duì)容量、歷史數(shù)據(jù)報(bào)表分析,快速掌握網(wǎng)元以及業(yè)務(wù)的KPI及健康度,支撐運(yùn)維決策、云平臺(tái)后續(xù)的規(guī)劃等??筛鶕?jù)需要的數(shù)據(jù)特點(diǎn),對(duì)指標(biāo)及各個(gè)維度的數(shù)據(jù)進(jìn)行組合自定義報(bào)表,以表格或圖表(折線圖、柱狀圖、圓環(huán)圖等)形式展示,以便管理員能實(shí)時(shí)了解數(shù)據(jù)中心整體的KPI指標(biāo)及健康度并及時(shí)發(fā)現(xiàn)問題和解決問題,支撐運(yùn)營(yíng),同時(shí)解決了從不同維度獲取數(shù)據(jù)信息程序復(fù)雜、統(tǒng)計(jì)分析耗時(shí)長(zhǎng)的問題,實(shí)現(xiàn)自助式業(yè)務(wù)分析。?2018第18頁(yè)技術(shù)日常巡檢?2018第19頁(yè)技術(shù)日志管理日志分類內(nèi)容用途運(yùn)行日志記錄了系統(tǒng)中進(jìn)程的實(shí)時(shí)運(yùn)行情況。底層設(shè)備的運(yùn)行日志需要通過配置FusionCare進(jìn)行可用于對(duì)系統(tǒng)的運(yùn)行狀況進(jìn)行了解,排障,遭遇安全事件時(shí)的問題定位。租戶操作日志云服務(wù)主動(dòng)上報(bào)的日志,記錄了租戶的操作行為和操作結(jié)果。分析系統(tǒng)故障是否與租戶操作行為相關(guān);分析租戶操作模式,以改進(jìn)用戶體驗(yàn);對(duì)租戶活動(dòng)和操作指令進(jìn)行審計(jì)。管理側(cè)操作日志記錄管理側(cè)用戶在系統(tǒng)上執(zhí)行的操作信息和系統(tǒng)運(yùn)行狀態(tài)。了解管理側(cè)用戶行為,識(shí)別并消除安全

,保證系統(tǒng)運(yùn)行過程信息的可追溯性?2018第20頁(yè)技術(shù)資源池管理?2018第21頁(yè)技術(shù)云服務(wù)資源池管理?2018第22頁(yè)技術(shù)系統(tǒng)備份用戶在如下場(chǎng)景下,需要備份各服務(wù)實(shí)例數(shù)據(jù),以便服務(wù)實(shí)例在出現(xiàn)異常情況時(shí)能夠快速恢復(fù)數(shù)據(jù)場(chǎng)景描述備份方式例行備份自動(dòng)升級(jí)服務(wù)實(shí)例前手動(dòng)重大業(yè)務(wù)調(diào)整前手動(dòng)?2018第23頁(yè)技術(shù)系統(tǒng)恢復(fù)當(dāng)數(shù)據(jù)庫(kù)實(shí)例運(yùn)行狀態(tài)正常,但服務(wù)實(shí)例的數(shù)據(jù)庫(kù)數(shù)據(jù)異常,導(dǎo)致服務(wù)實(shí)例無(wú)法正常使用時(shí),需要選擇相應(yīng)的備份文件進(jìn)行數(shù)據(jù)恢復(fù)。常見的恢復(fù)場(chǎng)景如下:場(chǎng)景描述使用的備份文件恢復(fù)至某個(gè)時(shí)間點(diǎn)將服務(wù)實(shí)例數(shù)據(jù)恢復(fù)至某個(gè)時(shí)間點(diǎn)的狀態(tài)。定時(shí)方式備份的文件恢復(fù)至服務(wù)實(shí)例升級(jí)前的數(shù)據(jù)當(dāng)服務(wù)實(shí)例升級(jí)失敗需要回退到升級(jí)前狀態(tài)時(shí),可利用備份數(shù)據(jù)進(jìn)行恢復(fù)。手動(dòng)方式備份的文件恢復(fù)至重大業(yè)務(wù)調(diào)整前的數(shù)據(jù)重大業(yè)務(wù)調(diào)整可能導(dǎo)致服務(wù)實(shí)例出現(xiàn)故障,利用備份數(shù)據(jù)可將服務(wù)恢復(fù)至重大業(yè)務(wù)調(diào)整前的狀態(tài)。手動(dòng)方式備份的文件?2018第24頁(yè)技術(shù)故障處理故障分析、定位和處理原則:以盡快恢復(fù)系統(tǒng)為原則。定位故障時(shí),應(yīng)及時(shí)故障數(shù)據(jù)信息,并盡量將

到的故障數(shù)據(jù)信息保存在移動(dòng)

介質(zhì)中或網(wǎng)絡(luò)中其它計(jì)算機(jī)中。在確定故障處理的方案時(shí),應(yīng)先評(píng)估影響,優(yōu)先保證業(yè)務(wù)的正常傳送。?2018第25頁(yè)技術(shù)1.私有云場(chǎng)景運(yùn)維架構(gòu)2.3.私有云場(chǎng)景管理員層面運(yùn)維私有云場(chǎng)景租戶自運(yùn)維消息通知業(yè)務(wù)(SMN)云

服務(wù)(CES)任務(wù)中心(TaskCenter)FusionNetDoctor?2018第26頁(yè)技術(shù)消息通知服務(wù)介紹消息通知服務(wù)(SMN:Simple

Message

Notification)是可

靠,可擴(kuò)展,海量的消息處理服務(wù)。它大大簡(jiǎn)化系統(tǒng)的耦合,能夠根據(jù)用戶的需求,向訂閱者主動(dòng)推送消息的服務(wù),訂閱

者可以是移動(dòng)設(shè)備,電子郵件,

,應(yīng)用等等。?2018第27頁(yè)技術(shù)SMN關(guān)鍵特性基于TOPIC推送消息:您可以向TOPIC推送消息。SMN服務(wù)很快將消息通知給TOPIC下面的訂閱者。您可以使用消息結(jié)構(gòu)體和消息模板進(jìn)行消息發(fā)送,能夠讓不同的協(xié)議收到不同的消息內(nèi)容。直接推送消息:您可以通過

號(hào)碼、郵箱地址、HTTP地址和消息內(nèi)容直接推送消息(目前僅提供給

服務(wù)使用)。策略管理:您可以設(shè)置TOPIC的控制策略,默認(rèn)策略是只有自己能添加訂閱者和推送消息。通過設(shè)置這個(gè)策略,您可以將權(quán)限授予其它的租戶和云服務(wù)。與其它服務(wù)集成:通過SMN服務(wù)您可以捕獲其它服務(wù)發(fā)布的事件或者告警。比如云

,彈性伸縮,對(duì)象

,安全服務(wù)等。?2018第28頁(yè)技術(shù)服務(wù)架構(gòu)Region

LBPublishServerPublishServerNotificationServerNotificationServer……DBServerCacheServerServerSmsServerHttpServer……QueueServerQueueServer……元數(shù)據(jù)請(qǐng)求處理流程消息publish處理流程消息push處理流程Publish

Server

ClusterPush

Server

ClusterQueue

ServerClusterCache

Server

ClusterDB

Server

Cluster?2018第29頁(yè)技術(shù)1.2.私有云場(chǎng)景運(yùn)維架構(gòu)私有云場(chǎng)景管理員層面運(yùn)維3.私有云場(chǎng)景租戶自運(yùn)維消息通知業(yè)務(wù)(SMN)云

服務(wù)(CES)任務(wù)中心(TaskCenter)FusionNetDoctor?2018第30頁(yè)技術(shù)應(yīng)用場(chǎng)景介紹云持服務(wù)是一個(gè)開放性的 平臺(tái),提供資源的

、告警、通知等服務(wù)。目前支彈性云服務(wù)器、云硬盤、虛擬私有云、關(guān)系型數(shù)據(jù)庫(kù)、分布式緩存服務(wù)、分布式消息服務(wù)、彈性負(fù)載均衡、彈性伸縮服務(wù)、Web應(yīng)用 、主機(jī) 檢測(cè)服務(wù)、云桌面服務(wù)的相關(guān)指標(biāo)。CES作為一個(gè)

平臺(tái),

接受各個(gè)服務(wù)的指標(biāo)數(shù)據(jù)。用戶通過指標(biāo)設(shè)置告警規(guī)則、通知策略,及時(shí)掌握各產(chǎn)品服務(wù)的實(shí)例資源運(yùn)行狀況、性能。CES部署在管理節(jié)點(diǎn),可以同時(shí)對(duì)多個(gè)租戶提供

服務(wù)。CES是租戶側(cè)的

,對(duì)租戶可見;OC是運(yùn)維側(cè)的

,對(duì)租戶不可見。CeilometerVPCRDSAS…CESSMNOCCTS……?2018第31頁(yè)技術(shù)CES關(guān)鍵特性項(xiàng)目,包括CPU,磁盤IO,網(wǎng)絡(luò)流量等,全方位為日常管理:云

提供了完備的您的業(yè)務(wù)保駕護(hù)航。問題通知:當(dāng)告警規(guī)則的狀態(tài)(告警、恢復(fù)正常、數(shù)據(jù)不足)變化時(shí),系統(tǒng)會(huì)及時(shí)通過郵件或

方式通知用戶,以便用戶及時(shí)查詢問

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論