2023卓越架構(gòu)白皮書(導(dǎo)讀版)_第1頁
2023卓越架構(gòu)白皮書(導(dǎo)讀版)_第2頁
2023卓越架構(gòu)白皮書(導(dǎo)讀版)_第3頁
2023卓越架構(gòu)白皮書(導(dǎo)讀版)_第4頁
2023卓越架構(gòu)白皮書(導(dǎo)讀版)_第5頁
已閱讀5頁,還剩122頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

前言01安全合規(guī)04三穩(wěn)定性19成本優(yōu)化30五卓越運營44高效性能56用戶而言,在上云、用云、管云過程中持續(xù)維持良好的云上架構(gòu)變得極具挑總結(jié),我們將阿里云上的架構(gòu)設(shè)計最佳實踐總結(jié)為一系列的方法論和設(shè)計原 阿里云卓越架構(gòu)包含以下五個架構(gòu)最佳實踐支柱:安全合規(guī)穩(wěn)定性成本優(yōu)化基于這五大支柱,卓越架構(gòu)提供相應(yīng)的設(shè)計原則和最佳實踐,以及可落地的方案。同時,卓越架構(gòu)還提供了免費的架構(gòu)評估工具和度量模型,來評估當(dāng)研發(fā)等角色。通過了解卓越架構(gòu)中定義的最佳實踐和解決方案,組織中的這些職能角色能夠不斷的將應(yīng)用架構(gòu)和卓越架構(gòu)中的最佳實踐進行比較,并不斷進行架構(gòu)的迭代和改進,從而降低風(fēng)險、控制成本、提升效率,為業(yè)務(wù)的安全合規(guī)安全合規(guī)安全管理的目的是風(fēng)險管理,識別企業(yè)內(nèi)部、外部的安全要求和監(jiān)管訴求,在云環(huán)境中針對網(wǎng)絡(luò)安全、身份安全、主機安全、數(shù)據(jù)安全等全方位地進行規(guī)劃和實施,同時持續(xù)對威脅進行檢測和快速響應(yīng)。云安全的責(zé)任模型是共擔(dān)的責(zé)任模型,基于云的客戶應(yīng)用,云供應(yīng)商要保障云平臺自身安全并提供相應(yīng)的安全能力和產(chǎn)品給云上的客戶??蛻魟t負責(zé)基于云供應(yīng)商提供的服務(wù)或原子化能力構(gòu)建保障應(yīng)用系統(tǒng)或業(yè)務(wù)的安全體系。云上客戶安全責(zé)任云上客戶安全責(zé)任用戶業(yè)務(wù)安全用戶應(yīng)用安全用戶數(shù)據(jù)安全用戶基礎(chǔ)安全云產(chǎn)品安全虛擬化安全硬件安全物理安全阿里云云盾安全服務(wù)&云安全生態(tài)云平臺內(nèi)部身份與訪問控制阿里云平臺側(cè)安全能力云平臺安全監(jiān)監(jiān)控和運營用戶賬戶安全安全需要設(shè)計和規(guī)劃,應(yīng)在構(gòu)建基于云或本地數(shù)據(jù)中心的的同時,建設(shè)安全系統(tǒng)和相關(guān)控制措施,建立配套安全管理流程和機制,建立安全意識管理體 整體建議如下整體建議如下●評估當(dāng)前企業(yè)戰(zhàn)略目標(biāo)和云業(yè)務(wù)一致性。●通過咨詢和風(fēng)險評估工具的方式評估當(dāng)前云計算環(huán)●評估架構(gòu)風(fēng)險,管理風(fēng)險以及合規(guī)風(fēng)險?!窠踩\營體系持續(xù)識別風(fēng)險,推動安全框架的通用的安全設(shè)計原則有云上基礎(chǔ)架構(gòu)包含了網(wǎng)絡(luò)架構(gòu)和身份體系,要評估和識別當(dāng)前網(wǎng)絡(luò)的架構(gòu)設(shè)計方法,是否符合安全最小化原則和縱深防御原則。企業(yè)使用云產(chǎn)品創(chuàng)建的配置文件是否符合安全原則,需要進行識別和自動化檢測,可基于云安全最佳實踐和行業(yè)合規(guī)要求建立符合企業(yè)自身的“云安全基線”也被稱之為“Baseline”,通過標(biāo)準(zhǔn)識別和檢測上云風(fēng)險。云上的資產(chǎn)可分為工作負載(ECS、容器、Server-less)、基礎(chǔ)網(wǎng)元(EIP、NAT、SLB等)、應(yīng)用(PaaS服務(wù)、域名、鏡像等),面對資產(chǎn)的脆弱性(包含資產(chǎn)基線和資產(chǎn)漏洞)應(yīng)該進行事前的風(fēng)險識別和檢合規(guī)包含了外部合規(guī)和內(nèi)部合規(guī)。外部合規(guī)指的是面向監(jiān)管的合規(guī),內(nèi)部合規(guī)指的是面向內(nèi)部審計、管理的合 安全防護定的條件下訪問對應(yīng)的云資源。它涉及到識別用戶和身份(身份驗證),確定該身份可以訪問哪些資源(授權(quán)),以及審計相應(yīng)身份的訪問和操作記錄(監(jiān)控和審計)。對于人員身份來說,保護好登錄憑證(如用戶名和密碼)能夠有效降低身份泄漏風(fēng)險。可以從以下幾種方式 云上的權(quán)限管理是為了控制某個身份在什么條件下對哪些資源能夠執(zhí)行哪些操作。云上的權(quán)限管理的核心原則就是權(quán)限最小化,只給身份授予必要的權(quán)限,確保權(quán)限最小夠用?;谠撛瓌t,針對不同的身份類型,在阿里云上有以下最佳實踐可以參考。針對人員所屬職能(如管理員、運維、安全等)進行權(quán)限劃分,并進行權(quán)限的抽象,簡化授權(quán)過程,降低管理成本。在對職能權(quán)限進行抽象后,可以通過將人員身份加入到指定職能用戶組的方式進行組織,提升授權(quán)效率。在云上,建議通過阿里云賬號或資源組兩種方式,區(qū)分不同業(yè)務(wù)應(yīng)用的資源。在資源合理分類的基礎(chǔ)上,按照人員所管理的業(yè)務(wù)應(yīng)用對應(yīng)的資源范圍進行授權(quán),能夠簡化授權(quán)邏輯,提高權(quán)限策略復(fù)用率,進而在權(quán)限最小化和管理針對程序身份,建議進行精細化授權(quán)。除一些特定業(yè)務(wù)場景外,應(yīng)用程序所需要訪問的阿里云資源,對應(yīng)進行的操作是可以預(yù)期的,盡可能的通過自定義權(quán)限策略來定義該程序身份所需要的最小權(quán)限。關(guān)注特權(quán)身份和閑置權(quán)限,確保每個身份的權(quán)限持續(xù)滿足多賬號場景下,通過管控策略,限制成員賬號內(nèi)的RAM身份權(quán)限范圍,禁用一些高危操作降低身份泄漏風(fēng)險。 網(wǎng)絡(luò)安全保護在東西向(VPC內(nèi)部、VPC之間)使用安全組、工作負載安全保護工作負載相關(guān)的安全保護主要是指計算資源的防護。根據(jù)工作負載部署的方式(如ECS、容器等),會有不同的防護方案,通用的最佳實踐如下:級。在阿里云上,可以通過數(shù)據(jù)安全中心DS強加密訴求(如自選密鑰、密鑰輪轉(zhuǎn)等)的用戶,可以基對安全事件進行監(jiān)控和分析首先需要對云上各個服務(wù)、資源等產(chǎn)生的事件進行收集,在安全角度,同時需要保證日志完整性,不被篡改,不存在未經(jīng)授權(quán)的訪問。針對日志收集,有以下最佳實踐: 戶,可以設(shè)置管控策略(ServiceControlPol動態(tài)數(shù)據(jù)保護(如VPN網(wǎng)關(guān)、智能接入網(wǎng)關(guān)等)也提供傳輸鏈路的加 對于云上企業(yè)來說,建議通過資源目錄構(gòu)建多賬號體系,將日志存儲在單獨的云賬號中進行歸檔,該云賬號不用于日常的其他操作,只用于日志存儲。同時僅給必要的人(如安全團隊、審計團隊)授予該賬號的訪問權(quán)限,嚴(yán)格控制各類身份對于該日志的權(quán)限,尤其關(guān)注寫、刪類型的權(quán)限。對于存儲在OSS中的日志,可以開啟合規(guī)保留策略,實現(xiàn)“不可刪除、不可篡改”方式保存和使用數(shù)據(jù)。的指標(biāo)和告警。最佳實踐是將安全事件的發(fā)現(xiàn)流程深度集成到工作流系統(tǒng)或第三方的日志分析系統(tǒng)中。接下來根據(jù)事件類型、等級進行進一步的響為了降低安全事件發(fā)生后對業(yè)務(wù)造成的影響,企業(yè)應(yīng)該盡早構(gòu)建安全應(yīng)急和響應(yīng)流程。可以參考業(yè)界中已有的標(biāo)準(zhǔn)和建議,如NISTSP800-61等,結(jié)合阿里云上相關(guān)的云產(chǎn)品,進行流程的設(shè)計與驗證。有以下最佳實踐建議: 專業(yè)的7X24遠程緊急響應(yīng)處理服務(wù),幫助云上用戶快速響應(yīng)和處理信息安系統(tǒng)架構(gòu)持續(xù)迭代升級,系統(tǒng)的復(fù)雜度隨之增加,面對更多的非預(yù)期事件風(fēng) 一個穩(wěn)定的分布式系統(tǒng)需要能夠快速適應(yīng)變化,及時發(fā)現(xiàn)和解決問題,并且能夠保持系統(tǒng)的一致性和可靠性。穩(wěn)定性通常包含系統(tǒng)可用性、可靠性、可觀測性、可運維性、可擴展性、可維護性等。使用云計算平臺服務(wù)可以更好的構(gòu)建系統(tǒng)穩(wěn)定性,例如云計算平臺可以根據(jù)系統(tǒng)的實際需求,動態(tài)分配和釋放計算資源,使得系統(tǒng)更容易擴展,降低系統(tǒng)負載壓力,從而提高系統(tǒng)的可擴展性。再者云計算平臺會提供冗余存儲和備份能力,避免系統(tǒng)因為硬件故障或其他原因?qū)е碌耐C或數(shù)據(jù)丟失。這種備份機制可以提高系統(tǒng)的可靠性。阿里云平臺提供高可用的基礎(chǔ)設(shè)施,并提供應(yīng)用穩(wěn)定性相關(guān)工具體系。用戶可以基于阿里云提供的產(chǎn)品及本框架中定義的最佳實踐入手,來建設(shè)云上應(yīng)用的做好面向失敗的架構(gòu)設(shè)計,充分考慮容做好面向失敗的架構(gòu)設(shè)計,充分考慮容打造具備彈性、高可用的應(yīng)用存儲設(shè)計可靠性高達12個9,彈性計算單實例可用性SLA高達99.975%眾所周知,系統(tǒng)異常事件是不可避免的,如網(wǎng)絡(luò)延遲、硬件故障、軟件錯2.2面向精細的運維管控原則定性和復(fù)雜性大幅增加,建議通過精細化的管理和可觀測手段,如版本控2.3面向風(fēng)險的應(yīng)急快恢原則 應(yīng)急1-5-10軟件系統(tǒng)從所有的功能都在一個應(yīng)用程序內(nèi)運行的單體應(yīng)用架構(gòu),到不同的功能模塊分別部署在不同的服務(wù)器上的傳統(tǒng)分布式應(yīng)用架構(gòu),再到服務(wù)細分通過輕量級的通信機制進行互相調(diào)用的微服務(wù)架構(gòu),到現(xiàn)在將云計算、容器化、微服務(wù)架構(gòu)等技術(shù)結(jié)合起來的云原生架構(gòu)。在軟件系統(tǒng)架構(gòu)演進中不變的是系統(tǒng)的基本屬性,包含存儲、計算和網(wǎng)絡(luò),變的是存儲、計算和網(wǎng)絡(luò)的實現(xiàn)方式和規(guī)模,往大規(guī)模、高性能、高可靠、易擴展等方向迭代演進,所以對架構(gòu)穩(wěn)定性提出了更高的要求。系統(tǒng)可預(yù)見的穩(wěn)定性風(fēng)險包含軟硬件故障和不可預(yù)期的流量,小到線程級風(fēng)險,大到地域級災(zāi)難,從此出發(fā)可通過容災(zāi)、容錯、容量三方面建立系統(tǒng)架構(gòu)穩(wěn)定性。容災(zāi)損失降到最小。針對數(shù)據(jù)容災(zāi),阿里云混合云備份HBR(HybridBackup容錯(FaultTolerance)是3.2變更設(shè)計原則 可灰度,需要建立起完整的灰度發(fā)布機制,完善的灰度機制有助于變更失敗時降低業(yè)務(wù)影響,提升用戶體驗?;叶劝l(fā)布機制包含但不限于以下幾點:灰度方式、灰度批次、間隔時間、灰度觀測等?;叶劝l(fā)布需注意:合理設(shè)定灰度間隔時間,不宜過長。過長的灰度間隔時間可能導(dǎo)致下游應(yīng)用出現(xiàn)數(shù)據(jù)不一致等問題。合理選擇灰度發(fā)布方式,可按用戶、按區(qū)域、按渠道等方式進行灰度,避免出現(xiàn)灰度過程中用戶體驗不一致的建議先小范圍的進行灰度驗證,再逐步擴大灰度范圍。4.明確灰度期間的可觀測指標(biāo),用于判斷發(fā)布結(jié)果避免造成連鎖反應(yīng)。大部分變更要做好應(yīng)急恢復(fù)手段,最常用的技術(shù)手段就是回滾。理論上回滾永遠是最合適最有效的方法,當(dāng)問題發(fā)生時,保證業(yè)務(wù)連續(xù)運行永遠是第一要義。實際中可能存在其他解決方案,但后果無法預(yù)料,所以選擇回滾是最好在發(fā)布時建議多版本小更新,避免因變更版本跨度較大,帶來的系統(tǒng)依賴關(guān)系問題可觀測云上實踐3.3應(yīng)急響應(yīng)機制應(yīng)急響應(yīng)機制的關(guān)鍵點在于事件發(fā)生后,有標(biāo)準(zhǔn)的操作流程和動作。阿里巴巴在過去十幾年的安全生產(chǎn)過程中,沉淀了一套故障應(yīng)急響應(yīng)機制,簡稱應(yīng)急響應(yīng)1-5-10。是指在1分鐘內(nèi)發(fā)現(xiàn)故障,5分鐘內(nèi)組織相關(guān)人員進行初步排查,10分鐘內(nèi)開展故障恢復(fù)和處理工作。企業(yè)在設(shè)計應(yīng)急響應(yīng)機制時,可以參考該方式明確響應(yīng)期間的標(biāo)準(zhǔn)動作和流程,確保在事件發(fā)生時,相關(guān)干系人都能夠明確自身職責(zé)和所需要采取的措施。 故障一旦發(fā)生,越早發(fā)現(xiàn)故障,能夠越早進行響應(yīng)。建議通過以下途徑實現(xiàn)故障的快統(tǒng)一告警:在發(fā)現(xiàn)故障后,需要將相關(guān)信息及時告知相關(guān)人員,包括系統(tǒng)管理員、運維人員等??梢酝ㄟ^短信、郵件、釘釘?shù)确绞竭M行告警,確保所有相關(guān)人員第一時間得知故障情況,以便快速組織應(yīng)急響應(yīng)。監(jiān)控大屏是指將所有系統(tǒng)的運行情況以圖形化的方式展示在屏幕上,以便實時監(jiān)控系統(tǒng)健康狀況。在發(fā)生故障時,監(jiān)控大屏可以快速反應(yīng)故障情況,并提供相關(guān)數(shù)據(jù),為故障排查及處理提供依據(jù)。風(fēng)險預(yù)測是指在發(fā)生故障前,通過數(shù)據(jù)分析、機器學(xué)習(xí)等方式,預(yù)測系統(tǒng)的風(fēng)險情況,提前進行預(yù)防和處理。在故障應(yīng)急響應(yīng)中,風(fēng)險預(yù)測可以作為重要參考,幫助快速識別問題的根本原因,提高故障處理效率和精度。在發(fā)現(xiàn)故障后,需要快速定位問題,通常有以下做法:故障發(fā)生后,需要迅速組織相關(guān)人員進行應(yīng)急響應(yīng)。組織協(xié)調(diào)包括設(shè)置指揮中心、確定應(yīng)急響應(yīng)流程、分配任務(wù)等。這些工作的目的是提高應(yīng)急響應(yīng)的效率和準(zhǔn)確性,讓每個人都清楚自己的任務(wù)和責(zé)任,避免出現(xiàn)混亂 3.4演練常態(tài)化故障演練提供了一種端到端的測試?yán)砟钆c工具框架,本質(zhì)是通過主動引入故障來充分驗證軟件質(zhì)量的脆弱性。從提前發(fā)現(xiàn)系統(tǒng)風(fēng)險、提升測試質(zhì)量、完善風(fēng)險預(yù)案、加強監(jiān)控告警、提升故障應(yīng)急效率等方面做到故障發(fā)生前有效預(yù)防,故障發(fā)生時及時應(yīng)對,故障恢復(fù)后回歸驗證。基于故障本身打造分布式系統(tǒng)韌性,持續(xù)提升軟件質(zhì)量,增強團隊對軟件生產(chǎn)運行的信心。故障演練可分為方案驗證的容災(zāi)演練、穩(wěn)定性驗收的紅藍攻防,以及故障應(yīng)急驗證的突襲演練。容災(zāi)演練紅藍攻防成本優(yōu)化成本優(yōu)化成本優(yōu)化支柱提供了云上成本管理及優(yōu)化的設(shè)計原則和最佳實踐,幫助企業(yè)高效地使用云服務(wù)來構(gòu)建業(yè)務(wù)應(yīng)用,減少不必要的開支并提升運營效率,讓企業(yè)在云上更具經(jīng)濟效益。在成本優(yōu)化過程中需要遵循一些重要的優(yōu)化原則,這些原則能夠幫助企業(yè)提升成本管理效率,更好地達成優(yōu)化目標(biāo)。 為了應(yīng)對企業(yè)面臨的云上成本管理挑戰(zhàn),國際上興起了FinOps理論框架。制定數(shù)據(jù)驅(qū)動的支出決策,使組織能夠獲得最大的業(yè)務(wù)價值”。阿里云在FinOps核心理念基礎(chǔ)上,融合自身實踐經(jīng)驗,提出更加細化落地用云執(zhí)行監(jiān)控分析產(chǎn)品工具用云計劃云上成本管理貫穿上云用云全生命周期 人員、工具和機制是云上成本管理的關(guān)鍵要素2.2用云計劃階段用云成本需求分析組織規(guī)劃財務(wù)規(guī)劃 資源規(guī)劃2.3用云執(zhí)行階段財務(wù)管理 對資源進行分層分組管理是管好資源及資源成本優(yōu)化的基礎(chǔ)。阿里云資源管理服務(wù)是一系列企業(yè)IT治理產(chǎn)品和服務(wù)的集合,主要包括資源目錄、資源組、資源共享和標(biāo)簽,幫助企業(yè)實現(xiàn)資源分層分組管理??梢允褂觅Y源目錄在云上構(gòu)建企業(yè)業(yè)務(wù)組織關(guān)系,使用資源組和標(biāo)簽分層管理云上資源,使用資源共享在企業(yè)成員之間共享云上資將云上成本盡量準(zhǔn)確地分?jǐn)偟綐I(yè)務(wù)是云上成本管理的關(guān)鍵環(huán)節(jié),是推進云成本持續(xù)優(yōu)化的重要前提。將成本進行分?jǐn)偛拍苈鋵嵆杀矩?zé)任制,定期對責(zé)任團隊所分?jǐn)偟某杀具M行監(jiān)控分析,追蹤超支原因,讓責(zé)任團隊能夠主動、持續(xù)的優(yōu)化成本。建議基于成本標(biāo)簽實現(xiàn)企業(yè)內(nèi)各責(zé)任團隊自動化分賬,關(guān)鍵步驟包括:對資源標(biāo)簽體系進行統(tǒng)一規(guī)劃。阿里云提供標(biāo)簽設(shè)計原則及預(yù)置標(biāo)簽產(chǎn)品能力,幫助企業(yè)進行標(biāo)簽規(guī)劃設(shè)計。從費用歸屬視角設(shè)計財務(wù)單元目錄樹。阿里云用戶中心提供財務(wù)單元能力,支持多維度自動化資源費用歸屬。準(zhǔn)確的資源成本標(biāo)簽是標(biāo)簽分賬的基礎(chǔ),建議在創(chuàng)建資源時即進行打標(biāo)。阿里云支持通過云產(chǎn)品控制臺、標(biāo)簽控制臺、OpenAPI等方式對資源進行打標(biāo)。建議在財務(wù)單元中按標(biāo)簽設(shè)定自動分配規(guī)則,提升成本對成本標(biāo)簽進行自動化審計,提升標(biāo)簽覆蓋度及準(zhǔn)確性。阿里云提供標(biāo)簽策略能力,企業(yè)可以通過限定資源上必須綁定的成本標(biāo)簽,對標(biāo)簽進行自動檢測及修復(fù),提升標(biāo)簽管理效率。2.3監(jiān)控分析階段監(jiān)控預(yù)警 成本可視化2.4成本優(yōu)化階段計費方式優(yōu)化云數(shù)據(jù)傳輸(CloudDataTransfer,簡稱CDT)提供 資源使用優(yōu)化持續(xù)架構(gòu)優(yōu)化平衡目標(biāo)與成本快速構(gòu)建新業(yè)務(wù)、減少故障處理、對業(yè)務(wù)進行持續(xù)觀測、提升業(yè)務(wù)系統(tǒng)穩(wěn)定卓越運營設(shè)計原則面對眾多的技術(shù)/工具選型,組織應(yīng)參考長期技術(shù)演進路線、社區(qū)活躍程度、技術(shù)成熟度、安全性等幾個主要方面進行判斷和選型。在選擇的過程做好卓越運營,不僅需要開發(fā)/運維團隊參與進來,更需要各個團隊(財務(wù)、安全等)在整個運營過程中扮演業(yè)務(wù)知識輸出的角色,并參與重要節(jié)點 如在laC(InfrastructureasCode,基礎(chǔ)設(shè)施即代碼)落地之前設(shè)定好基礎(chǔ)設(shè)施代碼管理與本地倉庫之間的工作流,如代碼評審流程、代碼合并流程管理和運營是一個復(fù)雜的積累過程,并非一蹴而就,組織可以選擇覆蓋面廣、能快速提升效率的場景入手,通過不斷完善自動化做好生產(chǎn)環(huán)境的運設(shè)計階段 在自動化方案設(shè)計過程中,需要先結(jié)合業(yè)務(wù)發(fā)展方向,定義清楚組織在當(dāng)前階段的自動化目標(biāo),再根據(jù)目標(biāo)選擇合適的自動化手段。組織在做自動化技術(shù)選型過程中,應(yīng)從實際組織需求角度出發(fā),而不是管理者偏好出發(fā),選擇長期的、可持續(xù)的和符合組織發(fā)展的技術(shù)方案。建議遵循5符合3關(guān)注的原則:組織在選擇自動化手段時,可以參考上述原則對備選方案進行評估,最終設(shè)計出最符合組織需求的自動化方案。服務(wù)構(gòu)建階段關(guān)注風(fēng)險及效率,在這個階段主要關(guān)注兩個層面:變更管理工作貫穿在整個云上環(huán)境各類系統(tǒng)生命周期,是ITIL管理中非常重要的一個流程環(huán)節(jié),和其他流程關(guān)系非常緊密,稍有不慎就容易導(dǎo)致故障。如何讓變更有章可循,是組織需要在這個階段重點考慮的問題。 與傳統(tǒng)IDC相比,云最大的變化就是基礎(chǔ)設(shè)施可以通過API編排,極大地提升了整個部署效率。在云上,建議優(yōu)先采用自動化手段來完成各層資源部署。變更管理是一種IT實踐。旨在在對關(guān)鍵系統(tǒng)和服務(wù)進行操作的同時最大限度的減少服務(wù)中斷的風(fēng)險。變更管理是任何系統(tǒng)穩(wěn)定運行的重要環(huán)節(jié)之一。如果變更管理運行良好,可以讓業(yè)務(wù)團隊的工作方式更接近標(biāo)準(zhǔn)的行為準(zhǔn)則,提升變更操作的規(guī)范性,從而降低變更導(dǎo)致的故障數(shù)量,最終提升業(yè)務(wù)運行的穩(wěn)定性。變更管理流程是變更管理最佳實踐的第一步。該流程應(yīng)該包括變更發(fā)起、變更審批、變更實施和變更驗證等環(huán)節(jié)。在引入變更管理流程時,需要確保流程的透明度和可追溯性,以便在變更過程中及時發(fā)現(xiàn)和解決問題。標(biāo)準(zhǔn)的變更管理數(shù)據(jù)庫是變更管理最佳實踐的第二步。該流程應(yīng)該包括變更系統(tǒng)、變更等級、變更對象的分類、以及確定不同變更內(nèi)容的對應(yīng)標(biāo)準(zhǔn)審批流程。并及時保證數(shù)據(jù)的完整性與準(zhǔn)確性,保證變更發(fā)起時可以匹變更數(shù)據(jù)持續(xù)運營是變更管理最佳實踐的第三步。該流程應(yīng)該包括變更結(jié)果數(shù)據(jù)統(tǒng)計、變更看板等。在看板內(nèi)可對數(shù)據(jù)進行篩選分析,逐漸規(guī)范組織內(nèi)的變更流程與操作規(guī)范。從而讓業(yè)務(wù)更好的連續(xù)運行。3.2部署管理基礎(chǔ)設(shè)施自動化 阿里云卓越架構(gòu)白皮書●通過OpenAPI和原生工具集成云服務(wù)云計算的客戶,從訪問云資源的方式上區(qū)分的話主要分為兩大類,通過控制臺可視化界面操作的普通群體、通過OpenAPI和其原生工具集成的開發(fā)者群體。前者更適合簡單上云和管理云資源的客戶,而后者則更適合需要自動化管理和復(fù)雜業(yè)務(wù)集成的開發(fā)者們?!裢ㄟ^資源化方式集成云服務(wù)云控制API云控制API提供阿里云面向資源的企業(yè)級集成一站式解決方案。提高企業(yè)和生態(tài)伙伴集成效率,降低維護成本。高階開發(fā)者需要一套標(biāo)準(zhǔn)化API來避免對多種云服務(wù)的OpenAPI業(yè)務(wù)差異化的理解成本,并能夠在后續(xù)運維過程中保持持續(xù)集成狀供伴/客戶/集成程供伴/客戶/集成程從伴/客戶/集成商從伴/客戶/集成商統(tǒng)一的接口伙伴/客戶/集成商伙伴/客戶/集成商伙伴/客戶/集成商伙伴/客戶/集成商伙伴/客戶/集成商@只空豆配置管理 應(yīng)用部署業(yè)務(wù)成功業(yè)務(wù)成功o事件是指任何可能中斷或降低服務(wù)質(zhì)量(或具有此類威脅)的計劃外事件。例如業(yè)務(wù)出現(xiàn)風(fēng)1.事件來源2.事件識別3.事·系統(tǒng)發(fā)現(xiàn)·人工上報·事件記錄·事件分類·事件通知·事件分派·事件處理·升級故障·事件完結(jié)·原因分類4.2故障管理快速構(gòu)建新業(yè)務(wù)、減少故障處理、對業(yè)務(wù)進行持續(xù)觀測、提升業(yè)務(wù)系統(tǒng)穩(wěn)定架構(gòu)設(shè)計●根據(jù)業(yè)務(wù)性能目標(biāo)選擇合適的資源類型●通過性能壓測驗證架構(gòu)設(shè)計●對生產(chǎn)環(huán)境進行性能監(jiān)控計算運行于物理機之上、滿足VM層面系統(tǒng)設(shè)置需求、豐富的類型與規(guī)格鏡像Kubernetes版(ACK)彈性容器實例(ECl)運行于云服務(wù)器之上、輕量化、快速部署、可移植、可擴展微服務(wù)、混合云部署函數(shù)計算(FC)并發(fā)能力強、單個函數(shù)計算能力較弱且限制較多事件驅(qū)動的應(yīng)用 其次,需要考慮各計算方案涉及云產(chǎn)品的指標(biāo),存儲高性能、低延遲應(yīng)用程序、OLTP數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫等I/O密集型的高性能、低時延業(yè)務(wù)本,多種訪問方式,99.999999999999%數(shù)據(jù)可大規(guī)模數(shù)據(jù)分層存儲、數(shù)據(jù)備份、網(wǎng)站托管、動靜資源分離、CDN加速高吞吐、低延遲,學(xué)計算、容器共享訪問與數(shù)據(jù)持久化、企業(yè)在線生產(chǎn)應(yīng)用數(shù)科學(xué)計算、容器共享訪問與數(shù)據(jù)持久化、企業(yè)阿里云產(chǎn)品主要特征業(yè)務(wù)場景混合云組網(wǎng)混合云組網(wǎng)高可用、高安全、易部署,高質(zhì)游戲加速、企業(yè)應(yīng)用加高可靠性,轉(zhuǎn)發(fā)功能豐富按需業(yè)務(wù)轉(zhuǎn)發(fā)、云原生應(yīng)用高性能、高可靠、易運維統(tǒng)一公網(wǎng)出口加速范圍廣、低延時、易部署、高可用網(wǎng)站加速、互聯(lián)網(wǎng) (即實例數(shù)量)的服務(wù)。彈性伸縮具有廣泛的應(yīng)用場景,不僅適合業(yè)務(wù)量不斷波動一般來說討論伸縮都是水平伸縮實現(xiàn)快速擴容,不過在特殊場景下也需要縱向的垂直伸縮。垂直伸縮能夠調(diào)整按量付費實例的實例規(guī)格(如vCPU和內(nèi)存)。針對使用云原生技術(shù)部署的業(yè)務(wù)應(yīng)用,阿里云容器服務(wù)ACK也提供了彈性伸縮的能力。典型的場景包含在線業(yè)務(wù)彈性、大規(guī)模計算訓(xùn)練、深度學(xué)習(xí)GPU或共享GPU的訓(xùn)練與推理、定時周期性負載變化等。彈性伸縮分為兩個維度:兩層的彈性組件與能力可以分開使用,也可以結(jié)合在一起使用,并且兩者之間是通過調(diào)度層面的容量狀態(tài)進行解耦。對于用戶來說,之前無論是云服務(wù)的伸縮還是容器的伸縮都還是需要用戶一定程度上參與基礎(chǔ)設(shè)施層面的資源管理和維護。而Serverless技術(shù)則無需用戶關(guān)心基礎(chǔ)設(shè)施層面的擴容或者伸縮。Serverless相關(guān)的產(chǎn)品具有彈性快(毫秒級擴容)、成本優(yōu)(按實際使用量付費)、開發(fā)效率高(不用關(guān)心底層云資源)的特點。 性能測試是通過自動化的測試工具模擬多種正常、峰值以及異常負載條件來對系統(tǒng)的各項性能指標(biāo)進行測試。性能測試主要的應(yīng)用場景是:要達成精準(zhǔn)衡量業(yè)務(wù)承接能力的目標(biāo),業(yè)務(wù)壓測就需要做到5個一樣:做到5個“一樣”,讓系統(tǒng)提前進行“模擬考”,從而達到精準(zhǔn)衡量業(yè)務(wù)模型實際處理能力的目標(biāo),便于相應(yīng)的性能提升、限流降級方案準(zhǔn)備等配套工做改造,直接基于基礎(chǔ)表里的測試賬戶(相關(guān)的數(shù)據(jù)完整性也要具備)進行,壓測之后將相關(guān)的測試產(chǎn)生的流水?dāng)?shù)據(jù)清除

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論