版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一一--·1··02··03·一云多芯算力調(diào)度實踐探索案例實踐·04·智慧時代,計算力就是生產(chǎn)力。計算場景多樣化驅(qū)使算力體系架構(gòu)向異計算產(chǎn)業(yè)的核心關(guān)注點。隨著近年來信息技術(shù)產(chǎn)業(yè)發(fā)展邁入新階段,業(yè)內(nèi)對于一云多芯相關(guān)技術(shù)的研究及實踐也在不斷深入,用戶對于一云多芯的要求也在不斷提升。但是,由于異構(gòu)芯片間指令集千差萬別、性能差異顯著,異一云多芯的最終目標是支撐業(yè)務應用在不同架構(gòu)處理器之間低成本、自為實現(xiàn)一云多芯的最終目標,算力作為一項核心資源,其調(diào)度能力至關(guān)重要。一云多芯算力調(diào)度倡導構(gòu)建分層解耦、開放標準的整體架構(gòu),從基礎(chǔ)設施到應用層的各層級能夠獨立運行、獨立演化,同時支持開放的協(xié)議、標準實現(xiàn)層間高效協(xié)同,兼容多樣化的硬件平臺,從而提升整體系統(tǒng)的靈活性與可擴展性。本報告針對算力調(diào)度架構(gòu)中的各個層級的實踐探索進行了分析最后,本報告對一云多芯的未來進行了展望。一云多芯勢在必行、任重道遠,不僅需要持續(xù)的原創(chuàng)性、引領(lǐng)性技術(shù)創(chuàng)新,也需要業(yè)內(nèi)廣泛聯(lián)合和生·05··06·場景呈現(xiàn)多樣化趨勢,大數(shù)據(jù)、科學計算、人工智能訓練、人工智能推理等新型計算模式不斷涌現(xiàn)。數(shù)據(jù)精度橫向擴展、數(shù)據(jù)量級縱向增長,對計算的實時性要求也不斷提升,傳統(tǒng)的速處理器、神經(jīng)擬態(tài)芯片、可編程芯片、領(lǐng)域?qū)S眉铀傩酒榷喾NTB級X86大數(shù)據(jù)關(guān)鍵計算TB級X86大數(shù)據(jù)關(guān)鍵計算科學計算數(shù)據(jù)量級不斷提升,類型復雜AI引入新計算類型,跨度更大·07·靈活可定制性受到關(guān)注。伴隨計算場景的多樣化,數(shù)據(jù)中心正從以CPU為中心,向GPU、在多元異構(gòu)處理器功能、性能和可靠性存在差異的情況下,為滿足高效穩(wěn)定的技術(shù)需求、實高效適配、無損遷移與性能調(diào)優(yōu)成為重要關(guān)注點。行業(yè)客戶對于一云多芯的需求不再限定于基礎(chǔ)的多芯資源的管理和調(diào)度,而是衍生了因不同架構(gòu)之間差異導致的應用性能優(yōu)化需求、向應用的資源供給分配標準以及不同技術(shù)路線之間的高可用遷移方法,從而降低應用適配改是保障應用的跨架構(gòu)高效穩(wěn)定運行,從而實現(xiàn)用戶體驗的一致性。功能的等價性主要面臨的挑戰(zhàn)是異構(gòu)處理器之間指令集的差異,對于操作系統(tǒng)及應用程序的跨架構(gòu)可運行性提出了更高的要求;性能的等價性主要面臨的挑戰(zhàn)是異構(gòu)處理器之間性能的差異,通過建立科學、全面的算力量化評估模型,準確分析不同架構(gòu)的處理能力、運算速度等方面的特性,為應用在·08·要推動CPU、GPU等異構(gòu)算力提升,逐步提高自主研發(fā)算力的部署比例,推進新型數(shù)據(jù)中展行動計劃》,提出要推動算力結(jié)構(gòu)多元配置,推動不同計算架構(gòu)的智能算力與通用算力協(xié)同發(fā)展,滿足均衡型、計算和存儲密集型等各類業(yè)務算力需求。中國人民銀行印發(fā)的《金融科技發(fā)展規(guī)劃(2022-2025)》中提出,要切實保障供應鏈穩(wěn)定可靠,不一云多芯的最終目標是支撐用戶業(yè)務在不同架構(gòu)處理器之間的低成本切換或者自由切·09·第二階段第三階段第二階段第三階段資源混部,即在同一個云平臺中實現(xiàn)不同廠商、不同求,為客戶提供更加靈活、高效的資源調(diào)度策略,實現(xiàn)業(yè)務的靈活部署和快速迭代,從而提升資源的整體利用率,降低運營成本,增強市場競爭力。對于一些對信息安全要求較高的行業(yè)(例如金融、政務等),多芯策略可以避免單一架構(gòu)的依賴,多樣化的技術(shù)路線有助于保在第一階段,用戶通過離線遷移、手動切換等方式實現(xiàn)應商、操作系統(tǒng)廠商、應用廠商、數(shù)據(jù)庫/中間件廠商的廣泛配合。用戶通常難以預在第一階段的基礎(chǔ)上,為進一步滿足應用的·10·源層面,通過跨平臺的資源封裝分發(fā)和遷移實現(xiàn)應用跨架構(gòu)部署和遷移;在平臺層面,實現(xiàn)有狀態(tài)/無狀態(tài)應用的跨架構(gòu)混合部署;在應用層面,可通過服務網(wǎng)格等技術(shù)實現(xiàn)應用的跨在該階段,通過建立面向動態(tài)異構(gòu)特征的算力量化框架,支持規(guī)格層算力測算,解決跨架構(gòu)算力表征及等價刻畫問題;設計等價切換調(diào)度方法,基于同構(gòu)節(jié)點優(yōu)先及應用副本數(shù)/規(guī)格動態(tài)調(diào)整策略,保障算力一致;基于優(yōu)雅退出、探針、重試、預熱等操作系統(tǒng)、數(shù)據(jù)庫、中間件和應用等產(chǎn)業(yè)鏈上下游的共同配合,實現(xiàn)應用與處理器架構(gòu)的徹產(chǎn)業(yè)鏈上下游協(xié)同配合是第三階段的核心驅(qū)動力。從上游的基礎(chǔ)軟件提供商,再到下游的各類應用企業(yè)及終端用戶共同協(xié)同。芯片制造商及整機廠商供商整合硬件資源,優(yōu)化平臺架構(gòu),實現(xiàn)對多芯資源的高效管理與調(diào)度,支撐應用的跨架構(gòu)等價運行;下游應用企業(yè)及終端用戶則從業(yè)務需求與使用體驗角度出發(fā),作為業(yè)務話語權(quán)的在算力評估、標準和測評方面,研究多元異構(gòu)算力量化評估方法產(chǎn)業(yè)鏈上下游,建立一云多芯行業(yè)標準。建立行業(yè)大生態(tài),共同探索新的業(yè)務模式與應用場景,提升整個云計算產(chǎn)業(yè)鏈的活力。促進一云多芯的泛在落地,為數(shù)字經(jīng)濟的蓬勃發(fā)展提供不同芯片架構(gòu)在指令集、寄存器、內(nèi)存管理等以通過交叉編譯等方式實現(xiàn)面向不同架構(gòu)的二進制的構(gòu)建,但程序本身源碼中架構(gòu)相關(guān)部分·11·并且不會產(chǎn)生編譯時錯誤。使用了該數(shù)據(jù)類型的代碼構(gòu)建的面向X86平臺的二進制程序在運行時,可能會與ARM平臺產(chǎn)生截然不同的結(jié)果。程序排錯依賴于專家經(jīng)驗,導致應用適遷移過程中,在新老副本切換流量過程中可能引發(fā)短暫的延遲、中斷或錯誤,造成應用響應實現(xiàn)有狀態(tài)任務在異構(gòu)節(jié)點間高效一致性共識協(xié)商和數(shù)據(jù)同步,以及無狀態(tài)任務的非侵入流生態(tài)建設、激發(fā)產(chǎn)業(yè)鏈協(xié)同創(chuàng)新活力,也能夠?qū)崿F(xiàn)應用在不同處理器架構(gòu)間的低成本切換,·12·制約著架構(gòu)的橫向協(xié)同,應用同時適配多個指令集和操作系統(tǒng)的問題依然很普遍。因此,IT產(chǎn)業(yè)需要新的理念、新的路徑、新的設計,即以CPU為核心的設計模式轉(zhuǎn)變?yōu)橐韵到y(tǒng)為核支撐用戶業(yè)務在不同架構(gòu)處理器之間的低成本切換或者自由切換,因此,基于以系統(tǒng)為核心圖計算等面向不同場景的業(yè)務需求驅(qū)動軟硬協(xié)同的系成接口標準、交互規(guī)范、算力規(guī)格、能效規(guī)范等標準或規(guī)范。其次,基于系統(tǒng)規(guī)格推導/定義芯片指令集標準和融合架構(gòu)整機系統(tǒng)設計,實現(xiàn)資源融合池化、多元異構(gòu)協(xié)同、綠色節(jié)能高效。在異構(gòu)加速層面,結(jié)合智能網(wǎng)卡、加速卡深度學習流式計算深度學習流式計算場景驅(qū)動軟硬協(xié)同設計場景驅(qū)動軟硬協(xié)同設計·13·承擔其相應的職責和功能。層與層之間通過標準協(xié)議實現(xiàn)協(xié)同和解耦。通過分層的層次實現(xiàn)了邏輯上的分離,每一層都可以獨立于其他層進行開發(fā)、部署和擴展,消除單一口,實現(xiàn)不同技術(shù)、平臺和應用之間的互操作性和可集成性,進而實現(xiàn)產(chǎn)業(yè)鏈整體的標準規(guī)范。例如,芯片/整機層與OS之間通過形成統(tǒng)一指令集/虛擬指令集標準支撐上層應用的);一云多芯的最終目標是支撐用戶業(yè)務在不同架構(gòu)處理器之間的低成本切換或者自由切持續(xù)演進。從混合部署、離線遷移和手動切換,到基·14·算力調(diào)度通過智能感知的分配策略實現(xiàn)算力的靈活調(diào)配,滿足應用多樣化的算力需求。一云多芯算力調(diào)度基于上述理念,倡導構(gòu)建分層解耦、開放標準的整體架構(gòu),層的各層級能夠獨立運行、獨立演化的同時,通過標準化、規(guī)范化的協(xié)議、標準實現(xiàn)層間協(xié)·跨架構(gòu)可運行性·分布式系統(tǒng)數(shù)據(jù)狀態(tài)同步·跨架構(gòu)流量分發(fā)治理·運行時等價封裝·架構(gòu)感知的算力有向調(diào)度·層次化算力量化分析方法·跨架構(gòu)可運行性·分布式系統(tǒng)數(shù)據(jù)狀態(tài)同步·跨架構(gòu)流量分發(fā)治理·運行時等價封裝·架構(gòu)感知的算力有向調(diào)度·層次化算力量化分析方法·應用跨架構(gòu)等價調(diào)度·跨架構(gòu)可運行性·算力測算方法·跨架構(gòu)運行調(diào)優(yōu)方法·性能及RAS設計·推動垂直生態(tài)繁榮·構(gòu)建整機開放標準云操作系統(tǒng)層、基礎(chǔ)應用層、業(yè)務應用層等,圍繞多芯場景下的業(yè)務應用的運行提供基礎(chǔ)運行環(huán)境,是承上接下的關(guān)鍵核心;云操作系統(tǒng)層本身作為分布式·15·跨架構(gòu)主備跨架構(gòu)混部一云多芯云操作系統(tǒng)芯片廠商甲芯片廠商乙???芯片廠商丙芯片廠商丁芯片架構(gòu)A芯片架構(gòu)B跨架構(gòu)主備跨架構(gòu)混部一云多芯云操作系統(tǒng)芯片廠商甲芯片廠商乙???芯片廠商丙芯片廠商丁芯片架構(gòu)A芯片架構(gòu)B計算芯片層面,各計算芯片廠商通過自主設計格提升、生產(chǎn)工藝提升等方式,不斷提升性能規(guī)格及穩(wěn)定性,并在實際落地應用過程中不斷迭代優(yōu)化。例如,龍芯研制了LoongArch指令系統(tǒng),具備高度的自主性與安全性,采用了采用模式識別等智能化技術(shù)實現(xiàn)高精度檢測,確保整機在生產(chǎn)過程中的質(zhì)量控制。業(yè)內(nèi)也倡·16·導制定標準規(guī)范為相關(guān)工作提供指導和依據(jù),例如強制性國家標準《GB43630-2023塔式是推動與主流操作系統(tǒng)的編譯適配和性能調(diào)優(yōu)。很多廠商不僅提供原廠適配的基礎(chǔ)版本操作核中合入。其次是推動主流編程語言和應用框架的適配,例如JDK等,以支持開發(fā)人員快速構(gòu)建相應架構(gòu)的應用,并提供應用跨架構(gòu)遷移和調(diào)優(yōu)的最佳實踐及便捷工具。最后是工具基于GCC推出了PhyGCC高性能編譯器,針對飛騰微架構(gòu)進行了定向優(yōu)化,內(nèi)置了寄存器分配算法的優(yōu)選器,引入了數(shù)組重新映射特性,支持對特定負優(yōu)化組合的禁用,集成了優(yōu)化的數(shù)學庫和內(nèi)存分配庫,在典型基準測試程序上實現(xiàn)了進一步的性能提升。推出適用于飛騰開放化標準化逐漸成為整機廠商的共識。早在2011年,國際上就發(fā)起了開放計算項目網(wǎng)卡等成功案例。2023年,中國電子技術(shù)標準化研究院、浪潮電子信息產(chǎn)業(yè)股份有限公司以開放共建、協(xié)同創(chuàng)新為宗旨,構(gòu)建全球領(lǐng)先的規(guī)范和標具備全球影響力的產(chǎn)業(yè)生態(tài)。同年,OCTC發(fā)布了首個面向通用市場建立的整機柜服務器的標準《T/CESA1293—2023整機柜服務器通用規(guī)范》,對推動實現(xiàn)標準化具于處理器的標準化算力模組單元,通過統(tǒng)一不同處理器算力單元對外高速互連、管理協(xié)議、·17·態(tài)挑戰(zhàn)問題,方便客戶根據(jù)人工智能、云計算、大數(shù)據(jù)等多樣化應用場景,靈活、快速匹配服務器操作系統(tǒng)是硬件與軟件之間的紐帶,是承載境。多芯場景下,要求服務器操作系統(tǒng)廣泛兼容不同的硬件平臺,并為承載的上層系統(tǒng)提供微架構(gòu)等方面存在天壤之別,如何在操作系統(tǒng)內(nèi)核層面兼容多種架構(gòu),在保障內(nèi)核高效穩(wěn)定運行的同時能夠在Shell層面提供一致性的應用程序運行環(huán)境成為挑戰(zhàn)。此外,不同架構(gòu)、不同廠商的處理器的核心數(shù)、工作頻率、生產(chǎn)工藝、散熱設計以及工況的差異導致處理器提供的計算能力存在巨大差異,如何針對算力進行客觀準確的衡量、并提供應用調(diào)優(yōu)的最佳實操作系統(tǒng)自身的跨架構(gòu)可運行性由構(gòu)建時指定的指令集與之匹配的鏡像,實現(xiàn)操作系統(tǒng)本身在不同硬件平臺上的可運行性,這涉及到操作系統(tǒng)內(nèi)核戰(zhàn)主要集中在多指令集支持上,不同指令集的差異導致內(nèi)核、驅(qū)動也有第三方廠商硬件自身支持的架構(gòu)有限,適配情況參差不齊,成為瓶頸。一些架構(gòu)生態(tài)建調(diào)試的難度。為驗證適配效果,主流操作系統(tǒng)提供了測試套件(例如LTP、KUnit等項目)構(gòu)可運行性提出了要求。一般而言,使用更高層級語言(例如C語言、Java語言等)編寫的程序往往具有更好的跨架構(gòu)兼容性,可通過交叉編譯等方式實現(xiàn)一套源代碼面向不同架構(gòu)的二進制文件的構(gòu)建;而使用了低層級語言(也包括內(nèi)聯(lián)匯編等技術(shù))編寫的程序往往需要進行一定的適配工作。其次,需要操作系統(tǒng)提供跨架構(gòu)等價一致的應用運行環(huán)境或運行時依·18·同架構(gòu)的內(nèi)核可能具有不同的系統(tǒng)調(diào)用約定,例如X86架構(gòu)下,參數(shù)通過寄存器傳遞,而ARM架構(gòu)下則結(jié)合堆棧實現(xiàn);二是浮點計算與對齊問題,不同架構(gòu)的浮點計算方式和數(shù)據(jù)對齊要求存在差異,導致同樣的程序在不同架構(gòu)上行為不一致甚至崩潰;三是運行時環(huán)境的兼容性,如動態(tài)鏈接器、C標準庫和應用依賴的第三方庫,需在跨架構(gòu)場景下提供一致的行此外,操作系統(tǒng)也與處理器協(xié)同,提供二進制翻譯方法跨架構(gòu)運行。但是二進制翻譯方法存在較高的性能損耗,也存在一些高級復雜指令無法直接翻譯的問題。因此目前基于軟件或軟硬協(xié)同的指令集翻譯技術(shù)更多的應用于終端應用,距離基于操作系統(tǒng)層的性能測試是對器部件或整機進行算以及一些更加綜合的測試工具,例如sysbench、unixbench而面向于特定的場景,業(yè)內(nèi)也有更加專業(yè)的測算方法或工具。例如SPECPower是由向人工智能計算場景的測算工具,以MLPerf為例,作為一款用于衡量機器學習硬件、軟件和服務性能的基準測試平臺,受到浪潮等業(yè)內(nèi)頭部廠商的關(guān)數(shù)據(jù)等場景,也有Linpack、HPCC等對應的工具套件。擴大到數(shù)據(jù)中心場景,不僅有對應基于服務器操作系統(tǒng)的算力測算工具能夠直接反映各器部件或是面向復雜的分布式系統(tǒng)時,面臨擴展能力差等問題,可通過云操作系運行的同時,也需要針對不同架構(gòu)的差異進行定向優(yōu)化,為應用提供最佳運行環(huán)境。在多芯場景下,由于異構(gòu)芯片之間指令集及性能存在的差異,穩(wěn)定性及性能的保障及調(diào)優(yōu)成·19·為上層操作系統(tǒng)及應用提供一致抽象的接口,減少硬件架構(gòu)變化對系統(tǒng)穩(wěn)定性的影響;二是保障系統(tǒng)的可靠穩(wěn)定運行。并通過在線升級的方式,為用戶及時推送系統(tǒng)補丁。核熱升級技術(shù)近年來成為研究的熱點,能夠?qū)崿F(xiàn)業(yè)務無感知的操作系統(tǒng)內(nèi)核升級,保障業(yè)務操作系統(tǒng)也提供對應的優(yōu)化策略。例如針對ARM架構(gòu),可充分利用其核心數(shù)量多的特點,操作系統(tǒng)通過專業(yè)性能分析工具,提供多芯場景下的系統(tǒng)指標采集和智能分析能力,有效識別和解決性能瓶頸,提高性能優(yōu)化的效率,例如浪潮信息云巒操作系統(tǒng)提供的全棧式智能調(diào)·20·跨架構(gòu)的安全等效性也是需要操作系統(tǒng)廠商重點關(guān)注的可信執(zhí)行環(huán)境的實現(xiàn)并沒有統(tǒng)一的標準,因此操作系統(tǒng)層需要通序提供安全等價的運行環(huán)境。云巒操作系統(tǒng)在社區(qū)版基礎(chǔ)上增強內(nèi)生安全機制,通過eBPF安全技術(shù)、可信計算及機密計算方面技術(shù)創(chuàng)新,構(gòu)建并升級了雙保險、可信任、高隱根據(jù)相關(guān)標準定義,云操作系統(tǒng)用于將物理設備以共享、彈理,提供人機界面以按需自服務可計量的方式為用戶提供計算、存儲和網(wǎng)絡等基礎(chǔ)云服務資異構(gòu)計算資源,北向提供高效靈活的混合任務調(diào)度能力,通過對算力任務的動態(tài)調(diào)整和資源跨平臺語言解決了應用的跨架構(gòu)問題,但依賴跨架構(gòu)用跨架構(gòu)的編譯,但也存在運行時的動態(tài)庫依賴問題。因此,程序在多芯系統(tǒng)中的運行不僅需要考慮自身的可運行性,對于現(xiàn)代化的復雜應用,還應綜合考慮其依賴的運行時?;谠撇僮飨到y(tǒng)提供的調(diào)度能力,結(jié)合標準化的容器方式對應用程序及其運行時依賴進行封裝,形成原子性的資源封裝,成為實現(xiàn)應用跨架構(gòu)部署及切換可行的路線。具體的,基于同一套應用程序源代碼,針對不同的架構(gòu)構(gòu)建不同的容器鏡像,如果程序是基于跨平臺的語言構(gòu)建,則將程序腳本或中間代碼與運行時封裝為容器;如果程序是基于非跨平臺的語言構(gòu)建的,則可以通過交叉編譯,構(gòu)建各種架構(gòu)下的二進制文件,然后將其與依賴庫等封裝為容器。此流程可以通過一套流水線作業(yè)自動構(gòu)建,并推送至鏡像倉庫。在應用編排時,云操作系統(tǒng)根據(jù)架構(gòu)感知是一云多芯實現(xiàn)算力調(diào)度、界面功能自適應展·21·性、實現(xiàn)資源封裝生命周期管理的基礎(chǔ),可通過收集器、調(diào)度器、攔截器實現(xiàn)。收集器采集并上報各節(jié)點的CPU架構(gòu)、硬件特性等信息,建立包含架構(gòu)特性的主機列表。調(diào)度器為各種粒度的資源封裝選擇匹配的主機節(jié)點,采用級聯(lián)過濾器機制,加載多個獨立的過濾器,依次對創(chuàng)建請求與主機進行匹配。在一云多芯場景下,通過級聯(lián)架構(gòu)感知過濾器,識別資源封裝創(chuàng)建請求中的鏡像架構(gòu)標簽,根據(jù)CPU架構(gòu)特性匹配結(jié)果過濾出主機節(jié)點。攔截器用于攔截請求并將結(jié)果反饋展示,從而實現(xiàn)不同架構(gòu)功能差異化的自動識別、動態(tài)擴展,屏蔽底測算對象量化方法測算工具規(guī)格算力從服務器系統(tǒng)資源層面測試評估計算能力磁盤和網(wǎng)絡等系統(tǒng)整機規(guī)格性能基準測試SPECCPU,Stress有效算力從平臺層面測試評估中間件的資源封裝性能Kafka等中間件針對中間件的量等指標進行量化評估從應用層面使用真實業(yè)務負載測試評估資源封裝計算能力客戶關(guān)系管理AI推理/訓練等業(yè)務應用針對業(yè)務事務處理能力指標進行量化評估Jmeter,·22·算力量化是實現(xiàn)應用等價遷移的基礎(chǔ),包括基于測評反饋基于測評反饋的算力量化方法分別針對不同層級的算力,定義其量化方法及工具,采用基于實際測量的方式對其算力進行量化。具體的,面向規(guī)格算力,采用基于SUnixBench等工具,對處理器等器部件的基礎(chǔ)性能進行量化評估;面向有效算力,采用進行測算。云操作系統(tǒng)支持提供面向動態(tài)異構(gòu)特征的算力量化框架,支持規(guī)格層、服務級、算力量化的另一種方式是基于性能模型的算力量化方法,建立性能模型的方式,避免在線測評的開銷(包括硬件成本及性能開銷),實現(xiàn)跨架構(gòu)資源封裝規(guī)格的快速推理。基于性能模型的方法對于算力建模要求較高,浪潮云海云操作系統(tǒng)通并使用智能化的計算工作流對影響整機性能的因子進行綜合計算,定義了通用性能調(diào)度指數(shù)基于云操作系統(tǒng)提供的面向動態(tài)異構(gòu)特征的算力量化框架,·23·容器化封裝,解耦操作系統(tǒng)依賴。當節(jié)點發(fā)生故障或計劃內(nèi)維護時,針對應用遷移過程中可能面臨服務性能基線降低的問題,實現(xiàn)了等算力調(diào)度器,支持應用優(yōu)先調(diào)度至等算力節(jié)點,當?shù)人懔?jié)點不滿足要求時(例如無法發(fā)現(xiàn)等算力節(jié)點),則跨架構(gòu)調(diào)度到異構(gòu)節(jié)點,并基于節(jié)點算力動態(tài)調(diào)整目標架構(gòu)上的資源封裝規(guī)格或副本數(shù),保持應用總算力不變,實數(shù)據(jù)庫集群1數(shù)據(jù)庫集群(數(shù)據(jù)庫集群1數(shù)據(jù)庫集群(節(jié)點n節(jié)點n數(shù)據(jù)庫集群2節(jié)點n節(jié)點n數(shù)據(jù)庫集群2節(jié)點n節(jié)點n數(shù)據(jù)庫集群主數(shù)據(jù)庫集群備節(jié)點n節(jié)點n數(shù)據(jù)庫集群主數(shù)據(jù)庫集群備節(jié)點n節(jié)點n·24·◆單架構(gòu)集群模式距小、網(wǎng)絡同域,部署形式不限于虛擬機、裸金屬或者容器化等形式。其優(yōu)點顯而易見,即為便于部署,應用廠商可能提供二進制安裝包、虛擬機鏡像等不同的資源封裝形式。隨著云原生技術(shù)的不斷成熟,越來越多的廠商也選擇提供容器鏡像以及對應的編排腳本的方式?;贠perator的編排方式則不僅能夠提供應用的編排,也能夠?qū)崿F(xiàn)應用的高階運維能力,也逐漸成為開發(fā)運維工程師的首選。目前越來越多的開源應用提供了官方或社區(qū)版本的◆跨架構(gòu)主備部署模式在單架構(gòu)集群模式的基礎(chǔ)上,新建異構(gòu)資源池作為備集群。典型的,主集群基于X86架構(gòu)構(gòu)建,而備集群基于ARM集群構(gòu)建,集群之間通過架構(gòu)無關(guān)的網(wǎng)絡通訊協(xié)議進行指令協(xié)同及數(shù)據(jù)同步。其優(yōu)點在于采用性能較優(yōu)的集群以保障系統(tǒng)性能及穩(wěn)定性,同時能夠降低該模式不僅滿足用戶對技術(shù)多樣性的期望,同時具備可靠客戶對于芯片架構(gòu)穩(wěn)定性和可靠性顧慮的方案之一。應用提供商應當持續(xù)加強其在多架構(gòu)上),◆跨架構(gòu)混合部署模式即相同角色的節(jié)點分別分布在多種架構(gòu)上。以一個三節(jié)點集群為例,其X86節(jié)點作為由于節(jié)點間在指令集、算力等方面存在的差異,面臨非對等架構(gòu)下的分布式應用狀態(tài)一致性保證問題,給其穩(wěn)定性及可維護性帶來巨大挑戰(zhàn)。在一云多芯的當前發(fā)展階段,往往僅在小非對等架構(gòu)下的分布式應用狀態(tài)一致性保證問題可通過分布式一致性算法解決。ACM圖靈獎獲得者萊斯利·蘭伯特(LeslieLamport)提出了基于消息傳遞且具有高容錯性的·25·在此基礎(chǔ)上,跨架構(gòu)的數(shù)據(jù)狀態(tài)同步需要進一步考慮節(jié)點的非對稱特征。以Raft協(xié)議為例周期性發(fā)送心跳來保證主節(jié)點地位,當一個從節(jié)點在一個超時周期內(nèi)沒有收到心跳,則該節(jié)點轉(zhuǎn)化為候選(Candidate)節(jié)點參與選舉。多芯系統(tǒng)中各節(jié)點的處理能力、網(wǎng)絡條件等不同導致超時影響差異化,可采用基于極大似然估計的適應性方法,避免心跳延遲大、處理能力弱的節(jié)點頻繁觸發(fā)選舉,同時保證處理能力強的節(jié)點可快速發(fā)起選舉。對于投票策略,采業(yè)務應用層承載具有實際業(yè)務價值的應用程基于分布式一致性協(xié)議的基礎(chǔ)應用簡化了業(yè)務應用的構(gòu)建態(tài)的工作負載,與復雜分布式的基礎(chǔ)應用層相結(jié)合,組成了完整的業(yè)務應用。如下是幾種典模塊B模塊B模塊B模塊B模塊B模塊B模塊B模塊B模塊B模塊B模塊B模塊B·26·◆單架構(gòu)模式◆跨架構(gòu)遠程調(diào)用下,不同模塊分別運行在不同架構(gòu)中,并通過架構(gòu)無關(guān)的網(wǎng)絡通訊協(xié)議或私有通訊協(xié)議進行互聯(lián)互通互操作。典型的,高性能的X86架構(gòu)被用于部署數(shù)據(jù)庫集群,而擁有更多核心的ARM架構(gòu)則被用于部署無狀態(tài)的業(yè)務應用,構(gòu)建整體的跨架構(gòu)應用(集群成為目前主◆跨架構(gòu)混合部署與基礎(chǔ)應用的跨架構(gòu)部署類似的,該模式下所有的模塊均跨架構(gòu)部署,是一種的部署模式。不僅面臨非對等架構(gòu)下的分布式應用狀態(tài)一致性保證問題,也的流量治理問題,目前更多的處于探索和試驗階段。需要基于云原生技術(shù),并借助云操作系并引流至對應節(jié)點的副本上。為保證服務質(zhì)量不降級,根據(jù)有效算力、業(yè)務算力量化分析確可采用服務網(wǎng)格的思想實現(xiàn)??刂泼娓兄北咀兓闪髁壳蟹植呗?,下發(fā)至網(wǎng)絡代理關(guān)。對于東西向流量,網(wǎng)絡代理劫持流量并根據(jù)切分策略按比例轉(zhuǎn)發(fā)到不同的副本。對于南北向流量,網(wǎng)關(guān)在流量轉(zhuǎn)發(fā)時根據(jù)切分策略轉(zhuǎn)發(fā)到不同副本。在流量切分的瞬時過程中,受目標節(jié)點副本未啟動、TCP連接延遲等·27·復雜且海量。如何管理利用好海量數(shù)字基礎(chǔ)設施,通過新一代信息通信技術(shù)賦能千行百業(yè),二、跨域一體化。通信云的鮮明特點是地域跨度極三、易管理易運維。地域跨度大也給管理運維增加了難度?;诮y(tǒng)一云平速上線,并實現(xiàn)跨域多數(shù)據(jù)中心的統(tǒng)一監(jiān)控、故障預持多元異構(gòu)資源的混合部署、統(tǒng)一調(diào)度、統(tǒng)一分發(fā),實現(xiàn)資源靈活調(diào)度及業(yè)務高效上云。其·28·安全保障體系安全保障體系跨域分布式云統(tǒng)一管理自用業(yè)務自用業(yè)務辦公類運營類......辦公類運營類......對外業(yè)務外網(wǎng)服務外網(wǎng)服務生態(tài)合作生態(tài)合作............數(shù)據(jù)庫服務數(shù)據(jù)庫服務服務容器服務行業(yè)生態(tài)資源數(shù)據(jù)庫數(shù)據(jù)庫服務服務容器容器服務運維運營體系運維運營體系存儲資源池網(wǎng)絡資源池計算資源池存儲資源池網(wǎng)絡資源池計算資源池異構(gòu)處理器異構(gòu)處理器租賃機房租賃機房該架構(gòu)具有如下特點。首先,以一云多芯為理念,以云原生技術(shù)為底座,建設統(tǒng)統(tǒng)一監(jiān)控、統(tǒng)一運維。最后,針對多元異構(gòu)計算·29·農(nóng)信是金融體系的重要組成部分,農(nóng)信的改革與建設,是健全高質(zhì)量農(nóng)村金融供給的重要內(nèi)容,對強化鄉(xiāng)村振興金融服務具有重要意義。農(nóng)信網(wǎng)點分布廣盡管云數(shù)據(jù)中心已具備基礎(chǔ)的運維監(jiān)控管理能力,但在多維度、高效、立體的自動化、智能化運維管理方面仍有待提升。因此,亟需優(yōu)化資源類型及利用率,構(gòu)建多元化的應用運行環(huán)一、一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 交通運輸規(guī)劃與城市發(fā)展
- 安全生產(chǎn)標準化培訓課件-機電
- Module3 Unit 2 Rules(說課稿)-2023-2024學年牛津上海版(試用本)英語二年級下冊
- 2025年度城市道路面包磚鋪設工程合同4篇
- 10竹節(jié)人 說課稿-2024-2025學年語文六年級上冊統(tǒng)編版
- 二零二五百貨集團電商渠道合作與推廣合同3篇
- 2025年度旅行社研學旅行服務合同7篇
- 5 魯濱遜漂流記(節(jié)選)(說課稿)-2023-2024學年語文六年級下冊統(tǒng)編版
- 12 我們小點兒聲 第2課時 說課稿-2023-2024學年道德與法治二年級上冊統(tǒng)編版
- 6 爭做未來科學家 說課稿-2024-2025學年道德與法治三年級上冊統(tǒng)編版
- 2024年縣鄉(xiāng)教師選調(diào)進城考試《教育學》題庫及完整答案(考點梳理)
- 車借給別人免責協(xié)議書
- 河北省興隆縣盛嘉恒信礦業(yè)有限公司李杖子硅石礦礦山地質(zhì)環(huán)境保護與治理恢復方案
- 第七章力與運動第八章壓強第九章浮力綜合檢測題(一)-2023-2024學年滬科版物理八年級下學期
- 醫(yī)療機構(gòu)診療科目名錄(2022含注釋)
- 微視頻基地策劃方案
- 光伏項目質(zhì)量評估報告
- 八年級一本·現(xiàn)代文閱讀訓練100篇
- 2023年電池系統(tǒng)測試工程師年度總結(jié)及下一年計劃
- 應急預案評分標準表
- 《既有建筑結(jié)構(gòu)安全監(jiān)測技術(shù)標準》(征求意見稿)及條文說明
評論
0/150
提交評論