版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
智算中心作為信息基礎設施的重要組成部分,通過算力的生產(chǎn)、聚合、調(diào)度和釋放,能夠為快速增長的人工智能算力需求提供基礎支撐,在推進AI產(chǎn)業(yè)化、賦能產(chǎn)業(yè)AI化、助力治理智能化、促進產(chǎn)業(yè)集群化等方面具有顯著作用,是數(shù)字經(jīng)濟時代促進科技創(chuàng)新、優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)、提升國家競爭力的重要支撐。中國智算中心產(chǎn)業(yè)迎來重要發(fā)展機遇。工業(yè)和信息化部、中央網(wǎng)信辦、教育部、國家衛(wèi)生健康委、中國人民銀行、國務院國資委等六部門聯(lián)合印發(fā)的《算力基礎設施高質(zhì)量發(fā)展行動計劃》明確提出,到2025年,我國算力規(guī)模超過300EFLOPS,智能算力占比達到35%。在政策指引與市場需求的共同推動下,智算中心產(chǎn)業(yè)進入快速發(fā)展期,大批智算中心項長。未來,隨著人工智能、大數(shù)據(jù)等新興技術(shù)驅(qū)動下的應用場景日益豐富,AI硬件、算力服務、模型應用等產(chǎn)業(yè)鏈重要環(huán)節(jié)的商業(yè)模式不斷創(chuàng)新發(fā)展,智算中心產(chǎn)業(yè)生態(tài)將加速形成,并向供給優(yōu)化、數(shù)實融合、綠色低碳、產(chǎn)業(yè)協(xié)同等方向演進。為深入剖析中國智算中心產(chǎn)業(yè)發(fā)展現(xiàn)狀,精準把握智算中心產(chǎn)業(yè)未來發(fā)展態(tài)勢,中國通信工業(yè)協(xié)會數(shù)據(jù)中心委員會集合智算中心產(chǎn)業(yè)專家資源和產(chǎn)業(yè)鏈力量,聯(lián)合發(fā)布《中國智算中心產(chǎn)業(yè)發(fā)展白皮書(2024)》。本白皮書立足于我國智算中心產(chǎn)業(yè)實際,展望未來,為共創(chuàng)智能計算新時代、建設數(shù)字中國貢獻力量。本白皮書全面梳理我國智算中心產(chǎn)業(yè)發(fā)展的現(xiàn)狀、趨勢、機遇與挑戰(zhàn),系統(tǒng)剖析智算中心建設、運營面臨的新形勢、新要求,希望為智算中心產(chǎn)業(yè)相關管理機構(gòu)、行業(yè)協(xié)會、產(chǎn)業(yè)從業(yè)者等提供參考。3中國通信工業(yè)協(xié)會數(shù)據(jù)中心委員會張家口市人民政府蕪湖市人民政府韶關市人民政府烏蘭察布市人民政府慶陽市人民政府大同市人民政府內(nèi)蒙古和林格爾新區(qū)管理委員會中國長江三峽集團有限公司中科院建筑設計研究院有限公司中國建設銀行股份有限公司北京科智咨詢有限公司上海寶信數(shù)據(jù)中心有限公司秦淮數(shù)據(jù)集團北京數(shù)道智算科技有限公司北京世紀互聯(lián)寬帶數(shù)據(jù)中心有限公司科華數(shù)據(jù)股份有限公司科大訊飛股份有限公司河南昆侖技術(shù)有限公司潤澤科技發(fā)展有限公司博大數(shù)據(jù)服務(深圳)有限公司聯(lián)想(北京)有限公司北京中科合盈數(shù)據(jù)科技有限公司南方電網(wǎng)大數(shù)據(jù)服務有限公司聯(lián)通(廣東)產(chǎn)業(yè)互聯(lián)網(wǎng)有限公司杭州星臨科技有限責任公司廣東美的暖通設備有限公司四川省天府云數(shù)據(jù)科技有限責任公司北京泰豪智能工程有限公司濰柴重機股份有限公司中電系統(tǒng)建設工程有限公司恒華數(shù)字科技集團有限公司深圳市中電電力技術(shù)股份有限公司廣州市匯源通信建設監(jiān)理有限公司中建三局第一建設安裝有限公司雙登集團股份有限公司蘭洋(寧波)科技有限公司廣州尚航信息科技股份有限公司華章數(shù)據(jù)技術(shù)有限公司中世順科技(北京)股份有限公司潤建股份有限公司浙江潔普智匯能源科技有限公司廣東申菱環(huán)境系統(tǒng)股份有限公司鵬博士電信傳媒集團股份有限公司盛達全球暢服(深圳)科技有限公司公誠管理咨詢有限公司金和平張福林張曉雪潘建初甄鑒張澤銳趙文博方虹珺周超輝孫東旺許志德鄧國峰王元月于景淇郭俊峰鞠昌斌任國斌楊彥超張學超唐巨光周洪聰周科翔蘭滿桔張勁松邵南軍侯興澤5一、智算中心產(chǎn)業(yè)發(fā)展背景及內(nèi)涵 (一)智算中心產(chǎn)業(yè)發(fā)展背景 (二)智算中心產(chǎn)業(yè)內(nèi)涵 二、全球智算產(chǎn)業(yè)步入快速發(fā)展新階段… (一)人工智能驅(qū)動智算規(guī)模擴張… (二)AI芯片技術(shù)迭代奠定智算基礎 (三)大模型加速人工智能與產(chǎn)業(yè)融合… 三、中國智算中心產(chǎn)業(yè)迎來黃金發(fā)展期 (一)新型基礎設施賦能數(shù)字經(jīng)濟發(fā)展 (二)政策推動智算中心合理有序建設 (三)大模型應用深化行業(yè)數(shù)字化轉(zhuǎn)型 四、中國智算中心產(chǎn)業(yè)發(fā)展現(xiàn)狀 (一)智算中心市場規(guī)模持續(xù)擴大 (二)各類投資主體積極投建智算中心 (三)智算中心商業(yè)模式不斷演進… (四)產(chǎn)業(yè)發(fā)展持續(xù)踐行綠色低碳理念… 五、AI時代算力中心建設開啟新篇章 (一)人工智能發(fā)展對算力中心建設提出更高要求 (二)技術(shù)創(chuàng)新加速AI硬件國產(chǎn)替代 (三)高效網(wǎng)絡架構(gòu)推動算網(wǎng)融合… (四)功率密度提升促進高效制冷實踐 (五)新型供配電系統(tǒng)重塑能源應用 六、智算中心運營服務向高效安全方向發(fā)展 (一)算力資源高效調(diào)度 (二)數(shù)據(jù)安全多重保障 (三)運維平臺智能可視 七、中國智算中心產(chǎn)業(yè)發(fā)展展望與倡議… (一)中國智算中心產(chǎn)業(yè)發(fā)展展望 (二)中國智算中心產(chǎn)業(yè)發(fā)展倡議… 附:中國智算中心典型項目案例 圖表1:中國智算中心產(chǎn)業(yè)鏈 圖表2:中國智算中心相關政策梳理 圖表3:2020-2028年中國智算中心市場規(guī)模及預測 圖表4:中國投運/在建/規(guī)劃智算中心項目區(qū)域分布 圖表5:中國智算中心項目主體分布(按項目數(shù)量)… 圖表6:中國智算中心項目主體分布(按算力規(guī)模)… 圖表7:智算中心建設主體類別及優(yōu)劣勢 圖表8:智算中心商業(yè)模式類別 圖表9:智算中心總體架構(gòu) 圖表10:AI芯片(GPU、FPGA、ASIC)主要特點 圖表11:主流高性能芯片特性對比 圖表12:InfiniBand和ROCE方案比較 圖表13:數(shù)據(jù)中心液冷技術(shù)方案對比 圖表14:中國高性能算力中心先進制冷方案應用案例 圖表15:算力資源調(diào)度與管理架構(gòu) 人工智能作為引領未來的戰(zhàn)略性技術(shù),逐步成為衡量國家國際競爭力的重要領域,高性能算力是人工智能發(fā)展的重要組成部分。從全球范圍看,各國紛紛制定人工智能相關的戰(zhàn)略和政策,推動高性能算力發(fā)展。如美國成立智算中心基礎設施特別工作組、歐盟出臺《歐洲高性能計算共同計劃》、日本發(fā)布《人工智能戰(zhàn)略2022》等。在當前復雜的國際競爭形勢下,發(fā)展人工智能產(chǎn)業(yè),有利于在新一輪國際科技競爭中掌握主導權(quán)。我國高度重視人工智能發(fā)展,黨的十八大以來,不斷完善人工智能發(fā)展頂層設計。自2017年,國務院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,明確堅持人工智能研發(fā)攻關、產(chǎn)品應用和產(chǎn)業(yè)培育"三位一體"推進,全面支撐科技、經(jīng)濟、社會發(fā)展和國家安全,部署構(gòu)筑我國人工智能發(fā)展的先發(fā)優(yōu)勢,加快建設創(chuàng)新型國家和世界科技強國。到2024年,全國兩會政府工作報告強調(diào)人工智能在推動經(jīng)濟社會發(fā)展中的重要作用,提出強化基礎研究、拓展應用領域、加強人才培養(yǎng)等,促進人工智能與實體經(jīng)濟深度融合。國家在政策層面全方位推進人工智能產(chǎn)業(yè)發(fā)展。智算中心是人工智能發(fā)展的關鍵基礎設施,是帶動社會科技創(chuàng)新、經(jīng)濟發(fā)展以及社會治理水平提升,賦能全產(chǎn)業(yè)鏈發(fā)展的重要力量。智算中心能夠為基礎研究和應用開發(fā)提供先進計算能力,同時加速5G、大數(shù)據(jù)等新一代信息技術(shù)的迭代發(fā)展;推動人工智能與各行業(yè)融合創(chuàng)新,推動制造、教育、金融、能源等9領域的數(shù)字化轉(zhuǎn)型,提升產(chǎn)業(yè)發(fā)展數(shù)字化智能化水平;促進人才培養(yǎng)和資源整合,加快地區(qū)人工智能產(chǎn)業(yè)集聚發(fā)展;助力智慧城市建設、公共安全保障和政務服務優(yōu)化,提升社會治理水平。智算中心產(chǎn)業(yè)成為我國提升國際競爭力、建設創(chuàng)新型國家的重要支撐。自生成式人工智能問世以來,國內(nèi)人工智能大模型快速發(fā)展。截至2024年11月,國家網(wǎng)信辦備案的生成式人工智能大模型已達到252個,通用大模型和垂類應用大模型訓練的智算算力需求迅速增加。目前,通用大模型和垂類應用大模型的已經(jīng)逐步商用,開始賦能千行百業(yè)。未來,人工智能大模型與產(chǎn)業(yè)必將走向深度融合,產(chǎn)業(yè)智算算力需求將得到充分釋放。在人工智能快速發(fā)展的帶動下,智算中心產(chǎn)業(yè)投資迅速增加。截至2024年11月,全國已投運的智算中心項目近150個,在建及規(guī)劃建設的智算中心項目近400個。智算中心是基于人工智能計算架構(gòu),提供人工智能應用所需算力服務、數(shù)據(jù)服務和算法服務的算力基礎設施,融合高性能計算設備、高速網(wǎng)絡以及先進的軟件系統(tǒng),為人工智能訓練和推理提供高效、穩(wěn)定的計算環(huán)境。智算中心的主要功能包括:提供強大的計算能力:智算中心采用專門的AI算力硬件,如GPU、NPU、TPU等,以支持高效的AI計算任務。高效的數(shù)據(jù)處理:智算中心融合了高性能計算設備和高速網(wǎng)絡,能夠處理大規(guī)模的數(shù)據(jù)集和復雜的計算任務。支持多種AI應用:智算中心適用于計算機視覺、自然語言處理、機器學習狹義上,智算中心是通用算力中心的升級,在傳統(tǒng)機房的基礎上部署AI算力以提供服務。廣義地說,智算中心是提供人工智能應用所需算力服務、數(shù)據(jù)服務和算法服務的新型算力基礎設施,包含基礎層、平臺層和應用層。其中,基礎部分是支撐智算中心建設與應用的先進人工智能理論和計算架構(gòu);平臺部分圍繞智算中心算力生產(chǎn)、聚合、調(diào)度、釋放的作業(yè)邏輯展開;應用層提供算力生產(chǎn)供應、數(shù)據(jù)開放共享、智能生態(tài)建設和產(chǎn)業(yè)創(chuàng)新聚集。智算中心產(chǎn)業(yè)鏈涵蓋從AI芯片/服務器等設計制造、基礎設施建設,到智算服務提供,以及生成式大模型研發(fā)及基于大模型的行業(yè)應用。在上游環(huán)節(jié),主要包括土建基礎設施和IT基礎架構(gòu)的建設。土建基礎設施涵蓋土建施工、制冷系統(tǒng)、供配電系統(tǒng)和電信運營等,為智算中心提供穩(wěn)定可靠的物理環(huán)境;IT基礎架構(gòu)包括芯片設計制造、AI服務器、網(wǎng)絡設備、存儲設備和數(shù)據(jù)中心管理系統(tǒng)等,它們共同構(gòu)成智算中心的計算、存儲和通信基礎。AI芯片作為智能算力的核心,技術(shù)壁壘高,在GPU、FPGA、TPU、NPU等細分領在中游環(huán)節(jié),智算服務提供商、云服務供應商和IDC服務商等基于自身優(yōu)勢,提供智算服務及運維解決方案。主流云服務供應商不僅自建大型智算中心,還加速布局AI大模型,以提供更高效、更智能的服務。IDC服務商也依托云網(wǎng)資源優(yōu)勢參與智算建設,提供智算、超算、通算等多樣化的算力服務及一體化運維解決方案。部分云服務商與科技公司利用自身技術(shù)壁壘提供大模型及平臺服務,為下游用戶提供更加豐富、智能的算力服務。動駕駛、機器人、元宇宙、智慧醫(yī)療、文娛創(chuàng)作、智慧科研等相關產(chǎn)業(yè)發(fā)展。通過提供智能算力和算法,加速新技術(shù)的研發(fā)和商業(yè)化進程,推動產(chǎn)業(yè)創(chuàng)新進步。隨著各行業(yè)積極探索生成式人工智能應用創(chuàng)新點,大模型應用場景逐步拓展。在海外市場,大模型主要在傳媒、游戲、機器人、辦公等領域落地應用。國內(nèi)市場大模型應用則主要聚焦于金融、醫(yī)療、傳媒、游戲、汽車等領域。全球智算產(chǎn)業(yè)步入快速發(fā)展新階段大模型參數(shù)量實現(xiàn)指數(shù)級增長,推理和訓練以海量數(shù)據(jù)為基礎,全球范圍內(nèi)大模型應用推動數(shù)據(jù)量激增,數(shù)據(jù)類型和來源更加豐富。在數(shù)據(jù)量、大模型復雜算法以及應用場景的推動下,承載AI計算能力的智算中心進入快速擴張階段。國際科技巨頭微軟、谷歌、亞馬遜,國內(nèi)互聯(lián)網(wǎng)企業(yè)阿里、騰訊、字節(jié)跳動,以及基礎電信運營商等,紛紛在全球多個區(qū)域建設智能計算中心以拓展AI云服務或滿足自身AI業(yè)務發(fā)展需求,其他各類主體也積極投資建設智算中心。2023年全球智能算力規(guī)模增速超過算力總規(guī)模增速,隨著技術(shù)的不斷進步和需求的持續(xù)擴大,智算中心建設加速推進,智能算力將繼續(xù)保持快速增長勢頭。高性能芯片技術(shù)快速迭代創(chuàng)新,為人工智能發(fā)展提供保障,進而帶動智算中心發(fā)展。Nvidia作為全球GPU算力芯片市場領導者,代表性產(chǎn)品V100、A100、H100技術(shù)指標處于領先水平,最新產(chǎn)品BlQckwellGPU采用先進的4納米工藝,提供高達20petaflops的FP4運算能力。其他科技巨頭如AMD、英特爾、微軟、亞馬遜和谷歌也在AI芯片領域展開競爭。同時,中國AI芯片國產(chǎn)化進程正加速發(fā)展,華為、寒武紀、海光信息、景嘉微以及阿里、百度等企業(yè)不僅在自研AI芯片技術(shù)上取得重要進展,還通過產(chǎn)品集成、行業(yè)解決方案及生態(tài)伙伴合作等方式推動國產(chǎn)AI芯片商業(yè)化應用,為智能算力發(fā)展提供堅實基礎。隨著人工智能技術(shù)的快速發(fā)展,以及人工智能與5G、物聯(lián)網(wǎng)、邊緣計算等技術(shù)的不斷融合,高性能芯片也將迎來技術(shù)創(chuàng)新的新高潮。生成式人工智能應用蓬勃發(fā)展。隨著AIGC技術(shù)不斷進步,大模型商業(yè)化應用場景從文生文、文生圖應用逐步擴展至音頻生成、視頻生成、多模態(tài)生成類,以及面向不同行業(yè)領域或用戶群體的工具類應用,如代碼生成、copilot、數(shù)字人、營銷工具、聊天助手等。通用大模型適用性廣,包括chatGPT、訊飛星火認業(yè)、基礎電信運營商、大型央國企等正加速推動垂類大模型研發(fā)落地。據(jù)測算,2024年全球生成式人工智能市場規(guī)模將達到400億美元,到2030年有望增長到1.5萬億美元,2022-2030年復合年增長率高達83%。未來AIGC將加速在更多場景商業(yè)化落地,如廣告、游戲、自媒體等內(nèi)容創(chuàng)作領域以及金融、電迎來黃金發(fā)展期智算中心是基于最新人工智能理論,采用領先的人工智能計算架構(gòu),提供人工智能應用所需算力服務、數(shù)據(jù)服務和算法服務的新型算力基礎設施。智算中心以算力技術(shù)和算法模型為關鍵核心,算力技術(shù)以AI芯片、AI服務器、AI集群為載體,算法模型則以AI大模型為主要代表。智算中心在提供高效算力資源和服務的基礎上,聚焦區(qū)域產(chǎn)業(yè)創(chuàng)新發(fā)展。智算中心項目具有良好的社會經(jīng)濟效益,對技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展的帶動作用明顯。根據(jù)國家信息中心數(shù)據(jù),在智算中心實現(xiàn)80%應用水平的情況下,城市/地區(qū)在智算中心建設投入的增長量對創(chuàng)新產(chǎn)出的貢獻率約為14%17%;預計2020年至2030年我國人工智能核心產(chǎn)業(yè)規(guī)模的年均復合增長率達20.9%,帶動相關產(chǎn)業(yè)規(guī)模的年均復合增長率達25.9%政府高度重視智算中心建設,密集出臺相關政策。為推動智算中心有序發(fā)展,國家出臺多項政策統(tǒng)籌建設面向人工智能領域的算力和算法中心,打造智能算力、通用算法和開發(fā)平臺一體化的新型智能基礎設施。各地政府積極響應,紛紛發(fā)布相關政策加快智算中心產(chǎn)業(yè)發(fā)展。智算政策聚焦關鍵領域,如高端高效智能經(jīng)濟、安全便捷智能社會建設等,著力打造人工智能重點應用場景,推動智算中心在關鍵領域的應用和普及,促進數(shù)字化轉(zhuǎn)型。2017年《新一代人工智能發(fā)展規(guī)劃》出臺,首次將智能計算中心提升到國家戰(zhàn)略層面,明確提出"建立人工智能超級計算中心"的戰(zhàn)略目標中心的發(fā)展奠定政策基礎。2020年,國家發(fā)改委將智能計算中心納入新型基礎設施建設范疇,激發(fā)各地智算中心投資熱情。在政策推動下,多地政府開始積極落地智能計算中心項目,智算中心進入快速擴張期。2022年"東數(shù)西算"工程實施以來,國家政策明確對全國算力資源進行統(tǒng)籌和智能調(diào)度,對智能計算中心發(fā)展的引導力度進一步加強。2024年9月,工信部等十一部門發(fā)布《關于推動新型信息基礎設施協(xié)調(diào)發(fā)展有關事項的通知》,強調(diào)逐步提升智能算力占比,東部發(fā)達地區(qū)先行先試、探索5G-A、人工智能等建設和應用新模式,西部地區(qū)在綜合成本優(yōu)勢明顯地區(qū)合理布局重大算力設施,探索建設超大型人工智能訓練算力設施。圖表2:中國智算中心相關政策梳理2017.8國務院《新一代人工智能發(fā)展規(guī)劃》布局前沿基礎理論研究,建立新一代人工智能關鍵共性技術(shù)體系,統(tǒng)籌布局人工智能創(chuàng)新平臺,建立人工智能超級計算中心、大規(guī)模超級智能計算支撐環(huán)境2020.4國家發(fā)改委新聞施、融合基礎設施、創(chuàng)新基礎設施三個方面信息基礎設施包括以數(shù)據(jù)中心、智能計算中心為代表的算力基礎設施等。2021.1國務院《建設高標準市案》加大新型基礎設施投資力度,推動第五代移動通信、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)等通信網(wǎng)絡基礎設施,人工智智能計算中心等算力基礎設施建設。2021.7工信部《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》加快提升算力算效水平。引導新型數(shù)據(jù)中心集約化高密化、智能化建設,穩(wěn)步提高數(shù)據(jù)中心單體規(guī)模、單機架功率,加快高性能、智能計算中心部署,推動CPU、GPU等異構(gòu)算力提升,逐步提高自主研發(fā)算力的部署比例,推進新型數(shù)據(jù)中心算力供應多元化,支撐各類智能應用。強化標準支撐引領。加快推進邊緣數(shù)據(jù)中心、智能計算中心等標準建設,支撐新技術(shù)新應用落地。2021.12全和信息化委員會《"十四五"國家信息化規(guī)劃》加強信息技術(shù)專利創(chuàng)新。圍繞大數(shù)據(jù)中心、智能計算中心等領域加強高價值專利培育。構(gòu)建云網(wǎng)融合的新型算力設施。統(tǒng)籌建設面向區(qū)塊鏈和人工智能等的算力和算法中心。2021.12國務院《"十四五"數(shù)字經(jīng)濟發(fā)展規(guī)劃》推動智能計算中心有序發(fā)展,打造智能算力、通用算法和開發(fā)平臺一體化的新型智能基礎設施,面向政務服務、智慧城市、智能制造、自動駕駛、語言智能等重點新興領域,提供體系化的人工智能服務。2022.1國務院《關于印發(fā)全國一體化政務大數(shù)據(jù)體系建設指南的通知》鼓勵各地區(qū)各部門推進數(shù)據(jù)基礎能力建設,積極構(gòu)建數(shù)據(jù)安全存儲、數(shù)據(jù)存證、隱私計算等支撐體系,推動大數(shù)據(jù)挖掘分析、智能計算、數(shù)據(jù)安全與隱私保護等核心技術(shù)攻關。2022.8科技部、財《企業(yè)技術(shù)創(chuàng)新能力提升行動方案(2022-2023年)》推動國家超算中心,智能計算中心等面向企業(yè)提供低成本算力服務。2022.11國務院《關于數(shù)字經(jīng)濟算力基礎設施達到世界領先水平。建成一批國家新一代人工智能公共算力開放創(chuàng)新平臺,以低成本算力服務支撐中小企業(yè)發(fā)展需求。2023.2國務院《數(shù)字中國建設整體布局規(guī)劃》系統(tǒng)優(yōu)化算力基礎設施布局,促進東西部算力高效互補和協(xié)同聯(lián)動,引導通用數(shù)據(jù)中心、超算中心、智能計算中心、邊緣數(shù)據(jù)中心等合理梯次布局。2024.9工信部等十《關于推動新型信息基礎設施協(xié)調(diào)發(fā)展有關事項的通知》優(yōu)化布局算力基礎設施,引導面向全國、區(qū)域提供服務的大型及超大型數(shù)據(jù)中心、智能計算中心、超算中心在樞紐節(jié)點部署。逐步提升智能算力占比。達地區(qū)先行先試、探索5G-A、人工智能等建設和應用新模式,西部地區(qū)在綜合成本優(yōu)勢明顯地區(qū)合理布局重大算力設施,探索建設超大型人工智能訓練算力設施。信息來源:科智咨詢整理人工智能大模型在數(shù)量、類別、參數(shù)方面不斷發(fā)展,效率和能力不斷提升,為千行百業(yè)數(shù)字化轉(zhuǎn)型提供人工智能解決方案。截至2024年7月底,全國范圍內(nèi)已有197個生成式人工智能服務完成備案,10億參數(shù)規(guī)模以上大模型數(shù)量已超100個。通用大模型任務處理能力不斷提升,文本理解和生成能力增強,圖像識別更加精準;行業(yè)大模型深耕專業(yè)場景,百度、騰訊、華為、京東、網(wǎng)易等企業(yè)已發(fā)布適用于特定領域的行業(yè)大模型,提高業(yè)務效率。在參數(shù)方面,大語言模型的參數(shù)規(guī)模已從億增長到千億,甚至達到萬億級別,模型的計算效率和性能也逐步提高,在推動經(jīng)濟社會數(shù)字化轉(zhuǎn)型方面發(fā)揮重要作用。目前,人工智能大模型正在由開發(fā)階段步入行業(yè)應用階段,為金融、醫(yī)療、教育、制造、交通、能源等多個行業(yè)的數(shù)字化轉(zhuǎn)型提供了有力支撐。企業(yè)可利用大模型對數(shù)據(jù)進行深度挖掘,優(yōu)化業(yè)務流程,提高運營效率。如制造業(yè)大模型可以用于生產(chǎn)線故障預測、生產(chǎn)計劃優(yōu)化等,從而降低生產(chǎn)成本,提高生產(chǎn)效率。金融機構(gòu)可利用大模型創(chuàng)新業(yè)務模式,制定金融產(chǎn)品開發(fā)策略,并為客戶提供分析和建議等。在教育、娛樂等領域,大模型可提供智能問答、個性化推薦等服務,滿足用戶需求。在需求推動下中國智算中心市場投資規(guī)模高速增長。2022年生成式人工智能大模型推向市場,在國內(nèi)引起AIGC發(fā)展熱潮,大模型訓練對智能算力的需求迅速攀升。2023年起國內(nèi)頭部互聯(lián)網(wǎng)企業(yè)及科技公司加速AIGC布局,政府也牽頭建設公共智能算力中心,賦能社會數(shù)字化轉(zhuǎn)型需求,全國智算中心投資火熱,智算中心市場規(guī)模大幅增長。2023年中國智算中心市場投資規(guī)模達879億,同比增長90%以上。預計2024年國產(chǎn)化芯片產(chǎn)能提升,智算算力供給瓶頸將逐漸緩解。未來,AI大模型應用場景不斷豐富,商用進程加快,智算中心市場增長動力逐漸由訓練切換至推理,市場進入平穩(wěn)增長期,預計2028年中國智算中心市場投資規(guī)模有望達到2886億元。圖表3:2020-2028年中國智算中心市場規(guī)模及預測(億元)注:智算中心市場規(guī)模包含算力(AI服務器)、存儲+網(wǎng)絡設備、基礎設施(機房、風火水電等)、算法(軟件平臺、數(shù)據(jù)服務)領域的投資。截至2024年8月,中國智算中心項目超過300個,已公布算力規(guī)模超50萬PFlops從已投用、在建、規(guī)劃的智算中心項目來看,全國各省智算中心總計300余個,約三分之一智算中心項目規(guī)劃算力大于500PFlops,主要為政府或基礎電信運營商投建項目。2024年當年投運項目數(shù)量超過50個,60%以上為地方政府、國資平臺及電信運營商項目,總計新增算力規(guī)模約為2萬PFlops。在區(qū)域分布上,智算中心項目主要集中在東部地區(qū)。中國智算中心產(chǎn)業(yè)發(fā)展具有明顯區(qū)域特征,東部地區(qū)集聚大量高科技企業(yè),"AI+行業(yè)"應用進程較快,為人工智能發(fā)展提供豐富的應用場景和數(shù)據(jù)資源,智算需求集中。同時,大模型訓練和推理通常涉及多卡構(gòu)成的算力集群,集群節(jié)點之間網(wǎng)絡通信壓力大,出于算力高效性和維護便利性考慮,當前大量智算中心項目落地東部發(fā)達地區(qū)。截至2024年8月底,江蘇省智算中心項目數(shù)量最多,其次為廣東及山東省;京津冀、長三角及廣東省智算中心項目合計超過120個,占比超40%。圖表4:中國投運/在建/規(guī)劃智算中心項目區(qū)域分布(截至2024年8月)大模型與行業(yè)深入融合發(fā)展,AI推理需求將快速提升,帶動一線城市、區(qū)域經(jīng)濟中心及周邊地區(qū)等智算中心部署。AI訓練需求對于網(wǎng)絡時延要求相對推理較低,在大規(guī)模部署階段將更加注重經(jīng)濟性,將帶動基于AI訓練的智算中心項目落地成本更低的"東數(shù)西算"西部集群地區(qū)。同時,近兩年政策強調(diào)統(tǒng)籌算力資源布局,推動區(qū)域協(xié)同發(fā)展。2024年8月《工業(yè)和信息化部等十一部門關于推動新型信息基礎設施協(xié)調(diào)發(fā)展有關事項的通知》提出,東部發(fā)達地區(qū)先行先試、探索5G-A、人工智能等建設和應用新模式,中西部和東北地區(qū)加快千兆城市建設,實現(xiàn)5G、千兆光網(wǎng)均衡發(fā)展,西部地區(qū)在綜合成本優(yōu)勢明顯地區(qū)合理布局重大算力設施,探索建設超大型人工智能訓練算力設施。長期來看,智算中心市場發(fā)展重心將逐漸向中西部經(jīng)濟中心及東數(shù)西算集群地區(qū)轉(zhuǎn)移。根據(jù)智算中心項目數(shù)量統(tǒng)計,截至2024年8月,全國投運、在建及規(guī)劃的智算中心中,地方政府和基礎電信運營商主導建設的智算中心項目占比超過50%,互聯(lián)網(wǎng)及云廠商項目數(shù)量占比約為17.7%,地方政府及基礎電信運營商是智算中心主要參與方。各地方政府一方面響應國家戰(zhàn)略,優(yōu)化算力資源配置,實現(xiàn)東西部算力資源的高效互補和協(xié)同聯(lián)動;另一方面,智算中心作為數(shù)字時代區(qū)域基礎設施的重要組成部分,能夠為區(qū)域技術(shù)創(chuàng)新、產(chǎn)業(yè)轉(zhuǎn)型升級和數(shù)字經(jīng)濟發(fā)展提供重要支撐?;A電信運營商兼具網(wǎng)絡提供商與算力中心服務商雙重身份,"東數(shù)西算"工程啟動后,基礎電信運營加快建設智算中心,提供網(wǎng)絡及算力基礎設施支持。從業(yè)務發(fā)展層面看,電信運營商在傳統(tǒng)業(yè)務增長放緩的情況下加大在算力領域的布局,著力發(fā)展業(yè)務第二增長曲線。圖表5:中國智算中心項目主體分布(按項目數(shù)量,截至2024年8月)從智算中心算力規(guī)模來看,互聯(lián)網(wǎng)及云廠商在智算中心投資建設中占據(jù)重要地位??萍季揞^在人工智能計算中心的建設中扮演重要角色,許多大型科技公司如阿里巴巴和騰訊,都在人工智能計算中心投入大量的資源。互聯(lián)網(wǎng)及云廠商建設的智算中心規(guī)模較大,多為萬卡集群,智算中心具備大規(guī)模、可擴展性、綠色化等特征,滿足互聯(lián)網(wǎng)及云業(yè)務長遠發(fā)展需求。企業(yè)主體在智算中心建設中可以提供強大的資金、技術(shù)支持和市場應用,以及市場化的管理運營機制,相比于政府等國資平臺更注重效率和效益,有助于提高智算中心的運營效率和服務質(zhì)量。截至2024年8月,全國投運、在建及規(guī)劃的智算中心中,互聯(lián)網(wǎng)及云廠商建設的智算中心規(guī)模占比超過30%,其次為基礎電信運營商,占比約為25.6%。圖表6:中國智算中心項目主體分布(按算力規(guī)模,截至2024年8月)不同主體的智算中心功能定位及布局訴求存在差異。政府主導建設的人工智能計算中心主要服務于地方人工智能大模型研發(fā)應用及相關領域數(shù)字化轉(zhuǎn)型,加速產(chǎn)業(yè)發(fā)展、城市治理、公共服務等各方面智能化進程,推動智慧醫(yī)療、智慧交通、金融科技、無人駕駛等各領域數(shù)智化水平?;A電信運營商投資建設的智算中心成為政府算力基礎設施的良好補充,承擔國家算力網(wǎng)絡建設任務的同時滿足自身算力需要及算力業(yè)務拓展需求。大型云廠商如騰訊云、阿里云、百度云等,具有完善的供應鏈資源、扎實的技術(shù)能力以及豐富的客戶資源,出于滿足集團AI發(fā)展需求及云業(yè)務拓展考慮,建設智算中心。此外,浪潮、協(xié)鑫等產(chǎn)業(yè)上游供應商,商湯等AI科創(chuàng)企業(yè),理想、小鵬等下游應用企業(yè)等基于產(chǎn)圖表7:智算中心建設主體類別及優(yōu)劣勢地方政府響應國家戰(zhàn)略,推動政策落地;促進區(qū)域產(chǎn)業(yè)發(fā)展優(yōu)勢:政策、資金、產(chǎn)業(yè)園區(qū)客戶北京/上海/廣州/武漢/天津/重慶/長沙/南京/西安/成都/合肥等30多個城市劣勢:缺乏IT技術(shù)、供應鏈經(jīng)驗、運營能力不足互聯(lián)網(wǎng)及云電信運營商滿足自身大模型訓練需求;拓展算力業(yè)務優(yōu)勢:充足的資金、技術(shù)和客戶資源,豐富的軟件供應鏈資源,較成熟的云算力業(yè)務模式騰訊合肥智算中心/百度陽泉智算中心/阿里飛天云智能華東算力中心等;中國電信武清智算中心/中國聯(lián)通蕪湖智算中心/中國移動武漢智算中心等客戶形成競爭互斥第三方IDC尋求業(yè)務增長優(yōu)勢:豐富的IDC機房資源,IDC一體化建設運營能力潤澤國際信息港A-11云博大數(shù)據(jù)深圳前海智算劣勢:缺乏IT供應鏈資源和算力服務器廠商/芯片渠道商縱向一體化優(yōu)勢:AI芯片、服務器等硬件資源獲取能力協(xié)鑫智算(上海)中心浪潮新疆克拉瑪依智算劣勢:缺乏IDC供應鏈和機房建設運營能力AI企業(yè)、應用企業(yè)縱向一體化優(yōu)勢:算法及相關軟件能力,客戶資源和應用場景積累商湯臨港AIDC理想汽車智算中心劣勢:缺乏AI芯片貨源、IDC資源跨界企業(yè)戰(zhàn)略轉(zhuǎn)型/發(fā)展新業(yè)務優(yōu)勢:一般與芯片廠商、渠道商英博數(shù)科北京AI創(chuàng)新賦能中心威星智能貴安智算中心恒潤股份蕪湖智算中心劣勢:缺乏IDC資源和持續(xù)穩(wěn)定現(xiàn)階段,智能算力在快速增長的同時存在供需匹配問題,部分智能算力資源利用率較低。規(guī)劃和實際需求之間存在差距,如算力架構(gòu)設計不合理,或技術(shù)更新迭代后設備無法滿足新的計算要求,可能導致智算中心資源閑置。部分智算中心由于市場推廣不足或服務類型單一等,算力資源未能得到充分利用。智算需求具有場景多樣化、高度定制化特征,同時智算中心涵蓋從底層基礎設施到上層應用各個方面,衍生出多元化的智算中心服務體系。智算中心服務包括機房托管服務、算力租賃服務、AI平臺服務、模型定制服務及AI應用服務。圖表8:智算中心商業(yè)模式類別IQQS基礎設施機房托管服務在傳統(tǒng)數(shù)據(jù)中心機房托管基礎上,提供更高功耗、配電和網(wǎng)絡定制智算轉(zhuǎn)型的數(shù)據(jù)中心服務商、中立的智算中心服務商等頭部云商及AI公算力租賃服務以云服務形式租賃智能算力,按使用時間和規(guī)模收費云廠轉(zhuǎn)型的智算服務商、中立的智算中心服務商等IT公司、非連續(xù)需求的科研機構(gòu)等PQQS平臺即服務AI平臺服務提供人工智能應用開發(fā)工頭部IT公司中小企業(yè)和開發(fā)者MQQS模型即服務模型定制服務模型定制、精調(diào)、部署等AI大模型全流程服務成熟的大模型供應商(具有AI大模型技術(shù)能力)中小垂直行業(yè)企業(yè)saQS軟件即服務AI應用服務直接應用于企業(yè)業(yè)務,提供人工智能分析、決策等服務具有AI能力的垂直行業(yè)頭部企業(yè)小型垂直行業(yè)企業(yè)機房托管服務與傳統(tǒng)數(shù)據(jù)中心服務模式類型相同,但需要面向智算的特點進行深度定制。例如,為了滿足AI訓練對高功耗、高密度計算的需求,智算中心的機房托管服務在功耗管理、配電系統(tǒng)、網(wǎng)絡架構(gòu)等方面進行了優(yōu)化升級。算力租賃服務是指通過云服務的形式,將算力以按需付費的方式提供給用戶,降低了算力使用的門檻和成本。這種服務模式不僅滿足了中小企業(yè)在研發(fā)、測試階段的算力需求,也為科研機構(gòu)提供了靈活、高效的算力支持。AI平臺服務提供基于智算能力的PQQS(平臺即服務)服務,主要包括人工智能應用開發(fā)工具和平臺。這些工具和平臺通常包含了數(shù)據(jù)預處理、模型訓練、模型評估、模型部署等全生命周期的管理功能,幫助開發(fā)者快速構(gòu)建、優(yōu)化和部署AI應用。模型定制服務提供基于智算能力的MQQS(模型即服務)層服務,主要提供從模型定制、精調(diào)到部署的全方位服務,這種服務模式不僅提高了AI模型的準確性和效率,還為企業(yè)帶來了更大的商業(yè)價值。AI應用服務是基于智算能力的SQQS(軟件即服務)層服務,SQQS層直接應用于企業(yè)業(yè)務場景中,提供人工智能分析、決策等智能化服務,供應方通常為具有AI能力的垂直行業(yè)頭部企業(yè),這類企業(yè)基于自身在特定領域的深厚積累和專機柜托管以及算力租賃服務是當前智算中心市場的主流商業(yè)模式。在產(chǎn)業(yè)發(fā)展初期,智算中心一般為算力用戶和傳統(tǒng)IDC客戶提供機柜托管服務。算力用戶的服務器由用戶自行解決,這類用戶多為云廠、AI企業(yè)、高校或科研機構(gòu),通常單次采購規(guī)模較小。占比35%左右,其它均為自用。在租賃的算力中,約80%被用于大型模型的訓練,約20%則用于小模型的訓練和推理任務。在區(qū)域分布上,60%的智算需求集中在北上廣深一線城市。智算算力租賃業(yè)務的興起一是由于短期內(nèi)智算資源供給能力不足,特別是以GPU為代表的AI芯片的緊缺;二是自建智算中心投資規(guī)模大、運維能力要求較高,算力使用綜合成本高。大多數(shù)中小企業(yè)在發(fā)展AI模型和應用的過程中面臨算力瓶頸,算力租賃業(yè)務迎來發(fā)展機遇。從客戶群體來看,AI企業(yè)、行業(yè)應用企業(yè)、高校科研機構(gòu)、解決方案提供商發(fā)布的大模型數(shù)量多,但互聯(lián)網(wǎng)企業(yè)模型落地最快。AI企業(yè)以及高校科研機構(gòu)掌握AI算法技術(shù),但極少擁有算力,通常以租賃算力為主;互聯(lián)網(wǎng)企業(yè)AI技術(shù)件廠商具有硬件終端解決方案和用戶數(shù)據(jù),部分有智算設施。目前來看,AI企業(yè)和高??蒲袡C構(gòu)是智算租賃市場的主要客戶群體,此外各行業(yè)頭部企業(yè)也可能成為重要的潛在客戶。算力租賃市場競爭較為激烈,存在上游芯片廠商、下游AI企業(yè)、地方政府、上市公司新進入者、云廠商五大力量。AI企業(yè)現(xiàn)階段集中力量開發(fā)大模型產(chǎn)品,市場給新進入者留下窗口期,芯片廠商、地方政智算領域,但相較之下,云廠商、AI企業(yè)擁有客戶、數(shù)據(jù)、MQQS業(yè)務,競爭力明顯強于地方政府與上市公司。隨著大模型競爭格局逐步明朗,云廠商將依托平臺、生態(tài)力量、規(guī)模效應全面拓展智算市場,小規(guī)模智算租企業(yè)將被收算力綠色化發(fā)展已成為我國數(shù)字經(jīng)濟發(fā)展的重要課題。"雙碳"目標提出中心和5G等新型基礎設施綠色高質(zhì)量發(fā)展實施方案》、《數(shù)據(jù)中心節(jié)能診斷服務指南(2023)》、《數(shù)據(jù)中心綠色低碳發(fā)展專項行動計劃》等進一步落實數(shù)據(jù)中心能效監(jiān)管,對PUE等指標提出明確要求,推動產(chǎn)業(yè)綠色低碳發(fā)展。同時,東數(shù)西算工程的實施促進了西部地區(qū)的風能、太陽能等可再生能源的消納,通過優(yōu)化算力基礎設施布局,提升算力中心綠色能源應用比例,實現(xiàn)能源的合理分配和利用。2023年度國家綠色數(shù)據(jù)中心名單重點新增智算中心領域,引導產(chǎn)業(yè)加快綠色智算中心建設。當前,我國智算中心逐步加強綠色節(jié)能技術(shù)應用,提升算力性能和能源利用效率。在綠色IT設備方面,通過部署整機柜服務器、冷板式液冷服務器等,降低服務器能源消耗。如深圳百旺信智算中心應用一體化芯片仿真設計整機柜服務器,實現(xiàn)單柜算力40PFlops,提升服務器使用效率,同時達到節(jié)能效果;中國電信京津冀智能算力中心冷板式液冷萬卡資源池全年PUE值為1.15,單位算力能耗為1.5KW/P。在綠色能源利用上,智算中心利用當?shù)氐木G電智算中心依托慶陽創(chuàng)新的"源網(wǎng)荷儲碳數(shù)"電力系統(tǒng)和新風自然冷卻技術(shù),將PUE穩(wěn)定控制在1.2以下。在智算中心運營上,采用高效間接蒸發(fā)離心式變頻水冷、封閉冷通道等先進制冷技術(shù),實現(xiàn)智算中心散熱能耗降低50%以上。部分智算中心建立智能化管理平臺,實時監(jiān)控機房運行狀態(tài),精確控制制冷和供電系統(tǒng),推動制冷耗電量下降8%15%,保障智算中心安全穩(wěn)定與低碳運行。如中國電信安徽智算中心A1樓通過優(yōu)化任務調(diào)度、負載均衡等技術(shù),提高信息設備利用率。面對巨大耗電量,智算中心綠色化水平仍有較大提升空間。高性能服務器單位能耗遠高于傳統(tǒng)服務器,千億參數(shù)大模型訓練階段用電或超過百萬度。在政策指導下,智算中心產(chǎn)業(yè)繼續(xù)貫徹落實綠色低碳要求,統(tǒng)籌推進算力與電力融合發(fā)展,充分考慮與電力基礎設施的協(xié)同布局,加強能源需求側(cè)管理和供給側(cè)優(yōu)化,夯實國家數(shù)字基礎設施,推動綠色算力發(fā)展。高度耦合是智算中心與傳統(tǒng)數(shù)據(jù)中心建設架構(gòu)的根本區(qū)別。傳統(tǒng)數(shù)據(jù)中心在數(shù)據(jù)中心基礎設施、算力、網(wǎng)絡通信、存儲、軟件與平臺等環(huán)節(jié)可采用獨立采購建設的模式,各環(huán)節(jié)之間協(xié)同性較弱。智算中心主要業(yè)務場景要求高并行,單一訓練任務以整個算力集群為基礎,因此算力基礎層內(nèi)部的設計和運行是高度耦合的,計算、存儲及網(wǎng)絡須緊密協(xié)同。在生產(chǎn)算力環(huán)節(jié),IT規(guī)劃設計須綜合考慮算力用途、算力類型、算力規(guī)模,以架構(gòu)的確定性應對各類異構(gòu)算力需求,提升計算效率和靈活性。存儲與數(shù)據(jù)方面,存儲系統(tǒng)不僅要能夠處理PB級的數(shù)據(jù)量,還要在數(shù)據(jù)采集、清洗、訓練及推理的每個環(huán)節(jié),都能提供高速、可靠的數(shù)據(jù)訪問。另外,通信網(wǎng)絡對智算集群的吞吐量和性能起關鍵作用,智算中心核心業(yè)務場景大模型訓練中的大規(guī)模參數(shù)對算力和顯存都提出了更高的要求,智算中心需要配套建設低時延、大帶寬、長期穩(wěn)定性、大規(guī)模擴展性和可運維的高性能網(wǎng)絡。圖表9:智算中心總體架構(gòu)信息來源:國家信息中心高密機柜對智算中心基礎設施整體布局規(guī)劃、供電、制冷、承重等帶來挑戰(zhàn)。高密部署導致IT機房面積占比大幅縮小,為支持多元算力的混合部署,應規(guī)劃好空間布局以容納不同冷卻技術(shù)和不同功率密度的算力設備。供電方面,高功率、大電流輸電損耗凸顯,對變壓器、母排、線纜等電力傳輸設備要求更高,可采用電力模塊替代變壓器、低壓配電、UPS、輸出配電等多個獨立的產(chǎn)品,或采用高壓直流方式提升輸配電效率。制冷方案選擇要綜合成本、PUE、可靠性等多方因素,風冷仍占據(jù)重要地位,液冷方案是未來主流方向。在承重方面,由于單機柜密度提升及制冷方案的變化,在設計智算中心時需要提高建筑承重負載,合理布局功能區(qū)域和設備,并考慮未來可能的擴展和設備更新。智算中心常見應用場景為訓練和推理,根據(jù)其對算力精度的需求的差異分為FP32、TF32、FP16、BF16、INT8等。進行智算中心算力規(guī)劃應根據(jù)具體的模型參數(shù)量,計算出訓練、推理場景對GPU顯存大小的需求;根據(jù)GPU單卡算力和卡間通信帶寬設計合理的并行方案,并用于芯片服務器的選型和集群網(wǎng)絡方案設計。AI芯片技術(shù)迭代速度快,遠超過基礎設施建設速度,智算中心算力規(guī)劃應充分考慮核心硬件設備技術(shù)更新,保持與時俱進,滿足實際應用需要。在滿足大規(guī)模計算集群的連接需求方面,智算中心網(wǎng)絡正迅速向十萬乃至數(shù)十萬卡互聯(lián)演進,參數(shù)面網(wǎng)絡的接入速率已從200GE提升至400GE乃至800GE。高性能網(wǎng)絡有利于保障集群智算節(jié)點間的通信效率,以滿足更高性能和更大規(guī)模的算力需求。低延時需求:RDMA技術(shù)通過繞過操作系統(tǒng)內(nèi)核,讓一臺主機可以直接訪問另外一臺主機的內(nèi)存,從而降低多機多卡間端到端通信時延。實現(xiàn)RDMA的方式有InfiniBand、ROCEv1、ROCEv2、iwARP四種,當前智算中心的RDMA技術(shù)主要采用的方案為InfiniBand和ROCEv2兩種。高帶寬需求:智算中心需要處理海量數(shù)據(jù),網(wǎng)絡設備的吞吐能力、端口帶寬及密度需要全面提升,確保數(shù)據(jù)在訓練和推理過程中的快速傳輸。穩(wěn)定性需求:大模型分布式訓練任務有可能需要數(shù)天或數(shù)周,網(wǎng)絡不穩(wěn)定將會影響整個訓練任務的進度。可運維需求:在成百上千張GPU卡的智算集群中,網(wǎng)絡架構(gòu)的復雜性、運維是否簡單穩(wěn)定并且有足夠的工具來管理集群是需要重點考慮的維度。海量文件存儲系統(tǒng)需要具備幾方面的特點,一是要求彈性擴展,滿足存儲集群增加節(jié)點的需要,二是橫向擴展時合理的數(shù)據(jù)分布,三是擴縮容穩(wěn)定性、易運維。在AI訓練過程中,高效的數(shù)據(jù)讀有利于提升整體訓練效率。大模型訓練的主要文件包括樣本文件、checkpoint文件、模型文件,整體數(shù)據(jù)量很大,對讀寫的要求也非常高。NPU/GPU直通存儲技術(shù)簡化CPU內(nèi)存緩沖和復制過程,大幅縮短數(shù)據(jù)讀寫時間。在AI推理階段,面對高并發(fā)、長序列的推理場景,以KVCQche(鍵值緩存)為中心的多級緩存加速技術(shù)能夠優(yōu)化數(shù)據(jù)訪問路徑,提升系統(tǒng)的整體性能和響應速度,從而更好地滿足大模型應用的需求。智能算力的核心是CPU、GPU、FPGA、ASIC等各類計算芯片。AI芯片內(nèi)核數(shù)量多,擅長并行計算,滿足AI算法所需的大量并行處理能力,并顯著提升計算效率和靈活性。智算服務器CPU+GPU、CPU+FPGA、CPU+Asrc等異構(gòu)形式,以充分發(fā)揮不同算力芯片在性能、成本和能耗上的優(yōu)勢。圖表10:AI芯片(GPU、FPGA、ASIC)主要特點FPGAASIC定義圖形處理器,用于圖形渲染、并行計算、AI訓練和推理現(xiàn)場可編程門陣列,可編程邏輯解決方案,適用于快速原型設計和特定應用專用集成電路,為特定應用定制設計的芯片相對較高,尤其是高性能GPU耗優(yōu)化能耗并行處理能力采用數(shù)量眾多的計算單元和超長流水線,具備高并行結(jié)構(gòu),通過多核并行計算支撐大算力需求具有高度實時性和靈活行和任務并行計算專為特定任務設計,高度并行化。靈活性和可拓展性靈活性較高,可通過軟件編程實現(xiàn)不同功能;可拓展性好,可通過多GPU擴展計算能力靈活性很高,可現(xiàn)場編程改變硬件邏輯;可拓展性好,可通過外部接口和其他系統(tǒng)組件連接靈活性低,制造完成后功能固定;可拓展性差可定制性通用性強,可通過軟件更新實現(xiàn)一定程度的定制;已有成熟產(chǎn)品線半定制化,可編程靈活度全定制化,完全根據(jù)特定應制造周期。成本取決于性能需求中等,取決于FPGA的規(guī)模和復雜度應用場景游戲、深度學習、數(shù)據(jù)加密貨幣挖礦、高性能計算、特定算法加速等NVIDIA、AMDxilinx、IntelGoogle、華為、寒武紀信息來源:科智咨詢整理在高端芯片限制不斷收緊的背景下,國產(chǎn)化芯片加速自主發(fā)展。AI服務器核心在于高性能芯片,參數(shù)規(guī)模、訓練數(shù)據(jù)隨著AI大模型的發(fā)展呈現(xiàn)指數(shù)級增長,相較于大量疊加服務器臺數(shù),提升芯片性能同樣芯片領軍企業(yè)主要包括寒武紀、海光信息、景嘉微、華為海思等,寒武紀思元370芯片、昆侖芯科技昆侖二代AI芯片以及阿里平頭哥含光800芯片等在性能上進一步縮小與國際先進水平的差距,并在特定應用場景中展現(xiàn)出優(yōu)勢;華為AI芯片異騰910在算力上和英偉達A100性能基本相當。整體而言國內(nèi)AI芯片與海外龍頭企業(yè)產(chǎn)品仍存在較大差距,長期來看國產(chǎn)自研AI芯片有望逐步成為國內(nèi)AI產(chǎn)業(yè)發(fā)展的重要支撐,有望圍繞產(chǎn)品形成算力、算法、應用一體化的開放生態(tài)。未來智算中心將集成更多的人工智能處理能力,推動技術(shù)融合與創(chuàng)新。圖表11:主流高性能芯片特性對比英偉達A100624TOPS@INT82TOPS/W312Ampere1935GB/S英偉達H1003958TOPS@INT81979Hopper3TB/SAMDMI100184.6TOPS@INT80.6TOPS/W184.6CDNA1.2TB/SAscend910512TOPS@INT82TOPS/W320HUAWEIDQVinci寒武紀思元370256TOPS@INT8MLuarch03614.4GB/S海光信息GPGPU1024GB/S百度昆侖昆侖2256TOPS@INT82.1TOPS/W128XPU-R平頭哥含光800825TOPS@INT8信息來源:科智咨詢整理目前國產(chǎn)化AI芯片仍處起步發(fā)展階段,在科學研究和產(chǎn)業(yè)應用方面具有廣闊的創(chuàng)新空間。下一代AI芯片開發(fā)需著力在以下方面獲得突破:架構(gòu)創(chuàng)新,可重構(gòu)芯片、存算一體、類腦智能等新興架構(gòu)的研究突破有望提升芯片性能;感存算一體,在傳感器端開始對信號做初步處理,減少后端芯片的壓力;通過融合計算單元與存儲單元,減少數(shù)據(jù)訪問和搬運,顯著提升能效并降低功耗;新型存儲器,為了降低數(shù)據(jù)頻繁交換導致的延遲和功耗,以存儲為中心的計算架構(gòu)逐漸興起,成為AI芯片的一大新興技術(shù)路線;復雜AI算子支持,探索能夠高效分解和映射TrQnsformer等復雜結(jié)構(gòu)的芯片架構(gòu),實現(xiàn)算法與硬件的協(xié)同優(yōu)化;稀疏化計算能力,利用神經(jīng)網(wǎng)絡中的稀疏性,減少無效計算,優(yōu)化功耗;云邊AI芯片協(xié)同,邊緣計算節(jié)省云端服務器帶寬和算力成本,帶來更多交互方式、更強的安全保護。提升智算中心算力利用率和集群可用度,需要構(gòu)建超高速、超大規(guī)模的組網(wǎng)架構(gòu)。超高速網(wǎng)絡技術(shù)通過提供更高的帶寬,減少網(wǎng)絡延遲,確保大規(guī)模集群中的數(shù)據(jù)傳輸更加高效。超大規(guī)模組網(wǎng)架構(gòu)技術(shù)確保規(guī)模集群中的數(shù)據(jù)傳輸穩(wěn)定性和可靠性,能夠?qū)崿F(xiàn)十萬卡以上的超高速網(wǎng)絡互聯(lián)。當前智算中心的RDMA技術(shù)主要采用InfiniBand和ROCEV2協(xié)議。RDMA(RemoteDirectMemoryAccess,遠程直接內(nèi)存訪問)是一種用于高性能網(wǎng)絡通信的技術(shù),相比傳統(tǒng)的網(wǎng)絡通信方式,RDMA具有更低的延遲、更高的帶寬和更低的CPU利用率等優(yōu)點,可顯著提高網(wǎng)絡通信的性能和效率。ROCE方案相較InfiniBand方案通用性更強,除用于構(gòu)建高性能網(wǎng)絡外,還可以在傳統(tǒng)的以太網(wǎng)絡中使用,但在交換機的Headroom、PFC、ECN等相關參數(shù)的配置比較復雜,因此在萬卡以上的超大規(guī)模場景下ROCE網(wǎng)絡吞吐性能較InfiniBQn方案相對更弱。ROCE提供了一種成本效益高的解決方案,可以利用現(xiàn)有的以太網(wǎng)基礎設施,價格相對更低;InfiniBand性能突出,適合對網(wǎng)絡性能有極高要求的應用場景。總體而言,智算中心網(wǎng)絡架構(gòu)的選擇取決于具體的應用需求、預算和現(xiàn)有基礎設施。圖表12:InfiniBand和ROCE方案比較RoCE協(xié)議基礎獨立于以太網(wǎng),專為高性能計算(HPC)環(huán)境設計基于以太網(wǎng),ROCEv2版本支持跨VLAN和IP子網(wǎng)通信,克服了ROCEv1的局限提供更高的帶寬和更低的延遲,最高可達200Gbps提供低延遲和高吞吐量,但通常低于InfiniBand。ROCEv2的最大帶寬為100Gbps易用性和可擴展性通常需要專門的硬件支持,部署成本較高可以利用現(xiàn)有的網(wǎng)絡基礎設施,易于部署和擴展容錯性和可靠性使用星型拓撲結(jié)構(gòu)和鏈路聚合,提供冗余路徑和高級的容錯機制提供多路徑技術(shù)和糾錯重傳機制,確保數(shù)據(jù)傳輸?shù)目煽啃杂布С种饕蒑ellQnox提供支持,提供全面的硬件和軟件解決方案有多家供應商提供支持ROCE的網(wǎng)絡適配器和交換機"東數(shù)西算"工程實施以來,國家政策持續(xù)推動全國一體化算力網(wǎng)絡建設。2023年12月發(fā)布的《國家發(fā)展改革委等部門關于深入實施"東數(shù)西算"工程加快構(gòu)建全國一體化算力網(wǎng)的實施意見》指出,加快建設跨區(qū)域、多層次算力高速直連網(wǎng)絡,積極推進算網(wǎng)深度融合;建立跨區(qū)域算力資源調(diào)度機制,構(gòu)建立體聯(lián)動的算力調(diào)度體系,促進東中西部算力資源實現(xiàn)供需平衡。為推動算網(wǎng)協(xié)同、加快全國一體化算力網(wǎng)絡建設,算力網(wǎng)絡建設需要做到彈性、敏捷、無損、安全、感知。算力網(wǎng)絡需具備彈性帶寬需求,適應不同計算場景的帶寬變化。具備泛在算力敏捷接入的能力,提升用戶的算力獲取效率。AI芯片性能提升帶動服務器及單機柜功耗大幅增加,液冷方案成為智算中心制冷更優(yōu)選擇。傳統(tǒng)風冷系統(tǒng)的散熱效率無法與高功率機柜的散熱需求相匹配,一方面,受數(shù)據(jù)中心建筑面積與單位運營成本等因素的影響,數(shù)據(jù)中心單機柜功率密度將持續(xù)上升,在AIGC的推動下單機柜功率上升速度有望較預期更快。另一方面,風冷方式移熱速率較低,相對于風冷散熱,液冷能更好地支持20KW以上高密機柜冷卻,提高換熱效率,實現(xiàn)數(shù)據(jù)中心PUE低至1.2以下,符合機房高密度演進趨勢,同時促進數(shù)據(jù)中心減少碳排放。液冷技術(shù)類型根據(jù)冷卻液和發(fā)熱設備接觸換熱方式的不同,可劃分為冷板式液冷、浸沒式液冷和噴淋式液冷。相較于其他液冷技術(shù)路線,冷板式液冷應用更加普遍。據(jù)科智咨詢統(tǒng)計,冷板式液冷方案應用比例達到91%,是現(xiàn)階段及未來較長一段時間的主流液冷技術(shù)形式。2022年,冷板式數(shù)據(jù)中心市場規(guī)模達到90.5億元,同比增長45.4%.目前冷板式液冷數(shù)據(jù)中心已形成相對成熟的解決方案,通過冷板和CDU帶走IT設備超過80%的熱量;不需要對數(shù)據(jù)中心機房進行大規(guī)模改造;散熱效率高,可降低PUE至1.2以下;液體不與設備接觸,可靠性高、易展開維護性設計,噪音低,空間利用率高、且熱能可回收。與浸沒式液冷相比,熱交換受到冷板的限制,節(jié)能效果相對降低。但浸沒式液冷和噴淋式液冷直接接觸冷卻液,兼容性差,專用機柜對于管路要求高,維護復雜,且存在冷卻液揮發(fā)的問題,運行成本較高。圖表13:數(shù)據(jù)中心液冷技術(shù)方案對比接觸形式冷卻液不接觸發(fā)熱體,采用導熱板傳熱冷卻液浸泡發(fā)熱體冷卻液噴淋發(fā)熱體建設成本主要成本在換熱系統(tǒng)和式相比,成本高通過改造機柜增加必須裝置,成本較小服務器改造成本改造成本高運維成本運維成本低運維成本適中運維成本適中冷卻液冷卻液使用量大,對冷卻液安全性要求高冷卻液用量適中,要求高服務器兼容性根據(jù)服務器定制冷板,兼容所有機器兼容性測試根據(jù)冷卻液不同,需進行兼容性測試利用率噪音程度較低低較低環(huán)境影響無冷卻液相變過程可能會導致氣體蒸發(fā)外散冷卻液霧滴和氣體可能散發(fā)到機箱外冷卻效果較好優(yōu)秀優(yōu)秀使用場景無限制有限制應用程度目前應用最廣泛適用于對功率密度、節(jié)能性要求較高的大型數(shù)據(jù)中心不適合高密度服務器和超大規(guī)模數(shù)據(jù)中心,現(xiàn)階段落地應用相對較少主流曙光數(shù)創(chuàng)廣東合一液冷方案在算力中心的規(guī)?;瘧萌蕴幱诔跫夒A段,目前為小規(guī)模部署。經(jīng)前期積淀,液冷產(chǎn)品及技術(shù)解決方案基本成型,但最終技術(shù)選型還需要經(jīng)過一定周期的驗證和市場篩選。超算中心及部分頭部互聯(lián)網(wǎng)企業(yè)開展液冷試點應用,積極尋求技術(shù)驗證、產(chǎn)品適配等方面的生態(tài)協(xié)作,為液冷大規(guī)模商用提供寶貴經(jīng)驗和良好的示范帶動作用,加速液冷產(chǎn)業(yè)發(fā)展。圖表14:中國高性能算力中心先進制冷方案應用案例(部分)天府智算西南算風冷項目使用42kw智算風冷算力倉,采用冷熱通道全密封+列間空調(diào)高溫進水模式,將冷熱氣流循環(huán)與外界環(huán)境進行隔離。相比傳統(tǒng)數(shù)據(jù)中心,進水溫度提高至18℃,制冷系統(tǒng)能效比提升10%以上。通過AI智能管控平臺實現(xiàn)制冷系統(tǒng)聯(lián)動調(diào)優(yōu),整體節(jié)能25%以上,風冷散熱PUE大幅降低。漢智算中心風冷+液冷采用風冷+液冷混合散熱方案,其中對主要發(fā)熱源CPU和內(nèi)存進行液冷設計,解決服務器90%的散熱問題。在機房空調(diào)和冷板液冷技術(shù)雙重影響下,CPU核心的溫度低于常規(guī)風冷機型,保障CPU在低溫條件下實現(xiàn)超頻運行。廈門大學嘉實驗室智算數(shù)據(jù)中心風冷+液冷采用冷板式液冷系統(tǒng)+風冷列間空調(diào)的制冷系統(tǒng)架構(gòu),風液比80%,整系統(tǒng)按2N架構(gòu)進行配置。PUE實時智能自動化調(diào)優(yōu),降低數(shù)據(jù)中心運行維護成本,實現(xiàn)節(jié)能減排。京東云華北(廊冷板式液冷整機柜冷板式液冷技術(shù)將室外冷源直接注入服務器主板芯片進行冷卻,達成系統(tǒng)去冷機化。CPU散熱由冷卻液通過室內(nèi)板式換熱器換熱后,可直接利用室外冷卻塔進行散熱,實現(xiàn)全年運行PUE低于1.1,基礎設施能耗節(jié)省可達30%,對應碳排放總量減少10%以上。綠色智算中心浸沒式液冷芯片滿功耗平均核溫65±2℃,PUE≤1.1,在靈活擴容、模塊組裝、安全可靠的前提下,結(jié)合先進的溫控系統(tǒng)和管路布局等設計,有效解決服務器高熱流密度的散熱難題。在復雜環(huán)境和空間受限等非理想條件下實現(xiàn)全鏈路集成快速部署。浸沒式液冷通過嵌入式液冷單元,盲插總線架構(gòu),實現(xiàn)全場景PUE≤1.15,實現(xiàn)綠色低碳,可支持部署萬億參數(shù)大模型。信息來源:科智咨詢整理未來,隨著液冷技術(shù)的逐漸成熟,浸沒式冷卻帶來的液體泄漏風險和運維成本預計逐步降低,液冷系統(tǒng)的其他配套設施也有望因技術(shù)進步和規(guī)模生產(chǎn)推動成本進一步下降。全棧式液冷有望在更多的領域得到應用,從硬件到軟件,整個系統(tǒng)設計更加高效節(jié)能。企業(yè)和研究機構(gòu)將積極開展長周期、大規(guī)模的液冷部署試驗,收集和分析實際運行數(shù)據(jù)以評估液冷技術(shù)的性能和可靠性,發(fā)現(xiàn)并解決潛在的問題和風險。更多行業(yè)標準的制定與落地帶動產(chǎn)業(yè)鏈有序發(fā)展,提升產(chǎn)業(yè)價值鏈地位。各設備和服務廠商正積極推動行業(yè)標準化,全力打造更開放的液冷生態(tài)。隨著機柜功率密度的增大,智算中心供電架構(gòu)要求逐漸發(fā)生變化,智算中心的規(guī)劃建設將更加注重供電系統(tǒng)的容錯性、可靠性,確保系統(tǒng)正常運行。智算中心供配電架構(gòu)設計需要統(tǒng)籌考慮相關設備的負荷容量、上下級開關保護配合、供電系統(tǒng)的檢修計劃、故障隔離等因素,并優(yōu)化拓撲結(jié)構(gòu)設計,配置完善的自動控制系統(tǒng),提高系統(tǒng)可用性。采用更靈活可靠的電力架構(gòu)提升供配電系統(tǒng)效率。一是一體化電源/電力模塊。傳統(tǒng)數(shù)據(jù)中心的供配電系統(tǒng)普遍采用分散式的結(jié)構(gòu),設備分散部署,占用面積大,線纜線路長、損耗大,后續(xù)的線纜檢修和系統(tǒng)擴容難度高。一體化電源或者電力模塊設備將中壓柜、變壓器、UPS、HVDC、饋電等預制集成交付,縮短供電鏈路和施工周期,使供電系統(tǒng)的供電效率提高約1%。二是直流供電模式。2NHVDC供電架構(gòu)中,每臺高壓直流電源設備均可獨立承擔系統(tǒng)的全部負載,提供了最高級別的冗余和可靠性,相比傳統(tǒng)的交流電源系統(tǒng)通常具有更高的轉(zhuǎn)換效率和更低的能耗。10KV交流直轉(zhuǎn)240V直流供電架構(gòu)中,移相變壓器柔性集成了10kv交流的配電,隔離變壓、模塊化整流器和輸出配電等環(huán)節(jié),優(yōu)化供電鏈路,系統(tǒng)容量可根據(jù)需求進行靈活配置。三是DR/RR供電架構(gòu)。傳統(tǒng)數(shù)據(jù)中心主流的供電架構(gòu)是2N架構(gòu),RR架構(gòu)為N+1配置,可使智算中心供電系統(tǒng)的利用率從50%提升到N/(N+1),同時占地面積減少(N-1)/2N。DR架構(gòu)中配電設備使用減少接近25%,電源設備成本低,但每套系統(tǒng)需要物理隔離,土建成本較DR架構(gòu)高。在人工智能時代,智算中心供配電系統(tǒng)向融合、綠色、智能方向發(fā)展。超融合設計下的一體化電源縮短供電鏈路長度,集約高效、交付周期短,具有重要的應用和推廣價值。結(jié)合源網(wǎng)荷儲、AI調(diào)優(yōu)、智能電網(wǎng)等技術(shù),提升智算中心能源利用效率和新型電力系統(tǒng)需求側(cè)資源優(yōu)化配置效率。通過源網(wǎng)荷儲一體化的方式,將新能源發(fā)電的不連續(xù)性和用電負荷的穩(wěn)定性要求相匹配,提升綠電使用比例和系統(tǒng)運行效率。利用AI技術(shù)進行電力負荷預測、故障檢測和優(yōu)化調(diào)度,結(jié)合先進AI算法實現(xiàn)對輸電線路的精準分析和故障預警,提升供配電系統(tǒng)管理的科學化與精細化水平,降低維護成本。智能電網(wǎng)技術(shù)有利于智算中心供配電系統(tǒng)與外部電網(wǎng)進行更為緊密的互動與協(xié)作,優(yōu)化電力調(diào)度,提高電力使用效率和可靠性。六、智算中心運營服務向高效安全方向發(fā)展為高效利用各類計算資源,優(yōu)化算力使用效率并降低成本,需要在算力集群中對計算資源進行分配和管理,即算力調(diào)度。算力調(diào)度以算力感知為基礎,感知并整合算力節(jié)點收集的算力資源信息,統(tǒng)一表達為包含計算、網(wǎng)絡、存儲等多維度資源的綜合模型,利用算網(wǎng)編排技術(shù)實現(xiàn)復雜算力業(yè)務的路徑編排,按需分配、實時調(diào)度不同區(qū)位、不同運營主體、不同架構(gòu)的算力資源。算力交易平臺連接算力買方與賣方,根據(jù)用戶的差異化需求,實現(xiàn)智能、公平、開放、算力調(diào)度體系強調(diào)按需分配和靈活調(diào)度計算資源、存儲資源及網(wǎng)絡資源,并加強網(wǎng)絡安全管理。支持彈性分配以適應任務不同、變化多端的動態(tài)需求,加強算力、網(wǎng)絡和安全系統(tǒng)間的協(xié)同防御,利用人工智能提升安全技術(shù)手段與應急處置能力。為了提高資源利用率和系統(tǒng)性能,算力調(diào)度系統(tǒng)需要實現(xiàn)負載均衡,并利用虛擬化技術(shù)實現(xiàn)資源的隔離和共享。全國算力調(diào)度統(tǒng)籌全國不同地區(qū)算力,促進東西部算力資源高效配置,達成全國算力基礎設施化的目標。從算力調(diào)度的范圍來看,算力調(diào)度涉及區(qū)域內(nèi)算力調(diào)度、跨區(qū)域算力調(diào)度、云邊端協(xié)同調(diào)度及算力和電力的協(xié)同調(diào)度。以城市算力網(wǎng)建設為基礎,繼而"連點成片"形成區(qū)域算力網(wǎng),各區(qū)域算力網(wǎng)按照統(tǒng)一標準互聯(lián)互通,最終形成全國一體化的算力網(wǎng)體系,實現(xiàn)漸進式落地。圖表15:算力資源調(diào)度與管理架構(gòu)智算中心是提供算力服務、數(shù)據(jù)服務和算法服務,推動人工智能產(chǎn)業(yè)發(fā)展的算力基礎設施,其安全可信環(huán)境的構(gòu)建關乎個人權(quán)益、產(chǎn)業(yè)發(fā)展和社會運行。智算中心應全面推進數(shù)據(jù)安全技術(shù)應用,通過加密技術(shù)、匿名化技術(shù)等,加強數(shù)據(jù)安全保護和管理,實現(xiàn)對多種資源的全方位隔離與防護。利用深度包檢測(DPI)技術(shù)、數(shù)據(jù)丟失預防(DLP)等對網(wǎng)絡流量、行為日志、數(shù)據(jù)流轉(zhuǎn)、共享接口等安全監(jiān)測分析。利用先進的人工智能和機器學習技術(shù)提高網(wǎng)絡安全防護系統(tǒng)的智能水平,實現(xiàn)智能化分析、防御、自主捕捉及未知風險應對,提供更加動態(tài)和前瞻性的安全保護。智算中心可通過建設內(nèi)外部安全管理體系保障數(shù)據(jù)安全。在智算中心內(nèi)部,加強網(wǎng)絡基礎設施的可靠性和高效性,同時積極利用數(shù)據(jù)安全技術(shù)如身份識別、數(shù)據(jù)加密、數(shù)據(jù)脫敏、數(shù)據(jù)流動管理等,以及數(shù)據(jù)服務與內(nèi)容安全技術(shù)如數(shù)據(jù)交易技術(shù)管理、開放共享管理、人工智能深度防偽、數(shù)據(jù)內(nèi)容合規(guī)等,提高智算中心從數(shù)據(jù)采集到算力應用層面的安全可靠。在外部層面,加強數(shù)據(jù)中心異地容災備份建設,利用分布的公有云,將新建IT系統(tǒng)和容災系統(tǒng)同時部署在云上,降低數(shù)據(jù)丟失風險,保障業(yè)務連續(xù)性和數(shù)據(jù)資產(chǎn)安全。通過實時監(jiān)控及時發(fā)現(xiàn)和解決設備故障,確保智算中心不間斷平穩(wěn)運行。運維監(jiān)控需兼顧實時性和準確性兩大要素,若監(jiān)控頻率過高,可能會對系統(tǒng)性能造成不利影響,反之,若監(jiān)控間隔過長則可能導致關鍵事件的遺漏。智算中心運維監(jiān)控與故障處理應更加高效,需要進行跨域故障感知和分析。通過對系統(tǒng)運行狀態(tài)的持續(xù)監(jiān)測,監(jiān)控智算中心計算、存儲、網(wǎng)絡、光模塊等設備的運行級網(wǎng)絡流量分析、存儲故障和性能分析等,迅速準確確定故障位置,從而縮短故障診斷時間,最大化防止訓練任務中斷。建立高效故障修復流程,發(fā)生故障時能夠立即采取相應措施恢復系統(tǒng)的穩(wěn)定運行,縮短系統(tǒng)停機時間。根據(jù)實際需求定制化運維平臺配置,包括監(jiān)控指標、報警規(guī)則、數(shù)據(jù)展示方式等,建立簡潔、直觀的界面,便于運維人員快速響應并處理問題。智能運維以數(shù)據(jù)為基礎,以算法為支撐,以場景為導向,為數(shù)據(jù)中心運維管理提供智能化解決方案,實時分析和處理問題。大型超大型智算中心承載的業(yè)務和數(shù)據(jù)量巨大,智能化運維體系的構(gòu)建有利于提升智算中心運行的穩(wěn)定性及動化運維工具通過平臺建設,將大量重復性的運維活動轉(zhuǎn)化為自動化操作,提高運維效率,增強運維過程的可視化智算中心智能化運維解決方案應具備如下特點。一是統(tǒng)一運維,提供智算中心一站式IT服務。二是數(shù)據(jù)驅(qū)動,聚合獨立的運維數(shù)據(jù)形成運維大數(shù)據(jù),并結(jié)合AI分析能力,實現(xiàn)對智算中心運維態(tài)勢的分析及可視化,支持運維決策。三是全局可視化,提供從平臺層到底層硬件基礎設施的全棧監(jiān)控可視化。四是自動化及智能化,提供自動化工具鏈,并對智算中心運行態(tài)勢進行智能化預測,形成故障應對機制,快速修復漏洞。五是安全合規(guī),保障智算中心運維過程中的數(shù)據(jù)安全、隱私保護、合規(guī)管理等方面符合相關法規(guī)和標準,降低法律風險。智能運維方案的核心部分為智算中心基礎設施管理(DCIM)、數(shù)字化運維服務管理平臺(DOSM),并在此基礎上搭建精細化運維工作管理架構(gòu),提升智算中心智能化水平和運營效率。發(fā)展展望與倡議智算中心產(chǎn)業(yè)發(fā)展環(huán)境持續(xù)優(yōu)化。政策推動新型智能基礎設施建設,以更好支撐社會經(jīng)濟發(fā)展需求,包括AI軟硬件、智算服務、大模型應用在內(nèi)的產(chǎn)業(yè)鏈各環(huán)節(jié)有望獲得更多政策支持。算電協(xié)同建設推進,新型電力系統(tǒng)與算力樞紐節(jié)點資源將進一步融合銜接,保障電力資源供給,促進算力綠色化高效運行。全國一體化算力網(wǎng)絡建設全面提速,為智算中心提供泛在連接、靈活高效的互聯(lián)網(wǎng)絡。AI應用規(guī)模落地激發(fā)智算需求增長。AI大模型商業(yè)化應用場景不斷拓展,前沿數(shù)字技術(shù)逐步轉(zhuǎn)向大規(guī)模行業(yè)應用階段,參數(shù)規(guī)模快速從億級突破至萬億級,產(chǎn)生大規(guī)模智算算力需求。近年來中國智算中心建設火熱,目前全國已有超過30個城市正在積極推進智算中心建設或規(guī)劃。未來隨著人工智能應用場景的持續(xù)創(chuàng)新和拓展,智算中心將更好賦能社會經(jīng)濟發(fā)展。綜合的智算生態(tài)服務將成為主流模式。隨著AI技術(shù)的不斷演進與智算生態(tài)的日益成熟,智算中心各服務類型之間將實現(xiàn)更加緊密的協(xié)同與融合。綜合技術(shù)能力強的科技公司或具有IT基礎的智算中心集成方有望基于完善的智算中心生態(tài),提供uIQas+paas+Maas+SQQS"的全棧式綜合智算生態(tài)服務。深度整合的服務模式不僅能夠提升服務效率和用戶體驗,也將促進技術(shù)創(chuàng)新與產(chǎn)業(yè)升級的良性循環(huán)。多元普惠的算力生態(tài)體系逐步構(gòu)建。AI軟硬件協(xié)同性進一步提高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 循環(huán)油購銷合同范例
- 洗車店收費合同范例
- 與彩印廠合同范例
- 水溝包工合同范例
- 房屋貨款合同范例
- 房屋貸款合同范例
- 建筑通風合同范例
- 農(nóng)戶購買農(nóng)資合同范例
- 連鎖加盟藥店合同范例
- 標簽銷售合同范例
- 中國石油天然氣集團有限公司投標人失信行為管理辦法(試行)
- 縫合線材料的可吸收性研究
- GB/T 43700-2024滑雪場所的運行和管理規(guī)范
- 《3-6歲兒童學習與發(fā)展指南》知識競賽參考題庫500題(含答案)
- 水電站廠房設計-畢業(yè)設計
- 幼兒園園長的園里園外融合教育
- 綜合金融服務方案課件
- 《鎮(zhèn)原民俗》課件
- 新型電力系統(tǒng)簡介
- 施工安全管理體系及安全保證措施樣本
- 護理科普工作總結(jié)以及計劃
評論
0/150
提交評論