版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
中國信通院中國信通院智算賦能算網(wǎng)新應(yīng)用白皮書2023年9月目錄/CONTENTS1.智算服務(wù)賦能算網(wǎng)應(yīng)用創(chuàng)新發(fā)展態(tài)勢(shì)1.1智算成科技發(fā)展新驅(qū)動(dòng),各國搶抓智算服務(wù)1.2算網(wǎng)應(yīng)用連接技術(shù)與用戶,多樣產(chǎn)業(yè)角色入局共建1.3智算服務(wù)“內(nèi)修外治”,助力算網(wǎng)應(yīng)用賦能千行百業(yè)1.3.2智算服務(wù)助力算網(wǎng)應(yīng)用推陳出新、由淺入深2.智算服務(wù)關(guān)鍵技術(shù)062.1智算服務(wù)發(fā)展聚焦綠色、多模態(tài)與泛在2.1.1綠色:用“連接”引領(lǐng)低2.1.2多模態(tài):AIGC技術(shù)大爆發(fā),成為數(shù)智發(fā)展新引擎2.1.3泛在:讓智能算力像水一樣流動(dòng),隨時(shí)隨地按需取用2.2資源全面感知、精準(zhǔn)調(diào)度,提升智能算力利用率2.2.1智能算力感知:構(gòu)建智算感知能力體系,為資源細(xì)粒度優(yōu)化提供依據(jù)2.2.2智能算力共享:精準(zhǔn)隔離,有效提升智算應(yīng)用部署密度2.2.3混合部署:智算應(yīng)用分級(jí)QoS,削峰填谷,充分利用空閑算力2.2.4智能算力調(diào)度:一體化精準(zhǔn)調(diào)度,最大化算力價(jià)值2.3提升智算生產(chǎn)率,推動(dòng)算力泛在化發(fā)展2.3.1高性能計(jì)算:提升單節(jié)點(diǎn)計(jì)算能力,并向分布式、混合并行模式演進(jìn)2.3.2高性能網(wǎng)絡(luò):建設(shè)高性能通信網(wǎng)絡(luò),有效提升智能算力集群性能2.3.3高性能存儲(chǔ):提升緩存命中率,降低數(shù)據(jù)讀取耗時(shí)2.3.4計(jì)算加速框架:集成模型工具箱,大幅提升大模型生產(chǎn)效率3.智算服務(wù)賦能算網(wǎng)應(yīng)用創(chuàng)新升級(jí)3.1算網(wǎng)應(yīng)用呈現(xiàn)場景化、多樣化、個(gè)性化特點(diǎn)3.2技術(shù)演進(jìn),驅(qū)動(dòng)傳統(tǒng)算網(wǎng)應(yīng)用萌生新活力3.2.1交通出行應(yīng)用3.2.2汽車產(chǎn)業(yè)應(yīng)用3.2.3制造行業(yè)應(yīng)用3.3場景創(chuàng)新,激發(fā)創(chuàng)新算網(wǎng)應(yīng)用打開新局面3.3.1東N西M應(yīng)用3.3.2生成式應(yīng)用3.3.3制造行業(yè)應(yīng)用3.3.4數(shù)字人應(yīng)用4.算網(wǎng)應(yīng)用未來發(fā)展趨勢(shì)前言/FOREWORD智算服務(wù)賦能算網(wǎng)應(yīng)用創(chuàng)新發(fā)展態(tài)勢(shì)1.1智算成科技發(fā)展新驅(qū)動(dòng),各國搶抓智算服務(wù)發(fā)展機(jī)遇AI研發(fā)關(guān)鍵領(lǐng)域、投資重點(diǎn)領(lǐng)域等內(nèi)容進(jìn)行規(guī)范,以確保美國在AI領(lǐng)域的領(lǐng)先地位;2023年,歐盟議會(huì)成員就《人工智能系統(tǒng)。算力規(guī)模上,根據(jù)中國信息通信研究院《中國算力發(fā)展指數(shù)白皮書(232EFLOPS,2030年預(yù)計(jì)達(dá)到52.5ZFLOPS,平均年增速超過80%,占全球算力總規(guī)模的93%以上,智算算力將成為全球算力規(guī)模增長的主要驅(qū)動(dòng)力。研發(fā)投入上,2020年美國《無盡前沿法案》中提出擬在未來5年投入1000億美元研發(fā)包括芯片、人工智能在內(nèi)的10大關(guān)鍵技術(shù);2021年4月,歐盟以條例的形式通過“數(shù)字歐洲計(jì)劃”,對(duì)包括人工智能在內(nèi)的政策上,《新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃(2021-2023年)》指出,引導(dǎo)新型數(shù)據(jù)中心智能化建設(shè),加快高性能智能計(jì)用算法和開發(fā)平臺(tái)一體化的新型智能基礎(chǔ)設(shè)施,提供體系化的人工智能服務(wù)。算力規(guī)模上,2021年我國智能算力規(guī)模達(dá)到104EFLOPS,在我國算力總規(guī)模中占比超過50%,增速為85%,成為算力規(guī)模增長的主要驅(qū)動(dòng)。2022年中國人工智能核心產(chǎn)業(yè)規(guī)模已達(dá)5080億元人民幣。研發(fā)投入上,北京、上海、廣東、山東等地設(shè)立專項(xiàng)基金用于人工智能相關(guān)技術(shù)、標(biāo)準(zhǔn)1.2算網(wǎng)應(yīng)用連接技術(shù)與用戶,多樣產(chǎn)業(yè)角色入局共建.1打破網(wǎng)絡(luò)與算力應(yīng)用的邊界,支撐算力服務(wù)下算與網(wǎng)的深度融合,打造堅(jiān)實(shí)算力網(wǎng)絡(luò)。NVIDIA推出NVLink技術(shù),支持GPU之間業(yè)務(wù)數(shù)據(jù)高速互通,良好支撐大模型訓(xùn)練場景。融合調(diào)度方面,確定性提供高質(zhì)量調(diào)度保障。算力調(diào)度領(lǐng)域發(fā)展出了同時(shí)考慮算力節(jié)點(diǎn)與網(wǎng)絡(luò)傳輸性能的算網(wǎng)融合技術(shù),提供兼具低時(shí)延與高可靠特性的算力服務(wù)。例如在智能制造場景的《2021年離散制造業(yè)上云調(diào)查》報(bào)告顯示:云的IT價(jià)值在敏捷性、彈性和經(jīng)濟(jì)性幾個(gè)方面的充分呈現(xiàn)加上同5G技術(shù)和應(yīng)用的結(jié)合,在制造、供應(yīng)鏈和采購等價(jià)值鏈關(guān)鍵環(huán)節(jié)賦能作用明顯,也催生出如車聯(lián)網(wǎng)/車路協(xié)同、超高清視頻流媒體、遠(yuǎn)中國信息通信研究院《中國算力服務(wù)研究報(bào)告(2023年)》指出,算力應(yīng)用依托有效算力進(jìn)行計(jì)算并輸出結(jié)果從而實(shí)現(xiàn)應(yīng)集約與統(tǒng)一供給。智算平臺(tái)圍繞人工智能及其衍生技術(shù)建設(shè),向下深度適配CPU、GPU、FPGA、MLU、NPU、TPU等.2如元宇宙,大模型等應(yīng)用場景,通常具有發(fā)展年限較短、智能算力規(guī)模需求大、性能要求高的特性。如GPT-3.5在微軟AzureAI超算基礎(chǔ)設(shè)施(由V100GPU組成的高帶寬集群)上進(jìn)行訓(xùn)練,總算力消耗約3640PF-days(即每秒一千萬億次云、專用服務(wù)統(tǒng)一輸出等方式支撐傳統(tǒng)算網(wǎng)應(yīng)用平滑、穩(wěn)定地升級(jí)。以智慧交通為例,2020年,高通推出可擴(kuò)展的自動(dòng)駕駛平臺(tái)SnapdragonRide,包括安全系統(tǒng)級(jí)芯片、安全加速器和自動(dòng)駕駛軟件棧,滿足從L1-L3級(jí)駕駛輔助以及L4-L5級(jí)自動(dòng)駕駛運(yùn)算需求;華為MDC智能駕駛計(jì)算平臺(tái)集成智能駕駛操作系統(tǒng)、配套工具鏈及車路云協(xié)同系統(tǒng),可支持400TOPS算力及200ms時(shí)延,助力傳統(tǒng)算網(wǎng)應(yīng)用場景煥發(fā)新活力。智算服務(wù)基于云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù),提供計(jì)算資源、算法模型以及一系列場景應(yīng)用。通過智算服務(wù),用戶可以快速獲取高性能計(jì)算資源、優(yōu)化算法模型、提高計(jì)算效率,滿足不同場景下的算力應(yīng)用需求。智算服務(wù)通常包括算力資源、算法模型、算力應(yīng)用等多種服務(wù),用戶可以根據(jù)需要靈活選擇和組合使用。智算服務(wù)廣泛應(yīng)用于機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析、科學(xué)計(jì)算、圖像處理等領(lǐng)域,在朝著綠色、2.1智算服務(wù)發(fā)展聚焦綠色、多模態(tài)與泛在在數(shù)字經(jīng)濟(jì)時(shí)代,計(jì)算力即生產(chǎn)力。但隨著算力的增長,數(shù)據(jù)中心的能耗也在增加。在碳達(dá)峰和碳中和的背景下,提高效大型數(shù)據(jù)中心、邊緣數(shù)據(jù)中心和5G基站等更多信息化基礎(chǔ)設(shè)施建設(shè)進(jìn)一步使得電信運(yùn)營商的能耗成本支出和碳排放快速增司單位電信業(yè)務(wù)總量綜合能耗、單位電信業(yè)務(wù)總量碳排放下降率均不低于20%,企業(yè)自身節(jié)電量較“十三五”翻兩番、超過400億度,企業(yè)2025年自身碳排放控制在5600萬噸以內(nèi),助力經(jīng)濟(jì)社會(huì)減排量較“十三五”聯(lián)通發(fā)布《“碳達(dá)峰、碳中和”十四五行動(dòng)規(guī)劃》,聚焦碳排放下降23%。在“十四五”期間,實(shí)現(xiàn)4/5G網(wǎng)絡(luò)共建共享節(jié)電量超過450億度,新建5G基站節(jié)電比例不型、超大型數(shù)據(jù)中心占比超過80%,新建數(shù)據(jù)中心PUE低于1.3。另外,下一步中國電信將重點(diǎn)從三個(gè)方面推進(jìn)“雙碳”工作:一是建設(shè)綠色新云網(wǎng),打造綠色新運(yùn)營;二是構(gòu)建綠色新生態(tài),賦能綠色新發(fā)展;三是催生綠色新科技,筑牢綠色新支提效、可再生能源替代、碳抵消等,提出“不晚于2030年,實(shí)現(xiàn)自身運(yùn)營及供應(yīng)鏈的全面碳中和?!睆墓?jié)能提效.2AIGC作為新的生產(chǎn)力引擎,讓我們從過去的PGC、UGC,已經(jīng)不可避免地進(jìn)入AIGC時(shí)代。AIGC代表著AI技術(shù)從感知、比如為人熟知的GAN、Transformer、擴(kuò)散模型等,這些模型的性能、穩(wěn)定性、生成內(nèi)容質(zhì)量等不斷提升。得益于生成算預(yù)訓(xùn)練模型,也即基礎(chǔ)模型、大模型,引發(fā)了AIGC技術(shù)能力的質(zhì)變。景中的靈活多變、高精度、高質(zhì)量等需求。而預(yù)訓(xùn)練模型能夠適用于多任務(wù)、多場景、多功能需求,能夠解決以上諸多痛點(diǎn)。預(yù)訓(xùn)練模型技術(shù)也顯著提升了AIGC模型的通用化能力和工業(yè)化水平,同一個(gè)AIGC模型可以高質(zhì)量地完成多種多樣的多模態(tài)技術(shù)推動(dòng)了AIGC的內(nèi)容多樣性,進(jìn)一步增強(qiáng)了AIGC模型的通用化能力。多模態(tài)技術(shù)使得語言文字、圖像、音視頻等多種類型數(shù)據(jù)可以互相轉(zhuǎn)化和生成。比如CLIP模型,它能夠?qū)⑽淖趾蛨D像進(jìn)行AIAI輔助修復(fù)耗時(shí)長(2-3月/幅)基于GAN的多尺度生成模型和損失函數(shù)自動(dòng)修復(fù)、上色利用AIGC技術(shù)手段修復(fù)古壁畫.3的環(huán)境下,如何保持通信的流暢度?智能駕駛場景中,如何將音視頻的傳輸時(shí)延從300ms優(yōu)化到100ms以內(nèi)?不同場景在音視頻、數(shù)字孿生、3D引擎及空間計(jì)算的細(xì)節(jié)追蹤支持下,能夠讓數(shù)字世界全細(xì)節(jié)化還原或超寫實(shí)呈現(xiàn)。可為人、物、環(huán)境創(chuàng)建1:1還原的全面信息孿生體,讓數(shù)字世界和真實(shí)世界相互連接、映射與耦合,實(shí)現(xiàn)數(shù)實(shí)世界之間的實(shí)時(shí)同步,是全在碰到復(fù)雜問題時(shí)可以通過輕便的AR眼鏡連線專家,專家隨即可以即時(shí)全息通信為例,必然離不開實(shí)時(shí)音視頻、人機(jī)交互、XR、數(shù)字人、多模態(tài)感知、數(shù)字孿生等多種智算服務(wù)的場景化和高效流通;通過算力虛擬化、算力的分級(jí)SLA、混部等關(guān)鍵技術(shù)來充分提升算力的利用率;依靠高性能算力集群、框架2.2資源全面感知、精準(zhǔn)調(diào)度,提升智能算力利用率當(dāng)前算力資源的使用還處于粗放式的發(fā)展,從目前的統(tǒng)計(jì)數(shù)據(jù)來看,算力的使用率低于30%,造成了大量的計(jì)算資源和能易造成算力資源大量浪費(fèi)或無法滿足業(yè)務(wù)需求的兩種極端情況。因此在提升算力利用率的同時(shí),需要保障算力服務(wù)的可用容器容器SLIQoS指標(biāo)與精細(xì)化運(yùn)營GPUGPU共享資源QoSCPUQoSCPUQoSIOIOQoS內(nèi)存內(nèi)存QoS網(wǎng)絡(luò)網(wǎng)絡(luò)QoSCPUCPUNPUNPUCOSCOSESSDESSDRDMARDMAGPUGPUFPGA/ASICFPGA/ASICTurboCFSTurboCFS100G100G.1絡(luò)時(shí)延等,另一方面定義算力運(yùn)行的可觀測性指標(biāo),包括全維度硬件力節(jié)點(diǎn),保障算力服務(wù)在各個(gè)算力節(jié)點(diǎn)的合理負(fù)載。并對(duì)其進(jìn)行可視化展示和分析,了解資源的實(shí)際利用率以及周期性規(guī).2隨著機(jī)器學(xué)習(xí)的不斷發(fā)展,GPU的性能越來越強(qiáng),提供并行算力已非常普遍。在實(shí)際的使用過程中,通常將完整的GPU卡分配給一個(gè)容器,對(duì)于模型開發(fā)和模型推理等場景資源浪費(fèi)嚴(yán)重。因此通過GPU共享技術(shù),可有效的提升算力應(yīng)用的部署密度,提升GPU的利用率。GPU共享需要解決容器間算力和顯存精細(xì)隔離的問題,支持算力和顯存的靈活配置,從而在精細(xì)切分GPU資源,最大程度保證業(yè)務(wù)穩(wěn)定的前提下,大幅提升GPU利用率,以達(dá)到節(jié)約GPU資源成本的目的。同時(shí)需具備良好的兼容性和云原生的支K8K8SKubernetesscheduler集群調(diào)度算法Kubernetes+GPUschedulerpluginpodO1/nGPUAPPpodO1/nGPUAPPCUDAruntimepod1?GPUAPPCUDAruntimepod1?GPUAPPCUDAruntimepod1GPUAPPCUDAruntimeqGPUqGPUcontainerruntimeQGPUdriverGPUGPU/vGPU實(shí)例GPU0GPU1GPU...GPUnQoSGPU容器共享技術(shù)框架.3gGPUKubernetesScheduler spreadbinpackPod1Pod2Pod1Pod2殆GPUPod3殆GPUGPU0高優(yōu)任務(wù)GPU0高優(yōu)任務(wù)低優(yōu)任務(wù)高優(yōu)任務(wù)低優(yōu)任務(wù)GPU1QoSGPU容器混部技術(shù)框架.4通過算力感知,可分析算力的整體效率,提供可靠、便利、智能的算力調(diào)度優(yōu)化技術(shù)方案,以滿足算力應(yīng)用的分級(jí)QoS和SLA要求,實(shí)現(xiàn)算力的調(diào)度優(yōu)化。AI計(jì)算場景科學(xué)計(jì)算場景視覺計(jì)算場景人臉識(shí)別OCR量子計(jì)算基因加速云游戲多媒體創(chuàng)作搜廣推NLP工業(yè)仿真自動(dòng)駕駛云渲染AR/VR/MR業(yè)務(wù)特性調(diào)度作TKE容器集群計(jì)算存儲(chǔ)CPUNPUCOSESSDRDMAGPUFPGA/ASICTurboCFS玄靈100G2.3提升智算生產(chǎn)率,推動(dòng)算力泛在化發(fā)展以大模型生產(chǎn)為例,近幾年NLP預(yù)訓(xùn)練模型規(guī)模的發(fā)展,模型已經(jīng)從億級(jí)發(fā)展到了萬億級(jí)參數(shù)規(guī)模。2018年BERT模型最大參數(shù)量為3.4億,2019年GPT-2為十億級(jí)參數(shù)的模型。2020年發(fā)布的百億級(jí)規(guī)模有T5和T-NLG,以及千億參數(shù)規(guī)模的GPT-3。在2021年末,Google發(fā)布了SwitchTransformer,首次將模型規(guī)模提升至萬億。型號(hào):TeslaP100顯存:16GB型號(hào):TeslaP100顯存:16GB型號(hào):TeslaV100顯存:32GB型號(hào):TitanV顯存:12GB型號(hào):TitanRTX顯存:24GB型號(hào):AmpereA100顯存:40/80GB型號(hào):HopperH100顯存:80GB2016.42017.52017.122018.112020.62022.3GLaMGLaM1T100B1B(1.2T)1T100B1B(1.2T)●SwitchTransformer(1.6T)●HunYuan-1TPaLM(1T)(540B)●GPT-3(175B)●T5(11B)BERT-L(340M)FMegatron(8B)●Pangu(200B)ERNIE-3(260B)T-NLG(17B)GPT-2(1.5B)2019202020212022時(shí)間線模型框架層:AI加速套件TACO模型編譯加速,2Dallreduce,梯度融合,最高40%業(yè)務(wù)性能提升數(shù)據(jù)緩存加速,充分利用VPC網(wǎng)絡(luò)及本地磁盤軟件庫:通訊集合通信加速庫TCCL網(wǎng)絡(luò)拓?fù)涓兄?,?dòng)態(tài)規(guī)劃最佳RingAlIReduce路徑,可預(yù)期的網(wǎng)絡(luò)性能規(guī)避哈希沖突,多租戶擁塞場景下網(wǎng)絡(luò)吞吐對(duì)比NCCL提升100%網(wǎng)絡(luò)鏈路層:自研擁塞控制算法為大規(guī)模組網(wǎng)消除PFC隱患,提升網(wǎng)絡(luò)可用性動(dòng)態(tài)時(shí)延降低50%-90%算力底座:高性能計(jì)算集群HCC星脈網(wǎng)絡(luò)提供大型RDMA網(wǎng)絡(luò)組網(wǎng)能力,硬件層面帶來平均20%性能提升基于自研交換機(jī)的RoCE網(wǎng)絡(luò),網(wǎng)絡(luò)成本僅為IB的20%2.3.1CPU預(yù)處理、CPU/GPU數(shù)據(jù)通信、GPU計(jì)算等方面的性能開銷,另一方面需要解決大模型場景下多節(jié)點(diǎn)協(xié)作的性能損耗.2數(shù)西算”寧夏樞紐搭建的智算無損網(wǎng)絡(luò),實(shí)現(xiàn)單GPU服務(wù)器之間800G的大帶寬;“星脈”網(wǎng)絡(luò)搭載了3.2T的超高通信帶寬,在同樣的GPU卡上星脈網(wǎng)絡(luò)相較前一代網(wǎng)絡(luò),將集群整體算力提升20%。高性能通信網(wǎng)絡(luò)使得超大算力集群能保持優(yōu)另外面對(duì)定制設(shè)計(jì)的高性能組網(wǎng)架構(gòu),開源的集合.3大量計(jì)算節(jié)點(diǎn)同時(shí)讀取一批數(shù)據(jù)集,需要盡可能縮短加載時(shí)長。對(duì)于文件存儲(chǔ)、對(duì)象存儲(chǔ)架構(gòu),需要具備TB級(jí)吞吐能力和千萬級(jí)IOPS,充分滿足大模型訓(xùn)練的大數(shù)據(jù)量存儲(chǔ)要求。超大帶寬:可以提供超大的內(nèi)網(wǎng)帶寬,滿足機(jī)器學(xué)習(xí)場景大帶寬級(jí)加速服務(wù),實(shí)現(xiàn)超越本地HDFS的性能??梢岳脭?shù)據(jù)加速器結(jié)合對(duì)象存儲(chǔ)作為數(shù)據(jù)網(wǎng)絡(luò)FRAMEWORKS網(wǎng)絡(luò)FRAMEWORKSCUDA.4),DEPLOYMENTCLOUDMLSERVICES拿databricksDAGRAPHMLDLTRAINDLINFERENCECloud2AlibabaGroupDEPLOYMENTCLOUDMLSERVICES拿databricksDAGRAPHMLDLTRAINDLINFERENCECloud2AlibabaGroupWorkstationServerWorkstationServer以NVIDIA為例,推出軟件加速庫的集合CUDA-XAI來加速計(jì)算。這些庫建立在CUDA(NVIDIA的開創(chuàng)性并行編程模型)cuML(用于加速數(shù)據(jù)科學(xué)工作流程和機(jī)器學(xué)習(xí)算法)、NVIDIATensorRT(用于優(yōu)化受訓(xùn)模型的推理性能)、cuDF(用但隨著模型參數(shù)的快速增長,萬億參數(shù)的模型訓(xùn)練僅參數(shù)和優(yōu)化器狀態(tài)便需要1.7TB以上的存儲(chǔ)模型訓(xùn)練時(shí)的模型狀態(tài)存儲(chǔ)于CPU中,在模型訓(xùn)練過程中會(huì)不斷拷貝到GPU,這就導(dǎo)致模型狀態(tài)同時(shí)存儲(chǔ)于CPU和GPU如在存儲(chǔ)優(yōu)化方面,可采用顯存、內(nèi)存統(tǒng)一存儲(chǔ)視角,來擴(kuò)充存儲(chǔ)容量的上限。如太極AngelPT型的參數(shù)、梯度、優(yōu)化器狀態(tài)以模型并行的方式切分到所有GPU,自研ZeRO-Cache框架把內(nèi)存作為二級(jí)存儲(chǔ)offload參數(shù)、梯度、優(yōu)化器狀態(tài)到CPU內(nèi)存,同時(shí)也支持把SSD作為第三級(jí)存儲(chǔ)。OptimizerstepCPUPersistentstorageGPUWhenWhencompleteTorchtensorOptimizerstepCPUPersistentstorageGPUWhenWhencompleteTorchtensorPipelineOptimizerCPUupdatepartCPUGPUupdateCPUGPUupdateGPU Asynccopy remainRuntimetemporarystorageContiguousMemoryContiguousMemoryGPU太極AngeIPTM同時(shí)將多流異步化做到了極致,在GPU計(jì)算的同時(shí)進(jìn)行數(shù)據(jù)IO和NCCL通信,使用異構(gòu)流水線均衡設(shè)備間的負(fù)載,最大化提升整個(gè)系統(tǒng)的吞吐。通過將GPU顯存、CPU內(nèi)存統(tǒng)一視角管理,減少了冗余存儲(chǔ)和內(nèi)存碎片,增加了內(nèi)太極AngeIPTM可采用大模型訓(xùn)練框架ZERO-Cache,高性能MOE組件,以及數(shù)據(jù)并行、流水并行、張量并行、專家并化器,可穩(wěn)定MOE半精度訓(xùn)練loss的Z_loss組件,選擇性重計(jì)算組件和降低通信代價(jià)的PowerSGD組件。通過PowerS-GD梯度壓縮技術(shù),對(duì)梯度進(jìn)行低秩矩陣分解后進(jìn)行通信,降低通信量,提升通信效率。通過提高算力的生產(chǎn)率,可大幅降力互補(bǔ),在算力優(yōu)化方面,采用驅(qū)動(dòng)層的GPU共享技術(shù)、基于內(nèi)核層的算力感知和隔離技術(shù)、基于調(diào)度層的成本優(yōu)化組件,來提升整體算力利用率;在智算生產(chǎn)方面,采用基于網(wǎng)絡(luò)層的高性能RDMA網(wǎng)絡(luò)通信加速庫,基于框架層輸出統(tǒng)一視角存儲(chǔ)管理、高性能MoE、自動(dòng)流水并行等框架加速能力,基于模型層的算子、編譯、計(jì)算圖等模型優(yōu)化能力,全面提升智算服務(wù)賦能算網(wǎng)應(yīng)用創(chuàng)新升級(jí)隨著5G、大數(shù)據(jù)、人工智能、區(qū)塊鏈等信息通信技術(shù)的推廣應(yīng)用,經(jīng)濟(jì)社會(huì)向數(shù)字化轉(zhuǎn)型升級(jí)的趨勢(shì)愈發(fā)明顯。2020年以來,國家發(fā)布了以“新基建”為導(dǎo)向的一系列政策,旨在通過加快建設(shè)數(shù)字化基礎(chǔ)設(shè)施,引領(lǐng)重大科技創(chuàng)新、重塑產(chǎn)業(yè)升級(jí)模式,為社會(huì)發(fā)展注入更算力服務(wù)作為“新基建”的重要組成部分,已經(jīng)成為整個(gè)社會(huì)發(fā)展的基礎(chǔ),正推動(dòng)各行業(yè)向數(shù)字化轉(zhuǎn)型、再造的深水區(qū)進(jìn)軍,為各行業(yè)帶來了紅利。算網(wǎng)應(yīng)用面向垂直行業(yè)和具體客戶提供適配多樣場景的服云服務(wù)與電信運(yùn)營商行業(yè)有較大合作空間。一方面是利用云服務(wù)公司司在解決方案、生態(tài)能力方面的優(yōu)勢(shì),協(xié)同電信運(yùn)營商推動(dòng)各個(gè)行業(yè)的數(shù)字化轉(zhuǎn)型。例如同電信運(yùn)營商共同承建文旅、政務(wù)等數(shù)字化能力3.1算網(wǎng)應(yīng)用呈現(xiàn)場景化、多樣化、個(gè)性化特點(diǎn)##分類應(yīng)用適用場景應(yīng)用行業(yè)11數(shù)字孿生、交通0S、渲染引擎、仿真HPC能力、自動(dòng)云駕駛能力等數(shù)字孿生、5G遠(yuǎn)控、渲染引擎、2233445566773.2技術(shù)演進(jìn),驅(qū)動(dòng)傳統(tǒng)算網(wǎng)應(yīng)用萌生新活力.1交通領(lǐng)域,需要提供覆蓋多種交通方式的運(yùn)營、管理、服務(wù)集成整體解決方案。交通OS是面向行業(yè)提供的數(shù)字交通基礎(chǔ)設(shè)關(guān)鍵能力:交通OS借助交通OS,智慧交通各系統(tǒng)將業(yè)務(wù)應(yīng)用與關(guān)鍵功能模塊進(jìn)行解耦,可復(fù)用的功能以組件形式沉淀至平臺(tái),幫助應(yīng)用實(shí)現(xiàn)PaaS...PaaS...外部服務(wù)流程,數(shù)據(jù)、應(yīng)用輕開發(fā)開放協(xié)同交通外部服務(wù)流程,數(shù)據(jù)、應(yīng)用輕開發(fā)開放協(xié)同......鏈路雙話、高性能發(fā)布訂閱、優(yōu)先級(jí)控制、消息生命周期管理、外部服務(wù)外部服務(wù)流程、數(shù)據(jù)、應(yīng)用輕開發(fā)開放協(xié)同服務(wù)...服務(wù)...智慧交通操作系統(tǒng)交通OS功能架構(gòu)具。面向企業(yè)應(yīng)用、系統(tǒng)、服務(wù)、API、設(shè)備等資源,提供安全、高可用、輕量化的連接器能力,為汽車產(chǎn)業(yè)應(yīng)用3.2.2汽車產(chǎn)業(yè)應(yīng)用3.2.2型的初心所在。云服務(wù)商積極參與產(chǎn)業(yè)生態(tài)共建,持續(xù)以數(shù)字化技術(shù)賦能汽車產(chǎn)業(yè)轉(zhuǎn)型升級(jí),旨在通過加快云計(jì)算、大數(shù)智能化的新物種。轉(zhuǎn)變二用戶需求之變,Z世代和“她”經(jīng)濟(jì)崛起為代表的新消費(fèi)。轉(zhuǎn)變?nèi)a(chǎn)業(yè)價(jià)值之變,關(guān)鍵能力:仿真HPC要進(jìn)行大量的CAE仿真模擬測試,根據(jù)行業(yè)趨勢(shì)觀察,近5年來,隨著中國CAE行業(yè)市場規(guī)模持續(xù)穩(wěn)定增長,CAE軟件風(fēng)電/風(fēng)機(jī)...CVMCVM并行存儲(chǔ)CFS-TurboRoCERoCEGPUGPU文件存儲(chǔ)文件存儲(chǔ)CFS對(duì)象存儲(chǔ)對(duì)象存儲(chǔ)COSVPCVPC5D-5D-WAN/VPNHPC仿真云架構(gòu)圖已經(jīng)能滿足較高性價(jià)比、適配不同類型CAE軟件、支持多類GPU數(shù)據(jù)采集數(shù)據(jù)管理數(shù)據(jù)和訪問合規(guī)管理數(shù)據(jù)標(biāo)注仿真評(píng)測仿真評(píng)測模擬仿真資源調(diào)度、數(shù)據(jù)服務(wù)、標(biāo)準(zhǔn)化算法迭代3.2.3制造行業(yè)應(yīng)用3.2.3當(dāng)前,越來越多從工業(yè)時(shí)代成長起來的企業(yè),開始不滿足于舊有模式與規(guī)則下的改良,而是寄希望于借助數(shù)字化手段實(shí)現(xiàn)倍增創(chuàng)新。通過創(chuàng)新,在更短時(shí)間內(nèi),以更少的人力與資源投入,實(shí)現(xiàn)業(yè)務(wù)的倍速增長、極致的運(yùn)營效率以及卓越的用戶盡管不同企業(yè)在數(shù)字化轉(zhuǎn)型中的側(cè)重點(diǎn)各不相同,但本質(zhì)上都是在做同一件事,即“破圈”:開辟一條新的思維途徑、引入電池缺陷率提升到十億分之一。這樣的極限效率,僅依賴傳統(tǒng)工具與固有經(jīng)驗(yàn)絕非可能。因此,企業(yè)唯有將原有的生產(chǎn)方數(shù)字化研發(fā)數(shù)字化生產(chǎn)數(shù)字化供應(yīng)數(shù)字化銷售數(shù)字化服務(wù)數(shù)字化產(chǎn)品數(shù)字化研發(fā)數(shù)字化生產(chǎn)數(shù)字化供應(yīng)數(shù)字化銷售數(shù)字化服務(wù)數(shù)字化產(chǎn)品用友U9CloudSAP用友U9CloudSAP...工業(yè)AI引擎工業(yè)AI引擎工業(yè)數(shù)據(jù)中臺(tái)工業(yè)AI中臺(tái)工業(yè)安全中臺(tái)AIoT5G工業(yè)數(shù)據(jù)中臺(tái)工業(yè)AI中臺(tái)工業(yè)安全中臺(tái)AIoT5G3.3場景創(chuàng)新,激發(fā)創(chuàng)新算網(wǎng)應(yīng)用打開新局面3.3.1東N西M應(yīng)用3.3.1東部GDP占比高,是國家經(jīng)濟(jì)發(fā)展的發(fā)動(dòng)機(jī),西部需要東部的帶動(dòng)和需求轉(zhuǎn)移,實(shí)現(xiàn)協(xié)東部能耗難以自給,西部產(chǎn)能多,滿足自用同時(shí),可在本地承接?xùn)|部算力需求,實(shí)現(xiàn)資源、我國東部地區(qū)算力需求旺盛,但受土地、電力、能耗指標(biāo)等限制,算力供應(yīng)不足。西部地區(qū)資源豐富,可利用空間大。在西部部署算力資源,通過靈活調(diào)度,承接?xùn)|部地區(qū)算力外溢需求,推動(dòng)?xùn)|西部資源和需求的再配置。東部GDP占比高,是國家經(jīng)濟(jì)發(fā)展的發(fā)動(dòng)機(jī),西部需要東部的帶動(dòng)和需求轉(zhuǎn)移,實(shí)現(xiàn)協(xié)東部能耗難以自給,西部產(chǎn)能多,滿足自用同時(shí),可在本地承接?xùn)|部算力需求,實(shí)現(xiàn)資源、東部人口密度大、資源緊張,西部地廣人稀、年均氣溫低,有先天資源優(yōu)勢(shì),利于算力設(shè)施化能力,支持多個(gè)容器共享一張GPU卡的容器共享技術(shù)。以容器插件的方并發(fā)代表著一系列虛擬計(jì)算資源的集合,包含CPU、帶寬、磁盤、GPU等,一路并發(fā)支持一個(gè)用戶同時(shí)訪問。多媒體云高畫質(zhì),保障用戶在使用時(shí)可以獲得優(yōu)質(zhì)的視覺體驗(yàn)以及較低的流量消耗;三是弱網(wǎng)保障,結(jié)合RTC帶寬評(píng)估、丟包重傳以在不同的終端和網(wǎng)絡(luò)環(huán)境下播放,滿足不同場景的應(yīng)用需求。隨著人工智能相關(guān)技術(shù)的發(fā)展,音視頻編解碼可通過視頻AI算法,根據(jù)視頻場景分類實(shí)時(shí)識(shí)別結(jié)果,并結(jié)合視頻源碼率、幀率、分辨率、紋理、運(yùn)動(dòng)變化幅度以及機(jī)器負(fù)載和ROI升云渲染能力,支撐數(shù)字人智能服務(wù)、全真營業(yè)廳等場景,另一方面一同助力傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型,應(yīng)用在影視動(dòng)畫制生成式應(yīng)用3.3.2生成式應(yīng)用3.3.2來,生成式AI的發(fā)展一直不溫不火。2022年11月ChatGPT的橫空出世,引發(fā)了現(xiàn)象級(jí)熱潮,讓生成式人工智能走入了億萬用戶的視野。生成式人工智能無論是服務(wù)C端還是B端場景,都需要有多種技術(shù)為其賦能,例如:數(shù)據(jù)標(biāo)注、模型調(diào)優(yōu)、內(nèi)容生成、大語言模型、內(nèi)容安全等。生成式應(yīng)用需要行業(yè)大模型和AI能力結(jié)合,可以快速提升“對(duì)話理解”和“智能問另外,從用戶側(cè)類型劃分,生成式應(yīng)用在C端和BG端市場呈現(xiàn)出兩類路徑,其中C端已經(jīng)達(dá)到可用、甚至好用的臨界點(diǎn),BG端將從高價(jià)值先導(dǎo)領(lǐng)域向模型即服務(wù)(MaaS)生態(tài)擴(kuò)展。生成式應(yīng)用中,模型即服務(wù)(MaaS)、內(nèi)容安全等能力是關(guān)鍵能力:模型即服務(wù)(MaaS)聯(lián)合推進(jìn)計(jì)劃,并率先在金融行業(yè)展開研究。云服務(wù)商加大在大模型領(lǐng)域的投入,2023年6月亞馬遜云宣布投資1億美元,PDF、WORD等)的安全檢測。防止生NLP模型NLP模型HTTPHTTP接入異步回調(diào)存儲(chǔ)系統(tǒng)接入音頻ASRTDWTDWMySQLMySQLCKV+CKV+ESESCOSCOS入內(nèi)容安全系統(tǒng)),間接方式(業(yè)務(wù)將數(shù)據(jù)圖片、視頻、音頻等內(nèi)容存儲(chǔ)到COS里面,內(nèi)容安全系統(tǒng)自動(dòng)拉取內(nèi)容進(jìn)行識(shí)別);內(nèi)容預(yù)處理針對(duì)WORD文件、PDF文件等非文本、圖片、音頻的文件進(jìn)行預(yù)處理,將里面的內(nèi)容拆解為文本、圖片策略層針對(duì)客戶不同業(yè)務(wù)系統(tǒng)接入支持不同的策略配置,策略配置包括黑白名單配置(支持針對(duì)文本、圖片、視頻的配數(shù)字孿生應(yīng)用3.3.3數(shù)字孿生應(yīng)用3.3.3在數(shù)實(shí)融合的大背景下,數(shù)字孿生作為產(chǎn)業(yè)數(shù)字化的重要技術(shù),是促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展的重要抓手,已經(jīng)進(jìn)入一個(gè)產(chǎn)業(yè)爆發(fā)建筑、園區(qū)、能源、文旅、城市、制造、環(huán)境保護(hù)等行業(yè),各行業(yè)的需求日益高漲,發(fā)展前景廣闊。PrecedenceResearch市場研究機(jī)構(gòu)公布的報(bào)告顯示,全球數(shù)字孿生市場規(guī)模在2022年已達(dá)到了115.5億美元,并預(yù)計(jì)在2022年至2030年期間以38.87%的復(fù)合年增長率增長,將達(dá)到約1597.7億美元。程進(jìn)行數(shù)字化建模和仿真,實(shí)現(xiàn)對(duì)生產(chǎn)過程全方位監(jiān)測、優(yōu)化和管理,以提高生產(chǎn)效率、降低成本、提高產(chǎn)品質(zhì)量和靈活為保障工廠各種設(shè)備安全、有序運(yùn)行,瑞泰馬鋼打造“數(shù)字孿生工廠”,以自動(dòng)化裝備系統(tǒng)、信息化系統(tǒng)(PLM、ERP、PMS等)為基礎(chǔ),以數(shù)字孿生底座為核心,利用數(shù)字孿生、動(dòng)態(tài)3D大數(shù)據(jù)可視化、AI數(shù)據(jù)應(yīng)用分析及5G遠(yuǎn)控等新技術(shù),通過“數(shù)字孿生工廠”的操作平臺(tái)實(shí)現(xiàn)產(chǎn)品設(shè)計(jì)、工藝、制造、服務(wù)到退役全生命周期數(shù)據(jù)和商業(yè)智能分析(BI)的透明據(jù)的接入與治理,業(yè)務(wù)數(shù)據(jù)的接入與治理,業(yè)務(wù)數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)與空間數(shù)據(jù)的融合處理,AI算法的接入與調(diào)用,數(shù)據(jù)及數(shù)字孿生底座通過無代碼/低代碼的方式為用戶提供服務(wù),以降低用戶使用平臺(tái)的技術(shù)門檻。物聯(lián)方面,提供無代碼的設(shè)備接入工具及標(biāo)準(zhǔn)化的物模型,用戶通過簡單的配置即可實(shí)現(xiàn)感知設(shè)備的快速接入、數(shù)據(jù)獲取與消費(fèi)、設(shè)備反控等;空間數(shù)據(jù)管理方面,提供多類BIM文件的導(dǎo)入、數(shù)模分離、輕量化、坐標(biāo)的管理和應(yīng)用;數(shù)據(jù)融合處理方面,提供可視化的數(shù)據(jù)編排畫布及豐富的原子節(jié)點(diǎn),可實(shí)現(xiàn)對(duì)數(shù)據(jù)的采集、處理、消費(fèi)的無代碼編排,滿足各類大數(shù)據(jù)治理、數(shù)據(jù)融合處理、實(shí)時(shí)/離線數(shù)據(jù)運(yùn)算、復(fù)雜數(shù)據(jù)聯(lián)動(dòng)場景編排等;應(yīng)用編排方面,提供豐富的圖表組件和模版,可快速上手,無代碼編輯各類二三維一體的數(shù)據(jù)展示和分析場景,實(shí)現(xiàn)數(shù)字孿生應(yīng)用的即時(shí)創(chuàng)應(yīng)用層平臺(tái)能力層基礎(chǔ)設(shè)施設(shè)備數(shù)據(jù)模型(UPS/空調(diào)...)應(yīng)用層平臺(tái)能力層基礎(chǔ)設(shè)施設(shè)備數(shù)據(jù)模型(UPS/空調(diào)...)人員數(shù)據(jù)模型(值排班|交接班|...)統(tǒng)一體驗(yàn)PCPC屏(統(tǒng)一Portal)IDCIDC運(yùn)維運(yùn)營APP集團(tuán)/大區(qū)/省管理大屏集團(tuán)/大區(qū)/省管理大屏數(shù)字化可視智能化運(yùn)維智能化運(yùn)營AI能效調(diào)優(yōu)安全可信間、制冷資源可視冷電鏈路冷電鏈路可視告警呈現(xiàn)統(tǒng)計(jì)鉀電健康度預(yù)測電力/設(shè)備變更仿真機(jī)房巡檢自動(dòng)化開關(guān)健康度預(yù)測配電故障影響面
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《薄層層析柱層析》課件
- 2025年臨汾貨物運(yùn)輸駕駛員從業(yè)資格考試系統(tǒng)
- 2025年漢中道路貨運(yùn)駕駛員從業(yè)資格證考試
- 《行政許可范圍制度》課件
- 住宅小區(qū)施工備案委托協(xié)議
- 排水系統(tǒng)工程合同協(xié)議書范本
- 長期購銷合同變更問題
- 花卉園藝設(shè)備租賃合同
- 舞臺(tái)表演音響租賃合同范本
- 農(nóng)藥使用安全操作手冊(cè)
- 《富馬酸盧帕他定口崩片關(guān)鍵質(zhì)量屬性與標(biāo)準(zhǔn)研究》
- 走近非遺 課件 2024-2025學(xué)年湘美版(2024)初中美術(shù)七年級(jí)上冊(cè)
- 新生兒壞死性小腸結(jié)腸炎臨床診療指南解讀 課件
- 網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例
- 2024版2024年【人教版】二年級(jí)上冊(cè)《道德與法治》全冊(cè)教案
- 2024年浙江省單獨(dú)招生文化考試語文試卷(含答案詳解)
- 山東省泰安市2024屆高三上學(xué)期期末數(shù)學(xué)試題(含答案解析)
- 少兒編程獲獎(jiǎng)?wù)n件
- 2024年《風(fēng)力發(fā)電原理》基礎(chǔ)技能及理論知識(shí)考試題庫與答案
- 軟件開發(fā)項(xiàng)目監(jiān)理細(xì)則
- (必會(huì))軍隊(duì)文職(藥學(xué))近年考試真題題庫(含答案解析)
評(píng)論
0/150
提交評(píng)論