大模型落地路線圖研究報(bào)告(2024年)_第1頁(yè)
大模型落地路線圖研究報(bào)告(2024年)_第2頁(yè)
大模型落地路線圖研究報(bào)告(2024年)_第3頁(yè)
大模型落地路線圖研究報(bào)告(2024年)_第4頁(yè)
大模型落地路線圖研究報(bào)告(2024年)_第5頁(yè)
已閱讀5頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1 2 5 7 9 9 10 12 15 15 16 20 24 24 25 30 33 33 34 37 40 40 42 43 2 4 6 7 10 12 15 20 24 30 18 18 18 18 1一、大模型發(fā)展情況概述通過(guò)芯片間的互連技術(shù)實(shí)現(xiàn)計(jì)算能力的代際飛躍。該芯片相較于低精度推理3等方法實(shí)現(xiàn)推理加速,可有效提升計(jì)算資源的利用率。1/zh-cn/blog/nvidia-gb200-nvl72-delivers-trillion-parameter-llm-tr2https://huggingface.co/docs/transformers/perf_train_gpu_one#fp163/abs/22絡(luò)架構(gòu)上,以Transformer為代表的主流架構(gòu)不斷迭代增強(qiáng),進(jìn)一步的瓶頸。例如,在Transformer解碼器的基礎(chǔ)上融入混合專家模型可以有效提升大模型的性能表現(xiàn)4?;贛ega架構(gòu)改進(jìn)的Megalodon來(lái)源:公開(kāi)資料整理(一)全面提升多模態(tài)感知能力,推進(jìn)認(rèn)知智能走深向4/pdf/230531.大模型具備多模態(tài)感知能力強(qiáng)大的表征和泛化能力賦予大模型出色的單任務(wù)識(shí)別分類和多2.大模型認(rèn)知能力顯著提升5/abs/24的準(zhǔn)確率近60%6,逐步接近人類的表現(xiàn)。推理和決策能力上,大模提示學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù)挖掘數(shù)據(jù)之間的關(guān)聯(lián)單詞問(wèn)題(MathWordProblem)任務(wù),相較于傳統(tǒng)提示學(xué)習(xí)在數(shù)據(jù)來(lái)源:公開(kāi)資料整理6/pdf/275(二)大模型場(chǎng)景落地百花齊放,擘畫智能應(yīng)用生態(tài)藍(lán)1.面向行業(yè)加速數(shù)字化轉(zhuǎn)型步伐中國(guó)工商銀行將大模型應(yīng)用于智能客服領(lǐng)域,將平均通話時(shí)長(zhǎng)縮短6來(lái)源:公開(kāi)資料整理2.面向場(chǎng)景激發(fā)應(yīng)用創(chuàng)新活力7來(lái)源:公開(kāi)資料整理(三)技術(shù)選型與工程實(shí)踐掣肘,亟需開(kāi)展落地路線研1.大模型工程實(shí)踐復(fù)雜,需系統(tǒng)梳理落地路線圖作為參考82.大模型技術(shù)選型困難,需明確技術(shù)指標(biāo)和評(píng)估方法9二、診斷大模型能力基礎(chǔ)(一)評(píng)估大模型能力發(fā)展現(xiàn)狀,深入挖掘業(yè)務(wù)轉(zhuǎn)型需來(lái)源:公開(kāi)資料整理(二)梳理人財(cái)物要素就緒情況,系統(tǒng)評(píng)估人工智能基礎(chǔ)1.評(píng)估基礎(chǔ)資源的完備度2.評(píng)估人才團(tuán)隊(duì)配比的平衡度3.評(píng)估戰(zhàn)略規(guī)劃與大模型應(yīng)用的契合度不確定性等因素綜合評(píng)估現(xiàn)階段相關(guān)的經(jīng)費(fèi)預(yù)算投入情況能否滿足來(lái)源:公開(kāi)資料整理(三)挖掘各類軟硬件資源需求,統(tǒng)籌規(guī)劃業(yè)務(wù)發(fā)展目1.根據(jù)業(yè)務(wù)發(fā)展需求確定服務(wù)場(chǎng)景及目標(biāo)2.根據(jù)服務(wù)場(chǎng)景及目標(biāo)確定大模型技術(shù)路徑3.根據(jù)大模型技術(shù)路徑確定基礎(chǔ)設(shè)施需求4.根據(jù)大模型技術(shù)路徑確定數(shù)據(jù)資源需求5.以風(fēng)險(xiǎn)控制為導(dǎo)向確定安全可信要求來(lái)源:公開(kāi)資料整理三、筑牢大模型技術(shù)底座(一)剖析大模型關(guān)鍵落地路線,科學(xué)確立技術(shù)選型原應(yīng)用方應(yīng)通過(guò)完善的方案設(shè)計(jì)和系統(tǒng)的研發(fā)測(cè)試筑牢大模型技(二)設(shè)計(jì)大模型智能系統(tǒng)架構(gòu),制定科學(xué)有效解決方1.面向大模型的基礎(chǔ)軟硬件方案設(shè)計(jì)原則合AI芯片顯存大小推算所需芯片數(shù)量。軟件設(shè)計(jì)方面,應(yīng)用方可選2.面向大模型的數(shù)據(jù)集構(gòu)建方案設(shè)計(jì)原則3.大模型選型和建設(shè)方案設(shè)計(jì)原則降低開(kāi)發(fā)成本、加快開(kāi)發(fā)速度,適用于基礎(chǔ)研究、可滿足定制化、個(gè)性化、安全性需求,適用于安全可輔助模型進(jìn)行特定領(lǐng)域知識(shí)問(wèn)答,可在一定程度能較好地?cái)M合數(shù)據(jù)集、適應(yīng)任務(wù)需求,學(xué)習(xí)能力強(qiáng)通過(guò)減少需要更新的參數(shù)量或改變參數(shù)更新的方式來(lái)提高微調(diào)效率,進(jìn)而減少對(duì)計(jì)算資源的依賴,并通過(guò)提高大模型的意圖理解能力,以提升問(wèn)答過(guò)程利用特定的輸入提示引導(dǎo)模型生成強(qiáng)相關(guān)的內(nèi)容,可根據(jù)實(shí)際需求動(dòng)態(tài)擴(kuò)展或縮減計(jì)算和存儲(chǔ)資源;通常具有較低的開(kāi)發(fā)和維護(hù)成本,避免了應(yīng)用方自可有效降低敏感數(shù)據(jù)泄露的風(fēng)險(xiǎn),能提供更靈活的結(jié)合公有云和私有云部署的優(yōu)勢(shì),有效幫助應(yīng)用方適用于對(duì)生成、理解、推理、決策的準(zhǔn)確率要求較適用于簡(jiǎn)單任務(wù),訓(xùn)練和推理算力需求較小,可在4.面向大模型的應(yīng)用服務(wù)方案設(shè)計(jì)原則5.面向大模型的風(fēng)險(xiǎn)控制方案設(shè)計(jì)原則單、進(jìn)行風(fēng)險(xiǎn)識(shí)別、完成風(fēng)險(xiǎn)處置,制定風(fēng)險(xiǎn)管理策略來(lái)源:公開(kāi)資料整理(三)系統(tǒng)研發(fā)大模型技術(shù)底座,全面開(kāi)展功能性能測(cè)1.構(gòu)建高效易用的大模型訓(xùn)練推理平臺(tái)2.構(gòu)建面向大模型的高質(zhì)量數(shù)據(jù)集3.構(gòu)建高質(zhì)量的算法模型資產(chǎn)4.開(kāi)發(fā)大模型一體化應(yīng)用服務(wù)平臺(tái)應(yīng)用方應(yīng)根據(jù)平臺(tái)管理和服務(wù)性能需求構(gòu)建大模型應(yīng)用服務(wù)平GPT-4o對(duì)音頻輸入的響應(yīng)時(shí)間可以短至232毫秒,與人類在對(duì)話中的響應(yīng)時(shí)間相近,提供了更即時(shí)的互動(dòng)體驗(yàn);GPT-4o為付費(fèi)用戶提5.構(gòu)建面向大模型的風(fēng)險(xiǎn)控制體系來(lái)源:百度四、革新大模型應(yīng)用范式(一)參照業(yè)務(wù)場(chǎng)景個(gè)性化需求,定制化調(diào)優(yōu)專用大模(二)開(kāi)發(fā)大模型原生智能應(yīng)用,實(shí)現(xiàn)大小模型協(xié)同賦應(yīng)用方應(yīng)將專用大模型轉(zhuǎn)化為應(yīng)用服務(wù)以滿足市場(chǎng)的多元化需1.面向不同應(yīng)用服務(wù)配置基礎(chǔ)資源2.面向不同應(yīng)用服務(wù)構(gòu)建數(shù)據(jù)集3.面向不同應(yīng)用場(chǎng)景實(shí)現(xiàn)模型優(yōu)化擇合適的學(xué)習(xí)率和訓(xùn)練迭代次數(shù)來(lái)確保模型同時(shí)掌握通用知識(shí)和專4.面向不同應(yīng)用場(chǎng)景開(kāi)發(fā)模型服務(wù)行編排,如RAG技術(shù)可通過(guò)檢索增強(qiáng)提升模型的準(zhǔn)確性和豐富性,AIAgent應(yīng)用可負(fù)責(zé)具體任務(wù)的調(diào)度、執(zhí)行與反饋,知識(shí)庫(kù)可為AIAgent提供決策支持。模型服務(wù)協(xié)議方面,應(yīng)從可對(duì)過(guò)去的行為展開(kāi)自我批評(píng)和反思,從錯(cuò)誤中吸取教訓(xùn),并對(duì)未來(lái)步驟進(jìn)行完善,提利用外部向量存儲(chǔ)和快速檢索以獲得長(zhǎng)時(shí)間智能體依托大模型實(shí)現(xiàn)意圖理解,并通過(guò)調(diào)理解意圖并將任務(wù)拆分為若干個(gè)步驟,對(duì)工通過(guò)多次迭代,實(shí)現(xiàn)更高質(zhì)量的輸出,確保多個(gè)智能體扮演不同的角色,協(xié)同完成復(fù)雜通過(guò)優(yōu)化資源配置、提高資源利用率,實(shí)現(xiàn)5.滿足不同應(yīng)用服務(wù)的安全可信要求訊飛星火認(rèn)知大模型云服務(wù)平臺(tái)為星火認(rèn)知大模型提供全面模型的預(yù)訓(xùn)練與微調(diào),以及推理服務(wù)的工程化操作和快速部署能力。通過(guò)專注于AI生產(chǎn)過(guò)程的平臺(tái)化以及AI技術(shù)的快速實(shí)際應(yīng)來(lái)源:科大訊飛(三)構(gòu)建全鏈路效能評(píng)估體系,形成診建用評(píng)有效閉1.評(píng)估基礎(chǔ)設(shè)施的成熟度應(yīng)用方應(yīng)從資源配備情況與綜合效能兩方面來(lái)評(píng)估基礎(chǔ)設(shè)施的2.評(píng)估數(shù)據(jù)資源的成熟度應(yīng)用方應(yīng)從數(shù)據(jù)構(gòu)成和數(shù)據(jù)質(zhì)量等方面來(lái)評(píng)估數(shù)據(jù)資源的成熟3.評(píng)估算法模型的成熟度應(yīng)通過(guò)識(shí)別和分類任務(wù)評(píng)估算法模型的感知觀和客觀方式來(lái)評(píng)估大模型的自主學(xué)習(xí)、自4.評(píng)估應(yīng)用服務(wù)的成熟度來(lái)源:公開(kāi)資料整理5.評(píng)估安全可信程度五、構(gòu)建大模型管理體系(一)梳理國(guó)內(nèi)外模型治理要點(diǎn),明晰運(yùn)營(yíng)管理體系價(jià)值部發(fā)展需要。當(dāng)前國(guó)內(nèi)外均高度重視大模型治理,2023年6月,歐思路。2023年7月,中央網(wǎng)信辦等七部門聯(lián)合頒發(fā)《生成式人工智助推業(yè)務(wù)發(fā)展等目標(biāo),可通過(guò)規(guī)范大模型管理的作進(jìn)行協(xié)調(diào)、控制和優(yōu)化。應(yīng)用方建立和實(shí)施大和服務(wù)質(zhì)量、降低運(yùn)營(yíng)成本,提高公信力和核心(二)實(shí)時(shí)監(jiān)測(cè)大模型運(yùn)行過(guò)程,確保高效穩(wěn)定提供服大模型部署后依賴收集監(jiān)測(cè)數(shù)據(jù)和用戶反饋以進(jìn)行持續(xù)更新迭1.監(jiān)測(cè)基礎(chǔ)設(shè)施的運(yùn)行狀態(tài)應(yīng)用方應(yīng)從硬件和軟件兩個(gè)方面實(shí)時(shí)監(jiān)測(cè)大模型基礎(chǔ)設(shè)施的運(yùn)2.監(jiān)測(cè)數(shù)據(jù)的鏈路、質(zhì)量和漂移3.監(jiān)測(cè)算法模型的運(yùn)行情況F1值、BLEU、ROUGE、均方誤差、平均絕對(duì)誤差、響應(yīng)時(shí)間等性4.監(jiān)測(cè)應(yīng)用服務(wù)的運(yùn)行狀態(tài)5.監(jiān)測(cè)大模型的安全可信情況安全意識(shí)培訓(xùn)以及實(shí)施數(shù)據(jù)加密和訪問(wèn)控制等措施來(lái)防范安全事件(三)建立健全大模型管理體系,保障業(yè)務(wù)高效穩(wěn)定開(kāi)展1.構(gòu)建基礎(chǔ)設(shè)施運(yùn)營(yíng)管理體系2.構(gòu)建數(shù)據(jù)治理體系訓(xùn)練、微調(diào)、測(cè)試數(shù)據(jù)集進(jìn)行綜合分析,組織形成數(shù)據(jù)架構(gòu)。根據(jù)數(shù)互通。在數(shù)據(jù)質(zhì)量方面,明確數(shù)據(jù)質(zhì)量目標(biāo),根據(jù)業(yè)務(wù)需求及數(shù)據(jù)要求制定數(shù)據(jù)質(zhì)量的評(píng)價(jià)準(zhǔn)則,包括衡量數(shù)據(jù)質(zhì)量的技術(shù)指標(biāo)、業(yè)務(wù)指統(tǒng)一加工和分析,對(duì)應(yīng)用服務(wù)中的監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析或建模,對(duì)已有數(shù)據(jù)安全的管理,滿足數(shù)據(jù)安全的業(yè)務(wù)需要和監(jiān)管需求,實(shí)現(xiàn)組織內(nèi)部對(duì)3.構(gòu)建算法模型的治理體系4.構(gòu)建應(yīng)用服務(wù)運(yùn)營(yíng)管理體系5.構(gòu)建大模型安全可信體系六、大模型發(fā)展趨勢(shì)展望(一)探索大模型架構(gòu)優(yōu)化方案,帶動(dòng)技術(shù)應(yīng)用雙重涌當(dāng)前,大模型的底層架構(gòu)Transformer逐漸顯現(xiàn)多種1.底層架構(gòu)迭代創(chuàng)新,全力突破模型發(fā)展瓶頸底層架構(gòu)問(wèn)題日益凸顯,Transformer架構(gòu)穩(wěn)居核心地位的同時(shí),在及混合架構(gòu)模型已成為未來(lái)重點(diǎn)研究方向之一。Mamba、RWKV、2.智能底座推陳出新,帶動(dòng)原生應(yīng)用涌現(xiàn)基于Mega架構(gòu)改進(jìn)的Megalodon能夠式,將帶來(lái)更加智能、高效的服務(wù)體驗(yàn)。以Copilot為代表的輔助型原生應(yīng)用方面,Copilot應(yīng)用能夠輔助用戶完成多種復(fù)雜任務(wù),大幅3.模型技術(shù)持續(xù)更迭演進(jìn),強(qiáng)力助推

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論