大模型行業(yè)分析報告_第1頁
大模型行業(yè)分析報告_第2頁
大模型行業(yè)分析報告_第3頁
大模型行業(yè)分析報告_第4頁
大模型行業(yè)分析報告_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

大模型行業(yè)分析報告大模型行業(yè)概念定義大模型是大規(guī)模語言模型簡稱,是參數(shù)規(guī)模龐大、復雜程度高的機器學習模型,訓練需大量數(shù)據(jù)和計算能力,參數(shù)有幾百萬到數(shù)十億個。設計目的是提升表示和性能能力,更好捕捉數(shù)據(jù)模式規(guī)律。按應用場景和功能,可分為自然語言處理、計算機視覺、語音識別等多種類型大模型。行業(yè)大模型針對特定行業(yè)或領域深度定制優(yōu)化,基于通用大模型進一步訓練調(diào)整,以適應特定行業(yè)語言、知識、數(shù)據(jù)特點,在特定行業(yè)應用中準確性和效率更高。其特點包括專業(yè)化,滿足特定行業(yè)需求;高性能,能快速處理大規(guī)模數(shù)據(jù);可擴展性,能快速迭代升級;安全性,保障數(shù)據(jù)和模型安全隱私。生成式人工智能的大型語言模型通常分基礎(基座或底座)大模型、下游任務微調(diào)優(yōu)化大模型等,通過自監(jiān)督學習對多模態(tài)序列訓練數(shù)據(jù)進行語言建模、理解與生成。大模型行業(yè)是基于大規(guī)模參數(shù)和復雜結(jié)構(gòu)機器學習模型進行技術(shù)研發(fā)與應用推廣的新興領域,涵蓋自然語言處理等多個子領域,產(chǎn)業(yè)鏈包含數(shù)據(jù)采集與處理、模型研發(fā)與訓練、應用開發(fā)與推廣等環(huán)節(jié)。大模型行業(yè)發(fā)展歷程早期奠基(2006-2017年):2006年深度學習技術(shù)受關注,GeoffreyHinton團隊成果為大模型技術(shù)奠基。2012年AlexNet模型在ImageNet競賽獲勝,推動深度學習在圖像識別發(fā)展,為大模型助力。2013-2014年,Word2Vec和GloVe等詞嵌入模型推動自然語言處理發(fā)展。2017年Transformer架構(gòu)誕生,引入自注意力機制,解決傳統(tǒng)RNN/LSTM長距離依賴局限,奠定現(xiàn)代大語言模型基礎。預訓練模型崛起(2018-2020年):2018年谷歌發(fā)布BERT,雙向上下文理解,推動雙向預訓練發(fā)展;OpenAI發(fā)布GPT-1,開啟生成式預訓練先河。2019年GPT-2參數(shù)擴大到15億,展示零樣本學習能力。2020年GPT-3擁有1750億參數(shù),成為規(guī)模擴展轉(zhuǎn)折點,谷歌T5模型證明大模型靈活性和泛化能力。訓練后對齊技術(shù)發(fā)展(2021-2022年):2021-2022年發(fā)展出監(jiān)督微調(diào)(SFT)和人類反饋強化學習(RLHF)技術(shù)。2022年ChatGPT基于GPT-3.5微調(diào),引入RLHF,提升交互性和安全性。多模態(tài)與推理能力突破(2023-2025年):2023年GPT-4V結(jié)合語言和視覺能力;2024年GPT-4o整合音頻和視頻輸入,OpenAI-o1系列引入思維鏈技術(shù)提升推理能力。2024年12月DeepSeek-V3出現(xiàn),降低訓練成本;2025年1月DeepSeek-R1通過強化學習優(yōu)化成本和性能。國內(nèi)發(fā)展情況:2023年被視為國產(chǎn)AI時代開啟元年,上半年大模型相關融資超20起,發(fā)布大模型超100個。2024年7月完成備案并上線的生成式AI大模型接近200個。經(jīng)歷“百模大戰(zhàn)”,2025年有創(chuàng)新能力的企業(yè)減少,產(chǎn)業(yè)競爭格局逐漸明晰。大模型行業(yè)產(chǎn)業(yè)鏈結(jié)構(gòu)大模型分類:按輸入數(shù)據(jù)類型,分為語言大模型(NLP)、視覺大模型(CV)和多模態(tài)大模型。NLP處理文本,如GPT系列等;CV用于圖像處理,如VIT系列等;多模態(tài)大模型能處理多種數(shù)據(jù),如DingoDB多模向量數(shù)據(jù)庫。按應用領域分通用大模型L0、行業(yè)大模型L1和垂直大模型L2,分別適用于多領域、特定行業(yè)、特定任務場景。產(chǎn)業(yè)鏈環(huán)節(jié):上游:涵蓋硬件和軟件。硬件有芯片、服務器、通信網(wǎng)絡等;軟件包括云計算、數(shù)據(jù)庫、中間件等,是大模型訓練和推理的基礎支撐。中游:主要是大模型行業(yè)本身。算力芯片是大模型速度核心,影響模型效果,大模型規(guī)模擴大推動芯片技術(shù)創(chuàng)新發(fā)展。下游:為大模型應用領域,包括游戲、辦公、傳媒影視、醫(yī)療、金融、電商、工業(yè)等眾多行業(yè)。市場規(guī)模與趨勢:市場容量及規(guī)模巨大,預計2028年將達1179億元。中國AI大模型行業(yè)市場規(guī)模從2020年的15億元增長至2022年的70億元,年均復合增長率高達116.02%,2023年進一步擴大至147億元。未來,隨著技術(shù)進步和應用場景拓展,大模型將在智能制造、生物醫(yī)藥等更多領域突破創(chuàng)新,中國AI大模型行業(yè)預計繼續(xù)保持快速增長。大模型行業(yè)市場規(guī)模全球市場規(guī)模:2023年全球大模型行業(yè)市場規(guī)模達到210億美元,同比增長94.4%。預計到2028年,全球大模型市場規(guī)模將達到1095億美元,2023-2028年復合增長率約為47.12%。初步估算,2024年全球大模型行業(yè)市場規(guī)模將達到280億美元,未來五年復合增速將達到36.23%。2.中國市場規(guī)模:2023年中國大模型行業(yè)市場規(guī)模為17.65億元(云側(cè)16.88億元,端側(cè)0.77億元),2023年中國大模型行業(yè)市場規(guī)模達147億人民幣,同比增長110.0%;2023年中國行業(yè)大模型市場規(guī)模為105億元左右。不同機構(gòu)對中國大模型行業(yè)未來規(guī)模預測有所差異:-預計2024年中國大模型產(chǎn)業(yè)規(guī)模將達216億元;中國大模型行業(yè)市場規(guī)模將達到205億元;中國大模型應用市場規(guī)模達到47.9億元人民幣(不包含算力類基礎設施規(guī)模);中國行業(yè)大模型市場規(guī)模將達到165億元。-預計2028年中國大模型市場規(guī)模將達到1179億人民幣,2023-2028年復合增長率約為60.11%。-預計2030年中國AI大模型行業(yè)市場規(guī)模為896.58億元(云側(cè)812.39億元,端側(cè)84.19億元)。3.區(qū)域市場與競爭格局:從區(qū)域看,2019-2023年全球基礎大模型發(fā)布累積數(shù)量中,美國最多,2023年占比69%,其次是中國和英國。全球AI大模型行業(yè),美企如OpenAI、Google、微軟等處于領先;中國頭部企業(yè)有百度、阿里、騰訊、華為等。行業(yè)競爭激烈,頭部企業(yè)依托技術(shù)和算力競爭,初創(chuàng)企業(yè)在細分領域發(fā)展,同時面臨算法優(yōu)化、成本控制和國際競爭等挑戰(zhàn)。4.應用滲透情況:大模型商業(yè)化應用時間短,但已滲透到多行業(yè)。截至2023年,金融、政府、影視游戲和教育領域滲透率超50%,電信、電子商務和建筑領域應用成熟度較高。大模型行業(yè)競爭格局全球競爭格局:全球大模型市場呈多元化競爭,美國在AI技術(shù)領先,在多領域優(yōu)勢顯著;中國進展突出,中文大模型實力強勁;歐洲、日本等也積極布局。我國大型語言模型分互聯(lián)網(wǎng)公司、AI公司、學術(shù)及科研機構(gòu)、行業(yè)專家團隊初創(chuàng)公司四大競爭派系。2024年上半年,百度、科大訊飛等企業(yè)中標項目表現(xiàn)突出。國內(nèi)市場情況:國內(nèi)大模型發(fā)展迅猛,騰訊、百度等巨頭推出產(chǎn)品并優(yōu)化。開源大模型崛起,如Qwen2-72B表現(xiàn)出色,縮小與頂尖模型差距,且在多行業(yè)應用深化。國內(nèi)共推出約305個大模型,約140個完成生成式人工智能服務備案。為獲取用戶和份額,頭部廠商打響“價格戰(zhàn)”,這推動應用場景拓展,但壓縮了初創(chuàng)企業(yè)競爭空間。競爭趨勢與格局變化:技術(shù)演進曲線趨于平緩,行業(yè)競爭格局走向收斂。中國通用基礎大模型領域競爭者縮減至20余家,由互聯(lián)網(wǎng)企業(yè)等主導。創(chuàng)業(yè)公司形成“六小虎”格局,快速成長為獨角獸;傳統(tǒng)互聯(lián)網(wǎng)巨頭加大投入,百度文心一言、騰訊混元大模型、字節(jié)跳動豆包等表現(xiàn)突出。海外格局收斂到頭部5家超級公司,腰部玩家和創(chuàng)業(yè)公司生存空間受擠壓。細分領域格局:政務大模型行業(yè),華為、浪潮等領先企業(yè)提升了行業(yè)集中度和競爭力。央國企大模型市場,科大訊飛市場份額居首,各廠商因央國企獨特需求形成差異化競爭格局。大模型行業(yè)商業(yè)模式大模型商業(yè)模式特點:高度自動化,減少人工干預成本;高度智能化,能處理大量數(shù)據(jù)并提高智能水平;高度可擴展性,能快速擴展處理數(shù)據(jù)和任務;高度安全性,保護數(shù)據(jù)和隱私;高度可定制化,提供個性化解決方案??蓱糜诮鹑?、醫(yī)療、教育、交通等多領域。收費模式:API調(diào)用收費:底層通用大模型多采用開放API接口,按實際消耗/調(diào)用的tokens量收費,不同模型收費標準不同,每1000tokens收費大概在0.008元-0.87元不等。訂閱計費:部分底層大模型采用此模式,按月或按年收取,一定使用額度內(nèi)連續(xù)訂閱有優(yōu)惠,超出額度可能限流或另外計費。主流大模型應用按訂閱費、調(diào)用費以及定制化收費更常見,如ChatGPT有不同版本及相應訂閱費。盈利探索與挑戰(zhàn):盈利模式:除上述收費模式,還有合規(guī)增值服務,如數(shù)據(jù)溯源、安全審核等。一些大模型企業(yè)與行業(yè)龍頭深度定制toB大模型解決方案,實現(xiàn)降本增效以獲取服務費和產(chǎn)品費收入。面臨挑戰(zhàn):訓練需大量數(shù)據(jù)和計算能力,投入資源和時間多;智能水平需持續(xù)提升;安全性和隱私保護需重視。國內(nèi)toC市場較卷、獲客成本高、付費習慣難養(yǎng)成,toB領域存在內(nèi)部數(shù)據(jù)‘喂料’難、接口調(diào)試難、內(nèi)部流程難等問題。行業(yè)發(fā)展趨勢:開源共享推動行業(yè)發(fā)展,包括加速技術(shù)創(chuàng)新、降低進入門檻、加強跨行業(yè)合作、優(yōu)化生態(tài)圈。行業(yè)競爭激烈,呈現(xiàn)百芯百模態(tài)勢,細分市場有云側(cè)和端側(cè)大模型,云側(cè)規(guī)模更大。隨著技術(shù)進步和成本降低,未來商業(yè)模式將不斷演變。大模型行業(yè)技術(shù)發(fā)展發(fā)展歷程:大模型起源可追溯到機器學習和人工智能早期,21世紀第二個十年嶄露頭角。2006年深度學習受關注,為大模型奠定基礎;2012年AlexNet模型推動其發(fā)展;隨后詞嵌入模型、BERT模型等不斷涌現(xiàn),各有突破。本質(zhì)與潛力:大模型通常指參數(shù)眾多的機器學習模型,參數(shù)可達數(shù)十億甚至數(shù)千億,通過大量數(shù)據(jù)學習捕捉復雜特征,理解深層關系。學習能力強,能執(zhí)行多種復雜任務,泛化能力好,可跨領域應用。技術(shù)細節(jié):大語言模型在tokenizer、位置編碼、LayerNormalization和激活函數(shù)的選擇運用上有差異;分布式訓練技術(shù)如數(shù)據(jù)并行、張量模型并行等提升訓練效率;參數(shù)高效微調(diào)技術(shù)如PromptTuning等實現(xiàn)高效模型定制。2024年發(fā)展趨勢:從技術(shù)競賽轉(zhuǎn)向商業(yè)應用;市場規(guī)模顯著增長,預計2024年中國行業(yè)大模型市場規(guī)模達165億元;技術(shù)迭代推進應用拓展,多模態(tài)整合能力提升;技術(shù)路線多元化,小模型涌現(xiàn);垂直領域深耕;降價潮與價格戰(zhàn)出現(xiàn);反哺基礎科學研究;場景滲透率提升;開源化與生態(tài)構(gòu)建加速。年度突破技術(shù)和進展:包括大模型推理技術(shù)、多模態(tài)生成式AI、具身智能和大模型的進化等十大突破,為各領域發(fā)展帶來新方向。現(xiàn)存問題與挑戰(zhàn):國內(nèi)大模型在數(shù)據(jù)層面存在“數(shù)據(jù)孤島”等問題,算力層面運營成本高,算法層面不可解釋且創(chuàng)新優(yōu)化難;AGI發(fā)展也面臨諸多挑戰(zhàn)。未來展望:技術(shù)將更深化融合,向垂直領域拓展,應用范圍不斷擴大至生活各方面,推動產(chǎn)業(yè)融合打造智能生態(tài)。同時要注重人才培養(yǎng)和安全可控性研究。大模型行業(yè)應用領域應用覆蓋領域與行業(yè):中國信通院發(fā)布的圖譜顯示,大模型應用主要聚焦科學智能、具身智能、自動駕駛、智能終端、在線新經(jīng)濟等五個領域,覆蓋教育、文化傳媒、金融、醫(yī)療、城市治理、智能制造等六個行業(yè)。應用分為落地探索、試點示范、應用爆發(fā)、成熟發(fā)展四個階段。如螞蟻集團百靈大模型在醫(yī)療領域處于落地探索期,推出“AI就醫(yī)助理”等解決方案;中國聯(lián)通元景大模型在城市治理處于試點示范期,在智能制造處于落地探索期;浪潮信息源大模型在教育領域處于試點示范期。主要應用領域細分:自然語言處理:用于文本生成、翻譯系統(tǒng)、問答系統(tǒng)、情感分析等。計算機視覺:包括圖像分類、目標檢測、圖像生成、人臉識別等。自動駕駛:進行物體檢測、路徑規(guī)劃、決策制定。金融:涵蓋市場預測和分析、風險評估、智能投顧。醫(yī)療領域:輔助醫(yī)療影像診斷、醫(yī)療數(shù)據(jù)分析。教育領域:提供個性化學習推薦、智能輔導。行業(yè)通用落地模式:大模型+專用知識庫:與領域知識庫結(jié)合,通過檢索增強或微調(diào)適配行業(yè)場景。大模型微服務化部署:封裝為微服務,對外暴露接口,具備彈性伸縮、數(shù)據(jù)隱私與安全保障機制。工業(yè)應用場景:大模型是發(fā)展新質(zhì)生產(chǎn)力的重要引擎,在光伏、汽車、家電制造等行業(yè)有應用。光伏制造需推動AI+IT+OT+IE融合;汽車制造可進行AI質(zhì)檢、智能分析和能源管理;家電制造可用于外觀瑕疵檢測、員工標準作業(yè)改善等。應用趨勢:大模型應用橫向拓展行業(yè)更廣泛,縱向延伸場景更聚焦,朝著垂直化、專業(yè)化發(fā)展。行業(yè)大模型應用場景快慢呈“微笑曲線”,研發(fā)/設計和營銷/服務領域滲透率高,生產(chǎn)制造領域較慢。大模型行業(yè)政策環(huán)境國家層面政策支持:國家通過多種政策助力大模型發(fā)展?!墩ぷ鲌蟾妗诽岢觥叭斯ぶ悄?”行動,鼓勵大模型在多領域落地應用并構(gòu)建安全標準體系,推動傳統(tǒng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型?!缎畔⒒瘶藴式ㄔO行動計劃(2024—2027年)》提出構(gòu)建AI大模型標準化體系,推動技術(shù)落地。地方政府積極響應:北京、上海等人工智能技術(shù)產(chǎn)業(yè)聚集地,在產(chǎn)業(yè)政策、算力基礎設施建設、人才培育、數(shù)據(jù)要素流通規(guī)范等方面多措并舉。東湖高新區(qū)發(fā)布政策,對大模型企業(yè)給予多項補貼,如生成式人工智能服務備案獎勵、算力支持、“首試首用”支持等,對龍頭企業(yè)研發(fā)原創(chuàng)大模型產(chǎn)品最高支持5000萬元。關注應用問題與監(jiān)管:政策關注到AI大模型應用中的算法偏見、虛假信息生成等問題,加強監(jiān)管和法規(guī)制定,確保AI技術(shù)的公正性、透明性和可解釋性。特定行業(yè)政策推動融合:文化和旅游部資源開發(fā)司組織相關活動,推動人工智能與旅游行業(yè)融合發(fā)展。中辦、國辦,國家發(fā)改委等部門分別發(fā)文支持政務服務大模型開發(fā)、訓練和應用,提升公共服務和社會治理智能化水平。大模型行業(yè)面臨挑戰(zhàn)技術(shù)層面:與國際先進水平有差距,算力、數(shù)據(jù)等關鍵資源緊缺,新技術(shù)探索受虹吸效應制約;大模型參數(shù)規(guī)模擴張,對算力要求更高;生成內(nèi)容可能有安全風險和隱形偏見;訓練數(shù)據(jù)有局限性,模型結(jié)構(gòu)處理數(shù)學概念困難,導致數(shù)學運算和邏輯推理薄弱;模型基于統(tǒng)計方法訓練,結(jié)果有偏差,數(shù)據(jù)質(zhì)量和完整性、模型復雜度也影響準確性。產(chǎn)業(yè)層面:缺乏龍頭產(chǎn)品,競爭低端化,核心模型依賴國外;堅持做基礎模型迭代的企業(yè)減少。應用層面:存在不好用、不便用、不敢用的情況,應用場景同質(zhì)化嚴重;在行業(yè)落地困難,數(shù)學和工程能力不足,難以100%正確,行業(yè)理解接受度、數(shù)據(jù)隱私安全、部署維護成本等也構(gòu)成阻礙;在金融等行業(yè)應用時,面臨本地化部署適應性、幻覺與話術(shù)合規(guī)性、融入現(xiàn)有系統(tǒng)流程、數(shù)據(jù)信息安全保護等挑戰(zhàn)。其他挑戰(zhàn):能源消耗與算力成本攀升,壓縮利潤空間,限制應用和商業(yè)化;數(shù)據(jù)隱私與安全需保障,防止泄露濫用;模型可解釋性與可信度低,限制關鍵領域應用;技術(shù)與應用存在鴻溝,應用于實際場景困難;大模型存在安全漏洞,面臨遭受網(wǎng)攻的新風險。大模型行業(yè)發(fā)展趨勢技術(shù)發(fā)展:模型規(guī)模持續(xù)擴大,但會追求規(guī)模與效率平衡,小型化、知識蒸餾、稀疏化技術(shù)興起,同時通過算法和硬件優(yōu)化降低能耗。多模態(tài)融合趨勢明顯,跨模態(tài)能力增強,向具身智能發(fā)展,推動更自然交互體驗。自主性與推理能力提升,從生成內(nèi)容向規(guī)劃決策延伸,強化數(shù)學與邏輯推理能力。自監(jiān)督學習任務創(chuàng)新,參數(shù)高效微調(diào)技術(shù)發(fā)展,多模態(tài)學習技術(shù)突破,模型壓縮與推理加速,知識蒸餾與小模型融合。行業(yè)應用:垂直領域?qū)I(yè)化,定制化領域大模型涌現(xiàn),企業(yè)私有化部署受關注。成為生產(chǎn)力工具,在內(nèi)容生成、客戶服務、教育科研等方面廣泛應用,形成人機協(xié)作新模式。市場與生態(tài):市場規(guī)模顯著增長,2023年中國行業(yè)大模型市場規(guī)模達105億元,預計2024年達165億元,2028年有望達624億元。開源模型崛起,開發(fā)者生態(tài)構(gòu)建加速,云廠商競爭激烈。技術(shù)競賽轉(zhuǎn)向商業(yè)應用,出現(xiàn)降價潮與價格戰(zhàn),應用場景滲透率提升,基礎AI通用大模型開源化加速。面臨挑戰(zhàn):數(shù)據(jù)存在“數(shù)據(jù)孤島”和分級分類管理不足等問題,算力運營成本高,算法不可解釋性及創(chuàng)新優(yōu)化面臨挑戰(zhàn)。有偏見與安全風險,面臨合規(guī)要求,訓練數(shù)據(jù)版權(quán)和內(nèi)容歸屬不明確。未來關鍵突破點:突破上下文窗口限制,實現(xiàn)實時與終身學習,通過技術(shù)降低成本實現(xiàn)普惠化。大模型行業(yè)數(shù)據(jù)安全大模型發(fā)展現(xiàn)狀與風險:2023年“百模大戰(zhàn)”解決大模型從無到有的問題,2024年是應用場景之年。但大模型在提升效能同時帶來數(shù)據(jù)安全和隱私保護擔憂。其技術(shù)尚不成熟,面臨諸多隱患,以大模型為目標的攻擊會更高效、輕量級,潛在安全漏洞可能引發(fā)嚴重后果。大模型安全風險主要在無害性和誠實性方面,成因包括模型內(nèi)因和外因。數(shù)據(jù)安全的重要性與政策:數(shù)據(jù)成為關鍵生產(chǎn)要素,全球數(shù)據(jù)安全事件頻發(fā),相關政策密集推出,如十六部門印發(fā)促進數(shù)據(jù)安全產(chǎn)業(yè)發(fā)展的指導意見,十七部門聯(lián)合印發(fā)“數(shù)據(jù)要素×”三年行動計劃。工業(yè)互聯(lián)網(wǎng)安全受關注,數(shù)據(jù)安全是重要一環(huán),邊緣設備需加強防護。應對策略與技術(shù)應用:應對大模型數(shù)據(jù)安全風險要“以模制?!?,對訓練數(shù)據(jù)全生命周期嚴格監(jiān)控管理,構(gòu)建專用小模型監(jiān)測輸入輸出。大模型在數(shù)據(jù)安全領域應用潛力大,如數(shù)據(jù)分類分級等智能體提升效率和智能化水平。檢測偽造內(nèi)容可借助深度學習模型和多模態(tài)分析,采用自適應學習機制。企業(yè)私有化部署大模型面臨多種安全挑戰(zhàn),有相應防護方案。未來趨勢建議:未來大模型數(shù)據(jù)安全,企業(yè)應采取“小切口、大縱深”策略,精準定位業(yè)務場景,逐步提升數(shù)字化水平實現(xiàn)全面AI化。大模型行業(yè)人才需求人才緊缺現(xiàn)狀:從脈脈高聘人才智庫數(shù)據(jù)來看,2024年上半年,大模型算法人才最緊缺,大模型算法供需比僅為0.17,相當于6個崗位爭奪1個人才。大模型技術(shù)專家人才供需比僅為0.25,相當于4崗爭1人。緊缺人才類型:基礎大模型技術(shù)人才:算法工程師是AI核心,需掌握數(shù)學、統(tǒng)計學、機器學習知識,熟練使用Python和TensorFlow等工具,跟進技術(shù)進展。復合型人才:既懂大模型技術(shù)又理解應用場景;了解底層算力系統(tǒng)及芯片側(cè)設計,還能將軟件應用到具體行業(yè);如多功能復合型選手MLE,需掌握多領域知識技能,可優(yōu)化模型性能等。計算機視覺人才:CV工程師要掌握圖像處理理論算法、熟悉深度學習模型在計算機視覺中的應用、精通相關工具框架,并能將技術(shù)應用于實際項目。硬件工程師:具備扎實基礎知識,了解AI領域需求挑戰(zhàn),如優(yōu)化硬件加速神經(jīng)網(wǎng)絡訓練和推理。人才培養(yǎng)方向:走產(chǎn)教研融合思路,企業(yè)為教育研究機構(gòu)提供實驗,助力人才培養(yǎng)感知產(chǎn)業(yè)迭代。高校與企業(yè)合作培養(yǎng)復合型人才,結(jié)合實際案例培訓,讓行業(yè)從業(yè)者掌握AI技術(shù),建立系統(tǒng)人才培養(yǎng)體系。大模型行業(yè)企業(yè)布局物流行業(yè):菜鳥網(wǎng)絡2023年6月發(fā)布“天機π”,已在多行業(yè)應用并提供定制化服務;順豐科技今年8月推出“豐知”,9月發(fā)布“豐語”,在多個業(yè)務場景落地應用,運行效率和預測準確率等有提升;京東物流2023年7月發(fā)布“京東物流超腦”。家電及機器人領域:許多制造企業(yè)布局人形機器人,ABB推進100多個AI項目,埃斯頓發(fā)布人形機器人新品;美的聚焦核心零部件領域。工業(yè)領域:工業(yè)大模型應用從實驗向小規(guī)模商業(yè)應用邁進,9.6%的企業(yè)已應用,13.3%的企業(yè)在規(guī)劃探討,75%的企業(yè)觀望。某鋼鐵集團的模型提高了生產(chǎn)效率。地區(qū)產(chǎn)業(yè)布局:青島重點發(fā)展海洋領域大模型等細分賽道;市南區(qū)培育“算力+大數(shù)據(jù)+垂直領域模型+應用”產(chǎn)業(yè)生態(tài),擁有10余家垂域模型企業(yè)。頭部企業(yè):字節(jié)跳動有大模型研究長期規(guī)劃;騰訊云推出混元大模型及“混元Turbo”,整合AI基礎設施,發(fā)布RAG解決方案;華為云持續(xù)深化行業(yè)應用。整體市場:AI大模型應用落地受關注,預計未來五年市場增長,空間超千億,但要防范技術(shù)風險和倫理問題。阿里在智能零售、智慧醫(yī)療、跨境物流等領域深度布局大模型。大模型行業(yè)算網(wǎng)協(xié)同散熱技術(shù)變革:隨著AI發(fā)展,算力需求提升,芯片和服務器功率升級,風冷散熱能力受限。預測三年后液冷和風冷將平分天下,三大運營商提出2025年50%以上數(shù)據(jù)中心項目應用液冷技術(shù),將推動液冷行業(yè)發(fā)展。算力需求變化:AI技術(shù)迭代,大模型對算力一體化需求大幅提升,需要多算力中心高效配合調(diào)度。應用端有變化,智算算力對時延和計算密度要求提升,云邊一體推理方式有機遇,異構(gòu)計算待解決互聯(lián)問題,行業(yè)處于快速增長期。企業(yè)與地區(qū)實踐:不同企業(yè)在全國一體化算力網(wǎng)建設中承擔不同角色;北京規(guī)劃建設超大規(guī)模智算集群,到2025年智算供給規(guī)模達45EFLOPS,2025-2027年優(yōu)化布局,2027年力爭自主可控算力滿足大模型訓練需求。大模型應用拓展:大模型融入云平臺推動信息化走向數(shù)智化,基礎大模型與垂直行業(yè)企業(yè)合作開發(fā)行業(yè)大模型。算網(wǎng)與AI大模型應用推動產(chǎn)業(yè)變革,其應用場景擴展至智能醫(yī)療等多領域。技術(shù)驗證與設施建設:中國聯(lián)通完成“AI大模型300公里跨域分布式協(xié)同訓練”技術(shù)驗證,為訓練模式提供新方案;全球首個光電融合確定性新型算網(wǎng)基礎設施開通,實現(xiàn)數(shù)據(jù)遠距離傳輸和分布式協(xié)同訓練,助力企業(yè)緩解“算力荒”。大模型行業(yè)技術(shù)創(chuàng)新路徑行業(yè)應用定制化:基礎模型與行業(yè)應用深度融合是實現(xiàn)價值關鍵。在制造業(yè)、醫(yī)療健康、金融服務等領域,通過了解行業(yè)痛點、業(yè)務流程和技術(shù)限制,進行定制化開發(fā),可提升模型技術(shù)價值和行業(yè)效率。開源模型:開源模型是技術(shù)進步與知識共享的重要驅(qū)動力,2023年超六成基礎模型開源。它降低技術(shù)門檻,激發(fā)創(chuàng)新思維,加速技術(shù)教育和普及。企業(yè)可通過開源建立品牌影響力,通過增值服務實現(xiàn)商業(yè)價值。技術(shù)調(diào)優(yōu)與應用適配:技術(shù)調(diào)優(yōu)涉及模型參數(shù)調(diào)整和訓練策略優(yōu)化,針對不同場景微調(diào)可提高模型性能。將基礎大模型融入業(yè)務流程也很重要,是應用于實際場景的關鍵。聯(lián)邦學習:作為先進分布式機器學習范式,允許參與方在不共享原始數(shù)據(jù)下協(xié)作訓練模型,解決大模型應用落地難題,保護數(shù)據(jù)隱私,促進AI技術(shù)公平性。新架構(gòu)探索:如RockAI的非Transformer架構(gòu)大模型,在能耗和成本控制上表現(xiàn)優(yōu)異,且實現(xiàn)多模態(tài)能力,增強在多種終端設備的適應性。多樣化創(chuàng)新路徑:包括大模型即服務(MaaS)模塊化創(chuàng)新、從基礎大模型到行業(yè)大模型轉(zhuǎn)變、基于大模型的實時優(yōu)化小程序、大模型與物理實體結(jié)合構(gòu)建具身智能等路徑。大模型行業(yè)生態(tài)系統(tǒng)構(gòu)建垂直行業(yè)大模型與生態(tài)構(gòu)建:在大模型領域,垂直行業(yè)大模型針對金融、醫(yī)療等特定領域深度優(yōu)化,構(gòu)建生態(tài)體系是大模型企業(yè)深化行業(yè)滲透、實現(xiàn)商業(yè)化閉環(huán)的關鍵。如昆侖萬維與中國移動咪咕音樂合作,基于“天工SkyMusic”打造“AI一語成歌”平臺,推進商業(yè)化落地?!吧鷳B(tài)伙伴”助力大模型應用,大模型企業(yè)借此觸達更多客戶,擴大份額,降低成本。行業(yè)會議推動生態(tài)發(fā)展:2024中關村論壇年會配套活動——大模型生態(tài)構(gòu)建與應用發(fā)展大會舉行,眾多創(chuàng)新主體參會,專家做主旨報告,圍繞相關主題交流建言,旨在打造協(xié)同創(chuàng)新體系。北京大模型創(chuàng)新主體多,企業(yè)占比高。地方布局與產(chǎn)業(yè)創(chuàng)新:深圳積極布局人工智能產(chǎn)業(yè),邁瑞與騰訊聯(lián)合發(fā)布“啟元”重癥大模型。2024年深圳扶持政策下,大模型企業(yè)增多,形成“雁陣式”梯隊,產(chǎn)業(yè)生態(tài)完善、規(guī)模增長。企業(yè)搶抓大模型機遇,華為、騰訊等發(fā)布多個大模型。生態(tài)系統(tǒng)構(gòu)建策略與評價:探討大模型企業(yè)生態(tài)系統(tǒng)構(gòu)建策略,涉及戰(zhàn)略規(guī)劃、能力建設等方面。同時探索大模型產(chǎn)業(yè)創(chuàng)新生態(tài)系統(tǒng)競爭力評價體系與提升機制,涵蓋產(chǎn)業(yè)鏈自主可控等方面指標,大模型競爭力呈動態(tài)演化。行業(yè)思考與機遇風險:業(yè)界認為通用大模型有迭代趨同風險,金融行業(yè)多應用垂類模型。中小企業(yè)可選擇通用模型或結(jié)合業(yè)務自主研發(fā)。此外,大模型并非萬能,存在規(guī)劃任務局限、能耗大等問題。大模型行業(yè)技術(shù)應用邊界技術(shù)進展:具身智能和大模型進化有顯著突破,大模型可操作物理設備、感知環(huán)境變化調(diào)整策略實現(xiàn)自我進化。應用前景:自然語言處理:能生成高質(zhì)量文本,用于機器翻譯、聊天機器人等眾多場景,如智能客服實現(xiàn)智能交互與精準推薦。傳媒領域:與AI結(jié)合變革內(nèi)容創(chuàng)作,用于視頻配音等業(yè)務,還能提供個性化內(nèi)容推薦。計算機視覺:在圖像識別等任務中表現(xiàn)出色,助力醫(yī)療診斷、安全監(jiān)控等行業(yè)。其他行業(yè):智能制造領域提高生產(chǎn)效率;智能交通方面提升管理和駕駛安全效率;還在金融、農(nóng)業(yè)、教育等領域發(fā)揮作用。面臨挑戰(zhàn)與解決方案:訓練成本高,簡單任務有過度擬合等風險??萍脊緶p少基礎大模型投入,轉(zhuǎn)向?qū)嶋H應用和商業(yè)化,加快定制AI解決方案,利用便宜AI芯片推動創(chuàng)新,建立數(shù)據(jù)交易平臺、完善安全治理體系。行業(yè)動態(tài):2025年將實施“人工智能+制造”行動;大模型開源成主流;國產(chǎn)頭部通用大模型在開發(fā)原生應用上取得進步,部分平臺建立AI原生應用商店;百度智能體技術(shù)拓展大模型能力邊界。各行業(yè)應用價值:互聯(lián)網(wǎng)科技:助力數(shù)字化轉(zhuǎn)型,在核心業(yè)務場景發(fā)揮作用。電商行業(yè):優(yōu)化客服、搜索等,提升服務與運營效率。線下零售:通過數(shù)據(jù)分析等實現(xiàn)智能化升級。教育行業(yè):生成教學內(nèi)容,提高教學質(zhì)量與個性化程度。法律行業(yè):自動化處理法律數(shù)據(jù),提升服務效率與專業(yè)性。房地產(chǎn)行業(yè):助力智能化、綠色化轉(zhuǎn)型。旅游行業(yè):可通過多種方式賦能行業(yè)發(fā)展。大模型行業(yè)數(shù)據(jù)治理策略通用管理策略:數(shù)據(jù)治理框架:明確數(shù)據(jù)所有權(quán)、責任、質(zhì)量標準及監(jiān)控機制,確保數(shù)據(jù)安全、完整、可靠和合規(guī)。質(zhì)量管理:確定質(zhì)量標準,建立評估、改進和監(jiān)控流程,借助工具提升效率與準確性。安全隱私保護:實施嚴格訪問控制與權(quán)限管理,對敏感數(shù)據(jù)脫敏、加密,采用隱私保護技術(shù)并開展培訓。備份恢復:制定備份頻率、存儲位置和災難恢復計劃,保障數(shù)據(jù)可靠性與可用性。共享策略:明確共享范圍、方式和協(xié)議,保證數(shù)據(jù)安全合規(guī)。技術(shù)選型部署:選擇合適平臺技術(shù),如主數(shù)據(jù)管理(MDM)平臺,并與現(xiàn)有業(yè)務系統(tǒng)集成。集成共享:支持數(shù)據(jù)分類和標準化,實現(xiàn)不同來源數(shù)據(jù)的識別與整合。人才培養(yǎng)管理:建立數(shù)據(jù)管理團隊,負責數(shù)據(jù)策略制定、執(zhí)行與監(jiān)控。數(shù)據(jù)沉淀:完善數(shù)據(jù)基礎設施,建立數(shù)據(jù)湖、數(shù)據(jù)倉庫等存儲分析系統(tǒng)。數(shù)智融合:融合大數(shù)據(jù)與大模型技術(shù),形成新的IT生產(chǎn)力。數(shù)據(jù)治理策略類型:拉式策略:面向數(shù)據(jù)應用,以提升數(shù)據(jù)應用準確性為目標。特點為自上而下規(guī)劃建設,涉及多系統(tǒng)數(shù)據(jù)整合,解決數(shù)據(jù)應用場景問題。推式策略:面向數(shù)據(jù)全生命周期管理控制,是體系化策略。具有體系化、全生命周期管理、立體策略等特點。大模型與數(shù)據(jù)治理關系及挑戰(zhàn):大模型和數(shù)據(jù)治理相互依存形成閉環(huán)。面臨數(shù)據(jù)多而分散、質(zhì)量參差不齊,不同粒度數(shù)據(jù)難以融合,以及數(shù)據(jù)隱私安全、質(zhì)量一致性、偏見公平性、規(guī)模處理能力等挑戰(zhàn)。大模型在數(shù)據(jù)治理中的作用:強大處理分析能力:自動識別分類大量數(shù)據(jù),準確提取關鍵信息,提升處理效率與準確性。實現(xiàn)標準化規(guī)范化:學習行業(yè)標準優(yōu)化數(shù)據(jù)格式,確保數(shù)據(jù)一致性與可用性。保障安全隱私:在數(shù)據(jù)安全與隱私保護方面發(fā)揮優(yōu)勢。大模型行業(yè)市場競爭態(tài)勢競爭格局:全球大模型市場多元化,美國在多領域領先,中國中文大模型實力強勁,歐洲、日本等積極布局。我國大模型分互聯(lián)網(wǎng)公司、AI公司、學術(shù)及科研機構(gòu)、行業(yè)專家團隊初創(chuàng)公司四大競爭派系。2024年上半年百度、科大訊飛等企業(yè)表現(xiàn)突出,但領先地位可能改變。國內(nèi)市場發(fā)展迅猛,開源大模型崛起,應用不斷深化。競爭策略與行動:大模型市場洗牌,“價格戰(zhàn)”開打,頭部廠商為獲用戶和份額降低價格。OpenAI停止部分地區(qū)API調(diào)用服務,國內(nèi)企業(yè)推“搬家計劃”爭奪用戶。典型產(chǎn)品與企業(yè):聯(lián)想與沐曦聯(lián)合發(fā)布基于DeepSeek的一體機解決方案;京東云發(fā)布具備多種特性的DeepSeek大模型一體機。微醫(yī)醫(yī)療大模型在醫(yī)療評測中多次奪冠,實際應用亮眼。發(fā)展趨勢:算力底座升級,預訓練仍是核心驅(qū)動,強化學習是后訓練關鍵,o1模型興起。應用上基于用量模式常見,未來垂直優(yōu)化方向增多。成功要素為模型、生態(tài)和渠道能力,部分廠商向垂直場景轉(zhuǎn)型。影響因素:數(shù)據(jù)成為競爭關鍵,高質(zhì)量數(shù)據(jù)供應不足影響模型性能,多家企業(yè)推出數(shù)據(jù)服務產(chǎn)品。大模型行業(yè)技術(shù)人才培養(yǎng)方案行業(yè)背景與趨勢:在人工智能浪潮下,以大模型為標志的軟件開發(fā)領域變革巨大,其生成式能力讓開發(fā)更靈活高效,滿足軟件產(chǎn)品快速迭代需求。大模型廣泛應用于多領域,改變了軟件開發(fā)模式,對人才培養(yǎng)影響深遠,人才需求改變,需要掌握AI相關知識技能。培養(yǎng)方案舉措:華為與青軟集團合作推出“研發(fā)大模型人才培養(yǎng)解決方案”,為高校與產(chǎn)業(yè)人才需求搭橋。給高校提供實踐環(huán)境、開發(fā)工具、課程及產(chǎn)業(yè)應用項目,助高校優(yōu)化人才培養(yǎng)各方面。大模型工具核心能力應用于研發(fā)場景,提升學生AI實踐能力與競爭力。師資培訓活動:青軟集團設師資培訓專項活動,在江西南昌與南昌航空大學等聯(lián)合舉辦研討課,20多所重點高校教師參與。華為技術(shù)專家等強調(diào)AI重要性與趨勢,教師通過實際項目開發(fā)體驗大模型工具優(yōu)勢。人才能力需求:大模型行業(yè)技術(shù)人才需深厚技術(shù)底蘊,掌握多種技術(shù)并跟進動態(tài);具備強大數(shù)據(jù)處理能力,能處理各類數(shù)據(jù);有創(chuàng)新思維和問題解決能力,多角度分析解決問題;有跨領域合作與溝通能力,有效協(xié)作;有持續(xù)學習和自我提升意識,應用新知識技能并反思總結(jié)。人才現(xiàn)狀與白皮書:“百模大戰(zhàn)”使大模型人才爭奪激烈,算法人才稀缺,預計1-2年改善。中國軟件行業(yè)協(xié)會教培分會發(fā)布研究報告探討技術(shù)崗位與能力培養(yǎng)。華為聯(lián)合中國信通院發(fā)布《智算與大模型人才白皮書》,世界人工智能大會展示人才培養(yǎng)成果。大模型行業(yè)應用場景拓展方向應用行業(yè)更加廣泛:大模型的應用已從傳統(tǒng)普及領域向價值鏈高端環(huán)節(jié)延伸,在政務、金融、工業(yè)、醫(yī)療、能源等垂直行業(yè)廣泛滲透。在金融行業(yè),可輔助溝通、完成對話任務,提升服務質(zhì)量與效率;在制造與能源行業(yè),驅(qū)動業(yè)務創(chuàng)新,助力轉(zhuǎn)型升級。多地大力發(fā)展垂類大模型,如山東征集工業(yè)領域大模型解決方案,廣州打造“新一代人工智能垂類模型之都”。華為盤古大模型不斷迭代,覆蓋的行業(yè)從礦山、政務等擴展到鋼鐵、高鐵等更多領域。應用場景更為聚焦:縱向上延伸的場景更加聚焦行業(yè)內(nèi)細分任務,如傳送帶異物檢測、卷宗提審、商品銷量預測等。銀行在智能客服、業(yè)務流程優(yōu)化、智能風控等場景應用大模型,且在理財領域?qū)崿F(xiàn)本地化部署,應用由淺入深推進。技術(shù)發(fā)展帶來新機遇:隨著大模型技術(shù)深入發(fā)展,催生了AI研發(fā)和應用的新范式。模型訓練從單任務定制化建模變?yōu)榭缛蝿铡⒖缒B(tài)、跨語言的統(tǒng)一建模;人機交互方式轉(zhuǎn)變,機器更加適應人;研發(fā)模式變?yōu)閿?shù)據(jù)驅(qū)動;調(diào)度能力提升,拓寬了應用空間。例如文心一言在高頻場景下推理性能大幅提升。推動創(chuàng)業(yè)新增長點:大模型為創(chuàng)業(yè)者提供廣闊市場空間,其應用場景涵蓋自然語言處理(文本生成、機器翻譯等)、計算機視覺(圖像識別、物體檢測等)、語音識別與合成、推薦系統(tǒng)等多個領域。大模型行業(yè)技術(shù)研發(fā)投入情況科大訊飛:2024年上半年研發(fā)投入21.9億元,同比增長32.23%,大模型新增投入超6.5億。這使其預計上半年凈虧損4.6億至3.8億元,同比由盈轉(zhuǎn)虧。不過“訊飛星火大模型”持續(xù)迭代,應用廣泛,在多領域市場份額領先,APP安卓端下載量達1.4億次。未來算力新增投入增幅較小。千方科技:2024年上半年全力加大行業(yè)大模型研發(fā)投入。預計營收同比增長5%-10%,扣非凈利潤6800萬至8900萬元。在智慧交通、物聯(lián)等領域積極開展研發(fā)合作與產(chǎn)品發(fā)布。2023年AI大模型上市公司:平均研發(fā)投入達59.56億元,13家超百億元,最高640.78億元。比亞迪:成立先進技術(shù)研發(fā)中心,側(cè)重AI算法等研發(fā)。今年上半年研發(fā)投入202億元,同比增長41.64%,高于同期凈利潤近66億元。騰訊:2024年Q3研發(fā)投入179億元,同比增長近9%。新推出的“騰訊混元Turbo”大模型性能顯著提升。同花順:在業(yè)績承壓下,今年上半年研發(fā)支出5.92億元,同比增長5.12%,占營收比重42.62%,持續(xù)加大大模型等人工智能研發(fā)投入。格靈深瞳:2023年研發(fā)投入1.84億元,占營收比重70.14%,同比增長39%,未來將進一步增加在多模態(tài)大模型等方面投入。大模型行業(yè)技術(shù)標準化進程企業(yè)參與標準制定:云知聲參與三項AI大模型國家標準編寫,包括通用要求、評測指標與方法、服務能力成熟度評估,體現(xiàn)其技術(shù)實力與促進行業(yè)發(fā)展的責任。2023年推出“山海”多模態(tài)大模型,成為全球AI獨角獸。官方機構(gòu)推動:2024年12月13日,工信部成立人工智能標準化技術(shù)委員會,職責廣泛,涵蓋大模型多個關鍵領域,委員來自多方,將推動標準制定、實施與推廣,遵循“急用先行”原則,提升我國人工智能領域競爭力。產(chǎn)業(yè)聯(lián)盟與企業(yè)合作:中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟等舉行大模型工程化成果發(fā)布會,新華三集團參與并分享技術(shù)突破。中國信通院聯(lián)合新華三集團等編撰《大模型基礎設施研究報告》,推動基礎設施標準化。行業(yè)應用標準推進:信通院組織召開AIGC產(chǎn)品系列及營銷行業(yè)應用標準研討會,參編相關標準。信通院與中國通信標準化協(xié)會發(fā)布八大行業(yè)大模型標準,覆蓋多領域,設定技術(shù)能力評估指標,組織試點驗證。青島市與山東省人工智能協(xié)會發(fā)布AIGC大模型功能測試指標體系。大模型行業(yè)技術(shù)風險與應對大模型應用現(xiàn)狀:大模型發(fā)展迅速,國內(nèi)外眾多科技公司相繼推出產(chǎn)品并應用于多領域。應用主要分三類:認知應用(如AIGC產(chǎn)業(yè))、信息應用(以智能體為代表)、物理域應用。其發(fā)展推動產(chǎn)業(yè)變革,處理復雜語言任務能力接近人類水平。技術(shù)風險:數(shù)據(jù)安全與隱私風險:包括傳輸截獲、運營方窺探、大模型記憶風險,威脅用戶個人信息安全。提示注入風險:因大模型區(qū)分系統(tǒng)指令和用戶輸入有挑戰(zhàn),攻擊者可構(gòu)造提示操縱輸出,如角色扮演攻擊。生成內(nèi)容問題:數(shù)據(jù)源污染、算法缺陷等致大模型生成虛假信息,還存在意識形態(tài)、倫理道德等風險。其他風險:大模型運作難以實現(xiàn)“可解釋性”,在核心業(yè)務場景應用受限,且面臨對抗性攻擊、數(shù)據(jù)篡改等風險。應對策略:構(gòu)建完善安全保障機制,從政策法規(guī)、技術(shù)能力、標準規(guī)范等多方面治理,如實施API管理策略預防安全威脅,以適應性治理思路應對治理滯后問題。大模型行業(yè)綜合分析報告一、大模型行業(yè)概念定義大模型:大規(guī)模語言模型簡稱,參數(shù)規(guī)模龐大(幾百萬到數(shù)十億個)、復雜程度高的機器學習模型,需大量數(shù)據(jù)和計算能力訓練,旨在提升表示和性能,捕捉數(shù)據(jù)模式規(guī)律。類型:按應用場景和功能,分自然語言處理、計算機視覺、語音識別等;按輸入數(shù)據(jù)類型,有語言、視覺和多模態(tài)大模型;按應用領域,分通用、行業(yè)和垂直大模型。行業(yè)大模型:針對特定行業(yè)深度定制優(yōu)化,基于通用大模型再訓練,具專業(yè)化、高性能、可擴展、安全等特點。生成式AI大模型:通常分基礎(基座)和下游任務微調(diào)優(yōu)化大模型,通過自監(jiān)督學習對多模態(tài)序列訓練數(shù)據(jù)進行語言建模、理解與生成。大模型行業(yè):基于大規(guī)模參數(shù)和復雜結(jié)構(gòu)機器學習模型進行技術(shù)研發(fā)與應用推廣,涵蓋自然語言處理等子領域,產(chǎn)業(yè)鏈包括數(shù)據(jù)采集與處理、模型研發(fā)與訓練、應用開發(fā)與推廣等環(huán)節(jié)。二、大模型行業(yè)發(fā)展歷程早期奠基(2006-2017年):2006年深度學習受關注,GeoffreyHinton團隊成果奠基;2012年AlexNet推動深度學習在圖像識別發(fā)展;2013-2014年詞嵌入模型推動自然語言處理;2017年Transformer架構(gòu)解決長距離依賴局限。預訓練模型崛起(2018-2020年):2018年谷歌BERT推動雙向預訓練,OpenAI發(fā)布GPT-1開啟生成式預訓練;2019年GPT-2展示零樣本學習;2020年GPT-3成規(guī)模擴展轉(zhuǎn)折點,谷歌T5證明大模型靈活性和泛化能力。訓練后對齊技術(shù)發(fā)展(2021-2022年):發(fā)展出監(jiān)督微調(diào)(SFT)和人類反饋強化學習(RLHF)技術(shù),2022年ChatGPT基于GPT-3.5微調(diào)引入RLHF。多模態(tài)與推理能力突破(2023-2025年):2023年GPT-4V結(jié)合語言和視覺;2024年GPT-4o整合音頻和視頻,OpenAI-o1系列引入思維鏈提升推理;2024-2025年DeepSeek系列模型降低成本、優(yōu)化性能。國內(nèi)發(fā)展:2023年國產(chǎn)AI元年,上半年大模型融資超20起,發(fā)布超100個;2024年7月近200個大模型完成備案上線;2025年創(chuàng)新企業(yè)減少,競爭格局漸明。三、大模型行業(yè)產(chǎn)業(yè)鏈結(jié)構(gòu)上游:硬件(芯片、服務器、通信網(wǎng)絡等)和軟件(云計算、數(shù)據(jù)庫、中間件等),是大模型訓練和推理基礎支撐。中游:大模型行業(yè)本身,算力芯片是速度核心,推動芯片技術(shù)創(chuàng)新。下游:應用于游戲、辦公、傳媒影視、醫(yī)療、金融、電商、工業(yè)等眾多行業(yè)。市場規(guī)模與趨勢:預計2028年全球達1095億美元,中國達1179億元。中國市場規(guī)模從2020年15億元增長至2022年70億元,2023年達147億元,未來有望在更多領域突破創(chuàng)新并保持快速增長。四、大模型行業(yè)市場規(guī)模全球市場:2023年達210億美元,同比增94.4%;預計2028年達1095億美元,2023-2028年復合增長率約47.12%。中國市場:2023年為147億元,不同機構(gòu)預測2024-2030年規(guī)模差異較大,如2024年預計達216億元等,2028年預計達1179億元,2023-2028年復合增長率約60.11%。區(qū)域市場與競爭格局:全球基礎大模型發(fā)布量美國最多,2023年占比69%,其次中國和英國。全球美企領先,中國頭部企業(yè)有百度、阿里等。競爭激烈,頭部靠技術(shù)算力,初創(chuàng)在細分領域,面臨算法優(yōu)化等挑戰(zhàn)。應用滲透:商業(yè)化時間短,已滲透多行業(yè),2023年金融、政府等領域滲透率超50%,電信等領域應用成熟度較高。五、大模型行業(yè)競爭格局全球競爭格局:多元化競爭,美國技術(shù)領先,中國中文大模型實力強,歐洲、日本等積極布局。我國分互聯(lián)網(wǎng)公司等四大競爭派系,2024年上半年百度、科大訊飛中標項目突出。國內(nèi)市場:發(fā)展迅猛,巨頭推產(chǎn)品優(yōu)化,開源大模型崛起,如Qwen2-72B。國內(nèi)推出約305個大模型,約140個完成備案。頭部廠商打“價格戰(zhàn)”,拓展應用場景但擠壓初創(chuàng)企業(yè)空間。競爭趨勢與格局變化:技術(shù)演進平緩,格局收斂。中國通用基礎大模型競爭者減至20余家,由互聯(lián)網(wǎng)企業(yè)等主導。創(chuàng)業(yè)公司形成“六小虎”格局,傳統(tǒng)互聯(lián)網(wǎng)巨頭加大投入。海外格局收斂到頭部5家超級公司,腰部和創(chuàng)業(yè)公司生存空間受擠壓。細分領域格局:政務大模型華為、浪潮領先;央國企大模型科大訊飛份額居首,各廠商差異化競爭。六、大模型行業(yè)商業(yè)模式商業(yè)模式特點:高度自動化、智能化、可擴展、安全、可定制,應用于多領域。收費模式:API調(diào)用按tokens量收費,每1000tokens收費0.008元-0.87元不等;訂閱計費,按月或年收取,一定額度內(nèi)連續(xù)訂閱有優(yōu)惠,超出可能限流或另計費。主流應用還按定制化收費。盈利探索與挑戰(zhàn):盈利模式還有合規(guī)增值服務、與行業(yè)龍頭定制解決方案。挑戰(zhàn)包括訓練成本高、智能水平待提升、安全隱私需重視,國內(nèi)toC市場競爭激烈、付費習慣難養(yǎng)成,toB領域數(shù)據(jù)‘喂料’等難。行業(yè)發(fā)展趨勢:開源共享推動發(fā)展,競爭激烈呈百芯百模態(tài)勢,細分云側(cè)和端側(cè)大模型,云側(cè)規(guī)模大,未來商業(yè)模式將演變。七、大模型行業(yè)技術(shù)發(fā)展發(fā)展歷程:起源于機器學習和人工智能早期,21世紀第二個十年嶄露頭角,2006年深度學習奠基,后AlexNet、詞嵌入模型、BERT等推動發(fā)展。本質(zhì)與潛力:參數(shù)眾多,通過大量數(shù)據(jù)學習捕捉復雜特征,學習和泛化能力強,可執(zhí)行多種復雜任務。技術(shù)細節(jié):大語言模型在tokenizer等選擇運用有差異;分布式訓練技術(shù)提升效率;參數(shù)高效微調(diào)技術(shù)實現(xiàn)高效定制。2024年發(fā)展趨勢:從技術(shù)競賽轉(zhuǎn)向商業(yè)應用,市場規(guī)模增長,技術(shù)迭代拓展應用,多模態(tài)整合能力提升,技術(shù)路線多元化,小模型涌現(xiàn),垂直領域深耕,降價潮與價格戰(zhàn),反哺基礎科學研究,場景滲透率提升,開源化與生態(tài)構(gòu)建加速。年度突破技術(shù)和進展:包括大模型推理技術(shù)等十大突破,為各領域發(fā)展帶來新方向。現(xiàn)存問題與挑戰(zhàn):國內(nèi)大模型在數(shù)據(jù)、算力、算法層面存在問題,AGI發(fā)展也面臨挑戰(zhàn)。未來展望:技術(shù)深化融合,向垂直領域拓展,應用范圍擴大,推動產(chǎn)業(yè)融合打造智能生態(tài),注重人才培養(yǎng)和安全可控性研究。八、大模型行業(yè)應用領域應用覆蓋領域與行業(yè):主要聚焦科學智能等五個領域,覆蓋教育等六個行業(yè),分落地探索等四個階段。如螞蟻集團、中國聯(lián)通、浪潮信息大模型在不同領域處于不同階段。主要應用領域細分:自然語言處理用于文本生成等;計算機視覺用于圖像分類等;自動駕駛用于物體檢測等;金融用于市場預測等;醫(yī)療輔助影像診斷等;教育提供個性化學習等。行業(yè)通用落地模式:大模型+專用知識庫,與領域知識庫結(jié)合適配行業(yè)場景;大模型微服務化部署,封裝為微服務,具備彈性伸縮等機制。工業(yè)應用場景:是發(fā)展新質(zhì)生產(chǎn)力的重要引擎,在光伏、汽車、家電制造等行業(yè)有應用。應用趨勢:橫向拓展行業(yè)廣泛,縱向延伸場景聚焦,朝垂直化、專業(yè)化發(fā)展,行業(yè)大模型應用場景快慢呈“微笑曲線”。九、大模型行業(yè)政策環(huán)境國家層面政策支持:《政府工作報告》提出“人工智能+”行動,《信息化標準建設行動計劃(2024—2027年)》提出構(gòu)建AI大模型標準化體系。地方政府積極響應:北京、上海等地在產(chǎn)業(yè)政策等方面多措并舉,東湖高新區(qū)對大模型企業(yè)給予多項補貼。關注應用問題與監(jiān)管:關注算法偏見等問題,加強監(jiān)管確保AI技術(shù)公正性等。特定行業(yè)政策推動融合:文化和旅游部推動人工智能與旅游融合,多部門發(fā)文支持政務服務大模型開發(fā)應用。十、大模型行業(yè)面臨挑戰(zhàn)技術(shù)層面:與國際先進有差距,算力、數(shù)據(jù)等資源緊缺,新技術(shù)探索受制約,模型存在安全風險、推理薄弱、結(jié)果偏差等問題。產(chǎn)業(yè)層面:缺乏龍頭產(chǎn)品,競爭低端化,核心模型依賴國外,堅持基礎模型迭代企業(yè)減少。應用層面:不好用、不便用、不敢用,應用場景同質(zhì)化,行業(yè)落地困難,面臨行業(yè)理解、數(shù)據(jù)隱私等阻礙。其他挑戰(zhàn):能源消耗與算力成本攀升,數(shù)據(jù)隱私安全需保障,模型可解釋性與可信度低,技術(shù)與應用存在鴻溝,存在安全漏洞。十一、大模型行業(yè)發(fā)展趨勢技術(shù)發(fā)展:模型規(guī)模擴大追求效率平衡,小型化等技術(shù)興起;多模態(tài)融合,向具身智能發(fā)展;自主性與推理能力提升;自監(jiān)督學習等技術(shù)發(fā)展。行業(yè)應用:垂直領域?qū)I(yè)化,定制化模型涌現(xiàn),企業(yè)私有化部署受關注;成為生產(chǎn)力工具,形成人機協(xié)作模式。市場與生態(tài):市場規(guī)模增長,2023-2024-2028年中國行業(yè)大模型市場規(guī)模分別為105億、165億、624億元;開源模型崛起,云廠商競爭激烈,技術(shù)競賽轉(zhuǎn)向商業(yè)應用,出現(xiàn)降價潮與價格戰(zhàn),應用場景滲透率提升,基礎AI通用大模型開源化加速。面臨挑戰(zhàn):數(shù)據(jù)存在“數(shù)據(jù)孤島”等問題,算力運營成本高,算法不可解釋及創(chuàng)新優(yōu)化困難,有偏見與安全風險,面臨合規(guī)要求,數(shù)據(jù)版權(quán)歸屬不明確。未來關鍵突破點:突破上下文窗口限制,實現(xiàn)實時與終身學習,降低成本實現(xiàn)普惠化。十二、大模型行業(yè)數(shù)據(jù)安全大模型發(fā)展現(xiàn)狀與風險:2023年“百模大戰(zhàn)”,2024年應用場景之年,大模型帶來數(shù)據(jù)安全和隱私擔憂,技術(shù)不成熟,面臨諸多隱患,安全風險主要在無害性和誠實性方面。數(shù)據(jù)安全的重要性與政策:數(shù)據(jù)成為關鍵生產(chǎn)要素,全球數(shù)據(jù)安全事件頻發(fā),相關政策密集推出,工業(yè)互聯(lián)網(wǎng)安全受關注。應對策略與技術(shù)應用:“以模制?!保O(jiān)控管理訓練數(shù)據(jù),構(gòu)建專用小模型監(jiān)測輸入輸出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論