![DeepSeeK開啟AI算法變革元年2025-甲子光年_第1頁](http://file4.renrendoc.com/view14/M00/16/12/wKhkGWehzAWAAl3vAACd9r2H6fU046.jpg)
![DeepSeeK開啟AI算法變革元年2025-甲子光年_第2頁](http://file4.renrendoc.com/view14/M00/16/12/wKhkGWehzAWAAl3vAACd9r2H6fU0462.jpg)
![DeepSeeK開啟AI算法變革元年2025-甲子光年_第3頁](http://file4.renrendoc.com/view14/M00/16/12/wKhkGWehzAWAAl3vAACd9r2H6fU0463.jpg)
![DeepSeeK開啟AI算法變革元年2025-甲子光年_第4頁](http://file4.renrendoc.com/view14/M00/16/12/wKhkGWehzAWAAl3vAACd9r2H6fU0464.jpg)
![DeepSeeK開啟AI算法變革元年2025-甲子光年_第5頁](http://file4.renrendoc.com/view14/M00/16/12/wKhkGWehzAWAAl3vAACd9r2H6fU0465.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
出品機(jī)構(gòu):甲子光年智庫研究團(tuán)隊(duì):宋濤、劉瑤、翟惠宇、何偉康、小麥發(fā)布時間:2025.02經(jīng)過近七十年的發(fā)展,人工智能自出現(xiàn)至今其核心能力一直在提升,到如今已經(jīng)成為覆蓋感知、認(rèn)知、決策、學(xué)習(xí)、執(zhí)行、社會協(xié)作能力,未來發(fā)展到現(xiàn)在,人工智能的技術(shù)能力已經(jīng)到了一個拐點(diǎn),即從技術(shù)能力驅(qū)動從舊范式抵達(dá)新范式。如今人工智能的發(fā)展已經(jīng)處于從第三階段向第四技術(shù)能力圖1:技術(shù)革命的周期性示意圖技術(shù)能力第五階段第一階段第二階段第三階段第四階段第五階段新產(chǎn)品、新產(chǎn)業(yè)的爆炸性增長和迅速創(chuàng)新全部集群(新產(chǎn)業(yè)、技術(shù)體系和基礎(chǔ)設(shè)施)新產(chǎn)品、新產(chǎn)業(yè)的爆炸性增長和迅速創(chuàng)新創(chuàng)新和市場潛力的全面擴(kuò)張產(chǎn)業(yè)范式的顛覆創(chuàng)新和市場潛力的全面擴(kuò)張產(chǎn)業(yè)范式的顛覆式創(chuàng)新擴(kuò)張新產(chǎn)品和新產(chǎn)業(yè)接近成熟,已經(jīng)構(gòu)建獨(dú)立的技術(shù)體系處位置產(chǎn)業(yè)發(fā)展醞釀期構(gòu)造范式成熟期成長期產(chǎn)業(yè)化醞釀期構(gòu)造范式成熟期技術(shù)新產(chǎn)品、新產(chǎn)業(yè)、新技術(shù)體系接連出現(xiàn)并持續(xù)更新技術(shù)大爆炸用得上新技術(shù)用得好新技術(shù)中國式新技術(shù)看得到新技術(shù)看得懂新技術(shù)用得上新技術(shù)用得好新技術(shù)中國式新技術(shù) 數(shù)據(jù)來源 數(shù)據(jù)來源2DeepSeek通過優(yōu)化算法架構(gòu),顯著提升了算力利用效率,打破了算力至上的傳統(tǒng)認(rèn)知o1GPT-4oGeminiUltraGPT-4o1GPT-4oNLG530BPaLM(540B)Claude2Megatron-TuringLlama2-70BBaichuan2-13BBaichuanNLG530BPaLM(540B)Claude2Megatron-TuringLlama2-70BBaichuan2-13BBaichuan2-7BJliGLM-130BBERT-LargeTransformerDeepSeek-R1-671BBERT-LargeTransformerAlexNetDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Qwen-1.5BAlexNet年人工智能指數(shù)報(bào)告》數(shù)據(jù)來源:3年人工智能指數(shù)報(bào)告》數(shù)據(jù)來源:3DeepSeek通過重新設(shè)計(jì)AIInfra,驗(yàn)證“性價比”訓(xùn)練路徑DeepSeek-R1的效果示意:更少的DeepSeek-R1的效果示意:更少的GPU(或其他AI芯片)帶來同樣的效果新設(shè)計(jì)訓(xùn)練流程、以少量SFT數(shù)據(jù)+新設(shè)計(jì)訓(xùn)練流程、以少量SFT數(shù)據(jù)+多輪強(qiáng)化學(xué)習(xí)的辦法,在提高了模型準(zhǔn)確性的同時,也顯著降低了內(nèi)存占練的方法,而不是說只能通過低成本反而通過優(yōu)化,DeepSeek-R1可能每增加一張GPU,模型推理能力可模型效果高穩(wěn)定提升,無需依賴復(fù)雜的外部監(jiān)督機(jī)制。這一特性直接驗(yàn)證了“算力即性能”的ScalingLaw,為AI芯片市低少多模型效果高穩(wěn)定提升,無需依賴復(fù)雜的外部監(jiān)督機(jī)制。這一特性直接驗(yàn)證了“算力即性能”的ScalingLaw,為AI芯片市低少多備注:該圖僅為示意,不代表實(shí)際情況下具體數(shù)量與效果的對比*該圖為無編碼基礎(chǔ)分析師通過DeepSeekR1協(xié)作利用python編碼生成年4年4 2025年發(fā)布的大模型,都具有低參數(shù)量的特征,為本地化部署到AI終端運(yùn)行提供了可能高參數(shù)量4萬億4560MiniMax-VL-01,4560新版BERT新版BERT4810億Qwen-32B,320Qwen-32B,3202025年1月2025年1月2025年1月2025年1月2025年1月2025年1月2018年6月2018年10月2019年2月2019年7月2020年6月2021年12月2023年2024年2025年1月2025年1月2025年1月2025年1月2025年1月2025年1月2025年52025年5AI技術(shù)創(chuàng)新一直在圍繞核心三要素在動態(tài)循環(huán),2025年再次進(jìn)入算法創(chuàng)新階段AI技術(shù)成熟度AI技術(shù)成熟度核心三要素的創(chuàng)新循環(huán)?算力、數(shù)據(jù)、算法的三角創(chuàng)新體系,在動態(tài)循環(huán)之中再次進(jìn)入算法創(chuàng)新階段。?數(shù)據(jù)據(jù)標(biāo)注等成為高質(zhì)量數(shù)據(jù)集建設(shè)的熱點(diǎn)方數(shù)據(jù)卡時代,算力運(yùn)營商等產(chǎn)業(yè)新物種誕生2025年2025年 R1-zero完全基于RL(強(qiáng)化學(xué)習(xí))進(jìn)行訓(xùn)練,以第三階段為主,通過自我學(xué)習(xí)來提高性能圖1:傳統(tǒng)AI基礎(chǔ)大模型的訓(xùn)練過程三個階段都注重圖2:DeepSeek聚焦的訓(xùn)練過程核心在第三階段第三階段強(qiáng)化學(xué)習(xí)優(yōu)化模型第二階段訓(xùn)練獎勵模型(RM)第一階段訓(xùn)練監(jiān)督策略模型?數(shù)據(jù)集中隨機(jī)抽取問題?第三階段強(qiáng)化學(xué)習(xí)優(yōu)化模型第二階段訓(xùn)練獎勵模型(RM)第一階段訓(xùn)練監(jiān)督策略模型?數(shù)據(jù)集中隨機(jī)抽取問題?使用PPO模型生成回答?基于質(zhì)量分?jǐn)?shù)優(yōu)化PPO模型參數(shù)?循環(huán)迭代出新模型?數(shù)據(jù)集中隨機(jī)抽取問題?生成多個不同的回答?標(biāo)注答案排名順序?排序結(jié)果數(shù)據(jù)來訓(xùn)練獎勵模型?數(shù)據(jù)集中隨機(jī)抽取問題?生成多個不同的回答?用標(biāo)注好的數(shù)據(jù)來微調(diào)模型采用PPO強(qiáng)化學(xué)習(xí)算法針對獎勵模型來優(yōu)化策略收集演示數(shù)據(jù)并訓(xùn)練有監(jiān)督策略收集比較數(shù)據(jù)并訓(xùn)練獎勵模型核心創(chuàng)新點(diǎn)第三階段強(qiáng)化學(xué)習(xí)第二階段訓(xùn)練獎勵模型(第一訓(xùn)練監(jiān)督策略模型核心創(chuàng)新點(diǎn)第三階段強(qiáng)化學(xué)習(xí)第二階段訓(xùn)練獎勵模型(第一訓(xùn)練監(jiān)督策略模型采用GRPO算法,通過對比分析方式針對獎勵模型來進(jìn)行優(yōu)化訓(xùn)練模型收集比較數(shù)據(jù)并訓(xùn)練獎勵模型RM)階段收集演示數(shù)據(jù)并訓(xùn)練有監(jiān)督策略階段?GRPO算法對比分析,提升訓(xùn)練效率?"冷啟動數(shù)據(jù)"建立基礎(chǔ)的推理框架?推理導(dǎo)向的強(qiáng)化學(xué)習(xí)?利用訓(xùn)練得到的檢查點(diǎn)來收集新的監(jiān)督訓(xùn)練數(shù)據(jù)?全場景強(qiáng)化學(xué)習(xí)?蒸餾賦予小型模型推理能力2025年2025年DeepSeek-R1的訓(xùn)練流程:通過RL強(qiáng)化LLM的推理能力R1-zero完全基于RL(強(qiáng)化學(xué)習(xí))進(jìn)行訓(xùn)練,未使用任何監(jiān)督訓(xùn)練或人類反饋,能夠通過自我學(xué)習(xí)來提高性能。R1是在R1-zero的基礎(chǔ)上,通過少量冷啟動數(shù)據(jù)進(jìn)行微調(diào),提高了輸出質(zhì)量和可讀性。 除了基于Transformer架構(gòu)的算法創(chuàng)新之外,非Transformer架構(gòu)的新算法也成為近期新出現(xiàn)的重點(diǎn)發(fā)展方向。一種新架構(gòu)模型LFM(LiquidFoundationModel超越了同等規(guī)模的Transformer模型如Llama3.2。它用的是一種液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN其計(jì)算單元植根于動態(tài)系統(tǒng)理論、信號處理和數(shù)值線性代數(shù)。其小巧便攜的特性使得它能夠直接部署在手機(jī)上進(jìn)行文檔和書籍等分析。因此,甲子光年智庫判斷,2025年將是算法變革的元年。未來最適合人類使用的大模型,可能會是非Transformer架構(gòu)的算法模型。圖:LFM架構(gòu)模型性能超越同等規(guī)模的Tran4040(A12B)2025年;2025年;AI終端推動端側(cè)模型和端側(cè)算力需求增加,小參數(shù)量模型需求爆發(fā)推動算法變革到來2024年AI終端已經(jīng)開始爆發(fā)AI處理重心正向端側(cè)轉(zhuǎn)移,催生小語言模型的需求爆發(fā)2024年AI終端已經(jīng)開始爆發(fā)AIPCAI手機(jī)AIPC占比AI手機(jī)占比74.6%80.3%74.6%54.7%XR等便攜戴設(shè)備28.0%16.0%471.238.0%XR等便攜戴設(shè)備28.0%16.0%471.25.0%338.8190.457.02131388.1%終端側(cè)5.0%338.8190.457.02131388.1%終端側(cè)邊緣云AI手機(jī)智能汽車人形機(jī)器人3人形機(jī)器人202320242025E2026E202320242025年2025年2024城頭變幻大王旗,2025年AI超級應(yīng)用開始出現(xiàn),DAU達(dá)2161萬為2024年的AI超級應(yīng)用的頭把交椅處于不斷變動之中。甲子光年智庫統(tǒng)計(jì)匯總了近13個月中訪問量最高的產(chǎn)品訪問量數(shù)據(jù),發(fā)現(xiàn)第一名的AI產(chǎn)品是處于不斷變動狀態(tài)的,可以用一句話來形容。那就是城頭變幻大王旗。基本上每個解讀的頭把交椅都會發(fā)生變化。2025年的開年,DeepSeek用短短二十天的時間就實(shí)現(xiàn)了DAU2161萬的數(shù)據(jù),超過了ChatGPT發(fā)布之處的數(shù)據(jù)表現(xiàn),具有成為AI超級應(yīng)用的潛力。圖:近一年中各月AI產(chǎn)品訪問量最高的產(chǎn)25002000150010005000-500TOP1訪問量(M)DeepSeek2161萬DAU百度搜索AI360AI搜索豆包文心一言文心一言文心一言豆包豆包豆包百度文庫百度文庫百度文庫1月2月3月4月5月7月8月9月10月1月2月3月4月5月7月8月9月10月11月12月25年1月6月sDeepSeek的模型實(shí)現(xiàn)AI時代的“小米模式”,實(shí)現(xiàn)技術(shù)和價格的雙重普惠如果說Transformer的應(yīng)用標(biāo)志著基礎(chǔ)模型時代的開始(基礎(chǔ)模型的龐大規(guī)模和應(yīng)用范圍突飛猛進(jìn)),可以稱為AI技術(shù)的“iPhone時刻”。那么DeepSeek從建立之初的“價格屠夫”模式就贏得了開發(fā)者市場的關(guān)注,可以看做是AI時代的“小米模式”。短期影響短期影響直接挑戰(zhàn)了國際品牌的高價策略國際挑戰(zhàn)高價策略直接挑戰(zhàn)OpenAI的閉源技術(shù)模式及OpenAIO1的價格策略(O1正將高性能智能手機(jī)推向大眾市場普惠開發(fā)者讓更多中國普通用戶使用推理型同時具有極強(qiáng)的代碼及數(shù)學(xué)能力帶動帶動京東方(屏幕)、舜宇光學(xué)土供應(yīng)鏈企業(yè)技術(shù)升級,降低全行業(yè)制造成本成本重構(gòu),打破資源壟斷訓(xùn)練效率提升與推理成本壓縮,帶動一系列本土AIinfra建立產(chǎn)業(yè)生態(tài)(如硅基流動與華為云聯(lián)合小米通過紅米系列覆蓋下沉市場,移動互聯(lián)網(wǎng)應(yīng)用服務(wù)更多樣人群推動垂直場景、長尾應(yīng)用爆發(fā)從“科技巨頭試驗(yàn)”走向“千行百業(yè)剛需”,構(gòu)建更多元的開發(fā)DeepSeek的“高性價比”有望解鎖具身智能的理解與推理DS不僅在推理模型上實(shí)現(xiàn)了突破,在多模態(tài)方面也保持了進(jìn)步,并于近日開源發(fā)布了Janus-Pro多模態(tài)模型。基于算法工程方面的優(yōu)化,DS能夠?qū)崿F(xiàn)性價比更高的模型推理能力(價格低、效率高、性能強(qiáng)、可部署在端側(cè)平臺DS有望以強(qiáng)大的推理能力和多模態(tài)感知能力,重塑機(jī)器人交互與決策,同時通過低成本、高效率的解決方案,加速具身智能的普及與應(yīng)用。DeepSeek的性價比&效率優(yōu)勢,有降低推理成本端側(cè)平臺部署、提升反應(yīng)速率、降低計(jì)算能耗性能更強(qiáng)的中小模型蒸餾更低的計(jì)算成本在真實(shí)硬件上運(yùn)行自主決策鏈?zhǔn)剿伎纪ㄓ眯缘统杀居?xùn)練??通過強(qiáng)化學(xué)習(xí)自主探索,發(fā)展出復(fù)雜的推理能力實(shí)現(xiàn)機(jī)器人自主規(guī)劃任務(wù)和解決復(fù)雜問題的能力進(jìn)行邏輯推理,從而更可靠地完成目標(biāo)不針對特定任務(wù),追求通用推理能力適應(yīng)不同具身場景冷啟動訓(xùn)練減少了對大量標(biāo)注數(shù)據(jù)的依賴,降低數(shù)據(jù)成本,并解決了R1-zero的可讀性問題低成本和高效率對于實(shí)現(xiàn)規(guī)?;瘧?yīng)用和商業(yè)化至關(guān)重要降低推理成本端側(cè)平臺部署、提升反應(yīng)速率、降低計(jì)算能耗性能更強(qiáng)的中小模型蒸餾更低的計(jì)算成本在真實(shí)硬件上運(yùn)行自主決策鏈?zhǔn)剿伎纪ㄓ眯缘统杀居?xùn)練??通過強(qiáng)化學(xué)習(xí)自主探索,發(fā)展出復(fù)雜的推理能力實(shí)現(xiàn)機(jī)器人自主規(guī)劃任務(wù)和解決復(fù)雜問題的能力進(jìn)行邏輯推理,從而更可靠地完成目標(biāo)不針對特定任務(wù),追求通用推理能力適應(yīng)不同具身場景冷啟動訓(xùn)練減少了對大量標(biāo)注數(shù)據(jù)的依賴,降低數(shù)據(jù)成本,并解決了R1-zero的可讀性問題降低訓(xùn)練成本加速研發(fā)速度、加速迭代速度、降低開發(fā)門檻加速研發(fā)速度、加速迭代速度、降低開發(fā)門檻多模態(tài)融合感知?能夠有效融合視覺和語言信息,使得機(jī)器人多模態(tài)融合感知圖像生成圖像生成?可生成高質(zhì)量的圖像,對虛擬環(huán)境建模、仿?視覺編碼方法解耦,對不同的任務(wù)進(jìn)行優(yōu)化,時提升感知能力和生成能力編碼器解耦編碼器解耦ss,2025sss,2025s 推理成本的顛覆性降低,將會推動C端產(chǎn)品的大多數(shù)應(yīng)用場景進(jìn)入實(shí)際落地階段大模型的價格正在快速下降,而開放權(quán)重也在加速,并為開發(fā)者提供更多選擇。OpenAI的o1每輸出100萬令牌收費(fèi)60美元,而DeepSeek-R1只需2.19美元。這將近30倍的價差,讓算力成本不再是模型門檻,正在讓基礎(chǔ)模型層“平民化”。推理成本的顛覆性降低,將會推動C端產(chǎn)品在大多數(shù)應(yīng)用場景得到落地。尤其是在星云象限和星團(tuán)象限之中的應(yīng)用場景,將會得到全面的落地。Y滿意度XNPS值待重塑產(chǎn)品側(cè)重產(chǎn)品效率提升Y滿意度XNPS值待重塑產(chǎn)品側(cè)重產(chǎn)品效率提升側(cè)重產(chǎn)品體驗(yàn)側(cè)重商業(yè)落地光年象限光年象限●●..● ●●.備注說明:1.滿意度:一個用來衡量個人或組織對特定產(chǎn)品、服務(wù)、經(jīng)驗(yàn)或事件的滿意程度的指標(biāo)。當(dāng)使用體驗(yàn)大于預(yù)期時會獲得滿意感。2.NPS值:凈推薦值,是評估用戶口碑的一種方式。評估用戶/客戶向朋友、其他人推薦公司的產(chǎn)品或服務(wù)的可能性的指標(biāo)。整理,2025年;整理,2025年;9、全球AI科技競爭進(jìn)入G2時代DeepSeek將成為特朗普制定人工智能政策的重要參考,預(yù)示著AI進(jìn)入G2競爭時代?調(diào)動企業(yè)力量發(fā)展人工智能:相比拜登政府堅(jiān)持通過政府干預(yù)進(jìn)行對人工智能監(jiān)管,特朗普政府更傾向于依靠企業(yè)和資本的力量發(fā)?擴(kuò)大對芯片的出口管制:一方面
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代醫(yī)學(xué)視角下的精神分析與心理治療結(jié)合研究
- 生物乙醇技術(shù)助力實(shí)現(xiàn)碳中和目標(biāo)
- 汽車智能化的移動互聯(lián)網(wǎng)技術(shù)探討
- 現(xiàn)代餐飲業(yè)的線上線下融合策略
- 未來教育模式基于AI技術(shù)的智能學(xué)習(xí)系統(tǒng)研究
- 物流管理在醫(yī)療電子商務(wù)中的重要性
- 現(xiàn)代經(jīng)濟(jì)預(yù)測模型的發(fā)展趨勢及挑戰(zhàn)
- Unit 3 Toys Story Time(說課稿)-2023-2024學(xué)年人教新起點(diǎn)版英語一年級下冊
- 班組長決策能力與戰(zhàn)略思維培養(yǎng)
- 現(xiàn)代物流技術(shù)與裝備的未來展望
- 2025江蘇南京市金陵飯店股份限公司招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 公共政策分析 課件匯 陳振明 第0-9章 導(dǎo)論、緒論:政策科學(xué)的“研究綱領(lǐng)”- 政策監(jiān)控
- C語言程序設(shè)計(jì) 教案
- 2025年牛津譯林版英語七年級下冊全冊單元重點(diǎn)知識點(diǎn)與語法匯編
- 《小學(xué)作文指導(dǎo)》課件
- 小學(xué)六年級數(shù)學(xué)方程應(yīng)用題100道及答案解析
- 2025新譯林版英語七年級下單詞表
- 海洋工程設(shè)備保溫保冷方案
- 文藝演出排練指導(dǎo)服務(wù)合同
- 人教版(2024新版)一年級上冊數(shù)學(xué)第一單元《數(shù)學(xué)游戲》單元整體教學(xué)設(shè)計(jì)
- 魏寧海超買超賣指標(biāo)公式
評論
0/150
提交評論