deepseek:智能時代的全面到來和人機協(xié)作的新常態(tài)-浙江大學(xué)-202502_第1頁
deepseek:智能時代的全面到來和人機協(xié)作的新常態(tài)-浙江大學(xué)-202502_第2頁
deepseek:智能時代的全面到來和人機協(xié)作的新常態(tài)-浙江大學(xué)-202502_第3頁
deepseek:智能時代的全面到來和人機協(xié)作的新常態(tài)-浙江大學(xué)-202502_第4頁
deepseek:智能時代的全面到來和人機協(xié)作的新常態(tài)-浙江大學(xué)-202502_第5頁
已閱讀5頁,還剩124頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

DeepSeekDeepSeek智能時代的全面到來和人機協(xié)作的新常態(tài)孫凌云教授計算機科學(xué)與技術(shù)學(xué)院2025年2月維基鏈接CommonCrawl數(shù)據(jù)總計4.64.6ThePilev164.66.4表:主要數(shù)據(jù)集大小匯總,以GB為單位。公開的數(shù)據(jù)集以粗體表示,確定的數(shù)據(jù)以斜體表示。CommonCrawl數(shù)據(jù)集過濾之前為45T來源:OpenAI團隊,LanguageModelsareFew-ShotLearners,/abs/2005.14165,2022年7月22日34由AI(DeepSeekR1)搜集并整理,經(jīng)人工檢查4三體人如何學(xué)習(xí)地球知識?三體人如何學(xué)習(xí)地球知識?電磁波探測器拯救派電磁波地球文明信息原始數(shù)據(jù)、無目標性探測器探測器搜集數(shù)據(jù)集電磁波地球文明信息原始數(shù)據(jù)、無目標性探測器探測器搜集數(shù)據(jù)集精準觀察、查漏補缺拯救派人類反饋實現(xiàn)對齊動態(tài)反饋、價值博弈三體人如何學(xué)習(xí)地球知識?拯救派人類反饋實現(xiàn)對齊動態(tài)反饋、價值博弈拯救派人類反饋實現(xiàn)對齊動態(tài)反饋、價值博弈電磁波地球文明信息原始數(shù)據(jù)、無目標性探測器搜集數(shù)據(jù)集精準觀察、查漏補缺定向能力強化價值觀校準原始數(shù)據(jù)基建定向能力強化價值觀校準三體人如何學(xué)習(xí)地球知識?電磁波探測器拯救派人類反饋強化學(xué)習(xí)人類反饋強化學(xué)習(xí)預(yù)訓(xùn)練三體人如何學(xué)習(xí)地球知識?電磁波基礎(chǔ)模型電磁波基礎(chǔ)模型強化學(xué)習(xí)結(jié)合準確性獎勵(數(shù)學(xué)、編程等任務(wù)的可驗證結(jié)果)和格式獎勵(強制輸出結(jié)構(gòu)化標簽),通過GRPO算法優(yōu)化模型三體人如何學(xué)習(xí)地球知識?電磁波基礎(chǔ)模型電磁波基礎(chǔ)模型強化學(xué)習(xí)數(shù)學(xué)題自動判分/編程題實戰(zhàn)演練/階梯進化結(jié)合準確性獎勵(數(shù)學(xué)、編程等任務(wù)的可驗證結(jié)果)和格式獎勵(強制輸出結(jié)構(gòu)化標簽),通過GRPO算法優(yōu)化模型https://huggingface.co/papers/2501.12948TheuserasksaquesThereasoningprocessandanswerareenclosedwithin2025年1月22日Ahamoment頓悟時刻人類長期思考后的靈感閃現(xiàn)強化學(xué)習(xí)中的獎勵信號引導(dǎo)結(jié)合準確性獎勵(數(shù)學(xué)、編程等任務(wù)的可驗證結(jié)果)和格式獎勵(強制輸出結(jié)構(gòu)化標簽),通過GRPO強化學(xué)習(xí)策略后訓(xùn)練V3模型Ahamoment頓悟時刻人類長期思考后的靈感閃現(xiàn)強化學(xué)習(xí)中的獎勵信號引導(dǎo)結(jié)合準確性獎勵(數(shù)學(xué)、編程等任務(wù)的可驗證結(jié)果)和格式獎勵(強制輸出結(jié)構(gòu)化標簽),通過GRPO強化學(xué)習(xí)策略后訓(xùn)練V3模型來源:/think/topics/chain-of-thoughts20表格內(nèi)容由AI生成,使用DeepSeekR1自動整理https://x.ai/blog/grok-3來源:/xai/status/18916997152987304822025年2月18日算力路線xAI發(fā)布會,DeepSeek白皮書訓(xùn)練成本估算2.1億/5億美元,含基礎(chǔ)設(shè)施558萬美元(單次訓(xùn)練成本)Axios成本報告技術(shù)特性2.7萬億參數(shù)動態(tài)架構(gòu)通過ThinkMode分解問題(如火星軌道計算調(diào)用9個子模型協(xié)同)671B參數(shù)僅激活少量參數(shù)完成同類任務(wù)xAI技術(shù)文檔,DeepSeek-V3技術(shù)表數(shù)學(xué)推理xAI基準測試,DeepSeek-V3數(shù)據(jù)表代碼生成LiveCodeBench57%LiveCodeBench40.5%Radargit性能對比訓(xùn)練能耗相當于30萬戶家庭年用電相當于于3000戶家庭年用電xAI發(fā)布會實錄推理成本$0.015/次$0.0018/次Radargit成本對比生態(tài)策略封閉生態(tài)X平臺,但提供實時數(shù)據(jù)接口開源策略允許開發(fā)者定制思維鏈展示規(guī)則Radargit行業(yè)分析使用DeepSeekR1自動整理,含第三方估計數(shù)據(jù)25DeepSeek-R1GPT-o1/通義千問QwQ-32B/天工Skyworko1/訊飛星火X1/GeminiUltra/Grok3-語言模式匹配與統(tǒng)計規(guī)律學(xué)習(xí)-上下文連貫性與生成流暢度-大規(guī)模數(shù)據(jù)泛化-復(fù)雜邏輯分析與多步驟推理-符號化規(guī)則與結(jié)構(gòu)化思維鏈構(gòu)建-邏輯驗證準確性-基于Transformer的并行化生成-端到端模式識別-依賴提示工程提升表現(xiàn)-原子推理模塊組合(如批判性思維、逐步推導(dǎo))-需強化學(xué)習(xí)優(yōu)化推理路徑-開放域?qū)υ挘头C器人)-文本創(chuàng)作(小說/詩歌生成)-數(shù)學(xué)定理證明(如代數(shù)方程求解)-動態(tài)規(guī)劃算法設(shè)計-實時決策系統(tǒng)(自動駕駛)),-FP8混合精度訓(xùn)練減少內(nèi)存占用與計算量-強化學(xué)習(xí)直接用于基礎(chǔ)模型(無需監(jiān)督微調(diào))-知識蒸餾技術(shù)縮短后訓(xùn)練周期-動態(tài)知識庫與多模態(tài)引擎加速迭代-FP8混合精度框架首次驗證超大規(guī)模模型可行性-負載均衡策略減少性能損失-知識蒸餾將大模型能力遷移至小模型(如15B參數(shù)模型)-動態(tài)稀疏注意力降低計算復(fù)雜度注:使用秘塔搜索(R1推理模型)總結(jié),內(nèi)容未經(jīng)人工確認,格式經(jīng)人工調(diào)整。詳情參考:/s/ZYdtday/s/TM0D0rP/pdf/2311.02462.pdf/pdf/2311.02462.pdf/sites/jodiecook/2024/07/16/openais-5-levels-of-super-ai-agi-to-outperform-human-capability/2024年7月16日來源:ARKInvest/big-ideas-20242024年1月31日33能力涌現(xiàn)不可逆社會影響倒計時人機協(xié)作新常態(tài)來源:/technology/chatgpt-opens-door-to-four-day-week-says-nobel-prize-winner-20230406-p5cyki來源:ARKInvest/big-ideas-20242024年1月31日37來源:Stella,F.,DellaSantina,C.&Hughes,J.HowcanLLMstransformtheroboticdesignprocess.NatureMachineIntelligence.5,561–564(2023)./10.1038/s42256-023-00669-72023年6月7日來源:Stella,F.,DellaSantina,C.&Hughes,J.HowcanLLMstransformtheroboticdesignprocess.NatureMachineIntelligence.5,561–564(2023)./10.1038/s42256-023-00669-72023年6月7日https://twitter.com/gong_cn/status/1726501516https://huggingface.co/blog/lcm_lora2023年11月9日人類完成絕大部分工作人類設(shè)立任務(wù)目標其中某(幾)個任務(wù)AI提供信息或建議人類自主結(jié)束工作人類和AI協(xié)作工作人類設(shè)立任務(wù)目標其中某(幾)個任務(wù)AI完成初稿人類修改調(diào)整確認↓人類自主結(jié)束工作AI全權(quán)代理!任務(wù)拆分工具選擇進度控制!AI全權(quán)代理!任務(wù)拆分工具選擇進度控制!AI自主結(jié)束工作AI完成絕大部分工作設(shè)立目標提供資源監(jiān)督結(jié)果來源:VIONWILLIAMS/s/AluYfD6BQOkLo6XpJMyQnQ2023年9月15日41蒸汽時代(1760-1840)蒸汽時代(1760-1840)水力、紡織、鐵蒸汽、鐵路、鋼電、化學(xué)品、內(nèi)燃機石油、天然氣、硅電子互聯(lián)網(wǎng)水力、紡織、鐵蒸汽、鐵路、鋼電、化學(xué)品、內(nèi)燃機石油、天然氣、硅電子互聯(lián)網(wǎng)信息時代(1950-第一波浪潮第二波浪潮第三波浪潮第四波浪潮第五波浪潮 60年 40年 動力運力電力通信信息觀點來自:北京大學(xué)黃鐵軍教授,2023年3月31日42蒸汽時代(1760-1840)蒸汽時代(1760-1840)電氣時代(1840-1950)信息時代(1950-以人工智能為代表的新型基礎(chǔ)設(shè)施?以人工智能為代表的新型基礎(chǔ)設(shè)施?動力 60年動力 通信 40年通信信息智力 信息智力運力電力觀點來自:北京大學(xué)黃鐵軍教授,2023年3月31日43來源:ArtificialIntelligenceIndexReport2024/report/ModelsTableRankingshttps://lifearchitect.ai/models-table/2025年2月/100-gen-ai-apps-3/應(yīng)用/平臺集成時間核心功能與技術(shù)特性信息來源測DeepSeek降低了基礎(chǔ)提示詞的使用DeepSeek降低了基礎(chǔ)提示詞的使用來源:/technology/chatgpt-opens-door-to-four-day-week-says-nobel-prize-winner-20230406-p5cyki52來源:澎湃新聞/newsDetail_forward_207904

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論