北京大學(xué)DeepSeek系列-DeepSeek與AIGC應(yīng)用_第1頁
北京大學(xué)DeepSeek系列-DeepSeek與AIGC應(yīng)用_第2頁
北京大學(xué)DeepSeek系列-DeepSeek與AIGC應(yīng)用_第3頁
北京大學(xué)DeepSeek系列-DeepSeek與AIGC應(yīng)用_第4頁
北京大學(xué)DeepSeek系列-DeepSeek與AIGC應(yīng)用_第5頁
已閱讀5頁,還剩153頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

DeepSeek與AIGC應(yīng)用AI (孫萍、周嶸、李娜、張惠軍、劉譽)2月20日院元宇宙技術(shù)研究所學(xué)實驗室2.本次講座首先分析當前備受矚目的DeepSeek-R1的概念、優(yōu)勢和歷史地位。然后進一AIGC具應(yīng)用的局限,理解DeepSeekAIGCAI具,為大家I目錄AIGC力揭秘AIGC的概念和應(yīng)用3PART01能的發(fā)展歷程,以及大模型相關(guān)術(shù)語,并對比DeepSeek-R1與其他模型的性能DeepSeek及DeepSeek-R1的技術(shù)原理和應(yīng)用場景,揭示了其型任務(wù)、教育、科研、知識應(yīng)用和文檔分析等領(lǐng)域的獨特優(yōu)勢,并列舉接入該模型的第對人工智能發(fā)展歷史以及DeepSeek-R1的介紹和分析,本部分旨在為聽眾提供一個對2023年GPT-4AIGCAIGC的發(fā)展歷程19501950s-1990S1990s-2010S2010s-2022年文本、圖片、音頻、視頻通義千問、秘塔搜索、微信搜索...?大語言模型(LLM,LargeLanguageModel)模型?行業(yè)模型(垂直模型、垂類模型)教育、醫(yī)療、金融等生成模型推理模型ref告(2025.01.08)比較項GPT-4o(生成模型)DeepSeek-R1(推理模型)模型定位專注于通用自然語言處理和多模態(tài)能力,適合日常對話、內(nèi)容生成、翻譯以及圖文、音頻、視頻等信息處理、生成、對話等。側(cè)重于復(fù)雜推理與邏輯能力,擅長數(shù)學(xué)、編程和自然語言推理任務(wù),適合高難度問題求解和專業(yè)領(lǐng)域應(yīng)用,在中文表達上容易出理能力在日常語言任務(wù)中表現(xiàn)均衡,但在復(fù)雜邏輯推理(如數(shù)學(xué)題求解)上準確率較低。在復(fù)雜推理任務(wù)表現(xiàn)卓越,尤其擅長數(shù)學(xué)、代碼推理任務(wù),在部分基準測試(如GPQA)中準確率高于GPT-4o。持支持文本、圖像、音頻乃至視頻輸入,可處理多種模應(yīng)用場景適合廣泛通用任務(wù),如對話、內(nèi)容生成、多模態(tài)信息處理以及多種語言相互翻譯和交流;面向大眾市場和適合需要高精度推理和邏輯分析的專業(yè)任務(wù),如數(shù)學(xué)競賽、編程問題和科學(xué)研究;在思路清晰度要求高的場景具有明顯優(yōu)勢,比如采訪大綱、方案梳理;在對中文語言表達和情感表達方面有明用戶交互體驗提供流暢的實時對話體驗,支持多種輸入模態(tài);用戶界面友好,適合大眾使用。可展示大部分鏈式思考過程,便于專業(yè)用戶理解推理過程;界面和使用體驗具有較高的定制性,但整體交互節(jié)奏較慢。勢-演繹或歸納等推理能力強(如謎題、數(shù)學(xué)證明)-響應(yīng)速度慢且計算成本高(需要更多推理時間)-鏈式思維推理出色(善于分解多步驟問題)-基于知識的任務(wù)更容易出錯(容易產(chǎn)生幻覺)-擅長復(fù)雜決策任務(wù)-處理簡單任務(wù)的時候效率低(容易"過度思考")-可以呈現(xiàn)思考過程mini火爆全網(wǎng)的DeepSeek-火爆全網(wǎng)的DeepSeek-R1?DeepSeek-R1的推理能力進入了第一梯隊(媲美OpenAIo1),但訓(xùn)練和推理成本低、速度快、全部開源?DeepSeek打破了硅谷傳統(tǒng)的“堆算力、拼資本”的大模型發(fā)展路徑01對01對AI行業(yè)的重大影響打破壟斷DeepSeek-R1以低成本和開源特性打破以往頭部企業(yè)巨頭割據(jù)局面價格下調(diào)DeepSeek-R1的API定價僅為行業(yè)均價的1/10,推動了中小型企業(yè)低成本接入AI,對行業(yè)產(chǎn)生了積極影響推動創(chuàng)新DeepSeek-R1促使行業(yè)開始從“唯規(guī)模論”轉(zhuǎn)向更加注重“性價比”和“高效能”方向DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技企業(yè),專注于人工智能基礎(chǔ)技術(shù)的研究與開發(fā)公司成立背景與發(fā)展歷程DeepSeek公司DeepSeekDeepSeek專注于開發(fā)先進的大語言模型(LLM)和相關(guān)技術(shù),旨在通過這些技術(shù)推動人工智能在多個領(lǐng)域的應(yīng)用和創(chuàng)新管理資金規(guī)模均超過600億元。這為DeepSeek提供了清晰的市場定位和投資者背景大語言模型(LLM)的創(chuàng)新應(yīng)用投資者背景與市場定位2025年1月20日推出DeepSeek2025年1月20日推出DeepSeek-R1推理模型DeepSeek產(chǎn)品信息官方渠DeepSeek產(chǎn)品信息官方渠道新聞:/zh-cn/news/news250120Github:/deepseek-ai/DeepSeek模DeepSeek模型系列DeepSeekDeepSeek最新的生成模型和推理模型版本對比生成模型(V3)推理模型(R1)想要在各種自然語言處理的任務(wù)中都更通用復(fù)雜的推理情況,比如分析和解決問題在數(shù)學(xué)題、多語言任務(wù)還有編碼任務(wù)里表現(xiàn)不錯,像Cmath能得90.7分,HumanEval編碼任務(wù)通過率是65.2%思考的測試里很棒,比如.8%的范圍適合大規(guī)模的自然語言處理工作,像對話式AI、多語言翻譯還有內(nèi)容生成等等,能給企業(yè)提供高效的AI方案,滿足好多領(lǐng)域的需求適合學(xué)術(shù)研究、解決問題的應(yīng)用和決策支持系統(tǒng)等需要深度推理的任務(wù),也能拿來當教育工具,幫學(xué)生鍛煉邏輯思維讓模型自我探索和訓(xùn)練蒸餾 (讓模型自我探索和訓(xùn)練蒸餾 (Distillation)在不損失能力的情況下縮小模型DeepSeek-R1強化學(xué)習(xí)強化學(xué)習(xí) (ReinforcementLearning) (ChainofThought)讓讓模型進行慢思考DeepSeek-DeepSeek-R1模型名稱滿血版,能力最強蒸餾版,能力稍弱QwenLlamaDeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BB能能部署DeepSeek-R1DeepSeek-RDeepSeek-R1的優(yōu)勢理科能力強,且準確率高DeepSeek-DeepSeek-R1的局限?R1的通用能力(尤其是生成能力)低于DeepSeek-V3?R1的幻覺仍舊比較明顯(可能源于R1的中文語言表達能力更強)RZero明顯DeepSeekDeepSeek-R1t如何使用DeepSeek如何使用DeepSeek寶I騰訊ima個人知識庫I接入接入DeepSeekR1第三方服務(wù)的廠家?百度:百度搜索、文小言?字節(jié)跳動:豆包、扣子、飛書?阿里:釘釘?AI應(yīng)用公司(教育類):學(xué)而思、北大青鳥、網(wǎng)易有道、猿輔導(dǎo)、作業(yè)幫、…...?其它云服務(wù)平臺:三大運營商、云服務(wù)商(硅基流動等)PART02AIGC的概念和應(yīng)用本部分著重介紹人工智能生成內(nèi)容(AIGC)的定義、應(yīng)用范圍及其在各行業(yè)的實際影響:AIGC,包括AI、AGI、生成式AI和決策式AI等,明確了其在人工智能領(lǐng)域的傳媒、影視、游戲、教育和金融等行業(yè)的具體實踐,展示AIGC在提升效率、降低成本和增強創(chuàng)通過深入探討AIGC的應(yīng)用現(xiàn)狀和未來趨勢,本部分旨在幫助讀者全面理解AIGC的潛力和影響,為應(yīng)本部分的內(nèi)容參考了《人工智能通識課(微課版)》和相關(guān)的視頻(B站的思睿觀通)初識AIGC (人工智能生成內(nèi)容)AIGCAIGCChatGPTAI(人工智能)AGI(通用人工智能) (artificialgeneralintelligence)AIGC能AIGC能干什么頻生成內(nèi)容AI文本AI文本?Cursor?Windsurf?MarsCode?GitHubCopilot?阿里云通義靈碼?微軟“小冰”出版詩集?AI撰寫劇本電影《陽春》?百萬字小說《天命使徒》?清華大學(xué)的《機憶之地》AIAI搜索聞?Perplexity?知乎直答?秘塔AI搜索引擎?納米AI搜索?微信搜索(DeepSeekR1、元寶)?小紅書的筆記助手?短視頻平臺的內(nèi)容創(chuàng)意?自動回復(fù)機器人?企業(yè)微信的智能回復(fù)?英國廣播公司(BBC)的Juicer?彭博社的Cyborg?新華社的快筆小新?人民日報的創(chuàng)作大腦?第一財經(jīng)的DT稿王AI繪畫AI繪畫2022年8月,獲得比賽2022年8月,獲得比賽“數(shù)字藝術(shù)/數(shù)字修飾照片”空歌劇院AI繪畫AI繪畫AI繪畫AI繪畫新西湖繁勝全景圖全景圖是一副百米畫卷,再現(xiàn)了當下西湖邊的景觀特色、生活場景,還有一些已經(jīng)消失的景觀,比如曾經(jīng)聞名寺。如果這些建筑都要自己親手畫,一天I技術(shù),在一年內(nèi)完成了作品AI音頻AI音頻話創(chuàng)作音樂隆AI視頻AI視頻頌效添加圖片AIGC的行業(yè)應(yīng)用內(nèi)容廣告電商行業(yè)其它行業(yè)內(nèi)容廣告電商行業(yè)其它行業(yè) (教育、金融...)新聞傳媒影視行業(yè)游戲行業(yè)AIGC的行業(yè)應(yīng)用產(chǎn)品拍攝降本增效主播提升直播帶貨效率參與傳效果播環(huán)節(jié)采編環(huán)節(jié)傳媒錄音語音轉(zhuǎn)寫應(yīng)用場景拓展能新聞寫作應(yīng)用功能升級能視頻剪輯應(yīng)用形態(tài)完善播環(huán)節(jié)采編環(huán)節(jié)傳媒錄音語音轉(zhuǎn)寫應(yīng)用場景拓展能新聞寫作應(yīng)用功能升級能視頻剪輯應(yīng)用形態(tài)完善對媒體從業(yè)者將部分采編、播放工作自動化,讓其更專注于思考創(chuàng)造如將精力集中于深度報道專題報道等更需發(fā)揮人類精準分析事物、妥善處理情感的領(lǐng)域;對傳媒用戶短時間獲得更多新聞,提高獲取及時性及便捷性;降低傳媒門檻,使得受眾可以參與內(nèi)容生產(chǎn),增強參與感對傳媒機構(gòu)大幅提高生產(chǎn)效率,并帶來新的視覺化、互動化體驗;豐富了新聞報道的形式,推動傳媒向智媒轉(zhuǎn)變傳媒AIGCAIGC對傳媒行業(yè)參與主體的影響影視劇本文稿創(chuàng)作拓展角色范疇影視劇本文稿創(chuàng)作拓展角色范疇賦賦能影視剪輯拓拓展場景空間戲玩法,提高游戲可玩性。游戲驗02功能AI造不同的面孔、服飾、聲音甚至性格特征,甚至可同步驅(qū)動嘴型、表情等面部變化,達到,完成行走、跑步等一系列動作反應(yīng)。?AI智能NPC能夠分析玩家的實時輸入,與玩家動態(tài)交互,構(gòu)建幾乎無限且不重復(fù)的劇情;AI?讓AI感知環(huán)境、自身狀態(tài)并基于特定目標決定當下需要執(zhí)行的動作,基于特定問題和場景,自主提出解決方案。游戲策業(yè)AIGCAIGC游戲研發(fā)環(huán)節(jié)作用001體驗套數(shù)值體系下的游戲體驗,提出優(yōu)化策略;找出游戲交互的可能性,發(fā)現(xiàn)潛在漏洞輔助游戲策劃。游戲性能0303角色0404劇情0505策略??AI自動化廣告投放:目前抖音等平臺的廣告分發(fā)、內(nèi)容推薦已通過算法實現(xiàn),且效果較高;游戲運營環(huán)節(jié)試?虛擬實驗室?生成學(xué)習(xí)資料?翻譯文獻資料其其它?風(fēng)險管理文檔?合規(guī)管理金融行業(yè)AIGC的未來AIGC的核心價值A(chǔ)IGC的核心價值A(chǔ)IGC的挑戰(zhàn)AIGC的挑戰(zhàn)結(jié)果幻象、可控性、理解能力生成精準度、還原度、仿真度0104倫理挑戰(zhàn)社會偏見、性別歧視等002003私及安全露隱私數(shù)字身份冒用制作虛假信息詐騙產(chǎn)權(quán)挑戰(zhàn)侵權(quán)與被侵權(quán)AIGC的未來AIGC的未來步AIGC的生成質(zhì)量和準確性將得到提升泛的應(yīng)用在更多領(lǐng)域得到應(yīng)用,如保險、醫(yī)療和法律服務(wù)等協(xié)作更多地與人類專家協(xié)作,以提供更高質(zhì)量的內(nèi)容和服務(wù)管框架的發(fā)展預(yù)計將出現(xiàn)更多關(guān)于內(nèi)容生成和使用的監(jiān)管框架生成式人工智能(AI)目前處于到2026年,Gartner預(yù)測超過80%的企業(yè)將使用生成式AI的API或模型,或在生產(chǎn)環(huán)境中部署支持生成式AI的應(yīng)用,而在2023年初這一比例不到5%。錫報告:《工作的新未來:在歐洲及其他地區(qū)部署人工智能和提升技能的競賽》顯著上升?STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))相關(guān)職業(yè)?醫(yī)療保健和其他高技能職業(yè)下降顯著?辦公室職員?生產(chǎn)工人?客戶服務(wù)代表等傳統(tǒng)職業(yè)到2030年,歐洲和美國多達30%的工作時間化錫報告:《工作的新未來:在歐洲及其他地區(qū)部署人工智能和提升技能的競賽》?技能類型需求變化?技術(shù)技能大幅增長?炙手可熱的“新寵”技能是社會和情感技能?體力和手動技能的需求預(yù)計將保持大致穩(wěn)定?認知技能(文字和信息處理、編程、科研、工程等)的需求預(yù)計將減少14%與AI共舞與AI共舞?學(xué)習(xí)AIGC基礎(chǔ)知識?積極使用AIGC工具?關(guān)注AIGC在各行業(yè)的應(yīng)用案例PART03本部分深入剖析AIGC背后的技術(shù)原理,涵蓋文本生成和圖像生成兩大核心領(lǐng)域。通過對比文本生成和圖像生成的不同路徑,大家能夠全面理解AIGC在不同模態(tài)下的工作原理,以及如何利用這些技術(shù)實現(xiàn)高效的內(nèi)容創(chuàng)作在文本生成方面,以O(shè)penAI的GPT-4o為例,詳細介紹了通用大語言模型(LLM)的工作原理,包括其基于Transformer架構(gòu)的生成機制、上下文編碼、自注意力機制以及預(yù)訓(xùn)練和微調(diào)過程。探討了GPT-4o在多輪對話、語言轉(zhuǎn)換、意圖理解、文本生成和推理能力等方面的優(yōu)勢,同時也指出其在知識局限、上下文窗口限制和生成幻覺的不足。在圖像生成方面,以StableDiffusion模型為例,解釋了其核心組件(文本編碼器、圖像信息生成器和圖像解碼器)的工作流程,揭示了文生圖和圖生圖技術(shù)的優(yōu)勢與局限。本部分的內(nèi)容參考了《人工智能通識課(微課版)》和相關(guān)的視頻(B站的思睿觀通)。文本生成的奧秘AIGC與GPTAIGC與GPT(通用大模型的代表)1950s-1990S11990s-2010S22010s-2022年OpenAIGPT4-多模態(tài)大模型GPT的學(xué)霸養(yǎng)成GPT的學(xué)霸養(yǎng)成記OpenAI能力工作原理-1工作原理-1GGenerative (生成式)GPTTransformer (變換器)Pre-trained (預(yù)訓(xùn)練)LLM:LargeLanguageModel11.收到提示詞2.將輸入拆分為token3.采用Transformer架構(gòu)處理token?理解token之間的關(guān)系?識別提示詞的整體含義4.基于上下文預(yù)測下一個token?為可能的單詞分配概率分數(shù)5.根據(jù)概率分數(shù)選擇標記概率概率預(yù)測+文字接龍自回歸:重復(fù)步驟4和步驟5直到形成完整的句子示例:今天天氣不錯,我定去公園訓(xùn)練 (自監(jiān)督)督微調(diào)收輸入處訓(xùn)練 (自監(jiān)督)督微調(diào)收輸入處理輸入進行推理工作原理-2模型工作過程+知識類反饋生成輸出生成輸出工作原理-3工作原理-3源維基百科在線百科,嚴謹圖書經(jīng)典為主的古登堡計劃和自助出版平臺Smashwords等雜志期刊鏈接WebText,RedditCommonCrawl開源項目,爬取互聯(lián)網(wǎng)所有數(shù)據(jù)GitHub程序員聚集地合計?700多GB,約有19萬套四大名著的閱讀量?5000億左右的token數(shù)量。(13萬億token:gpt4)?100個標記大約等于75個英語單詞訓(xùn)練語料(gpt-3)GPT-4o上下文窗口大?。?192個token(標記)劣勢劣勢vs?幻覺(生成錯誤答案)基本對話方法基本對話方法具:?ChatGPT?POE多輪對話引導(dǎo)如何與GPT對話智慧對智慧對話ChatGPTChatGPT:聊天機器人應(yīng)用GPT:大語言模型力-多輪對話?上下文編碼?自注意力機制上下文窗口限制?包括字符、標點、空格?GPT-3.5:4096,大約3000個英文單詞或4000個漢字?GPT-4:8192,大約6000個英文單詞或8000個漢字 tformopenaicomtokenizer?分段對話?定期總結(jié)?使用關(guān)鍵詞提醒?精簡輸入-語言轉(zhuǎn)換能力?人類語言之間轉(zhuǎn)換?機器語言之間轉(zhuǎn)換?人類語言與機器語言之間轉(zhuǎn)換??人類語言生成能力不同法語、德語、中文機器語言生成能力不同t?GPT:使用英文?中文優(yōu)先選擇國內(nèi)產(chǎn)品?編程盡量選用前4種語言力--意圖和情感分析能力力--意圖和情感分析能力?真實意圖?情緒識別?判斷行為特點?重要他人?缺乏真正的情感?上下文理解有限?缺乏深層次推理?提供清晰具體的信息?簡短和連貫的對話?使用明確的情感表達力力強力強文本生成能力文本統(tǒng)計?統(tǒng)計字符數(shù)、單詞數(shù)、句子數(shù)等基本統(tǒng)計信息文本摘文本統(tǒng)計?統(tǒng)計字符數(shù)、單詞數(shù)、句子數(shù)等基本統(tǒng)計信息文本摘要?從長文檔中提取主要信息,并生成一個簡短的概述創(chuàng)作能力-文本分析能力更新、長文本理解、數(shù)據(jù)偏見、數(shù)據(jù)、語境歧義、領(lǐng)域?qū)I(yè)知識、新穎和類別、不確定性文本分類?新聞分類、情感分析(正面、負面、中性)文本總結(jié)?文本的整體內(nèi)容進行簡要概述,通常比文本摘要更為簡短文本校對?錯別字識別與修改、語法錯誤檢查與修正、文本校對?錯別字識別與修改、語法錯誤檢查與修正、標點符號調(diào)整、詞匯選擇優(yōu)化、語句重組與調(diào)整、保持一致的寫作風(fēng)格文本改寫文本簡化、文本優(yōu)化、保持一致性創(chuàng)作能力-文本潤色能力更新限制、長文本處理能力、用戶意別文本擴寫?增加細節(jié)、舉例說明、提供背景信息、解釋專業(yè)術(shù)語或概念、描述過程或步驟、增加文學(xué)修辭、提供多種觀點等創(chuàng)作能力-使用建議創(chuàng)作能力-使用建議使用優(yōu)先級析>文本潤色>文本生成分段處理長文本明確和具體的指示補充背景信息注意多義詞和模糊表達對比能力?對比分析:對比能力?對比分析:事物、概念、人物、事件、文學(xué)作品、藝術(shù)作品等列舉能力?簡單列舉任務(wù):組合/排列/序列,簡單數(shù)學(xué)問題等假設(shè)推理能力?多個領(lǐng)域能力不同:歷史事件、文學(xué)作品解讀等數(shù)據(jù)局限、缺乏常識和領(lǐng)域?qū)iL、模型理解能力、過度生成偏見、難以驗證答案的準確性學(xué)會提學(xué)會提問?明確、具體、避免歧義邏輯清晰?上下文信息示范數(shù)據(jù)驗證輸出?從回復(fù)中找到有價值的部分識別可靠信息?評估信息準確性:與其他來源進行對比話圖像生成的奧秘Stable三大核心組件 (畫家)(工匠)圖像信息生成器編碼器Diffusion模型的構(gòu)成Stable三大核心組件 (畫家)(工匠)圖像信息生成器編碼器Diffusion模型的構(gòu)成Stable (翻譯官)?解析用戶輸入的提示詞?將提示詞轉(zhuǎn)化為高維向量表示?將輸入信息逐步處理和轉(zhuǎn)換為圖像數(shù)據(jù)?接收來自圖像信息生成器的處理后的信息矩陣?將信息矩陣轉(zhuǎn)換為可視化的圖像PART04AIGC的工具類型,包括聊天對話機器人、圖像生成工具、音頻與視頻生成工還

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論