2025DeepSeek與AIGC應(yīng)用場景講義_第1頁
2025DeepSeek與AIGC應(yīng)用場景講義_第2頁
2025DeepSeek與AIGC應(yīng)用場景講義_第3頁
2025DeepSeek與AIGC應(yīng)用場景講義_第4頁
2025DeepSeek與AIGC應(yīng)用場景講義_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

DeepSeek與AIGC應(yīng)用2025年2月20日摘要

本次講座為DeepSeek原理和應(yīng)用系列研討的講座之一,主要介紹DeepSeek的基本概念,以及大模型技術(shù)和AIGC工具應(yīng)用,不需要大家具備專業(yè)的AI或IT技術(shù)背景。

本次講座首先分析當(dāng)前備受矚目的DeepSeek-R1

的概念、優(yōu)勢和歷史地位。然后進(jìn)一步探討大模型和AIGC的底層工作機制,旨在幫助讀者突破工具應(yīng)用的局限,理解

DeepSeek和AIGC的深層次價值。最后,介紹如何科學(xué)選擇與高效使用AI工具,為大家提供更具深度與實用性的應(yīng)用場景的指導(dǎo),給聽眾帶來更落地的AI應(yīng)用價值。

盡管DeepSeek-R1以其低成本和開源策略為行業(yè)帶來變革,但當(dāng)前網(wǎng)絡(luò)上的大量相關(guān)內(nèi)容僅停留在工具應(yīng)用層面,易對初級AI應(yīng)用人員造成概念和思維方式的誤導(dǎo),這也是本次講座希望解決的問題。3詳解Deep

Seek

R1AIGC的能力揭秘AIGC的概念和應(yīng)用選擇AIGC工具目

錄詳解Deep

Seek-R

1PART

01簡介本部分介紹了DeepSeek-R1模型的技術(shù)特性、發(fā)展歷程、應(yīng)用場景及其在AIGC領(lǐng)域的定位。首先介紹人工智能的發(fā)展歷程,以及大模型相關(guān)術(shù)語,并對比DeepSeek-R1與其他模型的性能表現(xiàn)。DeepSeek-R1以其低成本、開源策略和卓越的推理能力脫穎而出,尤其在復(fù)雜邏輯推理、數(shù)學(xué)和編程任務(wù)中表現(xiàn)優(yōu)異。隨后介紹DeepSeek公司的背景、市場定位以及DeepSeek-R1的技術(shù)原理和應(yīng)用場景,揭示了其在推理密集型任務(wù)、教育、科研、知識應(yīng)用和文檔分析等領(lǐng)域的獨特優(yōu)勢,并列舉接入該模型的第三方應(yīng)用。通過對人工智能發(fā)展歷史以及DeepSeek-R1的介紹和分析,本部分旨在為聽眾提供一個對DeepSeek的客觀、全面的認(rèn)識,并理解該模型在AIGC領(lǐng)域的重要地位和應(yīng)用潛力。人工智能發(fā)展歷程2023年GPT-4AIGC的發(fā)展歷程1950s-1990S1990s-2010S2010s-2022年大模型相關(guān)術(shù)語多模態(tài)文本、圖片、音頻、視頻AI工具(國內(nèi))DeepSeek、豆包、Kimi、騰訊元寶、智譜清言、通義千問、秘塔搜索、微信搜索...通用模型大語言模型(LLM,Large

Language

Model)視頻模型多模態(tài)模型……行業(yè)模型(垂直模型、垂類模型)教育、醫(yī)療、金融等大模型的關(guān)鍵發(fā)展生成模型ref:中文大模型基準(zhǔn)測評2024年度報告(2025.01.08)推理模型生成模型與推理大模型的對比比較項GPT-4o(生成模型)DeepSeek-R1(推理模型)模型定位專注于通用自然語言處理和多模態(tài)能力,適合日常對話、內(nèi)容生成、翻譯以及圖文、音頻、視頻等信息處理、生成、對話等。側(cè)重于復(fù)雜推理與邏輯能力,擅長數(shù)學(xué)、編程和自然語言推理任務(wù),適合高難度問題求解和專業(yè)領(lǐng)域應(yīng)用,在中文表達(dá)上容易出彩。推理能力在日常語言任務(wù)中表現(xiàn)均衡,但在復(fù)雜邏輯推理(如數(shù)學(xué)題求解)上準(zhǔn)確率較低。在復(fù)雜推理任務(wù)表現(xiàn)卓越,尤其擅長數(shù)學(xué)、代碼推理任務(wù),在部分基準(zhǔn)測試(如GPQA)中準(zhǔn)確率高于GPT-4o。多模態(tài)支持支持文本、圖像、音頻乃至視頻輸入,可處理多種模態(tài)信息。當(dāng)前主要支持文本輸入,不具備圖像處理等多模態(tài)能力。應(yīng)用場景適合廣泛通用任務(wù),如對話、內(nèi)容生成、多模態(tài)信息處理以及多種語言相互翻譯和交流;面向大眾市場和商業(yè)應(yīng)用。適合需要高精度推理和邏輯分析的專業(yè)任務(wù),如數(shù)學(xué)競賽、編程問題和科學(xué)研究;在思路清晰度要求高的場景具有明顯優(yōu)勢,比如采訪大綱、方案梳理;在對中文語言表達(dá)和情感表達(dá)方面有明顯優(yōu)勢。用戶交互體驗提供流暢的實時對話體驗,支持多種輸入模態(tài);用戶界面友好,適合大眾使用??烧故敬蟛糠宙?zhǔn)剿伎歼^程,便于專業(yè)用戶理解推理過程;界面和使用體驗具有較高的定制性,但整體交互節(jié)奏較慢。推理模型的優(yōu)劣勢優(yōu)勢劣勢-演繹或歸納等推理能力強(如謎題、數(shù)學(xué)證明)-響應(yīng)速度慢且計算成本高(需要更多推理時間)-鏈?zhǔn)剿季S推理出色(善于分解多步驟問題)-基于知識的任務(wù)更容易出錯(容易產(chǎn)生幻覺)-擅長復(fù)雜決策任務(wù)-處理簡單任務(wù)的時候效率低(容易"過度思考")-可以呈現(xiàn)思考過程常見推理模型DeepSeekR1OpenAI

o1OpenAI

o3-miniGemini

2.0Grok3Kimi

1.5火爆全網(wǎng)的DeepSeek-R1爆火原因DeepSeek-R1的推理能力進(jìn)入了第一梯隊(媲美OpenAI

o1),但訓(xùn)練和推理成本低、速度快、全部開源DeepSeek打破了硅谷傳統(tǒng)的“堆算力、拼資本”的大模型發(fā)展路徑對AI行業(yè)的重大影響DeepSeek-R1以低成本和開源特性打破以往頭部企業(yè)巨頭割據(jù)局面DeepSeek-R1的API定價僅為行業(yè)均價的1/10,推動了中小型企業(yè)低成本接入AI,對行業(yè)產(chǎn)生了積極影響DeepSeek-R1促使行業(yè)開始從

“唯規(guī)模論”轉(zhuǎn)向更加注重

“性價比”和“高效能”方向010203打破壟斷價格下調(diào)推動創(chuàng)新DeepSeek公司2025年1月20日推出DeepSeek-R1推理模型作為由知名私募巨頭幻方量化孕育而生的公司,DeepSeek獲得了強大的資金支持和行業(yè)影響力,幻方量化與九坤投資、明汯投資、靈均投資并稱量化私募領(lǐng)域的“四大天王”,管理資金規(guī)模均超過600億元。這為DeepSeek提供了清晰的市場定位和投資者背景術(shù)推動人工智能在多個領(lǐng)域的應(yīng)用和創(chuàng)新DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技企業(yè),專注于人工智能基礎(chǔ)技術(shù)的研究與開發(fā)公司成立背景與發(fā)展歷程大語言模型(LLM)

DeepSeek專注于開發(fā)先進(jìn)的大語言模型(LLM)和相關(guān)技術(shù),旨在通過這些技的創(chuàng)新應(yīng)用投資者背景與市場定位里程碑DeepSeek產(chǎn)品信息官方渠道官網(wǎng):新聞:/zh-cn/news/news250120Github:/deepseek-ai/對話:DeepSeek模型系列DeepSeek最新的生成模型和推理模型版本對比比較方面生成模型(V3)推理模型(R1)設(shè)計初衷想要在各種自然語言處理的任務(wù)中都能表現(xiàn)好,更通用重點是為了搞定復(fù)雜的推理情況,比如深度的邏輯分析和解決問題性能展現(xiàn)在數(shù)學(xué)題、多語言任務(wù)還有編碼任務(wù)里表現(xiàn)不錯,像Cmath能得90.7分,Human

Eval編碼任務(wù)通過率是65.2%在需要邏輯思考的測試?yán)锖馨?,比如DROP任務(wù)F1分?jǐn)?shù)能達(dá)到92.2%,AIME2024的通過率是79.8%應(yīng)用的范圍適合大規(guī)模的自然語言處理工作,像對話式AI、多語言翻譯還有內(nèi)容生成等等,能給企業(yè)提供高效的AI方案,滿足好多領(lǐng)域的需求適合學(xué)術(shù)研究、解決問題的應(yīng)用和決策支持系統(tǒng)等需要深度推理的任務(wù),也能拿來當(dāng)教育工具,幫學(xué)生鍛煉邏輯思維DeepSeek-R1工作原理思維鏈(Chain

of

Thought)讓模型進(jìn)行慢思考蒸餾(Distillation)在不損失能力的情況下縮小模型強化學(xué)習(xí)(Reinforcement

Learning)讓模型自我探索和訓(xùn)練DeepSeek

R1論文:/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdfDeepSeek

R1論文圖解:/p/20844750193DeepSeek-R1版本模型名稱DeepSeek-R1-671B滿血版,能力最強DeepSeek-R1-Distill-Qwen-7B蒸餾版,能力稍弱--實際上是增加了推理能力的Qwen或Llama模型DeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Llama-70B部署DeepSeek-R1滿血版的算力要求和性能DeepSeek-R1的優(yōu)勢理科能力強,且準(zhǔn)確率高數(shù)學(xué)推理代碼生成復(fù)雜任務(wù)處理DeepSeek-R1的局限通用能力R1的通用能力(尤其是生成能力)低于DeepSeek-V3R1的幻覺仍舊比較明顯(可能源于R1的中文語言表達(dá)能力更強)語言混雜R1在處理非中英文問題時,偶爾會出現(xiàn)語言混雜現(xiàn)象這個現(xiàn)象在R1

Zero版本中更加明顯提示詞工程使用few-shot提示可能會降低R1性能使用過多的過程指導(dǎo)指令可能會降低R1的推理能力DeepSeek-R1應(yīng)用場景推理密集型任務(wù)編程任務(wù)中的代碼生成、算法設(shè)計,媲美Claude

3.5

Sonet數(shù)學(xué)問題求解、科學(xué)推理和邏輯分析等需要復(fù)雜推理的場景。教育與知識應(yīng)用可用于解決教育領(lǐng)域的問題,支持知識理解與解答??捎糜诳蒲腥蝿?wù)的實驗設(shè)計、數(shù)據(jù)分析和論文撰寫。文檔分析與長上下文理解適合處理需要深入文檔分析和理解長上下文的任務(wù),例如復(fù)雜信息提取與整合。開放領(lǐng)域問答與寫作在內(nèi)容生成、問題回答以及創(chuàng)造性寫作中具有廣泛應(yīng)用,例如生成高質(zhì)量文本或進(jìn)行內(nèi)容編輯。如何使用DeepSeek

R1DeepSeek官方網(wǎng)站和官方app騰訊系騰訊元寶微信AI搜索騰訊ima個人知識庫AI搜索秘塔搜索納米AI搜索知乎直答其它接入DeepSeek-R1的產(chǎn)品Molly

R1(向量智能)問小白接入DeepSeek

R1第三方服務(wù)的廠家互聯(lián)網(wǎng)大廠:騰訊:騰訊元寶、ima、微信、騰訊云百度:百度搜索、文小言字節(jié)跳動:豆包、扣子、飛書阿里:釘釘……互聯(lián)網(wǎng)小廠:科大訊飛、知乎、秘塔、納米AI搜索、……AI初創(chuàng)公司:零一萬物、階躍星辰、minmax、……AI應(yīng)用公司(教育類):學(xué)而思、北大青鳥、網(wǎng)易有道、猿輔導(dǎo)、作業(yè)幫、…...手機廠商:華為、榮耀、魅族、......其它云服務(wù)平臺:三大運營商、云服務(wù)商(硅基流動等)AIGC的概念和應(yīng)用PART

02簡介本部分著重介紹人工智能生成內(nèi)容(AIGC)的定義、應(yīng)用范圍及其在各行業(yè)的實際影響:首先梳理AIGC相關(guān)的術(shù)語,包括AI、AGI、生成式AI和決策式AI等,明確了其在人工智能領(lǐng)域的定位。隨后,詳細(xì)列舉AIGC在文本、圖像、音頻和視頻生成方面的多樣化應(yīng)用,并探討其在電商、新聞傳媒、影視、游戲、教育和金融等行業(yè)的具體實踐,展示AIGC在提升效率、降低成本和增強創(chuàng)新方面的核心價值。此外,還分析AIGC帶來的挑戰(zhàn),如數(shù)據(jù)隱私、倫理問題、生成質(zhì)量控制以及對就業(yè)結(jié)構(gòu)的影響。通過深入探討AIGC的應(yīng)用現(xiàn)狀和未來趨勢,本部分旨在幫助讀者全面理解AIGC的潛力和影響,為應(yīng)對技術(shù)變革提供參考。本部分的內(nèi)容參考了《人工智能通識課(微課版)》和相關(guān)的視頻(B站的思睿觀通)初識AIGC眼花繚亂的名詞眼花繚亂的名詞AI(人工智能)AGI(通用人工智能)(artificial

general

intelligence)決策式AIAIGCChatGPTAI

Generated

Content(人工智能生成內(nèi)容)生成式AIAIGC能干什么生成視頻生成音頻生成文本生成圖像生成內(nèi)容AI文本Perplexity知?直答秘塔AI搜索引擎納米AI搜索微信搜索(DeepSeek

R1、元寶)小紅書的筆記助手短視頻平臺的內(nèi)容創(chuàng)意自動回復(fù)機器人企業(yè)微信的智能回復(fù)英國廣播公司(BBC)的Juicer彭博社的Cyborg新華社的快筆小新人民日報的創(chuàng)作大腦第一財經(jīng)的DT稿王微軟“小冰”出版詩集AI撰寫劇本電影《陽春》百萬字小說《天命使徒》清華大學(xué)的《機憶之地》CursorWindsurfMarsCodeGitHub

Copilot阿里云通義靈碼新聞作品創(chuàng)作社交媒體代碼AI搜索AI繪畫太空歌劇院2022年8月,獲得比賽

“數(shù)字藝術(shù)/數(shù)字修飾照片”一等獎AI繪畫AI繪畫新西湖繁勝全景圖全景圖是一副百米畫卷,再現(xiàn)了當(dāng)下西湖邊的景觀特色、生活場景,還有一些已經(jīng)消失的景觀,比如曾經(jīng)聞名遐邇的大佛寺。圖中包含5000個建筑,作者白小蘇說如果這些建筑都要自己親手畫,一天畫10個都要500天。最后他借助于AI技術(shù),在一年內(nèi)完成了作品AI音頻語音對話語音克隆創(chuàng)作音樂AI視頻千秋詩頌視頻特效視頻添加圖片AIGC的行業(yè)應(yīng)用AIGC的行業(yè)應(yīng)用各行各業(yè)...電商行業(yè)01其它行業(yè)(教育、金融...)06新聞傳媒03內(nèi)容廣告02影視行業(yè)04游戲行業(yè)05電商行業(yè)商品3D模型改善購物體驗AI模特產(chǎn)品拍攝降本增效虛擬主播提升直播帶貨效率內(nèi)容廣告全流程參與提高效率雪花啤酒虛擬偶像提升品牌宣傳效果錄音語音轉(zhuǎn)寫智能新聞寫作智能視頻剪輯應(yīng)用場景拓展應(yīng)用功能升級應(yīng)用形態(tài)完善采編環(huán)節(jié)傳播環(huán)節(jié)對傳媒機構(gòu)對媒體從業(yè)者對傳媒用戶大幅提高生產(chǎn)效率,并帶來新的視覺化、互動化體驗;豐富了新聞報道的形式,推動傳媒向智媒轉(zhuǎn)變將部分采編、播放工作自動化,讓其更專注于思考創(chuàng)造如將精力集中于深度報道專題報道等更需發(fā)揮人類精準(zhǔn)分析事物、妥善處理情感的領(lǐng)域;短時間獲得更多新聞,提高獲取及時性及便捷性;降低傳媒門檻,使得受眾可以參與內(nèi)容生產(chǎn),增強參與感AIGC對傳媒行業(yè)參與主體的影響新聞傳媒傳媒影視行業(yè)影視劇本文稿創(chuàng)作拓展角色范疇賦能影視剪輯拓展場景空間AIGC游戲研發(fā)環(huán)節(jié)作用游戲行業(yè)01體驗02功能03角色04劇情05策略增強游戲體驗特定風(fēng)格模擬:AI通過模仿職業(yè)選手,玩家則感覺像在與真實的職業(yè)選手對抗;玩法教學(xué):幫助玩家快速熟悉操作與游戲玩法,提高游戲可玩性。前期平衡性測試:充分模擬玩家在某套數(shù)值體系下的游戲體驗,提出優(yōu)化策略;游戲功能測試:針對性找出游戲交互的可能性,發(fā)現(xiàn)潛在漏洞輔助游戲策劃。游戲性能測試NPC角色生成AI創(chuàng)造不同的面孔、服飾、聲音甚至性格特征,甚至可同步驅(qū)動嘴型、表情等面部變化,達(dá)到 高度逼真;并通過大量數(shù)據(jù)模擬人類運動,完成行走、跑步等一系列動作反應(yīng)。AI智能NPC能夠分析玩家的實時輸入,與玩家動態(tài)交互,構(gòu)建幾乎無限且不重復(fù)的劇情;AI能夠生產(chǎn)相關(guān)的圖文、音樂等,創(chuàng)造游戲素材,輔以劇情鋪排,提升劇情飽滿度。劇情生成游戲策略生成讓AI感知環(huán)境、自身狀態(tài)并基于特定目標(biāo)決定當(dāng)下需要執(zhí)行的動作,基于特定問題和場景,自主提出解決方案。游戲運營環(huán)節(jié)AI自動化廣告投放:目前抖音等平臺的廣告分發(fā)、內(nèi)容推薦已通過算法實現(xiàn),且效果較高;生成廣告素材:素材主要是圖像及音視頻內(nèi)容,預(yù)計AIGC的加持下廣告素材生成會更高效、高質(zhì)量;玩家分類提升體驗:通過不同玩家的數(shù)據(jù),將用戶細(xì)分類型,為不同類型玩家提供獨特的玩法,提高用戶體驗。其他行業(yè)教育行業(yè)金融行業(yè)其它自動批改作業(yè)和考試虛擬實驗室生成學(xué)習(xí)資料翻譯文獻(xiàn)資料其它風(fēng)險管理自動處理和分析金融文檔合規(guī)管理AIGC的未來AIGC的核心價值降本增效增強創(chuàng)新企業(yè)賦能個人賦能AIGC的挑戰(zhàn)數(shù)據(jù)隱私及安全泄露隱私數(shù)字身份冒用制作虛假信息詐騙知識產(chǎn)權(quán)挑戰(zhàn)侵權(quán)與被侵權(quán)生成質(zhì)量結(jié)果幻象、可控性、理解能力生成精準(zhǔn)度、還原度、仿真度倫理挑戰(zhàn)社會偏見、性別歧視等“復(fù)活”逝者損害已故人的隱私權(quán)01020304AIGC的未來AIGC的生成質(zhì)量和準(zhǔn)確性將得到提升在更多領(lǐng)域得到應(yīng)用,如保險、醫(yī)療和法律

服務(wù)等更多地與人類專家協(xié)作,以提供更高質(zhì)量的內(nèi)容和服務(wù)預(yù)計將出現(xiàn)更多關(guān)于內(nèi)容生成和使用的監(jiān)管框架01020304技術(shù)進(jìn)步更廣泛的應(yīng)用人機協(xié)作監(jiān)管框架的發(fā)展生成式人工智能(AI)目前處于期望膨脹期,預(yù)計將在2~5年內(nèi)產(chǎn)生巨大效益到2026年,Gartner預(yù)測超過80%的企業(yè)將使用生成式AI的API或模型,或在生產(chǎn)環(huán)境中部署支持生成式AI的應(yīng)用,而在2023年初這一比例不到5%。數(shù)據(jù)來源:Gartner(2023年8月)工作崗位需求變化顯著上升STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))相關(guān)職業(yè)醫(yī)療保健和其他高技能職業(yè)下降顯著辦公室職員生產(chǎn)工人客戶服務(wù)代表等傳統(tǒng)職業(yè)到2030

年,歐洲和美國多達(dá)30%的工作時間可能實現(xiàn)自動化2024年5月24日麥肯錫報告:《工作的新未來:在歐洲及其他地區(qū)部署人工智能和提升技能的競賽》技能類型需求變化技能類型需求變化技術(shù)技能大幅增長炙手可熱的“新寵”技能是社會和情感技能體力和手動技能的需求預(yù)計將保持大致穩(wěn)定認(rèn)知技能(文字和信息處理、編程、科研、工程等)的需求預(yù)計將減少14%2024年5月24日麥肯錫報告:《工作的新未來:在歐洲及其他地區(qū)部署人工智能和提升技能的競賽》與AI共舞學(xué)習(xí)AIGC基礎(chǔ)知識積極使用AIGC工具關(guān)注AIGC在各行業(yè)的應(yīng)用案例跟蹤最新發(fā)展趨勢A

I

G

C

的能力揭秘PART

03簡介本部分深入剖析AIGC背后的技術(shù)原理,涵蓋文本生成和圖像生成兩大核心領(lǐng)域。通過對比文本生成和圖像生成的不同路徑,大家能夠全面理解AIGC在不同模態(tài)下的工作原理,以及如何利用這些技術(shù)實現(xiàn)高效的內(nèi)容創(chuàng)作和應(yīng)用。在文本生成方面,以O(shè)penAI的GPT-4o為例,詳細(xì)介紹了通用大語言模型(LLM)的工作原理,包括其基于

Transformer架構(gòu)的生成機制、上下文編碼、自注意力機制以及預(yù)訓(xùn)練和微調(diào)過程。探討了GPT-4o在多輪對話、語言轉(zhuǎn)換、意圖理解、文本生成和推理能力等方面的優(yōu)勢,同時也指出其在知識局限、上下文窗口限制和生成幻覺等方面的不足。在圖像生成方面,以StableDiffusion模型為例,解釋了其核心組件(文本編碼器、圖像信息生成器和圖像解碼器)的工作流程,揭示了文生圖和圖生圖技術(shù)的優(yōu)勢與局限。本部分的內(nèi)容參考了《人工智能通識課(微課版)》和相關(guān)的視頻(B站的思睿觀通)。文本生成的奧秘AIGC與GPT(通用大模型的代表)1950s-1990S1990s-2010S2010s-2022年2023年OpenAI

GPT4-多模態(tài)大模型OpenAI

GPT的學(xué)霸養(yǎng)成記GPT:生成式預(yù)訓(xùn)練變換模型(GenerativePre-trainedTransformer)3大核心能力多輪對話任意語言的轉(zhuǎn)換能力意圖和情感理解能力對比能力窮舉能力假設(shè)推理能力文本總結(jié)能力文本改寫能力文本生成能力推理能力創(chuàng)作能力對話能力工作原理-1概率預(yù)測+文字接龍1.收到提示詞示例:“今天天氣不錯,我決定”4.基于上下文預(yù)測下一個token為可能的單詞分配概率分?jǐn)?shù)示例:{“去”:0.7.“停":0.2,“站":0.1}5.根據(jù)概率分?jǐn)?shù)選擇標(biāo)記示例:“去”采用Transformer架構(gòu)處理token理解token之間的關(guān)系識別提示詞的整體含義2.將輸入拆分為token[“今”,“天”,“天”,“氣”,“不”,“錯”,“,”,“我”,“決”,“定”]自回歸:重復(fù)步驟4和步驟5直到形成完整的句子示例:今天天氣不錯,我決定去公園GPTGenerative(生成式)Pre-trained(預(yù)訓(xùn)練)Transformer(變換器)LLM:Large

Language

Model工作原理-2預(yù)訓(xùn)練(自監(jiān)督)監(jiān)督微調(diào)人類反饋強化學(xué)習(xí)接收輸入處理輸入進(jìn)行推理生成輸出上下文+訓(xùn)練知識階段1:模型訓(xùn)練階段2:推理大模型工作過程工作原理-3數(shù)據(jù)來源說明維基百科在線百科,嚴(yán)謹(jǐn)圖書經(jīng)典為主的古登堡計劃和自助出版平臺Smashwords等雜志期刊論文:ArXiv等鏈接WebText,RedditCommon

Crawl開源項目,爬取互聯(lián)網(wǎng)所有數(shù)據(jù)GitHub程序員聚集地合計700

多GB,約有19萬套四大名著的閱讀量5

000億左右的token數(shù)量。(13萬億token:gpt4)100個標(biāo)記大約等于75個英語單詞訓(xùn)練語料(gpt-3)GPT-4o上下文窗口大?。?192個token(標(biāo)記)典型的新技能學(xué)習(xí)曲線:規(guī)模到達(dá)臨界點之后才會迅速增長模型參數(shù):1.8萬億參數(shù)(GPT-4)生成式通用大語言模型的優(yōu)勢與劣勢vs優(yōu)勢劣勢語言理解和生成能力世界知識能力一定的推理能力幻覺(生成錯誤答案)知識庫有限上下文窗口限制如何與GPT對話多輪對話引導(dǎo)基本對話方法對話工具:ChatGPTPOE各種對話能力邊界智慧對話使用對話工具ChatGPT:聊天機器人應(yīng)用訪問地址:/GPT:大語言模型GPT-3.5、GPT-4o對話能力-多輪對話上下文編碼自注意力機制原理上下文窗口限制問題+回答總數(shù)包括字符、標(biāo)點、空格限制分段對話定期總結(jié)使用關(guān)鍵詞提醒精簡輸入使用建議GPT-3.5:4096,大約3000個英文 單詞或4000個漢字GPT-4:8192,大約6000個英文單詞或8000個漢字(/tokenizer)對話能力-語言轉(zhuǎn)換能力人類語言之間轉(zhuǎn)換機器語言之間轉(zhuǎn)換人類語言與機器語言之間轉(zhuǎn)換不同語言人類語言生成能力不同

前5名:英語、西班牙語、 法語、德語、中文機器語言生成能力不同前4名:python、Java、Typescript、Javascript限制GPT:使用英文中文優(yōu)先選擇國內(nèi)產(chǎn)品編程盡量選用前4種語言使用建議對話能力--意圖和情感分析能力真實意圖情緒識別判斷行為特點重要他人能力缺乏真正的情感上下文理解有限缺乏深層次推理限制提供清晰具體的信息簡短和連貫的對話使用明確的情感表達(dá)使用建議創(chuàng)作能力文本分析能力最強文本潤色修改能力強文本生成能力不可控創(chuàng)作能力-文本分析能力文本統(tǒng)計統(tǒng)計字符數(shù)、單詞數(shù)、句子數(shù)等基本統(tǒng)計信息文本摘要從長文檔中提取主要信息,并生成一個簡短的概述文本分類新聞分類、情感分析(正面、負(fù)面、中性)文本總結(jié)文本的整體內(nèi)容進(jìn)行簡要概述,通常比文本摘要更為簡短知識更新、長文本理解、數(shù)據(jù)偏見、數(shù)據(jù)質(zhì)量、語境歧義、領(lǐng)域?qū)I(yè)知識、新穎和未知類別、不確定性限制創(chuàng)作能力-文本潤色能力限制新詞匯與表達(dá)、語境誤判、高度主觀性、

文化敏感性和幽默、不斷更新的語言規(guī)則、知識更新限制、長文本處理能力、用戶意圖識別文本校對錯別字識別與修改、語法錯誤檢查與修正、標(biāo)點符號調(diào)整、詞匯選擇優(yōu)化、語句重組與調(diào)整、保持一致的寫作風(fēng)格文本改寫口語轉(zhuǎn)書面語、不同體裁風(fēng)格、語義保持、文本簡化、文本優(yōu)化、保持一致性文本擴寫增加細(xì)節(jié)、舉例說明、提供背景信息、解釋專業(yè)術(shù)語或概念、描述過程或步驟、增加文學(xué)修辭、提供多種觀點等創(chuàng)作能力-使用建議使用優(yōu)先級文本分析>文本潤色>文本生成分段處理長文本明確和具體的指示補充背景信息注意多義詞和模糊表達(dá)推理能力限制對比能力

對比分析:事物、概念、人物、事件、文學(xué)作品、藝術(shù)作品等列舉能力

簡單列舉任務(wù):組合/排列/序列,簡單數(shù)學(xué)問題等假設(shè)推理能力

多個領(lǐng)域能力不同:歷史事件、文學(xué)作品解讀等

主觀判斷、上下文窗口、非專業(yè)算法、數(shù)據(jù)局限、缺乏常識和領(lǐng)域?qū)iL、模型理解能力、過度生成偏見、難以驗證答案的準(zhǔn)確性使用建議明確問題和期望補充背景信息結(jié)合領(lǐng)域知識基本對話和多輪對話

追問澄清引導(dǎo)多輪對話學(xué)會提問

明確、具體、避免歧義邏輯清晰

上下文信息示范數(shù)據(jù)驗證輸出

從回復(fù)中找到有價值的部分判斷結(jié)果質(zhì)量:初步識別可靠信息評估信息準(zhǔn)確性:與其他來源進(jìn)行對比處理錯誤信息:指出錯誤,重新提問基本對話圖像生成的奧秘Stable

Diffusion模型如何實現(xiàn)圖像生成?文生圖圖生圖Stable

Diffusion模型的構(gòu)成三大核心組件文本編碼器圖像信息生成器圖像解碼器(翻譯官)(工匠)(畫家)文本編碼器解析用戶輸入的提示詞將提示詞轉(zhuǎn)化為高維向量表示圖像信息生成器將輸入信息逐步處理和轉(zhuǎn)換為圖像數(shù)據(jù)圖像解碼器接收來自圖像信息生成器的處理后的信息矩陣將信息矩陣轉(zhuǎn)換為可視化的圖像文生圖的優(yōu)勢與局限局限精確控制困難隨機性太強復(fù)雜場景理解優(yōu)勢降低門檻提高效率藝術(shù)風(fēng)格多樣化選擇AIGC工具PART

04簡介本部分聚焦于如何科學(xué)選擇和高效應(yīng)用AIGC工具,以滿足不同場景下的多樣化需求。首先介紹當(dāng)前AIGC領(lǐng)域的工具類型,包括聊天對話機器人、圖像生成工具、音頻與視頻生成工具以及搜索工具等,并列舉了國內(nèi)外代表性工具。隨后,以DeepSeek-R1、Kimi、豆包、騰訊元寶等具體工具為例,詳細(xì)分析了它們的特點、優(yōu)勢及適用場景,展示了不同工具在推理能力、多模態(tài)支持、長文本處理和搜索效率等方面的差異。最后,還提出了選擇AIGC工具的依據(jù),包括明確需求、評估工具性能和考慮使用成本等,幫助讀者根據(jù)自身需求做出合理選擇。通過深入分析和對比,本部分旨在為讀者提供一份實用的AIGC

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論