2025DeepSeek大模型概念、技術(shù)與應(yīng)用實踐_第1頁
2025DeepSeek大模型概念、技術(shù)與應(yīng)用實踐_第2頁
2025DeepSeek大模型概念、技術(shù)與應(yīng)用實踐_第3頁
2025DeepSeek大模型概念、技術(shù)與應(yīng)用實踐_第4頁
2025DeepSeek大模型概念、技術(shù)與應(yīng)用實踐_第5頁
已閱讀5頁,還剩251頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

在當(dāng)下及未來發(fā)展中的重要地位與深遠影響,共同探索如何借助大模型的力量推動社1.11950年,“計算機之父”和“人工智能之父”艾倫·圖靈(AlanMTuring)發(fā)表了論文《計算機器與智能》,這篇論文被譽1.21.2在這次會議上,“人工智能”這個詞匯被約翰.麥卡錫(JohnMcCarthy)首次提出。與會者們不僅對人工智能的研究和應(yīng)用1.31.452

3.13.1達到1.8萬億,2021年11月阿里推出的M6模型的參數(shù)量達10萬億

3.23.2萌芽期(1950-這是一個以CNN(ConvolutionalNeuralNetworks,卷積神經(jīng)網(wǎng)絡(luò))沉淀期(2006-AdversarialNetworks,對抗式生成網(wǎng)絡(luò))誕生,標志著深度學(xué)習(xí)進是GenerativePre-TrainedTransformer,是一種基于互聯(lián)網(wǎng)的、可爆發(fā)期(2020-至今2020年6月,OpenAI公司推出了GP-3,模型參數(shù)規(guī)模達到了1750億,成為當(dāng)時最大的語言模型,并且在零樣本學(xué)習(xí)任務(wù)上實現(xiàn)了巨大性能提升。隨后,更多策略如基于人類反饋的強化學(xué)習(xí)(RLHF,Reinforcementgmn2022年1月,搭載了GPT3.5的ChatGPT(ChatGenerativePre-trainedransformer)橫空出世,憑借逼真的自然語言交互與多場景內(nèi)容生成能力,迅速引爆互聯(lián)網(wǎng),在全球范圍內(nèi)引起轟動,使得大模型的概念迅速進入普通大眾的視野。ChatGPT是人工智能技術(shù)驅(qū)動的自然語言處理工具,它能夠通過理解和學(xué)習(xí)人類的語言來進行對話,還能根據(jù)聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、爆發(fā)期(2020-至今人工智能包含了機器學(xué)習(xí),機器學(xué)習(xí)包含了深度學(xué)習(xí),深度學(xué)習(xí)可以采用不同的模型,其中一種模型是預(yù)訓(xùn)練模型,預(yù)訓(xùn)練模型包含了預(yù)訓(xùn)練大模型(可以簡稱為“大模型”),預(yù)訓(xùn)練大模型包含了預(yù)訓(xùn)練大語言模型(可以簡稱為“大語言模型”),預(yù)訓(xùn)練大語言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT開發(fā)的大模型產(chǎn)品,文心一言是基于文心ERNIE開發(fā)的大模型產(chǎn)品

文心.1Gemini包括三種不同規(guī)模的模型:GeminiUltra、GeminiPro和GeminiNano,適用于不同任務(wù)和設(shè)備。2023年12月6日,Gemini的初始版本已在Bard中提供,開發(fā)人員版本可通過GoogleCloud的API獲得。Gemini可以應(yīng)用于Bard和Pixel8式踏入了通用人工智能(AGI:ArtificialGeneralIntelligence)的時代。AGI是指能夠像人類一樣進行各種智能活動的機器智能,包括理解語言、識別圖像、進行復(fù)雜推理等。Sora大模型能夠直接輸出長達60秒的視頻,并且視頻中包含了高度細致的背景、復(fù)雜的多角度鏡頭,以及富有情感OpenAI3.4.2即夢3.4.2和推理任務(wù)上可與OpenAIo1媲美。.23.53.5大模型是基于ransformer架構(gòu)的,這種架構(gòu)是一種專門用于自然語言處理的“編碼

3.63.6理解能力。通過多任務(wù)學(xué)習(xí),大模型可以在不同的NLP(NaturalLanguageProcessing)任務(wù)因此需要高性能的硬件設(shè)備來支持。通常,訓(xùn)練大模型需要使用GPU(GraphicsProcessingUnit,圖形處理器)或TPU(TensorProcessingUnit,張量處理器)等專用加速器來提高計算在特定任務(wù)的數(shù)據(jù)上進行微調(diào)在特定任務(wù)的數(shù)據(jù)上進行微調(diào)跨領(lǐng)域的應(yīng)用能力跨領(lǐng)域的應(yīng)用能力3.73.7 是指在自然語言處理(NaturalLanguageProcessing,NLP)領(lǐng)域中的一類大模型,通常用于處理文本數(shù)據(jù)和理解自然語言。這類大模型的主要特點是它們在大規(guī)模語料庫上進行了訓(xùn)練,以學(xué)習(xí)自然語言的各種語法、語義和語境規(guī)則。代表性產(chǎn)品包括GPT系列(OpenAI)、Bard

是指在計算機視覺(ComputerVision,CV)領(lǐng)

3.83.8

大模型在自然語言處理、機器翻譯等領(lǐng)域的應(yīng)用,使得人們能夠快速、準確地處理大量文在翻譯領(lǐng)域,大模型能夠自動翻譯多種語言,減少人工翻譯

大模型能夠收集、整理和分析大量的數(shù)據(jù),通過數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù),幫助人們更準確地了解問題現(xiàn)狀,預(yù)測未來

大模型的發(fā)展使得一些繁瑣、從而減輕了人們的工作負擔(dān)。例如,在金融領(lǐng)域,大模型可以自動分析大量的金融數(shù)據(jù),

隨著大模型的普及和應(yīng)用,將創(chuàng)造??許多新的就業(yè)機會。例如,需要更多的人來開發(fā)和維護大模型,也需要更多的人來大模型在智能家居、智能客服等領(lǐng)域的例如,通過智能家居系統(tǒng),人們可以通

安裝下載DeepSeek運行DeepSeek使用OpenWebUI具體安裝過程請參考廈門大學(xué)數(shù)據(jù)庫實驗室博 3.113.11智能體(AIAgent),又稱“人工智能代理”,是一種模仿人類智能行為的智能化系統(tǒng),它就像是擁有豐富經(jīng)驗和知識的“智慧大腦”,能夠感知所處的環(huán)境,并依據(jù)感知結(jié)果,自主地進行規(guī)劃、決策,進而采取行動以達成特定目標。簡單來說,智能體能夠根據(jù)外部輸入做出決策,并通智能體本身既不是單純的軟件也不是硬件,而是一個更為寬泛的概念,它們可以是軟件程序、機器人或其他形式的系統(tǒng),具備一定的自主性和智基于大模型的智能體是指利用大語言模型(如GPT、BERT等)作為核心組件,構(gòu)建的能夠執(zhí)2025年1月23日,OpenAI發(fā)布了一個創(chuàng)新性的智能體——Operator,它是一個能夠像人類一樣使用計算機的智能體。它基于OpenAI最新研發(fā)的CA(Compue-UsingAgent)模型,CA將GPT-4o的視覺功能與通過強化學(xué)習(xí)獲得的高級推理相結(jié)合,經(jīng)過訓(xùn)練可以與圖形用戶界面(GUI,即人們在屏幕上看到的按鈕、菜單和文本字段)進行交互。Operator通過觀察屏幕并使用虛擬鼠標和鍵盤來完成任務(wù),而無需依賴專門的API接口。這種設(shè)計使其可以適配任何為人類設(shè)計的軟件界面,帶來極高的靈活性。Operaor好比一個博士水平的個人助理,你給他一個復(fù)雜的任務(wù),它就會自動執(zhí)行。Operaor的主要功能包括自主完成諸如采購雜貨、提交費用報表、訂票、買日用品、填寫表格等任務(wù),旨在通過自動化操作提升日常生活和工作效率。它還可以一邊在tubHub搜索勇士隊比賽門票,一邊處理網(wǎng)球場預(yù)訂、尋找清潔服務(wù)和DoorDash訂餐,實現(xiàn)多任務(wù)并行處理。2025年2月3日,OpenAI發(fā)布了一款新的智能體產(chǎn)品——Deepeseach。Deepeseach由OpenAIo3模型的一個版本提供支持,該模型針對網(wǎng)頁瀏覽和數(shù)據(jù)分析進行了優(yōu)化,它利用推理來搜索、解釋和分析互聯(lián)網(wǎng)上的大量文本、圖像和PDF,并根據(jù)需要根據(jù)遇到的信息做出調(diào)整。Deepeseach具有以下四大核心技術(shù):41AIGC什么是AIGC的全稱為“ArtificialIntelligenceGeneratedContent”,中文絡(luò)(GAN,GenerativeAdversarialNetworks)、大型預(yù)訓(xùn)練模型、多模態(tài).3AIGC生成商品標題、描述、廣寫周報日報,寫方案,寫生成商品標題、描述、廣寫周報日報,寫方案,寫運營活動,制作PPT,寫生成場景原畫,生成角色形象,生成世界觀,生成數(shù)值,生成3D頭像生成,照片修復(fù),圖生成分鏡頭腳本,生成劇本腳本,臺詞潤色,生成原畫繪制,動畫生成,分鏡原畫繪制,動畫生成,分鏡寫詩,寫小說,生成藝術(shù)創(chuàng)作品,草圖生成,藝術(shù)風(fēng)格UIUI軟文撰寫,大綱提煉,熱點軟文撰寫,大綱提煉,熱點AIGC技術(shù)的快速發(fā)展為傳統(tǒng)行業(yè)帶來了轉(zhuǎn)型升級的契機。通過與AIGC新興職業(yè)的??隨著AIGC技術(shù)的快速發(fā)展,一系列與該技新興職業(yè)的??隨著AIGC技術(shù)的快速發(fā)展,一系列與該技AIGC技術(shù)也為傳統(tǒng)職業(yè)的轉(zhuǎn)型升級提供了等,在AIGC技術(shù)的輔助下,工作效率和創(chuàng)AIGC技術(shù)改變了傳統(tǒng)的工作方式,使得遠采用AIGC技術(shù)來優(yōu)化工作流程,減少人力AIGC技術(shù)的發(fā)展為職業(yè)發(fā)展路徑提供了更多的可能性。從業(yè)者可以根據(jù)自己的興趣和特長,選擇適合自己的職業(yè)發(fā)展方向。例如,一些對AI技術(shù)感興趣的從業(yè)者可以選擇成為AI意和設(shè)計才能的從業(yè)者則可以利用AIGC面對AIGC技術(shù)的快速發(fā)展,從業(yè)者需要不作輔助、內(nèi)容創(chuàng)作、智能客服等多個領(lǐng)域引導(dǎo)生成引導(dǎo)生成增強交互性提高準確性4.1.7AIGC基本原則:簡單直接,自然表達。①無需復(fù)雜結(jié)構(gòu)。直接描述需求即可,無需添加“角色扮演”(如“假設(shè)你是專家”)或復(fù)雜指令(如“用學(xué)術(shù)語言分三點回答”)。比如,你可以直接向DeepSeek提問“什么是光合作用?”、“如何用Python寫一個計算器程序?”,而不建議使用提示詞“請以生物學(xué)教授的身份,用三個段落解釋光合作用,每段不超過100字”。②多輪對話優(yōu)化結(jié)果。如果首次回答不完整,可通過追問補充細節(jié),無需一次性給出完美提示。比如,第一輪提問“寫一首關(guān)于秋天的詩”,第二輪提問“加入一些悲傷的情緒”,第三輪提問“把‘落葉’換成比喻句”。不同場景的提問技巧(非必需,但可提升效率)。雖然簡單提問即可滿足大多數(shù)需求,但在復(fù)雜任務(wù)中,適當(dāng)提供背優(yōu)化后的提問是“用通俗易懂的語言解釋量子糾纏,適合高中生理解”,②創(chuàng)作類任務(wù)(寫作、編程等)。比如,基礎(chǔ)提問是“寫一個關(guān)于人工智能的科幻短篇故事”,優(yōu)化后的提問是“寫一個反烏托邦主題的科幻故事,主角是女性工程師,結(jié)局有反轉(zhuǎn)”。③實用建議(學(xué)習(xí)、工作等)。比如,基礎(chǔ)提問是“如何提高英語聽力?”,優(yōu)化后的提問是“我每天只有30分鐘學(xué)習(xí)時間,有哪些高效的英語聽力練習(xí)方法?”。④復(fù)雜任務(wù)(數(shù)據(jù)分析、代碼調(diào)試)。比如,基礎(chǔ)提問是“這段Python代碼報錯了,幫我看看問題”,優(yōu)化后的提問是“我的代碼目標是爬取網(wǎng)頁數(shù)據(jù),但遇到SSL證書錯誤。報錯信息如下:[粘貼代碼]”。作為初學(xué)者,DeepSeek的一些“魔法”指令也很有用,比如,你可以輸入“/步驟如何??機拍攝旅游照?”,DeepSeek返回的回答結(jié)果就會按照步驟詳細給出拍攝旅游照片的說明,再比如,你可以輸入“請解釋量?計算,然后/簡化”,它就會返回比較簡明扼要的回答。表點擊DeepSeek界面中的「回形針」圖標上傳?件,支持的文件類型包括文本類(PDF、DOCX、TXT、Markdown)數(shù)據(jù)類(CSV、XLSX)和圖像類(JG、PNG)。然后,就可以在對話框中輸入提示詞,比如,可以輸入“總結(jié)這份年報的三個核?要點”、“提取合同中的責(zé)任條款制成表格”、“對??檔A和?檔B的市場策略差異”、“從實驗報告中整理所有溫度數(shù)據(jù)”、“請識別圖片中的文字”等。也可以使用一些指令來處理文檔,如表7-2所示。500AvsB.docx關(guān)鍵增長點用請按照要求寫一篇200請按照要求寫一篇200字左右關(guān)于云計算的介紹。注意事項:文章的受眾是中學(xué)生,需要通俗易懂,語言風(fēng)格需要幽默、風(fēng)趣一些構(gòu)撰寫一份關(guān)于我國芯片行業(yè)的總結(jié)報告構(gòu)撰寫一份關(guān)于我國芯片行業(yè)的總結(jié)報告我希望你能扮演記者的角色,按照我的要求撰寫一份新聞?wù){(diào)查,要求:調(diào)查油罐車不清洗直接運送食用油的事情,不要出現(xiàn)具體企業(yè)名稱,要給出政府部門的處理態(tài)度我希望你能扮演記者的角色,按照我的要求撰寫一份新聞?wù){(diào)查,要求:調(diào)查油罐車不清洗直接運送食用油的事情,不要出現(xiàn)具體企業(yè)名稱,要給出政府部門的處理態(tài)度請你作為一個小紅書文案撰寫高手,為我生成一篇爆款小紅書文案,要求:突出酒店的特色,包括海景房、豪華單間、最新裝修、免費早餐、無線上網(wǎng)等請你作為一個小紅書文案撰寫高手,為我生成一篇爆款小紅書文案,要求:突出酒店的特色,包括海景房、豪華單間、最新裝修、免費早餐、無線上網(wǎng)等在6在6G專利申請方面,中國已經(jīng)遙遙領(lǐng)先。2021年的數(shù)據(jù)顯示,中國的6G專利申請量占比高達403%,穩(wěn)坐世界第一的寶座。請把上面的數(shù)據(jù)更新到目前最新的數(shù)據(jù)請以小紅書的風(fēng)格,按照以下要求幫我為“海景美食餐廳”寫一篇小紅書種草文案;內(nèi)容要求:要有標題、正文標題字數(shù):不超過請以小紅書的風(fēng)格,按照以下要求幫我為“海景美食餐廳”寫一篇小紅書種草文案;內(nèi)容要求:要有標題、正文標題字數(shù):不超過20個字;盡量簡短精煉,要足夠吸引眼球,用詞浮夸正文分段,層次分明,每段最少100要用“首先、其次、最后”這種模式整篇文案不要超過1000.22請為我規(guī)劃一次為期一周的廈門自由行;第1步:列出必去的景點,如廈門大學(xué)、鼓浪嶼、環(huán)島路、五緣灣、曾厝垵;第2步:根據(jù)景點位置安排每日行程,確保交通便利;第3步:推薦幾家當(dāng)?shù)氐奶厣蛷d,包括早餐、午餐和晚餐;第4步:提供一家性價比高的酒店住宿建議,并考慮其位置是否便于游覽。我是一位高校教師,請幫我寫一份工作周報,內(nèi)容盡量簡潔精煉,下面是我本周的工作內(nèi)容:完成了5個本科生畢業(yè)論文修改撰寫了教材的一個章節(jié)“云計算與大數(shù)據(jù)”輸出要求示例:我是一位高校教師,請幫我寫一份工作周報,內(nèi)容盡量簡潔精煉,下面是我本周的工作內(nèi)容:完成了5個本科生畢業(yè)論文修改撰寫了教材的一個章節(jié)“云計算與大數(shù)據(jù)”輸出要求示例:【本周工作周報】【本周工作進展】本周做了哪些事,產(chǎn)生了哪些結(jié)果【下周工作安排】基于本周的結(jié)果下周要推進哪些事【思考總結(jié)】簡要說說本周的收獲和反思.33:使用訊飛智文生成發(fā)的一個具體應(yīng)用,主要功能有文檔一鍵生成、AI撰寫助手、多語種文檔生成、AI自動配圖、模板圖示切換功能。請首先準備一個包含文本內(nèi)容的PDF文件,比如,可以從網(wǎng)絡(luò)新聞報道中復(fù)制一段關(guān)于20247月19日微軟藍屏事件的內(nèi)容保存到一個WORD文檔中,命名為“微軟藍屏.docx”,然后,使用WPS軟件打開“微軟藍屏.docx”,把該WORD文檔保存成PDF格式,生成“微軟藍pdf4.2.33:使用訊飛智文生成4.2.33:使用訊飛智文生成4.2.33:使用訊飛智文生成在頁面中(在頁面中(72所示)點擊“開始制作”。在出現(xiàn)的頁面中(如圖73),選擇AIPPT的“文檔創(chuàng)建”。然后,在出現(xiàn)的頁面中(如圖74所示),點擊“點擊上傳”,把本地文件“微軟藍屏.pdf”文件上傳上去(當(dāng)然,也可以上傳“微軟藍屏.docx”)。然后,在出現(xiàn)的頁面中(如圖然后,在出現(xiàn)的頁面中(如圖75所示)開始解析文檔”。之后,頁面會顯示提示文字“好的,已收到您的要求,讓我先為您生成PPT標題和大綱”。過一會兒,就會顯示自動生成的PPT標題和大綱,如果你不滿意,可以點擊頁面底部的“重新生成”,如果滿意,可以直接點擊“下一步”。圖7-2圖7-3AIPPT圖7-4圖7-5在出現(xiàn)的頁面中(如圖76所示),選擇你想要的模板配色,比如,這里選擇“清逸天藍”,然后點擊頁面頂部的“下一步”。經(jīng)過一段時間以后,頁面就會顯示自動生成的PPT(如圖77示),點擊頁面右上角的“導(dǎo)出”,就可以把PPT保存到本地電腦中,然后,可以根據(jù)自己的需求,自己對PPT繼續(xù)進行修改和完善。在本地電腦中打開自動生成的PPT,可以看出,AI制作PPT的水平非常專業(yè),邏輯清晰,配圖精美,超過了很多PPT初級者的制作水平,可以大大提高普通用戶制作PPT的效率和水平。圖7-6AIGCAIGCAIGC通過對圖像進行增強處理,AIGC(2(2)選擇創(chuàng)作模式:進入文心一格首頁以后,點擊“立即創(chuàng)作”。在出現(xiàn)的界面中,在界面左上角位置選擇“AI創(chuàng)作”,可供選擇的模式包括推薦、自定義、商品圖、藝術(shù)字、海報,可以滿足不同的創(chuàng)作需求。這里可以選擇默認的模式“推薦”。圖片類AIGC大模型主要包括Midjourney、StableDiffusionSDXL、百度文心一格等。這里以百度文心一格為((1)注冊賬戶:訪問文心一格官網(wǎng)(https://yigebaiducom/),點擊“注冊”按鈕,完成注冊過程。(3)輸入提示詞:在提示詞輸入框中輸入提示詞,比如輸入“請繪制一張圖片,一個(3)輸入提示詞:在提示詞輸入框中輸入提示詞,比如輸入“請繪制一張圖片,一個9歲的女孩子在海邊沙灘上挖沙子”。(4)設(shè)置畫面類型:可以選擇智能推薦、唯美二次元、中國風(fēng)等各種類型。(5)設(shè)置比例:可以選擇豎圖、方圖、橫圖。(6)設(shè)置數(shù)量:設(shè)置想要生成的圖片的數(shù)量,比如設(shè)置為1(7(7)生成圖片:點擊“立即生成”,就可以生成相應(yīng)的圖片(如圖所示)。圖片生成以后,可以點擊圖片底部的“編輯本圖片”,對圖片進行編輯。

在智能手機上下載并安裝“豆包APP”。啟動進入豆包APP出現(xiàn)如圖所示的對話界面,按住“語音按鈕”(圖中箭頭指向的位置)不要松開,然后就可以對著手機說話,把自己的需求說出來,比如,可以說“請介紹一下廈門大學(xué)”,然后松開“語音按鈕”,豆包就可以立即開始回答你提出的問題。豆包可以支持實時翻譯,你可以語音輸入“廈門大學(xué)的英文名稱是什么”,豆包會馬上給出翻譯結(jié)果。

4.4.2AIGC4.4.2AIGC會給出回答。豆包也支持AI繪圖功能,你可4.4.2AIGC在豆包的操作界面的底部,用手指點擊在豆包的操作界面的底部,用手指點擊“對話”,在出現(xiàn)的功能選擇界面中(圖所示),選擇“英語口語聊天搭子可以進入英語口語聊天界面(如圖所示),按住界面右下角的“語音按鈕”,就可以開始用英語語音聊天了,你說完一句英語,松開語音按鈕,豆包就會自動用英語語音回答你,然后你可以繼續(xù)輸入語音進行后續(xù)對話。圖豆包的功能選擇界 圖豆包的英語口語聊天界這時,會出現(xiàn)訂單支付頁面(如圖41這時,會出現(xiàn)訂單支付頁面(如圖417所示),可以選擇“會員及語音包購買”(45元一個月)或者“單次付費”(20元每次)。完成費用支付以后,就會出現(xiàn)下載提示頁面(如圖418所示)“去下載”,然后,在出現(xiàn)的下載頁面中(如圖419所示),點擊下載按鈕(圖中箭頭指向的位置)就可以把配音文件下載到本地電腦中。在本地電腦播放下載后的配音文件可以發(fā)現(xiàn),現(xiàn)在的AI配音技術(shù)已經(jīng)比較成熟,生成的配音質(zhì)量已經(jīng)可以達到專業(yè)配音員的水平。訪問訊飛配音官網(wǎng)(h訪問訊飛配音官網(wǎng)(httpspeiyinxunfeicn),首先按照頁面提示完成用戶注冊。注冊成功以后,會進入飛智作”頁面(如圖413所示),在頁面頂部選擇“訊飛配音”。在訊飛配音頁面(如圖414所示),輸入你的配音文本內(nèi)容,比如輸入“人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)”??梢栽O(shè)置配音的品質(zhì),點擊頁面左上角“敘述(品質(zhì)),在出現(xiàn)的頁面中(如圖415所示),可以選擇自己喜歡的主播類型,并且允許對主播的語速和語調(diào)進行設(shè)置,然后再點擊頁面右上角的“使用”按鈕。然后,點擊頁面右上角的“生成音頻”,在出現(xiàn)的頁面中(如圖416所示),設(shè)置作品名稱、文件格式和字幕,再點擊“確認”。4.4.2AIGC圖4-13圖4-144.4.2AIGC圖4-154.4.2AIGC圖4-16作品命名頁 圖4-17訂單支付頁4.4.2AIGC圖4-18圖4-19

短視頻與直 廣告與營 教育與培 與媒體融

視頻類AIGC大模型發(fā)端于Sora。2024年2月,美國的OpenAI發(fā)布了全球第一款文生視頻大模型Sora(這由快手推出,被譽為中國版由快手推出,被譽為中國版視頻生成時長可達120秒,支持文生視頻、圖生視頻、視頻續(xù)寫、鏡生數(shù)科技聯(lián)合清華大學(xué)發(fā)布,是中國首個長時長、高一致性、高動態(tài)性視頻大模型,支持一鍵生成16秒由上海人工智能實驗室研發(fā),可生成分鐘級視頻,已用于央視AI動畫片《千秋詩頌》的制作,具備中國 4.5.3AIGC4.5.3AIGC 4.5.3AIGC步驟4:調(diào)整數(shù)字人的位置、大小和服裝類型。選用的數(shù)字人確認后,可以點擊PPT上的“數(shù)字人”,進入“數(shù)字人”設(shè)置界面,點擊“數(shù)字人編輯”按鈕(如圖7-112所示),對“數(shù)字人”進行編輯,可以重新?lián)Q服裝以及選擇數(shù)字人出現(xiàn)的“形狀”;點擊“畫面”按鈕,可以通過坐標設(shè)置來調(diào)整數(shù)字人的位置和大?。ㄈ鐖D7-113所示),也可以點擊數(shù)字人的邊框,通過拖動鼠標來調(diào)整數(shù)字人的位置和大小。這里可以根據(jù)PPT畫面的布局來調(diào)整“數(shù)字人”的位置和大小,盡量避免數(shù)字人遮擋文字。 4.5.3AIGC步驟5:輸入播報內(nèi)容和設(shè)置字幕樣式。數(shù)字人調(diào)整完成后,點擊右側(cè)工具欄的“播報內(nèi)容”按鈕(如圖7-114所示輸入播報內(nèi)容,播報內(nèi)容可以AI自動生成,也可以手動輸入或?qū)胛募ㄗ謹?shù)不超過5000字),這里選擇“手動輸入”每頁PPT的播報內(nèi)容。點擊右側(cè)工具欄的“字幕樣式”按鈕(如圖7-115所示),設(shè)置視頻字幕的樣式并打開字幕顯示按鈕,通過鼠標拖動把字幕放置畫面的合適位置。 4.5.3AIGC步驟5:根據(jù)需要添加“背景”、“貼紙”、“音樂”并選擇播報音色。輸入完播報內(nèi)容后,可以點擊左側(cè)工具欄的“背景”、“貼紙”和“音樂”等功能(如圖7-116所示),根據(jù)需要添加,這里選擇不添加背景、貼紙和音樂。確認后,點擊“播報內(nèi)容”輸入框下方的“音色”按鈕,選擇合適的音色。這里選擇“如云”音色作為PPT的數(shù)字人播報音色(如圖7-117所示)。圖7-1174.5.3AIGC步驟6:保存并生成播報。選擇完音色后,點擊“音色”下方的“保存并生成播報”按鈕(如圖7-118所示),選中每一頁PPT,逐一點擊保存并生成播報,注意,平臺此時生成的數(shù)字人播報效果預(yù)覽,暫不支持口型對齊預(yù)覽,合成后可查看完整動態(tài)效果。圖7-118保存并生成播報4.5.3AIGC步驟7:合成并下載視頻。保存并生成每頁的PPT的播報后,點擊頁面右上方的“合成視頻”按鈕(如圖7-119所示然后設(shè)置合成視頻輸出的參數(shù)(如圖7-120所示),設(shè)置完成后點擊“確認”按鈕,系統(tǒng)后臺會自動合成數(shù)字人播報視頻,等待合成結(jié)束后,點擊“下載”按鈕(如圖7-121所示),下載合成的數(shù)字人播報視頻。最后,播放合成的視頻文件,檢查視頻畫面是否符合預(yù)期。如有需要,可以根據(jù)反饋調(diào)整參數(shù),重新生成。圖7-119點擊合成視頻

能夠提供輔助編程服務(wù)的AIGC大模型包括Codex、GitHubCopilot、CodeGeeX、aiXcoder、豆包、通義靈碼等。訪問豆包大模型官網(wǎng)(https://wwwdoubaocom/)冊用戶以后,進入大模型操作首頁(如圖所示),點擊“我的智能體”,再點擊“編程助理”,然后,在頁面中輸入提示詞,比如輸入“請編寫一段Python代碼,使用turtle庫,繪制一個五角星”,然后,豆包就會自動生成一段Python代碼(所示)。在Python中運行這段代碼,就可以成功繪制一個五角星。4.6AIGC4.6AIGCPythonAI搜索,即人工智能搜索引擎,是一種利用先進的人工智能技術(shù),特別是深度學(xué)習(xí)和自然語言處理(NL),來理解和響應(yīng)用戶的查詢需求的新型搜索工具。它不僅僅是傳統(tǒng)搜索引擎(比如百度)單升級,而是通過模擬人類的思維方式和行為模式,為用戶提供更加精準、個性化且高效的信息檢索服務(wù)。AI搜索通過收集和分析用戶的歷史搜索數(shù)據(jù)和行為模式,構(gòu)建用戶畫像,從而實現(xiàn)更加精準的個性化搜索服務(wù)。這種數(shù)據(jù)驅(qū)動的智能決策機制,使得I搜索能夠不斷自我優(yōu)化,提升用戶體驗。4.8AI4.8AI大模型是人工智能領(lǐng)域的重要研究方向,其強大的語言理解和生成能力使得它在自然語言處理、機器翻譯、智能客服等領(lǐng)域有著廣泛的應(yīng)用。大模型的訓(xùn)練需要大量的數(shù)據(jù)和計算資源,同時也需要先進的技術(shù)和算法支持。隨著技術(shù)的不斷發(fā)展,大模型的應(yīng)用場景也在不斷擴展,未來將會更加廣泛地應(yīng)用于各個領(lǐng)域。1.11.1

文心1.41.4 是指在自然語言處理(NaturalLanguageProcessing,NLP)領(lǐng)域中的一類大模型,通常用于處理文本數(shù)據(jù)和理解自然語言。這類大模型的主要特點是它們在大規(guī)模語料庫上進行了訓(xùn)練,以學(xué)習(xí)自然語言的各種語法、語義和語境規(guī)則。代表性產(chǎn)品包括GPT系列(OpenAI)、Bard

是指在計算機視覺(ComputerVision,CV)領(lǐng)

2024年9月12日,OpenAI官方宣布了OpenAIo1推理大模型

型是在回答之前進行思考,并在回復(fù)用戶之前,在內(nèi)部生成一長串的思維鏈過程。思維鏈是一種提示大語言模型進行逐步推先顯式地寫出推理的中間步驟。這就像人類解決復(fù)雜問題時會先把思考過程寫下來

非推理問題:”非推理問題:”法國的首都是哪里?”(答案直接、無需推導(dǎo)推理問題:”一列火車以每小時60英里的速度行駛3小時,行駛距離是多少?(需先理解”距離=速度×?xí)r間”的關(guān)系,再分步計算

Gemini的初始版本已在Bard中提供,開發(fā)人員版本可通過GoogleCloud的API獲得。Gemini可以應(yīng)用于Bard和Pixel8能發(fā)展對人類未來影響的深刻思考。隨著Sora的發(fā)布,人工智能似?的多個角色。這種能力已經(jīng)超越了簡單的圖像或文本生成,開始觸及視頻這一更加復(fù)雜和動態(tài)的媒介。這意味著人工智能不僅在處理靜態(tài)信OpenAI即夢和推理任務(wù)上可與OpenAIo1媲美。

通義千問是阿里云推出的一個超大規(guī)模的語言模型,它具備多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持的能力。通義千問這個名字有“通義”和“千問”兩層含義,“通義”言的含義,“千問”則表示這個模型能夠回答各種問題。通義千問基于深度學(xué)習(xí)技術(shù),通過對大量文本數(shù)據(jù)進行訓(xùn)練,從而具備了強大的語言理解AI,能理解你的需求并生成高質(zhì)量回大模型幻覺AI幻覺,是指大型語言模型在生成內(nèi)容時,產(chǎn)生與事實不符、邏輯錯誤或比如在回答歷史事件時,可能會編造不存在的細節(jié)或人物;在進行科學(xué)知識講解時,給出錯誤的其產(chǎn)生原因主要包括:模型訓(xùn)練數(shù)據(jù)存在偏差、不完整或錯誤,導(dǎo)致在學(xué)習(xí)過程中引入了不準確的信息;模型基于概率分布生成內(nèi)容,在某些情況下會選擇一些看似合理但實際錯誤的路徑。大模型幻覺會影響信息的準確性和可靠性,在信息在使用大模型時,需要對其輸出內(nèi)容進行仔細驗

通過這種方式,模型能夠理解不同類型的任務(wù)并提供符合預(yù)期的回答。指令-響應(yīng)(Instruction-

其核心思想是:在生成答案前,先從外部知識庫中檢索相關(guān)信息,再將檢索結(jié)果與用戶輸入結(jié)合,指導(dǎo)生成模型輸出更可靠的回答。簡單地說,就是利用已有的文檔、內(nèi)部知識生成向量知識庫,在提問的時候結(jié)合庫的內(nèi)的“AI數(shù)智員工”可在幾秒內(nèi)完成傳統(tǒng)需數(shù)天的公文起草任務(wù),格式準確率超一體機集成高性能AI芯片和優(yōu)化算法,顯著降低政府部門部署AI技術(shù)的門檻。例如,政府部門通過私有化部署DeepSeek一體機,既能處理敏感數(shù)據(jù),又能提升GF7280V5AI訓(xùn)推一體機DeepSeek人工智能一體機

亞康華創(chuàng)科技:D-BOXPro桌面級智能一體機華為昇騰:昇騰DeepSeek推理一體機AI一體機中國移動:智算一體機-DeepSeek版京東云:DeepSeek大模型一體機華能振宇:天巡DeepSeek大模型一體機昆侖技術(shù):DeepSeek本地化部署一體機DeepSeek一體機DeepSeek一體機新致軟件、中科曙光、聯(lián)想集團等公司,選擇以海光、沐曦等國產(chǎn)芯片作為算力基石。同時,部分公司在采用常見國際品牌芯片的基礎(chǔ)上,也積極

Ultra(滿血版),可DeepSeek-R1、V3的671B模型。相對而言,部分企業(yè)發(fā)

2TBRAM配置(如協(xié)創(chuàng)數(shù)據(jù)所提及)NVMe

實現(xiàn)審批問題精準檢索與權(quán)威解答,提升審批效率;邯鄲武安市在“武優(yōu)辦”小程序中嵌入“DeepSeek智詢”,可30危險化學(xué)品經(jīng)營許可證等業(yè)務(wù)辦理指南借助自然語言處理技術(shù),實現(xiàn)智能應(yīng)答、工單自動分類與轉(zhuǎn)派。廣東梅州接入相關(guān)技術(shù)后,話務(wù)接通等待時間大幅縮短了28%,工單直派準確率更是超過90%DeepSeek驅(qū)動的機器人可以在DeepSeek可以輔助用戶填寫各類在特定場景下,例如夜間或偏遠地區(qū),可以設(shè)置DeepSeek驅(qū)動7x24小時在線基于知識圖譜技術(shù),DeepSeek

DeepSeek可以根據(jù)訴求內(nèi)容、地理位置、

DeepSeek可以分析社區(qū)矛盾糾紛案例,構(gòu)DeepSeek可以分析社區(qū)矛盾糾紛案例,構(gòu)DeepSeek可以分析社區(qū)居民的各類數(shù)據(jù),

DeepSeek可以結(jié)合社區(qū)安全數(shù)據(jù)、輿情DeepSeekDeepSeek可以結(jié)合城市各類安全數(shù)據(jù),突發(fā)事件智能預(yù)警:DeepSeek可以實時DeepSeekDeepSeek可以根據(jù)突發(fā)事件類型和風(fēng)險等在突發(fā)事件發(fā)生時,DeepSeek可以輔助應(yīng)標準化程度高的業(yè)務(wù)標準化程度高的業(yè)務(wù)(詢、信息查詢),可以優(yōu)先引入DeepSeek以提升效邊界,筑牢數(shù)據(jù)安全防線。信任。針對DeepSeek在的生成內(nèi)容不可解釋性和

“技術(shù)再先進,也不能替代法律賦予公務(wù)員的判斷權(quán)”,深圳數(shù)據(jù)交易所AI專家吳鶴意

換人”,而是治理能力的全方位升級。面對95后、00后新一代公務(wù)員,各地創(chuàng)新建立

DeepSeek可以自動檢測公文中的格式錯誤、DeepSeek可以根據(jù)公文規(guī)范自動排版,并支持多種格式轉(zhuǎn)換,例如Word、PDF、HTML等,“鹿小數(shù)”案例深化:“鹿小數(shù)深圳市福田區(qū)“數(shù)智員工”案例深化:“數(shù)智員工在公文處理流程中扮演重要角色,提升智能文庫搜索升級智能文庫搜索升級知識圖譜構(gòu)建與分析DeepSeek知識圖譜構(gòu)建與分析DeepSeek智能會議紀要與議題分析DeepSeek數(shù)據(jù)可視化分析報告DeepSeek參考案例參考案例:多地政府知識圖譜建設(shè)探索一些地方政府已參考指標參考指標RPA(機器人流程自動化)技術(shù),DeepSeekRPA完成更復(fù)雜的自重復(fù)性人工操作減少80以上,辦公流程耗時縮短50以上,整體辦公效RPA在政務(wù)領(lǐng)域的廣泛應(yīng)用:RPA技術(shù)已經(jīng)在政務(wù)領(lǐng)域得到廣泛應(yīng)用,例如稅務(wù)申報自動化、社保辦理自動智能辦公助手類產(chǎn)品:市場上已經(jīng)出現(xiàn)一些智能辦公助手類產(chǎn)品,提供日

DeepSeekDeepSeek可以根據(jù)DeepSeekDeepSeek可以作為公務(wù)員的智能學(xué)習(xí)助手,解答學(xué)習(xí)疑問,提供案例分析,進行模擬測試,DeepSeek可以輔助生成培訓(xùn)教材、案例庫、考試題庫等培訓(xùn)內(nèi)容,降低培訓(xùn)成本,提升培7.17.1

AIAgent的誕生就是為了處理各種復(fù)雜任務(wù)的,就復(fù)雜任務(wù)的處AIAgent主要分為兩大類:行動類、規(guī)劃執(zhí)行類??偠灾珹IAgent就是結(jié)合大模型能去自動思考、規(guī)劃、效驗和AICopilot不再是機械地完成人AIAgent的工作僅需給定一個目標,它就prompt,來實現(xiàn)目標目標任務(wù),進行智能規(guī)劃與決策,自動執(zhí)行復(fù)雜的任務(wù)。比如在智能辦公場景中,AIAgent可以根據(jù)用戶的日程安排,自動預(yù)訂會議室、RAG的功能。對于一些數(shù)據(jù)量較小、業(yè)務(wù)場景相對簡單的政府部門來說,RAG是一個性價比很高的選擇工具和系統(tǒng)的集成。此外,AIAgent還需要不斷地進行訓(xùn)練和優(yōu)化,以提高其智能水平和適應(yīng)性。因此,對于一些政府部門來說,AIAgent的部署成本可能較高,但對于對智能化要求較高的政府部門來說,AIAgent帶來的價值可能遠超其成本RARA但RAG的局限性在于,它缺乏自主決策AAIAgen還是智能辦公領(lǐng)域,AIAgent都能夠發(fā)各自的優(yōu)勢和適用場景AIAgent則更人類一樣使用計算機的智能體。它基于OpenAI最新研發(fā)的CUA(Computer-UsingAgent)模型,CUAGPT-4o的視覺功能與通過強化學(xué)習(xí)獲得的高級推理相結(jié)合,經(jīng)交互。Operator通過觀察屏幕并使用虛擬鼠標和鍵盤來完成任務(wù),而無需依賴專門的Operator好比一個博士水平的個人助理,你給他一個復(fù)雜的任務(wù),它就會自動執(zhí)行。Operator的主要功能包括自主完成諸如采購雜貨、提交費用報表、訂票、買日用品、填寫表格等任務(wù),旨在通過自動化操作提升日常生活和工作效率。它還可以一邊在搜索勇士隊比賽門票,一邊處理網(wǎng)球場預(yù)訂、尋找清潔服務(wù)和訂餐,實現(xiàn)多任務(wù)并行處理2025年3月6日,由中國團隊開發(fā)的AI智能體Manus,因被稱為“全球首個通用Agent”而爆火網(wǎng)絡(luò)。它連接思想與行動,不僅能夠思考,還能交付成果。幫你完成一切??梢詭椭脩敉瓿珊啔v篩選、房地產(chǎn)調(diào)研以及股票金融數(shù)據(jù)分析等工作例如,在企業(yè)注冊登記場景中,申請人提交的營業(yè)執(zhí)照、法人身份證、公司章程等多種材料,預(yù)審機器人可在短時間內(nèi)完成格式檢查、信息完整性校驗以及關(guān)鍵信息的抽取,對材料的合規(guī)性進行初步審核,將不符合要求的材料提前篩選出來,大大減輕了人工審核的工作量,提高了審核效率與準確性,以稅務(wù)申報為例,企業(yè)提交的各類稅務(wù)單據(jù),如發(fā)票、財務(wù)報表等,代填機器人能夠快速識別單據(jù)上的金額、日期、項目等關(guān)鍵信息,以稅務(wù)申報為例,企業(yè)提交的各類稅務(wù)單據(jù),如發(fā)票、財務(wù)報表等,代填機器人能夠快速識別單據(jù)上的金額、日期、項目等關(guān)鍵信息,并準確無誤地填寫到稅務(wù)申報系統(tǒng)中,數(shù)據(jù)代填機器人的應(yīng)用可將這一工作效率提升10倍以上,同時避免了人工錄入可能出現(xiàn)基于代填機器人出色的OCR識別能力,能問答智能體,基于自然語言處理、知識圖譜、推薦技術(shù),集成問答智能體,基于自然語言處理、知識圖譜、推薦技術(shù),集成知識管理+搜索引擎+門戶搜索服+精準推送”四大模塊,是一個集中化、自動化、可視化、標該智能體能夠深入理解用戶提問的意圖,通過對政務(wù)知識庫的深度挖掘與分析,快速準確地提供相關(guān)政策解讀、業(yè)務(wù)流程說明、該智能體能夠深入理解用戶提問的意圖,通過對政務(wù)知識庫的深度挖掘與分析,快速準確地提供相關(guān)政策解讀、業(yè)務(wù)流程說明、例如,市民通過政務(wù)服務(wù)熱線咨詢醫(yī)保報銷政策,問答智能體可迅速定位到相關(guān)醫(yī)保政策條款,并結(jié)合市民的具體情況,以通俗易懂的語言給出準確的解答,實現(xiàn)了政務(wù)信息的智能整合與高效利用,提升了政務(wù)服務(wù)的便捷性與精準性,有效解決了群眾在獲取政務(wù)信息時面臨的信息碎片化、AIGC的全稱為“ArtificialIntelligenceGeneratedContent”,中文AIGC的核心思想是利用人工智能算法生成具有一定創(chuàng)意和質(zhì)量的內(nèi)容訓(xùn)練模型和大量數(shù)據(jù)的學(xué)習(xí),AIGC可以根據(jù)輸入的條件或指導(dǎo),生成與之相關(guān)的內(nèi)容。例如,通過輸入關(guān)鍵詞、描述或樣本,AIGC可以生成與之相匹配生成商品標題、描述、廣 生成商品標題、描述、廣寫周報日報,寫方案,寫PPT,寫生成場景原畫,生成角色形象,生成世界觀,生成頭像生成,照片修復(fù),圖頭像生成,照片修復(fù),圖生成分鏡頭腳本,生成劇本腳本,臺詞潤色,生成 引導(dǎo)生成引導(dǎo)生成增強交互性提高準確性 需顯式引導(dǎo)推理步驟(如通過“維鏈提示),否則可能跳過關(guān)鍵依賴提示語補償能力短板(嚴守保密紅線,禁止在處理公文、內(nèi)部資料或涉及國家秘密、工作秘密時使用在提示詞輸入框中輸入在提示詞輸入框中輸入請模仿李白的《望廬山瀑布》做一首詩,題目是《看廈門鼓浪嶼》,然后回車,或者用鼠標點擊提示詞輸入框右側(cè)的箭頭按鈕,向DeepSeek發(fā)起提問。DeepSeek給出的回答如圖所示,需要注意的是,大模型屬于概率模型,每次生成的回答內(nèi)容可能不完全相同。①無需復(fù)雜結(jié)構(gòu)。直接描述需求即可,無需添加“角色扮演”(假設(shè)你是專家”)或復(fù)雜指令(如“用學(xué)術(shù)語言分三點回答”)你可以直接向提問“什么是光合作用?”、“如何用n,而不建議使用提示詞請以生物學(xué)教授的身份,用三個段落解釋光合作用,每段不超過100字。②多輪對話優(yōu)化結(jié)果。

的語言解釋量子糾纏,適合高中生理解,②創(chuàng)作類任務(wù)(等)。比如,基礎(chǔ)提問是寫一個關(guān)于人工智能的科幻短篇故事,優(yōu)化后的提問是寫一個反烏托邦主題的科幻故事,主角是女性工程師,結(jié)局有反

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論