廈大團(tuán)隊(duì)：大模型概念、技術(shù)與應(yīng)用實(shí)踐（140 頁P(yáng) P T讀懂大模型）

上傳人：1*** IP屬地：北京上傳時(shí)間：2025-03-06 格式：PPTX 頁數(shù)：141 大小：61.11MB 積分：6 舉報(bào) 版權(quán)申訴

廈大團(tuán)隊(duì)：大模型概念、技術(shù)與應(yīng)用實(shí)踐（140 頁P(yáng) P T讀懂大模型）_第2頁

廈大團(tuán)隊(duì)：大模型概念、技術(shù)與應(yīng)用實(shí)踐（140 頁P(yáng) P T讀懂大模型）_第3頁

廈大團(tuán)隊(duì)：大模型概念、技術(shù)與應(yīng)用實(shí)踐（140 頁P(yáng) P T讀懂大模型）_第4頁

廈大團(tuán)隊(duì)：大模型概念、技術(shù)與應(yīng)用實(shí)踐（140 頁P(yáng) P T讀懂大模型）_第5頁

已閱讀5頁，還剩136頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大模型概念、技術(shù)與應(yīng)用實(shí)踐林子雨副教授廈門大學(xué)DeepSeek每個(gè)人都可以讀懂的大模型科普文章廈門大學(xué)大數(shù)據(jù)教學(xué)團(tuán)隊(duì)作品2025年2月9日廈門大學(xué)大數(shù)據(jù)教學(xué)團(tuán)隊(duì)國內(nèi)高校大數(shù)據(jù)教學(xué)的重要貢獻(xiàn)者團(tuán)隊(duì)負(fù)責(zé)人：林子雨

副教授年輕力量：核心成員全部46周歲以下結(jié)構(gòu)合理：教學(xué)型、科研型、實(shí)驗(yàn)工程師專注專業(yè)：從2013年至今，11年專注于大數(shù)據(jù)教學(xué)團(tuán)隊(duì)特點(diǎn)：眼光前瞻、緊跟技術(shù)、創(chuàng)新實(shí)干、執(zhí)行力強(qiáng)影響力高：多項(xiàng)指標(biāo)在國內(nèi)高校大數(shù)據(jù)教學(xué)領(lǐng)域領(lǐng)先教材數(shù)量教材占有率MOOC課程學(xué)習(xí)人數(shù)師資培養(yǎng)教學(xué)研討會(huì)教學(xué)網(wǎng)站訪問量在線講座觀看人數(shù)……團(tuán)隊(duì)負(fù)責(zé)人林子雨廈門大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授以第一作者編著出版15本大數(shù)據(jù)系列教材被國內(nèi)1000余所高校采用榮獲“2022年福建省高等教育教學(xué)成果獎(jiǎng)特等獎(jiǎng)（個(gè)人排名第一）”入選“2021年高校計(jì)算機(jī)專業(yè)優(yōu)秀教師獎(jiǎng)勵(lì)計(jì)劃”2018年國家精品在線開放課程（獨(dú)立主講）2020年國家級線上一流本科課程（獨(dú)立主講）2021年國家級線上一流本科課程（獨(dú)立主講）入選“2023年教育部國家智慧教育公共服務(wù)平臺(tái)應(yīng)用典型案例”個(gè)人主頁：/post/linziyu/本PPT節(jié)選自林子雨編著《數(shù)字素養(yǎng)通識(shí)教程》林子雨編著《數(shù)字素養(yǎng)通識(shí)教程——大數(shù)據(jù)與人工智能時(shí)代的計(jì)算機(jī)通識(shí)教育》人民郵電出版社，2025年1月ISBN:978-7-115-65946-0

定價(jià)：59.8元面向大一新生的全校大學(xué)計(jì)算機(jī)公共課教材教材官網(wǎng)：/post/digital-literacy/教材官網(wǎng)提供講義PPT、MOOC視頻、案例視頻、上機(jī)實(shí)驗(yàn)、教學(xué)大綱、課程思政案例、開學(xué)第一課講座PPT等豐富的教學(xué)資源掃一掃訪問教材官網(wǎng)《數(shù)字素養(yǎng)通識(shí)教程》林子雨編著《數(shù)字素養(yǎng)通識(shí)教程——大數(shù)據(jù)與人工智能時(shí)代的計(jì)算機(jī)通識(shí)教育》人民郵電出版社ISBN:978-7-115-65946-02025年1月第1版，定價(jià)：59.8元

教材官網(wǎng)：/post/digital-literacy/15年計(jì)算機(jī)教學(xué)生涯感悟升華，15本計(jì)算機(jī)暢銷教材知識(shí)凝練數(shù)字時(shí)代的大學(xué)計(jì)算機(jī)公共課教材，重構(gòu)大學(xué)計(jì)算機(jī)公共課知識(shí)體系深刻變革傳統(tǒng)大學(xué)計(jì)算機(jī)通識(shí)教育，培養(yǎng)學(xué)生計(jì)算思維、數(shù)據(jù)思維和AI思維到B站觀看林子雨主講《數(shù)字素養(yǎng)通識(shí)教程》MOOC視頻（1359分鐘）視頻地址：/video/BV1XPf8YZE6M/《數(shù)字素養(yǎng)通識(shí)教程》引言在數(shù)字化浪潮洶涌澎湃的當(dāng)下，大模型如同一顆璀璨新星，強(qiáng)勢崛起并迅速成為科技領(lǐng)域的焦點(diǎn)。從最初的理論探索到如今在各個(gè)行業(yè)的廣泛應(yīng)用，大模型正以驚人的速度重塑著我們的生活與工作模式。它不僅是人工智能技術(shù)發(fā)展的重大突破，更是推動(dòng)經(jīng)濟(jì)增長、提升社會(huì)治理效能、促進(jìn)科技創(chuàng)新的關(guān)鍵力量。本報(bào)告《大模型概念、技術(shù)與應(yīng)用實(shí)踐》將深入剖析大模型的核心概念、原理特點(diǎn)以及豐富多元的應(yīng)用實(shí)踐案例，旨在讓大家全面了解大模型這一前沿技術(shù)，明晰其在當(dāng)下及未來發(fā)展中的重要地位與深遠(yuǎn)影響

，共同探索如何借助大模型的力量推動(dòng)社會(huì)各項(xiàng)事業(yè)邁向新的高度。目錄1.人工智能發(fā)展簡史2.人工智能思維3.大模型：人工智能的前沿4.AIGC應(yīng)用與實(shí)踐1.

人工智能發(fā)展簡史1.1圖靈測試1.2人工智能的誕生1.3人工智能的發(fā)展階段1.4未來人工智能發(fā)展的五個(gè)階段1.1圖靈測試1950年，“計(jì)算機(jī)之父”和“人工智能之父”艾倫·圖靈（AlanM.Turing）發(fā)表了論文《計(jì)算機(jī)器與智能》，這篇論文被譽(yù)為人工智能科學(xué)的開山之作。在論文的開篇，圖靈提出了一個(gè)引人深思的問題：“機(jī)器能思考嗎？”。這個(gè)問題激發(fā)了人們無盡的想象，同時(shí)也奠定了人工智能的基本概念和雛形在這篇論文中，圖靈提出了鑒別機(jī)器是否具有智能的方法，這就是人工智能領(lǐng)域著名的“圖靈測試”。如圖所示，其基本思想是測試者在與被測試者（一個(gè)人和一臺(tái)機(jī)器）隔離的情況下，通過一些裝置（如鍵盤）向被測試者隨意提問。進(jìn)行多次測試后，如果被測試者機(jī)器讓平均每個(gè)測試者做出超過30%的誤判，那么這臺(tái)機(jī)器就通過了測試，并被認(rèn)為具有人類智能1.2人工智能的誕生人工智能的誕生可以追溯到20世紀(jì)50年代。當(dāng)時(shí)，計(jì)算機(jī)科學(xué)剛剛起步，人們開始嘗試通過計(jì)算機(jī)程序來模擬人類的思維和行為。在這個(gè)背景下，一些杰出的科學(xué)家和工程師們開始研究如何使計(jì)算機(jī)具備更高級的功能1956年8月，在美國達(dá)特茅斯學(xué)院舉辦的人工智能夏季研討會(huì)，是人工智能領(lǐng)域具有里程碑意義的一次重要會(huì)議。這次會(huì)議匯聚了眾多杰出的科學(xué)家和工程師，他們共同探討和研究人工智能的發(fā)展和應(yīng)用前景這次會(huì)議的主題圍繞著人工智能的定義、研究方法和應(yīng)用場景展開。與會(huì)者們深入探討了人工智能的基本概念、算法和技術(shù)，以及其在各個(gè)領(lǐng)域的應(yīng)用潛力。他們共同認(rèn)識(shí)到，人工智能的研究和發(fā)展將為人類帶來巨大的變革和進(jìn)步1.2人工智能的誕生在這次會(huì)議上，“人工智能”這個(gè)詞匯被約翰.麥卡錫（JohnMcCarthy）首次提出。與會(huì)者們不僅對人工智能的研究和應(yīng)用前景進(jìn)行了深入探討，還提出了許多重要的觀點(diǎn)和思路，為人工智能的發(fā)展奠定了基礎(chǔ)。這次會(huì)議的召開標(biāo)志著人工智能作為一個(gè)獨(dú)立學(xué)科的正式誕生，因此，達(dá)特茅斯會(huì)議被稱為“人工智能的開端”，1956年也被稱為“人工智能元年”。這次會(huì)議不僅為人工智能的研究和發(fā)展奠定了基礎(chǔ)，還為人類帶來了巨大的變革和進(jìn)步1.3人工智能的發(fā)展階段從1956年人工智能元年至今，人工智能的發(fā)展歷程經(jīng)歷了漫長的歲月，大致可以劃分為以下6個(gè)階段1.4未來人工智能發(fā)展5個(gè)階段2.人工智能思維2.人工智能思維了解每個(gè)人都應(yīng)了解人工智能的基礎(chǔ)運(yùn)行模式區(qū)分具備區(qū)分人的能力和機(jī)器的能力協(xié)作擁有和人工智能協(xié)作的能力，懂得如何運(yùn)用人工智能3.大模型：人工智能的前沿3.1大模型的概念3.2大模型的發(fā)展歷程3.3人工智能與大模型的關(guān)系3.4大模型產(chǎn)品3.5大模型原理3.6大模型特點(diǎn)3.7大模型分類3.8大模型應(yīng)用領(lǐng)域（在各個(gè)行業(yè)的應(yīng)用）3.9大模型對工作和生活的影響3.10本地部署大模型3.11基于大模型的智能體3.1大模型的概念大模型通常指的是大規(guī)模的人工智能模型，是一種基于深度學(xué)習(xí)技術(shù)，具有海量參數(shù)、強(qiáng)大的學(xué)習(xí)能力和泛化能力，能夠處理和生成多種類型數(shù)據(jù)的人工智能模型通常說的大模型的“大”的特點(diǎn)體現(xiàn)在：參數(shù)數(shù)量龐大、訓(xùn)練數(shù)據(jù)量大、計(jì)算資源需求高2020年，OpenAI公司推出了GPT-3，模型參數(shù)規(guī)模達(dá)到了1750億，2023年3月發(fā)布的GPT-4的參數(shù)規(guī)模是GPT-3的10倍以上，達(dá)到1.8萬億，2021年11月阿里推出的M6模型的參數(shù)量達(dá)10萬億3.1大模型的概念大模型的設(shè)計(jì)和訓(xùn)練旨在提供更強(qiáng)大、更準(zhǔn)確的模型性能，以應(yīng)對更復(fù)雜、更龐大的數(shù)據(jù)集或任務(wù)。大模型通常能夠?qū)W習(xí)到更細(xì)微的模式和規(guī)律，具有更強(qiáng)的泛化能力和表達(dá)能力大模型具有更強(qiáng)的上下文理解能力，能夠理解更復(fù)雜的語意和語境。這使得它們能夠產(chǎn)生更準(zhǔn)確、更連貫的回答上下文理解能力大模型可以從大量的數(shù)據(jù)中學(xué)習(xí)，并利用學(xué)到的知識(shí)和模式來提供更精準(zhǔn)的答案和預(yù)測。這使得它們在解決復(fù)雜問題和應(yīng)對新的場景時(shí)表現(xiàn)更加出色學(xué)習(xí)能力強(qiáng)大模型可以生成更自然、更流利的語言，減少了生成輸出時(shí)呈現(xiàn)的錯(cuò)誤或令人困惑的問題語言生成能力學(xué)習(xí)到的知識(shí)和能力可以在不同的任務(wù)和領(lǐng)域中遷移和應(yīng)用。這意味著一次訓(xùn)練就可以將模型應(yīng)用于多種任務(wù)，無需重新訓(xùn)練可遷移性高3.2大模型的發(fā)展歷程大模型發(fā)展歷經(jīng)三個(gè)階段，分別是萌芽期、沉淀期和爆發(fā)期3.2大模型的發(fā)展歷程萌芽期（1950-2005）這是一個(gè)以CNN（ConvolutionalNeuralNetworks，卷積神經(jīng)網(wǎng)絡(luò)）為代表的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型階段1956年，從計(jì)算機(jī)專家約翰·麥卡錫提出“人工智能”概念開始，AI發(fā)展由最開始基于小規(guī)模專家知識(shí)逐步發(fā)展為基于機(jī)器學(xué)習(xí)1980年，卷積神經(jīng)網(wǎng)絡(luò)的雛形CNN誕生1998年，現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)LeNet-5誕生，機(jī)器學(xué)習(xí)方法由早期基于淺層機(jī)器學(xué)習(xí)的模型，變?yōu)榱嘶谏疃葘W(xué)習(xí)的模型，為自然語言生成、計(jì)算機(jī)視覺等領(lǐng)域的深入研究奠定了基礎(chǔ)，對后續(xù)深度學(xué)習(xí)框架的迭代及大模型發(fā)展具有開創(chuàng)性的意義3.2大模型的發(fā)展歷程沉淀期（2006-2019）這是一個(gè)以Transformer為代表的全新神經(jīng)網(wǎng)絡(luò)模型階段2013年，自然語言處理模型Word2Vec誕生，首次提出將單詞轉(zhuǎn)換為向量的“詞向量模型”，以便計(jì)算機(jī)更好地理解和處理文本數(shù)據(jù)。2014年，被譽(yù)為21世紀(jì)最強(qiáng)大算法模型之一的GAN（GenerativeAdversarialNetworks，對抗式生成網(wǎng)絡(luò)）誕生，標(biāo)志著深度學(xué)習(xí)進(jìn)入了生成模型研究的新階段2017年，Google顛覆性地提出了基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)——Transformer架構(gòu)，奠定了大模型預(yù)訓(xùn)練算法架構(gòu)的基礎(chǔ)2018年，OpenAI基于Transformer架構(gòu)發(fā)布了GPT-1大模型，意味著預(yù)訓(xùn)練大模型成為自然語言處理領(lǐng)域的主流，其中，GPT的英文全稱是GenerativePre-TrainedTransformer，是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來訓(xùn)練的、文本生成的深度學(xué)習(xí)模型2019年，OpenAI發(fā)布了GPT-23.2大模型的發(fā)展歷程爆發(fā)期（2020-至今）這是一個(gè)以GPT為代表的預(yù)訓(xùn)練大模型階段2020年6月，OpenAI公司推出了GPT-3，模型參數(shù)規(guī)模達(dá)到了1750億，成為當(dāng)時(shí)最大的語言模型，并且在零樣本學(xué)習(xí)任務(wù)上實(shí)現(xiàn)了巨大性能提升。隨后，更多策略如基于人類反饋的強(qiáng)化學(xué)習(xí)（RLHF，ReinforcementLearningfromHumanFeedback）、代碼預(yù)訓(xùn)練、指令微調(diào)等開始出現(xiàn)，被用于進(jìn)一步提高推理能力和任務(wù)泛化2022年11月，搭載了GPT3.5的ChatGPT（ChatGenerativePre-trainedTransformer）橫空出世，憑借逼真的自然語言交互與多場景內(nèi)容生成能力，迅速引爆互聯(lián)網(wǎng)，在全球范圍內(nèi)引起轟動(dòng)，使得大模型的概念迅速進(jìn)入普通大眾的視野。ChatGPT是人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具，它能夠通過理解和學(xué)習(xí)人類的語言來進(jìn)行對話，還能根據(jù)聊天的上下文進(jìn)行互動(dòng)，真正像人類一樣來聊天交流，甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼，寫論文等任務(wù)3.2大模型的發(fā)展歷程爆發(fā)期（2020-至今）OpenAI在2023年3月發(fā)布了GPT-4，它是一個(gè)多模態(tài)大模型（接受圖像和文本輸入，生成文本）。相比上一代的GPT-3，GPT-4可以更準(zhǔn)確地解決難題，具有更廣泛的常識(shí)和解決問題的能力。2023年12月，谷歌發(fā)布大模型Gemini，它可以同時(shí)識(shí)別文本、圖像、音頻、視頻和代碼五種類型信息，還可以理解并生成主流編程語言（如Python、Java、C++）的高質(zhì)量代碼，并擁有全面的安全性評估。2024年12月，DeepSeek迅速崛起，震撼全球，使得人工智能進(jìn)入“普惠”時(shí)代3.3人工智能與大模型的關(guān)系人工智能包含了機(jī)器學(xué)習(xí)，機(jī)器學(xué)習(xí)包含了深度學(xué)習(xí)，深度學(xué)習(xí)可以采用不同的模型，其中一種模型是預(yù)訓(xùn)練模型，預(yù)訓(xùn)練模型包含了預(yù)訓(xùn)練大模型（可以簡稱為“大模型”），預(yù)訓(xùn)練大模型包含了預(yù)訓(xùn)練大語言模型（可以簡稱為“大語言模型”），預(yù)訓(xùn)練大語言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE，ChatGPT是基于GPT開發(fā)的大模型產(chǎn)品，文心一言是基于文心ERNIE開發(fā)的大模型產(chǎn)品3.4大模型產(chǎn)品3.4.1國外的大模型產(chǎn)品3.4.2國內(nèi)的大模型產(chǎn)品3.4.1國外的大模型產(chǎn)品ChatGPTChatGPT是一種由OpenAI訓(xùn)練的大語言模型。它是基于Transformer架構(gòu)，經(jīng)過大量文本數(shù)據(jù)訓(xùn)練而成，能夠生成自然、流暢的語言，并具備回答問題、生成文本、語言翻譯等多種功能ChatGPT的應(yīng)用范圍廣泛，可以用于客服、問答系統(tǒng)、對話生成、文本生成等領(lǐng)域。它能夠理解人類語言，并能夠回答各種問題，提供相關(guān)的知識(shí)和信息。與其他聊天機(jī)器人相比，ChatGPT具備更強(qiáng)的語言理解和生成能力，能夠更自然地與人類交流，并且能夠更好地適應(yīng)不同的領(lǐng)域和場景。ChatGPT的訓(xùn)練數(shù)據(jù)來自互聯(lián)網(wǎng)上的大量文本，因此，它能夠涵蓋多種語言風(fēng)格和文化背景3.4.1國外的大模型產(chǎn)品GeminiGemini是谷歌發(fā)布的大模型，它能夠同時(shí)處理多種類型的數(shù)據(jù)和任務(wù)，覆蓋文本、圖像、音頻、視頻等多個(gè)領(lǐng)域。Gemini采用了全新的架構(gòu)，將多模態(tài)編碼器和多模態(tài)解碼器兩個(gè)主要組件結(jié)合在一起，以提供最佳結(jié)果Gemini包括三種不同規(guī)模的模型：GeminiUltra、GeminiPro和GeminiNano，適用于不同任務(wù)和設(shè)備。2023年12月6日，Gemini的初始版本已在Bard中提供，開發(fā)人員版本可通過GoogleCloud的API獲得。Gemini可以應(yīng)用于Bard和Pixel8Pro智能手機(jī)。Gemini的應(yīng)用范圍廣泛，包括問題回答、摘要生成、翻譯、字幕生成、情感分析等任務(wù)。然而，由于其復(fù)雜性和黑箱性質(zhì)，Gemini的可解釋性仍然是一個(gè)挑戰(zhàn)3.4.1國外的大模型產(chǎn)品Sora2024年2月16日，OpenAI再次震撼全球科技界，發(fā)布了名為Sora的文本生成視頻大模型，只需輸入文本就能自動(dòng)生成視頻。這一技術(shù)的誕生，不僅標(biāo)志著人工智能在視頻生成領(lǐng)域的重大突破，更引發(fā)了關(guān)于人工智能發(fā)展對人類未來影響的深刻思考。隨著Sora的發(fā)布，人工智能似乎正式踏入了通用人工智能（AGI：ArtificialGeneralIntelligence）的時(shí)代。AGI是指能夠像人類一樣進(jìn)行各種智能活動(dòng)的機(jī)器智能，包括理解語言、識(shí)別圖像、進(jìn)行復(fù)雜推理等。Sora大模型能夠直接輸出長達(dá)60秒的視頻，并且視頻中包含了高度細(xì)致的背景、復(fù)雜的多角度鏡頭，以及富有情感的多個(gè)角色。這種能力已經(jīng)超越了簡單的圖像或文本生成，開始觸及到視頻這一更加復(fù)雜和動(dòng)態(tài)的媒介。這意味著人工智能不僅在處理靜態(tài)信息上越來越強(qiáng)大，而且在動(dòng)態(tài)內(nèi)容的創(chuàng)造上也展現(xiàn)出了驚人的潛力3.4.1國外的大模型產(chǎn)品Sora右圖是Sora根據(jù)文本自動(dòng)生成的視頻畫面，一位戴著墨鏡、穿著皮衣的時(shí)尚女子走在雨后夜晚的東京市區(qū)街道上，抹了鮮艷唇彩的唇角微微翹起，即便帶著墨鏡也能看到她的微笑，地面的積水映出了她的身影和燈紅酒綠的霓虹燈，熱鬧非凡的唐人街正在進(jìn)行舞龍表演，熙熙攘攘的人群目光都聚焦在躍動(dòng)的彩龍身上，整個(gè)環(huán)境的喜慶氛圍仿佛令人身臨其境3.4.1國外的大模型產(chǎn)品OpenAIo32024年12月20日，OpenAI發(fā)布推理模型o3，無論在軟件工程、編寫代碼，還是競賽數(shù)學(xué)、掌握人類博士級別的自然科學(xué)知識(shí)能力方面，o3都達(dá)到了很高的水平3.4.2國內(nèi)的大模型產(chǎn)品大模型圖標(biāo)指標(biāo)排名DeepSeek

能力測評第一豆包

用戶數(shù)量第一Kimi

文本處理第一即夢AI

作圖能力第一通義萬相

視頻生成第一智譜清言

文檔歸納第一2025年1月國內(nèi)大模型排行榜3.4.2國內(nèi)的大模型產(chǎn)品DeepSeek（深度求索）2024年12月26日，杭州一家名為“深度求索”（DeepSeek）的中國初創(chuàng)公司，發(fā)布了全新一代大模型DeepSeek-V3。在多個(gè)基準(zhǔn)測試中，DeepSeek-V3的性能均超越了其他開源模型，甚至與頂尖的閉源大模型GPT-4o不相上下，尤其在數(shù)學(xué)推理上，DeepSeek-V3更是遙遙領(lǐng)先。DeepSeek-V3以多項(xiàng)開創(chuàng)性技術(shù)，大幅提升了模型的性能和訓(xùn)練效率。DeepSeek-V3在性能比肩GPT-4o的同時(shí)，研發(fā)卻只花了558萬美元，訓(xùn)練成本不到后者的二十分之一。因?yàn)楸憩F(xiàn)太過優(yōu)越，DeepSeek在硅谷被譽(yù)為“來自東方的神秘力量”。2025年1月20日，DeepSeek-R1正式發(fā)布，擁有卓越的性能，在數(shù)學(xué)、代碼和推理任務(wù)上可與OpenAIo1媲美。DeepSeek創(chuàng)始人梁文峰3.4.2國內(nèi)的大模型產(chǎn)品通義千問通義千問是阿里云推出的一個(gè)超大規(guī)模的語言模型，它具備多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持的能力。通義千問這個(gè)名字有“通義”和“千問”兩層含義，“通義”表示這個(gè)模型能夠理解各種語言的含義，“千問”則表示這個(gè)模型能夠回答各種問題。通義千問基于深度學(xué)習(xí)技術(shù)，通過對大量文本數(shù)據(jù)進(jìn)行訓(xùn)練，從而具備了強(qiáng)大的語言理解和生成能力。它能夠理解自然語言，并能夠生成自然語言文本同時(shí)，通義千問還具備多模態(tài)理解能力，能夠處理圖像、音頻等多種類型的數(shù)據(jù)。通義千問的應(yīng)用范圍非常廣泛，可以應(yīng)用于智能客服、智能家居、移動(dòng)應(yīng)用等多個(gè)領(lǐng)域。它可以與用戶進(jìn)行自然語言交互，幫助用戶解決各種問題，提供相關(guān)的知識(shí)和信息。同時(shí)，通義千問還可以與各種設(shè)備和應(yīng)用進(jìn)行集成，為用戶提供更加便捷的服務(wù)3.4.2國內(nèi)的大模型產(chǎn)品字節(jié)跳動(dòng)豆包豆包是字節(jié)跳動(dòng)基于云雀模型開發(fā)的AI，能理解你的需求并生成高質(zhì)量回應(yīng)。它知識(shí)儲(chǔ)備豐富，涵蓋歷史、科學(xué)、技術(shù)等眾多領(lǐng)域，無論是日常問題咨詢，還是深入學(xué)術(shù)探討，都能提供準(zhǔn)確全面的信息。同時(shí)，具備出色的文本創(chuàng)作能力，能撰寫故事、詩歌、文案等各類體裁。并且擅長語言交互，交流自然流暢，就像身邊的知心伙伴，耐心傾聽并給予恰當(dāng)反饋。3.4.2國內(nèi)的大模型產(chǎn)品文心一言文心一言是由百度研發(fā)的知識(shí)增強(qiáng)大模型，能夠與人對話互動(dòng)、回答問題、協(xié)助創(chuàng)作，高效便捷地幫助人們獲取信息、知識(shí)和靈感文心一言基于飛槳深度學(xué)習(xí)平臺(tái)和文心知識(shí)增強(qiáng)大模型，持續(xù)從海量數(shù)據(jù)和大規(guī)模知識(shí)中融合學(xué)習(xí)，具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對話增強(qiáng)的技術(shù)特色。文心一言具有廣泛的應(yīng)用場景，例如智能客服、智能家居、移動(dòng)應(yīng)用等領(lǐng)域。它可以與用戶進(jìn)行自然語言交互，幫助用戶解決各種問題，提供相關(guān)的知識(shí)和信息3.5大模型的基本原理大模型是基于Transformer架構(gòu)的，這種架構(gòu)是一種專門用于自然語言處理的“編碼-解碼器”架構(gòu)。在訓(xùn)練過程中，大模型將輸入的單詞以向量的形式傳遞給神經(jīng)網(wǎng)絡(luò)，然后通過網(wǎng)絡(luò)的編碼解碼以及自注意力機(jī)制，建立起每個(gè)單詞之間聯(lián)系的權(quán)重。大模型的核心能力在于將輸入的每句話中的每個(gè)單詞與已經(jīng)編碼在模型中的單詞進(jìn)行相關(guān)性的計(jì)算，并把相關(guān)性又編碼疊加在每個(gè)單詞中。這樣，大模型能夠更好地理解和生成自然文本，同時(shí)還能夠表現(xiàn)出一定的邏輯思維和推理能力大模型基于深度學(xué)習(xí)利用大量的數(shù)據(jù)和計(jì)算資源訓(xùn)練具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)模型不斷地調(diào)整模型參數(shù)模型能夠在各種任務(wù)中取得最佳表現(xiàn)3.5大模型的基本原理3.6大模型的特點(diǎn)3.6大模型的特點(diǎn)

（1）巨大的規(guī)模大模型通常包含數(shù)十億個(gè)參數(shù)，模型大小可以達(dá)到數(shù)百GB甚至更大。這種巨大的規(guī)模不僅提供了強(qiáng)大的表達(dá)能力和學(xué)習(xí)能力，還使得大模型在處理復(fù)雜任務(wù)時(shí)具有更高的效率和準(zhǔn)確性3.6大模型的特點(diǎn)（2）涌現(xiàn)能力涌現(xiàn)能力是指模型在訓(xùn)練過程中突然展現(xiàn)出之前小模型所沒有的、更深層次的復(fù)雜特性和能力。當(dāng)模型的訓(xùn)練數(shù)據(jù)突破一定規(guī)模時(shí)，模型能夠綜合分析和解決更深層次的問題，展現(xiàn)出類似人類的思維和智能。這種涌現(xiàn)能力是大模型最顯著的特點(diǎn)之一，也是其超越傳統(tǒng)模型的關(guān)鍵所在3.6大模型的特點(diǎn)（3）更好的性能和泛化能力大模型因其巨大的規(guī)模和復(fù)雜的結(jié)構(gòu)，展現(xiàn)出更出色的性能和泛化能力。它們在各種任務(wù)上都能表現(xiàn)出色，超越了傳統(tǒng)的小模型。這主要?dú)w功于大模型的參數(shù)規(guī)模和學(xué)習(xí)能力。大模型能夠更好地理解和模擬現(xiàn)實(shí)世界中的復(fù)雜現(xiàn)象，從而在各種任務(wù)中表現(xiàn)出更高的準(zhǔn)確性和效率。它們能夠捕捉到數(shù)據(jù)中的微妙差異和復(fù)雜模式，使得在未見過的數(shù)據(jù)上也能表現(xiàn)優(yōu)秀，即具有良好的泛化能力（4）多任務(wù)學(xué)習(xí)大模型的多任務(wù)學(xué)習(xí)特點(diǎn)使其能夠同時(shí)處理多種不同的任務(wù)，并從中學(xué)習(xí)到更廣泛和泛化的語言理解能力。通過多任務(wù)學(xué)習(xí)，大模型可以在不同的NLP（NaturalLanguageProcessing）任務(wù)中進(jìn)行訓(xùn)練，例如機(jī)器翻譯、文本摘要、問答系統(tǒng)等。這種多任務(wù)學(xué)習(xí)的方式有助于大模型更好地理解和應(yīng)用語言的規(guī)則和模式3.6大模型的特點(diǎn)（5）大數(shù)據(jù)訓(xùn)練大模型需要大規(guī)模的數(shù)據(jù)來訓(xùn)練，通常在TB級別甚至PB級別。這是因?yàn)榇竽Ｐ蛽碛袛?shù)億甚至數(shù)十億的參數(shù)，需要大量的數(shù)據(jù)來提供足夠的信息供模型學(xué)習(xí)和優(yōu)化。只有大規(guī)模的數(shù)據(jù)才能讓大模型的參數(shù)規(guī)模發(fā)揮優(yōu)勢，提高模型的泛化能力和性能。同時(shí)，大數(shù)據(jù)訓(xùn)練也是保證大模型能夠處理復(fù)雜任務(wù)的關(guān)鍵。通過使用大規(guī)模數(shù)據(jù)，大模型能夠更好地理解數(shù)據(jù)中的復(fù)雜模式和關(guān)系，從而更好地模擬現(xiàn)實(shí)世界中的各種現(xiàn)象（6）強(qiáng)大的計(jì)算資源大模型需要強(qiáng)大的計(jì)算資源來訓(xùn)練和運(yùn)行。由于模型規(guī)模龐大，參數(shù)數(shù)量眾多，計(jì)算復(fù)雜度極高，因此需要高性能的硬件設(shè)備來支持。通常，訓(xùn)練大模型需要使用GPU（GraphicsProcessingUnit，圖形處理器）或TPU（TensorProcessingUnit，張量處理器）等專用加速器來提高計(jì)算效率。這些加速器能夠并行處理大量的參數(shù)和數(shù)據(jù)，使得大模型的訓(xùn)練和推斷速度更快。除了硬件設(shè)備，大模型的訓(xùn)練還需要大量的時(shí)間。由于模型參數(shù)眾多，訓(xùn)練過程中需要進(jìn)行大量的迭代和優(yōu)化，因此，訓(xùn)練周期可能長達(dá)數(shù)周甚至數(shù)月3.6大模型的特點(diǎn)（7）遷移學(xué)習(xí)和預(yù)訓(xùn)練通過在大規(guī)模數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練，大模型能夠?qū)W習(xí)到豐富的語言知識(shí)和模式，從而在各種任務(wù)上展現(xiàn)出卓越的性能。遷移學(xué)習(xí)和預(yù)訓(xùn)練有助于大模型更好地適應(yīng)特定任務(wù)在大規(guī)模數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練后，大模型可以在特定任務(wù)的數(shù)據(jù)上進(jìn)行微調(diào)，從而更好地適應(yīng)目標(biāo)任務(wù)的特性和要求。這種微調(diào)過程可以幫助大模型更好地理解和處理目標(biāo)任務(wù)的特定問題，進(jìn)一步提高模型的性能在特定任務(wù)的數(shù)據(jù)上進(jìn)行微調(diào)遷移學(xué)習(xí)和預(yù)訓(xùn)練也有助于大模型實(shí)現(xiàn)跨領(lǐng)域的應(yīng)用。通過在多個(gè)領(lǐng)域的數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練，大模型可以學(xué)習(xí)到不同領(lǐng)域的知識(shí)和模式，并在不同領(lǐng)域中進(jìn)行應(yīng)用。這種跨領(lǐng)域的應(yīng)用能力，有助于大模型更好地服務(wù)于實(shí)際需求，推動(dòng)人工智能技術(shù)的創(chuàng)新和發(fā)展跨領(lǐng)域的應(yīng)用能力3.6大模型的特點(diǎn)（8）自監(jiān)督學(xué)習(xí)自監(jiān)督學(xué)習(xí)利用大規(guī)模未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練，通過從數(shù)據(jù)中挖掘內(nèi)在的規(guī)律和模式，使模型能夠自動(dòng)地理解和預(yù)測數(shù)據(jù)中的信息。在大規(guī)模的未標(biāo)記數(shù)據(jù)中，大模型通過預(yù)測輸入數(shù)據(jù)的標(biāo)簽或下一個(gè)時(shí)刻的狀態(tài)來進(jìn)行訓(xùn)練。這種訓(xùn)練方式使得大模型能夠從大量的數(shù)據(jù)中自動(dòng)地學(xué)習(xí)到語言的內(nèi)在結(jié)構(gòu)和模式，而不需要人工標(biāo)注和干預(yù)3.6大模型的特點(diǎn)（9）領(lǐng)域知識(shí)融合大模型通過領(lǐng)域知識(shí)融合，能夠?qū)⒉煌I(lǐng)域的數(shù)據(jù)和知識(shí)融合在一起，從而更好地模擬現(xiàn)實(shí)世界中的復(fù)雜現(xiàn)象領(lǐng)域知識(shí)融合使得大模型能夠從多個(gè)領(lǐng)域中學(xué)習(xí)到廣泛的知識(shí)和模式，并將這些知識(shí)和模式整合到統(tǒng)一的框架中3.6大模型的特點(diǎn)（10）自動(dòng)化和效率大模型在應(yīng)用中展現(xiàn)出高度的自動(dòng)化和效率。由于大模型具有強(qiáng)大的表達(dá)能力和學(xué)習(xí)能力，它可以自動(dòng)化許多復(fù)雜的任務(wù)，大大提高工作效率。大模型通過預(yù)訓(xùn)練和微調(diào)過程，能夠自動(dòng)地適應(yīng)特定任務(wù)，而不需要過多的手工調(diào)整和干預(yù)。這使得大模型能夠快速地應(yīng)用于各種實(shí)際場景，并且自動(dòng)地處理復(fù)雜的任務(wù)，如自動(dòng)編程、自動(dòng)翻譯、自動(dòng)摘要等3.7大模型的分類3.7大模型的分類語言大模型視覺大模型多模態(tài)大模型是指在自然語言處理（NaturalLanguageProcessing，NLP）領(lǐng)域中的一類大模型，通常用于處理文本數(shù)據(jù)和理解自然語言。這類大模型的主要特點(diǎn)是它們在大規(guī)模語料庫上進(jìn)行了訓(xùn)練，以學(xué)習(xí)自然語言的各種語法、語義和語境規(guī)則。代表性產(chǎn)品包括GPT系列（OpenAI）、Bard（Google）、DeepSeek、文心一言（百度）等是指在計(jì)算機(jī)視覺（ComputerVision，CV）領(lǐng)域中使用的大模型，通常用于圖像處理和分析。這類模型通過在大規(guī)模圖像數(shù)據(jù)上進(jìn)行訓(xùn)練，可以實(shí)現(xiàn)各種視覺任務(wù)，如圖像分類、目標(biāo)檢測、圖像分割、姿態(tài)估計(jì)、人臉識(shí)別等。代表性產(chǎn)品包括VIT系列（Google）、文心UFO、華為盤古CV、INTERN（商湯）等是指能夠處理多種不同類型數(shù)據(jù)的大模型，例如文本、圖像、音頻等多模態(tài)數(shù)據(jù)。這類模型結(jié)合了NLP和CV的能力，以實(shí)現(xiàn)對多模態(tài)信息的綜合理解和分析，從而能夠更全面地理解和處理復(fù)雜的數(shù)據(jù)。代表性產(chǎn)品包括DingoDB多模向量數(shù)據(jù)庫（九章云極DataCanvas）、DALL-E(OpenAI)、悟空畫畫（華為）、midjourney等3.7大模型的分類按照應(yīng)用領(lǐng)域的不同，大模型主要可以分為L0、L1、L2三個(gè)層級是指可以在多個(gè)領(lǐng)域和任務(wù)上通用的大模型。它們利用大算力、使用海量的開放數(shù)據(jù)與具有巨量參數(shù)的深度學(xué)習(xí)算法，在大規(guī)模無標(biāo)注數(shù)據(jù)上進(jìn)行訓(xùn)練，以尋找特征并發(fā)現(xiàn)規(guī)律，進(jìn)而形成可“舉一反三”的強(qiáng)大泛化能力，可在不進(jìn)行微調(diào)或少量微調(diào)的情況下完成多場景任務(wù)，相當(dāng)于AI完成了“通識(shí)教育”通用大模型L0是指那些針對特定行業(yè)或領(lǐng)域的大模型。它們通常使用行業(yè)相關(guān)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào)，以提高在該領(lǐng)域的性能和準(zhǔn)確度，相當(dāng)于AI成為“行業(yè)專家”行業(yè)大模型L1是指那些針對特定任務(wù)或場景的大模型。它們通常使用任務(wù)相關(guān)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào)，以提高在該任務(wù)上的性能和效果垂直大模型L23.8大模型的應(yīng)用領(lǐng)域3.8大模型的應(yīng)用領(lǐng)域大模型的應(yīng)用領(lǐng)域非常廣泛，涵蓋了自然語言處理、計(jì)算機(jī)視覺、語音識(shí)別、推薦系統(tǒng)、醫(yī)療健康、金融風(fēng)控、工業(yè)制造、生物信息學(xué)、自動(dòng)駕駛、氣候研究等多個(gè)領(lǐng)域（1）自然語言處理大模型在自然語言處理領(lǐng)域具有重要的應(yīng)用，可以用于文本生成（如文章、小說、新聞等的創(chuàng)作）、翻譯系統(tǒng)（能夠?qū)崿F(xiàn)高質(zhì)量的跨語言翻譯）、問答系統(tǒng)（能夠回答用戶提出的問題）、情感分析（用于判斷文本中的情感傾向）、語言生成（如聊天機(jī)器人）等（2）計(jì)算機(jī)視覺大模型在計(jì)算機(jī)視覺領(lǐng)域也有廣泛應(yīng)用，可以用于圖像分類（識(shí)別圖像中的物體和場景）、目標(biāo)檢測（能夠定位并識(shí)別圖像中的特定物體）、圖像生成（如風(fēng)格遷移、圖像超分辨率增強(qiáng)）、人臉識(shí)別（用于安全驗(yàn)證和身份識(shí)別）、醫(yī)學(xué)影像分析（輔助醫(yī)生診斷疾?。┑?.8大模型的應(yīng)用領(lǐng)域（3）語音識(shí)別大模型在語音識(shí)別領(lǐng)域也有應(yīng)用，如語音識(shí)別、語音合成等。通過學(xué)習(xí)大量的語音數(shù)據(jù)，大模型可以實(shí)現(xiàn)高質(zhì)量的跨語言翻譯和語音識(shí)別以及生成自然語音（4）推薦系統(tǒng)大模型可以用于個(gè)性化推薦、廣告推薦等任務(wù)。通過分析用戶的歷史行為和興趣偏好，大模型可以為用戶提供個(gè)性化的推薦服務(wù)，提高用戶滿意度和轉(zhuǎn)化率3.8大模型的應(yīng)用領(lǐng)域大模型可以用于自動(dòng)駕駛中的感知、決策等任務(wù)。通過學(xué)習(xí)大量的駕駛數(shù)據(jù)，大模型可以實(shí)現(xiàn)對車輛周圍環(huán)境的感知和識(shí)別，以及進(jìn)行決策和控制，提高自動(dòng)駕駛的安全性和效率自動(dòng)駕駛大模型可以用于醫(yī)療影像診斷、疾病預(yù)測等任務(wù)。通過學(xué)習(xí)大量的醫(yī)學(xué)影像數(shù)據(jù)，大模型可以輔助醫(yī)生進(jìn)行疾病診斷和治療方案制定，提高醫(yī)療水平和效率醫(yī)療健康大模型可以用于信用評估、欺詐檢測等任務(wù)。通過分析大量的金融數(shù)據(jù)，大模型可以評估用戶的信用等級和風(fēng)險(xiǎn)水平，以及檢測欺詐行為，提高金融系統(tǒng)的安全性和穩(wěn)定性金融風(fēng)控3.8大模型的應(yīng)用領(lǐng)域工業(yè)制造大模型可以用于質(zhì)量控制、故障診斷等任務(wù)。通過學(xué)習(xí)大量的工業(yè)制造數(shù)據(jù)，大模型可以輔助工程師進(jìn)行產(chǎn)品質(zhì)量控制和故障診斷，提高生產(chǎn)效率和產(chǎn)品質(zhì)量氣候研究在氣候研究領(lǐng)域，大模型可以處理氣象數(shù)據(jù)，進(jìn)行天氣預(yù)測和氣候模擬。它們能夠分析復(fù)雜的氣象現(xiàn)象，提供準(zhǔn)確的氣象預(yù)報(bào)，幫助人們做出應(yīng)對氣候變化的決策生物信息學(xué)在生物信息學(xué)領(lǐng)域，大模型可以用于基因序列分析（識(shí)別基因中的功能元件和變異位點(diǎn)）、蛋白質(zhì)結(jié)構(gòu)預(yù)測（推測蛋白質(zhì)的二級和三級結(jié)構(gòu)）、藥物研發(fā)（預(yù)測分子與靶點(diǎn)的相互作用）等3.9大模型對人們工作和生活的影響3.9.1大模型對工作的影響3.9.2大模型對生活的影響3.9.1大模型對工作的影響提高工作效率大模型在自然語言處理、機(jī)器翻譯等領(lǐng)域的應(yīng)用，使得人們能夠快速、準(zhǔn)確地處理大量文本數(shù)據(jù)，提高工作效率。例如，在翻譯領(lǐng)域，大模型能夠自動(dòng)翻譯多種語言，減少人工翻譯的時(shí)間和成本，提高翻譯效率優(yōu)化決策過程大模型能夠收集、整理和分析大量的數(shù)據(jù)，通過數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)，幫助人們更準(zhǔn)確地了解問題現(xiàn)狀，預(yù)測未來趨勢，從而做出更明智的決策自動(dòng)化部分工作大模型的發(fā)展使得一些繁瑣、重復(fù)的工作可以由機(jī)器來完成，從而減輕了人們的工作負(fù)擔(dān)。例如，在金融領(lǐng)域，大模型可以自動(dòng)分析大量的金融數(shù)據(jù)，幫助人們做出更準(zhǔn)確的決策創(chuàng)造新的就業(yè)機(jī)會(huì)隨著大模型的普及和應(yīng)用，將創(chuàng)造出許多新的就業(yè)機(jī)會(huì)。例如，需要更多的人來開發(fā)和維護(hù)大模型，也需要更多的人來利用大模型進(jìn)行各種應(yīng)用開發(fā)3.9.2大模型對生活的影響大模型在智能家居、智能客服等領(lǐng)域的應(yīng)用，使得人們的生活更加便利、舒適。例如，通過智能家居系統(tǒng)，人們可以通過語音指令控制家電，實(shí)現(xiàn)智能化生活改善生活質(zhì)量大模型在教育領(lǐng)域的應(yīng)用，可以幫助人們更高效地學(xué)習(xí)新知識(shí)。例如，通過大模型的智能推薦功能，人們可以根據(jù)自己的興趣和需求，獲取更加個(gè)性化的學(xué)習(xí)資源提高學(xué)習(xí)效率大模型在娛樂領(lǐng)域的應(yīng)用，可以提供更加豐富、多樣的娛樂體驗(yàn)。例如，通過大模型的語音識(shí)別功能，人們可以通過語音指令控制游戲，實(shí)現(xiàn)更加智能化的游戲體驗(yàn)增強(qiáng)娛樂體驗(yàn)3.10本地部署大模型3.10.1為什么需要本地部署大模型離線與高效使用定制化與靈活性數(shù)據(jù)隱私與安全性成本與資源優(yōu)化避免使用限制本地部署大模型3.10.2本地部署大模型方法安裝Ollama下載DeepSeekR1運(yùn)行DeepSeekR1使用OpenWebUI增強(qiáng)交互體驗(yàn)具體安裝過程請參考廈門大學(xué)數(shù)據(jù)庫實(shí)驗(yàn)室博客/blog/5816/3.11基于大模型的智能體3.11基于大模型的智能體智能體（AIAgent），又稱“人工智能代理”，是一種模仿人類智能行為的智能化系統(tǒng)，它就像是擁有豐富經(jīng)驗(yàn)和知識(shí)的“智慧大腦”，能夠感知所處的環(huán)境，并依據(jù)感知結(jié)果，自主地進(jìn)行規(guī)劃、決策，進(jìn)而采取行動(dòng)以達(dá)成特定目標(biāo)。簡單來說，智能體能夠根據(jù)外部輸入做出決策，并通過與環(huán)境的互動(dòng)，不斷優(yōu)化自身行為。智能體本身既不是單純的軟件也不是硬件，而是一個(gè)更為寬泛的概念，它們可以是軟件程序、機(jī)器人或其他形式的系統(tǒng)，具備一定的自主性和智能性。3.11基于大模型的智能體基于大模型的智能體是指利用大語言模型（如GPT、BERT等）作為核心組件，構(gòu)建的能夠執(zhí)行特定任務(wù)、與環(huán)境交互并做出決策的人工智能系統(tǒng)。這些智能體具有自主性、交互性、適應(yīng)性等特點(diǎn)，能夠模擬人類的認(rèn)知和決策過程，提供更加自然、高效和個(gè)性化的交互體驗(yàn)。它們能夠處理海量數(shù)據(jù)，進(jìn)行高效的學(xué)習(xí)與推理，并展現(xiàn)出跨領(lǐng)域的應(yīng)用潛力。3.11基于大模型的智能體2025年1月23日，OpenAI發(fā)布了一個(gè)創(chuàng)新性的智能體——Operator，它是一個(gè)能夠像人類一樣使用計(jì)算機(jī)的智能體。它基于OpenAI最新研發(fā)的CUA（Computer-UsingAgent）模型，CUA將GPT-4o的視覺功能與通過強(qiáng)化學(xué)習(xí)獲得的高級推理相結(jié)合，經(jīng)過訓(xùn)練可以與圖形用戶界面（GUI，即人們在屏幕上看到的按鈕、菜單和文本字段）進(jìn)行交互。Operator通過觀察屏幕并使用虛擬鼠標(biāo)和鍵盤來完成任務(wù)，而無需依賴專門的API接口。這種設(shè)計(jì)使其可以適配任何為人類設(shè)計(jì)的軟件界面，帶來極高的靈活性。Operator好比一個(gè)博士水平的個(gè)人助理，你給他一個(gè)復(fù)雜的任務(wù)，它就會(huì)自動(dòng)執(zhí)行。Operator的主要功能包括自主完成諸如采購雜貨、提交費(fèi)用報(bào)表、訂票、買日用品、填寫表格等任務(wù)，旨在通過自動(dòng)化操作提升日常生活和工作效率。它還可以一邊在StubHub搜索勇士隊(duì)比賽門票，一邊處理網(wǎng)球場預(yù)訂、尋找清潔服務(wù)和DoorDash訂餐，實(shí)現(xiàn)多任務(wù)并行處理。3.11基于大模型的智能體2025年2月3日，OpenAI發(fā)布了一款新的智能體產(chǎn)品——DeepResearch。DeepResearch由OpenAIo3模型的一個(gè)版本提供支持，該模型針對網(wǎng)頁瀏覽和數(shù)據(jù)分析進(jìn)行了優(yōu)化，它利用推理來搜索、解釋和分析互聯(lián)網(wǎng)上的大量文本、圖像和PDF，并根據(jù)需要根據(jù)遇到的信息做出調(diào)整。DeepResearch具有以下四大核心技術(shù)：（1）數(shù)據(jù)雷達(dá)。會(huì)自動(dòng)24小時(shí)掃描全球知識(shí)庫。（2）知識(shí)拼圖。能把零散的信息拼成完整的戰(zhàn)略地圖。（3）邏輯推理。發(fā)現(xiàn)矛盾時(shí)，自動(dòng)回溯、驗(yàn)證，調(diào)整推理路徑。（4）學(xué)術(shù)裁縫。可以綜合各種知識(shí)，生成完美的報(bào)告，還附帶文獻(xiàn)引用。3.11基于大模型的智能體Coze(扣子)4.AIGC應(yīng)用與實(shí)踐4.1AIGC概述4.2文本類AIGC應(yīng)用實(shí)踐4.3圖片類AIGC應(yīng)用實(shí)踐4.4語音類AIGC應(yīng)用實(shí)踐4.5視頻類AIGC應(yīng)用實(shí)踐4.6AIGC在輔助編程中的應(yīng)用4.7AI搜索4.8AI智能辦公4.1AIGC概述4.1.1什么是AIGC4.1.2AIGC與大模型的關(guān)系4.1.3常見的AIGC應(yīng)用場景4.1.4AIGC技術(shù)對行業(yè)發(fā)展的影響4.1.5AIGC技術(shù)對職業(yè)發(fā)展的影響4.1.6常見的AIGC大模型工具4.1.7AIGC大模型的提示詞4.1.1什么是AIGCAIGC的全稱為“ArtificialIntelligenceGeneratedContent”，中文翻譯為“人工智能生成內(nèi)容”。這是一種新的創(chuàng)作方式，利用人工智能技術(shù)來生成各種形式的內(nèi)容，包括文字、音樂、圖像、視頻等AIGC是人工智能進(jìn)入全新發(fā)展時(shí)期的重要標(biāo)志，其核心技術(shù)包括生成對抗網(wǎng)絡(luò)（GAN，GenerativeAdversarialNetworks）、大型預(yù)訓(xùn)練模型、多模態(tài)技術(shù)等AIGC的核心思想是利用人工智能算法生成具有一定創(chuàng)意和質(zhì)量的內(nèi)容。通過訓(xùn)練模型和大量數(shù)據(jù)的學(xué)習(xí)，AIGC可以根據(jù)輸入的條件或指導(dǎo)，生成與之相關(guān)的內(nèi)容。例如，通過輸入關(guān)鍵詞、描述或樣本，AIGC可以生成與之相匹配的文章、圖像、音頻等AIGC技術(shù)不僅可以提高內(nèi)容生產(chǎn)的效率和質(zhì)量，還可以為創(chuàng)作者提供更多的靈感和支持。在文學(xué)創(chuàng)作、藝術(shù)設(shè)計(jì)、游戲開發(fā)等領(lǐng)域，AIGC可以自動(dòng)創(chuàng)作出高質(zhì)量的文本、圖像和音頻等內(nèi)容。同時(shí)，AIGC也可以應(yīng)用于媒體、教育、娛樂、營銷、科研等領(lǐng)域，為用戶提供高質(zhì)量、高效率、高個(gè)性化的內(nèi)容服務(wù)4.1.2AIGC與大模型的關(guān)系大模型與AIGC之間的關(guān)系可以說是相輔相成、相互促進(jìn)的。大模型為AIGC提供了強(qiáng)大的技術(shù)基礎(chǔ)和支撐，而AIGC則進(jìn)一步推動(dòng)了大模型的發(fā)展和應(yīng)用，具體如下：大模型為AIGC提供了豐富的數(shù)據(jù)資源和強(qiáng)大的計(jì)算能力AIGC的需求也推動(dòng)了大模型的發(fā)展大模型和AIGC的結(jié)合，也帶來了廣泛的應(yīng)用前景020103AIGC可以應(yīng)用于各行各業(yè)，主要包括但不限于生成文字、圖像、音頻、視頻等，具體如下：生成商品標(biāo)題、描述、廣告文案和廣告圖電商寫周報(bào)日報(bào)，寫方案，寫運(yùn)營活動(dòng)，制作PPT，寫讀后感，寫代碼辦公生成場景原畫，生成角色形象，生成世界觀，生成數(shù)值，生成3D模型，生成NPC對話，音效生成游戲頭像生成，照片修復(fù)，圖像生成，音樂生成娛樂生成分鏡頭腳本，生成劇本腳本，臺(tái)詞潤色，生成推廣宣傳物料，音樂生成影視4.1.3常見的AIGC應(yīng)用場景原畫繪制，動(dòng)畫生成，分鏡生成，音樂生成動(dòng)漫寫詩，寫小說，生成藝術(shù)創(chuàng)作品，草圖生成，藝術(shù)風(fēng)格轉(zhuǎn)換，音樂創(chuàng)作藝術(shù)批改試卷，試卷創(chuàng)建，搜題答題，課程設(shè)計(jì)，課程總結(jié)，虛擬講師教育UI設(shè)計(jì)，美術(shù)設(shè)計(jì)，插畫設(shè)計(jì)，建筑設(shè)計(jì)設(shè)計(jì)軟文撰寫，大綱提煉，熱點(diǎn)撰寫媒體制定學(xué)習(xí)計(jì)劃，做旅游規(guī)劃生活4.1.3常見的AIGC應(yīng)用場景AIGC技術(shù)對行業(yè)發(fā)展的影響深遠(yuǎn)且廣泛，主要體現(xiàn)在以下幾個(gè)方面：AIGC技術(shù)能夠自動(dòng)生成高質(zhì)量的文本、圖像、音頻和視頻等內(nèi)容，極大地提高了內(nèi)容創(chuàng)作的效率。在新聞、廣告、自媒體等領(lǐng)域，AIGC已經(jīng)實(shí)現(xiàn)了廣泛應(yīng)用，幫助創(chuàng)作者快速生成多樣化、個(gè)性化的內(nèi)容，滿足市場需求。這種技術(shù)革新不僅降低了內(nèi)容創(chuàng)作的成本，還激發(fā)了創(chuàng)作者的創(chuàng)新靈感，推動(dòng)了內(nèi)容產(chǎn)業(yè)的繁榮發(fā)展。內(nèi)容創(chuàng)作領(lǐng)域的革新AIGC技術(shù)在多個(gè)行業(yè)中展現(xiàn)了其提升生產(chǎn)力和降低成本的潛力。例如，在游戲開發(fā)領(lǐng)域，AIGC技術(shù)可以用于場景構(gòu)建、角色互動(dòng)等，減少人工制作的工作量，提高開發(fā)效率。在制造業(yè)中，AIGC技術(shù)可以輔助設(shè)計(jì)、優(yōu)化生產(chǎn)流程，降低生產(chǎn)成本。這些應(yīng)用使得企業(yè)能夠更快地響應(yīng)市場變化，提升競爭力。生產(chǎn)力提升與成本降低AIGC技術(shù)通過提供個(gè)性化、定制化的內(nèi)容和服務(wù)，顯著提升了用戶體驗(yàn)。在智能客服、在線教育等領(lǐng)域，AIGC技術(shù)可以根據(jù)用戶的需求和偏好提供精準(zhǔn)的服務(wù)，滿足用戶的個(gè)性化需求。這種以用戶為中心的服務(wù)模式不僅增強(qiáng)了用戶的滿意度和忠誠度，還為企業(yè)帶來了更多的商業(yè)機(jī)會(huì)。用戶體驗(yàn)的升級AIGC技術(shù)的快速發(fā)展為傳統(tǒng)行業(yè)帶來了轉(zhuǎn)型升級的契機(jī)。通過與AIGC技術(shù)的深度融合，傳統(tǒng)行業(yè)可以探索新的商業(yè)模式和服務(wù)模式，實(shí)現(xiàn)創(chuàng)新發(fā)展。例如，在零售業(yè)中，AIGC技術(shù)可以用于智能推薦、虛擬試衣等場景，提升購物體驗(yàn)并促進(jìn)銷售增長。在金融領(lǐng)域，AIGC技術(shù)可以應(yīng)用于投資策略優(yōu)化、風(fēng)險(xiǎn)管理等方面，提高金融機(jī)構(gòu)的決策效率和準(zhǔn)確性。推動(dòng)行業(yè)創(chuàng)新與轉(zhuǎn)型4.1.4AIGC技術(shù)對行業(yè)發(fā)展的影響AIGC技術(shù)對職業(yè)發(fā)展產(chǎn)生了深遠(yuǎn)的影響，主要體現(xiàn)在以下幾個(gè)方面：傳統(tǒng)職業(yè)的轉(zhuǎn)型升級新興職業(yè)的出現(xiàn)隨著AIGC技術(shù)的快速發(fā)展，一系列與該技術(shù)相關(guān)的新興職業(yè)應(yīng)運(yùn)而生。例如，AI訓(xùn)練師、機(jī)器學(xué)習(xí)工程師、數(shù)據(jù)標(biāo)注員等職業(yè)需求激增。這些新興職業(yè)不僅要求從業(yè)者具備扎實(shí)的技術(shù)基礎(chǔ)，還需要不斷學(xué)習(xí)和掌握最新的AIGC技術(shù)動(dòng)態(tài)。AIGC技術(shù)也為傳統(tǒng)職業(yè)的轉(zhuǎn)型升級提供了契機(jī)。許多傳統(tǒng)職業(yè)如編輯、設(shè)計(jì)師、教師等，在AIGC技術(shù)的輔助下，工作效率和創(chuàng)作質(zhì)量得到了顯著提升。同時(shí)，這些職業(yè)也需要從業(yè)者不斷適應(yīng)技術(shù)變革，掌握新的技能和工具，以適應(yīng)市場需求的變化。工作方式的變革AIGC技術(shù)改變了傳統(tǒng)的工作方式，使得遠(yuǎn)程工作、靈活辦公成為可能。許多企業(yè)開始采用AIGC技術(shù)來優(yōu)化工作流程，減少人力成本，提高工作效率。這種變革不僅為員工提供了更加靈活的工作方式，也為企業(yè)帶來了更大的經(jīng)濟(jì)效益。持續(xù)學(xué)習(xí)與技能提升職業(yè)發(fā)展路徑的多樣化AIGC技術(shù)的發(fā)展為職業(yè)發(fā)展路徑提供了更多的可能性。從業(yè)者可以根據(jù)自己的興趣和特長，選擇適合自己的職業(yè)發(fā)展方向。例如，一些對AI技術(shù)感興趣的從業(yè)者可以選擇成為AI訓(xùn)練師或機(jī)器學(xué)習(xí)工程師，而一些具有創(chuàng)意和設(shè)計(jì)才能的從業(yè)者則可以利用AIGC技術(shù)來提升自己的創(chuàng)作能力。面對AIGC技術(shù)的快速發(fā)展，從業(yè)者需要不斷學(xué)習(xí)和提升自己的技能水平。通過參加培訓(xùn)課程、閱讀專業(yè)書籍、參與技術(shù)論壇等方式，從業(yè)者可以緊跟技術(shù)前沿，保持自己的競爭力。4.1.5AIGC技術(shù)對職業(yè)發(fā)展的影響常見的AIGC大模型工具包括：OpenAI的ChatGPTDeepSeek科大訊飛的訊飛星火阿里的通義千問百度文心一言字節(jié)跳動(dòng)豆包Kimi這些工具基于大規(guī)模語言模型技術(shù)，具備文本生成、語言理解、知識(shí)問答、邏輯推理等多種能力，可廣泛應(yīng)用于寫作輔助、內(nèi)容創(chuàng)作、智能客服等多個(gè)領(lǐng)域。通過不斷迭代和優(yōu)化，為用戶提供更加智能、高效的內(nèi)容生成解決方案4.1.6常見的AIGC大模型工具AIGC大模型的提示詞（Prompt）是指用戶向大模型輸入的文本內(nèi)容，用于觸發(fā)大模型的響應(yīng)并指導(dǎo)其如何生成或回應(yīng)這些提示詞可以是一個(gè)問題、一段描述、一個(gè)指令，甚至是一個(gè)帶有詳細(xì)參數(shù)的文字描述。它們?yōu)榇竽Ｐ吞峁┝松蓪?yīng)文本、圖片、音頻、視頻等內(nèi)容的基礎(chǔ)信息和指導(dǎo)方向。提示詞的重要作用如下：提高準(zhǔn)確性引導(dǎo)生成增強(qiáng)交互性4.1.7AIGC大模型的提示詞使用提示詞需要注意一些技巧，這樣可以從大模型獲得更加符合我們預(yù)期要求的結(jié)果，主要技巧如下：簡潔明確考慮受眾分解復(fù)雜任務(wù)使用肯定性指令示例驅(qū)動(dòng)明確角色遵守規(guī)則自然語言回答4.1.7AIGC大模型的提示詞4.2文本類AIGC應(yīng)用實(shí)踐4.2.1案例1：與DeepSeek進(jìn)行對話4.2.2案例2：與百度文心一言進(jìn)行對話4.2.3案例3：使用訊飛智文生成PPT4.2.1案例1：與DeepSeek進(jìn)行對話1.快速體驗(yàn)DeepSeek訪問DeepSeek官網(wǎng)（/），會(huì)出現(xiàn)如圖7-1所示對話界面，在提示詞輸入框的底部，有兩個(gè)按鈕，即“深度思考(R1)”和“聯(lián)網(wǎng)搜索”，可以用鼠標(biāo)點(diǎn)擊來選中或取消，默認(rèn)情況下，“深度思考(R1)”按鈕是處于選中狀態(tài)，“聯(lián)網(wǎng)搜索”則處于未選中狀態(tài)。兩個(gè)按鈕的功能如下：（1）深度思考(R1)。表示觸發(fā)更復(fù)雜的多步推理能力，適合需要邏輯鏈分析的場景，典型使用場景包括數(shù)學(xué)題/物理題推導(dǎo)、文學(xué)作品的隱喻分析、編程問題的架構(gòu)設(shè)計(jì)、需要分步驟解釋的操作指南等。（2）聯(lián)網(wǎng)搜索。表示實(shí)時(shí)獲取最新網(wǎng)絡(luò)信息，適合時(shí)效性強(qiáng)的查詢，典型使用場景包括查詢實(shí)時(shí)股價(jià)/匯率、驗(yàn)證最新科研成果、獲取突發(fā)事件進(jìn)展、檢索特定網(wǎng)頁內(nèi)容等。4.2.1案例1：與DeepSeek進(jìn)行對話在提示詞輸入框中輸入“請模仿李白的《望廬山瀑布》做一首詩，題目是《看廈門鼓浪嶼》”，然后回車，或者用鼠標(biāo)點(diǎn)擊提示詞輸入框右側(cè)的箭頭按鈕，向DeepSeek發(fā)起提問。DeepSeek給出的回答如圖7-2所示，需要注意的是，大模型屬于概率模型，每次生成的回答內(nèi)容可能不完全相同。1.快速體驗(yàn)DeepSeek4.2.1案例1：與DeepSeek進(jìn)行對話2.DeepSeek的基本用法（1）基本原則：簡單直接，自然表達(dá)。①無需復(fù)雜結(jié)構(gòu)。直接描述需求即可，無需添加“角色扮演”（如“假設(shè)你是專家”）或復(fù)雜指令（如“用學(xué)術(shù)語言分三點(diǎn)回答”）。比如，你可以直接向DeepSeek提問“什么是光合作用？”、“如何用Python寫一個(gè)計(jì)算器程序？”，而不建議使用提示詞“請以生物學(xué)教授的身份，用三個(gè)段落解釋光合作用，每段不超過100字”。②多輪對話優(yōu)化結(jié)果。如果首次回答不完整，可通過追問補(bǔ)充細(xì)節(jié)，無需一次性給出完美提示。比如，第一輪提問“寫一首關(guān)于秋天的詩”，第二輪提問“加入一些悲傷的情緒”，第三輪提問“把‘落葉’換成比喻句”。（2）不同場景的提問技巧（非必需，但可提升效率）。雖然簡單提問即可滿足大多數(shù)需求，但在復(fù)雜任務(wù)中，適當(dāng)提供背景信息或明確需求會(huì)讓結(jié)果更精準(zhǔn)，具體技巧包括：①知識(shí)類問題。比如，基礎(chǔ)提問是“量子力學(xué)的基本原理是什么？”，優(yōu)化后的提問是“用通俗易懂的語言解釋量子糾纏，適合高中生理解”，②

創(chuàng)作類任務(wù)（寫作、編程等）。比如，基礎(chǔ)提問是“寫一個(gè)關(guān)于人工智能的科幻短篇故事”，優(yōu)化后的提問是“寫一個(gè)反烏托邦主題的科幻故事，主角是女性工程師，結(jié)局有反轉(zhuǎn)”。③實(shí)用建議（學(xué)習(xí)、工作等）。比如，基礎(chǔ)提問是“如何提高英語聽力？”，優(yōu)化后的提問是“我每天只有30分鐘學(xué)習(xí)時(shí)間，有哪些高效的英語聽力練習(xí)方法？”。④復(fù)雜任務(wù)（數(shù)據(jù)分析、代碼調(diào)試）。比如，基礎(chǔ)提問是“這段Python代碼報(bào)錯(cuò)了，幫我看看問題”，優(yōu)化后的提問是“我的代碼目標(biāo)是爬取網(wǎng)頁數(shù)據(jù)，但遇到SSL證書錯(cuò)誤。報(bào)錯(cuò)信息如下：[粘貼代碼]”。4.2.1案例1：與DeepSeek進(jìn)行對話作為初學(xué)者，DeepSeek的一些“魔法”指令也很有用，比如，你可以輸入“/步驟如何??機(jī)拍攝旅游照?”，DeepSeek返回的回答結(jié)果就會(huì)按照步驟詳細(xì)給出拍攝旅游照片的說明，再比如，你可以輸入“請解釋量?計(jì)算，然后/簡化”，它就會(huì)返回比較簡明扼要的回答。2.DeepSeek的基本用法表DeepSeek的“魔法”指令指令功能/續(xù)寫當(dāng)回答中斷時(shí)?動(dòng)繼續(xù)?成/簡化將復(fù)雜內(nèi)容轉(zhuǎn)換成??話/?例要求展?實(shí)際案例（特別是寫代碼時(shí)）/步驟讓AI分步驟指導(dǎo)操作流程/檢查幫你發(fā)現(xiàn)?檔中的錯(cuò)誤4.2.1案例1：與DeepSeek進(jìn)行對話3.使用DeepSeek處理文檔點(diǎn)擊DeepSeek界面中的「回形針」圖標(biāo)上傳?件，支持的文件類型包括文本類（PDF、DOCX、TXT、Markdown）、數(shù)據(jù)類（CSV、XLSX）和圖像類（JPG、PNG）。然后，就可以在對話框中輸入提示詞，比如，可以輸入“總結(jié)這份年報(bào)的三個(gè)核?要點(diǎn)”、“提取合同中的責(zé)任條款制成表格”、“對??檔A和?檔B的市場策略差異”、“從實(shí)驗(yàn)報(bào)告中整理所有溫度數(shù)據(jù)”、“請識(shí)別圖片中的文字”等。也可以使用一些指令來處理文檔，如表7-2所示。表

用于文檔處理的DeepSeek指令功能指令模板應(yīng)用場景內(nèi)容摘要/總結(jié)[文件名]生成500字摘要快速把握長篇文檔核心內(nèi)容問答提取/問答[文件名]第三章提到的技術(shù)參數(shù)是？精準(zhǔn)定位特定信息數(shù)據(jù)可視化/可視化[文件名]將銷售數(shù)據(jù)生成折線圖轉(zhuǎn)化表格數(shù)據(jù)為圖形分析跨文檔對比/對比文件Avs文件B的政策差異合同/論文查重對比還可以要求DeepSeek對回答結(jié)果進(jìn)行結(jié)構(gòu)化輸出，比如，可以輸入如下提示詞：/解析文件

年度報(bào)告.docx輸出要求：

1.按"營收/利潤/成本"分類

2.用Markdown表格對比近三年數(shù)據(jù)

3.關(guān)鍵增長點(diǎn)用?標(biāo)注（1）告訴文心一言你要的風(fēng)格在輸入提示詞時(shí)，明確指定你希望生成的文本內(nèi)容的風(fēng)格。這樣，文心一言在理解并處理你的請求時(shí)，會(huì)更有針對性地調(diào)整其生成內(nèi)容的風(fēng)格，以滿足你的具體需求。比如，可以使用提示詞：請按照要求寫一篇200字左右關(guān)于云計(jì)算的介紹。注意事項(xiàng)：文章的受眾是中學(xué)生，需要通俗易懂，語言風(fēng)格需要幽默、風(fēng)趣一些想要生成不同語氣風(fēng)格的文字，可以在問題描述中加入你想要的語氣風(fēng)格作為限定條件，提示文心一言按照你的要求去輸出。比如，如果你需要正式語氣，可以在提示詞中加入“請采用正式的詞匯和語法結(jié)構(gòu)，使內(nèi)容顯得莊重、嚴(yán)肅和專業(yè)”；如果你需要抒情語氣，請?jiān)谔崾驹~中加入“請使用富有感情和表達(dá)感情的詞匯，使內(nèi)容產(chǎn)生共鳴和情緒共振”；如果你需要口語化語氣，請?jiān)谔崾驹~中加入“請運(yùn)用口語化的表達(dá)方式，例如俚語、俗語和口頭禪，使內(nèi)容更加輕松和親切”。4.2.2案例2：與百度文心一言進(jìn)行對話（2）告訴文心一言你要的結(jié)構(gòu)在構(gòu)建提示詞時(shí)，應(yīng)明確指定期望的輸出結(jié)構(gòu)。比如，如果是要求生成一篇文章，可以在提示詞中明確指出“請按照引言-正文-結(jié)論的結(jié)構(gòu)來撰寫”。這樣，文心一言在生成內(nèi)容時(shí)，會(huì)遵循這一結(jié)構(gòu)框架，使得輸出更加條理清晰、邏輯嚴(yán)密。再比如，如果要撰寫給上級領(lǐng)導(dǎo)的方案、報(bào)告、總結(jié)時(shí)，可以使用提示詞：請按照【現(xiàn)狀/問題/解決方案，數(shù)據(jù)洞察/問題概覽/調(diào)研方向，數(shù)據(jù)/亮點(diǎn)/問題/經(jīng)驗(yàn)】這個(gè)結(jié)構(gòu)撰寫一份關(guān)于我國芯片行業(yè)的總結(jié)報(bào)告4.2.2案例2：與百度文心一言進(jìn)行對話（3）告訴文心一言你要的角色在提示詞中可以設(shè)定具體的角色或視角。例如，在要求創(chuàng)作故事時(shí)，可以明確指定“以一位勇敢探險(xiǎn)家的視角講述這段經(jīng)歷”。這樣的提示能引導(dǎo)文心一言在生成內(nèi)容時(shí)，從特定角色的角度出發(fā)，賦予文本獨(dú)特的情感色彩和敘事風(fēng)格。此技巧有助于增強(qiáng)生成內(nèi)容的代入感和故事性，使內(nèi)容更加豐富和引人入勝。下面是一段提示詞實(shí)例：請你作為一個(gè)小紅書文案撰寫高手，為我生成一篇爆款小紅書文案，要求：突出酒店的特色，包括海景房、豪華單間、最新裝修、免費(fèi)早餐、無線上網(wǎng)等下面是另一段提示詞實(shí)例：我希望你能扮演記者的角色，按照我的要求撰寫一份新聞?wù){(diào)查，要求：調(diào)查油罐車不清洗直接運(yùn)送食用油的事情，不要出現(xiàn)具體企業(yè)名稱，要給出政府部門的處理態(tài)度4.2.2案例2：與百度文心一言進(jìn)行對話（4）告訴文心一言你的內(nèi)容要求可以通過詳細(xì)具體的提示詞明確表達(dá)內(nèi)容要求。無論是希望生成的文章主題、關(guān)鍵詞匯，還是期望涵蓋的信息點(diǎn)、情感傾向，都應(yīng)在提示詞中清晰呈現(xiàn)。這樣做能讓文心一言更準(zhǔn)確地理解用戶需求，生成更符合期望的內(nèi)容。比如，可以通過如下提示詞表達(dá)自己的內(nèi)容要求：在6G專利申請方面，中國已經(jīng)遙遙領(lǐng)先。2021年的數(shù)據(jù)顯示，中國的6G專利申請量占比高達(dá)40.3%，穩(wěn)坐世界第一的寶座。請把上面的數(shù)據(jù)更新到目前最新的數(shù)據(jù)4.2.2案例2：與百度文心一言進(jìn)行對話（4）告訴文心一言你的內(nèi)容要求如果對輸出的內(nèi)容有比較多的要求或限制，不妨在輸入框中將這些內(nèi)容要求一條一條明確告訴文心一言，比如，可以采用類似如下的提示詞：請以小紅書的風(fēng)格，按照以下要求幫我為“海景美食餐廳”寫一篇小紅書種草文案；內(nèi)容要求：（1）要有標(biāo)題、正文（2）標(biāo)題字?jǐn)?shù)：不超過20個(gè)字；盡量簡短精煉，要足夠吸引眼球，用詞浮夸（3）正文分段，層次分明，每段最少100字（4）要用“首先、其次、最后”這種模式（5）整篇文案不要超過1000個(gè)字4.2.2案例2：與百度文心一言進(jìn)行對話（5）告訴文心一言你想寫的文體明確指定文體，如散文、小說、詩歌、科技文等，讓大模型理解并模擬該文體的語言特點(diǎn)、結(jié)構(gòu)安排和表達(dá)習(xí)慣，從而輸出更具針對性的文本。比如，可以采用提示詞“請寫一段[中秋賞月]的朋友圈文案，需要采用藏頭詩的形式”4.2.2案例2：與百度文心一言進(jìn)行對話（6）指導(dǎo)文心一言分步解決問題將復(fù)雜問題拆解成多個(gè)簡單、具體的步驟，作為提示詞輸入給文心一言。這樣不僅能降低問題的處理難度，使文心一言更容易理解和響應(yīng)，還能確保解決問題的過程更加系統(tǒng)、有條理。通過逐步引導(dǎo)，可以逐步逼近問題的解決方案，提高答案的準(zhǔn)確性和實(shí)用性。比如，如果想讓文心一言幫你制定一份旅行規(guī)劃，可以使用類似如下的提示詞：請為我規(guī)劃一次為期一周的廈門自由行；（1）第1步：列出必去的景點(diǎn)，如廈門大學(xué)、鼓浪嶼、環(huán)島路、五緣灣、曾厝垵；（2）第2步：根據(jù)景點(diǎn)位置安排每日行程，確保交通便利；（3）第3步：推薦幾家當(dāng)?shù)氐奶厣蛷d，包括早餐、午餐和晚餐；（4）第4步：提供一家性價(jià)比高的酒店住宿建議，并考慮其位置是否便于游覽。4.2.2案例2：與百度文心一言進(jìn)行對話（7）告訴文心一言你要的示例明確溝通意圖，通過具體示例引導(dǎo)大模型理解你的需求。這有助于文心一言更準(zhǔn)確地捕捉你的思維框架和期望結(jié)果，減少誤解。比如，可以使用類似如下的提示詞：我是一位高校教師，請幫我寫一份工作周報(bào)，內(nèi)容盡量簡潔精煉，下面是我本周的工作內(nèi)容：（1）完成了5個(gè)本科生畢業(yè)論文修改（2）撰寫了教材的一個(gè)章節(jié)“云計(jì)算與大數(shù)據(jù)”輸出要求示例：【本周工作周報(bào)】【本周工作進(jìn)展】本周做了哪些事，產(chǎn)生了哪些結(jié)果【下周工作安排】基于本周的結(jié)果下周要推進(jìn)哪些事【思考總結(jié)】簡要說說本周的收獲和反思4.2.2案例2：與百度文心一言進(jìn)行對話（8）告訴文心一言你要的場景在輸入提示詞時(shí)，應(yīng)明確描述所需的上下文或環(huán)境背景，如“在科幻電影中描述一個(gè)未來城市的景象”或“請撰寫一封給朋友的生日祝福信，場景設(shè)定在海邊日落時(shí)”。這樣做有助于文心一言更好地理解你的需求，生成更符合場景氛圍和情境的內(nèi)容，從而提升輸出內(nèi)容的貼切性和情感共鳴。4.2.2案例2：與百度文心一言進(jìn)行對話訊飛智文是科大訊飛公司旗下的AI一鍵生成PPT/WORD的網(wǎng)站平臺(tái)，是基于科大訊飛星火認(rèn)知大模型技術(shù)基礎(chǔ)上開發(fā)的一個(gè)具體應(yīng)用，主要功能有文檔一鍵生成、AI撰寫助手、多語種文檔生成、AI自動(dòng)配圖、模板圖示切換功能。這里介紹如何使用訊飛智文快速生成PPT。請首先準(zhǔn)備一個(gè)包含文本內(nèi)容的PDF文件，比如，可以從網(wǎng)絡(luò)新聞報(bào)道中復(fù)制一段關(guān)于2024年7月19日微軟藍(lán)屏事件的內(nèi)容保存到一個(gè)WORD文檔中，命名為“微軟藍(lán)屏.docx”，然后，使用WPS軟件打開“微軟藍(lán)屏.docx”，把該WORD文檔保存成PDF格式，生成“微軟藍(lán)屏.pdf”。4.2.3案例3：使用訊飛智文生成PPT訪問訊飛智文官網(wǎng)（/），在首頁（如圖所示）中點(diǎn)擊“免費(fèi)使用”，然后按照網(wǎng)頁提示完成注冊（推薦使用手機(jī)號(hào)注冊）。4.2.3案例3：使用訊飛智文生成PPT在頁面中（如圖7-2所示）點(diǎn)擊“開始制作”。在出現(xiàn)的頁面中（如圖7-3所示），選擇AIPPT的“文檔創(chuàng)建”。然后，在出現(xiàn)的頁面中（如圖7-4所示），點(diǎn)擊“點(diǎn)擊上傳”，把本地文件“微軟藍(lán)屏.pdf”文件上傳上去（當(dāng)然，也可以上傳“微軟藍(lán)屏.docx”）。然后，在出現(xiàn)的頁面中（如圖7-5所示），點(diǎn)擊“開始解析文檔”。之后，頁面會(huì)顯示提示文字“好的，已收到您的要求，讓我先為您生成PPT標(biāo)題和大綱”。過一會(huì)兒，就會(huì)顯示自動(dòng)生成的PPT標(biāo)題和大綱，如果你不滿意，可以點(diǎn)擊頁面底部的“重新生成”，如果滿意，可以直接點(diǎn)擊“下一步”。圖7-2開始創(chuàng)作4.2.3案例3：使用訊飛智文生成PPT圖7-3選擇AIPPT中的“文檔創(chuàng)建”4.2.3案例3：使用訊飛智文生成PPT圖7-4上傳文件4.2.3案例3：使用訊飛智文生成PPT圖7-5開始解析文檔4.2.3案例3：使用訊飛智文生成PPT在出現(xiàn)的頁面中（如圖7-6所示），選擇你想要的模板配色，比如，這里選擇“清逸天藍(lán)”，然后點(diǎn)擊頁面頂部的“下一步”。經(jīng)過一段時(shí)間以后，頁面就會(huì)顯示自動(dòng)生成的PPT（如圖7-7所示），點(diǎn)擊頁面右上角的“導(dǎo)出”，就可以把PPT保存到本地電腦中，然后，可以根據(jù)自己的需求，自己對PPT繼續(xù)進(jìn)行修改和完善。在本地電腦中打開自動(dòng)生成的PPT，可以看出，AI制作PPT的水平非常專業(yè)，邏輯清晰，配圖精美，超過了很多PPT初級者的制作水平，可以大大提高普通用戶制作PPT的效率和水平。圖7-6選擇模板配色4.2.3案例3：使用訊飛智文生成PPT4.3圖片類AIGC應(yīng)用實(shí)踐4.3.1圖片類AIGC應(yīng)用場景4.3.2圖片類AIGC案例實(shí)踐圖片類AIGC是一種基于人工智能技術(shù)生成圖片的方法，它利用深度學(xué)習(xí)、生成對抗網(wǎng)絡(luò)（GAN）等先進(jìn)算法，通過學(xué)習(xí)和模仿大量圖像數(shù)據(jù)，能夠自動(dòng)創(chuàng)作出高度真實(shí)和藝術(shù)化的圖片。AIGC在圖像生成、修復(fù)、風(fēng)格轉(zhuǎn)換、藝術(shù)創(chuàng)作等領(lǐng)域展現(xiàn)出強(qiáng)大能力，為數(shù)字藝術(shù)、設(shè)計(jì)、游戲、電影等多個(gè)行業(yè)帶來創(chuàng)新解決方案。其優(yōu)勢包括高效性、多樣性和自動(dòng)化，能夠快速生成大量高質(zhì)量的圖像內(nèi)容，滿足各種復(fù)雜需求。4.3

圖片類AIGC應(yīng)用實(shí)踐圖片類AIGC的應(yīng)用場景非常廣泛，?主要包括圖像生成、?圖像修復(fù)、?圖像增強(qiáng)和圖像識(shí)別等方面：?AIGC還可以修復(fù)損壞的圖像，?如去除噪聲、?填充缺失的部分等。?這項(xiàng)技術(shù)對于保護(hù)和恢復(fù)古老的藝術(shù)作品、?修復(fù)損壞的照片等具有重要意義。??AIGC?能夠生成高度逼真的圖像，?如人臉、?動(dòng)物、?建筑物等。?例如，?OpenAI發(fā)布的DALL-E可以根據(jù)文本提示詞創(chuàng)作出全新的、?原創(chuàng)的圖像，?展示了AI在圖像創(chuàng)作方面的強(qiáng)大能力。??通過對圖像進(jìn)行增強(qiáng)處理，?AIGC可以增加圖像的飽滿感和增強(qiáng)細(xì)節(jié)，?使圖像質(zhì)量得到提升。?這在提升照片的視覺效果、?改善圖像的清晰度和細(xì)節(jié)方面非常有用。??AIGC在圖像識(shí)別方面也有廣泛應(yīng)用，?可以識(shí)別圖像中的對象、?場景和特征，?如人臉識(shí)別、?車牌識(shí)別等。?這項(xiàng)技術(shù)對于安防監(jiān)控、?智能搜索、?自動(dòng)駕駛等領(lǐng)域的發(fā)展至關(guān)重要。圖像生成圖像識(shí)別圖像增強(qiáng)圖像修復(fù)4.3.1

圖片類AIGC應(yīng)用場景圖片類AIGC大模型主要包括Midjourney、StableDiffusionSDXL、百度文心一格等。這里以百度文心一格為例介紹圖片類AIGC的使用方法。文心一格是一款由百度公司研發(fā)的AI繪畫工具，?為用戶提供了豐富的創(chuàng)意空間。?使用文心一格進(jìn)行AI繪畫的步驟包括注冊賬戶、?選擇創(chuàng)作模式、輸入提示詞、設(shè)置畫面類型、設(shè)置比例、設(shè)置數(shù)量以及生成圖片等，具體如下：（1）注冊賬戶：?訪問文心一格官網(wǎng)（/），?點(diǎn)擊“注冊”按鈕，?完成注冊過程。?（2）選擇創(chuàng)作模式：進(jìn)入文心一格首頁以后，?點(diǎn)擊“立即創(chuàng)作”。在出現(xiàn)的界面中，在界面左上角位置選擇“AI創(chuàng)作”，可供選擇的模式包括推薦、自定義、商品圖、藝術(shù)字、海報(bào)，可以滿足不同的創(chuàng)作需求。這里可以選擇默認(rèn)的模式“推薦”。4.3.2

圖片類AIGC案例實(shí)踐圖文心一格操作界面（3）輸入提示詞：在提示詞輸入框中輸入提示詞，比如輸入“請繪制一張圖片，一個(gè)9歲的女孩子在海邊沙灘上挖沙子”。（4）設(shè)置畫面類型：可以選擇智能推薦、唯美二次元、中國風(fēng)等各種類型。（5）設(shè)置比例：可以選擇豎圖、方圖、橫圖。（6）設(shè)置數(shù)量：設(shè)置想要生成的圖片的數(shù)量，比如設(shè)置為1。（7）生成圖片：點(diǎn)擊“立即生成”，就可以生成相應(yīng)的圖片（如圖所示）。圖片生成以后，可以點(diǎn)擊圖片底部的“編輯本圖片”，對圖片進(jìn)行編輯。4.3.2

圖片類AIGC案例實(shí)踐文心一格提供了豐富的AI編輯功能，可以對圖片進(jìn)行各種智能化處理，包括圖片擴(kuò)展、圖片變高清、涂抹消除、智能摳圖、涂抹編輯、圖片疊加等4.3.2

圖片類AIGC案例實(shí)踐4.4語音類AIGC應(yīng)用實(shí)踐4.4.1語音類AIGC應(yīng)用場景4.4.2語音類AIGC案例實(shí)踐語音類AIGC是一種利用人工智能技術(shù)（特別是語音識(shí)別、自然語言處理和語音合成技術(shù)），自動(dòng)生成和處理語音內(nèi)容的技術(shù)。它能夠模擬人類語音，實(shí)現(xiàn)語音到文本的轉(zhuǎn)換、文本到語音的合成，以及語音情感分析等功能，廣泛應(yīng)用于智能語音助手、智能客服、語音翻譯等多個(gè)領(lǐng)域。4.4

語音類AIGC應(yīng)用實(shí)踐語音類AIGC的應(yīng)用場景非常豐富，涵蓋了多個(gè)領(lǐng)域，從日常生活到專業(yè)應(yīng)用，都展現(xiàn)出了其獨(dú)特的價(jià)值和潛力，以下是一些主要的語音類AIGC應(yīng)用場景：應(yīng)用場景01智能語音助手07智能駕駛艙與車載語音助手02智能客服06語音分析與情感識(shí)別03語音合成與轉(zhuǎn)換05語音翻譯04虛擬人物與數(shù)字人4.4.1語音類AIGC應(yīng)用場景豆包大模型的語音類功能用法一般情況下，普通用戶在手機(jī)上使用語音類AIGC大模型的場景比較多，因此，這里介紹手機(jī)版豆包的使用方法。圖豆包的對話界面在智能手機(jī)上下載并安裝“豆包APP”。啟動(dòng)進(jìn)入豆包APP，會(huì)出現(xiàn)如圖所示的對話界面，按住“語音按鈕”（圖中箭頭指向的位置）不要松開，然后就可以對著手機(jī)說話，把自己的需求說出來，比如，可以說“請介紹一下廈門大學(xué)”，然后松開“語音按鈕”，豆包就可以立即開始回答你提出的問題。豆包可以支持實(shí)時(shí)翻譯，你可以語音輸入“廈門大學(xué)的英文名稱是什么”，豆包會(huì)馬上給出翻譯結(jié)果。4.4.2語音類AIGC案例實(shí)踐豆包大模型的語音類功能用法豆包不僅支持語音輸入，也可以支持文字輸入，只要在文字輸入框內(nèi)輸入提示詞，豆包就會(huì)給出回答。豆包也支持AI繪圖功能，你可以用手指點(diǎn)擊界面上的“圖片生成”按鈕，然后輸入提示詞，比如通過文字或者語音輸入“請幫我繪制一張圖片，一個(gè)9歲的小女孩在海邊沙灘上玩沙子”，然后，豆包就會(huì)自動(dòng)繪制生成滿足你要求的圖片4.4.2語音類AIGC案例實(shí)踐豆包大模型的語音類功能用法豆包還有一個(gè)很實(shí)用的功能，就是可以幫助你進(jìn)行英語口語對話練習(xí)。在豆包的操作界面的底部，用手指點(diǎn)擊“對話”，在出現(xiàn)的功能選擇界面中（如圖所示），選擇“英語口語聊天搭子”就可以進(jìn)入英語口語聊天界面（如圖所示），按住界面右下角的“語音按鈕”，就可以開始用英語語音聊天了，你說完一句英語，松開語音按鈕，豆包就會(huì)自動(dòng)用英語語音回答你，然后你可以繼續(xù)輸入語音進(jìn)行后續(xù)對話。圖豆包的功能選擇界面圖豆包的英語口語聊天界面4.4.2語音類AIGC案例實(shí)踐訊飛智作大模型的語音類功能用法訪問訊飛配音官網(wǎng)（/），首先按照頁面提示完成用戶注冊。注冊成功以后，會(huì)進(jìn)入“訊飛智作”頁面（如圖4-13所示），在頁面頂部選擇“訊飛配音”。在訊飛配音頁面（如圖4-14所示），輸入你的配音文本內(nèi)容，比如輸入“人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量，是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)”?？梢栽O(shè)置配音的品質(zhì)，點(diǎn)擊頁面左上角“敘述（品質(zhì)）”，在出現(xiàn)的頁面中（如圖4-15所示），可以選擇自己喜歡的主播類型，并且允許對主播的語速和語調(diào)進(jìn)行設(shè)置，然后再點(diǎn)擊頁面右上角的“使用”按鈕。然后，點(diǎn)擊頁面右上角的“生成音頻”，在出現(xiàn)的頁面中（如圖4-16所示），設(shè)置作品名稱、文件格式和字幕，再點(diǎn)擊“確認(rèn)”。這時(shí)，會(huì)出現(xiàn)訂單支付頁面（如圖4-17所示），可以選擇“會(huì)員及語音包購買”（45元一個(gè)月）或者“單次付費(fèi)”（20元每次）。完成費(fèi)用支付以后，就會(huì)出現(xiàn)下載提示頁面（如圖4-18所示），點(diǎn)擊“去下載”，然后，在出現(xiàn)的下載頁面中（如圖4-19所示），點(diǎn)擊下載按鈕（圖中箭頭指向的位置）就可以把配音文件下載到本地電腦中。在本地電腦播放下載后的配音文件可以發(fā)現(xiàn)，現(xiàn)在的AI配音技術(shù)已經(jīng)比較成熟，生成的配音質(zhì)量已經(jīng)可以達(dá)到專業(yè)配音員的水平。4.4.2語音類AIGC案例實(shí)踐訊飛智作大模型的語音類功能用法圖4-13訊飛智作頁面圖4-14訊飛配音頁面4.4.2語音類AIGC案例實(shí)踐訊飛智作大模型的語音類功能用法圖4-15選擇主播4.4.2語音類AIGC案例實(shí)踐訊飛智作大模型的語音類功能用法圖4-16作品命名頁面圖4-17訂單支付頁面4.4.2語音類AIGC案例實(shí)踐訊飛智作大模型的語音類功能用法圖4-18下載頁面圖4-19點(diǎn)擊下載按鈕4.4.2語音類AIGC案例實(shí)踐4.5視頻類AIGC應(yīng)用實(shí)踐4.5.1視頻類AIGC應(yīng)用場景4.5.2代表性視頻類AIGC大模型4.5.3視頻類AIGC案例實(shí)踐視頻類AIGC是指利用人工智能技術(shù)，特別是深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等算法，自動(dòng)創(chuàng)建或處理視頻內(nèi)容的技術(shù)。它能根據(jù)給定的文本、圖像或其他數(shù)據(jù)，自動(dòng)生成符合描述的視頻內(nèi)容，涵蓋文生視頻、圖生視頻、視頻風(fēng)格化、人物動(dòng)態(tài)化等多個(gè)方向。這一技術(shù)在創(chuàng)意設(shè)計(jì)、影視制作等領(lǐng)域潛力巨大，極大地提升了視頻內(nèi)容的生產(chǎn)效率和質(zhì)量4.5視頻類AIGC應(yīng)用實(shí)踐視頻類AIGC在多個(gè)領(lǐng)域擁有廣泛的應(yīng)用場景，以下是一些主要的應(yīng)用方向：影視制作與后期制作短視頻與直播廣告與營銷教育與培訓(xùn)虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)其他領(lǐng)域新聞傳播與媒體融合4.5.1視頻類AIGC應(yīng)用場景視頻類AIGC大模型發(fā)端于Sora。2

人人文庫> 全部分類> 應(yīng)用文書 > 事務(wù)文書

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

廈大團(tuán)隊(duì)：大模型概念、技術(shù)與應(yīng)用實(shí)踐（140 頁P(yáng) P T讀懂大模型）

文檔簡介

溫馨提示

最新文檔

評論

廈大團(tuán)隊(duì)：大模型概念、技術(shù)與應(yīng)用實(shí)踐（140 頁P(yáng) P T讀懂大模型）

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

廈大團(tuán)隊(duì)：大模型概念、技術(shù)與應(yīng)用實(shí)踐（140 頁P(yáng) P T讀懂大模型）