ChatGPT(智能對話開創(chuàng)新時(shí)代)_第1頁
ChatGPT(智能對話開創(chuàng)新時(shí)代)_第2頁
ChatGPT(智能對話開創(chuàng)新時(shí)代)_第3頁
ChatGPT(智能對話開創(chuàng)新時(shí)代)_第4頁
ChatGPT(智能對話開創(chuàng)新時(shí)代)_第5頁
已閱讀5頁,還剩161頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ChatGPT智能對話開創(chuàng)新時(shí)代目錄TOC\h\h第一章劃時(shí)代的浪潮:ChatGPT\h第一節(jié)什么是ChatGPT\h五大特點(diǎn)\h締造傳奇:OpenAI\h業(yè)務(wù)模式\h第二節(jié)層層的突破\h邏輯性強(qiáng)的結(jié)構(gòu)化寫作\h藝術(shù)性強(qiáng)的非結(jié)構(gòu)化寫作\h高效率的輔助性寫作\h技術(shù)性強(qiáng)的代碼生成\h第三節(jié)問題、引導(dǎo)與使用\h對話的藝術(shù)\h如何精準(zhǔn)提問\h玩轉(zhuǎn)ChatGPT\h第四節(jié)革新與局限性\h無與倫比的性能\h局限與優(yōu)勢同在\h第二章ChatGPT與智能對話系統(tǒng)\h第一節(jié)認(rèn)識(shí)智能對話系統(tǒng)\h從文字到對話\h自然語言處理\h從語音到對話\h情感計(jì)算與對話\h第二節(jié)智能對話的發(fā)展\h早期智能對話系統(tǒng)\h智能對話機(jī)器人\h智能對話模型\h第三節(jié)智能技術(shù)之于ChatGPT\h深度學(xué)習(xí)\h強(qiáng)化學(xué)習(xí)\h算力的挑戰(zhàn)\h第三章ChatGPT的技術(shù)原理\h第一節(jié)前置自然語言處理技術(shù)\h探秘編碼器—解碼器\h探秘注意力機(jī)制\hTransformer:端到端模型的里程碑\h預(yù)訓(xùn)練模型的前世今生\h第二節(jié)GPT模型的革新\hGPT-1的嘗試\hGPT-2的探索\hGPT-3的強(qiáng)化\h第三節(jié)如何訓(xùn)練ChatGPT\h有監(jiān)督微調(diào)\h反饋模型的改進(jìn)\h近端策略優(yōu)化算法\h第四節(jié)GPT技術(shù)新發(fā)展——GPT-4\h支持圖像信息\h更長的上下文\h更智能的問答\h第四章ChatGPT的應(yīng)用場景\h第一節(jié)教育的思考與探索\h教學(xué)的革命\h用ChatGPT寫作業(yè)\h隱患與風(fēng)險(xiǎn)并存\h前景與改變\h第二節(jié)醫(yī)療的變革與進(jìn)步\h醫(yī)療管理技術(shù)的精準(zhǔn)化\h臨床醫(yī)學(xué)的輔助者\(yùn)h第三節(jié)互聯(lián)網(wǎng)的蛻變與升騰\h搜索引擎的劇變\h編程新時(shí)代\h游戲的新局面\h第四節(jié)服務(wù)業(yè)的震動(dòng)與潛力\h不得不提的智能客服\h不僅僅是咨詢\h更流暢的翻譯\h第五節(jié)創(chuàng)作的突破與升華\h文案創(chuàng)作的新模式\h營銷與廣告的新內(nèi)容\h第五章類ChatGPT產(chǎn)品\h第一節(jié)國外市場火熱依舊\h聊天機(jī)器人的競爭\h模型測評者\(yùn)h其他大語言模型\h第二節(jié)國內(nèi)市場的突破進(jìn)展\h“文心一言”的發(fā)布\hChatYuan的解決方案\h華為PanGu模型的提出\hWeLM的嘗試\h第三節(jié)類ChatGPT與ChatGPT的故事\h應(yīng)用場景的差異\h規(guī)模對比\h自定義的程度\h精度和速度的差異\h第六章ChatGPT的社會(huì)問題\h第一節(jié)越發(fā)嚴(yán)峻的就業(yè)風(fēng)險(xiǎn)\h失業(yè)恐慌\h行業(yè)的危機(jī)\h第二節(jié)愈演愈烈的法律風(fēng)險(xiǎn)\h知識(shí)產(chǎn)權(quán)的歸屬\h虛擬犯罪的警示\h第三節(jié)信息安全風(fēng)險(xiǎn)\h信息偏差的誘導(dǎo)\h數(shù)據(jù)泄露的危險(xiǎn)\h第四節(jié)學(xué)術(shù)不端風(fēng)險(xiǎn)\h效率工具與學(xué)術(shù)誠信\h檢測工具的誕生\h第七章從ChatGPT到AIGC\h第一節(jié)什么是AIGC\h從誕生到發(fā)展\h對未來的暢想\h第二節(jié)AIGC的技術(shù)基石\h工業(yè)機(jī)器人的鋪墊\h微軟的AI部署戰(zhàn)略\h英偉達(dá)的遠(yuǎn)大目標(biāo)\h第三節(jié)AIGC的常見應(yīng)用\h圖像AIGC的多樣\h音頻AIGC的流行\(zhòng)h視頻AIGC的應(yīng)用\h第四節(jié)AIGC帶動(dòng)產(chǎn)業(yè)升級(jí)\h上游產(chǎn)業(yè)\h中游產(chǎn)業(yè)\h下游產(chǎn)業(yè)\h第八章ChatGPT,奇點(diǎn)臨近\h第一節(jié)ChatGPT賦能元世界\h元宇宙世界的新拼圖\h元宇宙中智能交互的革新\hWeb3.0建設(shè)的催化劑\h第二節(jié)ChatGPT的潛在影響\h人機(jī)交互方式的新高度\h智能化技術(shù)的高速應(yīng)用\h多元文化交互的新空間\h隱私安全的挑戰(zhàn)\h第三節(jié)嶄新的“風(fēng)向標(biāo)”\hChatGPT引領(lǐng)變革\h跨領(lǐng)域整合能力升級(jí)\hAI技術(shù)發(fā)展的里程碑\h認(rèn)知的跨越\h自主智能體第一章劃時(shí)代的浪潮:ChatGPTChatGPT,可能是2022年年底最時(shí)髦的一個(gè)詞。人們在大街小巷、朋友圈、各大網(wǎng)站都在傳播它,其火爆程度讓人們感到震撼和驚奇。ChatGPT的火熱在全球掀起了一股AI的浪潮,讓稍顯沉寂的AI行業(yè)重新走向了風(fēng)口浪尖。ChatGPT的橫空出世,讓大眾看到AI在文本生成、文本摘要、多輪對話甚至生成代碼等方面的能力有了質(zhì)的飛躍。

釋義1.1ChatGPTChatGPT(全稱:ChatGenerativePre-trainedTransformer),美國OpenAI研發(fā)的聊天機(jī)器人程序,于2022年11月30日發(fā)布。ChatGPT是人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具,它能夠通過理解和學(xué)習(xí)人類的語言來進(jìn)行對話,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),真正像人類一樣聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、代碼,翻譯、寫論文等任務(wù)?!倏频谝还?jié)什么是ChatGPTChatGPT使用了GPT(GenerativePre-trainedTransformer,生成式預(yù)訓(xùn)練變換模型)技術(shù),可以和用戶進(jìn)行自然對話,為用戶提供各種信息。它是一種強(qiáng)大的自然語言處理模型,可以根據(jù)大量的文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并生成類似于人類使用的自然語言的文本。在ChatGPT中,這種技術(shù)被用于生成聊天機(jī)器人的回復(fù),從而實(shí)現(xiàn)智能對話的功能。ChatGPT的一大特點(diǎn)是它可以進(jìn)行個(gè)性化的聊天,因?yàn)樗鼤?huì)根據(jù)用戶的輸入和歷史記錄進(jìn)行學(xué)習(xí)和調(diào)整。這意味著,隨著用戶使用時(shí)間和輸入內(nèi)容的增加,ChatGPT的回復(fù)將變得越來越準(zhǔn)確和個(gè)性化。當(dāng)用戶向ChatGPT發(fā)送消息時(shí),它會(huì)使用自然語言處理技術(shù)來理解消息的內(nèi)容和意圖。然后,ChatGPT將使用預(yù)訓(xùn)練模型生成對話回復(fù),并將其返回給用戶。[1]ChatGPT還可以使用上下文進(jìn)行學(xué)習(xí),例如,如果用戶問了一個(gè)問題,在隨后的對話中提供了更多的信息,ChatGPT將使用這些信息來生成更準(zhǔn)確的回復(fù)。這種學(xué)習(xí)過程是持續(xù)的,因此ChatGPT可以不斷地改進(jìn)其對話回復(fù)的質(zhì)量。五大特點(diǎn)作為當(dāng)前最先進(jìn)的大型語言模型之一,ChatGPT已經(jīng)引起了人們的廣泛關(guān)注和研究。它的出現(xiàn)革命性地提高了智能對話系統(tǒng)的精度、速度和語言生成能力,對智能對話技術(shù)的發(fā)展起到了巨大的推動(dòng)作用,并且給人們帶來了持續(xù)的震撼。那么,ChatGPT的強(qiáng)大之處究竟在哪里呢?到底是什么帶來了這種震撼?又是什么能讓這種震撼持續(xù)?這讓很多人充滿了疑惑。總的來講,這種震撼源于ChatGPT的五大特點(diǎn),如圖1.1所示,即多輪對話、多語言支持、可擴(kuò)展性強(qiáng)、智能推薦和自我學(xué)習(xí)。圖1.1ChatGPT的特點(diǎn)及涉及方向(1)多輪對話。ChatGPT能夠處理復(fù)雜的對話場景,實(shí)現(xiàn)對話的延續(xù)和對上下文的理解,通過存儲(chǔ)和更新對話歷史記錄來實(shí)現(xiàn)多輪對話。它可以根據(jù)先前的問題和回答來理解上下文,并生成更加準(zhǔn)確的回答。同時(shí),ChatGPT使用自然語言處理技術(shù)來解析和理解用戶的輸入,從而更好地理解用戶的意圖。ChatGPT的多輪對話特點(diǎn)使其能夠?qū)崿F(xiàn)更加自然和流暢的對話體驗(yàn),可用于多種場景,如智能客服、聊天機(jī)器人、語音助手等。[2](2)多語言支持。ChatGPT可以處理多語言的文本輸入,支持多語言的文本生成和對話,并提供多語言的API(應(yīng)用程序編程接口),能夠應(yīng)用于多語言環(huán)境中,處理不同語言之間的交互和文本生成需求。ChatGPT使用多語言數(shù)據(jù)集進(jìn)行訓(xùn)練,采用遷移學(xué)習(xí)技術(shù),能夠?qū)⒃谝环N語言上的學(xué)習(xí)應(yīng)用到其他語言上,從而加快在多語言環(huán)境下的部署。ChatGPT的多語言特點(diǎn)使其具有廣泛的應(yīng)用價(jià)值,能夠應(yīng)用于多種語言的程序中,為用戶提供更好的多語言交互體驗(yàn)。(3)可擴(kuò)展性強(qiáng)。ChatGPT支持多種編程語言、應(yīng)用場景和模型定制。它可以應(yīng)用于多種場景,如智能客服、機(jī)器翻譯、自然語言生成等,處理各種語言和專業(yè)領(lǐng)域的輸入和輸出。ChatGPT通過對數(shù)據(jù)進(jìn)行精細(xì)化標(biāo)注、調(diào)整模型參數(shù)、增加訓(xùn)練數(shù)據(jù)等方式來提高模型的精度和泛化能力。它依賴于強(qiáng)大的計(jì)算機(jī)集群,可以根據(jù)需要調(diào)整計(jì)算資源,提高模型的訓(xùn)練和推理速度,從而支持高并發(fā)、大規(guī)模的應(yīng)用場景。這些特點(diǎn)使得ChatGPT具有更廣泛的應(yīng)用價(jià)值,可以滿足不同應(yīng)用場景下的需求。[3](4)智能推薦。ChatGPT具有智能推薦的特點(diǎn)。這個(gè)模型可以自動(dòng)處理和理解海量文本數(shù)據(jù),通過學(xué)習(xí)尋找其規(guī)律和關(guān)系,以便提供有用的建議,再根據(jù)用戶提供的信息來推薦更加準(zhǔn)確和符合用戶期望的內(nèi)容。此外,通過不斷學(xué)習(xí)和更新,ChatGPT還可以不斷地提高其推薦的準(zhǔn)確性和效率,并且可以自動(dòng)適應(yīng)不同的應(yīng)用場景和用戶需求。(5)自我學(xué)習(xí)。ChatGPT是基于OpenAI發(fā)布的GPT模型,該模型具有強(qiáng)大的學(xué)習(xí)能力。它可以理解和處理規(guī)模龐大的自然語言數(shù)據(jù),并從中發(fā)現(xiàn)和總結(jié)文本中的規(guī)律和模式,從而學(xué)習(xí)自然語言的語法、語義規(guī)則,不斷地提高自身性能。GPT的學(xué)習(xí)能力源于其內(nèi)部的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),它可以通過反向傳播算法不斷地調(diào)整和優(yōu)化自身的參數(shù)和權(quán)重。另外,GPT模型還可以通過遷移學(xué)習(xí)和增量學(xué)習(xí)的方法,將之前學(xué)習(xí)的知識(shí)和模式遷移到新的任務(wù)或領(lǐng)域中,從而更快地適應(yīng)新任務(wù)和新場景下傳輸給模型的數(shù)據(jù)。總的來說,與傳統(tǒng)聊天機(jī)器人相比,ChatGPT具有更多優(yōu)勢。它可以以一種更加自然的方式生成回復(fù),讓用戶獲得更真實(shí)的對話體驗(yàn)。這是因?yàn)镃hatGPT是一種基于深度學(xué)習(xí)的大型語言模型,它可以處理大量的自然語言數(shù)據(jù),從中學(xué)習(xí)語言的規(guī)律和模式,并生成類似人類自然語言的回復(fù)。這使得人機(jī)對話更加流暢和自然,同時(shí)也使用戶更容易理解和接受回復(fù)。締造傳奇:OpenAIChatGPT是由OpenAI創(chuàng)造的,并且深深地影響著世界,用“傳奇”兩個(gè)字來形容也不為過。那么OpenAI究竟是怎么樣的存在呢?它為什么可以做出ChatGPT這么好的產(chǎn)品呢?它的運(yùn)行邏輯和商業(yè)模式是什么呢?它會(huì)創(chuàng)造更多的奇跡嗎?OpenAI是一家AI研究公司,由埃隆·馬斯克(ElonMusk)等人于2015年創(chuàng)辦,其總部位于美國舊金山,并得到了亞馬遜創(chuàng)始人杰夫·貝佐斯(JeffBezos)等知名投資者的支持。其目標(biāo)是推動(dòng)AI的發(fā)展,并讓AI技術(shù)造福全人類。為此,OpenAI在AI領(lǐng)域進(jìn)行了大量的研究工作,包括自然語言處理、計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方向。由于OpenAI的核心成員均是AI領(lǐng)域的頂尖科學(xué)家和研究者,其研究成果備受矚目。OpenAI的技術(shù)成果包括了一些AI項(xiàng)目,如GPT、Gym\h[1]以及OpenAIFive\h[2]等。其中,OpenAI最為著名的成果之一就是GPT系列模型,這是一種基于深度學(xué)習(xí)的語言模型,能夠生成高質(zhì)量的自然語言文本,被廣泛應(yīng)用于語言模型、文本生成、對話系統(tǒng)等領(lǐng)域。而名為OpenAIGym的強(qiáng)化學(xué)習(xí)平臺(tái),則為研究和應(yīng)用強(qiáng)化學(xué)習(xí)提供了一個(gè)開放的環(huán)境。為了推動(dòng)AI技術(shù)的發(fā)展,OpenAI還積極開展AI的倫理和社會(huì)影響研究。例如,OpenAI曾發(fā)表過《AI安全需要社會(huì)科學(xué)家》(AISafetyNeedsSocialScientists)[4]等多篇關(guān)于AI安全與社會(huì)問題的研究報(bào)告,以及《人工智能的惡意使用:預(yù)測、預(yù)防和緩解》(TheMaliciousUseofArtificialIntelligence:Forecasting,Prevention,andMitigation)[5]等多項(xiàng)倫理規(guī)范。OpenAI的開放性和透明度是值得稱贊的。OpenAI開放了大量的研究成果,推動(dòng)了AI技術(shù)的普及和應(yīng)用。此外,OpenAI還開發(fā)了一個(gè)名為CodeX\h[3]的系統(tǒng),它可以自動(dòng)編寫代碼,幫助程序員提高工作效率。OpenAI一直致力于推動(dòng)AI技術(shù)的開放和合作。2016年,OpenAI與微軟達(dá)成合作,微軟向OpenAI提供了10億美元的投資,幫助OpenAI開展更加復(fù)雜的AI研究。OpenAI還與眾多知名高校和研究機(jī)構(gòu)合作,包括斯坦福大學(xué)、麻省理工學(xué)院等。此外,OpenAI提出了“可控AI”的概念,即AI技術(shù)應(yīng)該是一種安全的、可控的、透明的、可解釋的,以及能夠?yàn)槿祟悗砀嗪锰幍那把丶夹g(shù)。OpenAI的立足點(diǎn)是構(gòu)建可解釋的智能系統(tǒng),其重點(diǎn)領(lǐng)域包括深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理等。自2015年成立以來,OpenAI在AI領(lǐng)域進(jìn)行了廣泛而深入的研究,取得了許多重要的成果。?2015年,OpenAI成立,其創(chuàng)始人包括埃隆·馬斯克、薩姆·阿爾特曼(SamAltman)等知名人士,目標(biāo)是推動(dòng)AI的發(fā)展并讓其造福全人類。?2016年,OpenAI發(fā)布了Gym,這是一種用于強(qiáng)化學(xué)習(xí)的開源工具集,旨在幫助研究者設(shè)計(jì)和測試新的學(xué)習(xí)算法。?2017年,OpenAI推出了一系列AI語言模型,其中最著名的是GPT-1。這些模型利用深度學(xué)習(xí)技術(shù),可以生成高質(zhì)量的自然語言文本,包括文章、對話、新聞等,是自然語言處理領(lǐng)域的重要突破。?2018年,OpenAI宣布組建了一個(gè)新的研究團(tuán)隊(duì),致力于開發(fā)AI系統(tǒng)以進(jìn)行更加深入的推理,增強(qiáng)推斷能力。OpenAI還發(fā)布了GPT-2,該模型比GPT-1更大、更復(fù)雜,能夠生成更逼真的自然語言文本。?2019年,OpenAI釋放了一部分GPT-2的源代碼,這使得研究人員和開發(fā)者能夠更加深入地了解這個(gè)模型的工作原理和性能,促進(jìn)了AI技術(shù)的開放和共享。?2020年,OpenAI宣布推出了GPT-3,這是迄今為止最大的語言模型,包含了1750億個(gè)參數(shù),能夠生成非常逼真的自然語言文本。此外,OpenAI還發(fā)布了一些新的工具和應(yīng)用程序,包括CodeX、DALL-E(圖像生成系統(tǒng))等,這些工具利用了GPT-3的強(qiáng)大功能,拓展了AI應(yīng)用的范圍和領(lǐng)域。?2021年,OpenAI宣布將以混合模式(hybridmodel)運(yùn)營,該模式結(jié)合了非營利性質(zhì)和營利性質(zhì),可以更好地推動(dòng)AI技術(shù)的應(yīng)用和發(fā)展。同時(shí),OpenAI還開放了GPT-3API,任何人都可以使用這個(gè)強(qiáng)大的語言模型來開發(fā)新的應(yīng)用和工具。?2022年,OpenAI推出ChatGPT,ChatGPT一經(jīng)問世便轟動(dòng)全球,引發(fā)了廣泛的行業(yè)和社會(huì)關(guān)注。OpenAI的發(fā)展歷程見證了AI技術(shù)的飛速發(fā)展,其研究成果也受到了國際社會(huì)的廣泛關(guān)注。\h[1]Gym,是一款用于研發(fā)和比較強(qiáng)化學(xué)習(xí)算法的工具包,提供一系列測試環(huán)境。\h[2]OpenAIFive,是第一個(gè)在電子競技游戲中擊敗世界冠軍的人工智能。\h[3]CodeX,是一個(gè)基于GPT-3的模型,能夠?qū)崿F(xiàn)自然語言到程序編碼的轉(zhuǎn)變。業(yè)務(wù)模式OpenAI持續(xù)努力,不斷取得驕人成績。本小節(jié)我們將介紹關(guān)于ChatGPT使用的GPT系列語言模型之外的其他產(chǎn)品,關(guān)于GPT模型的詳細(xì)介紹我們放在第三章。OpenAI的產(chǎn)品和服務(wù)都基于AI技術(shù)的創(chuàng)新應(yīng)用,它開發(fā)了DALL-E及DALL-E2模型、Gym,開放了GPT-3API,開發(fā)者可自由接入。它還提供多種AI技術(shù)服務(wù),包括技術(shù)咨詢、算法訓(xùn)練和部署、語音合成等。DALL-E模型DALL-E是由OpenAI研究團(tuán)隊(duì)開發(fā)的一款A(yù)I模型,旨在將文字描述轉(zhuǎn)換為圖像。它是OpenAI繼GPT-2、GPT-3等知名模型之后的又一力作。DALL-E(Dali+Pixar+WALL-E的縮寫)的名稱是從三個(gè)文化符號(hào)中獲得的靈感,它們代表了繪畫大師達(dá)利(Dali)、皮克斯動(dòng)畫工作室(Pixar)和電影《機(jī)器人總動(dòng)員》中的機(jī)器人角色瓦力(WALL-E)。釋義1.2DALL-EDALL-E的工作原理是將一組描述性文字輸入模型,然后通過訓(xùn)練模型生成與輸入的文字描述相匹配的圖像。與GPT-3類似,DALL-E也是一種基于Transformer\h[1]的神經(jīng)網(wǎng)絡(luò)模型,它可以將自然語言描述轉(zhuǎn)換為高質(zhì)量的圖像。DALL-E使用了大規(guī)模的自動(dòng)編碼器來學(xué)習(xí)從文本到圖像的映射。與其他圖像生成模型不同的是,DALL-E可以生成非常奇特的圖像,如“百合花狀的大象”或“烤面包狀的太陽鏡”,這些圖像與真實(shí)世界中的對象并不一致,但仍然非常逼真。DALL-E模型的訓(xùn)練數(shù)據(jù)集由互聯(lián)網(wǎng)上的圖像和對應(yīng)的文本描述組成,它使用了一個(gè)包含多層卷積神經(jīng)網(wǎng)絡(luò)和Transformer解碼器的結(jié)構(gòu)來生成圖像。該模型使用了大量的參數(shù)和計(jì)算資源,能夠處理非常復(fù)雜的圖像生成任務(wù),但也需要消耗大量的時(shí)間和計(jì)算資源進(jìn)行訓(xùn)練。該模型在許多領(lǐng)域中都有潛在應(yīng)用,如圖像編輯、電影特效、虛擬現(xiàn)實(shí)等。然而,由于該模型還處于實(shí)驗(yàn)階段,因此它的實(shí)際應(yīng)用還需要進(jìn)一步研究和開發(fā)。盡管DALL-E的創(chuàng)新性和實(shí)用性都很高,但是它也存在一些問題。例如,它可能會(huì)生成一些不合理的圖像,這是因?yàn)樗挠?xùn)練數(shù)據(jù)集中可能存在一些偏差。此外,DALL-E的訓(xùn)練過程非常復(fù)雜,它使用了大量數(shù)據(jù)集和深度學(xué)習(xí)技術(shù),并且需要消耗大量的時(shí)間和計(jì)算資源,這也限制了它的應(yīng)用范圍。Gym釋義1.3GymGym是由OpenAI推出的一個(gè)用于開發(fā)和比較強(qiáng)化學(xué)習(xí)算法的工具包。它提供了一組標(biāo)準(zhǔn)化的環(huán)境,可以讓研究者和開發(fā)者進(jìn)行強(qiáng)化學(xué)習(xí)算法的測試和評估。Gym提供了一些經(jīng)典的強(qiáng)化學(xué)習(xí)環(huán)境,如CartPole(倒立擺)和MountainCar(山地車),以及如Atari(雅達(dá)利)游戲和RobotControl(機(jī)器人控制)等基于真實(shí)的強(qiáng)化學(xué)習(xí)環(huán)境。Gym提供了一個(gè)簡單易用的PythonAPI,使得開發(fā)者可以很容易地編寫自己的強(qiáng)化學(xué)習(xí)算法,并將其應(yīng)用于提供的環(huán)境中。此外,它還提供了一些強(qiáng)化學(xué)習(xí)算法的實(shí)現(xiàn),如Q學(xué)習(xí)\h[2]和DQN\h[3]等,供開發(fā)者使用和比較。Gym的主要目標(biāo)是為強(qiáng)化學(xué)習(xí)算法的研究和開發(fā)提供一個(gè)標(biāo)準(zhǔn)化的測試平臺(tái)。通過Gym,開發(fā)者和研究者可以使用相同的環(huán)境和工具來測試和比較自己的算法,從而使研究結(jié)果更加客觀。盡管Gym是一個(gè)非常有用的平臺(tái),但是它也存在一些局限性。例如,它只適用于強(qiáng)化學(xué)習(xí)算法的開發(fā)和研究,而不適用于其他類型的機(jī)器學(xué)習(xí)算法。此外,由于Gym的環(huán)境是固定的,因此它并不能覆蓋所有的強(qiáng)化學(xué)習(xí)場景。OpenAIAPIOpenAI提供了一系列的API和工具,使開發(fā)者能夠更快地將想法轉(zhuǎn)換為可使用的應(yīng)用程序和服務(wù)以幫助他們節(jié)約時(shí)間和開發(fā)成本。OpenAIAPI支持多種應(yīng)用場景,其中包括自然語言處理、計(jì)算機(jī)視覺、強(qiáng)化學(xué)習(xí)、增強(qiáng)學(xué)習(xí)和深度學(xué)習(xí)等。開發(fā)者可以使用OpenAIAPI來開發(fā)更加智能的應(yīng)用程序,如語音識(shí)別、機(jī)器翻譯、對話機(jī)器人、智能推薦等系統(tǒng)。此外,OpenAIAPI還提供了許多自定義應(yīng)用程序,如智能家居、智能工廠、智能汽車等,幫助開發(fā)者快速實(shí)現(xiàn)自己的想法。OpenAI開放了很多API,如OpenAIGymAPI、OpenAIGPT-3API、OpenAISpinningUpAPI和OpenAIBaselinesAPI。?OpenAIGymAPI是一個(gè)強(qiáng)化學(xué)習(xí)框架,它提供一系列經(jīng)典的強(qiáng)化學(xué)習(xí)算法,這些算法可以幫助機(jī)器學(xué)習(xí)程序做出更好的決策。OpenAIGymAPI支持多種強(qiáng)化學(xué)習(xí)算法,如Q學(xué)習(xí)、SARSA\h[4]、A3C\h[5]、DDPG\h[6]、PPO\h[7]等。?OpenAIGPT-3API是一款機(jī)器學(xué)習(xí)API,它能夠幫助開發(fā)者實(shí)現(xiàn)自然語言處理的自動(dòng)化,其中包括語義理解、自動(dòng)摘要、文本生成和其他語言任務(wù)。OpenAIGPT-3API為開發(fā)者提供了一系列的API,如GPT-3訓(xùn)練器、GPT-3訓(xùn)練語料庫等。?OpenAISpinningUpAPI是一個(gè)面向強(qiáng)化學(xué)習(xí)算法開發(fā)者的API,它提供了一系列工具和文檔,幫助用戶快速搭建、訓(xùn)練和評估強(qiáng)化學(xué)習(xí)模型。SpinningUpAPI基于Python語言(一種計(jì)算機(jī)編程語言),它提供了基于PyTorch的深度學(xué)習(xí)算法實(shí)現(xiàn),包括多種強(qiáng)化學(xué)習(xí)算法,如Actor-Critic(一種強(qiáng)化學(xué)習(xí)算法)、DQN、PPO等。同時(shí),它還提供了多種強(qiáng)化學(xué)習(xí)環(huán)境,如Atari游戲、Robotics(OpenAI提供的一個(gè)開源項(xiàng)目)、MuJoCo物理模擬器等,用戶可以通過這些環(huán)境測試自己的強(qiáng)化學(xué)習(xí)模型。此外,SpinningUpAPI還提供高效的數(shù)據(jù)處理和并行化工具,可以加速模型訓(xùn)練和提高評估速度。最后,它還提供了詳細(xì)的文檔和教程,幫助用戶快速學(xué)習(xí)強(qiáng)化學(xué)習(xí)算法。?OpenAIBaselinesAPI是OpenAI發(fā)布的一個(gè)強(qiáng)化學(xué)習(xí)算法庫,它提供了多種標(biāo)準(zhǔn)、高效的強(qiáng)化學(xué)習(xí)算法。OpenAIBaselines基于Python語言和TensorFlow(符號(hào)數(shù)學(xué)系統(tǒng))深度學(xué)習(xí)框架,旨在為強(qiáng)化學(xué)習(xí)的研究者和開發(fā)者提供一個(gè)簡單易用的工具集,幫助他們快速開發(fā)和測試強(qiáng)化學(xué)習(xí)算法。它所提供的強(qiáng)化學(xué)習(xí)算法都經(jīng)過了嚴(yán)格的測試,并進(jìn)行了優(yōu)化,可以在Gym等標(biāo)準(zhǔn)化的環(huán)境中進(jìn)行評估和比較。此外,OpenAIBaselines還提供了許多輔助工具,如數(shù)據(jù)搜集、可視化、參數(shù)優(yōu)化等工具,這些工具可以幫助開發(fā)者更好地理解和優(yōu)化自己的強(qiáng)化學(xué)習(xí)算法。同時(shí),OpenAIBaselines還支持分布式訓(xùn)練,可以在多個(gè)CPU(中央處理器)或GPU(圖形處理器)上并行訓(xùn)練強(qiáng)化學(xué)習(xí)模型,從而大大提高模型訓(xùn)練的速度。\h[1]Transformer,一類純粹基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)算法。\h[2]Q學(xué)習(xí)(Qlearning),是一種與模型無關(guān)的強(qiáng)化學(xué)習(xí)算法,可以直接優(yōu)化一個(gè)可迭代計(jì)算的Q函數(shù)。\h[3]DQN(DeepQ-Networks),是一種無模型算法。\h[4]SARSA(State-Action-Reward-State-Action),是一個(gè)學(xué)習(xí)馬爾可夫決策過程策略的算法,通常應(yīng)用于機(jī)器學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等學(xué)習(xí)領(lǐng)域,SARSA算法和Q學(xué)習(xí)算法的區(qū)別主要在期望獎(jiǎng)勵(lì)Q值的更新方法上。\h[5]A3C(AsynchronousAdvantageActorCritic),是一種使用Actor-Critic神經(jīng)網(wǎng)絡(luò)架構(gòu)的強(qiáng)化學(xué)習(xí)算法。\h[6]DDPG(DeepDeterministicPolicyGradient),是一種無模型、在線式深度強(qiáng)化學(xué)習(xí)算法。\h[7]PPO(ProximalPolicyOptimization),是一種基于策略的、使用兩個(gè)神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)算法。第二節(jié)層層的突破2022年11月底,OpenAI發(fā)布了ChatGPT,它是一個(gè)基于GPT-3.5體系架構(gòu)的大型語言模型,相較于其他語言類AI應(yīng)用擁有更加強(qiáng)大的文本處理能力。ChatGPT具有大量的預(yù)訓(xùn)練參數(shù),能夠涵蓋廣泛的知識(shí)領(lǐng)域,并可以通過自我學(xué)習(xí)和不斷優(yōu)化拓展自身的知識(shí)深度和廣度。因此,它在多個(gè)領(lǐng)域都能發(fā)揮作用。并且它可以通過定制和模型微調(diào)參數(shù),滿足不同用戶、不同場景的需求,比傳統(tǒng)的語言模型具有更高的靈活性和可定制性。ChatGPT的語言表達(dá)能力更接近人類,它可以生成更加流暢自然的文本,包括文章、對話、摘要、翻譯等多種形式。此外,ChatGPT有極強(qiáng)的文本交互能力,可以與用戶進(jìn)行多輪對話,能夠準(zhǔn)確理解和回答用戶的問題。它還可以依據(jù)用戶提供的信息,結(jié)合上下文來回答問題。同時(shí),它能夠通過語言實(shí)現(xiàn)邏輯推理,但其在數(shù)理推理方面的能力較弱。相較于其他的語言模型,ChatGPT已經(jīng)能夠?qū)崿F(xiàn)更加智能化的人機(jī)交互。作為一個(gè)語言類AI,ChatGPT的文本處理能力非常強(qiáng)大,它可以根據(jù)用戶需求進(jìn)行非交互式寫作,在諸如翻譯等輔助性寫作方面的表現(xiàn)也十分優(yōu)秀。本節(jié)將用多個(gè)實(shí)際例子來說明ChatGPT在不同場景中的表現(xiàn)。文本創(chuàng)作主要包含結(jié)構(gòu)化寫作和非結(jié)構(gòu)化寫作。其中,結(jié)構(gòu)化寫作是指按照一定的格式、規(guī)則或標(biāo)準(zhǔn),進(jìn)行有較強(qiáng)邏輯性的寫作。結(jié)構(gòu)化寫作要求文章條理清晰,易于閱讀和理解。常見的結(jié)構(gòu)化寫作包括標(biāo)準(zhǔn)化的政策性文件及規(guī)范性文件,如:公文、法律文件及公司的行政法規(guī)等;需要向讀者傳遞信息的新聞稿件及咨詢報(bào)告等;需要對現(xiàn)有知識(shí)及成果進(jìn)行綜合歸納和系統(tǒng)闡述的教科書、科普類寫作等;以及需要對比較復(fù)雜的工作做出規(guī)劃及部署的計(jì)劃性公文、策劃案等。此外,在工作場景中的郵件及工作總結(jié)等也屬于結(jié)構(gòu)化寫作。非結(jié)構(gòu)化寫作則是一種沒有明確大綱或組織框架的寫作方式。它以文字為載體來表達(dá)作者的個(gè)人意識(shí),以一種更藝術(shù)的形式來傳遞思想、營造氛圍,以寫意的方法激發(fā)讀者的想象力。它強(qiáng)調(diào)的是創(chuàng)造性和自由表達(dá),作者可以自由地發(fā)揮想象力。極具藝術(shù)創(chuàng)造性的散文、詩歌、小說及富有創(chuàng)意的廣告文案等都屬于非結(jié)構(gòu)化寫作。邏輯性強(qiáng)的結(jié)構(gòu)化寫作結(jié)構(gòu)化寫作需要確定寫作的目的以及預(yù)期的讀者群體,以決定文本內(nèi)容的組織方式、語言風(fēng)格和所需資料的詳細(xì)程度。結(jié)構(gòu)化寫作強(qiáng)調(diào)使用簡單、清晰的語言表達(dá)觀點(diǎn)和想法,以確保文本易于閱讀和理解,并且要確保文本的邏輯性和連貫性。ChatGPT在結(jié)構(gòu)化寫作上的表現(xiàn)非常亮眼,它能在很短的時(shí)間內(nèi)生成邏輯連貫的結(jié)構(gòu)化段落或文章。撰寫新聞稿件圖1.2是使用ChatGPT生成的新聞稿件。在對ChatGPT發(fā)出“請寫一篇關(guān)于ChatGPT的新聞播報(bào)”的命令后,它快速生成了一篇標(biāo)準(zhǔn)的新聞稿。整篇稿件的邏輯性較強(qiáng),包含了引言、背景,表達(dá)了較為中立的觀點(diǎn)并做了總結(jié)。圖1.2ChatGPT示例:撰寫新聞稿件撰寫產(chǎn)品推廣方案圖1.3展示了使用ChatGPT撰寫產(chǎn)品推廣方案的示例。ChatGPT可以迅速從市場需求入手,抓住目標(biāo)客戶,強(qiáng)調(diào)產(chǎn)品賣點(diǎn),引導(dǎo)客戶消費(fèi),最終生成粉底液的推廣文案。該文案結(jié)構(gòu)清晰,但語言不太符合當(dāng)下社交媒體的文案風(fēng)格。圖1.3ChatGPT示例:撰寫產(chǎn)品推廣方案撰寫工作郵件雖然ChatGPT是一個(gè)自動(dòng)化工具,但它并不能完全替代人類的寫作。在撰寫有特定目的和目標(biāo)受眾的文本時(shí),ChatGPT需要用戶提供更具體的需求命令,才能生成更精確的文本內(nèi)容。圖1.4展示了ChatGPT在工作場景中撰寫英文工作郵件的示例。工作郵件需要遵循較為規(guī)范的書寫格式,且要注意語氣和措辭。只要準(zhǔn)確告知郵件需要包含的內(nèi)容,ChatGPT就可以快速生成標(biāo)準(zhǔn)格式的商務(wù)郵件。圖1.4ChatGPT示例:撰寫工作郵件藝術(shù)性強(qiáng)的非結(jié)構(gòu)化寫作非結(jié)構(gòu)化寫作可能會(huì)導(dǎo)致文本的邏輯性較差,特別是意識(shí)流寫作,會(huì)使讀者難以直觀地理解文本意思,因?yàn)樗痪邆涿鞔_的邏輯順序和清晰的結(jié)構(gòu)。它是一種較為自由和開放的寫作方式,強(qiáng)調(diào)創(chuàng)造性、藝術(shù)性及表達(dá)自由性。ChatGPT同樣可以進(jìn)行邏輯性較弱但富有創(chuàng)造性的非結(jié)構(gòu)化寫作,如小說、詩歌、散文等。小說梗概圖1.5是ChatGPT寫的一個(gè)武俠小說的梗概,故事圍繞著一個(gè)叫李飛雪的少俠展開。雖然ChatGPT生成的小說梗概擁有完整的故事線,但情節(jié)略為老套,可以看出是依據(jù)較熱門的武俠小說模式來撰寫的。但是,ChatGPT能夠理解“武俠小說”的含義,并仿照中國武俠小說的故事發(fā)展模式創(chuàng)造出小說梗概。對語言類AI來說,這在非結(jié)構(gòu)化寫作上已經(jīng)有了質(zhì)的飛躍。圖1.5ChatGPT示例:撰寫小說梗概創(chuàng)作詩歌相較于更注重故事情節(jié)和角色刻畫的小說,詩歌的語言更為抽象化,它是一種更注重意象表達(dá)的文學(xué)形式。詩歌強(qiáng)調(diào)表現(xiàn)詩人的內(nèi)心情感和思想,而對沒有人類情感的AI來說,詩歌創(chuàng)作更多的是模仿詩歌的寫作結(jié)構(gòu)和語言風(fēng)格,在意象和情感的表達(dá)上缺乏藝術(shù)性。圖1.6是ChatGPT創(chuàng)作的一首贊美春天的現(xiàn)代詩。在生成詩歌文本時(shí),ChatGPT遵循了現(xiàn)代詩的寫作結(jié)構(gòu),但在意象的表達(dá)上較為簡單直白。相較于現(xiàn)代詩,中國的古詩詞更講究“只可意會(huì),不可言傳”的意境美,具有高度凝練的語言藝術(shù)魅力。圖1.7是ChatGPT創(chuàng)作的一首七言絕句。它能夠理解“七言絕句”的含義,并依照每首八句,每句七字的標(biāo)準(zhǔn)格式生成文本。圖1.6ChatGPT示例:撰寫現(xiàn)代詩圖1.7ChatGPT示例:創(chuàng)作七言絕句高效率的輔助性寫作除了對邏輯性要求較高的結(jié)構(gòu)化寫作及需要富有創(chuàng)造性的非結(jié)構(gòu)化寫作,ChatGPT在輔助性寫作上的能力更為突出,如它在多語言翻譯、修正語法錯(cuò)誤、改進(jìn)文章措辭及歸納總結(jié)文章含義等方面表現(xiàn)優(yōu)秀,可以輔助用戶高效地完成文本創(chuàng)作。翻譯在ChatGPT出現(xiàn)以前,語言類AI在中英文翻譯上的應(yīng)用已日漸成熟。谷歌翻譯(來自美國)和DeepL翻譯(來自德國)都是AI翻譯領(lǐng)域中比較有代表性的應(yīng)用。圖1.8節(jié)選了維基百科中關(guān)于AI的英文介紹,對比了谷歌翻譯及ChatGPT翻譯的結(jié)果。圖1.8中節(jié)選維基百科中關(guān)于AI介紹的原文如下:AIapplicationsincludeadvancedwebsearchengines(e.g.,GoogleSearch),recommendationsystems(usedbyYouTube,Amazon,andNetflix),understandinghumanspeech(suchasSiriandAlexa),self-drivingcars(e.g.,Waymo),generativeorcreativetools(ChatGPTandAIart),automateddecision-making,andcompetingatthehighestlevelinstrategicgamesystems(suchaschessandGo).Artificialintelligencewasfoundedasanacademicdisciplinein1956,andintheyearssinceithasexperiencedseveralwavesofoptimism,followedbydisappointmentandthelossoffunding(knownasan"AIwinter"),followedbynewapproaches,success,andrenewedfunding.AIresearchhastriedanddiscardedmanydifferentapproaches,includingsimulatingthebrain,modelinghumanproblemsolving,formallogic,largedatabasesofknowledge,andimitatinganimalbehavior.Inthefirstdecadesofthe21stcentury,highlymathematicalandstatisticalmachinelearninghasdominatedthefield,andthistechniquehasprovedhighlysuccessful,helpingtosolvemanychallengingproblemsthroughoutindustryandacademia.圖1.8谷歌翻譯與ChatGPT翻譯對比谷歌翻譯與ChatGPT在翻譯簡單句子時(shí)沒有太大的差異,但在長句、難句的翻譯上,ChatGPT翻譯得更通順,語言表達(dá)更自然。如圖1.8所示,對于多個(gè)并列句的翻譯,谷歌翻譯的措辭略微重復(fù)且對英文被動(dòng)語態(tài)的翻譯不夠準(zhǔn)確?!啊S后是失望和資金流失(被稱為‘AI冬天’),隨后是新方法、成功和重新資助……”相比于谷歌翻譯,ChatGPT翻譯的語言就流暢許多,“……多年來經(jīng)歷了幾次樂觀、失望和資金損失(被稱為‘AI冬天’),然后是新的方法、成功和重新獲得資金……”在同一個(gè)句子中,避免了重復(fù)措辭,并且對英文被動(dòng)語態(tài)的翻譯較為準(zhǔn)確。潤色潤色指的是對文本、文章或其他寫作內(nèi)容進(jìn)行修改、編輯的改進(jìn)過程。它包括查錯(cuò),修改語法錯(cuò)誤、句子結(jié)構(gòu),增加或刪減內(nèi)容,以及改變整體寫作風(fēng)格和提高流暢度等方面的工作。潤色可以提高文本的質(zhì)量,使文本更具可讀性,讓讀者能夠更容易理解文本所傳達(dá)的信息。圖1.9為使用ChatGPT修改谷歌翻譯結(jié)果的示例展示。Chat-GPT糾正了并列句重復(fù)措辭的問題,潤色后行文更加流暢。圖1.9ChatGPT示例:潤色修改文章圖1.10中展示的是使用ChatGPT修改中文病句的示例。示例中的中文語句涵蓋了常見的語病,如句子成分殘缺、詞語搭配不當(dāng)、重復(fù)措辭、濫用副詞及語義前后矛盾等??梢钥闯?,ChatGPT可以修改大部分的中文語病。但在圖1.10中,第一句話成分殘缺的問題沒有修正,在ChatGPT修改后的句子中,依然缺少主語。圖1.10ChatGPT示例:修改中文病句圖1.11展示的是使用ChatGPT修改英文病句的示例。相較于對中文的潤色,ChatGPT在英文文本修改上表現(xiàn)出更加出色的能力。示例中的6句英文涵蓋了過度使用副詞、過多的介詞短語、語義不明、錯(cuò)誤用詞、指代不明及逗號(hào)使用錯(cuò)誤的問題??梢钥闯觯珻hatGPT可以修改上述語病,且行文流暢自然??偟膩碚f,ChatGPT可以高效地幫助用戶修改文章,且其處理英文文本的性能更強(qiáng)。圖1.11ChatGPT示例:修改英文病句段落總結(jié)除了能夠?qū)ξ恼逻M(jìn)行修改,ChatGPT還可以輔助用戶對文章的大意進(jìn)行總結(jié)。在圖1.12的例子中,輸入一段1300多字介紹故宮歷史的文本,然后,命令ChatGPT用300字總結(jié)文章的大意??梢钥闯觯珻hatGPT能夠使用邏輯清晰且流暢自然的語言總結(jié)出文章的內(nèi)容。在圖1.12的例子中,輸入介紹故宮歷史的文本。故宮,又稱紫禁城,是明清兩朝二十四位皇帝的皇宮。故宮始建于明成祖永樂四年(1406年),永樂十八年(1420年)落成。位于北京中軸線中心的故宮,占地面積106.09萬平方米,建筑面積約23.33萬平方米,是世界上現(xiàn)存規(guī)模最大的宮殿建筑群。故宮是第一批全國重點(diǎn)文物保護(hù)單位、第一批國家5A級(jí)旅游景區(qū),1987年被選入《世界文化遺產(chǎn)》名錄。故宮現(xiàn)為故宮博物院,藏品主要以明、清兩代皇宮和宮廷收藏為基礎(chǔ),是國家一級(jí)博物館。明初定都于應(yīng)天府(今南京)。建文元年(1399年),燕王朱棣自北平(今北京)起兵,發(fā)動(dòng)靖難之役。永樂元年(1403年),朱棣頒詔改北平為北京。從永樂元年至三年,明成祖朱棣多次下令從各地遷入人口至北京。永樂四年(1406年)閏七月,朱棣頒詔“以明年建北京宮殿”,永樂五年開始營建紫禁城。宮殿和宮墻由潭柘寺的無名和尚設(shè)計(jì),泰寧侯陳珪、工部侍郎吳中、刑部侍郎張思恭主持工程營建。以北方工匠為主體的大量營建工匠,包括部分南方工匠,如著名的石工陸祥、瓦工楊青等,在永樂五年五月到達(dá)北京。建造紫禁城和改造北京是同時(shí)進(jìn)行的,以原來的元大都城為基礎(chǔ)改建。紫禁城工程開始后不久,受到長陵建設(shè)及永樂八年、十一年兩次北伐蒙古戰(zhàn)役影響,營建速度放慢,至永樂十六年六月方才開始重新開工。永樂十八年(1420年)十一月,朱棣發(fā)布詔書,宣告北京宮殿竣工。次年正月初一日,朱棣在奉天殿(今太和殿)接受朝賀,由此開啟了紫禁城自明至清的使用歷史。同年五月遭雷擊,發(fā)生大火,前三殿被焚毀。正統(tǒng)五年(1440年),重建前三殿及乾清宮。天順三年(1459年),營建西苑。嘉靖三十六年(1557年),紫禁城大火,前三殿、奉天門、文武樓、午門全部被焚毀,至嘉靖四十年(1561年)才重建完工。萬歷二十五年(1597年),紫禁城大火,焚毀前三殿、后三宮。復(fù)建工程直至天啟七年(1627年)方完工。崇禎十七年(1644年),李自成軍攻陷北京,明朝滅亡。未幾,明朝山海關(guān)總兵吳三桂引清兵入關(guān),擊敗李自成。李自成向陜西撤退前焚毀紫禁城,僅武英殿、建極殿、英華殿、南薰殿、四周角樓和皇極門未焚。同年清順治帝至北京,以皇極門為常朝場所,以未被焚毀的建極殿為位育宮,作為順治帝寢宮,攝政王多爾袞在武英殿辦公。順治元年(1644年)至順治十四年,重建了午門、天安門、外朝前三殿,將位育宮改名為保和殿(順治二年),又整修內(nèi)廷、東路和西路的建筑??滴趿辏?667年)重建端門。康熙二十二年(1683年),開始重建紫禁城其余被毀的部分建筑。1735年乾隆帝即位,此后的六十年間對紫禁城進(jìn)行了大規(guī)模增建和改建。嘉慶十八年(1813年),林清率天理教教眾攻打紫禁城。光緒十四年(1886年)太和門護(hù)軍值班房發(fā)生火災(zāi),由于救火設(shè)施不完善,大火燒了兩天,貞度門、太和門、昭德門被焚。此次損壞直到光緒二十年才修復(fù)完畢。1912年清帝溥儀退位,但仍居于宮內(nèi)。1924年馮玉祥與胡景翼、孫岳在北京發(fā)動(dòng)北京政變,推翻了曹錕反動(dòng)政權(quán),12月5日,黃郛主持召開攝政內(nèi)閣會(huì)議,修改《清室優(yōu)待條件》內(nèi)容,根據(jù)第五條規(guī)定,廢除皇帝尊號(hào),請廢帝溥儀出宮。政府代表李煜瀛、京師警衛(wèi)司令鹿鍾麟、警察總監(jiān)張璧,于6日接管皇宮,封存文物。后經(jīng)攝政內(nèi)閣核準(zhǔn),經(jīng)一年之整理,故宮博物院于1925年10月10日正式成立。2012年,故宮單日最高客流量突破18萬人次,2019年全年客流量突破1900萬人次,可以說是世界上接待游客最繁忙的博物館。2013年5月18日起,故宮博物院范圍內(nèi)嚴(yán)禁明火,全體員工、在院合作單位和游客,不管在室內(nèi)和室外,不分開放區(qū)與工作區(qū),一律禁止吸煙、禁用明火。圖1.12ChatGPT示例:段落總結(jié)注:圖中ChatGPT將故宮博物院的成立和現(xiàn)狀總結(jié)成“民國時(shí)期修葺歷史”并不準(zhǔn)確。生成表格除了生成和處理文本,ChatGPT還具備輸出表格的能力。圖1.13展示的是用戶命令ChatGPT生成“2011—2020年中國的GDP數(shù)據(jù)表”的示例。ChatGPT不僅具備生成表格樣式答案的能力,也具備自動(dòng)檢索數(shù)據(jù)的能力?;卮鹬械腉DP數(shù)據(jù)并不是用戶告知ChatGPT的,而是它在得到用戶指令后,自己搜尋,并以表格的形式展示出來的。圖1.13ChatGPT示例:生成表格從圖1.13可以看出,ChatGPT給出的結(jié)果與中國國家統(tǒng)計(jì)局發(fā)布的官方數(shù)據(jù)是有出入的。由此可見,ChatGPT的回答并不總是準(zhǔn)確的。因此,當(dāng)進(jìn)行諸如寫論文、做數(shù)據(jù)分析等對準(zhǔn)確性要求較高的工作時(shí),用戶需要進(jìn)一步考證ChatGPT結(jié)果的準(zhǔn)確性。技術(shù)性強(qiáng)的代碼生成ChatGPT不僅可以很好地完成各種基礎(chǔ)的語言類任務(wù),也可能取代部分程序員的工作。換句話說,ChatGPT可以根據(jù)用戶輸入的文字請求,編寫相應(yīng)的代碼。ChatGPT的代碼生成能力可能會(huì)引發(fā)互聯(lián)網(wǎng)行業(yè)的變革。在未來,或許初級(jí)程序員的崗位將會(huì)被AI取代。如圖1.14所示,用戶要求ChatGPT用Python語言編寫一個(gè)彈球游戲的代碼。從ChatGPT生成的代碼質(zhì)量來看,它不像一個(gè)資深的“碼農(nóng)”,因?yàn)榇a質(zhì)量有很大的提高空間,但它足以承擔(dān)各種重復(fù)性的代碼編寫任務(wù)。圖1.14ChatGPT示例:彈球游戲代碼ChatGPT生成代碼的能力離不開互聯(lián)網(wǎng)中海量代碼數(shù)據(jù)的支撐。如果ChatGPT真的取代了程序員去完成各種代碼編寫任務(wù),也會(huì)帶來一個(gè)問題:在未來,ChatGPT學(xué)習(xí)所用的代碼數(shù)據(jù)是由ChatGPT自己生成的,這合理嗎?如果沒有合適的評定數(shù)據(jù)的方法,那么在取代程序員后,ChatGPT將面臨沒有任何數(shù)據(jù)可用于學(xué)習(xí)的困境。不僅是代碼,文本數(shù)據(jù)也是如此。因此,在ChatGPT取代人類工作之前,如何持久地獲取有效數(shù)據(jù)是首先要思考的問題??偠灾?,ChatGPT不論是在文本任務(wù)還是代碼任務(wù)上都表現(xiàn)出極強(qiáng)的能力,大有取代人類的趨勢。如果沒有正確引導(dǎo)的話,ChatGPT的出現(xiàn)可能導(dǎo)致各行業(yè)更加劇烈的“內(nèi)卷”。或許ChatGPT的出現(xiàn)是出于讓人們進(jìn)一步提高生產(chǎn)力的目的,但它也需要正確的引導(dǎo),從而真正成為幫助人們提高效率的工具,而不是成為“內(nèi)卷”的背后推手。第三節(jié)問題、引導(dǎo)與使用ChatGPT回答問題的質(zhì)量很大程度取決于用戶問題的質(zhì)量,這也催生出一個(gè)新的職業(yè)——提示工程師(PromptEngineer)。這個(gè)職業(yè)的工作內(nèi)容就是研究如何給ChatGPT提出高質(zhì)量的問題,引導(dǎo)ChatGPT生成最準(zhǔn)確、最合適的回答。從某個(gè)角度看,用戶在使用ChatGPT的時(shí)候也是在履行一個(gè)提示工程師的職能。因此,本節(jié)將從如何引導(dǎo)ChatGPT生成高質(zhì)量回答的角度出發(fā),介紹用戶該如何設(shè)計(jì)合適的問題來引導(dǎo)ChatGPT。對話的藝術(shù)在介紹用戶應(yīng)該如何設(shè)計(jì)問題之前,我們需要先明白ChatGPT在回答問題時(shí)都具備哪些強(qiáng)大的能力,才可以知道什么問題對ChatGPT來說是好的問題。總的來說,ChatGPT具有三個(gè)強(qiáng)大的能力:能夠聯(lián)系上下文的多輪對話能力、能夠理解文本情緒和含義的能力及強(qiáng)法律意識(shí)和道德感能力。下面我們分別介紹這三種能力的具體含義。能夠聯(lián)系上下文的多輪對話能力ChatGPT具備理解上下文的能力,這里的上下文不僅指同一文本中的上下文,也指整個(gè)對話中的上下文內(nèi)容。舉例來說,當(dāng)用戶和ChatGPT圍繞一個(gè)話題進(jìn)行討論時(shí),可能只在對話開始提到了這個(gè)話題的具體內(nèi)容,而在后續(xù)對話中只用指示代詞,如“這個(gè)事件”“它”等來指代這個(gè)話題。ChatGPT可以準(zhǔn)確地理解這些指示代詞的含義。這就是ChatGPT聯(lián)系上下文的能力。在人與人之間的對話中,人們往往不會(huì)對一個(gè)多次提到的事物反復(fù)做出解釋,而是在潛意識(shí)中構(gòu)建了關(guān)于對話的語境信息。換句話說,人類天然具備聯(lián)系上下文、理解上下文的能力。作為與人類進(jìn)行交流的AI,具備這種聯(lián)系上下文的能力是十分必要的。那么,ChatGPT是如何有效理解上下文的呢?從理論上來說,當(dāng)在一輪對話中輸入新的文本內(nèi)容時(shí),用戶需要將之前的對話內(nèi)容也一并提交給ChatGPT,形成一個(gè)包含上下文的Prompt格式(釋義1.4)。這一要求無疑加大了用戶使用ChatGPT的難度,但好在當(dāng)我們使用ChatGPT時(shí),應(yīng)用程序幫我們默默地完成了這件事。釋義1.4包含上下文的Prompt\h[1]格式一個(gè)包含上下文的Prompt格式應(yīng)該為:{“上下文內(nèi)容”:“用戶:內(nèi)容;AI:內(nèi)容……”(此輪對話中用戶與ChatGPT交替產(chǎn)生的文本信息),“用戶輸入”:“內(nèi)容”}。圖1.15是一個(gè)使用ChatGPT生成視頻腳本的例子。在我們對視頻內(nèi)容和總時(shí)長提出了具體要求后,ChatGPT很快就生成了一個(gè)有分鏡頭的視頻腳本。腳本包含了畫面內(nèi)容及與畫面相匹配的文案。圖1.15ChatGPT示例:生成視頻腳本接著,在剛生成的視頻腳本基礎(chǔ)上,我們對ChatGPT提出進(jìn)一步的要求。如圖1.16所示,我們可以看出,ChatGPT能夠聯(lián)系上下文,針對上一輪的對話內(nèi)容,按要求進(jìn)一步細(xì)化腳本。圖1.16ChatGPT示例:細(xì)化視頻腳本能夠理解文本情緒和含義的能力ChatGPT第二個(gè)強(qiáng)大的功能就理解文本情緒和含義的能力。換句話說,它能夠理解文本的畫外音。通過一個(gè)最簡單的測試就可以了解該功能。如當(dāng)用戶輸入一段帶有情緒的文本內(nèi)容并要求ChatGPT判斷文本體現(xiàn)的是積極還是消極情緒時(shí),ChatGPT可以給出準(zhǔn)確的回答。此外,用戶還可以要求ChatGPT生成不同情緒的文本,比如“生成一段故作高深的回答”或是“生成一段淺顯易懂的回答”。ChatGPT理解文本含義的能力不僅在于生成不同情緒的文本,還在于它可以降低用戶使用ChatGPT的難度。有時(shí)候用戶并不能解釋清楚自己的問題到底是什么,此時(shí)ChatGPT會(huì)通過自身具備的理解文本含義的能力來推斷用戶的意圖,并給出相應(yīng)的回復(fù),甚至ChatGPT也會(huì)反過來引導(dǎo)用戶解釋清楚自己的需求。這是ChatGPT高泛化性的部分體現(xiàn)。當(dāng)然,不可否認(rèn)的是,雖然ChatGPT具備理解文本含義的能力,但如果用戶提出的問題質(zhì)量越高,ChatGPT給出滿意回答的可能性也越高。因此,ChatGPT的這種能力更像是一種擁有底線機(jī)制的回應(yīng),它并未擁有什么問題都能回答的“萬能”之力。強(qiáng)法律意識(shí)和道德感能力ChatGPT的第三個(gè)給用戶極高安全感的能力就是它具備較強(qiáng)的法律意識(shí)和道德感。OpenAI公司對ChatGPT進(jìn)行訓(xùn)練時(shí),特意加強(qiáng)了這個(gè)能力。畢竟人們誰都不愿意在使用一款應(yīng)用產(chǎn)品時(shí),應(yīng)用產(chǎn)品對自己進(jìn)行精神攻擊或“三觀”沖擊。換句話說,ChatGPT在努力扮演人類的良師益友,這點(diǎn)對使用者來說是十分重要的。圖1.17展示的是ChatGPT具有極高道德感的對話示例。從示例中我們可以看到,當(dāng)用戶詢問一些敏感話題或者不良話題時(shí),ChatGPT可以有效識(shí)別出不良話題并做出正確的引導(dǎo),這無疑會(huì)提高人們對ChatGPT的好感度。AI不光是在追求技術(shù)進(jìn)步,它也是有溫度的。圖1.17ChatGPT的道德感(僅用于示范,絕無任何不良引導(dǎo))\h[1]Prompt,是一種輸入方式,它將人工智能模型的輸入限制在一個(gè)特定的范圍內(nèi),從而更好地控制模型的輸出。如何精準(zhǔn)提問前文中提到,雖然ChatGPT具有理解文本含義的能力,但用戶提出的問題質(zhì)量越高,ChatGPT給出的回答就越合理。第一,一個(gè)好的問題是清晰的,是可以通過準(zhǔn)確的關(guān)鍵詞來表達(dá)需求的。第二,對問題的分解也很重要。下面我們從這兩方面討論,什么樣的問題對ChatGPT來說是質(zhì)量較高的問題。選好關(guān)鍵詞清楚地定義問題是十分必要的,這需要用戶使用精準(zhǔn)的關(guān)鍵詞進(jìn)行提問。下面我們先看一個(gè)對比案例。圖1.18展示的是使用模糊關(guān)鍵詞進(jìn)行提問的問題。圖1.18ChatGPT教學(xué):模糊關(guān)鍵詞用戶向ChatGPT提出“請幫我寫一個(gè)詠春的段落”,這里的“詠春”既可以表示“歌詠春天”的意思,也可以表示“詠春拳”這種武術(shù)招式,而用戶的本意是歌詠春天。從回答來看,顯然ChatGPT推測用戶意圖時(shí)錯(cuò)誤地將“詠春”理解為了武術(shù)招式,并對武術(shù)招式生成了一段描述性的文本。而在圖1.19中,用戶對同一個(gè)問題采取了更準(zhǔn)確的描述。此時(shí),ChatGPT正確理解了用戶的意圖并給出了質(zhì)量較高的回答。圖1.19ChatGPT教學(xué):精準(zhǔn)關(guān)鍵詞從這個(gè)例子我們可以看出,雖然ChatGPT具備推測用戶意圖的能力,但它并不像人類那樣聰明,在推測時(shí)往往會(huì)曲解人們的意圖。為了讓ChatGPT給出正確的回答,當(dāng)提出問題時(shí)人們應(yīng)盡量將問題表述清楚,使用精準(zhǔn)的關(guān)鍵詞是十分必要的。分解問題除了將問題表述明確,將問題分解到位也是十分必要的。ChatGPT具備理解上下文的能力,人們在使用ChatGPT時(shí)應(yīng)該好好利用這個(gè)能力。一個(gè)十分復(fù)雜的問題無疑會(huì)給ChatGPT的理解帶來一定的困難,用戶在使用ChatGPT時(shí),應(yīng)當(dāng)盡可能地把問題逐步分解,引導(dǎo)ChatGPT逐步得出答案。然而,分解問題雖然降低了ChatGPT理解的難度,但提高了用戶使用的難度。如果問題分解有誤,形成很多與原本問題并不相關(guān)的子問題,那么ChatGPT很可能會(huì)被這些子問題帶偏,進(jìn)而給出質(zhì)量極低的回答。因此,用戶在使用分解問題這個(gè)方法時(shí),需要十分慎重。引導(dǎo)與矯正除了在提問時(shí)盡可能給出清晰問題,在多輪對話中,用戶對ChatGPT進(jìn)行合理引導(dǎo),給它答案提示,以及對回答做出合理評價(jià),也是提高ChatGPT表現(xiàn)的有效方法。ChatGPT會(huì)從前面的對話內(nèi)容中進(jìn)行自我學(xué)習(xí),因此我們可以不斷糾正它的答案,或在要求中預(yù)設(shè)答案,引導(dǎo)它給予更具體、更準(zhǔn)確的回答。玩轉(zhuǎn)ChatGPT在這一部分,讓我們結(jié)合上述方式對ChatGPT提出要求,并使用Midjourney\h[1]生成一幅有意境的畫作。第一步:提出需求?!短靸羯场で锼肌肥窃R致遠(yuǎn)的一首散曲小令,短短28個(gè)字就勾勒出了一幅凄涼孤寂的秋郊夕照圖??萏倮蠘浠桫f,小橋流水人家,古道西風(fēng)瘦馬。夕陽西下,斷腸人在天涯。在這個(gè)例子中,我們的目的是使用ChatGPT生成關(guān)鍵詞,之后用它生成的關(guān)鍵詞進(jìn)行AI繪畫。首先,我們需要對ChatGPT提出基本的需求,然后,讓ChatGPT描述這首小令勾勒出的畫面。圖1.20展示了ChatGPT生成的結(jié)果,可以看出,它能夠準(zhǔn)確理解馬致遠(yuǎn)這首小令所表述的意境。在它描述的畫面中,幾乎涵蓋了這首小令所要傳遞的意象。圖1.20ChatGPT示例:提出需求第二步:細(xì)化需求。我們對ChatGPT提出進(jìn)一步的要求,讓它將上一輪對話中生成的文本轉(zhuǎn)為更簡練的英文關(guān)鍵詞,同時(shí)我們也對繪畫的風(fēng)格提出了要求。圖1.21為ChatGPT生成的結(jié)果,可以看出,它能夠使用精練的關(guān)鍵詞對長文本進(jìn)行總結(jié),但對水墨畫風(fēng)格的描述還不夠完整,我們可以基于它生成的答案給予進(jìn)一步的引導(dǎo),以獲得更完善且準(zhǔn)確的結(jié)果。圖1.21ChatGPT示例:細(xì)化需求第三步:進(jìn)行引導(dǎo)。我們預(yù)設(shè)答案,并對ChatGPT進(jìn)行引導(dǎo)。對于水墨畫的風(fēng)格,我們提出忽略“黑白色調(diào)”這一特性。圖1.22為ChatGPT生成的結(jié)果,可以看出,ChatGPT認(rèn)同我們的建議,并很快對上一輪對話中的答案進(jìn)行了糾正,輸出了一個(gè)更完善的結(jié)果。圖1.22ChatGPT示例:進(jìn)行引導(dǎo)到此,我們已獲得了足夠多的關(guān)鍵詞。如果想要讓最后生成的圖片更加貼近中國水墨畫的風(fēng)格,我們可以繼續(xù)向ChatGPT提出更為具體的要求。第四步:生成圖片。我們將使用ChatGPT生成的關(guān)鍵詞進(jìn)行AI繪畫。圖1.23為Midjourney依據(jù)關(guān)鍵詞初步生成的圖片,我們可以從這4張圖片中選擇自己喜歡的一張作為最終作品,也可以對這4張圖片繼續(xù)進(jìn)行優(yōu)化。在這4張圖片中,左下角的圖片最接近水墨畫的風(fēng)格,但缺少了“小橋流水人家”與“斷腸人”的意象。經(jīng)過比對,我們選擇了右下角的圖片作為最終作品。這張圖片雖然不夠貼近傳統(tǒng)水墨畫的風(fēng)格,但其包含的意象是最為完整的。圖1.23ChatGPT示例:生成圖片圖1.24ChatGPT生成的《天凈沙·秋思》畫作如圖1.24所示,在一個(gè)鄉(xiāng)村小鎮(zhèn),枯萎的藤蔓和老樹交織在一起,樹上停滿了黑色的烏鴉,它們發(fā)出低沉的叫聲。小橋下是潺潺的流水,沿著河岸是一排排的房屋,美麗而寧靜。在遠(yuǎn)處的古道上,一個(gè)人騎著一匹瘦弱的馬,獨(dú)自面對著遠(yuǎn)方的天空,內(nèi)心該是多么的孤獨(dú)和凄涼。至此,我們使用ChatGPT及Midjourney,在5分鐘之內(nèi)生成了一張圖片。雖然這張圖不夠貼合我們預(yù)想的水墨畫風(fēng)格,但是如果在關(guān)鍵詞部分對ChatGPT進(jìn)行進(jìn)一步糾正,相信能夠得到更為準(zhǔn)確的表述?;蛟S,從更為純粹的藝術(shù)角度來看,這張圖的意境不夠高遠(yuǎn),但對一個(gè)毫無繪畫基礎(chǔ)的人來說,能在5分鐘內(nèi)生成這樣的圖片,已經(jīng)是生產(chǎn)力極大提高的表現(xiàn)。\h[1]Midjourney是美國一個(gè)根據(jù)文本生成圖像的人工智能平臺(tái),2022年6月12日進(jìn)行首次公測。用戶可以通過輸入關(guān)鍵詞來生成圖片。第四節(jié)革新與局限性ChatGPT使用了GPT-3及GPT-3.5架構(gòu),并訓(xùn)練了1750億個(gè)參數(shù),這使得它能夠處理大量的文本數(shù)據(jù),并且具有相當(dāng)高的語言理解能力。相比之下,一些早期的語言類AI,如基于規(guī)則的語言處理器或簡單的神經(jīng)網(wǎng)絡(luò),只有很少的參數(shù)和訓(xùn)練數(shù)據(jù)。[6]目前,OpenAI已推出了基于GPT-4模型的ChatGPTPlus(ChatGPT的付費(fèi)訂閱服務(wù)),據(jù)OpenAI透露,GPT-4的參數(shù)量已經(jīng)達(dá)到了3.5萬億。ChatGPT可以在不需要先驗(yàn)知識(shí)或特定任務(wù)的情況下從原始數(shù)據(jù)中學(xué)習(xí)有用的信息。這與一些傳統(tǒng)的語言類AI有所不同,傳統(tǒng)AI需要手動(dòng)設(shè)計(jì)特征或規(guī)則才能完成任務(wù)。此外,ChatGPT可以預(yù)測給定一些文本的下一個(gè)單詞或句子,因此它在自然語言生成和理解任務(wù)中表現(xiàn)出色。而其他類型的語言類AI則更專注于文本分類、實(shí)體識(shí)別等任務(wù)。ChatGPT可以通過增強(qiáng)學(xué)習(xí)來優(yōu)化自己的行為,通過與環(huán)境交互來獲得反饋和獎(jiǎng)勵(lì),并從中學(xué)習(xí)如何采取行動(dòng)使獎(jiǎng)勵(lì)最大化。這使得ChatGPT能夠在一些交互式任務(wù)中有更出色的表現(xiàn)。無與倫比的性能ChatGPT的出現(xiàn)為自然語言處理的應(yīng)用場景提供了新的可能,并帶來了全新的性能優(yōu)勢。[7]理解能力強(qiáng):ChatGPT可以準(zhǔn)確理解用戶的輸入,并以正確的語義和格式給出回復(fù)。它能夠從文本中抽取細(xì)微的信息,并以敏銳的洞察力深入理解用戶的意圖,從而更好地解決用戶的需求。它還能夠自動(dòng)生成符合語法規(guī)則的、表達(dá)準(zhǔn)確的句子,以達(dá)到自然的交流效果。響應(yīng)速度快:它可以在幾秒內(nèi)響應(yīng)用戶的查詢,而不需要人工介入。這大大提高了服務(wù)效率,為用戶提供了更加便捷的服務(wù)體驗(yàn)。智能化程度高:ChatGPT能夠根據(jù)用戶輸入的語句,識(shí)別用戶的意圖,并進(jìn)行相應(yīng)的回答,滿足用戶所需。它還能夠分析用戶的歷史記錄,更好地了解用戶的需求,智能回復(fù)更加準(zhǔn)確、有效。功能可定制:ChatGPT可以根據(jù)不同企業(yè)的實(shí)際需求,選擇相應(yīng)的配置。此外,其具有較高的安全性,可以防止用戶的敏感信息泄露,確保企業(yè)的數(shù)據(jù)安全。局限與優(yōu)勢同在ChatGPT作為一種自然語言處理技術(shù),能夠根據(jù)上下文預(yù)測文本,從而為社交媒體、聊天機(jī)器人、問答系統(tǒng)等提供支持。這種技術(shù)給用戶帶來了很多便利,但同時(shí)也存在一些局限性。[8]數(shù)據(jù)偏差性:ChatGPT是根據(jù)訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練和生成的。如果訓(xùn)練數(shù)據(jù)存在偏差或缺乏代表性,那么ChatGPT生成的內(nèi)容可能會(huì)受到影響。例如,如果訓(xùn)練數(shù)據(jù)主要來自一種語言或特定文化背景,那么ChatGPT在其他語言或文化背景下的表現(xiàn)則不佳。理解語義的局限性:盡管ChatGPT能夠生成自然語言文本,但其并不一定能夠真正理解所生成文本的語義。ChatGPT學(xué)習(xí)的是人類的語言模式,但其并不一定具備人類的語言理解能力。上下文理解的局限性:ChatGPT是一種序列模型,其在生成文本時(shí)考慮的是前面已經(jīng)生成的內(nèi)容。但是,如果在生成的過程中需要考慮更大范圍的上下文信息,那么ChatGPT可能會(huì)遇到困難。這也是為什么在某些情況下,ChatGPT生成的回答可能會(huì)與問題相關(guān)度低或無關(guān)。特定領(lǐng)域的局限性:ChatGPT是基于大規(guī)模通用文本訓(xùn)練的,它可能在某些特定領(lǐng)域的專業(yè)術(shù)語或知識(shí)方面存在不足。如果需要在某個(gè)特定領(lǐng)域進(jìn)行任務(wù)處理,那么我們需要對ChatGPT進(jìn)行專門的訓(xùn)練。算力和能耗:ChatGPT是一種大規(guī)模模型,需要大量的計(jì)算資源和電力能源來保障其訓(xùn)練與運(yùn)行。這意味著在一些資源受限的場合,ChatGPT的應(yīng)用可能會(huì)受到限制。除此之外,ChatGPT在英語上的表現(xiàn)能力遠(yuǎn)遠(yuǎn)超過其他語言。雖然目前ChatGPT支持多種語言,但對于有較復(fù)雜語言邏輯的語種,如中文,其文本處理的能力稍顯不足。作為一個(gè)基于自然語言處理的大型語言模型,ChatGPT在數(shù)理推理方面的表現(xiàn)受到其訓(xùn)練數(shù)據(jù)和模型結(jié)構(gòu)的限制。雖然ChatGPT可以理解并回答數(shù)學(xué)問題,但它的數(shù)理推理能力相對較弱。圖1.25是ChatGPT對一道數(shù)理邏輯題的推理過程和結(jié)果,它給出了一個(gè)看似合理但錯(cuò)誤的答案——214505\h[1]。圖1.25ChatGPT示例:數(shù)理推理\h[1]“1=5”中1-0=1,且1為2的0次方;“2=15”中3-1=2,且2為2的1次方;“3=215”中6-3=4,且4為2的2次方;“4=2145”中2+1+4=6,且x-6=8。根據(jù)不完全歸納法,推斷應(yīng)為2的3次方,即8,所以5的形式應(yīng)該為“5=214y5”,求得:x=15,所以有y=15-6=8,所以可推斷“5=21485”。第二章ChatGPT與智能對話系統(tǒng)與機(jī)器對話,是不是很酷呢?設(shè)想一下,未來可能每個(gè)人都有一個(gè)或多個(gè)機(jī)器人助手,這樣的世界會(huì)不會(huì)帶來不一樣的體驗(yàn)?簡單來講,ChatGPT是一種智能對話系統(tǒng)[1]。其應(yīng)用的例子已經(jīng)較為常見,比如智能客服、智能機(jī)器人等。它們本質(zhì)上搭載了AI系統(tǒng),內(nèi)嵌大量智能的對話庫。下面,我們將詳細(xì)講述智能對話系統(tǒng)。第一節(jié)認(rèn)識(shí)智能對話系統(tǒng)言語是人與人進(jìn)行交流的方式之一,因此改善人與計(jì)算機(jī)之間的語音交互,從而模擬人與人之間的語音交流,是人機(jī)交互領(lǐng)域的目標(biāo)。在這個(gè)目標(biāo)的指引下,智能對話系統(tǒng)應(yīng)運(yùn)而生。那么,什么是智能對話系統(tǒng)?智能對話系統(tǒng)是由什么組成的,又是如何工作的呢?接下來的內(nèi)容會(huì)帶領(lǐng)我們展開神秘的畫卷,探索智能對話系統(tǒng)的秘密。從文字到對話想要完成對話,首先要了解文字(當(dāng)然小朋友學(xué)說話并不一定需要懂文字,但是對機(jī)器來講,了解文字還是必需的)。文字是組成對話的最基本的單位。機(jī)器從識(shí)字開始,再經(jīng)過大量的訓(xùn)練,慢慢才有了對話的功能。文字認(rèn)知機(jī)器是如何理解文字的含義,又是如何通過文字知曉指令的呢?面對一串又一串的文字,沒有大腦的機(jī)器是如何處理文字,并進(jìn)行“思考”的呢?想要弄明白這些問題,那就必須引入一個(gè)計(jì)算機(jī)界的概念——自然語言處理。[2]自然語言處理是一項(xiàng)讓計(jì)算機(jī)能夠理解和處理人類自然語言的技術(shù),可以簡單地理解為機(jī)器“聽文字的耳朵”、“處理文字的大腦”和“組織文字的嘴”。文字作為最基本的語言單位,承載著人類語言中的信息和含義。因此,文字認(rèn)知是自然語言處理的重要環(huán)節(jié)之一。文字認(rèn)知涉及多種技術(shù),如分詞、詞性標(biāo)注、句法分析、語義分析、命名實(shí)體識(shí)別、情感分析和自然語言生成等。這些技術(shù)需要機(jī)器能夠?qū)φZ言中的詞語、句子結(jié)構(gòu)、上下文語境和情感色彩等進(jìn)行深入分析和充分理解,才能準(zhǔn)確地識(shí)別和處理文字。舉個(gè)例子,如圖2.1所示,當(dāng)處理文本“小明是一個(gè)好學(xué)生,他總是在課堂上積極參與”時(shí),機(jī)器可根據(jù)三個(gè)步驟來進(jìn)行處理。?分詞處理,將文本分解為單個(gè)單詞或標(biāo)點(diǎn)符號(hào),如“小明”“是”“一個(gè)”“好學(xué)生”“,”“他”“總是”“在”“課堂上”“積極參與”。?句法分析,用于確定每個(gè)單詞的詞性和在句子中的作用。例如,“小明”是主語,“是”是謂語,“一個(gè)好學(xué)生”是賓語,“他”是主語,“總是”是副詞,“在課堂上”是介詞短語,“積極參與”是動(dòng)詞短語。?語義分析,用于確定句子的含義和上下文相關(guān)的信息。例如,“小明是一個(gè)好學(xué)生”表示小明是一個(gè)學(xué)習(xí)習(xí)慣優(yōu)良的學(xué)生,“他總是在課堂上積極參與”表示他在上課時(shí)表現(xiàn)得非常積極。圖2.1機(jī)器的文字認(rèn)知至此,面對人類文字,機(jī)器已經(jīng)完全解析。在現(xiàn)實(shí)社會(huì)中,文字認(rèn)知在很多領(lǐng)域都有著重要的應(yīng)用,如智能客服、智能翻譯、搜索引擎優(yōu)化、金融風(fēng)控等,但同時(shí)它也存在著一些挑戰(zhàn),如多語言處理、領(lǐng)域適應(yīng)性、上下文語境理解等問題。因此,對文字認(rèn)知技術(shù)的不斷優(yōu)化和提升,是自然語言處理領(lǐng)域的一大挑戰(zhàn)。從文字到句子“我很想你”“你很想我”“很想你我”,這三個(gè)短語文字相同,卻因?yàn)榕帕胁煌?,表達(dá)的意思也不相同。作為人類,理解句子、組織句子似乎是我們從小就有的本能,我們幾乎忘記了是怎么學(xué)習(xí)、理解、組織文字的。機(jī)器是如何理解文字并將文字組織成句子的呢?對機(jī)器來說,將文字組織成句子是一項(xiàng)基本任務(wù),這涉及識(shí)別句子中的語法和結(jié)構(gòu)。為了實(shí)現(xiàn)這個(gè)目標(biāo),我們通常使用句法分析技術(shù)。通過這項(xiàng)技術(shù),機(jī)器可以識(shí)別句子中的各個(gè)成分,如短語、詞語、修飾關(guān)系等,并將它們組織成合理的句子結(jié)構(gòu)。通過句法分析,機(jī)器也可以更加準(zhǔn)確地理解句子的語法結(jié)構(gòu)和含義,為后續(xù)的自然語言處理任務(wù)提供更為可靠的基礎(chǔ)。句法分析通??梢苑譃閮蓚€(gè)層次:短語結(jié)構(gòu)分析和依存關(guān)系分析。?短語結(jié)構(gòu)分析,是將句子分解為一個(gè)個(gè)的短語,識(shí)別出短語之間的嵌套和修飾關(guān)系。例如,在句子“小明正在學(xué)習(xí)自然語言處理”中,短語結(jié)構(gòu)分析可以將其分解為“小明”“正在學(xué)習(xí)”“自然語言處理”三個(gè)短語。?依存關(guān)系分析,是識(shí)別句子中的各個(gè)詞語之間的依存關(guān)系,以及它們之間的修飾關(guān)系。例如,還是在句子“小明正在學(xué)習(xí)自然語言處理”中,“正在”是動(dòng)詞“學(xué)習(xí)”的修飾語,“自然語言處理”是動(dòng)詞“學(xué)習(xí)”的賓語。總而言之,句法分析是機(jī)器語言處理中非常重要的技術(shù),它可以幫助機(jī)器更加準(zhǔn)確地理解句子中的語法信息和含義,為后續(xù)的自然語言處理任務(wù)提供更為可靠的基礎(chǔ),從而實(shí)現(xiàn)機(jī)器理解中從文字到句子的跨越。從句子到對話當(dāng)我們進(jìn)行語言對話時(shí),一個(gè)句子不僅僅是一個(gè)獨(dú)立的語言單位,還用于表達(dá)一種特定的含義和目的,如描述一件事情,表達(dá)一個(gè)觀點(diǎn)或者參與一個(gè)對話。因此,從句子到對話的轉(zhuǎn)換是自然語言處理中的一個(gè)重要環(huán)節(jié)。在這個(gè)環(huán)節(jié)中,我們需要對句子進(jìn)行分析和解釋,理解其含義和上下文,然后將其整合到一個(gè)完整的對話中。在接下來的內(nèi)容中,我們將詳細(xì)介紹自然語言處理中從句子到對話的轉(zhuǎn)換過程,并舉例說明其中的細(xì)節(jié)以及遇到的挑戰(zhàn)。假設(shè)機(jī)器得到了以下兩個(gè)句子。1.我今天去了公園。2.天氣非常好,陽光明媚。這兩個(gè)句子分別描述了“我”今天的活動(dòng)和天氣的情況。那么,該如何將這兩個(gè)句子整合成一個(gè)完整的對話,以更好地表達(dá)它們的含義呢?通過自然語言處理技術(shù),我們可以分析這兩個(gè)句子的上下文和語義關(guān)系,然后構(gòu)建一個(gè)對話場景。例如,我們可以假設(shè)這兩個(gè)句子是在兩個(gè)人的對話中出現(xiàn)的。這樣,我們就可以將這兩個(gè)句子轉(zhuǎn)化為以下形式的對話。A:你今天去了哪兒?B:我今天去了公園。A:天氣怎么樣?B:天氣非常好,陽光明媚。在這個(gè)對話中,第一個(gè)句子變成了提問:“你今天去了哪兒?”第二個(gè)句子成了回答:“我今天去了公園?!钡谌齻€(gè)句子成了另一個(gè)提問:“天氣怎么樣?”第四個(gè)句子成了回答:“天氣非常好,陽光明媚?!边@樣,我們就將兩個(gè)獨(dú)立的句子轉(zhuǎn)化為了一個(gè)連貫的對話,更好地表達(dá)了原始文本的含義。從句子到對話的轉(zhuǎn)換是自然語言處理中的一個(gè)重要環(huán)節(jié),因?yàn)檎Z言通常是用于交流的。將獨(dú)立的句子轉(zhuǎn)換為對話可以更好地表達(dá)語言的特定含義和目的,更符合人類交流的方式。在自然語言處理中,從句子到對話的轉(zhuǎn)換可以幫助計(jì)算機(jī)理解和生成更自然、更貼近人類交流方式的文本,從而更好地服務(wù)于人類。自然語言處理通過前面的講述,我們知道了自然語言處理技術(shù)是一項(xiàng)能夠讓計(jì)算機(jī)理解人類語言的技術(shù),是機(jī)器“聽文字的耳朵”、“處理文字的大腦”和“組織文字的嘴”。那么從技術(shù)的角度上說,你知道在計(jì)算機(jī)領(lǐng)域是如何描述和研究自然語言處理的嗎?你知道ChatGPT和自然語言處理是如何關(guān)聯(lián)在一起的嗎?接下來,我們一起來看看吧。釋義2.1自然語言處理自然語言處理技術(shù)是一種涉及人類和計(jì)算機(jī)用自然語言進(jìn)行交互的技術(shù),它主要研究如何讓計(jì)算機(jī)能夠理解、分析、處理、生成自然語言,并根據(jù)語言執(zhí)行相關(guān)的任務(wù)。自然語言處理技術(shù)涉及文本處理、語音識(shí)別、語言理解、機(jī)器翻譯、信息檢索、自動(dòng)摘要、情感分析等多個(gè)方面。ChatGPT作為一個(gè)基于自然語言處理技術(shù)的AI模型,使用了深度學(xué)習(xí)算法來學(xué)習(xí)和理解大量的語言數(shù)據(jù),并能夠根據(jù)用戶輸入的語言進(jìn)行智能回復(fù)。圖2.2為自然語言處理流程。圖2.2自然語言處理流程例如,用戶在ChatGPT中輸入“我該如何學(xué)習(xí)編程?”自然語言處理會(huì)怎么做呢?首先,自然語言處理會(huì)使用文本處理中的分詞技術(shù)將用戶輸入的問題按照單詞進(jìn)行分割,形成一個(gè)單詞序列,并對單詞序列進(jìn)行詞性標(biāo)注和實(shí)體命名等技術(shù)處理,使單詞序列中的名詞、動(dòng)詞、形容詞等詞語和地名、人名等實(shí)體類型分別明晰。其次,對問題進(jìn)行語義分析,以確定輸入的含義和意圖。之后,進(jìn)行信息檢索,搜集相關(guān)資料,并根據(jù)用戶輸入的問題以及之前的對話歷史等信息,使用預(yù)訓(xùn)練模型生成相應(yīng)的回復(fù)。在ChatGPT中如何使用情感分析技術(shù)來理解用戶輸入的情感傾向,并根據(jù)情感傾向生成相應(yīng)的回復(fù)?例如,當(dāng)用戶輸入“我很難過,我不知道該怎么辦”時(shí),ChatGPT可以使用情感分析技術(shù)判斷用戶情感傾向?yàn)樨?fù)面,生成相應(yīng)的回復(fù)來安慰用戶,并提供一些有用的建議和資源來幫助用戶緩解情緒。在ChatGPT中,自然語言處理技術(shù)被廣泛應(yīng)用于多個(gè)方面。首先,它通過語言模型來理解用戶輸入的語言,并生成相應(yīng)的回復(fù)。其次,它使用文本分類技術(shù)來將用戶的問題歸類到不同的主題,從而更好地回答用戶的問題。最后,它還可以通過情感分析技術(shù)來理解用戶輸入的情感傾向,并根據(jù)情感傾向生成相應(yīng)的回復(fù)。因此,自然語言處理技術(shù)對ChatGPT的應(yīng)用非常重要。它使ChatGPT能夠更好地理解和處理用戶輸入的語言,從而更準(zhǔn)確地回答用戶的問題,提供更好的用戶體驗(yàn)。隨著自然語言處理技術(shù)的不斷發(fā)展,ChatGPT的性能也將不斷提高,從而更好地滿足用戶的需求。接下來,我們會(huì)對自然語言處理過程中一些重要的環(huán)節(jié)進(jìn)行詳細(xì)解釋,相信能夠幫助大家更好地理解自然語言處理。分詞分詞[3]是自然語言處理中的一個(gè)重要環(huán)節(jié)。因?yàn)檎Z言是有意義的,它是由具有一定含義的單詞組成的。因此,將文本切分成有意義的詞語序列可以更好地反映文本的語義和結(jié)構(gòu),為后續(xù)的語言分析和處理提供堅(jiān)實(shí)基礎(chǔ)。釋義2.2分詞分詞是指將一個(gè)連續(xù)的漢字序列切分成有意義的詞語序列的過程。舉一個(gè)例子,一個(gè)中文文本“我喜歡自然語言處理”經(jīng)過分詞后,分詞器通過判斷單詞的邊界將其分成“我”“喜歡”“自然語言處理”三個(gè)詞語。分詞可以使用規(guī)則化方法、統(tǒng)計(jì)方法或混合方法等不同的方法來實(shí)現(xiàn)?;谝?guī)則化的分詞方法通常是通過定義一系列的規(guī)則和模式,來進(jìn)行詞語的識(shí)別和切分?;诮y(tǒng)計(jì)的分詞方法則是通過分析語料庫中的大量語言數(shù)據(jù),來學(xué)習(xí)單詞和詞語之間的關(guān)系,從而進(jìn)行自動(dòng)分詞。分詞是自然語言處理中的一個(gè)基礎(chǔ)和核心環(huán)節(jié),它對于機(jī)器能夠準(zhǔn)確理解和處理自然語言文本至關(guān)重要。語義如果說分詞是自然語言處理的前提和基礎(chǔ),那么語義就是自然語言處理的根基了。語義在語境中通常指的是文本所表達(dá)的實(shí)際含義或意義,包括詞語、句子、對話等不同層次。它不僅包含字面含義,也包含文本所隱含的情感、主題、目的等多方面的信息。釋義2.3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論