版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大語(yǔ)言模型通識(shí)微課
提示工程與語(yǔ)境學(xué)習(xí)大語(yǔ)言模型正在發(fā)展成為人工智能的一項(xiàng)基礎(chǔ)設(shè)施,少數(shù)大廠負(fù)責(zé)預(yù)訓(xùn)練大模型,而大多數(shù)人則會(huì)是其用戶。用戶掌握用好大模型的技術(shù)。用好大模型的第一個(gè)層次是掌握提示工程,第二個(gè)層次是做好大模型的微調(diào)。提示工程關(guān)注提示詞的開(kāi)發(fā)和優(yōu)化,幫助用戶將大模型用于各場(chǎng)景和研究領(lǐng)域。掌握提示工程相關(guān)技能幫助用戶更好地了解大模型的能力和局限性。另一方面,需要使用指令數(shù)據(jù)對(duì)其進(jìn)行微調(diào)。如何構(gòu)造指令數(shù)據(jù),如何高效低成本地進(jìn)行指令微調(diào)訓(xùn)練,以及如何在語(yǔ)音模型基礎(chǔ)上進(jìn)一步擴(kuò)大上下文等問(wèn)題,是大模型在有監(jiān)督微調(diào)階段的核心。微課8.1提示工程與語(yǔ)境學(xué)習(xí)提示工程應(yīng)用于開(kāi)發(fā)和優(yōu)化提示詞,幫助用戶有效地將語(yǔ)言模型用于各種應(yīng)用場(chǎng)景和研究領(lǐng)域。研究人員可利用提示工程來(lái)提高大模型處理復(fù)雜任務(wù)場(chǎng)景的能力,如問(wèn)答和算術(shù)推理能力以及大模型的安全性。開(kāi)發(fā)人員可通過(guò)提示工程設(shè)計(jì)和實(shí)現(xiàn)與大模型或其他生態(tài)工具的交互和高效接軌,借助專業(yè)領(lǐng)域知識(shí)和外部工具來(lái)增強(qiáng)大模型能力。8.1.1什么是提示工程提示不僅是用戶與大模型(如ChatGPT)交互的橋梁,更是一種全新的“編程語(yǔ)言”,用于指導(dǎo)人工智能模型產(chǎn)生特定的輸出。(1)角色轉(zhuǎn)變:用戶通過(guò)精心設(shè)計(jì)的提示來(lái)“編程”人工智能模型,指導(dǎo)其執(zhí)行各種任務(wù)。(2)任務(wù)多樣性:任務(wù)的范圍非常廣泛,從簡(jiǎn)單問(wèn)答、文本生成到復(fù)雜的邏輯推理、數(shù)學(xué)計(jì)算和創(chuàng)意寫(xiě)作等。(3)即時(shí)性與互動(dòng)性:提示通常更加即時(shí)和互動(dòng)。用戶可以直接在模型接口中輸入提示并立即看到結(jié)果。8.1.1什么是提示工程提示工程涉及到如何設(shè)計(jì)、優(yōu)化和管理提示內(nèi)容,以確保人工智能模型能夠準(zhǔn)確、高效地執(zhí)行用戶的指令。(1)設(shè)計(jì):需要仔細(xì)選擇詞匯、構(gòu)造清晰的句子結(jié)構(gòu),并考慮上下文信息,確保大模型能夠準(zhǔn)確理解用戶的意圖并產(chǎn)生符合預(yù)期的輸出。(2)優(yōu)化:可能涉及調(diào)整詞匯選擇、改變句子結(jié)構(gòu)或添加額外的上下文信息,以提高大模型的性能和準(zhǔn)確性。需要多次迭代以達(dá)到最佳效果。(3)管理:管理大量提示內(nèi)容,包括組織、存儲(chǔ)和檢索提示,以便在需要時(shí)能夠快速找到并使用它們。同時(shí),還需要定期更新和維護(hù)。8.1.2提示工程的原理以下是設(shè)計(jì)提示的一些技巧。(1)從簡(jiǎn)單開(kāi)始。記住設(shè)計(jì)提示是一個(gè)迭代過(guò)程,需要大量實(shí)驗(yàn)來(lái)獲得最佳結(jié)果??梢詮暮?jiǎn)單提示開(kāi)始,隨著目標(biāo)獲得更好的結(jié)果,不斷添加更多的元素和上下文。具體、簡(jiǎn)潔和簡(jiǎn)明通常會(huì)帶來(lái)更好的結(jié)果。當(dāng)有一個(gè)涉及許多不同子任務(wù)的大任務(wù)時(shí),可以嘗試將任務(wù)分解為更簡(jiǎn)單的子任務(wù),并隨著獲得更好的結(jié)果而不斷構(gòu)建。這避免了在提示設(shè)計(jì)過(guò)程中一開(kāi)始就添加過(guò)多的復(fù)雜性。8.1.3提示的技巧(2)指令??梢允褂妹顏?lái)指示模型執(zhí)行各種簡(jiǎn)單任務(wù),例如“寫(xiě)入”“分類”“總結(jié)”“翻譯”“排序”等,為任務(wù)設(shè)計(jì)有效的提示。需要進(jìn)行大量的實(shí)驗(yàn),嘗試使用不同的關(guān)鍵字、上下文和數(shù)據(jù)嘗試不同的指令,看看哪種方法最適合特定的用例和任務(wù)。通常情況下,上下文與要執(zhí)行的任務(wù)越具體和相關(guān),效果越好。(3)具體性。提示越具體和詳細(xì),結(jié)果就越好。在提示中提供示例非常有效,可以以特定格式獲得所需的輸出。在設(shè)計(jì)提示時(shí),還應(yīng)考慮提示的長(zhǎng)度,因?yàn)殚L(zhǎng)度有限制。8.1.3提示的技巧(4)避免不精確。通常最好是具體和直接,越直接信息傳遞就越有效。例如,如果有興趣了解提示工程的概念。可以嘗試這樣做:解釋提示工程的概念。保持解釋簡(jiǎn)短,只有幾句話,不要過(guò)于描述。但更好的提示是非常具體、簡(jiǎn)潔和直接的。設(shè)計(jì)提示時(shí)的另一個(gè)技巧是避免說(shuō)不要做什么,而是說(shuō)要做什么。鼓勵(lì)更具體化,并關(guān)注導(dǎo)致模型產(chǎn)生良好響應(yīng)的細(xì)節(jié)。8.1.3提示的技巧語(yǔ)境學(xué)習(xí),也稱上下文學(xué)習(xí),是指模型可以從上下文中的幾個(gè)例子中學(xué)習(xí):向模型輸入特定任務(wù)的一些具體例子(也稱示例)及要測(cè)試的樣例,模型可以根據(jù)給定的示例續(xù)寫(xiě)測(cè)試樣例的答案。以情感分類任務(wù)為例,向模型中輸入一些帶有情感極性的句子、每個(gè)句子相應(yīng)的標(biāo)簽,以及待測(cè)試的句子,模型可以自然地續(xù)寫(xiě)出它的情感極性為“正面”。
圖8-5語(yǔ)境學(xué)習(xí)示例8.1.4語(yǔ)境學(xué)習(xí)語(yǔ)境學(xué)習(xí)可以看作提示學(xué)習(xí)的一個(gè)子類,其中示例是提示的一部分。語(yǔ)境學(xué)習(xí)的關(guān)鍵思想是從類比中學(xué)習(xí),整個(gè)過(guò)程并不需要對(duì)模型進(jìn)行參數(shù)更新,僅執(zhí)行前向的推理。大模型可以通過(guò)語(yǔ)境學(xué)習(xí)執(zhí)行許多復(fù)雜的推理任務(wù)。作為大模型的一種新的范式,語(yǔ)境學(xué)習(xí)具有許多獨(dú)特的優(yōu)勢(shì)。首先,其示例是用自然語(yǔ)言編寫(xiě)的,提供了一個(gè)可解釋的界面來(lái)與大模型進(jìn)行交互。其次,不同于以往的監(jiān)督訓(xùn)練,語(yǔ)境學(xué)習(xí)本身無(wú)須參數(shù)更新,這可以大大降低使大模型適應(yīng)新任務(wù)的計(jì)算成本。8.1.4語(yǔ)境學(xué)習(xí)在語(yǔ)境學(xué)習(xí)中,示例的標(biāo)簽正確性(輸入和輸出的具體對(duì)應(yīng)關(guān)系)并不是有效的關(guān)鍵因素,起到更重要作用的是輸入和樣本配對(duì)的格式、輸入和輸出分布等。此外,語(yǔ)境學(xué)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度地坪工程環(huán)保驗(yàn)收承包合同3篇
- 2025年度信息安全產(chǎn)品代理分銷協(xié)議書(shū)4篇
- 二零二五年度馬鈴薯種植基地農(nóng)業(yè)廢棄物資源化利用技術(shù)研發(fā)合同4篇
- 2025年度儲(chǔ)油罐安裝施工合同(安全質(zhì)量標(biāo)準(zhǔn)嚴(yán)格)4篇
- 二零二五年綿陽(yáng)城市綠化帶租賃服務(wù)合同4篇
- 2025年大蒜精油原料倉(cāng)儲(chǔ)與物流服務(wù)合同3篇
- 二零二五年啤酒品牌授權(quán)與加盟管理合同
- 二零二五年度高端戶外運(yùn)動(dòng)輪胎批發(fā)供應(yīng)協(xié)議4篇
- 2025不銹鋼電梯門套及配件采購(gòu)合作協(xié)議3篇
- 2025年度羅馬柱工程古建筑遺址保護(hù)與修復(fù)合同4篇
- 火災(zāi)安全教育觀后感
- 農(nóng)村自建房屋安全協(xié)議書(shū)
- 快速康復(fù)在骨科護(hù)理中的應(yīng)用
- 國(guó)民經(jīng)濟(jì)行業(yè)分類和代碼表(電子版)
- ICU患者外出檢查的護(hù)理
- 公司收購(gòu)設(shè)備合同范例
- 廣東省潮州市2023-2024學(xué)年高二上學(xué)期語(yǔ)文期末考試試卷(含答案)
- 2024年光伏發(fā)電項(xiàng)目EPC總包合同
- 子女放棄房產(chǎn)繼承協(xié)議書(shū)
- 氧化還原反應(yīng)配平專項(xiàng)訓(xùn)練
- 試卷(完整版)python考試復(fù)習(xí)題庫(kù)復(fù)習(xí)知識(shí)點(diǎn)試卷試題
評(píng)論
0/150
提交評(píng)論