大學(xué)計算機基礎(chǔ) 課件 1.4.3AIGC技術(shù)應(yīng)用領(lǐng)域_第1頁
大學(xué)計算機基礎(chǔ) 課件 1.4.3AIGC技術(shù)應(yīng)用領(lǐng)域_第2頁
大學(xué)計算機基礎(chǔ) 課件 1.4.3AIGC技術(shù)應(yīng)用領(lǐng)域_第3頁
大學(xué)計算機基礎(chǔ) 課件 1.4.3AIGC技術(shù)應(yīng)用領(lǐng)域_第4頁
大學(xué)計算機基礎(chǔ) 課件 1.4.3AIGC技術(shù)應(yīng)用領(lǐng)域_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

大學(xué)計算機基礎(chǔ)——基于計算思維(Windows10+Office2016)第1章計算機文化1.4.3AIGC技術(shù)應(yīng)用領(lǐng)域1.4生成式人工智能(AIGC)文生文文生文是AIGC領(lǐng)域的一個重要概念,它指的是基于文本的生成任務(wù),即通過分析和理解輸入的文本信息,自動生成相應(yīng)的文本內(nèi)容。這一過程涉及到自然語言處理、機器學(xué)習(xí)等多個技術(shù)領(lǐng)域的應(yīng)用。文生文可以應(yīng)用于多種場景,如自動寫作、內(nèi)容創(chuàng)作輔助等。文生文①數(shù)據(jù)預(yù)處理文生文原理步驟如下②模型訓(xùn)練③序列生成④文本輸出在文本生成之前,需要大量的文本數(shù)據(jù)作為輸入。這些數(shù)據(jù)首先經(jīng)過預(yù)處理,包括清洗(去除噪聲信息),標(biāo)準(zhǔn)化(統(tǒng)一文本格式),分詞(將文本分解為詞匯或短語),向量化(將詞匯轉(zhuǎn)換為數(shù)值表示)等步驟。數(shù)據(jù)預(yù)處理清洗標(biāo)準(zhǔn)化分詞向量化...文生文①數(shù)據(jù)預(yù)處理文生文原理步驟如下②模型訓(xùn)練③序列生成④文本輸出使用處理過的數(shù)據(jù)來訓(xùn)練一個語言模型。文生文①數(shù)據(jù)預(yù)處理文生文原理步驟如下②模型訓(xùn)練③序列生成④文本輸出這些模型通過學(xué)習(xí)單詞或字符的序列來預(yù)測下一個最可能的單詞或字符,這使得它們非常適合于文本生成。文生文①數(shù)據(jù)預(yù)處理文生文原理步驟如下②模型訓(xùn)練③序列生成④文本輸出訓(xùn)練好的模型能夠基于給定的起始文本(種子)來生成文本。這個過程可以是確定性的,也可以引入隨機性,允許模型在多個可能的選項中選擇,以增加文本的多樣性和創(chuàng)造性。文生文市場上的文生文大模型種類繁多,例如百度的文心一言(ERNIE系列)、阿里云的通義千問、Minimax系列模型、科大訊飛的訊飛星火以及美國OpenAI研發(fā)的ChatGPT等。這些模型在文本創(chuàng)作、智能問答、知識檢索、商業(yè)文案生成等多個場景中展現(xiàn)出了巨大的潛力。...文生圖文生圖是一種基于文本生成圖像的技術(shù),屬于AIGC的一個重要方向。用戶通過輸入描述性的文本,AI模型能夠根據(jù)這些描述生成相應(yīng)的圖像。這種技術(shù)的核心在于理解和轉(zhuǎn)換文本信息到圖像內(nèi)容,涉及到多種技術(shù)和模型的應(yīng)用。文生圖是文生圖領(lǐng)域的一個重要技術(shù),它基于擴散模型(diffusionmodels),通過模擬物理世界中的擴散過程,將噪聲逐漸轉(zhuǎn)化為具有特定結(jié)構(gòu)和紋理的圖像。StableDiffusion這一過程包括對數(shù)據(jù)不斷加噪成為真實噪聲,以及從真實噪聲中去噪還原成原始數(shù)據(jù)的過程,通過學(xué)習(xí)去噪的過程,進而能夠?qū)φ鎸嵲肼曔M行隨機采樣,以生成圖像。在StableDiffusion的技術(shù)實現(xiàn)中,涉及到多個組件和模型的組合使用。首先是文本理解組件,它負責(zé)將文本信息轉(zhuǎn)換成數(shù)字表示。此外,還包括提示詞處理、去噪、VAE等模塊的作用和參數(shù)設(shè)置,這些都對生成高質(zhì)量的圖像至關(guān)重要。文生圖目前市面上文生圖工具種類繁多,包括但不限于下面幾種:Midjourney是一個強大的AI圖像生成工具,通過Discord服務(wù)器運行,可以使用文本或圖像提示、調(diào)整參數(shù)和選擇模型來使用。Midjourney文生圖這是由OpenAI開發(fā)的一系列文生圖模型,DALL·E能夠根據(jù)自然語言的描述創(chuàng)建逼真的圖像和藝術(shù)。DALL·E文生圖這是百度推出的一系列基于ERNIE的視覺語言模型,用于生成圖像,具有強大的中文語義理解能力。ERNIE-ViLG系列文生視頻文生視頻技術(shù)的原理主要基于深度學(xué)習(xí)模型,通過訓(xùn)練大量的文本和視頻數(shù)據(jù),使模型能夠?qū)W習(xí)到文本描述和視頻內(nèi)容之間的映射關(guān)系。在生成階段,模型會根據(jù)輸入的文本描述,自動選擇合適的圖像、音效和動畫效果,從而生成符合描述的視頻內(nèi)容。OpenAISora是其中的一個例子,它是一個基于文本描述生成視頻的AI模型,能夠根據(jù)文字描述制作出最長60秒的視頻。文生視頻Sora的技術(shù)原理還包括擴散模型和視覺塊嵌入代碼,從一個類似于靜態(tài)噪聲的視頻畫面開始,逐步移除噪聲,生成清晰的視頻。此外,Sora使用Transformer架構(gòu),通過類似DALL-E的圖像生成方式,從噪聲開始生成高清視頻剪輯。文生視頻文生視頻技術(shù)的核心在于其大模型,即包含大量參數(shù)和數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型,通過訓(xùn)練大量的數(shù)據(jù),使其具備生

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論