行研新視角：AIGC助推元宇宙進程加速未來商業(yè)化場景探究

上傳人：b*** IP屬地：北京上傳時間：2024-04-30 格式：DOCX 頁數(shù)：25 大?。?09.84KB 積分：18 舉報 版權申訴

已閱讀5頁，還剩20頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

目錄AIGC將推動元宇宙發(fā)展 5被稱為下一代風口的AIGC到底是什么 5組成元宇宙概念的拼圖逐漸完整 7為什么元宇宙還沒實現(xiàn)？ 9AIGC如何提升元宇宙內容生成效率 10頭部大模型技術在競爭中不斷精進 12微軟:劃時代橫空出世 2.2谷歌：GEMINI1.5采用MOE架構超長上下文回溯 2.3亞馬遜：CLAUDE3邏輯推理能力獨一檔 16文字以外的領域同樣在發(fā)生變革 17繪圖及電影制作應用場景不斷拓寬 17AI能夠自行通關游戲，虛擬角色將更擬真 19未來商業(yè)化場景暢想 20相關標的 21風險提示 22圖目錄圖目錄圖1：AIGC最典型的商化產品：ChatGPT 6圖2：AIGC未來將是元宙重要內容創(chuàng)作來源 6圖通過重復習實現(xiàn)高概率結果 7圖4：目前自然語大型訓練仍在突飛猛進 7圖5：元宇宙是虛與實結合的混合生態(tài) 8圖6：構成元宇宙八要素缺一不可 8圖6：Chatgpt的文字生能力展示 10圖7：Midjourney的圖生成能力展示圖的音頻成能力展示圖9：SORA的視頻生成能力展示 12圖10：GPT經(jīng)過多次升，目前已經(jīng)能夠滿更的內容生成 15圖1.5在超長冗余信息中依然保較召回率 16圖12：Claude3號稱花最少得錢獲取最優(yōu)秀用體驗 17圖13：AI繪畫已經(jīng)從簡生成圖片已經(jīng)進化理和推理繪畫的內容 18圖14：SORA概念視頻線，生成內容時長1分鐘 18圖15：Cradle能直接據(jù)游戲內的提示和程成對應的可執(zhí)行代碼 19表目錄表1：AIGC技術升級將力元宇宙加速實現(xiàn) 9表2：三大廠商模測能力對比 13表3：三大廠商模付會員使用價格對比 13表4：GPT4.0在各項功上有較大突破 15表5：AIGC及元宇宙相概念標的估值 211.AIGC1.AIGC將推動元宇宙發(fā)展AIGC到底是什么AIGC（AIGeneratedContent）AI生成的內容，其特點是自動化生產、高NLGAI模型的成熟，AIGC逐漸受到大家的關3DAIGC將極大的推動元宇宙的發(fā)展，元宇宙中大量的數(shù)字原生內容，需AIAIGC之后的新型內容創(chuàng)作方式。AIGC依托高效的數(shù)據(jù)、算法、場景學習優(yōu)勢，能夠為用戶在元宇宙中的數(shù)字身份塑造、元世界打造提供數(shù)據(jù)與算法服務，實現(xiàn)渲染、交互驅動、智能計算、數(shù)據(jù)開放與數(shù)字資產流通功能，高AIGC元宇宙構成要素包括硬件設備、軟件平臺、虛擬現(xiàn)實技術、人工智能、區(qū)塊鏈等。硬件設備包括虛擬現(xiàn)實眼鏡、手套、體感設備等，可以讓用戶身臨其境地感受到虛擬現(xiàn)實空間。軟件平臺則提供了一個開放的環(huán)境，使得用戶可以自由地創(chuàng)建和分享內容。虛擬現(xiàn)實技術則是元宇宙的核心，它可以讓用戶在虛擬現(xiàn)實空間中進行交互和溝通。人工智能則可以為元宇宙中的角色賦予智能，讓他們更加真實。區(qū)塊鏈則為元宇宙提供了一個去中心化的管理方式，使得用戶可以自由地交換和共享數(shù)字資產?？傊?，元宇宙是一個融合了多種技術的數(shù)字世界，它將給人類帶來更加廣闊的想象空間和無限的可能性。1：AIGC最典型的商業(yè)化產品：ChatGPT2：AIGC未來將是元宇宙重要內容創(chuàng)作來源資料來源：OpenAI官網(wǎng)、國元證券經(jīng)紀（香港）資料來源：國元證券經(jīng)紀（香港）ChatGPT是首個成熟的AIGC產品ChatGPT是由OpenAI公司開發(fā)的一種基于Transformer架構的先進語言模型，成為機器學習并輸出內容的首個應用類工具，它擁有強大的語言理解和生成能力，能夠模擬人類的溝通方式，提供更為高效、自然的表達方式。這種模型在各種場景下具有廣泛的應用潛力，包括但不限于在線聊天、智能語音助手以及自然語言處理任務等。ChatGPT通過持續(xù)的學習和優(yōu)化算法，不斷提升自身的性能和準確性，從而更好地滿足用戶的多樣化需求。作為AIGC領域中的一種具體應用和產品，ChatGPT屬于文本生成范疇，其優(yōu)點在于能夠生成流暢、連貫且富有邏輯的文本內容。當GPT模型在參考了千億甚至萬億級數(shù)據(jù)后，經(jīng)過大模型預訓練，可以基本GPT現(xiàn)出自然、有趣的對話風格，為用戶帶來良好的使用體驗。ChatGPTGPT場景中的作用。ChatGPTTransformer的語言模型，在文本生成和自然語言處理領域具有顯著的優(yōu)勢和廣泛的應用前景。隨著技術的不斷進步和自然語言處理領域具有顯著的優(yōu)勢和廣泛的應用前景。隨著技術的不斷進步GPT為人類的生活和工作帶來更多便利。圖3：GPTAI通過重復學習實現(xiàn)高概率結果圖4：目前自然語言大模型訓練仍在突飛猛進資料來源：Google論文、國元證券經(jīng)紀（香港）資料來源：Google論文、國元證券經(jīng)紀（香港）組成元宇宙概念的拼圖逐漸完整元宇宙生態(tài)當前仍處于初級階段5G側必須擁有強大的算力支撐。Roblox五大鮮明特征與屬性：社會與空間的交融屬性、科技賦能的超越現(xiàn)實延伸、人、五大鮮明特征與屬性：社會與空間的交融屬性、科技賦能的超越現(xiàn)實延伸、人、機與人工智能的共創(chuàng)共生、真實感與現(xiàn)實世界的精準映射，以及虛擬資產與服務的自由交易與流通。本質上，元宇宙是對現(xiàn)實世界的深度虛擬化與數(shù)字化，這一過程需要對內容生產、經(jīng)濟系統(tǒng)、用戶體驗以及實體世界內容的深度融合進行大量創(chuàng)新性的改造。然而，元宇宙的發(fā)展并非一蹴而就，而是在共享的基礎設施、統(tǒng)一的標準及協(xié)議的支撐下，由眾多工具、平臺的不斷融合與進化而最終成形?；跀U展現(xiàn)實技術，元宇宙為用戶提供了前所未有的沉浸式體驗；借助數(shù)字孿生技術，它生成了現(xiàn)實世界的精準鏡像；通過區(qū)塊鏈技術，元宇宙社交、身份等多個系統(tǒng)上實現(xiàn)了緊密融合，每個用戶都被賦予了內容生產和世界編輯的權力，從而共同塑造這個充滿無限可能的數(shù)字新世界。圖5：元宇宙是虛擬與現(xiàn)實結合的混合生態(tài) 圖6：構成元宇宙的八大要素缺一不可資料來源：Google論文、國元證券經(jīng)紀（香港）資料來源：Google論文、國元證券經(jīng)紀（香港）AIGC技術助力元宇宙內容快速膨脹PGCUGCAIGCPGCWeb1.0UGCWeb2.0AIGC技術將助力元宇宙加速實現(xiàn)。表1：AIGC技術升級將助力元宇宙加速實現(xiàn)互聯(lián)網(wǎng)時代Web1.0Web2.0Web3.0/元宇宙內容生產方式PGC(專業(yè)生產)UGC(用戶生產)AIGC(Al生產)特點專業(yè)、質量有保證自由上傳、內容豐富高效率發(fā)展核心網(wǎng)絡傳輸用戶數(shù)量算力資料來源：國元證券經(jīng)紀（香港）為什么元宇宙還沒實現(xiàn)？界，因此人們可以在這個世界中獲得大量的成就感和滿足。這一概念早在2021年就開始興起，科技行業(yè)巨頭們紛紛為進軍元宇宙領域布局，大家也對20213Roblox8VRPICO，2021年10FacebookMeta。但是發(fā)展至現(xiàn)在市面上依然沒有成型的元宇宙生態(tài)，資本市場的熱度也有所下降。我們認為其主要制約因素有以下幾點：的元宇宙體驗仍然面臨技術限制。人工智能與自主行為：元宇宙中的虛擬角色和虛擬物品通常由人工智能控制，但目前的人工智能技術在模擬人類行為和情感方面仍存在局限性。實現(xiàn)更加智能化和自主化的虛擬角色和虛擬物品仍然是一個技術挑戰(zhàn)。設備和設施：要在元宇宙中獲得沉浸式體驗，用戶通常需要使用虛擬現(xiàn)實些設備在成本、便攜性和用戶友好性方面還存在一些限制。云設備和計算資源：元宇宙需要強大的計算資源和硬件設備的支持，包括GPU更加真實、高效和流暢的虛擬環(huán)境和交互體驗。建立一個交互體驗高的元宇宙需要持續(xù)和高效的生成內容，同時也需要后AI期過長。AIGC如何提升元宇宙內容生成效率AIGC的高速發(fā)展將能夠提升生態(tài)內容的生成效率，而且由于目前普遍大模型已經(jīng)開始多模態(tài)化，ChatGPT目前可實現(xiàn)的功能不僅僅局限于聊天，它具有強大的自然語言處理能力，可以完成文本生3DAIGC的高效內容生產文本生成模態(tài)：ChatGPT可以按照要求高質量完成文案生成、撰寫新聞稿在線答疑等任務，某些方面甚至有超越搜索引擎的趨勢。同時具備較強上下文連接以及多輪對話的能力，人機交互體驗感大幅提升。6：Chatgpt的文字生成能力展示資料來源：Chatgpt官網(wǎng)、國元證券經(jīng)紀（香港）ChatGPTAI繪畫，一種是通過文字描述生成圖像，另一種是在已有圖像的基礎上借助文字描述生成新的圖像，第三類是先通過文字描述產生圖像，然后在生成圖像的基礎上再借助MidjourneyDALL.E2圖7：Midjourney的圖片生成能力展示資料來源：Midjourney官網(wǎng)、國元證券經(jīng)紀（香港）音頻生成模態(tài)：目前人工智能內容生成在音頻生成領域的應用非常廣泛，例如有聲讀物的制作、語音播報、短視頻配音、音樂合成等領域，目前以GPT成。的音頻生成能力展示資料來源：FakeYou官網(wǎng)、國元證券經(jīng)紀（香港）ChatGPT20229Make-A-Video工具就已經(jīng)可以實現(xiàn)文字描述生成短視頻的功能，谷歌公司也推出了分辨率更高、功能更加強大的視頻內容生成軟件，生成的視頻不僅更加清晰，同時能理解并生成不同風格的視頻作品。另外品。另外2024年2月15日向公眾展示了由Sora生成的多個高清視頻，稱該模型能夠生成長達一分鐘的視頻。圖9：SORA的視頻生成能力展示資料來源：SORA官網(wǎng)、國元證券經(jīng)紀（香港）頭部大模型技術在競爭中不斷精進GPT大模型研發(fā)，技術都在周期性迭代，各家AIAI實驗室，包括DeepMindOpenAI和背靠亞馬遜的。其中，被谷歌收購的DeepMindAlphaGo（阿爾法狗）最為家喻戶曉。而大模型是“大算力AI實現(xiàn)從“手AI從實驗室走向規(guī)模化的產業(yè)應Claude3Anthropic公布的測試數(shù)據(jù)來看，目前市場上頭部互聯(lián)網(wǎng)企業(yè)（微軟、谷歌、亞馬遜）token1小時的視頻、11小30,000700,000AI的高度。價格方面，目前由于芯片供應及海外電價等原因，使得價格偏高，但是預計未價格方面，目前由于芯片供應及海外電價等原因，使得價格偏高，但是預計未來隨著技術更新以及算法持續(xù)優(yōu)化，價格有優(yōu)化空間，使得更多用戶能夠享受到科技進步帶來的紅利。大模型通常基于大規(guī)模無標注數(shù)據(jù)進行訓練，掌握某種特征和規(guī)則；基于大模型進行應用開發(fā)時，將大模型進行微調，或者不進行微調，就可以完成多個應用場景的任務。與此同時，大模型具有自監(jiān)督學習能力，不需要或很少需要通過人工標注的數(shù)據(jù)進行訓練，降低了訓練成本，因而能夠加快AI的產業(yè)化進程，降低AI應用的門檻。通過不斷迭代，大模型能夠具有更強的通用性以及更高的智能程度，從而使得AI更廣泛地賦能各行業(yè)應用。評估方案測評能力Claude3OPUSClaude3SonnetClaude5HaikuGPT-4GPT-3.5Gemini1.0UltraGemini1.0proMMLU知識儲備水平86.8079.0075.2086.4070.0083.7071.80GPQA推理能力50.4040.4033.3035.7028.10--GSM8K數(shù)學推理評測評估方案測評能力Claude3OPUSClaude3SonnetClaude5HaikuGPT-4GPT-3.5Gemini1.0UltraGemini1.0proMMLU知識儲備水平86.8079.0075.2086.4070.0083.7071.80GPQA推理能力50.4040.4033.3035.7028.10--GSM8K數(shù)學推理評測95.0092.3088.9092.0057.1094.4096.50MATH解答數(shù)學問題測評60.1043.1038.9052.9034.1053.2032.60MGSM多語言環(huán)境數(shù)學能90.7083.5075.1074.50-79.0063.50HumanEal編碼能力94.9073.0075.9067.0048.1074.4067.70DROP,F1-SCORE文本推理能力83.1078.9078.4080.9064.1082.0086.80BIG-Bench-Hard混合推理能力86.8082.9073.7083.1066.6083.6075.00ARC-Challenge知識問答96.4093.2089.2096.3085.20--HelaSwag常識儲備95.4089.0085.9095.3085.5087.8084.70資料來源：Anthropic、國元證券經(jīng)紀（香港）表3：三大廠商模型付費會員使用價格對比價格對比GPT-4.0TURBO 輸入：10$/1000000token 輸出：20$/1000000tokeOPUS:輸入：15$/10輸出：7Claude3

Sonnet:Gem資料來源：Anthropic、國元證券經(jīng)紀（香港）微軟GPT-4.0橫空出世2015年，特斯拉汽車創(chuàng)始人埃隆·馬斯克，格雷格·布羅克曼(OpenAI聯(lián)合創(chuàng)始人兼總裁)、山姆·阿爾特曼(OpenAI首席執(zhí)行官)、彼得泰爾(Paypal創(chuàng)始人)以及伊利亞·蘇特斯科夫(OpenAI首席科學家)10OpenAIInc.。2016AzureOpenAI提供了算力條件。2018GPT-1，運用幾十億文1.17億個；2019年，GPT-2發(fā)布，模型參數(shù)量提高到15億個，得益于更高的數(shù)據(jù)質量和更大的數(shù)據(jù)規(guī)模，GPT-2的生成能力有明顯提升。2020年，GPT-3參數(shù)量達到了創(chuàng)紀錄的1750GPT-210倍以上，技術路線上則去掉了初代GPTGPT訓練讀過文字和句子后可接續(xù)問題的能力，同時包含了更為廣泛的主題。2023OpenAIGPT-4，支持多模態(tài)且擁有強大的識圖能力。具體提升有以下幾點：GPT-41.8萬億個參數(shù)。模型架構和預訓練技術。GPT-4練系統(tǒng)，結合自我監(jiān)督學習和監(jiān)督學習。GPT-4NLPGPT-3.5如在閱讀理解、文本生成、情感分析等任務上。GPT-4種數(shù)據(jù)類型，這使得它能夠進行更加智能化的自然語言處理任務。應用場景。GPT-4摘要、機器翻譯、問答系統(tǒng)、聊天機器人等。對話和指令性任務處理。GPT-4更加準確地輸出相關回復。圖像處理能力。GPT-4能夠輸入輸出圖像。圖10：GPT經(jīng)過多次升級，目前已經(jīng)能夠滿足更多的內容生成資料來源：OpenAI官網(wǎng)、國元證券經(jīng)紀（香港）表4：GPT4.0在各項功能上有較大突破GPT-3.5 GPT-3.5 GPT-4.0輸出速度較慢有提升，但不明顯分段能力生成幾百字后停止，需要回復“繼續(xù)” 基本連貫答案質量滿足基本需求推理、角色能力有極大提升文字限制最多回復3000字，但幾百字就結束最多2.5w字圖片能力無支持圖片上傳，分析圖片，輸出圖片對接互聯(lián)網(wǎng) 無可以通過第三方插件輸出最新互聯(lián)網(wǎng)信息連續(xù)對話能力最大容量8000個字最大容量64000個模型自然語言模型多模態(tài)模型資料來源：OpenAI官網(wǎng)、國元證券經(jīng)紀（香港）谷歌：Gemini1.5MoE架構超長上下文回溯20242Gemini1.51.0Ultra類似。Gemini1.5還引入了長上下文理解方面的突破性實驗特征。Gemini1.5TransformerMoETransformer充當一個大MoE模型則分為更小的神經(jīng)網(wǎng)絡。根據(jù)給定輸入的類型，MoE模型學會選擇性地僅激活其神經(jīng)網(wǎng)絡中最相關的路徑。人工智能模型“1.5Pro的上下文窗口容量，Gemini1.5Pro可以在生100Token1小時的視頻、的視頻、11小時的音頻、超過30,000行代碼或超過70萬個單詞的代碼庫。對GPT4,Gemini1.5ProGPT-4TurboGPT-4Turbo的128Ktoken128Ktoken50%。相比之下，Gemini1.5Pro128Ktoken70%1MToken60%的召回率。圖11：Gemini1.5在超長冗余信息中依然保持較高召回率資料來源：GoogleDeepMind、國元證券經(jīng)紀（香港）亞馬遜：Claude3邏輯推理能力獨一檔20243Anthropic展開合作，發(fā)布了新一代大語言模型Claude3HaikuSonnetOpus大模型特征如下：快速實時響應，視覺能力提升：Claude3Haiku1tokensarXiv紙等在內的廣泛視覺格式。OpusSonnetHaiku大幅降低了錯誤拒絕的概率，能更精準細膩地理解問題的真實意圖，有效區(qū)分真正威脅與無害內容，減少了不必要拒絕，更智能地處理各種請求。200K超長上下文：Claude3200Ktoken的上下文窗口能力，100token輸入能力。圖12：Claude3號稱花最少得錢獲取最優(yōu)秀的用戶體驗資料來源：Anthropic官網(wǎng)、國元證券經(jīng)紀（香港）文字以外的領域同樣在發(fā)生變革繪圖及電影制作應用場景不斷拓寬AI目前已經(jīng)可以生成可以媲美專業(yè)畫師的作品，生成圖片的效率也從的數(shù)小時到AI繪畫技術現(xiàn)在可以在一定程度上模擬人類藝術家AIAI繪畫技術可能會更加精準繪畫還可能具備更強大的學習和進化能力，能夠不斷學習和優(yōu)化自身的繪畫技巧，AIAI圖13：AI繪畫已經(jīng)從簡單生成圖片已經(jīng)進化到理解和推理繪畫的內容資料來源：國元證券經(jīng)紀（香港）AIOpenAI發(fā)布的人工智能文生視頻SORA技術依托于OpenAI開DALL-E3技術架構，被賦予“擴散變換器”的稱謂，其核心技術采用了SoraSora60秒視頻內容。第二點是盡管對圖14：SORA概念視頻上線，生成內容時長1分鐘資料來源：OpenAI、國元證券經(jīng)紀（香港）AI能夠自行通關游戲，虛擬角色將更擬真GeneralComputerControlGCC)-Cradle，使智能體不依賴任何內部API鏢客23AAI控制NPC同樣扮演的重要的角AI將能夠極大程度提升元宇宙的體驗真實感，《西部世界》將不再是熒幕上的電視劇，而會在元宇宙中得以實現(xiàn)。15：Cradle能直接根據(jù)游戲內的提示和教程生成對應的可執(zhí)行代碼Cradle能夠有效地通過反思來發(fā)現(xiàn)并且糾正錯誤資料來源：Cradle官網(wǎng)、國元證券經(jīng)紀（香港）4.4.未來商業(yè)化場景暢想游戲游戲和元宇宙正互為解藥加速合體，元宇宙帶來游戲技術進步，游戲幫元宇宙技術落地。經(jīng)過多年發(fā)展，除了目前類Roblox元宇宙已經(jīng)成功實現(xiàn)創(chuàng)作生態(tài)、內購、廣告、電商等盈利模式，我們認為未來還有更多的元宇宙游戲類型可以開發(fā)，這包括動作類、角色扮演類、體育類、社交類。這里面我們認為最終的形態(tài)將很有可能會像日本小說家川原礫著作《刀劍神域》系列那樣，會有很多個小的虛擬世界，每個虛擬世界都有自己的特點和特色（中古世紀、超現(xiàn)代、魔法世界等），同時玩家又可以實現(xiàn)虛擬人物的無縫穿越，擁有虛擬又真實的游玩體驗。博彩VR2015年，ALEASlotsMillionVRWEB3.0技術，因此如果在使用結算系統(tǒng)上對接虛擬貨幣將能吸引更多潛在客群。社交認為一些特定的人群將會非常樂意沉浸式體驗這種新型社交方式，例如LGBT、二次元等具有代表性的群體。算力和數(shù)據(jù)共享算力和數(shù)據(jù)共享訓練AIGC模型需要海量的數(shù)據(jù)和強大的算力，這導致成本非常巨大，AIGC行業(yè)龍頭StabilityAI為了訓練其StableDiffusion模型，在AWS中運行了包含4000多個NvidiaA100GPU的集群，

人人文庫> 全部分類> 行業(yè)資料 > 信息產業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

行研新視角：AIGC助推元宇宙進程加速未來商業(yè)化場景探究

文檔簡介

溫馨提示

最新文檔

評論

行研新視角：AIGC助推元宇宙進程加速未來商業(yè)化場景探究

文檔簡介

溫馨提示

最新文檔

評論

相關文檔