2023年數(shù)字人產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2023):好看的皮囊有趣的靈魂_第1頁(yè)
2023年數(shù)字人產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2023):好看的皮囊有趣的靈魂_第2頁(yè)
2023年數(shù)字人產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2023):好看的皮囊有趣的靈魂_第3頁(yè)
2023年數(shù)字人產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2023):好看的皮囊有趣的靈魂_第4頁(yè)
2023年數(shù)字人產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2023):好看的皮囊有趣的靈魂_第5頁(yè)
已閱讀5頁(yè),還剩92頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

序言一數(shù)字人是當(dāng)下最前沿、最時(shí)尚的前沿技術(shù)產(chǎn)品,他不僅有逼真的人的外貌,還能很好地模擬人的行為,而且具備了一定程度的人的思想。數(shù)字人也是一個(gè)技術(shù)和藝術(shù)的完美融合體。在技術(shù)維度上,數(shù)字人是多種前沿科技的集大成者;在藝術(shù)上,數(shù)字人的制作和表現(xiàn)也需要極高的審美。數(shù)字人起源于電影行業(yè),早在本世紀(jì)初,數(shù)字人的相關(guān)技術(shù)就在《指環(huán)王》、《阿凡達(dá)》等電影中大量使用了。隨著游戲科技的發(fā)展,游戲中的一些建模、綁定,動(dòng)捕,渲染、AI語(yǔ)音識(shí)別、圖像識(shí)別等技術(shù)開始賦能數(shù)字人產(chǎn)業(yè),極大地提高了數(shù)字人的制作效能。從2020年開始,大量的網(wǎng)紅數(shù)字人出現(xiàn),尤其2022年冬奧會(huì),數(shù)字人在手語(yǔ)解說,節(jié)目直播等眾多場(chǎng)合亮相,推動(dòng)了公眾對(duì)數(shù)字人的認(rèn)知普及,進(jìn)一步推動(dòng)了產(chǎn)業(yè)的發(fā)展。為全面把握數(shù)字人產(chǎn)業(yè)發(fā)展的前沿趨勢(shì),騰訊研究院、騰訊云智能和創(chuàng)業(yè)黑馬聯(lián)合,先后訪談了數(shù)十家從事數(shù)字人的創(chuàng)新企業(yè),從價(jià)值定位、核心技術(shù)、行業(yè)應(yīng)用、C端發(fā)展、產(chǎn)業(yè)聚集、未來(lái)挑戰(zhàn)等十個(gè)不同維度進(jìn)行剖析,深度解析產(chǎn)業(yè)發(fā)展的現(xiàn)狀,驅(qū)動(dòng)力、挑戰(zhàn)和未來(lái)走向。在研究過程中,項(xiàng)目團(tuán)隊(duì)也發(fā)現(xiàn)了大量的優(yōu)秀產(chǎn)品、解決方案和行業(yè)應(yīng)用。我們發(fā)現(xiàn),數(shù)字人產(chǎn)業(yè)日臻成熟,進(jìn)入了新的發(fā)展階段,其表現(xiàn)為:不同類型的數(shù)字人定位明確,生成工具逐漸完善,制作流程管線化,AI驅(qū)動(dòng)的數(shù)字人已經(jīng)在行業(yè)中大范圍應(yīng)用。在報(bào)告撰寫過程中,我們也在進(jìn)一步思考。誠(chéng)然,數(shù)字人產(chǎn)業(yè)的發(fā)展,不可避免地涉及了更廣泛的產(chǎn)業(yè)和社會(huì)議題,如,數(shù)字人是否是用戶的剛需?是否幫助人們緩解了孤獨(dú)感、帶來(lái)更多溫暖?對(duì)于數(shù)字人這種新技術(shù)的產(chǎn)物,是否也一些肖像權(quán)、倫理道德等潛在問題?我們應(yīng)該如何看待,是否需要讓子彈飛一會(huì)?展望未來(lái),數(shù)字人會(huì)正朝幾個(gè)方向加速迭代:一是外貌更加精致,形象更加逼真,動(dòng)作更加自然,即“皮囊更好看”,跨越恐怖谷效應(yīng)后,會(huì)使人覺得數(shù)字人和真人無(wú)異,有利于建立良好的心理連接;二是隨著AI技術(shù)的不斷完善,數(shù)字人多模態(tài)感知和交互的能力會(huì)得到顯著提升,數(shù)字人未來(lái)有可能具備記憶力和判斷力,從而更加智能,行為和思想上更趨于接近人,擁有“有趣的靈魂”。此外,數(shù)字人產(chǎn)業(yè)的加速發(fā)展,也需要渲染、動(dòng)捕等行業(yè)開發(fā)工具、云渲染等技術(shù)支持體系的進(jìn)一步完善,從而大幅提升制作效能,有效降低制作時(shí)間和成本。目前,很多技術(shù)已經(jīng)接近商業(yè)化大規(guī)模推廣的臨界點(diǎn),數(shù)字人產(chǎn)業(yè)有望進(jìn)入全真互聯(lián)的新階段。在未來(lái),數(shù)字人將可能作為我們的分身,成為數(shù)字世界的交互入口,為我們帶來(lái)更智能、更沉浸的“在場(chǎng)”體驗(yàn)。騰訊研究院院長(zhǎng)

司曉2022年11月01PAGE/序言二伴隨云計(jì)算、AI、5G等數(shù)字技術(shù)的突破進(jìn)展,全真互聯(lián)時(shí)代正在悄然到來(lái),加速線上線下的跨時(shí)空融合。作為全真互聯(lián)的重要入口,數(shù)字人可以推動(dòng)線上和線下更加全面地一體化,打造出沉浸式的“全真”體驗(yàn)與可操作的“互聯(lián)”交互。全真互聯(lián)建基于CV、NLP、ASR、TTS、交互智能等多種人工智能技術(shù),實(shí)現(xiàn)對(duì)真實(shí)世界全面感知、連接、交互,數(shù)字人正是聚合這些技術(shù)的典型應(yīng)用之一。去年,虛擬數(shù)字技術(shù)被納入“十四五”規(guī)劃綱要。在數(shù)實(shí)融合的趨勢(shì)下,科技企業(yè)以技術(shù)進(jìn)步推動(dòng)應(yīng)用創(chuàng)新,加速數(shù)字人的場(chǎng)景化應(yīng)用落地。從產(chǎn)業(yè)需求出發(fā),我們也提出從數(shù)字人智能化升級(jí)為“數(shù)智人”的方向,通過整合語(yǔ)音交互、自然語(yǔ)言理解、圖像識(shí)別等AI能力,連接騰訊豐富的內(nèi)容和服務(wù)生態(tài),助力行業(yè)客戶打造有智能、有形象、可交互的“數(shù)智員工”。過去一年,我們看到這類“數(shù)智員工”以不同形象出現(xiàn)在金融、傳媒、文旅、出行等多個(gè)行業(yè)中,承擔(dān)資訊播報(bào)、文旅導(dǎo)覽、坐席客服等角色。結(jié)合行業(yè)知識(shí)圖譜,“數(shù)智員工”打通感知、驅(qū)動(dòng)、決策等鏈路,通過不斷的自學(xué)習(xí)、自適應(yīng)提升服務(wù)能力,為用戶帶來(lái)更智能、更溫暖的服務(wù),也為產(chǎn)業(yè)、企業(yè)創(chuàng)造出更大的實(shí)用價(jià)值。技術(shù)應(yīng)用的終極價(jià)值是“服務(wù)于人”。伴隨著全真互聯(lián)的到來(lái),未來(lái)數(shù)字人應(yīng)用還將具有哪些可能性,技術(shù)路線會(huì)產(chǎn)生哪些變化?騰訊研究院、騰訊云智能聯(lián)合創(chuàng)業(yè)黑馬,從技術(shù)演進(jìn)、產(chǎn)業(yè)應(yīng)用、政策支持等多方面進(jìn)行調(diào)研分析,形成這份報(bào)告,期望能為行業(yè)帶來(lái)啟發(fā)。也期望未來(lái),與更多行業(yè)伙伴一同,以數(shù)字人的創(chuàng)新應(yīng)用,助力更多產(chǎn)業(yè)在數(shù)智化轉(zhuǎn)型浪潮中以“智”取勝。騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人

吳運(yùn)聲2022年11月02PAGE/序言三互聯(lián)網(wǎng)產(chǎn)業(yè)已經(jīng)來(lái)到了一個(gè)新的臨界點(diǎn),無(wú)論是用戶的使用時(shí)間還是手機(jī)上的硬件水平,都即將達(dá)到現(xiàn)有技術(shù)條件下的生物和物理極限。當(dāng)下,互聯(lián)網(wǎng)需要新的突破,要增加空間上的體驗(yàn)維度,也要大幅增加既定時(shí)間的使用價(jià)值,我們正處在從Web2.0到Web3.0的技術(shù)拐點(diǎn)上。但是這一變化又必然是長(zhǎng)周期的,長(zhǎng)期演化過程中,虛擬世界需要有一個(gè)抓手,需要有一個(gè)跟現(xiàn)實(shí)世界的映射點(diǎn),這就是數(shù)字人。在Web3.0的世界里,數(shù)字人是每一個(gè)用戶創(chuàng)建的唯一身份的基本工具。與不同行業(yè)融合的深度與廣度、數(shù)字資產(chǎn)的確權(quán)保護(hù)、面向C端產(chǎn)品化的能力構(gòu)成了不同數(shù)字人企業(yè)之間競(jìng)爭(zhēng)的主要壁壘。創(chuàng)業(yè)黑馬作為國(guó)內(nèi)唯一一家在創(chuàng)業(yè)板上市的創(chuàng)新型孵化器,創(chuàng)立14年來(lái),建立了一個(gè)由遍及全國(guó)的77個(gè)組成的產(chǎn)業(yè)集群,形成了覆蓋不同產(chǎn)業(yè)、不同發(fā)展階段企業(yè)的加速生態(tài)。迄今為止,黑馬服務(wù)了2萬(wàn)多家創(chuàng)業(yè)公司,其中有20多家公司在海內(nèi)外上市,還有50多家獨(dú)角獸企業(yè)。2022年3月,創(chuàng)業(yè)黑馬集團(tuán)聯(lián)合多家產(chǎn)學(xué)研機(jī)構(gòu),共同發(fā)起“朝陽(yáng)黑馬元宇宙數(shù)字人”,也是在北京市經(jīng)信局、朝陽(yáng)區(qū)政府的大力支持下打造的最具前沿性的一個(gè)產(chǎn)業(yè),目前也是黑馬唯一一個(gè)虛實(shí)結(jié)合的實(shí)體產(chǎn)業(yè)。截止目前招募2期,共有100家數(shù)字人企業(yè)入駐。實(shí)體

落地在朝陽(yáng)區(qū)東湖歡樂頌,首期15000平,并獲得了北京市授予的“北京市數(shù)字人基地”稱號(hào)。此次,創(chuàng)業(yè)黑馬、騰訊研究院和騰訊云智能聯(lián)手對(duì)數(shù)字人產(chǎn)業(yè)的典型企業(yè)進(jìn)行了深度調(diào)研與跟蹤訪談,結(jié)合騰訊研究院的產(chǎn)業(yè)洞察、騰訊云智能的專業(yè)支持與黑馬的產(chǎn)業(yè)服務(wù)能力,共同形成了《數(shù)字人產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2023)》。我們期待,這份報(bào)告能為行業(yè)提供一些啟發(fā)與思考,也希望未來(lái)有更多的主體,能夠參與到數(shù)字人產(chǎn)業(yè)生態(tài)的建設(shè)中來(lái),我們共同開啟互聯(lián)網(wǎng)產(chǎn)業(yè)新時(shí)代的大門。創(chuàng)業(yè)黑馬集團(tuán)董事長(zhǎng)

牛文文2022年11月22日03PAGE/推薦語(yǔ)虛擬人類正在逐步走入真實(shí)人類的生活。它的背后,是多領(lǐng)域技術(shù),包括渲染建模、內(nèi)容生成算法,計(jì)算機(jī)視覺,ASR/NLP,新終端/交互技術(shù)等等的多年發(fā)展、積累和成熟,而它的前方,則是內(nèi)容制作大眾化,用戶服務(wù)自動(dòng)化,社交形態(tài)多樣化,IP打造工業(yè)化等等非常具體和廣闊的應(yīng)用前景,甚至有機(jī)會(huì)成為一種新的藝術(shù)創(chuàng)作形態(tài)(想象一下《三體》中羅輯在想象中創(chuàng)造小說女主角的過程,這個(gè)過程有可能通過虛擬人的創(chuàng)作工具具象化,而非簡(jiǎn)單的形成文字小說),這些令人興奮的前景使得數(shù)字人逐步成為一個(gè)越來(lái)越值得關(guān)注和投入的領(lǐng)域。這份報(bào)告從技術(shù)發(fā)展、應(yīng)用場(chǎng)景和社會(huì)價(jià)值等多個(gè)角度對(duì)虛擬數(shù)字人這一新生事物進(jìn)行了詳實(shí)的分析研究,具備非常高的參考價(jià)值。騰訊公司副總裁

曾宇目前,我國(guó)數(shù)字人商業(yè)化應(yīng)用場(chǎng)景越來(lái)越豐富,數(shù)字人已經(jīng)在金融、傳媒、游戲、文旅等行業(yè)做出快速探索。這得益于數(shù)字人產(chǎn)業(yè)底層技術(shù)、應(yīng)用平臺(tái)的高速發(fā)展,從技術(shù)開發(fā)到落地應(yīng)用的產(chǎn)業(yè)鏈也正趨于完善。這其中,我們看到數(shù)字人也逐漸進(jìn)化為融合語(yǔ)言理解能力、表達(dá)能力和智能交互能力的服務(wù)型數(shù)智人。伴隨交互智能技術(shù)的加速發(fā)展,相信數(shù)智人還將促進(jìn)更高效的產(chǎn)業(yè)協(xié)作,達(dá)成更優(yōu)質(zhì)的用戶體驗(yàn)。這份報(bào)告經(jīng)由深入的行業(yè)調(diào)研,展現(xiàn)了數(shù)字人行業(yè)產(chǎn)、學(xué)、研領(lǐng)域?qū)<业囊娊?,?duì)技術(shù)發(fā)展趨勢(shì)、應(yīng)用落地方向都提出了前瞻性看法,給予啟發(fā)。騰訊云副總裁、騰訊云智能平臺(tái)負(fù)責(zé)人李學(xué)朝04PAGE/推薦語(yǔ)此報(bào)告深入淺出地分析了數(shù)字人技術(shù)的現(xiàn)狀,并從行業(yè)、技術(shù)、應(yīng)用等相關(guān)角度提出了對(duì)未來(lái)的暢想。橫觀整個(gè)行業(yè),AI賦能的三維重建算法以及生成AI技術(shù)讓數(shù)字人擁有更加“逼真”和“好看”的皮囊。然而,皮囊只是基礎(chǔ)。如果想要使數(shù)字人技術(shù)的應(yīng)用場(chǎng)景更加廣闊,數(shù)字人需要有“有趣”的靈魂。什么樣的靈魂才是“有趣”的?數(shù)字人除了“有趣”以外是否需要擁有其他特質(zhì)去更有效地解決物理世界的人在安全感、歸屬感、幸福感的需求?與此同時(shí),社會(huì)各界對(duì)數(shù)字人技術(shù)的應(yīng)用有各種擔(dān)憂(如,真實(shí)世界里人與人的交流已日趨減少,社會(huì)信任日趨喪失,數(shù)字人技術(shù)的應(yīng)用是否會(huì)加深已有問題?)。特別是數(shù)字人技術(shù)目前過于單一的應(yīng)用場(chǎng)景,并沒能帶來(lái)良好的示范。例如在使用最多的廣告行業(yè)中,擁有完美皮膚和黃金五官比例的虛擬人,給年輕人帶來(lái)了更多的容貌焦慮。深入探討這一系列問題將是數(shù)字人“社會(huì)化”發(fā)展的基本前提。IEEEFellow、ACM杰出科學(xué)家上??萍即髮W(xué)信息科學(xué)與技術(shù)學(xué)院教授、執(zhí)行院長(zhǎng)

虞晶怡數(shù)字人風(fēng)起云涌,多項(xiàng)跨領(lǐng)域技術(shù)的綜合應(yīng)用成熟是推動(dòng)數(shù)字人發(fā)展的底層動(dòng)力基礎(chǔ)。而我們也能看到,越來(lái)越多的新興技術(shù)剛一推出就有可能被應(yīng)用在數(shù)字人領(lǐng)域內(nèi),推動(dòng)著形象更加優(yōu)化、實(shí)時(shí)互動(dòng)更具趣味,同時(shí),背后的制作也正在追求更高的效率甚至顛覆原有的制作路徑。本報(bào)告對(duì)數(shù)字人背后錯(cuò)綜復(fù)雜的各項(xiàng)技術(shù)和在不同行業(yè)的應(yīng)用場(chǎng)景都進(jìn)行了詳實(shí)調(diào)研,值得技術(shù)開發(fā)充分學(xué)習(xí)了解市場(chǎng)應(yīng)用和跨領(lǐng)域技術(shù),以綜合更低成本、更高效果、更具有實(shí)時(shí)互動(dòng)性的技術(shù)為目標(biāo)而努力。Style3D首席科學(xué)家、原美國(guó)俄亥俄州立大學(xué)終身教授2023年ACM計(jì)算機(jī)動(dòng)畫研討會(huì)(SCA)論文主席、視覺計(jì)算期刊(TVCJ)副主編

王華民05PAGE/特別感謝感謝以下專家在此次研究中給予的指導(dǎo)和支持

(按姓氏拼音排序)北京中科深智科技有限公司

CEO

成維忠海南超次元數(shù)碼科技有限公司

CEO

陳堅(jiān)浙江凌迪數(shù)字科技有限公司

數(shù)字戰(zhàn)略總監(jiān)

陳夢(mèng)婕重慶上丞科技有限公司

CEO

方桐北京海百川科技有限公司

CEO

孫博深圳市達(dá)旦數(shù)生科技有限公司

聯(lián)合創(chuàng)始人

孫立發(fā)深圳臻像科技有限公司

COO

孫雪君數(shù)字王國(guó)虛谷未來(lái)科技(北京)有限公司

CEO

唐佳嫻北京本壹數(shù)字信息技術(shù)有限公司

CEO

陶茜影眸科技(上海)有限公司

CEO

吳迪北京國(guó)承萬(wàn)通信息科技有限公司

創(chuàng)始人、CEO

郭成北京容積視覺科技有限公司

CEO

郭松杰Nreal

副總裁

呼顯龍上海積鋆文化傳媒有限公司

創(chuàng)始人

王思懿唯物科技(杭州)有限公司

CEO

吳靖仇一隅千象

CEO

魏娉婷杭州優(yōu)鏈時(shí)代科技有限公司

創(chuàng)始人CEO

蔣亞洪神秘綠洲文化科技(深圳)有限公司

CEO

賈田北京諾亦騰科技有限公司

商務(wù)負(fù)責(zé)人

孔勇花臉數(shù)字技術(shù)有限公司

創(chuàng)始人

劉威凌云光技術(shù)股份有限公司

立體視覺事業(yè)部總經(jīng)理

熊偉世優(yōu)(北京)科技有限公司

合伙人

燕建軍&紫郁北京梅小西科技文化有限公司

CEO

尹玫北京聚力維度科技有限公司

CEO

趙天奇梅蘭芳文化科技有限公司

聯(lián)合創(chuàng)始人、CEO

張宏飛北京圣承科技有限公司

CEO

張勝藍(lán)色光標(biāo)元宇宙業(yè)務(wù)負(fù)責(zé)人&藍(lán)色宇宙技術(shù)生態(tài)合伙人

劉方銘北京云舶在線科技有限公司

創(chuàng)始人&CEO

梅嵩深圳位形空間科技有限公司

CEO

彭俊熙杭州納視文化創(chuàng)意有限公司

創(chuàng)始人

孫堅(jiān)06PAGE/目

錄發(fā)展現(xiàn)狀

產(chǎn)業(yè)趨勢(shì)應(yīng)用案例07PAGE/08PAGE/數(shù)字人定義數(shù)字人是指以數(shù)字形式存在于數(shù)字空間中,具有擬人或真人的外貌、行為和特點(diǎn)的虛擬人物,也稱之為虛擬形象、數(shù)字虛擬人、虛擬數(shù)字人等。數(shù)字人的核心技術(shù)主要包括計(jì)算機(jī)圖形學(xué)、動(dòng)作捕捉、圖像渲染、AI等。數(shù)字人可以打造更完美的人設(shè),為品牌帶來(lái)正向價(jià)值?;ヂ?lián)網(wǎng)、金融、電商平臺(tái)、消費(fèi)品牌、汽車出行等領(lǐng)域紛紛推出數(shù)字人,用于品牌營(yíng)銷、智能客服等方向。數(shù)字人可以按照不同維度進(jìn)行分類:???根據(jù)人物圖形資源的維度,數(shù)字人可分為2D和3D兩大類,從外形上又可分為2D真人、2D卡通、3D卡通、3D風(fēng)格化、3D寫實(shí)、3D超寫實(shí)、3D高保真等多種。根據(jù)驅(qū)動(dòng)的維度,可分為真人驅(qū)動(dòng)和AI驅(qū)動(dòng)兩種。根據(jù)商業(yè)和功能維度,可分為內(nèi)容/IP型、功能服務(wù)型和虛擬分身等三種。3D卡通3D風(fēng)格化3D寫實(shí)3D超寫實(shí)3D高保真2D真人2D卡通類

型示

例創(chuàng)建方式真人采集2D繪制3D建模3D建模3D建模真人掃描+3D建模+美型加工真人掃描+3D建模+1:1復(fù)刻09PAGE/爆點(diǎn)事件推動(dòng)數(shù)字人產(chǎn)業(yè)被用戶認(rèn)知,底層是技術(shù)推動(dòng)、用戶需求、生態(tài)建設(shè)和標(biāo)準(zhǔn)等支撐網(wǎng)紅數(shù)字人頻出資本不斷投入專項(xiàng)政策出臺(tái)認(rèn)知支撐網(wǎng)紅數(shù)字人大量出現(xiàn),推動(dòng)數(shù)字人在C端用戶的認(rèn)知和普及。資本不斷投入,數(shù)字人賽道成為融資領(lǐng)域熱點(diǎn),用戶感知度不斷提升。數(shù)字人專項(xiàng)政策發(fā)布,支持行業(yè)健康有序發(fā)展,影響力進(jìn)一步提升。技

術(shù)第一動(dòng)力CG、光場(chǎng)采集、動(dòng)捕、AI等關(guān)鍵技術(shù)持續(xù)迭代,推動(dòng)產(chǎn)品升級(jí)。10PAGE/網(wǎng)紅數(shù)字人推動(dòng)C端直觀認(rèn)知和概念普及??星瞳、艾靈等網(wǎng)紅數(shù)字人的爆紅和超級(jí)QQ秀為代表的虛擬空間中虛擬分身產(chǎn)品大量出現(xiàn),推動(dòng)數(shù)字人在C端用戶中的認(rèn)知普及。?

數(shù)字人熱點(diǎn)事件?

虛擬分身推廣進(jìn)入2022年以來(lái),數(shù)字人在諸多應(yīng)用場(chǎng)景大放光彩,特別是在北京冬奧會(huì)的開幕式表演、氣象播報(bào)、手語(yǔ)解說中頻頻現(xiàn)身,使其用戶基礎(chǔ)不斷擴(kuò)大。?

重大賽事活動(dòng)中數(shù)字人虛擬偶像--星瞳和平精英虛擬解說--占樂樂AI歌姬--艾靈數(shù)字航天員--小諍3D手語(yǔ)數(shù)智人--聆語(yǔ)超級(jí)QQ秀11PAGE/融資事件頻繁及專項(xiàng)政策的出臺(tái)進(jìn)一步加深對(duì)產(chǎn)業(yè)的認(rèn)知2021年,有20家以上的數(shù)字人企業(yè)獲得新一輪融資,2022年,數(shù)字人繼續(xù)成為融資熱點(diǎn)領(lǐng)域。??IMVUAPP完成戰(zhàn)略投資,金額3500萬(wàn)美元中科深智完成A輪融資,金額數(shù)千萬(wàn)人民幣2021年1月2022年1月????世悅星承完成Pre-A輪融資2022年7月,在2022全球數(shù)字經(jīng)濟(jì)大會(huì)上,北京市發(fā)布了《北京市促進(jìn)數(shù)字人產(chǎn)業(yè)創(chuàng)新發(fā)展行動(dòng)計(jì)劃(2022-2025年)》并進(jìn)行詳細(xì)解讀。該計(jì)劃是國(guó)內(nèi)出臺(tái)的首個(gè)數(shù)字人產(chǎn)業(yè)專項(xiàng)支持政策,從構(gòu)建數(shù)字人全鏈條技術(shù)體系、培育標(biāo)桿應(yīng)用項(xiàng)目、優(yōu)化數(shù)字人產(chǎn)業(yè)生態(tài)等方面為支持?jǐn)?shù)字人產(chǎn)業(yè)發(fā)展提供了指引,進(jìn)一步加深數(shù)字人在用戶中的認(rèn)知。慧夜科技Pre-A輪融資,金額數(shù)百萬(wàn)美元燃麥科技AYAYI完成Pre-A輪融資,金額數(shù)千萬(wàn)人民幣博宇蓋樂完成A輪融資,金額1000萬(wàn)美元?創(chuàng)壹科技完成股權(quán)融資,金額千萬(wàn)級(jí)人民幣??ISEC完成戰(zhàn)略投資,金額1億日元2月中科深智完成A+輪融資,金額數(shù)千萬(wàn)人民幣3月4月??萬(wàn)象文化完成A輪融資,金額數(shù)百萬(wàn)美元代碼乾坤完成戰(zhàn)略融資,金額一億元??匯智互娛智能完成天使輪融資,金額千萬(wàn)級(jí)人民幣次世文化完成A+輪融資2月??STEPVR完成A+輪、B輪融資,金額近億元云舶科技完成A輪融資,金額數(shù)百萬(wàn)美元3月4月?魔琺科技Xmov完成B輪融資,金額2000萬(wàn)美元5月6月??魔琺科技Xmov完成C輪融資,金額1.1億美元影眸科技完成Pre-A輪融資,金額數(shù)千萬(wàn)人民幣??燃麥科技AYAYI完成Pre-A輪融資,金額數(shù)百萬(wàn)人民幣追一科技完成戰(zhàn)略融資,金額數(shù)億人民幣???小冰完成A輪融資,金額數(shù)億人民幣次世文化完成A輪融資,金額500萬(wàn)美元云舶科技完成A+輪融資,金額數(shù)百萬(wàn)美元??心識(shí)宇宙完成天使輪融資,金額數(shù)千萬(wàn)元八點(diǎn)八數(shù)字完成Pre-A輪融資,金額數(shù)百萬(wàn)元6月7月8月?半人貓完成天使輪融資,金額千萬(wàn)級(jí)人民幣????虛擬影業(yè)完成PreA輪融資,金額超千萬(wàn)人民幣ACE虛擬歌姬完成Pre-A輪融資,金額數(shù)百萬(wàn)美元次元潮玩完成天使輪融資,金額數(shù)百萬(wàn)人民幣追一科技完成戰(zhàn)略融資,金額未披露9月??萬(wàn)像文化完成戰(zhàn)略融資,金額未披露10月11月12月次世文化完成A+輪融資,金額數(shù)百萬(wàn)美元??中科深智完成B輪融資,金額千萬(wàn)級(jí)美元萬(wàn)像文化完成A+輪融資,金額數(shù)千萬(wàn)美元??相芯科技完成戰(zhàn)略融資,金額7000萬(wàn)人民幣頭號(hào)偶像完成戰(zhàn)略融資,金額未披露12PAGE/?世悅星承完成天使輪融資,金額1000萬(wàn)人民幣技術(shù)發(fā)展是數(shù)字人第一推動(dòng)力??數(shù)字人是多技術(shù)綜合產(chǎn)物,數(shù)字人近年的發(fā)展的共同成熟。于CG(ComputerGraphics,利用計(jì)算機(jī)進(jìn)行視覺設(shè)計(jì)和生產(chǎn))、語(yǔ)音識(shí)別、圖像識(shí)別、動(dòng)捕等相關(guān)技術(shù)數(shù)字人具有以下三方面特征,分別是由建模、物理仿真、渲染、動(dòng)捕、面捕和AI等技術(shù)支持,各項(xiàng)技術(shù)不斷迭代,推動(dòng)數(shù)字人制作效能和智能水平提升,其中通過AI技術(shù)實(shí)現(xiàn)高度擬人化的“思想和行為”,進(jìn)而給用戶帶來(lái)親切感、參與感、互動(dòng)感和沉浸感是未來(lái)發(fā)展的重要方向。(1)人的外觀,具有人的相貌、性別和性格等人物特征。(2)人的行為,具有語(yǔ)言、面部表情和肢體動(dòng)作的能力。(3)人的思想,具有識(shí)別外界環(huán)境,并與人交流互動(dòng)的能力。建模物理仿真渲染人的外觀數(shù)字人技術(shù)外在內(nèi)在形似人神似人好看的皮囊有趣的靈魂動(dòng)捕面捕人的行為人的思想AI驅(qū)動(dòng)AI驅(qū)動(dòng)13PAGE/游戲科技不斷賦能數(shù)字人制作數(shù)字人技術(shù)游戲技術(shù)角色形象角色制作角色表達(dá)建模綁定等建模綁定等數(shù)字人通用框架動(dòng)畫生成模塊語(yǔ)言生成模塊語(yǔ)音生成、動(dòng)畫生成(驅(qū)動(dòng)、渲染)等動(dòng)作捕捉動(dòng)畫渲染音視頻合成顯示模塊引擎應(yīng)用AR/VR技術(shù)合成顯示終端顯示技術(shù)語(yǔ)音語(yǔ)義識(shí)別、人臉識(shí)別、動(dòng)作識(shí)別等識(shí)別感知分析決策AI語(yǔ)音理解AI圖像識(shí)別交互模塊知識(shí)庫(kù)、對(duì)話管理等14PAGE/Z世代用戶崛起數(shù)字人和虛擬空間為互聯(lián)網(wǎng)原生一代提供新體驗(yàn)??作為互聯(lián)網(wǎng)原生一代,Z世代用戶增長(zhǎng)速度較快,規(guī)模已達(dá)到3.42億,已成為移動(dòng)互聯(lián)網(wǎng)的重度用戶,他們對(duì)社交、視頻、音樂、網(wǎng)購(gòu)等興趣愛好使用深度和廣度的上遙遙領(lǐng)先于全網(wǎng)平均水平。Z世代對(duì)新形式的互聯(lián)網(wǎng)產(chǎn)品需求更大,而數(shù)字人突出人物個(gè)性,強(qiáng)調(diào)體驗(yàn)感和交互性,與Z世代用戶可以產(chǎn)生情感鏈接,并產(chǎn)生情緒共振和文化認(rèn)同。特別是數(shù)字人和虛擬空間相結(jié)合,孵化新玩法,帶來(lái)新體驗(yàn),因此Z世代用戶為數(shù)字人的核心用戶群體。單位:億Z世代用戶規(guī)模變化趨勢(shì)3.423.142.772.53年齡分布2.131%1%2%2%19%2018-062019-062020-062021-062022-062021年6月Z世代人群興趣偏好活躍占比

TOP1091.3%76%83.9%

82.6%74.6%71.6%

70.0%54.7%49.2%

48.7%41.8%17歲及以下18-24歲25-30歲保密31-35歲36歲及以上社交視頻音樂網(wǎng)購(gòu)團(tuán)購(gòu)游戲?qū)W習(xí)閱讀時(shí)尚辦公Z世代,通常是指1995年后出生的一代人Source:QuestMobileGROWTH用戶畫像標(biāo)簽數(shù)據(jù)庫(kù)2021年6月&2022年6月星瞳粉絲:核心為18-24歲群體,達(dá)76%Source:星瞳用戶畫像標(biāo)簽15PAGE/頭部企業(yè)從工具、平臺(tái)和應(yīng)用多維度入局引領(lǐng)數(shù)字人產(chǎn)業(yè)發(fā)展頭部企業(yè)通過打造數(shù)字人制作工具和平臺(tái)、數(shù)字人應(yīng)用平臺(tái)等引領(lǐng)產(chǎn)業(yè)快速發(fā)展Epic

Games

MetaHuman騰訊云智能播報(bào)數(shù)智人平臺(tái)NVIDIA

OmniverseMeta

Horizon

Worlds

社交平臺(tái)16PAGE/標(biāo)準(zhǔn)制定引導(dǎo)產(chǎn)業(yè)規(guī)范發(fā)展??針對(duì)數(shù)字人通用技術(shù),通過可信能力、指標(biāo)和評(píng)估能力等對(duì)產(chǎn)品進(jìn)行規(guī)范和引導(dǎo),支持產(chǎn)業(yè)健康發(fā)展。在垂直行業(yè)中,如金融行業(yè),在證券期貨、金融應(yīng)用等方向陸續(xù)出臺(tái)相關(guān)應(yīng)用建設(shè)指南,推動(dòng)落地應(yīng)用。類型組織項(xiàng)目名稱行業(yè)標(biāo)準(zhǔn)行業(yè)標(biāo)準(zhǔn)金標(biāo)委證券分委會(huì)北京金融科技產(chǎn)業(yè)聯(lián)盟《證券期貨業(yè)虛擬數(shù)字人應(yīng)用建設(shè)指南》《虛擬數(shù)字人金融應(yīng)用建設(shè)指南》團(tuán)體標(biāo)準(zhǔn)行業(yè)標(biāo)準(zhǔn)團(tuán)體標(biāo)準(zhǔn)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟《虛擬數(shù)字人指標(biāo)要求和評(píng)估方法》系列標(biāo)準(zhǔn)《虛擬數(shù)字人指標(biāo)要求和評(píng)估方法》系列標(biāo)準(zhǔn)《數(shù)字人系統(tǒng)基礎(chǔ)可信能力要求及評(píng)估方法》團(tuán)體標(biāo)準(zhǔn)中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)《人工智能

深度合成圖像系統(tǒng)技術(shù)規(guī)范》《Requirementsandevaluationmethodsof

noninteractive2Dreal-persondigitalhumanapplicationsystems》國(guó)際標(biāo)準(zhǔn)ITU-T(國(guó)際電信聯(lián)盟)《Frameworkandmetricsfordigitalhumanapplicationsystems》發(fā)布或制定過程中的數(shù)字人相關(guān)標(biāo)準(zhǔn)17PAGE/數(shù)字人市場(chǎng)將呈現(xiàn)高速增長(zhǎng)態(tài)勢(shì)數(shù)字人市場(chǎng)增長(zhǎng)迅速,根據(jù)市場(chǎng)分析機(jī)構(gòu)預(yù)測(cè),其中AI數(shù)字人市場(chǎng)規(guī)模在2026年將達(dá)到102.4億元。中國(guó)AI數(shù)字人市場(chǎng)規(guī)模預(yù)測(cè),2021-2026IDC在《中國(guó)AI數(shù)字人市場(chǎng)現(xiàn)狀與機(jī)會(huì)分析,2022》報(bào)告中預(yù)計(jì),到2026年中國(guó)AI數(shù)字人市場(chǎng)規(guī)模將達(dá)到102.4

億元單位:億元人民幣:IDC中國(guó),202218PAGE/19PAGE/十大趨勢(shì)?

價(jià)值定位?

技術(shù)迭代?

AI賦能?

C端模式?

硬件載體?

發(fā)展路徑?

產(chǎn)業(yè)集聚?

合規(guī)前置?

融合發(fā)展?

行業(yè)應(yīng)用20PAGE/數(shù)字人產(chǎn)業(yè)發(fā)展十大趨勢(shì)價(jià)值定位數(shù)字人制造和運(yùn)營(yíng)服務(wù)的B端C端模式UGC數(shù)字人將加速出現(xiàn),成市場(chǎng)不斷擴(kuò)大,將面向更廣大的C端用戶提供服務(wù),各類數(shù)字人價(jià)值定位和商業(yè)模式有差異。為未來(lái)產(chǎn)業(yè)的增量空間硬件載體技術(shù)迭代數(shù)字人仍以2D顯示設(shè)備為主,技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人3D顯示設(shè)備成為特定領(lǐng)域的新解法形似人,制作效能將繼續(xù)提升發(fā)展路徑AI

賦能在場(chǎng)是數(shù)字人發(fā)展的高級(jí)階段,AI技術(shù)驅(qū)動(dòng)數(shù)字人多模態(tài)交互將與應(yīng)用場(chǎng)景深度耦合更神似人,并逐步覆蓋數(shù)字人全流程產(chǎn)業(yè)聚集融合發(fā)展藝術(shù)和技術(shù)雙輪驅(qū)動(dòng),北京有望成為產(chǎn)業(yè)新高地?cái)?shù)字人技術(shù)與SLAM、3D交互、體積視頻、空間音頻等技術(shù)深度融合,渲染將從本地到云端合規(guī)前置數(shù)字人保護(hù)及行業(yè)合規(guī)體行業(yè)應(yīng)用千行千面的數(shù)字人將成為人機(jī)系需同步建設(shè),推動(dòng)實(shí)現(xiàn)可用、可靠、可知、可控交互新入口,但深度上仍需挖掘騰訊研究院、騰訊云智能和創(chuàng)業(yè)黑馬:《數(shù)字人產(chǎn)業(yè)發(fā)展趨勢(shì)報(bào)告(2023)》21PAGE/趨勢(shì)1:數(shù)字人制造和運(yùn)營(yíng)服務(wù)的B端市場(chǎng)不斷擴(kuò)大,將面向更廣大的C端用戶提供服務(wù),各類數(shù)字人價(jià)值定位和商業(yè)模式有差異數(shù)字人的最終服務(wù)對(duì)象為C端用戶,在B端的應(yīng)用領(lǐng)域從電影動(dòng)畫向廣告營(yíng)銷、電商直播、虛擬偶像等領(lǐng)域不斷擴(kuò)展。未來(lái),以虛擬分身為代表的應(yīng)用潛力巨大。從需求角度,數(shù)字人制造和運(yùn)營(yíng)服務(wù)在B端市場(chǎng)不斷擴(kuò)大領(lǐng)域和規(guī)模,面向更廣大的C端用戶提供服務(wù),而制作方式也從PGC向UGC發(fā)展。?

在20世紀(jì)80年代電影、動(dòng)畫等領(lǐng)域早期的手繪數(shù)字人最先出現(xiàn),伴隨著21世紀(jì)初計(jì)算機(jī)動(dòng)畫和動(dòng)捕技術(shù)的成熟,內(nèi)容/IP型數(shù)字人大量應(yīng)用在影視行業(yè)中,主要是增強(qiáng)影視中觀眾的體驗(yàn)效果,隨后逐漸在文娛、市場(chǎng)營(yíng)銷、文旅、虛擬偶像等場(chǎng)景推廣應(yīng)用。?

近年,伴隨AI驅(qū)動(dòng)技術(shù)的成熟,功能服務(wù)型數(shù)字人陸續(xù)出現(xiàn),主要應(yīng)用于行業(yè)服務(wù)場(chǎng)景,如金融數(shù)字人客服、傳媒數(shù)字人口播等。?

在虛擬空間中的虛擬分身數(shù)字人大范圍出現(xiàn)相對(duì)較晚,虛擬空間的技術(shù)和產(chǎn)品還在發(fā)展中,待產(chǎn)業(yè)進(jìn)一步完善,此類應(yīng)用潛力巨大,是數(shù)字人市場(chǎng)的增量空間。?

第一需求方:影視、游戲公司等B端廠?

制作方式:PGC?

第一需求方:文娛公司等B端廠商?

制作方式:PGC?

第一需求方:各行各業(yè)等B端企業(yè)?

制作方式:PGC?

第一需求方:C端用戶?

制作方式:UGC影視游戲文娛產(chǎn)業(yè)企業(yè)服務(wù)虛擬分身增強(qiáng)體驗(yàn)效果打造虛擬偶像,塑造IP價(jià)值提升技術(shù)服務(wù),為企業(yè)降本增效虛擬空間的分身80年底初21世紀(jì)初2018年-現(xiàn)在內(nèi)容IP型:網(wǎng)紅型數(shù)字人大量出現(xiàn)。功能服務(wù)性:以金融、傳媒作為起點(diǎn),進(jìn)入行業(yè)服務(wù)。虛擬分身:虛擬場(chǎng)景中虛擬分身大量出現(xiàn)電影制作動(dòng)畫方向游戲、電影制作方向形態(tài):內(nèi)容IP型形態(tài):內(nèi)容IP型/功能服務(wù)型/虛擬分身技術(shù)路線

·投入成本

·動(dòng)捕設(shè)備、計(jì)算機(jī)動(dòng)畫技術(shù)路線

·

傳統(tǒng)手繪技術(shù)路線

·

動(dòng)捕設(shè)備、AI驅(qū)動(dòng)算法,驅(qū)動(dòng)模型,2D驅(qū)動(dòng),3DAI建模投入成本

·

人力、GPU,數(shù)據(jù)采集,算法投入投入成本

·人工密集型驅(qū)動(dòng),學(xué)習(xí)和管理的成本高,單個(gè)電影制作,投入幾百萬(wàn)至千萬(wàn)美金不等手工繪本內(nèi)容生產(chǎn),效率較低、效果較差A(yù)I驅(qū)動(dòng)部分不再依賴人力和設(shè)備,減少大規(guī)模商用成本22PAGE/趨勢(shì)1:數(shù)字人制造和運(yùn)營(yíng)服務(wù)的B端市場(chǎng)不斷擴(kuò)大,將面向更廣大的C端用戶提供服務(wù),各類數(shù)字人價(jià)值定位和商業(yè)模式有差異??三種數(shù)字人(內(nèi)容/IP型、功能服務(wù)型和虛擬分身型)在產(chǎn)品定位、應(yīng)用行業(yè)、核心價(jià)值、競(jìng)爭(zhēng)力等方面存在顯著差異。其中,內(nèi)容/IP型主要應(yīng)用于影視、文娛和市場(chǎng)營(yíng)銷等場(chǎng)景,功能服務(wù)型主要應(yīng)用于行業(yè)服務(wù)場(chǎng)景。這兩種類型數(shù)字人制作方式以PGC為主,從數(shù)字人制作廠商角度,更多是面向B端。?此外,虛擬分身類型數(shù)字人(Avatar)一般為C端用戶制作虛擬形象,應(yīng)用于C端用戶在虛擬空間中的形象分身和代理。按照商業(yè)和功能應(yīng)用維度劃分產(chǎn)品分類制作方式產(chǎn)品定位代表應(yīng)用應(yīng)用行業(yè)內(nèi)容/IP型PGC為主功能服務(wù)型PGC為主虛擬分身(Avatar)UGC為主偶像,用于娛樂、科教等虛擬偶像、數(shù)字航天員、品牌代言人電影、電視、綜藝、科普紀(jì)錄片等數(shù)字員工,提供擬人化服務(wù)虛擬主播、數(shù)字客服、數(shù)字專家金融、文旅、零售、直播在虛擬空間中的身份代理游戲身份如VRChat、虛擬演唱會(huì)觀眾游戲、VR應(yīng)用人工作的增強(qiáng)和輔助,降低企業(yè)成本,提供自動(dòng)化、智能化和標(biāo)準(zhǔn)化服務(wù)核心價(jià)值虛擬IP/偶像身份的具象化虛擬空間中的交互入口,推動(dòng)虛擬內(nèi)容生產(chǎn)核心競(jìng)爭(zhēng)力驅(qū)動(dòng)方式形象的藝術(shù)性、IP的打造和運(yùn)營(yíng)能力中之人驅(qū)動(dòng)智能交互能力沉浸化、實(shí)時(shí)化、體驗(yàn)感中之人驅(qū)動(dòng)/指令驅(qū)動(dòng)AI驅(qū)動(dòng)/中之人驅(qū)動(dòng)虛擬空間虛擬偶像、虛擬網(wǎng)紅虛擬代言人、虛擬品牌官...虛擬主持人虛擬主播虛擬客服、虛擬導(dǎo)游虛擬專家、虛擬講解員...超級(jí)助手/入口...真實(shí)世界建模精細(xì)化內(nèi)容多元化交互實(shí)時(shí)化載體多樣化產(chǎn)業(yè)融合

知識(shí)圖譜深化

全能化生產(chǎn)平臺(tái)化內(nèi)容場(chǎng)景化AI交互情感化演進(jìn)方向底層邏輯增強(qiáng)連接23PAGE/趨勢(shì)1:數(shù)字人制造和運(yùn)營(yíng)服務(wù)的B端市場(chǎng)不斷擴(kuò)大,將面向更廣大的C端用戶提供服務(wù),各類數(shù)字人價(jià)值定位和商業(yè)模式有差異?

IP運(yùn)營(yíng),客戶服務(wù)和流量變現(xiàn)是當(dāng)前主要的三種商業(yè)模式:內(nèi)容/IP型數(shù)字人主要依靠數(shù)字人的商業(yè)IP運(yùn)營(yíng)實(shí)現(xiàn)商業(yè)變現(xiàn),功能服務(wù)型是交付給客戶實(shí)現(xiàn)變現(xiàn),而虛擬分身則需要結(jié)合虛擬空間的設(shè)定和規(guī)則進(jìn)行流量變現(xiàn)。?

數(shù)字人的制作成本和周期也伴隨定制化程度的下降而遞減:三種數(shù)字人的制作方式和周期也存在差異,內(nèi)容/IP型數(shù)字人更多是項(xiàng)目制,以定制為主;功能服務(wù)型是產(chǎn)品和定制化相結(jié)合,在通用產(chǎn)品上,進(jìn)行定制化開發(fā);而虛擬分身更多是產(chǎn)品制,用戶利用平臺(tái)工具產(chǎn)品進(jìn)行數(shù)字人形象的制作并在相應(yīng)虛擬場(chǎng)景內(nèi)進(jìn)行活動(dòng),一般而言內(nèi)容/IP型數(shù)字人的成本和周期最高,虛擬分身型數(shù)字人最低。各種數(shù)字人典型的商業(yè)流程和制作方式內(nèi)容/IP型功能服務(wù)型虛擬分身B端客戶需求/C端用戶需求從數(shù)字人制作角度B端客戶需求C端用戶需求場(chǎng)景規(guī)則設(shè)定使用場(chǎng)景打造用戶定制形象人設(shè)打造數(shù)字人制作中之人/AI訓(xùn)練平臺(tái)對(duì)接數(shù)字人制作AI訓(xùn)練平臺(tái)上架結(jié)合虛擬空間設(shè)定進(jìn)行流量變現(xiàn)交付并商業(yè)變現(xiàn)視頻推流IP運(yùn)營(yíng)商業(yè)變現(xiàn)注:內(nèi)容IP型以視頻播放場(chǎng)景為例項(xiàng)目制產(chǎn)品結(jié)合定制化產(chǎn)

品24PAGE/趨勢(shì)2:技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人形似人,制作效能將繼續(xù)提升建模技術(shù)發(fā)展推動(dòng)外貌更接近人的超寫實(shí)數(shù)字人制作門檻和周期進(jìn)一步下降人的思想人的外觀數(shù)字人神似人數(shù)字人形似人建模技術(shù)物理仿真物理仿真算法迭代推動(dòng)服裝動(dòng)態(tài)展示趨向真實(shí)渲染引擎的迭代發(fā)展和GPU算力的提升推動(dòng)數(shù)字人渲染畫面更加精細(xì)和實(shí)時(shí)化渲染技術(shù)動(dòng)捕技術(shù)面捕技術(shù)算法的優(yōu)化推動(dòng)動(dòng)捕技術(shù)門檻下降,使用將會(huì)更加輕量,視覺動(dòng)捕在C端應(yīng)用潛力更大人的行為(中之人驅(qū)動(dòng)動(dòng)作和表情)面部捕捉技術(shù)向更簡(jiǎn)單的硬件、更細(xì)膩的表情、更自動(dòng)化的流程方向發(fā)展管線化流程工具AI技術(shù)25PAGE/趨勢(shì)2:技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人形似人,制作效能將繼續(xù)提升2.1建模技術(shù)發(fā)展推動(dòng)超寫實(shí)數(shù)字人制作門檻、成本和周期進(jìn)一步下降?

2D數(shù)字人和3D數(shù)字人生成/建模方式不同,2D數(shù)字人本質(zhì)是生成圖像,因此主要方式是利用深度學(xué)習(xí)技術(shù)根據(jù)視頻生成與真人相同的圖像,技術(shù)相對(duì)成熟。?

3D數(shù)字人需要建立3D模型,主要是利用軟件傳統(tǒng)的手工建模、靜態(tài)掃描建模(相機(jī)陣列掃描建模)、動(dòng)態(tài)光場(chǎng)或者AI建模(3D重建技術(shù))生成3D模型。目前手工建模和靜態(tài)掃描建模技術(shù)較為成熟且應(yīng)用廣泛,利用3D重建技術(shù)或動(dòng)態(tài)光場(chǎng)重建可極大節(jié)約建模時(shí)間,提升建模效率,是未來(lái)重要布局方向。其中動(dòng)態(tài)光場(chǎng)重建優(yōu)勢(shì)在于重建人物的幾何模型同時(shí)還可一次性獲取動(dòng)態(tài)的人物模型數(shù)據(jù),并高品質(zhì)重現(xiàn)不同視角下觀看人體的光影效果。?

AI建模目前已經(jīng)初步實(shí)現(xiàn)產(chǎn)品化,目前精度可以達(dá)到次世代游戲人物級(jí)別,優(yōu)勢(shì)是可以開放程序接口,對(duì)接各種應(yīng)用,因此潛力較大,范圍較廣,特別是C端的應(yīng)用,可以通過便捷化的上傳圖片即可生成3D數(shù)字人面部模型。未來(lái)發(fā)展方向是通過算法驅(qū)動(dòng)提高精度,優(yōu)化建模效果,比如:偏移矯正、陰影修復(fù)等。數(shù)字人外形方向數(shù)字人類型生成/建模方式精度建模/掃描時(shí)間特點(diǎn)應(yīng)用領(lǐng)域技術(shù)成熟度完全復(fù)刻可以定制形象或者融合形象,均和真人無(wú)異傳媒、金融、政務(wù)2D數(shù)字人深度學(xué)習(xí)小時(shí)-天真人相對(duì)成熟0.1人工操作,建模時(shí)間相對(duì)較長(zhǎng),人物建模主流方式電影、傳媒、行業(yè)應(yīng)用手工建模月各種類型成熟毫米高速,后續(xù)需要人

重建數(shù)字人三維模型工進(jìn)一步完善模型

重建數(shù)字人紋理貼趨勢(shì)相機(jī)陣列掃描建模毫米微米超寫實(shí)

電影、傳媒相對(duì)成熟重建數(shù)字人三維模型、紋理3D數(shù)字人光場(chǎng)掃描高速貼圖、法線貼圖、材質(zhì)貼圖、

超寫實(shí)

電影、傳媒動(dòng)態(tài)網(wǎng)格落地完善中發(fā)展中,需要多種技術(shù)路徑驗(yàn)證AI建模成本低,可定制,1分鐘生成,實(shí)現(xiàn)千人千面,簡(jiǎn)單易用,零基礎(chǔ)使用相對(duì)較高(上傳照片/視頻生成寫實(shí)類型數(shù)字人)1分鐘生成寫實(shí)互聯(lián)網(wǎng)26PAGE/光場(chǎng)建模維度提升帶來(lái)影視級(jí)數(shù)字人制作周期大幅縮減,AI技術(shù)是未來(lái)發(fā)展重點(diǎn)光場(chǎng)是三維世界中光線集合的完備表示,包含光的位置、方向、光譜、時(shí)間等七個(gè)維度信息,采集并顯示光場(chǎng)就能在視覺上重現(xiàn)真實(shí)世界。數(shù)字人光場(chǎng)建模就是利用多角度攝像機(jī)、多角度光源模擬拍攝真人各種條件下的影像,解算人體表面形貌特性的技術(shù)?;驹恚喝四樒つw反射(I)與反照率(k)入射光方向(L)與皮膚反射方向(n)相關(guān),符合I=kLn的關(guān)系。拍攝時(shí),光場(chǎng)設(shè)備模擬x,y,z三個(gè)方向不同偏振態(tài)(或RGB不同色彩光照)的球形梯度光照拍攝人臉,采集不同偏振態(tài)的數(shù)據(jù)。由于梯度光照的對(duì)稱性,可以簡(jiǎn)化多光源的共同作用,以I=nC(C為常數(shù))的公式根據(jù)照片迅速地計(jì)算人臉各處對(duì)入射方向的光線的反射狀況n,即法向信息。梯度光光場(chǎng)可以重建出精確而真實(shí)的多層皮膚材質(zhì)(漫反射材質(zhì)、高光反射材質(zhì)、法向信息),讓渲染出的人臉皮膚展現(xiàn)出更加逼真的質(zhì)感。影眸面部光場(chǎng)掃描系統(tǒng)大型光場(chǎng)系統(tǒng)相機(jī)陣列系統(tǒng)數(shù)字人制作周期:1-2月多維光場(chǎng)重建數(shù)字人制作周期:1周(不含精修時(shí)間)光場(chǎng)未來(lái)研究重點(diǎn):AI加持、數(shù)據(jù)驅(qū)動(dòng)與神經(jīng)渲染技術(shù)結(jié)合的重建技術(shù)目標(biāo)硬件系統(tǒng)高分辨率相機(jī)陣列+頻閃光源硬件系統(tǒng)高分辨率攝像機(jī)陣列+變光照光源更簡(jiǎn)單的硬件設(shè)備、更高的精細(xì)度、更豐富的材質(zhì)信息可驅(qū)動(dòng)、可重打光、可編輯系統(tǒng)功能重建數(shù)字人三維模型重建數(shù)字人紋理貼圖系統(tǒng)功能重建數(shù)字人三維模型、紋理貼圖、法線貼圖、材質(zhì)貼圖、動(dòng)態(tài)網(wǎng)格代表工作Google|帶動(dòng)態(tài)材質(zhì)的體積攝影技術(shù)Therelightables:Volumetricperformancecaptureofhumanswithrealisticrelighting,SIGGRAPH2019影眸科技|AI驅(qū)動(dòng)的面部材質(zhì)與幾何資產(chǎn)系統(tǒng)指標(biāo)計(jì)算速度:<1小時(shí)/表情重建精度:毫米級(jí),面部結(jié)構(gòu)->毛孔系統(tǒng)指標(biāo)計(jì)算速度:<1小時(shí)/表情重建精度:亞毫米級(jí),毛孔->皮膚噪波Video-drivenNeuralPhysically-basedFacialAssetforProduction,SIGGRAPHasia2022上海科技大學(xué)|神經(jīng)渲染相結(jié)合的可驅(qū)動(dòng)重建HumanPerformanceModelingandRenderingviaNeuralAnimatedMesh,ACMSIGGRAPH2022上??萍即髮W(xué)相機(jī)陣列系統(tǒng)Meta|手機(jī)掃描的Codec

Avatar生成AuthenticVolumetricAvatarsfromaPhoneScan,ACMTOG41.4(2022):1-19.27PAGE/趨勢(shì)2:技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人形似人,制作效能將繼續(xù)提升2.2物理仿真算法迭代推動(dòng)服裝動(dòng)態(tài)展示趨向真實(shí)布料仿真一直是CG動(dòng)畫中的研究熱點(diǎn)與難點(diǎn),對(duì)提高動(dòng)畫質(zhì)量以及用戶體驗(yàn)具有重要意義。虛擬世界中虛擬角色強(qiáng)烈的視覺真實(shí)感主要擬人物的服裝動(dòng)畫,布料的仿真程度很大程度上可以增強(qiáng)用戶的體驗(yàn)感。于逼真的虛?

將服裝通過骨骼綁定驅(qū)動(dòng)的方式是市場(chǎng)上最為常見的應(yīng)用方式。這種應(yīng)用方式下,數(shù)字服裝作為剛性物體被驅(qū)動(dòng),只能進(jìn)行拉伸,好處是對(duì)于服裝解算沒有算力消耗,因此,更常見于實(shí)時(shí)互動(dòng)應(yīng)用中。?

基于位置的動(dòng)力學(xué)(PositionBasedDynamics,PBD)技術(shù),面數(shù)較大容易出現(xiàn)網(wǎng)格穿模,動(dòng)力學(xué)表現(xiàn)生硬,且較難區(qū)分不同面料質(zhì)感的物理差異,修型的工作量極大,單件服裝的效果調(diào)優(yōu)無(wú)法被負(fù)責(zé)且較難體現(xiàn)布料細(xì)節(jié)褶皺。?

物理仿真算法的服裝動(dòng)力學(xué)解算能夠無(wú)限接近真實(shí)世界的服裝表現(xiàn),能夠很好的表達(dá)服裝的物理質(zhì)感,服裝與人體的關(guān)系,同時(shí)也不依賴于美術(shù)的高復(fù)雜且繁重的美術(shù)工作,但是過于依賴端的計(jì)算能力,移動(dòng)端只能夠通過云端服務(wù)器的計(jì)算然后進(jìn)行數(shù)據(jù)網(wǎng)絡(luò)傳輸,進(jìn)而對(duì)網(wǎng)絡(luò)傳輸速度也有了極高的要求。?

基于AI算法的服裝動(dòng)態(tài)模擬在學(xué)術(shù)上有所表現(xiàn),但是成熟度較低,目前無(wú)法較好的處理多層級(jí)服裝的效果解算,服裝的細(xì)節(jié)表現(xiàn)也較弱,但是仍有較大的潛力與可能性。類型仿真程度仿真速度算力開銷數(shù)據(jù)依賴骨骼綁定無(wú)快無(wú)無(wú)無(wú)position-baseddynamics(PBD)缺乏物理意義較快適合移動(dòng)端,面數(shù)大問題明顯Physically-basedSimulation物理仿真AI仿真基本接近真實(shí)物理效果有一定物理意義較慢較快應(yīng)用開銷大無(wú)訓(xùn)練開銷大,應(yīng)用開銷尚可提前進(jìn)行大量數(shù)據(jù)訓(xùn)練28PAGE/趨勢(shì)2:技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人形似人,制作效能將繼續(xù)提升2.3渲染引擎迭代和GPU算力提升推動(dòng)數(shù)字人畫面更加精細(xì)和實(shí)時(shí)化渲染是對(duì)3D數(shù)字人或虛擬場(chǎng)景加入幾何、視點(diǎn)、紋理、照明和陰影等信息從而達(dá)成從模型到圖像的轉(zhuǎn)變,渲染決定了最終數(shù)字人的質(zhì)量,而渲染引擎和GPU算力的發(fā)展推動(dòng)數(shù)字人渲染更加信息和實(shí)時(shí)化。??目前離線渲染比較成熟,應(yīng)用較為廣泛。而實(shí)時(shí)渲染尚有提升空間,伴隨GPU算力的不斷提升和渲染引擎的優(yōu)化,將推動(dòng)實(shí)時(shí)渲染的速度和真實(shí)度,未來(lái)實(shí)時(shí)渲染技術(shù)的發(fā)展也為數(shù)字人的實(shí)時(shí)交互提供了極大助力。主流的3D渲染引擎UnrealEngine和Unity3D版本不斷迭代,推動(dòng)數(shù)字人皮膚紋理、3D效果、質(zhì)感和細(xì)節(jié)等方面渲染效果更佳,同時(shí)生產(chǎn)效率更高。趨勢(shì)算力是渲染質(zhì)量和實(shí)時(shí)性的根本驅(qū)動(dòng)力渲染方式定義離線渲染實(shí)時(shí)渲染在計(jì)算出畫面時(shí)并不顯示畫面,計(jì)算機(jī)根據(jù)預(yù)先定義好的光線、圖形數(shù)據(jù)實(shí)時(shí)計(jì)算與輸出,每一幀都是針對(duì)當(dāng)時(shí)實(shí)際的環(huán)境光源、相機(jī)位置和材軌跡渲染圖片,渲染完成后再將圖片連續(xù)播放,實(shí)現(xiàn)動(dòng)畫效果

質(zhì)參數(shù)計(jì)算出的圖像渲染時(shí)間計(jì)算資源長(zhǎng),花費(fèi)幾十分鐘甚至更長(zhǎng)時(shí)間渲染一幀畫面多,受時(shí)效限制有限,可臨時(shí)調(diào)配更多計(jì)算資源短,每秒至少渲染30幀少,受限于時(shí)效要求,計(jì)算資源一般不能及時(shí)調(diào)整渲染質(zhì)量高中數(shù)字人交互數(shù)字人文件格式無(wú)視頻無(wú)交互/有交互視頻或程序強(qiáng)調(diào)“美學(xué)和視覺效果”,主要優(yōu)點(diǎn)是渲染時(shí)可以不考慮時(shí)間

強(qiáng)調(diào)“交互性和實(shí)時(shí)性”,優(yōu)點(diǎn)是可以實(shí)時(shí)操控,缺點(diǎn)是要受系統(tǒng)的負(fù)荷能力的對(duì)渲染效果的影響缺點(diǎn)是渲染畫面播放時(shí)用戶不能實(shí)時(shí)控制物

限制,必要時(shí)要犧牲畫面效果(模型的精細(xì)、光影的應(yīng)用、貼圖的精細(xì)程度)來(lái)滿優(yōu)缺點(diǎn)體和場(chǎng)景足實(shí)時(shí)系統(tǒng)的要求。應(yīng)用領(lǐng)域廣告營(yíng)銷/影視等預(yù)先設(shè)計(jì)好的模式的演示直播/行業(yè)數(shù)字客服/游戲等無(wú)預(yù)定腳本場(chǎng)景1998年2002年2005年2007年2009年2010年2011年2012年2014年2015年2016年2017年2018年2019年2020年2021年2022年UE1UE2UE3UE4UE51、UE5主要是做了兩大核心功能的更新,第一個(gè)是Nanite(虛擬微多邊形幾何體技術(shù))以及l(fā)umen(流明技術(shù))。流明技術(shù)(lumen)是虛幻五的全動(dòng)態(tài)實(shí)時(shí)光照解決方案核心亮點(diǎn),不需要性能強(qiáng)勁的顯卡,也不用場(chǎng)景預(yù)渲染,就可以達(dá)到類似于光線追蹤的實(shí)時(shí)效果。多邊形虛擬化技術(shù)(Nanite)可以被實(shí)時(shí)流送和縮放,無(wú)需再考慮多邊形數(shù)量預(yù)算、多邊形內(nèi)存預(yù)算或繪制次數(shù)預(yù)算了;也不用再將細(xì)節(jié)烘焙到法線貼圖或手動(dòng)編輯LOD,畫面質(zhì)量不會(huì)再有絲毫損失。初代虛幻引擎將渲

將《虛幻競(jìng)技場(chǎng)2004》染、碰撞偵測(cè)、AI、

中改進(jìn)載具模擬的圖形、網(wǎng)絡(luò)和文件

KarmaphysicsSDK系統(tǒng)集成為一個(gè)完

集成在一起,也強(qiáng)化1、UE3整合了由Ageia所提供的“NovodeX”物理模擬技術(shù),讓展示場(chǎng)景中的對(duì)象呈現(xiàn)出如同實(shí)際物體般的反應(yīng),像是彎曲、抖動(dòng)、晃動(dòng)、碰撞、彈跳等,并以常見的連鎖機(jī)關(guān)方式來(lái)展示這些真實(shí)物理反應(yīng)模擬所能做到的效果。1、UE4采用了目前最新的即時(shí)光跡追蹤、HDR光照、虛擬位移等新技術(shù),而且能夠每秒鐘實(shí)時(shí)運(yùn)算兩億個(gè)多邊形運(yùn)算,效能是目前“UnrealEngine”的100倍,而通過NVIDIA的GeForce6800顯示卡與“UnrealEngine3”3D引擎的搭配,可以實(shí)時(shí)運(yùn)算出電影CG等級(jí)的畫面。UE整的引擎。了許多元素。2、UE3引擎的進(jìn)步之處在于在游戲的制作階段,引擎可以支持制作人員創(chuàng)建一個(gè)數(shù)百萬(wàn)多邊形組成的超精細(xì)模型,并對(duì)模型進(jìn)行細(xì)致的渲染,從而得到一張高品質(zhì)的法線貼圖,這張法線貼圖中記錄了高精度模型的所有光照信息和通道信息。2、重新設(shè)計(jì)了整個(gè)架構(gòu),對(duì)移動(dòng)平臺(tái)提供了更好的支持,UE4廢棄了UnrealScript,統(tǒng)一使用C++開發(fā),并革命性的引入了代碼的熱更新。2、虛幻5成本小,效率更高,效果更好,更加人性化,更加智能。Unity1.0Unity2.0Unity3.0Unity4.0Unity5.0Unity2017Unity2018Unity2019Unity2020Unity2021Unity20221、Unity簡(jiǎn)化了對(duì)象的創(chuàng)建,尤其是分層的對(duì)象結(jié)構(gòu)和依賴,并簡(jiǎn)化了應(yīng)用程序代碼。1、在Unity3.0版本中(2013年),新增了基于約定的自動(dòng)注冊(cè)機(jī)制(RegistrationByConvention),以使Unity容器的裝配過程變得更加簡(jiǎn)單,并且減少冗余代碼。2、Unity3提供一個(gè)新的延時(shí)光照系統(tǒng),支持在場(chǎng)景中實(shí)現(xiàn)上百個(gè)點(diǎn)光源。同時(shí)開放了延時(shí)光照需要的G-Buffers,開發(fā)者可以重用到其他高端圖片效果上,而沒有額外的性能損失。1、Unity5.0物理系統(tǒng)的預(yù)計(jì)工作速度是以前版本的2倍,基于物理的標(biāo)準(zhǔn)著色器使材質(zhì)在任何照明環(huán)境中看起來(lái)一致?;贕eomericsEnlighten技術(shù)的實(shí)時(shí)全局照明。音頻混合器,可大幅改善游戲中的音頻。1、Unity

2022.1中最大的變化之一是新的材質(zhì)變體系統(tǒng),它適用于HDRP和URP渲染管線,它允許藝術(shù)家創(chuàng)建材質(zhì)模板,其中子材質(zhì)與父材質(zhì)共享公共屬性,并僅覆蓋那些不同的屬性。2、支持需求的抽象,這允許開發(fā)人員在運(yùn)行時(shí)或者配置中指定依賴,并簡(jiǎn)化了橫切關(guān)注點(diǎn)的管理。Unity3、通過延遲將配置組裝到容器來(lái)提高靈活性。4、服務(wù)定位功能允許客戶代碼保存或者緩存容器。這在開發(fā)人員可以持久化容器到ASP.NETSession或者Application中的ASP.NETWeb應(yīng)用程序中特別有用。2、Unity

2022.1引入了一個(gè)新的Splines包,包括在Unity編輯器中創(chuàng)建和操作樣條線所需的工具,以及自定義這些工具所需的框架,它是一個(gè)通用工具集,用途包括生成用于3D建模的基本曲線、創(chuàng)建動(dòng)畫路徑或在布置環(huán)境時(shí)沿樣條線實(shí)例化預(yù)制件。2、Unity5.0中,Cloth不再對(duì)場(chǎng)景中的所有碰撞器做出反應(yīng),也不再將力應(yīng)用回世界。相反有一個(gè)更快、多線程、更穩(wěn)定的角色服裝解決方案。當(dāng)添加它時(shí),新的Cloth組件不再對(duì)任何物體做出反應(yīng)。29PAGE/趨勢(shì)2:技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人形似人,制作效能將繼續(xù)提升2.4算法的優(yōu)化推動(dòng)專業(yè)動(dòng)捕設(shè)備趨向便捷化,視覺動(dòng)捕在C端應(yīng)用潛力更大動(dòng)作捕捉是指通過數(shù)字手段記錄現(xiàn)實(shí)中的運(yùn)動(dòng)過程,特點(diǎn)是動(dòng)作靈活、互動(dòng)效果覺好,多用于內(nèi)容/IP型數(shù)字人,場(chǎng)景多為直播、路演等互動(dòng)性活動(dòng),其本質(zhì)上是傳統(tǒng)影視制作CG技術(shù)的演進(jìn),目前主流的方式是光學(xué)動(dòng)捕和慣性動(dòng)捕,而基于計(jì)算機(jī)視覺的視頻動(dòng)捕發(fā)展速度較快。此外,多種方式相結(jié)合的混合動(dòng)捕方式也是未來(lái)重要的發(fā)展方向,如光學(xué)動(dòng)捕和慣性動(dòng)捕的結(jié)合,視覺動(dòng)捕和VR頭顯/手柄的結(jié)合等。?光學(xué)動(dòng)捕是最早出現(xiàn)的動(dòng)捕技術(shù),同時(shí)發(fā)展也最為成熟,需要多個(gè)專業(yè)動(dòng)捕攝像機(jī)結(jié)合穿動(dòng)捕服的中之人。未來(lái)會(huì)向?qū)I(yè)化和便捷化兩個(gè)方向發(fā)展:專業(yè)化方向,將實(shí)現(xiàn)更高的分辨率和更遠(yuǎn)的探測(cè)距離,動(dòng)作的還原度更高,更加逼真和穩(wěn)定,同時(shí)將數(shù)據(jù)在云上處理;便捷化方向?qū)⒑鸵曨l動(dòng)捕趨同,采用數(shù)量較少的消費(fèi)級(jí)攝像頭,無(wú)需穿戴設(shè)備。慣性動(dòng)捕是采用傳感器結(jié)合算法的方式,由于精度較高,對(duì)場(chǎng)地要求適中,因此是B端主流方式,未來(lái)伴隨算法的不斷完善,傳感器數(shù)量將呈下降趨勢(shì),對(duì)中之人和場(chǎng)地的限制也會(huì)越來(lái)愈少。激光+慣性動(dòng)捕方式,采用激光傳感器結(jié)合慣性傳感器的方式,對(duì)抗電磁干擾能力強(qiáng),可連續(xù)24小時(shí)穩(wěn)定工作,適合大空間內(nèi)動(dòng)捕定位,未來(lái)向更低使用門檻發(fā)展。視覺動(dòng)捕顯著降低了使用門檻,從最初的利用深度攝像頭,到利用多目攝像頭到現(xiàn)在的利用單目普通攝像頭,對(duì)設(shè)備的要求逐漸降低,未來(lái)發(fā)展方向是在C端不斷提高定位精度和準(zhǔn)確度,適用于UGC的使用場(chǎng)景。另一發(fā)展方向是通過增加攝像頭的數(shù)量,向?qū)I(yè)化發(fā)展,與光學(xué)動(dòng)捕中便捷化發(fā)展趨勢(shì)趨同。???傳感器數(shù)量下降慣性動(dòng)捕光學(xué)動(dòng)捕專業(yè)化便捷化專業(yè)化便捷化更高的分辨率和更遠(yuǎn)的探測(cè)距發(fā)展方向使用消費(fèi)級(jí)別攝像頭,無(wú)需穿戴設(shè)備增加攝像頭數(shù)量,提高精度兩者發(fā)展方向趨同視覺動(dòng)捕利用單目攝像頭和手機(jī)算力更多的激光發(fā)射器和傳感器專業(yè)化便捷化激光+慣性動(dòng)捕穿戴方便、零校準(zhǔn)、低使用成本類型光學(xué)動(dòng)捕定位精度傳感器數(shù)量抗遮擋低對(duì)場(chǎng)地空間要求移動(dòng)性硬件成本算法難度適用場(chǎng)景高中高低高中中無(wú)高中中低低中中高高中中低中低中高電影、動(dòng)畫電視臺(tái)節(jié)目慣性動(dòng)捕高激光+慣性動(dòng)捕視頻動(dòng)捕高影視、訓(xùn)練、虛擬直播虛擬直播無(wú)30PAGE/趨勢(shì)2:技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人形似人,制作效能將繼續(xù)提升2.5面部捕捉技術(shù)向更簡(jiǎn)單的硬件、更細(xì)膩的表情、更自動(dòng)化的流程方向發(fā)展驅(qū)動(dòng)一個(gè)數(shù)字人往往被拆分為追蹤(Tracking)與重定向(Retargeting)兩個(gè)環(huán)節(jié)。追蹤由專業(yè)的面部捕捉設(shè)備及其輔助算法完成,負(fù)責(zé)記錄演員的面部動(dòng)作信息,重定向則是將捕捉到的面部動(dòng)作信息遷移到新的角色。追蹤:從傳統(tǒng)計(jì)算機(jī)視覺算法到基于深度學(xué)習(xí)的方案重定向:從藝術(shù)家手工綁定到自動(dòng)綁定方案硬件:多目紅外攝像頭/深度傳感器基于通用骨骼蒙皮、BlendShape的綁定方案+藝術(shù)家手動(dòng)調(diào)整的綁定方案(如:使用MetaHuman骨骼蒙皮遷移、MeshtoMetaHuman)參照掃描表情拆分BlendShape或骨骼蒙皮不符合真人本人表情對(duì)藝術(shù)家水平要求高工作量極大裝備:面捕頭盔+面部標(biāo)記點(diǎn)(也有一些不需要標(biāo)記點(diǎn))主要原理:基于傳統(tǒng)計(jì)算機(jī)視覺的關(guān)鍵點(diǎn)追蹤、雙目視覺技術(shù)、結(jié)構(gòu)光技術(shù)備注:由于采用傳統(tǒng)算法,對(duì)輸入內(nèi)容的質(zhì)量比較嚴(yán)苛,所以往往要求更好的硬件與光照環(huán)境(紅外)或者額外的深度信息作為輔助,成本居高不下(影視級(jí)數(shù)字替身常用制作方案,如:《雙子殺手》)基于肌肉模擬仿真完成面部驅(qū)動(dòng)難以實(shí)時(shí)解算(如:ZIVADYNAMICS)硬件:?jiǎn)文繑z像頭?????Datadriven的面部綁定依據(jù),如依靠4D連續(xù)幀數(shù)據(jù)與追蹤算法強(qiáng)關(guān)聯(lián)的自動(dòng)化綁定裝備:面捕頭盔/手機(jī)主要原理:在二維、三維數(shù)據(jù)集上,通過可微分渲染、深度學(xué)習(xí)等技術(shù)實(shí)現(xiàn)備注:基于深度學(xué)習(xí)的算法對(duì)輸入數(shù)據(jù)具有更強(qiáng)的魯棒性,對(duì)捕捉設(shè)備的要求有所下降;同時(shí),由于神經(jīng)網(wǎng)絡(luò)出色的表達(dá)性能,能夠更準(zhǔn)確的對(duì)微表情進(jìn)行捕捉。具有解剖學(xué)依據(jù),符合肌肉動(dòng)力學(xué)采用更高級(jí)別的表達(dá)方式還原微表情,如BlendShape與骨骼混合,甚至是神經(jīng)網(wǎng)絡(luò)的隱式表達(dá)實(shí)時(shí)量子動(dòng)力推出AVATARY綁定系統(tǒng)。AutoFace和Rigger功能模塊支持面部表情模型、骨骼和控制器的快捷生成和綁定,完成了從BS生成到骨骼綁定、控制器綁定的流程,高效實(shí)現(xiàn)了面部模型的生成和綁定。影眸科技最新微表情級(jí)面部捕捉技術(shù),使用神經(jīng)網(wǎng)絡(luò)對(duì)4D數(shù)據(jù)進(jìn)行學(xué)習(xí)代替?zhèn)鹘y(tǒng)綁定,計(jì)算機(jī)圖形學(xué)頂會(huì)SIGGRAPHAsia2022接收為TechnicalPaper-ZIVADYNAMICS推出ZIVAFACETRAiNER在線Sass服務(wù),通過4D掃描技術(shù)得到的訓(xùn)練數(shù)據(jù),使用機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)自動(dòng)化綁定。JournalTrack并受邀作報(bào)告分享。31PAGE/數(shù)字人技術(shù)擴(kuò)散,數(shù)字人各項(xiàng)技術(shù)如動(dòng)捕、布料仿真等,在數(shù)字人制作過程中發(fā)揮重要作用外,也溢出到其他產(chǎn)業(yè),發(fā)揮重要作用Style3D

凌迪科技將布料仿真技術(shù)應(yīng)國(guó)承萬(wàn)通將動(dòng)捕應(yīng)用于機(jī)器人驅(qū)動(dòng)用于服裝設(shè)計(jì)動(dòng)作捕捉技術(shù)在擊劍訓(xùn)練中使用,定位精確輔助訓(xùn)練設(shè)備,解決了以往視頻分析等手段中存在的實(shí)時(shí)性問題,能對(duì)運(yùn)動(dòng)員的身體狀態(tài)、運(yùn)動(dòng)機(jī)能等關(guān)鍵要素直觀、可視化地展示,從而幫助教練與選手展開個(gè)性化、精準(zhǔn)化的訓(xùn)練。動(dòng)作捕捉技術(shù)和布料仿真等技術(shù)在服裝設(shè)計(jì)過程中可以還原人體尺寸和動(dòng)態(tài)效果,使服裝的設(shè)計(jì)無(wú)需經(jīng)過實(shí)物打樣生產(chǎn)制作,即可通過數(shù)字人及其一系列動(dòng)態(tài)來(lái)直觀反映服裝設(shè)計(jì)的設(shè)計(jì)美感與工業(yè)適配性。通過工業(yè)孿生的數(shù)字人和服裝,降低服裝設(shè)計(jì)開發(fā)的成本和周期。影眸科技聯(lián)合上??萍即髮W(xué)、上海市第九人民醫(yī)院合力構(gòu)建了符合解剖學(xué)規(guī)則的參數(shù)化人臉生成模型國(guó)承萬(wàn)通將動(dòng)作捕捉技術(shù)應(yīng)用于機(jī)器人驅(qū)動(dòng),解決了以往在開放環(huán)境中,機(jī)器人末端難以通過傳感器實(shí)現(xiàn)空間精準(zhǔn)定位的問題,在現(xiàn)有機(jī)器人感知框架內(nèi),能夠訓(xùn)練機(jī)器人細(xì)節(jié)精準(zhǔn)抓取的動(dòng)作,從而幫助服務(wù)型機(jī)器人更快的走進(jìn)千家萬(wàn)戶,徹底提升人們的生活品質(zhì)。SCULPTOR,它對(duì)頭骨、臉部幾何形狀和臉部外觀進(jìn)行聯(lián)合建模,僅通過一張照片/一個(gè)人臉模型即可推測(cè)角色骨骼形狀,并以此為依據(jù)進(jìn)一步調(diào)整角色相貌;該技術(shù)將被應(yīng)用于數(shù)字人創(chuàng)作、整形預(yù)測(cè)等多個(gè)方向,為文化娛樂與醫(yī)療美容行業(yè)提供技術(shù)解決方案。32PAGE/趨勢(shì)2:技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人形似人,制作效能將繼續(xù)提升2.6伴隨數(shù)字人制作流程更加管線化和智能化,制作效能不斷提升目前2D數(shù)字人的定制自動(dòng)化程度逐步提升,通過定制管線可完成從訓(xùn)練到播報(bào)、交互應(yīng)用平臺(tái)的上架。騰訊2D數(shù)字人自動(dòng)化管線生產(chǎn)流程專業(yè)影棚錄制的視頻,經(jīng)過AI自動(dòng)訓(xùn)練即生成用于播報(bào)&交互、動(dòng)作可配的專業(yè)數(shù)智人,用于業(yè)務(wù)辦理、信息咨詢、主播等場(chǎng)景。1、模特人選及妝發(fā)確定3、自動(dòng)化數(shù)據(jù)標(biāo)注、預(yù)處理3分鐘視頻素材經(jīng)過天級(jí)別的AI訓(xùn)練,便可生成各行各業(yè)的數(shù)智人分身,適用于內(nèi)容講解、口播視頻生產(chǎn)、直播帶貨等場(chǎng)景。33PAGE/趨勢(shì)2:技術(shù)集綜合迭代驅(qū)動(dòng)數(shù)字人形似人,制作效能將繼續(xù)提升2.6伴隨數(shù)字人制作流程更加智能化和管線化,制作效能不斷提升??3D數(shù)字人制作涉及眾多技術(shù)領(lǐng)域、制作方法尚未完全定型,自動(dòng)化程度相對(duì)較低,需要大量的人工參與,高效率的生產(chǎn)高質(zhì)量難度較大,目前領(lǐng)域內(nèi)部正通過管線化生產(chǎn)的方式對(duì)生產(chǎn)流程進(jìn)行標(biāo)準(zhǔn)化,以提升制作效能。未來(lái)將在管線化生產(chǎn)的基礎(chǔ)上,通過算法優(yōu)化和更加便利的工具,如自動(dòng)化的骨骼和表情綁定工具,使制作更加簡(jiǎn)單化和一體化,特別通過AI技術(shù)提升制作的智能化水平,減少人工參與編輯和調(diào)優(yōu)。資產(chǎn)制作管線傳統(tǒng)手工建模方式制作數(shù)字人典型管線白模制作面部修型眼部修型毛發(fā)制作衣服制作綁定/材質(zhì)貼圖光影精調(diào)采用Maya技術(shù)精確塑造模型,結(jié)合虛幻引擎技術(shù)渲染材質(zhì),塑造高質(zhì)量寫實(shí)模型。同時(shí)采用綁定系統(tǒng),高效完成人體肌肉搭建及口型精準(zhǔn)制作;配給布料物理專業(yè)人才,同時(shí)采用全套捕捉系統(tǒng),解決動(dòng)捕過程中肢體動(dòng)作及服飾動(dòng)感等技術(shù)難題,使得虛擬人迅速投入商業(yè)場(chǎng)景的應(yīng)用。一站式制作數(shù)字人典型管線AI驅(qū)動(dòng)中之人驅(qū)動(dòng)1.選擇已有形象模版2.形象創(chuàng)作3.選擇頭發(fā)4.選擇體型及服裝5.在UE中下載MetaHuman資產(chǎn)通過快速和容易地創(chuàng)建獨(dú)特高保真的數(shù)字人類的工具,直接操縱面部特征,調(diào)整膚色,并且從預(yù)設(shè)的身體類型、發(fā)型、服飾等范圍中選擇,在角色制作完成后,會(huì)包含完整的綁定并可以直接在虛幻引擎或者maya中制作動(dòng)畫。光場(chǎng)掃描方式制作數(shù)字人典型管線3D+4D掃描數(shù)據(jù)采集及處理皮膚材質(zhì)渲染毛發(fā)拓?fù)溲壑榧巴捉Y(jié)構(gòu)制作模型精修及多層渲染前期以超高的精度與超快的速度動(dòng)態(tài)掃描面部材質(zhì)、捕捉表情變化時(shí)的肌肉運(yùn)動(dòng),基于微米級(jí)面部光場(chǎng)掃描,輸出精細(xì)到皮膚微結(jié)構(gòu)的逐幀面部幾何與材質(zhì),并快速完成臉部細(xì)節(jié)精修、材質(zhì)制作、毛發(fā)制作及瞳孔制作,重拓?fù)浜笸渡渲脫Q貼圖,令虛擬人模型達(dá)到噪波級(jí)細(xì)致的毛孔以及超高度的皮膚質(zhì)感與精度。將超寫實(shí)數(shù)字人制作周期提速到3-4周左右(沒有動(dòng)捕和表情)34PAGE/??騰訊NExT

Studios自研xMoCap

3A級(jí)動(dòng)捕動(dòng)畫全流程管線和xFaceBuilder

數(shù)字角色制作管線騰訊NExT

Studios自研的xMoCap?

3A級(jí)動(dòng)捕動(dòng)畫全流程管線集角騰訊NExT

Studios自研的xFaceBuilder?數(shù)字角色制作管線通過極致的算法優(yōu)化,便利工具的研發(fā),提升了高保真人臉制作效率,打磨成了一套影視級(jí)別的建模、綁定、動(dòng)畫在內(nèi)的高保真人臉制作全流程管線,可以運(yùn)行于手機(jī),主機(jī),PC等平臺(tái)。不僅支持從手游到3A游戲角色的不同制作標(biāo)準(zhǔn),也應(yīng)用到了影視、科教等更多領(lǐng)域。色綁定、動(dòng)作捕捉、動(dòng)畫工具、資產(chǎn)管理及動(dòng)捕數(shù)據(jù)庫(kù)為一體,支持大型團(tuán)隊(duì)協(xié)作、云端海量資產(chǎn)管理、高保真3D角色動(dòng)畫生產(chǎn),符合3A游戲的開發(fā)需求。35PAGE/趨勢(shì)3:

AI技術(shù)驅(qū)動(dòng)數(shù)字人多模態(tài)交互更神似人,并逐步覆蓋數(shù)字人全流程人的外觀數(shù)字形似人目前主流方式是圍繞NLP技術(shù)進(jìn)行文本驅(qū)動(dòng),NLP是數(shù)字人的大腦,直接影響交互體驗(yàn)。自然語(yǔ)言處理(NLP)人的思想數(shù)字人神似人計(jì)算機(jī)視覺(CV)人的行為CV決定數(shù)字人面部表情和肢體動(dòng)作。目前聲唇同步技術(shù)相對(duì)完善。(AI驅(qū)動(dòng)表情動(dòng)作)36PAGE/趨勢(shì)3:

AI技術(shù)驅(qū)動(dòng)數(shù)字人多模態(tài)交互更神似人,并逐步覆蓋數(shù)字人全流程當(dāng)前數(shù)字人對(duì)語(yǔ)言理解還是以文本為主,動(dòng)作合成上聲唇同步較為完善:?AI驅(qū)動(dòng)數(shù)字人是指數(shù)字人等語(yǔ)音表達(dá)、面部表情和動(dòng)作形態(tài)等通過深度學(xué)習(xí)模型進(jìn)行運(yùn)算,并將其結(jié)果實(shí)時(shí)或者離線驅(qū)動(dòng),并進(jìn)行渲染。目前主流的方式是圍繞NLP能力通過文本驅(qū)動(dòng),本質(zhì)是通過ASR-NLP-TTS等AI技術(shù)進(jìn)行感知-決策-表達(dá)的閉環(huán)來(lái)驅(qū)動(dòng)數(shù)字人交互,同時(shí)需要預(yù)先設(shè)置相關(guān)的知識(shí)圖譜或問答庫(kù)等,與數(shù)字人的對(duì)話系統(tǒng)對(duì)接,但目前NLP在通用性場(chǎng)景的能力還需要進(jìn)一步完善。?計(jì)算機(jī)視覺(CV)目前數(shù)字人聲唇同步技術(shù)相對(duì)完善,在游戲中已經(jīng)大量應(yīng)用;而其他表情和動(dòng)作還需要描述性的數(shù)據(jù)或者標(biāo)簽驅(qū)動(dòng),尚未智能合成,表情動(dòng)作也是是AI驅(qū)動(dòng)未來(lái)發(fā)展的重點(diǎn)方向。騰訊AILab的數(shù)字人AI口型驅(qū)動(dòng)技術(shù)已經(jīng)應(yīng)用到《重返帝國(guó)》、《代號(hào)破曉》等多款游戲中,其中大量游戲角色的臉部口型動(dòng)畫都是通過AI技術(shù)自動(dòng)生成技術(shù)階段作用和目的發(fā)展趨勢(shì)感知階段將人的語(yǔ)音轉(zhuǎn)換為文本相對(duì)成熟ASR語(yǔ)音理解處理并理解文本,以對(duì)話能力為核心,為數(shù)字人的大腦配合知識(shí)圖譜,應(yīng)用于特定場(chǎng)景,未來(lái)通用型模型還需要完善NLPTTS決策階段表達(dá)階段《重返帝國(guó)》游戲畫面《代號(hào)破曉》游戲畫面相對(duì)成熟,未來(lái)方向增加斷句、多音字的準(zhǔn)確度,增加情感,更加似人將需要輸出的文本合成為語(yǔ)音騰訊智影平臺(tái)聯(lián)合《王者榮耀》,實(shí)現(xiàn)《王者榮耀》自有IP為2022KPL春季賽提供手語(yǔ)解說。當(dāng)天觀賽人數(shù)突破1300萬(wàn);后續(xù)該能力也將作為王者賽事的通用能力,輸出到包括世冠在內(nèi)的多個(gè)國(guó)際及海外賽事中。建立輸入文本到輸出音頻與輸出視覺信息的關(guān)聯(lián)映射,主要是對(duì)采集到的文本到語(yǔ)音和嘴形視頻(2D)/嘴形動(dòng)畫(3D)的數(shù)據(jù)進(jìn)行模型訓(xùn)練,得到相關(guān)模型,并智能合成隨著寫實(shí)度的提高,微表情更多,超寫實(shí)對(duì)精度要求更高,超寫實(shí)還需要進(jìn)一步完善AI驅(qū)動(dòng)嘴形動(dòng)作表達(dá)階段表達(dá)階段動(dòng)作合成AI驅(qū)動(dòng)其他動(dòng)作動(dòng)作是采用隨機(jī)策略或者腳本進(jìn)行預(yù)設(shè),需要人工配制描述性的數(shù)據(jù)或者標(biāo)簽尚未實(shí)現(xiàn)智能合成37PAGE/趨勢(shì)3:

AI技術(shù)驅(qū)動(dòng)數(shù)字人多模態(tài)交互更神似人,并逐步覆蓋數(shù)字人全流程多模態(tài)AI技術(shù)是未來(lái)數(shù)字人發(fā)展的最大推動(dòng)力,驅(qū)動(dòng)數(shù)字人“思想”更像人:未來(lái)AI技術(shù)的重點(diǎn)方向是在輸入端實(shí)現(xiàn)多模態(tài)感知輸入,在輸出端提升多模態(tài)交互能力,綜合提升數(shù)字人的表現(xiàn)力,從目前的基于文本的交互,轉(zhuǎn)化為基于語(yǔ)義的交互,特別是需要強(qiáng)化對(duì)人情緒的感知和表達(dá)。AI驅(qū)動(dòng)數(shù)字人未來(lái)發(fā)展方向示意圖輸入分析思考輸出空間感知肢體感知表情感知……動(dòng)作信息表情信息情感信息重音位置激動(dòng)程度語(yǔ)言學(xué)特征肢體動(dòng)作面部表情圖像AI大腦多種喚醒方式多模態(tài)分析模型聲音口型自主學(xué)習(xí)能力語(yǔ)氣語(yǔ)義……語(yǔ)音記憶聲唇同步推理和決策能力注:黑色部分為近期和中期目標(biāo),紅色部分是AI發(fā)展中長(zhǎng)期方向38PAGE/騰訊數(shù)智人強(qiáng)大的形象表現(xiàn)力、識(shí)別力、理解能力和服務(wù)性能騰訊3D超寫實(shí)數(shù)智人擁有超細(xì)微的面部表情,超強(qiáng)的情緒表現(xiàn)力,精通多種語(yǔ)言,能夠生動(dòng)地表達(dá)情緒,可以滿足各類場(chǎng)景需求,數(shù)智人有個(gè)性、有情感、更真實(shí)生動(dòng)。騰訊數(shù)智人AI能力示意驅(qū)模情緒識(shí)別會(huì)話AI支持多種豐富立體情緒表達(dá)文本驅(qū)動(dòng)聲音驅(qū)動(dòng)面捕驅(qū)動(dòng)動(dòng)捕驅(qū)動(dòng)人像生成情緒特征知識(shí)問答4D建模自動(dòng)綁定動(dòng)作遷移情緒變化用戶狀態(tài)異常行為表格圖譜寒暄庫(kù)信息傳遞常態(tài)常態(tài)難過高興驚訝生氣難過驚訝?wèi)岩勺匀徽Z(yǔ)言處理語(yǔ)音技術(shù)視覺技術(shù)知識(shí)圖譜害怕厭惡開心自然語(yǔ)言生成場(chǎng)景知識(shí)庫(kù)意圖識(shí)別知識(shí)定義知識(shí)抽取知識(shí)管理圖譜可視化ASRTTS人像、環(huán)境識(shí)別手勢(shì)、表情識(shí)別圖像對(duì)比害怕厭惡可疑生氣AI降噪方言識(shí)別詞槽抽取捏臉技術(shù)39PAGE/趨勢(shì)3:

AI技術(shù)驅(qū)動(dòng)數(shù)字人多模態(tài)交互更神似人,并逐步覆蓋數(shù)字人全流程AI技術(shù)正在覆蓋數(shù)字人制作的全流程:除了利用ASR-NLP-TTS等技術(shù)驅(qū)動(dòng)數(shù)字人交互外,AI技術(shù)也應(yīng)用在2D數(shù)字人的視頻生成、3D數(shù)字人的建模、視頻驅(qū)動(dòng)、物理仿真等多個(gè)環(huán)節(jié)。生成數(shù)字人形象物理仿真驅(qū)動(dòng)2D數(shù)字3D數(shù)字人布料仿真:通過AI預(yù)測(cè)的方式生成布料形態(tài)、動(dòng)力學(xué)形變視頻驅(qū)動(dòng):由視頻驅(qū)動(dòng)數(shù)字人的表情和動(dòng)作視頻生成:通過視頻和AI算法生成2D數(shù)字人的形象AI3D建模:通過AI的算法,由視頻自動(dòng)生成3D模型和相關(guān)紋理騰訊AILab提出的通過手機(jī)自拍自動(dòng)創(chuàng)建高保真3D數(shù)字人技術(shù),用戶可以通過手機(jī)自拍一段臉部視頻,然后將其輸入到三維建模算法和AI推理模型中,可以自動(dòng)生成高保真的3D數(shù)字人頭部模型及相應(yīng)的高清紋理、法線貼圖等數(shù)字資產(chǎn),具有毛孔、唇紋、毛發(fā)級(jí)別的細(xì)節(jié),再借助UE或Unity等基于物理的渲染引擎,可以得到高真實(shí)感的3D寫實(shí)數(shù)字人。騰訊云智能利用多模態(tài)合成AI技術(shù),能通過真人錄制的視頻數(shù)據(jù)快速生成2D真人數(shù)智人,具備與真人無(wú)異的交互和播報(bào)能力。同時(shí)2D真人形象不僅高度還原真人模特,也可通過融合技術(shù)創(chuàng)造世界不存在的形象。對(duì)于數(shù)字化紡織物制造商來(lái)說,以往靠懸臂法來(lái)測(cè)試,一塊布條的測(cè)試至少需要15分鐘,凌迪Style3D通過AI技術(shù)將采集速度提升了5倍。利用AI技術(shù),小K視頻動(dòng)捕無(wú)需穿戴任何硬件動(dòng)捕設(shè)備,僅需普通RGB攝像頭即可實(shí)時(shí)高精度捕捉人體身體,手指,表情等全棧3D運(yùn)動(dòng)數(shù)據(jù);用戶可以方便的驅(qū)動(dòng)數(shù)字人形象進(jìn)行動(dòng)作表達(dá),極大降低了動(dòng)捕技術(shù)的使用門檻。40PAGE/趨勢(shì)4:

數(shù)字人技術(shù)與SLAM、3D交互、體積視頻、空間音頻等技術(shù)深度融合,渲染將從本地到云端?

數(shù)字人作為3D呈現(xiàn)的一種方式,未來(lái)將與其他3D技術(shù)如SLAM(即時(shí)定位與地圖構(gòu)建)、體積視頻、空間音頻等融合,進(jìn)一步完善數(shù)字人和真實(shí)空間的交互。例如在直播場(chǎng)景中虛擬/真實(shí)空間中真人和數(shù)字人的交互,數(shù)字人對(duì)真實(shí)空間的感知等。?

同時(shí)由于數(shù)字人對(duì)渲染能力要求較高,未來(lái)云端渲染是重要的方向,將推動(dòng)云服務(wù)商從算力(CPU)云服務(wù),到渲染力(GPU)的云服務(wù)。但成本仍是云渲染普及的關(guān)鍵阻礙,需要突破。騰訊仿真風(fēng)數(shù)字人技術(shù),將虛擬人物投射到現(xiàn)實(shí)環(huán)境中,通過SLAM、實(shí)時(shí)3D渲染、混合現(xiàn)實(shí)等技術(shù),讓虛擬內(nèi)容的生產(chǎn)者可隨時(shí)在日常環(huán)境中取材和創(chuàng)作,

同時(shí)打通移動(dòng)端與云端能力;以PaaS化形式將端云渲染混合解決方案作為基礎(chǔ)設(shè)施服務(wù)輸出給業(yè)界。用戶A-手機(jī)本地渲染輸出畫面本地渲染輸出畫面用戶B-PC用戶C-VR云端分發(fā)服本地渲染輸出畫面用戶D云渲染節(jié)點(diǎn)1結(jié)構(gòu)化數(shù)據(jù)互聯(lián)網(wǎng)分發(fā)渲染畫面視頻流D視頻流E用戶E云渲染節(jié)點(diǎn)2渲染畫面容積視覺和跆拳道世界冠軍劉哮波合作,通過體積視頻技術(shù)在其道館可以隨時(shí)隨地把虛擬的自己召喚出來(lái)和小朋友進(jìn)行對(duì)戰(zhàn),甚至和他互動(dòng)合影。小朋友還可以通過體積視頻技術(shù)直接在家里觀看他各個(gè)招式的分解動(dòng)作。凌云光數(shù)字員工沐嵐的XR虛擬直播使用凌云光運(yùn)動(dòng)捕捉系統(tǒng)擴(kuò)展了攝影機(jī)跟蹤功能,系統(tǒng)在完成數(shù)字人動(dòng)作捕捉的同時(shí),利用SLAM技術(shù)對(duì)演播室多臺(tái)攝影機(jī)進(jìn)行同步跟蹤定位與大屏建模,一鍵完成多系統(tǒng)亞毫米級(jí)精準(zhǔn)融合標(biāo)定。眾多黑科技的加持,讓數(shù)字人沐嵐的直播充滿未來(lái)感及技術(shù)創(chuàng)新。云端渲染成本下降本地渲染云端渲染41PAGE/騰訊視頻自研虛實(shí)交互技術(shù),可低成本、高畫質(zhì)的連接真人和數(shù)字人騰訊視頻自研的虛實(shí)交互技術(shù),無(wú)需硬件外設(shè)輔助,任何人通過一臺(tái)相機(jī)/手機(jī)就可以把自己融入到虛擬世界中,極大降低了使用門檻和成本的同時(shí),高品質(zhì)的人物摳圖、清晰穩(wěn)定的畫面、創(chuàng)新酷炫的互動(dòng)也為內(nèi)容創(chuàng)作帶來(lái)無(wú)限發(fā)揮空間,具有廣闊的應(yīng)用前景和社會(huì)價(jià)值。故宮講壇真人虛景項(xiàng)目利用虛擬運(yùn)鏡跟蹤、二維碼空間定位技術(shù),可以實(shí)時(shí)渲染真人在虛擬空間中的位置,陰影。不僅可以保證人物和虛景地面的貼合。同時(shí)也可以保證在無(wú)需定位器的前提下,實(shí)拍攝像機(jī)和虛擬攝像機(jī)的運(yùn)動(dòng)同步。相

機(jī)

運(yùn)

動(dòng)

圖高質(zhì)量綠幕/無(wú)綠幕摳圖無(wú)硬件高質(zhì)量相機(jī)跟蹤算法虛實(shí)交互-實(shí)現(xiàn)對(duì)虛擬物體的操縱/踢/推等特效冬奧會(huì)數(shù)字人貝貝在數(shù)字人項(xiàng)目中,同樣可以運(yùn)用自研的摳圖、相機(jī)跟蹤、虛實(shí)交互的技術(shù)實(shí)現(xiàn)虛擬穩(wěn)定器,實(shí)現(xiàn)虛擬推拉鏡頭,3d特效前景等功能并且讓基于普通攝像頭形象驅(qū)動(dòng)的AI數(shù)字人可以和真人同步運(yùn)動(dòng),實(shí)現(xiàn)高質(zhì)量的互動(dòng)效果。支持3D/全景背景的替換支持2D/3D/VR視頻的渲染虛擬穩(wěn)定器可AI運(yùn)鏡,效果媲美實(shí)體穩(wěn)定器人體空間定位&虛擬陰影42PAGE/趨勢(shì)5:千行千面的數(shù)字人將成為人機(jī)交互新入口,但深度上仍需挖掘AI驅(qū)動(dòng)的數(shù)字人通過AI能力建立人與大數(shù)據(jù)的連接,提高效率并滿足人情感交流需求,提升用戶體驗(yàn),將成為人機(jī)交互新入口:?應(yīng)用廣度上:目前使用文字或語(yǔ)音交互的場(chǎng)景都可用AI數(shù)字人軟著陸的方式替代,不需要改變?cè)械臉I(yè)務(wù)邏輯和商業(yè)模式,大眾接受成本較低,并提供更好的用戶體驗(yàn),未來(lái)應(yīng)用場(chǎng)景非常廣泛,可以與各種領(lǐng)域相結(jié)合,實(shí)現(xiàn)服務(wù)規(guī)?;蜆?biāo)準(zhǔn)化。?應(yīng)用深度上:數(shù)字人作為企業(yè)的數(shù)字資產(chǎn),是對(duì)員工工作的增強(qiáng),具有生產(chǎn)力的屬性,可以進(jìn)一步釋放生產(chǎn)力,同時(shí)降本增效。未來(lái)數(shù)字人將根據(jù)不同行業(yè)的業(yè)務(wù)特點(diǎn)和應(yīng)用場(chǎng)景進(jìn)行更深度結(jié)合,孵化千行千面的數(shù)字員工,提供智能化服務(wù)。數(shù)字人增強(qiáng)客服人員的效能數(shù)字人提升人機(jī)交互體驗(yàn)機(jī)器當(dāng)前方式未來(lái)趨勢(shì)人人人當(dāng)前方式未來(lái)趨勢(shì)人人數(shù)字人機(jī)器數(shù)字人43PAGE/趨勢(shì)5:千行千面的數(shù)字人將成為人機(jī)交互新入口,但深度上仍需挖掘IP/內(nèi)容型、功能服務(wù)型、虛擬分身型等不同類型的數(shù)字人應(yīng)用領(lǐng)域非常廣泛,其中AI驅(qū)動(dòng)的功能服務(wù)型在在行業(yè)應(yīng)用仍處于探索階段,但已經(jīng)迅速擴(kuò)展到金融、傳媒市場(chǎng)、公共服務(wù)、生活服務(wù)、互聯(lián)網(wǎng)等,正向多元化發(fā)展。數(shù)字人行業(yè)應(yīng)用全景圖功能服務(wù)型IP/內(nèi)容型虛擬分身型政務(wù)教育家居交通出行

互聯(lián)網(wǎng)互聯(lián)網(wǎng)銀行資管保險(xiǎn)影視傳媒市場(chǎng)營(yíng)銷文旅影視傳媒和市場(chǎng)公共服務(wù)生活服務(wù)44PAGE/騰訊在傳媒、金融、政務(wù)等多個(gè)行業(yè)實(shí)現(xiàn)了開創(chuàng)性、規(guī)?;膽?yīng)用騰訊云智能和騰訊智影平臺(tái)合作,在數(shù)字人的形象、表現(xiàn)力、場(chǎng)景化能力上有豐富的儲(chǔ)備,在toB、toG方向有多年積累,特別在傳媒,金融,政務(wù)等領(lǐng)域?qū)崿F(xiàn)開創(chuàng)性和規(guī)?;膽?yīng)用。傳媒行業(yè)--

AI主播“新小萌”證券行業(yè)--首個(gè)AI證券主播司法行業(yè)--首個(gè)AI法官騰訊與新華社推出全球首個(gè)AI女主播“新小萌”。目前合作開發(fā)的三位主播都已在新華社APP上崗,參與了包括進(jìn)博會(huì)等若干重要報(bào)道,并且兩次參加服貿(mào)會(huì),作為媒體融合的典型案例進(jìn)行現(xiàn)場(chǎng)演示。AI證券主播參與廣發(fā)證券易淘金APP上播報(bào)每日的早盤視點(diǎn)、盤中熱點(diǎn)和收

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論