下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于神經(jīng)網(wǎng)絡(luò)的圖像3D建模算法設(shè)計(jì)與實(shí)現(xiàn)摘要:隨著計(jì)算機(jī)的發(fā)明和普及,網(wǎng)絡(luò)速度和計(jì)算能力的快速增長(zhǎng)深刻地影響和改變著人們的生產(chǎn)生活方式,其中以3D技術(shù)的影響最為突出。圖像3D建模技術(shù),是目前圖像處理領(lǐng)域主要的研究方向之一。本文主要研究如何從圖像中提取3D信息。包括多種不同的基于多視角圖像3D建模方法以及最新的基于神經(jīng)網(wǎng)絡(luò)的圖像3D建模方法。最后,本文還重現(xiàn)了基于多角度單張圖像對(duì)3D物體的重建算法。該實(shí)驗(yàn)基于Matlab平臺(tái),圖像數(shù)據(jù)及訓(xùn)練網(wǎng)絡(luò)來(lái)源于卡耐基梅隆大學(xué)計(jì)算機(jī)視覺(jué)課程。實(shí)驗(yàn)結(jié)果顯示該算法能夠生成準(zhǔn)確的2D圖片深度圖,并較為完整的重建了圖片的3D模型。關(guān)鍵詞:圖像處理;神經(jīng)網(wǎng)絡(luò);3D重建
2、;點(diǎn)云算法Abstract:Withtheinventionandpopularizationofcomputers,therapidgrowthofnetworkspeedandcomputingabilityhasprofoundlyaffectedandchangedpeople'slifestyles,especiallyforthe3Dtechnology.Inparticular,image3Dmodelingtechnologyisoneofthemainresearchdirectionsinthefieldofimageprocessing.Therefore,thi
3、spapermainlyconsidershowtoextract3Dinformationfromsingle2Dimage.Itmainlyanalyzesavarietyofdifferent3Dmodelingmethodsbasedonmulti-viewimagesandneuralnetworks.Finally,thispaperalsoreproducesthereconstructionalgorithmfor3Dobjectsbasedonmulti-anglesingleimages.ThisexperimentwasbasedontheMatlabsoftware,a
4、ndtheimagedatacomesfromthecomputervisionclassatCarnegieMellonUniversity.Theexperimentalresultsshowthatthisalgorithmcangenerateaccurate2Dimagedepthmapsandreconstructthe3Dmodeloftheimagescompletely.Keywords:Imageprocessing;Neuralnetwork;3Dreconstruction;Pointcloudalgorithm摘要LAbstractL目錄U.1 引言11.1 研究背景
5、及意義11.2 圖像3D建模12 多視角圖像在3D圖像建模中的應(yīng)用32.1 基于深度圖重建42.2 基于點(diǎn)云重建52.2.1 點(diǎn)云重建算法62.2.2 點(diǎn)云重建結(jié)果82.3 本章小結(jié)93神經(jīng)網(wǎng)絡(luò)在3D圖像處理中的應(yīng)用93.1 人工神經(jīng)網(wǎng)絡(luò)93.2 卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionNeuralNetworks,CNN)103.2.1 卷積層103.2.2 下采樣層113.2.3 激活函數(shù)層113.3 卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用133.4 本章小結(jié)1343D圖像建模仿真實(shí)驗(yàn)144.1 理論背景144.2 實(shí)驗(yàn)步驟164.3 實(shí)驗(yàn)結(jié)果194.4 本章小結(jié)195結(jié)論與展望19參考文獻(xiàn)19致謝21II1引言
6、1.1 研究背景及意義近年來(lái),隨著阿凡達(dá)、捉妖記等為代表的3D高票房影片出現(xiàn)。3D電影獨(dú)特的空間表現(xiàn)力為電影藝術(shù)的展現(xiàn)開(kāi)辟了新的維度,推動(dòng)了當(dāng)代電影市場(chǎng)的空前繁榮。有關(guān)3D電影的制作問(wèn)題也引起了廣泛的討論。除了直接使用昂貴的立體深度攝像機(jī)直接引導(dǎo)三維場(chǎng)景外,還可以在原始二維圖像的基礎(chǔ)上進(jìn)行轉(zhuǎn)換1。利用預(yù)測(cè)的深度信息,通過(guò)不同的方法重建二維圖像,實(shí)現(xiàn)基于深度圖像的三維圖像繪制(DIBR)技術(shù)。3D場(chǎng)景圖像的構(gòu)建關(guān)鍵因素在于獲取圖像對(duì)應(yīng)的深度圖。因此,如果能夠從二維圖像中準(zhǔn)確估計(jì)出深度,具不但能夠應(yīng)用于2D電影轉(zhuǎn)制3D電影領(lǐng)域,還能廣泛應(yīng)用于其它計(jì)算機(jī)視覺(jué)領(lǐng)域。目前,計(jì)算機(jī)領(lǐng)域存在著一個(gè)固有的瓶頸
7、,即當(dāng)三維世界的信息被映射成二維圖像時(shí),不可避免地會(huì)造成局部空間結(jié)構(gòu)信息和表面形狀信息缺失。這將導(dǎo)致物體形狀2的錯(cuò)誤重建。在圖像語(yǔ)義分割方面,也會(huì)造成遮擋、粘連等投影方向的多目標(biāo)分割網(wǎng)。因此,該技術(shù)也可應(yīng)用于語(yǔ)義分割,姿態(tài)估計(jì),場(chǎng)景理解。綜上可得,一旦能夠精確地恢復(fù)二維圖像的深度圖,整個(gè)計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)?huì)向前邁出堅(jiān)實(shí)的一步。1.2 圖像3D建模我們生活在一個(gè)三維的世界中,但對(duì)它的觀察通常是用相機(jī)拍攝的二維影像的形式。因此在計(jì)算機(jī)視覺(jué)領(lǐng)域,一個(gè)關(guān)鍵目標(biāo)是恢復(fù)這些基于2D圖像的3D結(jié)構(gòu)。對(duì)真實(shí)物體或場(chǎng)景的三維幾何進(jìn)行建模是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù),目前研究人員已經(jīng)采用了不同的工具和方法,例如計(jì)算機(jī)
8、輔助設(shè)計(jì)(CAD)工具、胳膊探測(cè)器、活動(dòng)方法和被動(dòng)的基于圖像的方法等。其中,基于單幅圖像的3D模型重建方法是本文主要研究的主題,它提供了一種基于小部分成本獲取準(zhǔn)確3D內(nèi)容的快速方法。基于單幅圖像的三維重建算法的方法可以被描述為一一通過(guò)給定一組物體或第1頁(yè)(共21頁(yè))場(chǎng)景的照片,根據(jù)已知材料,視點(diǎn)和照明的假設(shè)估計(jì)最有可能解釋這些照片的3D形狀條件(見(jiàn)圖1-1)。該定義強(qiáng)調(diào)了該任務(wù)的假設(shè),即材料,視角和照明已知的假設(shè)。因此,如果沒(méi)有進(jìn)一步的假設(shè),單一算法就不能單獨(dú)從照片正確重建3D幾何模型。在一組合理的假設(shè)下,例如剛性的朗伯紋理表面,最先進(jìn)的技術(shù)甚至可以從數(shù)百萬(wàn)張照片中對(duì)物體進(jìn)行高度詳細(xì)的重建。圖
9、1-1基于圖像的三維重建進(jìn)行這種推理的嘗試很多,可以追溯到該領(lǐng)域的最早幾年。盡管如此,目前研究進(jìn)展緩慢的原因有幾個(gè):首先,這項(xiàng)任務(wù)本身就是不合適的。因?yàn)閷?duì)象總是出現(xiàn)在自我遮擋下,并且有無(wú)數(shù)的3D結(jié)構(gòu)可能會(huì)引起特定的2D視角。解決這個(gè)問(wèn)題的方法是通過(guò)學(xué)習(xí)統(tǒng)計(jì)模型來(lái)識(shí)別哪些3D結(jié)構(gòu)是可能的,哪些不是。其次,即使有了這樣的統(tǒng)計(jì)模型,推論也是棘手的。這包括將圖像像素映射到3D表示的子任務(wù),在相同結(jié)構(gòu)的不同圖像之間檢測(cè)和建立對(duì)應(yīng)關(guān)系以及處理該3D空間中表示的多模態(tài)的子任務(wù)。第三,目前還不清楚3D結(jié)構(gòu)如何最好地表現(xiàn)出來(lái),例如,通過(guò)密集的體素,通過(guò)定義多面體網(wǎng)格的頂點(diǎn),邊和面的集合,或其他類(lèi)型的表示。最后,
10、由于地面實(shí)況三維數(shù)據(jù)收集起來(lái)很困難且成本很高,因此迄今為止數(shù)據(jù)集的規(guī)模和范圍相對(duì)有限。在本文中,我們使用基于多視角單幅圖片的點(diǎn)云算法來(lái)學(xué)習(xí)生成3D結(jié)構(gòu)模型,并通過(guò)神經(jīng)網(wǎng)絡(luò)算法進(jìn)行概率推理,從而從2D圖像中恢復(fù)3D結(jié)構(gòu)。第2頁(yè)(共21頁(yè))2多視角圖像在3D圖像建模中的應(yīng)用本章主要討論幾種當(dāng)前流行的多視圖(multi-viewstereo,MVS)算法在3D圖像重建中的應(yīng)用。圖2-1、2-2展示了現(xiàn)代MVS算法所使用的兩種輸出場(chǎng)景表示法:深度圖和點(diǎn)云法。同時(shí)值得注意的是,由于點(diǎn)云重建通過(guò)基于點(diǎn)的渲染技術(shù)可視化4,因此可能會(huì)呈現(xiàn)完整紋理映射網(wǎng)格模型的外觀,但它們只是具有顏色的獨(dú)立3D點(diǎn)圖2-2基于點(diǎn)云重建為了評(píng)估MVS算法的準(zhǔn)確性,研究人員進(jìn)行了定量評(píng)估來(lái)驗(yàn)證。2006年,Seitz,Curless,Diebel,Scharstein和Szeliski等人為MVS定量評(píng)估奠定了基礎(chǔ)5,該算法評(píng)估了兩個(gè)低分辨率(640X480)圖像對(duì)象數(shù)據(jù)集上的MVS算法。這個(gè)評(píng)估被稱(chēng)為MiddleburyMVS評(píng)估。雖然使用低分辨率圖像可能并不能等同于高分辨率數(shù)碼相機(jī),但它具有將校準(zhǔn)誤差影響降至最低的優(yōu)勢(shì):因?yàn)檩^高的圖像分辨率需要更精確和可重復(fù)性的機(jī)械設(shè)備(例如,機(jī)器人手臂)。幾年之后,StrechaHa
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度有機(jī)肥料生產(chǎn)與銷(xiāo)售風(fēng)險(xiǎn)控制合作協(xié)議2篇
- 2025年度體育場(chǎng)館建設(shè)承包合同范本4篇
- 2025年度新能源汽車(chē)充電樁租賃合同書(shū)3篇
- 2024綠化項(xiàng)目勞務(wù)施工分包合同書(shū)版B版
- 2025年絕緣筒項(xiàng)目可行性研究報(bào)告
- 2025年模特選美賽事形象權(quán)保護(hù)與保密合同范本3篇
- 螺旋式除塵器行業(yè)市場(chǎng)發(fā)展及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 2025年度個(gè)人留學(xué)貸款擔(dān)保合同范本12篇
- 2025年度室內(nèi)外景觀設(shè)計(jì)及施工合同樣本4篇
- 2025年度藝術(shù)品抵押借款咨詢(xún)合同范本3篇
- 2022年湖北省武漢市中考數(shù)學(xué)試卷含解析
- TLFSA 003-2020 危害分析與關(guān)鍵控制點(diǎn)(HACCP)體系調(diào)味面制品生產(chǎn)企業(yè)要求
- LY/T 2244.3-2014自然保護(hù)區(qū)保護(hù)成效評(píng)估技術(shù)導(dǎo)則第3部分:景觀保護(hù)
- 紀(jì)律教育月批評(píng)與自我批評(píng)五篇
- GB/T 26480-2011閥門(mén)的檢驗(yàn)和試驗(yàn)
- GB/T 13342-2007船用往復(fù)式液壓缸通用技術(shù)條件
- 藥店員工教育培訓(xùn)資料
- GB 20371-2016食品安全國(guó)家標(biāo)準(zhǔn)食品加工用植物蛋白
- 【英語(yǔ)手寫(xiě)體】26英文字母手寫(xiě)體描紅書(shū)寫(xiě)字帖
- 實(shí)習(xí)護(hù)生壓瘡相關(guān)知識(shí)掌握情況及預(yù)防態(tài)度的調(diào)查問(wèn)卷
- 《駱駝祥子》第(9、10、11、12)章檢測(cè)題
評(píng)論
0/150
提交評(píng)論