![計算機視覺調(diào)研報告_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/14/6ce77640-121c-4aa1-b799-c6f990082b75/6ce77640-121c-4aa1-b799-c6f990082b751.gif)
![計算機視覺調(diào)研報告_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/14/6ce77640-121c-4aa1-b799-c6f990082b75/6ce77640-121c-4aa1-b799-c6f990082b752.gif)
![計算機視覺調(diào)研報告_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/14/6ce77640-121c-4aa1-b799-c6f990082b75/6ce77640-121c-4aa1-b799-c6f990082b753.gif)
![計算機視覺調(diào)研報告_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/14/6ce77640-121c-4aa1-b799-c6f990082b75/6ce77640-121c-4aa1-b799-c6f990082b754.gif)
![計算機視覺調(diào)研報告_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/14/6ce77640-121c-4aa1-b799-c6f990082b75/6ce77640-121c-4aa1-b799-c6f990082b755.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、計算機視覺調(diào)研報告計算機視覺調(diào)研報告摘要:在信息時代高速發(fā)達的今天,計算機視覺作為計算機科學(xué)的一個分支,也在人們?nèi)粘I钪幸驳玫綇V泛的應(yīng)用,給人們的生活帶來許多的便利,促進了科學(xué)技術(shù)的發(fā)展,本文是主要介紹一下計算機視覺的發(fā)展、在工農(nóng)業(yè)以及其他行業(yè)的應(yīng)用,還簡要介紹了該技術(shù)在今天所面臨的一些問題。關(guān)鍵詞:計算機視覺;發(fā)展;應(yīng)用;面臨的問題;1.概述計算機視覺就是一門研究如何使機器學(xué)會看的技術(shù),簡言之,就是使用視覺傳感器或者計算機模擬人眼視覺的基本功能,即通過這種技術(shù)可以實現(xiàn)對外在世界實際場景的感知、采集、處理以及解釋理解等功能。此類技術(shù)的研究初衷是采集、感知相關(guān)環(huán)境的圖像,定位、辨識具體目標,確
2、認相關(guān)目標的排列分布組合、結(jié)構(gòu)特點和相關(guān)目標間的關(guān)系,從而能夠?qū)ν庠谑澜缋锏膶嶋H場景和目標做出有意義的識別和判斷;而且在今天計算機視覺是人工智能領(lǐng)域最熱門的研究課題之一,它和專家系統(tǒng)、自然語言理解已成為人工智能最活躍的三大領(lǐng)域。盡管它還是一門年輕的學(xué)科,還沒有形成完整的理論體系,在很多方面它解決問題的方法還是一種技巧,但它是實現(xiàn)工業(yè)生產(chǎn)高度自動化、機器人智能化、自主車導(dǎo)航、目標跟蹤,以及各種工業(yè)檢測、醫(yī)療和軍事應(yīng)用的核心內(nèi)容之一,也是實現(xiàn)第五代智能機的關(guān)鍵因素之一。所以對于計算機視覺的研究是非常有意義的,成熟的計算機視覺技術(shù)對人類的發(fā)展會有相當大的促進作用。2. 計算機視覺的發(fā)展計算機視覺是在
3、20世紀50年代從統(tǒng)計模式識別開始的,主要集中在二維圖像分析和識別上。20世紀60年代MIT的Roberts通過計算機程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對物體形狀及物體的空間關(guān)系進行描述。Roberts的研究工作開創(chuàng)了以理解三維場景為目的的三維計算機視覺的研究。20世紀70年代中期麻省理工學(xué)院人工智能實驗室正式開設(shè)“計算機視覺”課程,由國際著名學(xué)者B.K.P.Horn教授講授。David Marr教授于1973年應(yīng)邀在MIT·AI實驗室領(lǐng)導(dǎo)一個以博士生為主體的研究小組,1977年提出了不同于積木世界”分析方法的計算視覺理論該理論,稱為馬爾(Marr
4、)視覺理論,他認為視覺可分為三個階段,第一階段是早期視覺,其目的是抽取觀察者周圍景物表面的物理特性,第二階段是二維半簡圖或本征圖象;是在以觀察者為中心的坐標系中描述表面的各種特性,根據(jù)這些描述可以重建物體邊界、按表而和體積分割景物,但在以觀察者為中心的坐標系中只能得到可見表面的描述,得不到遮擋表面的描述,故稱二維半簡圖;第三階段是三維模ICU、視覺信息處理的最后一個層次,是用二維半簡圖中得到的表面信息建立適用于視覺識別的三維形狀描述,這個描述應(yīng)該與觀察者的視角無關(guān),也就是在以物體為中心的坐標系中,以各種符號關(guān)系和幾何結(jié)構(gòu)描述物體的三維結(jié)構(gòu)和空間關(guān)系。該理論在20世紀80年代成為計算機視覺研究領(lǐng)
5、域中的一個十分重要的理論框架。到20世紀80年代中期計算機視覺獲得了蓬勃發(fā)展,新概念、新方法、新理論不斷涌現(xiàn)比如,基于感知特證群的物體識別理論框架,主動視覺理論框架,視覺集成理論框架等。而且自80年代以來,計算機視覺的研究已經(jīng)實驗室走向?qū)嶋H應(yīng)用的發(fā)展階段。而計算機水平的飛速提高以及人工智能、并行處理和神經(jīng)元網(wǎng)絡(luò)等學(xué)科的發(fā)展,更促進了計算機視覺系統(tǒng)的實用化和涉足許多復(fù)雜視覺過程的研究。目前,計算機視覺技術(shù)正在廣泛的應(yīng)用于幾何計算、計算機圖形學(xué)、圖像處理、機器人學(xué)等多個領(lǐng)域中。3. 計算機視覺的應(yīng)用在網(wǎng)絡(luò)和信息時代非常發(fā)達的今天,計算機技術(shù)也在不斷的發(fā)展與完善,使得它在人們的現(xiàn)實生活中扮演的角色也
6、越來越多,而且該技術(shù)的應(yīng)用的領(lǐng)域也越來越廣,它所表現(xiàn)出來的價值也越來越高。下面就簡單的分析該技術(shù)在各個方面的應(yīng)用,在介紹它在各個方面的應(yīng)用之前簡要的引入一些計算機圖像處理的方法,因為計算機視覺的處理技術(shù)主要依賴于圖像的處理方法。3.1計算機視覺圖像處理方法3.1.1圖像變換圖像變換是許多圖像處理與分析技術(shù)的基礎(chǔ),為了有效快速地對圖像進行處理和分析,常需要將原定義在圖像空間的圖像以某種形式轉(zhuǎn)換到另一些空間,并利用在這些空間的特有性質(zhì)方便地進行一定的加工,最后再轉(zhuǎn)換回圖像空間以得到所需的效果。3.1.2圖像增強圖像增強目的是對圖像進行加工,以得到對具體應(yīng)用來說視覺效果更“好”更“有用”的圖像,從根
7、本上說并沒有圖像增強的通用標準,觀察者是某種增強技術(shù)優(yōu)劣的最終判斷者,由于視覺檢查和評價是相當主觀的過程,所謂“好圖像”的定義在比較增強算法性能中實際上是非常多變不定的。3.1.3圖像恢復(fù)圖像恢復(fù)也稱圖像還原,就是盡可能地減少或者去除數(shù)字圖像在獲取過程中的降質(zhì),恢復(fù)被退化圖像的本來面貌,從而改善圖像質(zhì)量。3.1.4圖像編碼圖像編碼也稱圖像壓縮,圖像數(shù)據(jù)量是非常巨大,無論傳輸或存儲需要對圖像數(shù)據(jù)進行有效的壓縮,壓縮數(shù)據(jù)量的重要方法是肖除冗余數(shù)據(jù),對圖像進行存儲、處理和傳輸?shù)戎斑M行,而在這之后需要將壓縮了的圖像解壓縮以重建原始圖像或其近似圖像。3.1.5圖像邊緣銳化圖像邊緣銳化處王里主要是加強圖
8、像中的輪廓邊緣和細節(jié),形成完整的物體邊界,達到將物體從圖像中分離出來或?qū)⒈硎就晃矬w表面的區(qū)域檢測出來的目的。3.1.6圖像分割圖像分割是指把一幅圖像分成不同的區(qū)域。這些區(qū)域要么對當前的任務(wù)有意義,要么有助于說明它們與實際物體或物體的某些部分之間的對應(yīng)關(guān)系,一般來講,分割出的區(qū)域需同時滿足均勻均勻性和連通性的條件。3.1.7圖像識別圖像識別是利用計算機識別出圖像中的目標分類,用機器智能代替人的智能,目前用于圖像識別的方法主要分為決策理論和結(jié)構(gòu)方法。圖像經(jīng)過處理后輸出圖像的質(zhì)量得到相當程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。3.2計算機視覺技術(shù)在工業(yè)領(lǐng)域的應(yīng)用
9、研究近年來,隨著計算機集成制造系統(tǒng)的推廣和應(yīng)用,計算機視覺的應(yīng)用已從國防工業(yè)轉(zhuǎn)向民用工業(yè),而且現(xiàn)在被廣泛應(yīng)用于電子、汽車、木材、紡織、包裝和航空等工業(yè)領(lǐng)域之中,之所以能夠得到廣泛應(yīng)用,是因為它易于同設(shè)計信息和加工控制信息集成,具有不與被檢測表面接觸、檢測速度快、抗干擾能力強等優(yōu)點;而且它可以保證產(chǎn)品質(zhì)量,提高生產(chǎn)率,解放人力,降低生成成本。. 3.2.1產(chǎn)品形位尺寸檢查計算機視覺在制造業(yè)中通常是檢查產(chǎn)品的尺寸是否在容許的范圍內(nèi)或產(chǎn)品是否有正確形狀。這類檢查方法主要涉及到被檢產(chǎn)品二維或三維的幾何特性,例如表面形狀、位置、圓度等特征,也就是空間特征的檢查。3.2.2產(chǎn)品表面質(zhì)量檢查通過計算機視覺對
10、產(chǎn)品表面凹陷、劃痕、裂紋以及磨損進行檢查或?qū)Ρ砻?、粗糙度和紋理進行檢測,從而對產(chǎn)品進行有效的評估或分級。3.2.3產(chǎn)品零部件缺失檢測在生產(chǎn)線上,通過計算機視覺能準確地檢查產(chǎn)品是否丟失零部件(螺釘、鉚釘?shù)龋┗驒z查產(chǎn)品是否混有外物、雜質(zhì)。3.2.4零部件文字標記識別與檢測 文字識別技術(shù)在工業(yè)自動化生產(chǎn)中有許多成功的應(yīng)用實例。序列號作為零部件的唯一身份標志,通常打印在電子元器件、集成電路板、大型工件成品的外表面上,由數(shù)字、字母和漢字等組成(以數(shù)字和字母居多)。這些字符標號或編碼,如采用人工方式用眼睛對這些字符進行觀察識別,將不能滿足高效率生產(chǎn)自動化的要求。由于字符在工件上的位置很多時候都不便于人眼觀
11、察;人眼疲勞因素的作用也會使檢測結(jié)果不能從根本上得到保證,有些情況下甚至不能進行正確識別。3.2.5視覺伺服系統(tǒng)計算機視覺技術(shù)應(yīng)用于機器人領(lǐng)域,為機器人建立視覺系統(tǒng),使得機器人能更靈活、更自主地適應(yīng)所處的環(huán)境,以滿足柔性生產(chǎn)中自動定位、裝配、搬運和自動焊接的需要。3.3計算機視覺技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用研究計算機視覺技術(shù)在農(nóng)業(yè)上的應(yīng)用研究,起始于20世紀70年代末期,主要應(yīng)用于植物種類的鑒別、農(nóng)產(chǎn)品品質(zhì)檢測與分級等。隨著計算機軟硬件技術(shù)、圖形圖像處理技術(shù)的迅猛發(fā)展,它在農(nóng)業(yè)上的應(yīng)用研究有了較大的突破,在農(nóng)業(yè)領(lǐng)域的生產(chǎn)前、生產(chǎn)中、收獲時和產(chǎn)后的各個環(huán)節(jié)中,均可以利用計算機視覺技術(shù)來實現(xiàn)這些農(nóng)業(yè)生產(chǎn)的
12、視覺化。計算機視覺在產(chǎn)前的應(yīng)用主要是檢驗種子質(zhì)量;在產(chǎn)中的應(yīng)用包括田間雜草識別、植物生長信息的監(jiān)測、病蟲害的監(jiān)視和營養(yǎng)脅迫診斷等方面;在農(nóng)作物收獲時的應(yīng)用主要體現(xiàn)在農(nóng)業(yè)機器人的研制與開發(fā)上;在產(chǎn)后的應(yīng)用包括水果分級和農(nóng)產(chǎn)品的加工等。3.3.1在產(chǎn)前的應(yīng)用計算機視覺技術(shù)在產(chǎn)前的應(yīng)用主要是檢驗農(nóng)作物種子質(zhì)量,其檢測方法有:凈度圖像分析、種子發(fā)芽圖像分析、品種鑒定的圖像分析和種子活力的漫射光測定。3.3.2在產(chǎn)中的應(yīng)用雜草的識別是根據(jù)雜草的不同的種類可以采取光譜分析法、顏色分析法、紋理分析法或外形分析法,確定農(nóng)產(chǎn)品中雜草密度和種類情況;利用計算機視覺技術(shù)對設(shè)施農(nóng)業(yè)中動植物生長進行監(jiān)測,不僅可以檢測設(shè)
13、施內(nèi)植物的葉面積、莖桿直徑、葉柄夾角等外部生長參數(shù),還可以根據(jù)果實表面顏色判別其成熟度,以及作物缺水缺肥等情況;3.3.3在產(chǎn)后的應(yīng)用通過圖像獲取設(shè)備獲取農(nóng)產(chǎn)品圖像,對圖像進行去噪、分割處理后,可以從獲取的圖像中得到豐富的參數(shù)和數(shù)據(jù)信息。針對圖像特征參數(shù)與農(nóng)業(yè)產(chǎn)品的外部物理參數(shù)(例如顏色、形狀或大小等)不用人眼依次測定對象便可對其進行質(zhì)量判別、篩選和分類,而且和人工檢驗相比具有效率高、識別率高、標準統(tǒng)一的優(yōu)點,因此計算機視覺技術(shù)動植物和農(nóng)產(chǎn)品等生物體的自動化檢測篩選系統(tǒng)中得到廣泛的使用。3.4計算機視覺技術(shù)在其他領(lǐng)域的應(yīng)用研究3.4.1計算機視覺技術(shù)在醫(yī)學(xué)領(lǐng)域的應(yīng)用研究X-CT、放射性同位素掃
14、描、B 型超聲、核磁共振成像,是現(xiàn)代醫(yī)學(xué)的四大成像技術(shù)。B 超檢測系統(tǒng)通過有規(guī)律的發(fā)射超聲波,接受從人體發(fā)射回來的聲音信號,形成灰度聲圖像線密度值。將計算機視覺技術(shù)應(yīng)用于臨床醫(yī)學(xué),可以準確的診斷出患者的狀況,從而提高準確性,避免誤診等現(xiàn)象。3.4.2計算機視覺技術(shù)在公安工作中的應(yīng)用指紋識別、人像識別是視覺技術(shù)應(yīng)用在公安工作中所取得的突出成果。將現(xiàn)場收集到的指紋錄入計算機,提取指紋特征后再和指紋庫里的指紋進行比對,就可以提供破案的線索。指紋識別也可用于出入海關(guān)的身份檢驗及指紋密碼鎖等方面,指紋印鑒已用于銀行業(yè)。計算機人像組合技術(shù)可以根據(jù)目擊者的描述,由計算機用不同的人面像部件組合出嫌疑人的人面像
15、協(xié)助破案。在公安刑偵中還應(yīng)用了模糊圖像復(fù)原技術(shù)對犯罪現(xiàn)場的模糊圖像進行復(fù)原處理。4.對計算機視覺技術(shù)發(fā)展的認識與人體視覺系統(tǒng)相比,目前的計算機視覺系統(tǒng)無論從功能上來說還是從可靠性上來說都還很不健全,可以說仍處于很不成熟的階段。原因是計算機視覺系統(tǒng)的研究過程面臨著一系列技術(shù)上的難點:1.由于系統(tǒng)內(nèi)部的和外界的各種干擾因素如噪聲,物體表面的光學(xué)不均勻性,不理想的照明條件引起的陰影干擾,表面輝點及背干擾等,使得視覺系統(tǒng)中的圖象處理階段就很難得到滿意的和可靠的結(jié)果,例如,至今尚無統(tǒng)一的方法來對付即使是并不復(fù)雜的但帶有曲面的物體的圖象,使得處理后能得到完整的輪廓線。真基元的丟失和假基元的增生有時是無法避
16、免的。這就給后階段的分析帶來了很大的困難。當然,利用強的預(yù)知識作為指導(dǎo),可以改善各階段處理的效果,但是這樣做就意味著犧牲系統(tǒng)的通用性;2.計算機視覺系統(tǒng)在分析和理解景物時,必須要在一幅或多幅平面圖象中提取了維特征信息深度信息或表面傾斜信息。這并不是一件簡單的事情。應(yīng)運而生一系列技術(shù),如體視學(xué),從運動圖象重建物體的三維結(jié)構(gòu),從幾個剪影恢復(fù)物體的三維信息等技術(shù)都是用來解決這一問題的。但是,上述這些技術(shù)都遇到了一個十分棘手的問題,就是如何在具有灰度失真,幾何失真(包括透視、旋轉(zhuǎn)、標尺變換等失真)和干擾的情況下求取兩幅和多幅圖象之間的對應(yīng)特征(對應(yīng)問題有時稱匹配問題或套準問題)。遺憾的是,至今尚無可靠
17、的通用的求取對應(yīng)特征的辦法,尤其在圖間失真和干擾比較嚴重的場合。利用照度學(xué)的信息可以從單幅圖象得到深度信息,但是,必須對物體表面的光學(xué)特性作出嚴格的均勻性假定,對于照明條件也要作出嚴格的假定。這就同真實世界的情況相差很遠。在景物分析中除了得到三維信息的困難外,在現(xiàn)實世界里,物體間相互遮擋,物體自身各部位間的遮擋,使得圖象分拆更加復(fù)雜化了。目前對諸如積木世界等簡單情況可以通過可見部分的信息有效地借助推理推得被遮擋部分的信息,但是這必須要有足夠的預(yù)知識作為指導(dǎo)。一般的遮擋問題尚無有效辦法解決。3.預(yù)知識的表達、獲取、存放、更新和檢索是很復(fù)雜的。人類的視覺系統(tǒng)具有驚人的分析理解能力。那怕是一個學(xué)令前
18、的兒童,就能從一群人的照片中不費力地找出他所熟識的人來。給一個成人看一張航空攝影照片,即使他從未去過那個地方,他也能指給你看那一部分是城區(qū),那兒是山脈,那兒是海岸線。人之所以具有高超的視覺分析和理解能力,是同人的大腦中已經(jīng)積累的大量知識有關(guān)的。人是如何精選、獲取、更新視覺知識,以及如何利用這些知識來分析景物的,至今還遠未研究透徹。4.實際工程上的困難。對于一幅典型的分辨率為30003000的航空攝影照片,用一個最簡單的33算子對其進行一次卷積操作,就要進行相當于次的乘法運算。對于每秒能進行50萬次乘法運算的計算機(速度已屬中等)得花200秒!對一幅或多幅圖象進行處理分析其運算量不知要比這積卷積操作大多少倍,所花的計算時間之長是可想而知的。然而實用的系統(tǒng)必須要實時地進行分析處理。這就迫使圖象系統(tǒng)的設(shè)計專家們放棄傳統(tǒng)的序貫計算技術(shù)而采取并行處理技術(shù)。這實際上是以硬件的規(guī)模擴大來換取處理速度的提高。但是硬件的規(guī)模擴大并非無限制的。硬件規(guī)模擴大不僅大大地增加了費用而且增加體積和能量消耗。但在很多應(yīng)用場合,留給視覺系統(tǒng)的空間和提供給它的電能都是有限的,如活動的機器人的視覺系統(tǒng)就
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 41850.1-2024機械振動機器振動的測量和評價第1部分:總則
- U-48520-生命科學(xué)試劑-MCE-8289
- Asante-potassium-green-1-AM-APG-1-AM-生命科學(xué)試劑-MCE-2611
- 二零二五年度醫(yī)療健康產(chǎn)業(yè)股權(quán)轉(zhuǎn)讓協(xié)議示范文本合同
- 2025年度大數(shù)據(jù)分析與應(yīng)用聯(lián)合開發(fā)合同
- 2025年度美縫工程智能化施工管理合同
- 二零二五年度商務(wù)咨詢與管理優(yōu)化合同
- 2025年度畫家與設(shè)計師合作簽約合同
- 施工現(xiàn)場施工排水管理制度
- 施工現(xiàn)場施工防地震災(zāi)害威脅制度
- 2025年中國濕度傳感器行業(yè)深度分析、投資前景、趨勢預(yù)測報告(智研咨詢)
- 人教版道德與法治二年級下冊《第一單元 讓我試試看》大單元整體教學(xué)設(shè)計2022課標
- 甘肅省蘭州市蘭煉一中2025屆數(shù)學(xué)高一上期末統(tǒng)考試題含解析
- 聯(lián)合體三方協(xié)議合同模板
- 2024年3季度青島房地產(chǎn)市場季度簡報
- 蘇東坡詞十首
- 山東省臨沂市2024年中考物理真題
- 2023年天津市文化和旅游局直屬事業(yè)單位招聘考試真題及答案
- 電力系統(tǒng)分析(郝亮亮)
- 改善護理服務(wù)行動計劃方案
- 建筑材料包銷協(xié)議書
評論
0/150
提交評論