版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
計算機視覺預備知識第一頁,共四十五頁,2022年,8月28日人類視覺原理與特點
人類從外界環(huán)境獲取信息,一般是通過視覺﹑觸覺﹑聽覺﹑嗅覺等感覺器官來實現的。其中,60%-80%的信息是由人的眼睛,即視覺來獲得的。可見,視覺器官是人類的最重要的感知器官。第二頁,共四十五頁,2022年,8月28日人類的視覺系統(tǒng)1,眼睛2,視覺神經系統(tǒng)第三頁,共四十五頁,2022年,8月28日基本視覺信息
1.亮度:亮度是最基本的視覺信息,亮度是一種外界輻射的物理量在我們視覺中反映出來的心理物理量。2.形狀:由物體在視覺空間上的亮度分布,顏色分布或運動狀態(tài)不同而顯示出來的。3.運動。4.顏色:是一種主觀感覺,目前只在感受器細胞水平和心理物理的宏觀水平上得到了較深入的研究。第四頁,共四十五頁,2022年,8月28日
例如:雪地上一張白紙,荒野中潛伏的狼,都比較難以覺察。相反,雪地上一張彩紙,綠草地上一朵紅花,荒野中奔跑的狼,都比較容易發(fā)現,這是由于物體形狀因亮度、顏色、運動等因素而突顯出來,易于被人眼分辨出來。第五頁,共四十五頁,2022年,8月28日5.深度知覺:判斷物體距離或深度的感覺。 例如:伸手拿一本書,躲開汽車或障礙物,把足球踢入球門等。 ——外界目標在視網膜上的象是二維的,而且同一物體在左右眼的視網膜上的成象有著微小的差異,這種差異為立體視覺提供了最基本的信息——視差。——還有許多單眼的信息可以產生深度信息的估計,如物體的重疊、透視(近大遠小,近清晰遠模糊,近亮遠暗)、明暗、紋理及運動。第六頁,共四十五頁,2022年,8月28日視覺中的一些心理和生理特征與現象
1.視覺的相對性:視覺感知的結果不僅僅取決于刺激本身,同時還受經驗、對比等的影響,這就是視覺的相對性。
例如:初升的旭日和正午的驕陽究竟何者離我們更近。2.視覺的選擇性
例如:視而不見
第七頁,共四十五頁,2022年,8月28日3.視覺的整體性:整體性是指超越對部分感知之和而產生的一種整體知覺經驗,即整體大于部分之和。
4.視覺的恒常性
1).亮度恒常性
例如:一匹黑布和一匹白布 原因:先驗知識;本體反射率。
2).大小恒常性
例如:遠處的牛比近處的狗要大
3).形狀恒常性
4).顏色恒常性第八頁,共四十五頁,2022年,8月28日5.錯視現象(a)高度錯視;(b)長度錯視;(c)平行線錯視;(d)大小錯視;(e)主從錯視;第九頁,共四十五頁,2022年,8月28日第十頁,共四十五頁,2022年,8月28日第十一頁,共四十五頁,2022年,8月28日計算機視覺計算機視覺是指用計算機實現人的視覺功能——對客觀世界的三維場景的感知、識別和理解。第十二頁,共四十五頁,2022年,8月28日圖像輸入人機交互處理
結果輸出
圖像理解
圖像分析
圖像處理數字化計算機視覺系統(tǒng)的組成及原理第十三頁,共四十五頁,2022年,8月28日計算機數字圖象處理系統(tǒng)
幀存攝像頭A/DLUT監(jiān)視器D/A微機接口顯示器系統(tǒng)總線內存顯存CPU計算機圖象采集卡第十四頁,共四十五頁,2022年,8月28日CCD攝像頭
CCD(ChargeCouplingDevice)攝像頭由一組離散的光敏元件陣列組成,當光線照到這個陣列上時,每個光敏元件上產生電荷。電荷的多少和光敏元件上的照度成正比,由此產生的電信號反映光強。這些電信號用兩相時鐘脈沖順序傳送,就產生代表圖像的電壓時間信號。第十五頁,共四十五頁,2022年,8月28日XOnYm視頻圖像構成原理分辨率m
×n如:480×640灰度圖像I=f(x,y)彩色圖像IR=fR(x,y)IG=fG(x,y)IB=fB(x,y)制式PAL/NTSC視頻圖像數字圖像像素第十六頁,共四十五頁,2022年,8月28日圖象數字化
黑白圖象數字化彩色圖象數字化第十七頁,共四十五頁,2022年,8月28日計算機視覺基本特點
分階段信息處理,多層次信息表示絕大部分問題為病態(tài)問題
原始信息被污染,信息處理量巨大
一種知識導引與管理系統(tǒng)
多學科交叉與結合
第十八頁,共四十五頁,2022年,8月28日實用圖像處理技術
灰度圖像彩色圖像二值化圖像
第十九頁,共四十五頁,2022年,8月28日圖像的增強
1.直方圖的均衡化
第二十頁,共四十五頁,2022年,8月28日2.平滑濾波
原圖噪聲污染后的圖像第二十一頁,共四十五頁,2022年,8月28日均值濾波后的圖像中值濾波后的圖像第二十二頁,共四十五頁,2022年,8月28日3.銳化(邊緣檢測)
第二十三頁,共四十五頁,2022年,8月28日彩色圖像分割方法
三色學說假設人視網膜上有三種神經纖維,每種神經纖維的興奮都引起紅綠藍原色中的一種的感覺。光作用在視網膜上雖然能同時引起三種纖維的興奮,但波長不同,引起三種纖維的興奮程度不同,人眼就產生不同的顏色感覺。
第二十四頁,共四十五頁,2022年,8月28日三種視神經興奮曲線
紅色纖維綠色纖維藍色纖維紅橙黃綠藍紫第二十五頁,共四十五頁,2022年,8月28日顏色視覺和顏色空間理論
三色原理
現代色度學理論指出,人對任何一種顏色的感覺,都可以用紅、綠、藍三種單色加權混合產生,因此,紅、綠、藍三種單色稱為三基色,這就是三色原理。顏色空間
各顏色的光都可以由紅、綠、藍三種基色光加權混合而成,因此,彩色空間是三維的線形空間,任何一種具有一定亮度的顏色光都是空間中的一個點(或向量),這個空間就是顏色空間。第二十六頁,共四十五頁,2022年,8月28日幾種顏色空間RGB顏色空間
當我們選擇具有確定光通量的紅綠藍三基色光作為三維顏色空間的基時,就構成了RGB顏色空間。顏色空間不是唯一的
格拉斯曼定律指出,人的視覺只能分辨顏色的三種變化(例如明度、色度、飽和度)。這就是說,通過對RGB顏色空間進行坐標變換,可以產生新的顏色空間。XYZ表色系統(tǒng)YIQ表色系統(tǒng)HSI表色系統(tǒng)
第二十七頁,共四十五頁,2022年,8月28日彩色視覺系統(tǒng)顏色分類
顏色信息提取
從理論上講,在這個空間中的每一個點都代表一種顏色,因而,在這個空間中有16.7兆種顏色。但從實際上看,這16.7兆個點并不簡單的劃分為16.7兆種顏色。GRB255RGB顏色空間255255第二十八頁,共四十五頁,2022年,8月28日HIS顏色模型第二十九頁,共四十五頁,2022年,8月28日顏色空間的相互轉換
第三十頁,共四十五頁,2022年,8月28日圖5.30劃分HSI空間的方法顏色模型的轉換第三十一頁,共四十五頁,2022年,8月28日計算機視覺預備知識
暫時到此第三十二頁,共四十五頁,2022年,8月28日返回第三十三頁,共四十五頁,2022年,8月28日返回第三十四頁,共四十五頁,2022年,8月28日圖像處理由于實際景物轉換為圖像信號時,總會引入各種噪聲或畸變失真,一般需要先進行圖像處理。這一過程借用了大量的圖象處理技術和算法,如圖象濾波、圖像增強、邊緣檢測等,以便從圖象中抽取諸如角點、邊緣﹑線條、邊界以及色彩等關于場景的基本特征;這一過程還包含了各種圖象變換(如校正)、圖象紋理檢測、圖象運動檢測等;有時還采用圖像編碼壓縮技術大大地減少信息量,以達到減少對計算機存儲容量和傳輸通道的要求。
返回第三十五頁,共四十五頁,2022年,8月28日圖象分析圖象分析的主要任務是恢復場景的深度、表面法線方向、輪廓等有關場景的2.5維信息。實現的途徑有立體視覺、測距成象、運動估計、明暗特征、紋理特征等估計方法。系統(tǒng)標定、系統(tǒng)成象模型等研究內容一般也是在這個層次上進行的。
返回第三十六頁,共四十五頁,2022年,8月28日圖象理解圖象理解是在以物體為中心的坐標系中,在原始輸入圖象、圖象基本特征、2.5維圖的基礎上,恢復物體的完整三維圖,建立物體三維描述,識別三維物體并確定物體的位置和方向。
返回第三十七頁,共四十五頁,2022年,8月28日絕大部分問題為病態(tài)問題
由于視覺問題是成象過程的逆過程,成象是從三維向二維投影的過程,因而在這個過程中會把深度信息丟失,造成圖象的多義性,同時諸如光照﹑材料特性、朝向、距離等信息都反映成唯一的測量值——灰度,因而要從這唯一的測量值恢復上述一個或幾個反映物體本質特征的參數是一個病態(tài)的過程。成象中由于大氣擾動、鏡頭因素、傳感器噪聲、傳輸噪聲以及量化噪聲等的干擾,都會使圖象產生失真,這些干擾多具有隨機性。以上這些病態(tài)性問題,在處理和分析過程中都會導致圖象的解不唯一。
返回第三十八頁,共四十五頁,2022年,8月28日原始信息被污染,信息處理量巨大
灰度圖象,彩色圖象,深度圖象的信息量十分巨大,比如分辨率為640×480的8位灰度圖象的數據量為300K,同樣分辨率的彩色圖象的數據量是900K。如果處理的是圖象序列,則數據量更大。巨大的數據量需要巨大的存貯空間,還不易實現快速處理。同時,由于光學成像通道和電子線路成像通道存在大量的隨機噪聲,使得原始信息被污染,這也增加了后續(xù)處理的難度。返回第三十九頁,共四十五頁,2022年,8月28日一種知識導引與管理系統(tǒng)在視覺過程中對一幅圖象的理解需要大量的關于任務領域的知識,這些知識不同于問題求解中的知識可以明確地顯式表示;人類獲取信息的60%-80%是通過視覺得到的,因而這些知識涉及面之廣難以預測。因此視覺系統(tǒng)中的知識管理是一個重要的問題。我們會看到,計算機視覺系統(tǒng)的最大特征是,在視覺的各個階段,系統(tǒng)盡可能地進行自動運算。為此,系統(tǒng)需要使用各種知識,包括特征模型、成象模型、物體模型和物體間的關系等。如果計算機視覺系統(tǒng)不用這些知識,則其應用的范圍及其功能將十分有限。返回第四十頁,共四十五頁,2022年,8月28日多學科交叉與結合
計算機視覺計算機科學心理學生理學物理學信號處理數學圖象圖形學模式識別與人工智能返回第四十一頁,共四十五頁,2022年,8月28日黑白圖象數字化視頻輸入預處理A/D數字輸出同步鎖相采樣脈沖形成地址形成地址輸出返回第四十二頁,共四十五頁,2022年,8月28日彩色圖象數字化
解碼器彩色視頻輸入預處理A/DGD預處理A/DRD預處理A/DBD返回第四十三頁,共四十五頁,2022年,8月28日圖像的灰度直方圖n(I)--I為一幅圖像的灰度直方圖(圖5﹒14)對灰度圖像而言,一個圖像的灰度直方圖整體地描述了這幅圖像的灰度分布設I1,I2,﹒﹒﹒IL為一幅給定圖像的離散強度,則直方圖的第j個值為:
其中,mj為灰度Ij的像素點的數目,m為圖像總像素數。n(I)I圖5﹒14一幅圖像的灰度直方圖返回第四十
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房產繼承公積金貸款買賣合同4篇
- 2025年校長聘任合同:聚焦核心素養(yǎng)培養(yǎng)合作框架3篇
- 2025-2030年中國麥芽糊精行業(yè)發(fā)展現狀及前景趨勢分析報告
- 2025-2030年中國酸奶發(fā)酵劑行業(yè)市場前景趨勢與投資潛力分析報告
- 2025年度煤炭鐵路運輸供應鏈金融服務合同3篇
- 2025年相鄰土地土地流轉稅收優(yōu)惠政策協(xié)議3篇
- 2025-2030年中國觸摸屏玻璃基板行業(yè)市場運行狀況及發(fā)展趨勢預測報告
- 2025-2030年中國螺絲刀行業(yè)市場發(fā)展現狀及前景規(guī)劃研究報告
- 二零二五年度戶外廣告位臨時租賃合同示范文本4篇
- 工程管理重大風險應對方案
- 直播帶貨助農現狀及發(fā)展對策研究-以抖音直播為例(開題)
- 腰椎間盤突出疑難病例討論
- 《光伏發(fā)電工程工程量清單計價規(guī)范》
- 2023-2024學年度人教版四年級語文上冊寒假作業(yè)
- (完整版)保證藥品信息來源合法、真實、安全的管理措施、情況說明及相關證明
- 營銷專員績效考核指標
- 陜西麟游風電吊裝方案專家論證版
- 供應商審核培訓教程
- 【盒馬鮮生生鮮類產品配送服務問題及優(yōu)化建議分析10000字(論文)】
- 肝硬化心衰患者的護理查房課件
評論
0/150
提交評論