數(shù)字媒體技術(shù)導(dǎo)論(微課版)課件 第2章 數(shù)字圖像與計算機視覺技術(shù)_第1頁
數(shù)字媒體技術(shù)導(dǎo)論(微課版)課件 第2章 數(shù)字圖像與計算機視覺技術(shù)_第2頁
數(shù)字媒體技術(shù)導(dǎo)論(微課版)課件 第2章 數(shù)字圖像與計算機視覺技術(shù)_第3頁
數(shù)字媒體技術(shù)導(dǎo)論(微課版)課件 第2章 數(shù)字圖像與計算機視覺技術(shù)_第4頁
數(shù)字媒體技術(shù)導(dǎo)論(微課版)課件 第2章 數(shù)字圖像與計算機視覺技術(shù)_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第2章數(shù)字圖像與計算機視覺技術(shù)數(shù)字媒體技術(shù)導(dǎo)論現(xiàn)代編著新技術(shù)數(shù)字2.1數(shù)字圖像基礎(chǔ)知識2.2數(shù)字圖像處理關(guān)鍵技術(shù)2.3數(shù)字圖像處理軟件Photoshop的應(yīng)用2.4計算機視覺2.1.1

數(shù)字圖像的概念“圖”和“像”“圖”是物體反射或透射光的分布,是客觀世界的反映;而“像”則是人類視覺系統(tǒng)對圖的響應(yīng),是人的大腦對圖的印象或認識,是人的一種感覺。圖像是圖和像的有機結(jié)合,既反映物體的客觀存在,又體現(xiàn)人的感知因素。所有具有視覺效果的畫面都可稱為圖像,包括紙介質(zhì)、底片、照片、電視、投影儀或計算機屏幕上具有視覺效果的畫面。圖像是人類認識世界的重要來源,照片、繪畫、剪貼畫、書法作品、影視畫面、X光片都屬于圖像。數(shù)字圖像,又稱為數(shù)碼圖像或數(shù)位圖像,是由模擬圖像數(shù)字化得到的,可以用計算機或數(shù)字電路存儲和處理的圖像。簡單來說,數(shù)字圖像就是用數(shù)字信號表示的圖像。廣義上的圖像數(shù)字圖像2.1.2數(shù)字圖像的類型——位圖與矢量圖1.位圖放大位圖的顯示效果位圖又稱柵格圖、像素圖或點陣圖,它是由許多離散的、方格的點所組成,類似于M(行)×N(列)的點陣,這些點稱為像素(pixel),像素是位圖的基本元素單位。用數(shù)碼相機拍攝的照片、掃描儀掃描的圖片,以及手機、計算機截屏的圖片都屬于位圖。位圖的特點是可以表現(xiàn)豐富的色彩變化和細微過渡,產(chǎn)生逼真的效果,方便在不同軟件之間交換使用,但在保存時需要記錄每個像素的位置和顏色信息,會占用較大的存儲空間。位圖的顯示比例不斷放大,圖像會失真變模糊,圖像上的線條和形狀將產(chǎn)生鋸齒,參差不齊。12432.1.2數(shù)字圖像的類型——位圖與矢量圖1.位圖(1)位圖的質(zhì)量、大小位圖的質(zhì)量與其本身的圖像分辨率有關(guān),圖像分辨率也叫像素密度,指每英寸圖像內(nèi)有多少個像素,分辨率的單位為像素/英寸(PixelsPerInch,PPI)。相同尺寸的圖像,像素的個數(shù)越多,圖像分辨率越高,圖像越清晰,即圖像的清晰度與其總像素數(shù)直接有關(guān)。對于存儲在計算機中的位圖,其圖像分辨率也可用像素總數(shù)表示,即圖像寬度×圖像高度,其中,圖像寬度和圖像高度分別指圖像水平和垂直方向上的像素數(shù)量。位圖的質(zhì)量位圖的文件大小位圖圖像文件大小是指在磁盤上存儲圖像所需的字節(jié)數(shù),由圖像的像素總數(shù)(或圖像尺寸)和色彩深度兩個因素決定。色彩深度又稱圖像深度,是指位圖圖像中記錄每個像素顏色信息所用的二進制數(shù)位數(shù)。對于灰度圖像(又稱黑白圖像)來說,色彩深度決定了該圖像可以使用的灰度級別,即灰度圖像沒有色彩,但存在灰度變化;對于彩色圖像來說,色彩深度決定了該圖像可以使用的最多顏色數(shù)目。2.1.2

數(shù)字圖像的類型——位圖與矢量圖1.位圖(2)位圖的文件格式不同的圖像文件格式對圖像的質(zhì)量有直接影響,高質(zhì)量的圖像可以讓畫面顯得更加逼真和細膩,但圖像文件也會更大,因此,在選擇圖像文件格式時,應(yīng)考慮圖像的最終用途。BMPBMP是標準的Windows圖像文件格式,是一種與硬件設(shè)備無關(guān)的圖像文件格式,在色彩還原上的效果很好,屬于無損壓縮,但文件占用的存儲空間較大。JPEGJPEG是一種很常見的圖像文件格式,文件擴展名為.jpg或.jpeg,其特點是壓縮比高,生成的文件體積小,但圖像質(zhì)量會受到影響。TIFFTIFF是一種高質(zhì)量的圖像文件格式,文件擴展名為.tif或.tiff,其生成的文件較大,當對圖像質(zhì)量要求較高時,可以選擇這種格式。GIFGIF是一種在網(wǎng)絡(luò)上被廣泛應(yīng)用的圖像文件格式,其文件擴展名為.gif,這種格式的文件很小,支持動畫和透明效果。PNGPNG結(jié)合了GIF和TIFF的優(yōu)點,具有壓縮不失真、支持透明背景等特點。2.1.2

數(shù)字圖像的類型——位圖與矢量圖2.矢量圖矢量圖,又叫向量圖,也稱為繪圖圖形,是由數(shù)學算法定義的圖形元素,如直線和曲線等元素組成的數(shù)字圖像,這些圖形元素在計算機中可用數(shù)字表示。矢量圖可用點、線和面來描述圖形,存儲的是圖像信息的輪廓部分,而不是圖像的每個像素點,它們不需要用像素來表示,其質(zhì)量大小不依賴于分辨率。矢量圖生成的文件占用存儲空間較小,文件大小只與圖形復(fù)雜程度有關(guān),一般圖形越復(fù)雜,文件越大,并且無論放大、縮小或旋轉(zhuǎn)矢量圖都不會使其失真變模糊,但是難以表現(xiàn)色彩層次。2.1.2

數(shù)字圖像的類型——位圖與矢量圖2.矢量圖CDR是矢量圖形設(shè)計和排版軟件CorelDraw的專用文件存儲格式,其文件擴展名為.cdr。CDR文件在CorelDraw應(yīng)用軟件中能夠以源文件的方式使用、編輯,常用于產(chǎn)品外包裝圖形、標簽、海報的設(shè)計、排版等。AI是矢量圖形編輯軟件Illustrator創(chuàng)建的原始矢量圖形文件格式,其文件擴展名為.ai。AI文件可以包含文本、插圖、圖形和其他矢量圖形元素,常用于創(chuàng)建需要高質(zhì)量矢量圖形的項目。EPS是一種在印刷行業(yè)和數(shù)字媒體中廣泛使用的矢量圖形文件格式,其文件擴展名為.eps,Illustrator和CorelDraw這兩款矢量圖形制作軟件都可以導(dǎo)出EPS文件。Photoshop應(yīng)用軟件也可以打開EPS文件,但打開后的圖片是位圖而非矢量圖。DWG是計算機輔助設(shè)計軟件CAD的專用文件存儲格式,其文件擴展名為.dwg。DWG是一種高效、穩(wěn)定、可靠的文件格式,常用于建筑設(shè)計、工程設(shè)計、汽車設(shè)計等工業(yè)設(shè)計領(lǐng)域。CDRAIEPSDWG2.1.3數(shù)字圖像的色彩模式1.色彩(1)色彩的分類VS無彩色包括黑白灰,按照一定的變化規(guī)律,可以將這3種色彩排成由白色漸變到淺灰、中灰、深灰到黑色的系列,色度學上稱此為黑白系列。有彩色簡稱彩色系,它以紅、橙、黃、綠、青、藍、紫等為基本色,基本色相互混合,以及基本色與無彩色所混合形成的所有顏色都屬于有彩色。無彩色有彩色2.1.3數(shù)字圖像的色彩模式1.色彩(2)色彩三要素色相即色彩的相貌稱謂,是色彩彼此之間相互區(qū)別的首要特征。人們對于色彩的第一個感知往往就是從色相開始的,色相好比色彩的華美肌膚。在可見光譜中,紅、橙、黃、綠、藍、紫等每一種色相都有自己的波長與頻率,它們從短到長按序排列,秩序而和諧,這種秩序可以色相環(huán)的形式體現(xiàn)。色相明度純度明度是指色彩的明暗程度,明暗受光線強弱影響。任何色彩(無彩色只有明度屬性)都存在明暗變化,多用來表現(xiàn)物體的立體感與空間感。色彩的明度有兩種情況:一是同一顏色的不同明度。二是各種顏色的不同明度。色彩的純度是指色彩中所包含的某色的飽和程度,也稱飽和度、彩度、鮮度等,含有色成分的比例越大,則色彩的純度越高;含有色成分的比例越小,則色彩的純度也越低。2.1.3數(shù)字圖像的色彩模式2.色彩模式(1)RGB模式RGB模式的配色原理是加色混合,通過色光三原色(是指通過混合產(chǎn)生其他所有顏色的基本光源)紅(R)、綠(G)、藍(B)相互疊加得到各種顏色,如紅、綠、藍3色的混合為白色。RGB模式為圖像中每一個像素的RGB分量分配一個0~255范圍內(nèi)的強度值,因此可以表示1670萬余種顏色。RGB模式適用于顯示器、投影儀、掃描儀等靠色光直接合成顏色的設(shè)備。色光三原色2.1.3數(shù)字圖像的色彩模式2.色彩模式(2)CMYK模式CMYK模式和RGB模式相比:RGB模式是一種發(fā)光的色彩模式,人們在黑暗的房間內(nèi)仍然可以看見屏幕上的內(nèi)容,CMYK則是一種依靠反光的色彩模式,需要有外界光源,例如,人們閱讀印刷品上的內(nèi)容,是由光源照射到印刷品上,再反射到人們的眼中。CMYK是彩色印刷時采用的一種模式,利用顏料三原色(是指通過混合產(chǎn)生其他顏色的基本顏料)的配色原理,加上黑色油墨,共計4種顏色混合疊加,形成“全彩印刷”。青(Cyan,C)、品紅(Magenta,M)、黃(Yellow,Y)分別是顏料三原色。010203CMYK模式的配色原理是減色混合,顏料有選擇地吸收一些顏色的光,并反射剩下的光線,反射的光線就是人們所看見的顏色。顏料三原色2.1.3數(shù)字圖像的色彩模式2.色彩模式(3)Lab模式Lab模式是計算機內(nèi)部使用最基本的色彩模式之一,也是一種色彩范圍較廣的色彩模式,包含RGB模式和CMYK模式中所有的顏色。Lab模式不依賴于光線,也不依賴于顏料,是與設(shè)備無關(guān)的色彩模式,無論使用什么設(shè)備(如顯示器、打印機、掃描儀等)創(chuàng)建或輸出圖像,顏色效果一致,可作為各種色彩模式之間相互轉(zhuǎn)換的中間模式。Lab模式由一個亮度通道L和a、b兩個色相通道來表示顏色,其中L表示圖像的亮度,取值范圍為0~100之間的整數(shù),L=50時,就相當于50%的黑;a表示從綠色到紅色的變化,取值范圍為-128~+127之間的整數(shù);b表示從藍色到黃色的變化,取值范圍同樣為-128~+127之間的整數(shù)。Lab模式中所有的顏色就以L、a、b這三個值交互變化所組成。0102032.1.3數(shù)字圖像的色彩模式2.色彩模式(4)HSB模式HSB模式又稱HSV模式,是采用色彩的三屬性來表示顏色,和RGB模式類似,也是用量化的形式,飽和度和亮度以百分比值(0%-100%)表示,色度以角度(0°-360°)表示。HSB色彩模式為將自然顏色轉(zhuǎn)換為計算機創(chuàng)建的色彩提供了一種直接方法。因此在進行圖像色彩校正時,經(jīng)常都會用到飽和度/亮度/色度的設(shè)置。2.2數(shù)字圖像基礎(chǔ)知識2.1數(shù)字圖像處理關(guān)鍵技術(shù)2.3數(shù)字圖像處理軟件Photoshop的應(yīng)用2.4計算機視覺2.2.1圖像增強技術(shù)1.灰度變換灰度變化,就是改變圖像中每個像素點的灰度值,使處理后的圖像對比度發(fā)生變化,實現(xiàn)圖像增強的目的。修正曝光不足(太暗)的圖像效果修正過度曝光(太亮)的圖像效果通過降低圖像亮色區(qū)域(高灰度區(qū)域)各像素點的灰度值,使亮色區(qū)域變暗,同時擴大亮色區(qū)域的灰度級范圍,從而增強亮色區(qū)域的對比度,以增強圖像中亮色區(qū)域的細節(jié)顯示。通過增大圖像暗色區(qū)域(低灰度區(qū)域)各像素點的灰度值,使暗色區(qū)域變亮,同時擴大暗色區(qū)域的灰度級范圍,從而增強暗色區(qū)域的對比度,以增強圖像中暗色區(qū)域的細節(jié)顯示。VS2.2.1圖像增強技術(shù)2.直方圖均衡化直方圖均衡化就是利用直方圖通過運算變換,將每種灰度值像素的個數(shù)均勻分布。通常這種方法不僅可以使圖像的灰度均勻分布,也使圖像色調(diào)更協(xié)調(diào),還可以擴大圖像灰度級的分布范圍,提高圖像整體對比度。直方圖均衡化的前后圖像對比示例2.2.2圖像降噪技術(shù)1.均值濾波均值濾波是指用當前像素點鄰域內(nèi)所有像素點的平均值代替當前像素點的像素值。即以當前像素點為中心像素點,選擇由該像素點及其近鄰的若干像素點組成的區(qū)域,該區(qū)域的寬度和高度一般是奇數(shù),如3x3像素、5x5像素等,這樣選擇的當前像素點才可成為中心像素點,然后計算該區(qū)域中所有像素點的平均值,再把該均值賦予當前像素點。2.2.2圖像降噪技術(shù)2.中值濾波中值濾波是指用當前像素點鄰域內(nèi)所有像素點的中值代替當前像素點的像素值,使鄰域內(nèi)像素值差別較大的像素點,其像素值替換為與周圍像素值接近的值,從而消除孤立(噪聲在圖像上常表現(xiàn)為引起較強視覺效果的孤立像素點或像素塊)的噪聲。2.3數(shù)字圖像基礎(chǔ)知識2.1數(shù)字圖像處理關(guān)鍵技術(shù)2.2數(shù)字圖像處理軟件Photoshop的應(yīng)用2.4計算機視覺2.3.1認識Photoshop啟動Photoshop后,創(chuàng)建文件或打開一個圖像文件便可進入操作界面。2.3.2Photoshop的基本操作(1)使用“圖像大小”命令選擇【圖像】/【圖像大小】命令,打開“圖像大小”對話框,調(diào)整各選項參數(shù),單擊“確定”按鈕完成調(diào)整。(2)使用“畫布大小”命令選擇【圖像】/【畫布大小】命令,打開“畫布大小”對話框,調(diào)整各選項參數(shù),單擊“確定”按鈕完成調(diào)整。(3)使用裁剪工具選擇“裁剪工具”后,圖像編輯區(qū)中將顯示一個矩形區(qū)域,區(qū)域內(nèi)的圖像為裁剪保留的區(qū)域,拖曳矩形區(qū)域四周的邊框,可調(diào)節(jié)裁剪范圍,按【Enter】鍵完成裁剪操作。1.調(diào)整圖像大小2.3.2Photoshop的基本操作2.創(chuàng)建和管理圖層創(chuàng)建圖層在“圖層”面板選擇需要圖層后,按住鼠標左鍵不放并拖曳該圖層,可以移動該圖層的位置;選擇【圖層】/【復(fù)制圖層】命令,或按【Ctrl+J】組合鍵可復(fù)制該圖層;選擇【圖層】/【刪除】命令,或按【Delete】鍵可刪除該圖層。創(chuàng)建圖層選擇【圖層】/【新建圖層】命令,或單擊“圖層”面板下方的“創(chuàng)建新圖層”按鈕,可創(chuàng)建新圖層。2.3.2Photoshop的基本操作3.創(chuàng)建選區(qū)選框工具組矩形選框工具用于創(chuàng)建規(guī)則的矩形選區(qū);橢圓選框工具用于創(chuàng)建規(guī)則的橢圓形選區(qū);單行選框工具用于創(chuàng)建高1像素的水平矩形選區(qū);單列選框工具用于創(chuàng)建寬1像素的豎直矩形選區(qū)。套索工具用于創(chuàng)建不規(guī)則選區(qū);多邊形套索工具用于創(chuàng)建選區(qū)邊界為直線或折線的選區(qū);磁性套索工具用于自動捕捉圖像中對比度較大區(qū)域邊緣,以此創(chuàng)建選區(qū)。對象選擇工具可以自動識別框選區(qū)域的完整對象,并將其創(chuàng)建為選區(qū);快速選擇工具可以快速選擇指定區(qū)域,并將其創(chuàng)建為選區(qū);魔棒工具可以選取圖像中顏色相同或顏色相近的區(qū)域,并將其創(chuàng)建為選區(qū)。套索工具組選擇工具組2.3.2Photoshop的基本操作4.調(diào)整圖像明暗色階曲線“亮度/對比度”選擇【圖像】/【調(diào)整】/【亮度/對比度】命令,打開“亮度/對比度”對話框,可設(shè)置亮度與對比度的參數(shù)。曝光度選擇【圖像】/【調(diào)整】/【曝光度】命令,打開“曝光度”對話框,可設(shè)置預(yù)設(shè)、曝光度、位移和灰度系數(shù)校正等參數(shù),來處理曝光不足的圖像。2.3.3應(yīng)用案例:制作家具網(wǎng)頁橫幅廣告1.調(diào)整背景圖亮度打開圖像文件降低圖像亮度降低亮度后的圖像效果2.3.3應(yīng)用案例:制作家具網(wǎng)頁橫幅廣告2.輸入文本創(chuàng)建文本圖層后輸入文本并設(shè)置字體復(fù)制并修改文本設(shè)置文本格式2.3.3應(yīng)用案例:制作家具網(wǎng)頁橫幅廣告3.合成圖像摳取落地燈素材粘貼選區(qū)對象并調(diào)整其位置2.4數(shù)字圖像基礎(chǔ)知識2.1數(shù)字圖像處理關(guān)鍵技術(shù)2.2數(shù)字圖像處理軟件Photoshop的應(yīng)用2.3計算機視覺2.4.1計算機視覺的概念計算機視覺是研究如何用計算機“看”世界的科學,簡而言之,是用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等操作,并進一步做圖像處理,用計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像。草原上的長頸鹿它的工作原理與人類視覺基本相同,形象地說,就是給計算機安裝上眼睛(攝像機)和大腦(算法),使計算機能夠感知環(huán)境,分析和理解圖像中相應(yīng)場景的三維信息,完成人類視覺的任務(wù)。2.4.2計算機視覺的發(fā)展與應(yīng)用神經(jīng)生理學家大衛(wèi)·休伯爾(DavidHunterHubel)和托斯坦·維厄瑟爾(TorstenWiesel)通過貓的視覺實驗,發(fā)現(xiàn)了視覺通路中的信息分層處理機制,為視覺神經(jīng)研究奠定了基礎(chǔ)。同一時期,計算機科學家羅素·基爾希(RussellKirsch)和他的團隊成員研制了一個小型數(shù)字圖像掃描儀(這臺數(shù)字圖像掃描儀發(fā)現(xiàn)了方形像素),并由此開發(fā)出為圖像處理奠定基礎(chǔ)的算法,為數(shù)字圖像處理迎來開端。勞倫斯·羅伯茨(LawrenceRoberts)在《三維固體的機器感知》一文中將物體簡化為幾何形狀來加以識別,只要提取出物體形狀,并加以空間描述,就可以像“搭積木”一樣推理出任何復(fù)雜的三維場景,這開創(chuàng)了理解三維場景為目的的計算機視覺研究。麻省理工學院(MassachusettsInstituteofTechnology,MIT)的人工智能實驗室在這一時期對計算機視覺的研究發(fā)展起到了積極的推動作用。一方面,它設(shè)置了計算機視覺課程,另一方面,它吸引了眾多研究人員參與到計算機視覺的理論和實踐研究中。20世紀50年代20世紀60年代20世紀70年代2.4.2計算機視覺的發(fā)展與應(yīng)用隨著機器學習的興起,計算機視覺開始取得一些實際的應(yīng)用進展。例如,保羅·比奧拉(PaulViola)和邁克爾·瓊斯(MichaelJones)等人利用Adaboost算法出色地完成了人臉的實時檢測,并被富士通公司應(yīng)用到商用產(chǎn)品中——一款具有實時人臉檢測功能的相機。隨后,HOG、DPM等特征提取算法被提出,計算機視覺的發(fā)展被逐步推向高潮。深度學習在計算機視覺中大放異彩,使計算機視覺取得長足發(fā)展。這不僅得益于計算機運算能力的提高,還得益于可供深度學習訓練的大型數(shù)據(jù)庫,如PASCALVOC、ImageNet、MSCOCO等數(shù)據(jù)庫建立。同時,一些極具影響力的計算機視覺類競賽項目,如ILSVRC、Kaggle、AIChallenger、NeurIPS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論