網(wǎng)絡(luò)多媒體技術(shù)復(fù)習(xí) 網(wǎng)絡(luò)多媒體復(fù)習(xí)_第1頁
網(wǎng)絡(luò)多媒體技術(shù)復(fù)習(xí) 網(wǎng)絡(luò)多媒體復(fù)習(xí)_第2頁
網(wǎng)絡(luò)多媒體技術(shù)復(fù)習(xí) 網(wǎng)絡(luò)多媒體復(fù)習(xí)_第3頁
網(wǎng)絡(luò)多媒體技術(shù)復(fù)習(xí) 網(wǎng)絡(luò)多媒體復(fù)習(xí)_第4頁
網(wǎng)絡(luò)多媒體技術(shù)復(fù)習(xí) 網(wǎng)絡(luò)多媒體復(fù)習(xí)_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、網(wǎng)絡(luò)多媒體技術(shù)復(fù)習(xí).第第1章章 多媒體信息處理基礎(chǔ)多媒體信息處理基礎(chǔ). 位圖文件 圖像分辨率:分辨率越高,表示組成一幅圖的像素就越多,圖像文件就越大 像素深度:像素深度越深,表達單個像素的顏色和亮度的位數(shù)越多,圖像文件就越大 灰度圖像:只有明暗不同的像素而沒有彩色像素組成的圖像?;叶戎导墧?shù)就等于256級,每個像素可以是0255之間的任何一個值 彩色圖像:每個像素的R、G和B值用一個字節(jié)來表示 1位:黑白;8位:灰階;8位:256色;24位:真彩;30/36/48位:全彩. 音頻數(shù)字化實際上就是對模擬信號進行采樣、量化和編碼 色調(diào)反映彩色的類別,例如紅、橙、黃、綠、青、藍、紫等不同顏色。發(fā)光物體

2、的色調(diào)由光的波長決定, 色飽和度反映彩色光的深淺程度 在RGB模型中,顏色空間里所有的顏色都是由R、G、B (紅、綠、藍)三種光依不同的比例相加而成;相加混色。 在CMY顏色模型中,顏色空間由青(Cyan)、品紅(Magenta)和黃(Yellow)這三種基色按不同的比例混合而成,相減混色。. 圖像采樣就是對圖像在水平方向和垂直方向上進行等間隔的采樣,將二維空間上模擬的連續(xù)亮度(即灰度)或彩色信息,轉(zhuǎn)化為一系列有限的離散數(shù)值來表示 一幅圖像在采樣時,行、列的采樣點與量化時每個像素量化的級數(shù),既影響數(shù)字圖像的質(zhì)量,也影響到該數(shù)字圖像數(shù)據(jù)量的大小。假定圖像取MN個采樣點,每個像素量化后的灰度二進制

3、位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k, 則存儲一幅數(shù)字圖像所需的字節(jié)數(shù)B為 kBMN8.第第2章章 圖像增強圖像增強.灰度直方圖 灰度直方圖是灰度級的函數(shù),它表示圖像中具有某種灰度級的像素的個數(shù),反映了圖像中每種灰度級出現(xiàn)的概率.1. 統(tǒng)計原始圖像的直方圖: 其中, 是歸一化的輸入圖像灰度級。2. 計算直方圖累積分布曲線3. 用累積分布函數(shù)作變換函數(shù)進行圖像灰度變換:根據(jù)計算得到的累積分布函數(shù),建立輸入圖像與輸出圖像灰度級之間的對應(yīng)關(guān)系,即重新定位累計分布函數(shù) (與歸一化灰度等級 比較,尋找最接近的一個作為原灰度級k變換后的新灰度級)。 nnrpkkrkjkjjjrkknnrprTs

4、00)()(直方圖均衡化的實現(xiàn)步驟krkskr.鄰域平均法 模板操作實現(xiàn)了一種鄰域運算,即某個像素點的運算結(jié)果不僅與本像素灰度有關(guān),而且與其鄰域點的值有關(guān)。模板操作的數(shù)學(xué)含義是卷積(或互相關(guān))運算。 鄰域平均法是一種局部空間域處理的算法。 基本思想:用鄰域像素灰度的平均值代替每個像素的灰度值。l優(yōu)點:算法簡單,計算速度快。l缺點:在降低噪聲的同時容易模糊圖像邊沿和細節(jié)處。.中值濾波 中值濾波是對一個滑動窗口內(nèi)的諸像素灰度值排序,用中值代替窗口中心像素的原來灰度值,因此它是一種非線性的圖像平滑法。中值濾波的依據(jù):噪聲以孤立點的形式出現(xiàn),這些點對應(yīng)的像素數(shù)很少,而圖像則是由像素數(shù)較多、面積較大的塊

5、構(gòu)成。中值濾波的目的就是要把這些孤立的點去除掉。中值濾波方法:選一個含有奇數(shù)點的窗口W,將這個窗口在圖像上移動,把該窗口中所含的像素點按灰度值進行升(或降)序排列,取位于中間的灰度值,來代替該點的灰度值。將原圖像中所有的像素點都執(zhí)行上述操作后就得到中值濾波的結(jié)果圖像。.例:有一個序列為0, 3, 4, 0, 7,當窗口m5時試求出采用中值濾波的結(jié)果。解:該序列重新排列后為0, 0, 3, 4, 7則中值濾波的結(jié)果 M0,0,3,4,7=3中值濾波.低通濾波器 理想低通濾波器 以D0為半徑的圓內(nèi)所有頻率分量無損的通過,圓外的所有頻率分量完全衰減。 由于高頻成分包含有大量的邊緣信息,因此,采用該濾

6、波器在去噪聲的同時將會導(dǎo)致邊緣信息損失而使圖像邊模糊。 Butterworth低通濾波器 特性是連續(xù)性衰減 在抑制噪聲的同時,圖像邊緣的模糊程度大大減小,沒有振鈴效應(yīng)產(chǎn)生 高斯低通濾波器 高斯低通濾波器的傅立葉反變換也是高斯的,這意味著反變換后高斯濾波器將沒有振鈴現(xiàn)象產(chǎn)生. 圖像銳化 圖像變模糊原因: 成像系統(tǒng)聚焦不好或者信道過窄 平均或積分運算使目標物輪廓變模糊,細節(jié)輪廓不清楚 目的:加重目標物輪廓,使圖像變清楚 單方向的一階銳化是指對某個特定方向上的邊緣信息進行增強。.水平方向的一階銳化12321212623087612786232690 0 0 000-3-13-2000-6-13-13

7、00 1 12 500 0 0 001*1+2*2+1*3-1*3-2*0-1*8=-3121000121H.垂直方向的一階銳化12321212623087612786232690 0 0 000-7-17 400-16-25 500 -17 -22-300 0 0 001*1+2*2+1*3-1*3-2*2-1*8=-7101202101H.拉普拉斯算子 拉普拉斯算子),(4) 1,() 1,(), 1(), 1(),(),(22222jifjifjifjifjifyyxfxyxff 可見, 數(shù)字圖像在(i, j)點的拉普拉斯算子,可以由(i, j)點灰度值減去該點鄰域平均灰度值來求得。01

8、01-4 10101111811112H1212421213H0101510104H.高通濾波 圖像中的邊緣或線條等細節(jié)部分與圖像頻譜的高頻分量相對應(yīng)。 采用高通濾波使圖像的邊緣或線條等細節(jié)變得清楚,實現(xiàn)圖像的銳化。.第第3章章 形態(tài)學(xué)圖像處理形態(tài)學(xué)圖像處理.數(shù)學(xué)形態(tài)學(xué)的基本概念 數(shù)學(xué)形態(tài)學(xué)是用集合論方法定量描述集合結(jié)構(gòu)的學(xué)科,它包括一組基本的形態(tài)學(xué)算子(膨脹、腐蝕、開、閉等)及其組合.數(shù)學(xué)形態(tài)學(xué)的基本概念 二值圖像的邏輯運算 對于二值圖像而言,習(xí)慣上認為取值為1的點對應(yīng)于景物(前景),而取值為0的點構(gòu)成背景.二值圖像的二值圖像的邏輯運算邏輯運算1表示黑色,表示黑色,0表示白色表示白色.二值形

9、態(tài)學(xué)的基本運算膨脹膨脹膨脹. 膨脹 應(yīng)用:連接圖像中的鄰近目標.二值形態(tài)學(xué)的基本運算腐蝕. 腐蝕的應(yīng)用 去掉小于結(jié)構(gòu)元素的物體 如果兩個物體之間有細小的連通,當結(jié)構(gòu)元素足夠大時,可以將物體分開. 開操作(opening) 先腐蝕,后膨脹 作用 消除細小對象 在細小粘連處分離對象 在不明顯改變形狀的前提下,平滑對象的邊緣二值形態(tài)學(xué)的基本運算開操作()A BABB$.A AB BA AB BA AB B. 開操作.二值形態(tài)學(xué)的基本運算閉操作 閉操作(closing) 先膨脹、后腐蝕 作用 填充對象內(nèi)細小空洞 連接鄰近對象 在不明顯改變面積的前提下,平滑對象邊緣()A BABB$.A AB BA A

10、B BA AB B. 開操作和閉操作的應(yīng)用:先開操作再閉操作,構(gòu)成噪聲濾波器.第第4章章 圖像分割圖像分割.圖像分割 計算機處理圖像的兩個目的 產(chǎn)生更適合人觀察和識別的圖像 由計算機自動識別和理解圖像 圖像分割是圖像識別和圖像理解的基礎(chǔ)知識庫知識庫表示與描述表示與描述預(yù)處理預(yù)處理分割分割低級處理低級處理高級處理高級處理中級處理中級處理識別識別與與解釋解釋結(jié)果結(jié)果圖像獲取圖像獲取問題問題. 圖像分割的定義 圖像分割是把圖像分割成互不交疊的有意義區(qū)域,以便進一步的分析,分開的區(qū)域一般是圖像中我們感興趣的目標 圖像分割是基于目標或區(qū)域的特征進行的 圖像分割算法一般是基于亮度值的不連續(xù)性和相似性 圖像

11、分割的目的 把圖像分解成構(gòu)成它的部件和對象; 有選擇性地定位感興趣對象在圖像中的位置和范圍。.4.圖像分割的方法1) 基于邊緣的分割方法:先提取區(qū)域邊界,再確定邊界限定的區(qū)域。2) 區(qū)域分割:確定每個像素的歸屬區(qū)域,從而形成一個區(qū)域圖。3) 區(qū)域生長:將屬性接近的連通像素聚集成區(qū)域。4) 分裂合并分割:綜合利用前兩種方法,既存在圖像的劃分,又有圖像的合并。.間斷檢測 間斷檢測是基于圖像像素灰度值的不連續(xù)性進行圖像分割 點檢測 線檢測 邊界檢測 尋找間斷最一般的方法是模板檢測1 1229991iiiRw zw zw zw z.間斷檢測 點檢測 線檢測-1-1-1222-1-1-1水平模板水平模板

12、-1-12-12-12-1-14545度模板度模板-12-1-12-1-12-1垂直模板垂直模板2-1-1-12-1-1-12-45-45度模板度模板.間斷檢測 邊緣是位于兩個區(qū)域的邊界線上的相連像素的集合 邊緣可以通過計算局部微分算子來檢測 一階導(dǎo)數(shù):通過梯度來計算 二階導(dǎo)數(shù):通過拉普拉斯算子來計算.第第5章章 數(shù)字圖像與視頻壓縮編碼數(shù)字圖像與視頻壓縮編碼. 數(shù)據(jù)壓縮的理論基礎(chǔ)是信息論。從信息論的角度來看,壓縮就是去掉數(shù)據(jù)中的冗余,即保留不確定的信息,去掉確定的信息(可推知的),也就是用一種更接近信息本質(zhì)的描述來代替原有冗余的描述。 在一般的圖像和視頻數(shù)據(jù)中,主要存在空間冗余,時間冗余,統(tǒng)計

13、冗余,結(jié)構(gòu)冗余,知識冗余以及人眼的視覺冗余.無失真編碼 熵編碼是純粹基于信號統(tǒng)計特性的一種編碼方法,它利用信源概率分布的不均勻性,通過變長編碼來減少信源數(shù)據(jù)冗余,解碼后還原的數(shù)據(jù)與壓縮編碼前的原始數(shù)據(jù)完全相同而不引入任何失真.游程編碼 二值圖像是指圖像中的像素值只有兩種取值,即“0”和“1”,因而在圖像中這些符號會連續(xù)地出現(xiàn),我們通常將連“0”這一段稱為“0”游程,而連“1”的一段則稱為“1”游程,它們的長度分別表示為L(0)和L(1),往往“0”游程與“1”游程會交替出現(xiàn),即第一游程為“0”游程。第二游程為“1”游程。第三游程又為“0”游程。下面我們以一個具體的二值序列為例進行說明。 已知一

14、個二值序列,根據(jù)游程編碼規(guī)則,可知其游程序列為21133121。.Huffman編碼過程1. 把信源符號按概率大小順序排列,并設(shè)法按逆次序分配碼字的長度。在分配碼字的長度時,首先將出現(xiàn)概率最小的兩個符號的概率相加,合成一個概率;第二步把這個合成概率看成是一個新組合符號的概率,重復(fù)上述操作,直到最后只剩下兩個符號的概率為止。2. 完成以上概率相加順序排列后,再反過來逐步向前進行編碼,每一步有兩個分支,各賦予一個二進制碼,可以對概率大的編碼賦予0,概率小的編碼賦予1。反之,也可以對概率大的編碼賦予1,概率小的編碼賦予0。.n例例2:信源的符號的概率嚴重不對稱:信源的符號的概率嚴重不對稱:nH bi

15、ts/symbolnHuffman編碼:編碼:a0b11c10nl bits/symboln冗余(冗余(Redundancy) = l - H = 0.715 bits/sym (213%!).算術(shù)編碼 基本原理:將被編碼的信息表示成0和1之間的間隔。信息越長,則編碼表示它的間隔就越小,表示這一間隔所需的二進制位就越多。 算術(shù)編碼是一種非分組編碼,它用一個浮點數(shù)值表示整個信源符號序列。算術(shù)編碼將被編碼的信源符號序列表示成實數(shù)半開區(qū)間0,1)中的一個數(shù)值間隔. 算術(shù)編碼首先假設(shè)一個概率模型,然后用這些概率來縮小表示信源集的區(qū)間。 在算術(shù)編碼的初始階段,可設(shè)置兩個專用寄存器C和A來存儲符號到來之前

16、子區(qū)間的狀態(tài)參數(shù),令寄存器C的值為子區(qū)間的起始位置,寄存器A的值為子區(qū)間的寬度,該寬度恰好是已輸入符號串的概率。再設(shè)L和H分別為編碼字符的初始編碼區(qū)間的低端和高端值初始時,C=0,A=1。當新的符號到來時,CC+AL, A A(HL)。 算術(shù)編碼的結(jié)果落在子區(qū)間C,C+A)之內(nèi). 例:假設(shè)信源符號為00,01,10,11,這些符號的概率分別為,0.3。根據(jù)這些概率,可把間隔0,1)分成4個子間隔:0,),),)和,1)。.如果二進制消息序列的輸入為10 00 11 00 10 11 01,則(1)首先輸入的符號是10,其編碼范圍是,0.7),即,。因此,。(2)由于消息中第二個符號00的編碼范

17、圍是0,),因此,。(3)第3個符號11的編碼范圍是,1,因此,。依此類推,編碼第4個符號00時,消息的編碼輸出可以是最后一個間隔中的任意數(shù)。.限失真編碼 限失真編碼方法利用了人類視覺的感知特性,允許壓縮過程中損失一部分信息,雖然在解碼時不能完全恢復(fù)原始數(shù)據(jù),但是如果把失真控制在視覺閾值以下或控制在可容忍的限度內(nèi),則不影響人們對圖像的理解,卻換來了高壓縮比。.第第9章章 數(shù)字水印技術(shù)數(shù)字水印技術(shù).數(shù)字水印 數(shù)字水印是永久鑲嵌在其他數(shù)據(jù)(宿主數(shù)據(jù))中具有可鑒別性的的數(shù)字信號或模式,而且并不影響宿主數(shù)據(jù)的可用性 數(shù)字水印應(yīng)具有如下的基本特征: 不可感知性, 水印容量, 魯棒性, 可證明性, 安全性

18、.數(shù)字水印的組成 數(shù)字水印技術(shù)包括水印的嵌入和水印檢測/提取兩個過程。 嵌入階段的設(shè)計主要解決兩個問題: 數(shù)字水印的生成,可以是一串偽隨機數(shù),也可以是與作者有關(guān)的字符串、圖標等信息經(jīng)過加密產(chǎn)生; 嵌入算法,嵌入方案的目標是使數(shù)字水印在不可見性和魯棒性之間找到一個較好的折中。換句話說就是使用嵌入算法E把水印信號W嵌入到原始產(chǎn)品I中 . 檢測階段主要是設(shè)計一個相應(yīng)于嵌入過程的檢測算法。檢測的結(jié)果或是原水?。ㄈ缱址驁D標等),或是基于統(tǒng)計原理的檢驗結(jié)果以判斷水印存在與否。檢測方案的目標是使錯判與漏判的概率盡量小。1 , 0WKIW中存在水印表示中不存在水印表示W(wǎng)WWIIWKID10),(WKIW表示檢測到的水印其中WKIDWW),(.第第10章章 基于內(nèi)容的多媒體信息檢基于內(nèi)容的多媒體信息檢索索.基于內(nèi)容檢索技術(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論