版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第4章多媒體技術(shù)基礎主要內(nèi)容:§4.1多媒體的概念§4.2光盤存儲系統(tǒng)§4.3多媒體音頻信號處理§4.4多媒體圖像信息處理§4.5計算機圖形處理技術(shù)簡介§4.6多媒體視頻信息處理本章小結(jié)思考與練習一、思考與練習1.什么是媒體?媒體是如何分類的?2.什么是多媒體?多媒體技術(shù)有哪些關(guān)鍵特性?3.一個完整的多媒體計算機系統(tǒng)包括哪幾個層次的結(jié)構(gòu)?4.相對于其他存儲介質(zhì)而言,光盤存儲具有哪些特點?5.常見的光盤標準是如何劃分的?可分為哪些類型?6.DVD與藍光DVD能夠?qū)崿F(xiàn)大容量存儲的原因是什么?7.簡述光盤系統(tǒng)記錄與讀取信息的原理。8.可刻錄光盤(CDR)是如何寫入與存儲信息的?9.什么是音頻信號?決定音頻信號波形的參數(shù)有哪些?10.常見的數(shù)字音頻文件有哪些?11.計算機語音信號處理技術(shù)已經(jīng)介入到日常生活中,請列舉幾例應用說明它的用途。12.什么是計算機圖像處理?13.圖像的數(shù)字化過程的基本步驟是什么?思考與練習14.圖像的采樣與分辨率的關(guān)系是什么?15.什么圖像量化?量化級數(shù)與量化字長有什么關(guān)系?16.常見的數(shù)字圖像文件有哪些?17.什么是RGB彩色模型?它與CMYK彩色模型在表示和應用方面有什么不同?18.圖像信息為什么能壓縮?常見的數(shù)據(jù)壓縮方法有哪些?19.什么是行程編碼?它適合對哪些類型的圖像進行壓縮?20.什么是計算機圖形處理?它主要應用于哪些領域?21.計算機圖形處理包括的內(nèi)容有哪些?22.圖形與圖像處理技術(shù)的區(qū)別與聯(lián)系有哪些?23.矢量圖和位圖的主要特點是什么?24.什么是視頻?簡述視頻圖像的數(shù)字化過程。25.數(shù)字化視頻的優(yōu)點有哪些?26.常用的電視信號制式有哪幾種?我國電視信號使用的是什么制式?27.數(shù)字電視系統(tǒng)由哪幾部分組成?28.電視機的機頂盒的作用是什么?思考與練習二、計算題1.根據(jù)Nyquist理論,若原有聲音信號的頻率為20kHz,則采樣頻率應為多少?2.若一個數(shù)字化聲音的量化位數(shù)為16,則能夠表示的聲音幅度等級是多少?3.用44.1kHz的采樣頻率進行采樣,量化位數(shù)選用8位,則錄制2分鐘的立體聲節(jié)目,其波形文件所需的存儲量是多少?4.在CD播放機中,假設音樂信號是均勻分布的,采樣速率為44.1kHz,采用16比特的量化編碼,試確定存儲50分鐘時間段的音樂所需要的存儲容量。5.一幀640×480分辨率的彩色圖像,圖像深度為24位,不經(jīng)壓縮,則一幅畫面需要多少字節(jié)的存儲空間?按每秒播放30幀計算,播放一分鐘需要多大存儲空間?一張容量為650MB的光盤,在數(shù)據(jù)不壓縮的情況下,能夠播放多長時間?思考與練習6.有一張圖片,以W表示白色,B表示黑色:WWWWWWWWWWWWBWWWWWWWWWWWWBBB試寫出游程編碼,并計算壓縮率。7.為了使電視圖像獲得良好的清晰度和規(guī)定的對比度,需要用5×105個像素和10個不同的亮度電平,并設每秒要傳送30幀圖像,所有的像素是獨立的,且所有亮度電平等概出現(xiàn)。求此圖像所攜帶的信息熵。8.現(xiàn)有一幅已離散量化后的圖像,圖像的灰度量化分成8級,如圖所示。圖中數(shù)字為相應像素上的灰度級。現(xiàn)有一個無噪聲信道,單位時間(秒)內(nèi)傳輸100個二元符號。要將圖像通過給定的信道傳輸,不考慮圖像的任何統(tǒng)計持性,并采用二元等長碼,問需多長時間才能傳送完這幅圖像?(見下頁圖)三、練習與實踐1.用你的數(shù)碼相機和數(shù)碼攝像機等設備拍攝一些校園風景,并在計算機上瀏覽播放,記錄圖像或視頻文件的格式及其容量。思考與練習2.用Windows的錄音軟件錄制一段30秒的聲音并保存,觀察其文件格式和容量。3.MIDI音樂格式已非常流行,嘗試用Cakewalk軟件制作一個MIDI作品,或從網(wǎng)絡上下載一個MIDI文件,感受一下MIDI音樂與真實音樂的不同之處。思考與練習§4.1多媒體的概念4.1.1媒體的分類在計算機領域中媒體有兩種含義:一種是指用以存儲信息的實體(媒質(zhì));另一種是指信息的載體。多媒體計算機技術(shù)中的媒體是指后者。媒體可分為以下五種,如圖4-1所示。(1)感覺媒體(perception)(2)表示媒體(presentation)(3)顯示媒體(display)(4)存儲媒體(storage)(5)傳輸媒體(transmission)§4.1多媒體的概念§4.1多媒體的概念圖4-1國際標準將媒體分為
五種類型各種媒體之間的關(guān)系如圖4-2所示?!?.1多媒體的概念圖4-2各種媒體之間的關(guān)系4.1.2多媒體與多媒體技術(shù)1.多媒體的定義通常所指的多媒體就是各種感覺媒體的組合,也就是聲音、圖像、圖形、動畫、文字、數(shù)據(jù)、文件等各種媒體的組合。定義1:所謂多媒體技術(shù)就是計算機交互式綜合處理多種媒體信息——文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個系統(tǒng)并具有交互性。定義2:所謂多媒體就是在數(shù)值、文字、圖形等由計算機處理的信息中,使靜止圖像、語音、影像等時間序列信息相互關(guān)聯(lián),同步處理的技術(shù)。§4.1多媒體的概念2.多媒體技術(shù)多媒體技術(shù)是指利用計算機綜合處理多種媒體信息的技術(shù)。3.多媒體技術(shù)的主要特性信息媒體的多樣性、多種技術(shù)的集成性和處理過程的交互性。4.多媒體的關(guān)鍵技術(shù)大容量數(shù)據(jù)存儲技術(shù)、多媒體數(shù)據(jù)壓縮編碼與解碼技術(shù)、虛擬現(xiàn)實技術(shù)、多媒體數(shù)據(jù)庫技術(shù)、智能多媒體技術(shù)、多媒體信息檢索?!?.1多媒體的概念4.1.3多媒體計算機系統(tǒng)1.多媒體計算機系統(tǒng)的層次結(jié)構(gòu)§4.1多媒體的概念圖4-3多媒體計算機
系統(tǒng)的組成2.多媒體計算機的硬件系統(tǒng)多媒體計算機硬件系統(tǒng)由多媒體計算機主機、多媒體接口卡、多媒體外部設備、光盤存儲器、網(wǎng)絡接口卡等組成。一個常見的多媒體硬件系統(tǒng)如圖4-4所示?!?.1多媒體的概念圖4-4多媒體
計算機硬件系統(tǒng)§4.2光盤存儲系統(tǒng)4.2.1光盤及其特點光盤存儲系統(tǒng)由光盤和光盤驅(qū)動器組成。光盤存儲系統(tǒng)具有一切存儲介質(zhì)的優(yōu)點,如大容量、耐用、易保存、標準化等。CD意為高密盤,稱之為光盤,因為它是通過光學方式來記錄和讀取二進制信息的?!?.2光盤存儲系統(tǒng)4.2.2光盤的標準與類型由于光盤能存儲不同類型的數(shù)據(jù),包括音頻和視頻數(shù)據(jù)、計算機程序等,而這些數(shù)據(jù)的組織方式各有不同,由此制定了一些國際標準,以適應多媒體的各種應用?!?.2光盤存儲系統(tǒng)按光盤的讀寫性能來講,可分為三種類型:1.只讀型光盤存儲器只讀光盤中的數(shù)據(jù)是用壓?;蚧瘜W刻寫方法制成的,用戶只能讀取上面的數(shù)據(jù),而不能寫入或修改光盤中的數(shù)據(jù)。2.一次可寫光盤存儲器一次性可寫光盤的每一個記憶單元只可以寫入一次,不可抹去。3.多次可擦寫光盤存儲器多次可擦寫光盤具有磁盤一樣的可擦寫性,允許用戶存儲、移動、修改光盤上的數(shù)據(jù),適合作為計算機的新型標準外存設備?!?.2光盤存儲系統(tǒng)4.2.3光盤系統(tǒng)記錄與讀取信息的原理光盤系統(tǒng)是由光盤驅(qū)動器和光盤盤片組成。光盤的讀取信息的過程是基于物理學的“光反射”原理,以圖4-5所示的CD-ROM光盤讀取過程為例。光盤是一種多層材料組成的圓盤結(jié)構(gòu)。以CD-ROM為例,其物理結(jié)構(gòu)如圖4-6所示?!?.2光盤存儲系統(tǒng)§4.2光盤存儲系統(tǒng)圖4-5光盤數(shù)據(jù)讀取原理圖4-6CD-ROM的剖面結(jié)構(gòu)CD-ROM只讀光盤是利用在盤上壓制凹坑的機械辦法,利用凹坑(Pit)和平面(Land)部分來記錄“0”
和“1”。CD-R光盤增加了一層有機染料作為記錄層。CD-RW記錄原理為在光盤的記錄層鍍上一層結(jié)晶層,這個結(jié)晶層的特色是能呈現(xiàn)出結(jié)晶與非結(jié)晶的狀態(tài),借助于激光的照射,可在這兩種狀態(tài)之間互換,而這兩種狀態(tài)也對光的反射不同,產(chǎn)生的0與1的信號,經(jīng)過解碼器分析后,獲得所需的數(shù)據(jù)?!?.2光盤存儲系統(tǒng)§4.3多媒體音頻信號處理4.3.1音頻信號的形式音頻(Audio)信號可分為兩類:語音信號和非語音信號。根據(jù)物理學原理,聲音是一種在時間和幅度上都是連續(xù)的波形,是一種模擬信號。模擬音頻信號有兩個重要參數(shù):頻率和幅度。人們在日常說話時的語音信號頻率范圍在300Hz~3000Hz之間。頻率范圍為20Hz~20kHz的信號稱為音頻(audio)。信號的幅度是從信號的基線到當前波峰的距離。周期是指信號在兩個峰點或谷底之間的相對時間。周期和頻率之間的關(guān)系是互為倒數(shù)。(如圖4-7所示)§4.3多媒體音頻信號處理§4.3多媒體音頻信號處理圖4-7聲音的幅度和周期4.3.2音頻的數(shù)字化過程模擬音頻信號的數(shù)字化過程需要三個步驟:采樣、量化和編碼。1.聲音的采樣聲音的采樣就是按一定的時間間隔將聲音波形在時間軸(即橫軸)上進行分割,把時間和幅度上都是連續(xù)的模擬信號轉(zhuǎn)化成時間上離散、幅度連續(xù)的信號(圖4-9a)。采樣頻率越高,即采樣的間隔時間越短,則在單位時間內(nèi)計算機得到的聲音樣本數(shù)據(jù)就越多,對聲音波形的表示越精確,聲音的保真度也越好,但所要求的存儲空間也越大?!?.3多媒體音頻信號處理2.量化我們把對聲波波形幅度的數(shù)字化表示稱之為“量化”,如圖4-9b所示。量化把采樣后在幅度軸上連續(xù)取值(模擬量)的每一個樣本轉(zhuǎn)換為離散值表示?!?.3多媒體音頻信號處理圖4-9聲音的采樣和量化示意圖3.編碼編碼就是按照一定的格式把經(jīng)過采樣和量化后得到的離散數(shù)據(jù)記錄下來,并在有用的數(shù)據(jù)中加入一些用于糾錯、同步和控制的數(shù)據(jù)。4.數(shù)字化音頻文件的存儲容量計算采樣頻率、量化位數(shù)、聲道數(shù)的值越大,形成的數(shù)字音頻文件也就越大。數(shù)字音頻文件的存儲量以字節(jié)為單位,模擬波形聲音被數(shù)字化后音頻文件的存儲量為:存儲量(字節(jié))=采樣頻率(Hz)×量化位數(shù)/8×聲道數(shù)×時間(秒)§4.3多媒體音頻信號處理4.3.3數(shù)字音頻的文件格式所謂格式,可以理解為數(shù)碼信息的組織方式。一段模擬音頻經(jīng)過數(shù)字化處理后,所產(chǎn)生的數(shù)碼信息可以用各種編碼格式編排,而形成一個個音頻格式文件。1.WAV格式2.CD-DA格式3.MPEG音頻文件——MP3MPEG音頻文件的壓縮是一種有損壓縮,根據(jù)壓縮質(zhì)量和編碼復雜程度的不同可分為三層,分別對應MP1、MP2和MP3這三種聲音文件?!?.3多媒體音頻信號處理4.VOC文件5.其他格式除了上面介紹之外,還有WMA(WindowsMediaAudio)格式(*.wma);為解決網(wǎng)絡傳輸帶寬資源而設計的,被認為是網(wǎng)絡靈魂的文件格式Realaudio(*.RA/*.RM)和蘋果公司開發(fā)的,被Macintosh平臺和應用程序所支持的文件格式AIFF(*.AIF/*.AIFF)等。以上介紹的都是數(shù)字音頻格式,很多人熟悉的MIDI格式并不在其中。4.3.4語音信號處理技術(shù)語音信號處理的應用極為廣泛,其中的主要技術(shù)包括語音編碼、語音合成、語音識別和語音增強等?!?.3多媒體音頻信號處理語音識別技術(shù)(AutomaticSpeechRecognition)是指將人說話的語音信號轉(zhuǎn)換為可被計算機識別的文字信息,從而識別說話人的語音指令以及文字內(nèi)容的技術(shù)。語音識別系統(tǒng)的模型通常由聲學模型和語言模型兩部分組成,分別對應于語音到音節(jié)概率的計算和音節(jié)到字概率的計算,語言模型主要采用概率統(tǒng)計的方法來揭示語言單位內(nèi)在的統(tǒng)計規(guī)律。語音合成技術(shù)(TexttoSpeech)是指將文字信息轉(zhuǎn)變?yōu)檎Z音數(shù)據(jù),以語音的方式播放出來的技術(shù)?!?.3多媒體音頻信號處理§4.4多媒體圖像信息處理4.4.1計算機圖像處理的概念現(xiàn)代圖像既包括可見圖像(VisibleIimage,可見光范圍的圖像),也包括不可見光范圍內(nèi)借助于適當轉(zhuǎn)換裝置轉(zhuǎn)換成人眼可見的圖像(如紅外成像技術(shù)),還包括視覺無法觀察的其他物理圖像和空間物體圖像,以及由數(shù)學函數(shù)和離散數(shù)據(jù)所描述的連續(xù)或離散圖像。計算機圖像處理研究的主要內(nèi)容是如何對一幅連續(xù)圖像取樣、量化以產(chǎn)生數(shù)字圖像,如何對數(shù)字圖像做各種變換以方便處理,如何濾去圖像中的無用噪聲,如何壓縮圖像數(shù)據(jù)以便存儲和傳輸、圖像邊緣提取、特征增強和提取、計算機視覺和模式識別等?!?.4多媒體圖像信息處理§4.4多媒體圖像信息處理4.4.2顏色模型1.RGB模型基色是指互為獨立的單色,任一基色都不能由其他兩種基色混合產(chǎn)生。自然界常見的各種顏色,都可以由紅(Red)、綠(Gre-
en)、藍(Blue)三種顏色光按不同比例相配而成。2.CMYK顏色模型CMY模型(Cyan、Magenta、Yellow)是采用青、粉紅、黃色三種基本顏色按一定比例合成顏色的方法。雖然理論上利用CMY三原色混合可以制作出所需要的各種色彩,但實際上同量的CMY混合后并不能產(chǎn)生完善的黑色或灰色?!?.4多媒體圖像信息處理4.4.3圖像的數(shù)字化過程1.圖像的采樣數(shù)字化圖像的形成是計算機使用相應的軟硬件技術(shù)把許多像素點的特征數(shù)據(jù)組織成行列,整齊地排列在一個矩形區(qū)域內(nèi),形成計算機可以識別的圖像。圖像采樣就是將二維空間上連續(xù)的圖像用許多等距的水平線與豎直線分割成網(wǎng)狀的過程(如圖4-12所示)。被分割的圖像若水平方向有M個間隔,垂直方向上有N個間隔,則一幅圖像畫面就被表示成M×N個離散像素點構(gòu)成的集合,M×N表示圖像的分辨率??梢詫⑦B續(xù)變化的二維圖像用f(x,y)函數(shù)離散值的形式表示出來。§4.4多媒體圖像信息處理在進行采樣時,采樣點的間隔的選取是一個重要的問題。它決定了采樣后的圖像是否能真實地反映原圖像的程度。圖4-13給出在不同采樣頻率下獲得不同的圖像效果。圖4-12采樣是對圖像在水平方向和垂直方向上分割成網(wǎng)狀結(jié)構(gòu)§4.4多媒體圖像信息處理圖4-13不同采樣頻率獲得不同的圖像效果2.圖像的量化圖像量化實際就是將圖像采樣后的樣本值的范圍分為有限多個段,把落入某段中的所有樣本值用同一值表示,是用有限的離散數(shù)值量來代替無限的連續(xù)模擬量的一種映射操作。圖像可表示的量化級數(shù)(顏色數(shù)或灰度值)就為2的冪次方,即28、216位、224
種顏色。量化字長越大,所得到的量化級數(shù)也就越多,則越能真實地反映原有圖像的顏色。圖像文件的大小與圖像的分辨率和圖像顏色深度有關(guān)。一幅未經(jīng)壓縮的圖像文件的存儲容量可以按照下面的公式進行估算:圖像存儲容量(字節(jié))=分辨率×顏色深度/8§4.4多媒體圖像信息處理§4.4多媒體圖像信息處理4.4.4圖像的壓縮與編碼1.圖像信息為什么能壓縮從信息論的角度來看,壓縮就是去掉信息中的冗余,即保留不確定的信息,去除確定的信息(可推知的),也就是用一種更接近信息本質(zhì)的描述來代替原有冗余的描述。連續(xù)多幀畫面在很大程度上是相似的,而這些相似的信息(或稱作冗余信息)為數(shù)據(jù)的壓縮提供了基礎。人的視覺和聽覺對某些信號(如顏色,聲音)不那么敏感的生理特性,至使信息被壓縮之后還不知不覺,也不至對壓縮后的信息產(chǎn)生誤解。2.數(shù)據(jù)壓縮與編碼分類(1)數(shù)據(jù)壓縮:分為有損壓縮和無損壓縮兩類無損壓縮算法是為保留原始多媒體對象而設計的。有損壓縮會造成一些信息的損失,關(guān)鍵問題是看這種損失對圖像質(zhì)量帶來的影響。(2)經(jīng)典壓縮編碼:通常有預測編碼、變換編碼和統(tǒng)計編碼三種類型預測編碼根據(jù)離散信號之間存在著一定的相關(guān)性,利用前面的一個或多個信號對下一信號進行預測,然后對實際值和預測值的差進行編碼。變換編碼的基本方法是將數(shù)字圖像分成一定大小的子圖像塊,用某種變換對子像塊進行變換,得到變換域中的系數(shù)矩陣,然后選用其中的主要系數(shù)進行量化和編碼。統(tǒng)計編碼就是根據(jù)消息出現(xiàn)概率的分布特性而進行的壓縮編碼?!?.4多媒體圖像信息處理3.行程編碼行程長度編碼,用RLE(RunLengthEncoding)表示,具有相同顏色并且是連續(xù)的像素數(shù)目稱為行程長度。RLE所能獲得的壓縮比有多大,主要取決于圖像本身的特點。RLE編碼方法特別適用于由計算機生成的圖像,對于減少圖像文件的存儲空間非常有效?!?.4多媒體圖像信息處理§4.4多媒體圖像信息處理4.4.5圖像文件格式1.BMPBMP文件是一種與設備無關(guān)的圖像文件,它是Windows軟件推薦使用的一種格式。2.JPEGJPEG是按圖像專家聯(lián)合組制訂的壓縮標準,JPEG使用一種有損壓縮算法,無損壓縮算法能在解壓后準確再現(xiàn)壓縮前的圖像,而有損壓縮則犧牲了一部分的圖像數(shù)據(jù)來達到較高的壓縮率。3.GIFGIF是由CompuServe公司為了制定彩色圖像傳輸協(xié)議而開發(fā)的圖像格式文件。4.PSD格式PSD是著名的Adobe公司的圖像處理軟件Photoshop的專用格式。5.TIFF格式TIFF稱為標記圖像文件格式。它是Alaus和Microsoft公司為掃描儀和桌面出版系統(tǒng)研制開發(fā)的較為通用的圖像文件格式。6.PNG格式PNG是一種新興的網(wǎng)絡圖像格式。7.其他格式§4.4多媒體圖像信息處理§4.5計算機圖形處理技術(shù)簡介4.5.1計算機圖形處理的概述計算機圖形處理是指利用由概念或數(shù)學描述所表示物體的幾何數(shù)據(jù)或幾何模型,用計算機進行顯示并存儲,并可以進行修改、完善以及有關(guān)操作的過程。圖形主要分為兩類。一是基于線條信息表示的;二是反映物體表面屬性或材質(zhì)的灰度顏色等非幾何要素。圖形處理技術(shù)的主要應用領域是計算機輔助設計和制造、計算機教育、計算機藝術(shù)、計算機模擬、計算機可視化、計算機動畫和虛擬現(xiàn)實?!?.5計算機圖形處理技術(shù)簡介4.5.2計算機圖形處理包括的內(nèi)容如何在計算機中表示圖形、以及利用計算機進行圖形的建模、計算、處理和顯示的相關(guān)原理與算法,構(gòu)成了計算機圖形學的主要研究內(nèi)容。主要有:幾何變換,如平移、旋轉(zhuǎn)、縮放、透視和投影等;曲線和曲面擬合;建?;蛟煨?;隱藏線隱藏面消除;陰暗處理;紋理產(chǎn)生;渲染?!?.5計算機圖形處理技術(shù)簡介§4.5計算機圖形處理技術(shù)簡介(a)由Matlab軟件生成的三維曲面(b)3DMAX動畫軟件中生成的三維模型圖4-18三維圖形模型示例4.5.3圖形與圖像處理技術(shù)的區(qū)別與聯(lián)系計算機圖形學是指將點、線、面、曲面等實體生成物體的模型,然后模型存放在計算機里,并可修改、合并、改變模型和選擇視點來顯示模型的一門學科。計算機圖形技術(shù)主要應用于CAD、物理實體建模、可視化、虛擬現(xiàn)實,以及計算機動畫、游戲等領域。圖形學的逆過程是分析和識別輸入的圖像并從中提取二維或三維的數(shù)據(jù)模型(特征)。圖像處理技術(shù)是采用計算機外部輔助設備(如掃描儀、視頻采集裝置等)輸入的圖像像素數(shù)據(jù)進行處理、壓縮、傳輸?shù)囊婚T計算機技術(shù)?!?.5計算機圖形處理技術(shù)簡介在實際應用中,圖形圖像技術(shù)是相互關(guān)聯(lián)的。把圖形處理技術(shù)和圖像處理技術(shù)相結(jié)合可以使視覺效果和質(zhì)量更加完善,更加精美。4.5.4矢量圖和位圖的比較客觀世界中,圖可分為兩類。一類是可見的圖像。另一類是可用數(shù)學公式或模型描述的圖形。由此對應的圖文件有兩種,一種是存儲圖形信息的矢量圖(VectorGraphics)文件,另一種是存儲圖像信息的位圖(BitGraphics)文件?!?.5計算機圖形處理技術(shù)簡介矢量圖主要是把圖形元素當作矢量來處理。矢量圖形的特點是精度高、靈活性大,并且用它們設計出來的作品可以任意放大、縮小而不變形失真。靜態(tài)圖像亦稱為位圖,它指的是由掃描儀、數(shù)碼相機等圖像采集設備捕捉實際的畫面產(chǎn)生的數(shù)字圖像,是由像素點陣構(gòu)成的點陣圖?!?.5計算機圖形處理技術(shù)簡介§4.6多媒體視頻信息處理§4.6多媒體視頻信息處理4.6.1視頻的定義視頻(video)就其本質(zhì)而言,實際上就是其內(nèi)容隨時間變化的一組動態(tài)圖像(25或30幀/秒),所以視頻又叫做運動圖像或活動圖像。由圖4-19可見,視頻由一幅幅連續(xù)的圖像幀序列構(gòu)成,沿時間軸若一幀圖像保持一個時間段Δt,利用人眼的視覺暫留作用,可形成連續(xù)運動圖像(即視頻)的感覺。圖像與視頻是兩個既有聯(lián)系又有區(qū)別的概念:靜止的圖片稱為圖像(Image),運動的圖像稱為視頻(Video)?!?.6多媒體視頻信息處理視頻與動畫都是動態(tài)的圖像,其主要區(qū)別在于幀圖像畫面的產(chǎn)生方式的不同。圖4-19視頻由連續(xù)的圖像幀序列構(gòu)成§4.6多媒體視頻信息處理4.6.2視頻的分類按照處理方式的不同,視頻分為:1.模擬視頻(AnalogVideo)模擬視頻是一種用于傳輸圖像和聲音的并且隨時間連續(xù)變化的電信號。2.數(shù)字視頻(DigitalVideo-DV)要使計算機能夠?qū)σ曨l進行處理,必須把視頻源轉(zhuǎn)換成計算機要求的數(shù)字視頻形式并存放在磁盤上。4.6.3電視信號制式1.NTSC制NTSC是美國國家電視系統(tǒng)委員會在1953年制定的一種兼容的彩色電視制式,是目前常用的視頻標準,在美國、日本和其他國家廣為使用。2.PAL制PAL是聯(lián)邦德國1962年制定的一種兼容電視制式。3.SECAMSECAM稱為順序傳送彩色與存儲,是用于法國、俄羅斯及幾個東歐國家的彩色電視制式。§4.6多媒體視頻信息處理4.6.4YUV彩色模型在PAL彩色電視制式中采用YUV模型來表示彩色圖像。其中Y表示亮度,U,V用來表示色差,是構(gòu)成彩色的兩個分量(如圖4-20所示)?!?.6多媒體視頻信息處理圖4-20PAL彩色電視制式中采用YUV模型來表示彩色圖像4.6.5視頻的數(shù)字化過程視頻數(shù)字化是將模擬視頻信號經(jīng)模數(shù)轉(zhuǎn)換和彩色空間變換轉(zhuǎn)為計算機可處理的數(shù)字信號。在電腦上通過視頻采集卡可以接收來自視頻輸入端的模擬視頻信號,對該信號進行采集、量化成數(shù)字信號,然后壓縮編碼成數(shù)字視頻(圖4-21)。視頻數(shù)字化操作更多的是對視頻進行各種數(shù)字化的錄制、編輯、處理、格式轉(zhuǎn)換的過程?!?.6多媒體視頻信息處理§4.6多媒體視頻信息處理圖4-21視頻采集卡的作用4.6.6數(shù)字電視系統(tǒng)數(shù)字電視(DigitalTelevision)系統(tǒng)包括前端系統(tǒng)、傳輸網(wǎng)絡和接收終端,是一個從節(jié)目采集、節(jié)目制作、節(jié)目傳輸直到用戶端都以數(shù)字方式處理信號的端到端的系統(tǒng)。根據(jù)信號的空間傳播方式,數(shù)字電視主要包括四種形式:數(shù)字電視地面?zhèn)鬏斚到y(tǒng)、數(shù)字有線電視系統(tǒng)、數(shù)字衛(wèi)星電視系統(tǒng)、IP數(shù)字電視系統(tǒng)。國際電聯(lián)(ITU-T)給出的定義是:“高清晰度電視應是一個透明系統(tǒng),一個正常視力的觀眾在距該系統(tǒng)顯示屏高度的三倍距離上所看到的圖像質(zhì)量應具有觀看原始景物或表演時所得到的印象?!?/p>
§4.6多媒體視頻信息處理HDTV采用了全數(shù)字信號傳輸。§4.6多媒體視頻信息處理圖4-22不同制式的縱橫比屏幕效果比較(電影《指環(huán)王3》截圖)(a)NTSC或PAL制式的縱橫比為4∶3(b)HDTV標準規(guī)定的縱橫比為16∶94.6.7H.264視頻編解碼標準H.264標準的主要目標是:與其他現(xiàn)有的視頻編碼標準相比,在相同的帶寬下提供更加優(yōu)秀的圖像質(zhì)量。H.264標準的主要特點如下:(1)更高的編碼效率,同其他視頻編碼效率相比,能夠平均節(jié)省大于50%的碼率。(2)高質(zhì)量的視頻畫面,H.264能夠在低碼率情況下提供高質(zhì)量的視頻圖像。(3)提高網(wǎng)絡適應能力,H.264可以工作在實時通信應用(如視頻會議)低延時模式下,也可以工作在沒有延時的視頻存儲或視頻流服務器中?!?.6多媒體視頻信息處理H.264最大的優(yōu)勢是具有很高的數(shù)據(jù)壓縮比率,在同等圖像質(zhì)量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍?!?.6多媒體視頻信息處理4.6.8常見的視頻文件格式1.本地影像視頻(1)AVI格式AVI即音頻視頻交錯格式。AVI格式允許視頻和音頻交錯在一起同步播放,其優(yōu)點是圖像質(zhì)量好,可以跨多個平臺使用,缺點是壓縮標準不統(tǒng)一,不具有兼容性。(2)MOV格式默認的播放器是Apple公司的QuickTimePlayer。它具有較高的壓縮比率和較完美的視頻清晰度等特點,但是其最大的特點還是跨平臺性。§4.6多媒體視頻信息處理(3)MPEG/MPG/DAT格式MPEG即動態(tài)圖像專家組格式,是運動圖像壓縮算法的國際標準,現(xiàn)已被幾乎所有的計算機平臺共同支持。MPEG采用有損壓縮方法減少運動圖像中的冗余信息,從而達到高壓縮比(最高可達200∶1)的目的,同時圖像和音響的質(zhì)量也非常好,兼容性相當好。2.網(wǎng)絡影像視頻(1)FLVFLV是FLASHVIDEO的簡稱,F(xiàn)LV流媒體格式是隨著FlashMX的推出發(fā)展而來的視頻格式?!?.6多媒體視頻信息處理由于它形成的文件極小、加載速度極快,使得網(wǎng)絡觀看視頻文件成為可能,它的出現(xiàn)有效地解決了視頻文件導入Flash后,使導出的SWF文件體積龐大,不能在網(wǎng)絡上很好的使用等缺點。(2)WMV格式WMV也是微軟推出的一種采用獨立編碼方式并且可以直接在網(wǎng)上實時觀看視頻節(jié)目的文件壓縮格式。(3)RM格式對符合RealMedia規(guī)范的網(wǎng)絡音頻/視頻資源進行實況轉(zhuǎn)播,并且RealMedia可以根據(jù)不同的網(wǎng)絡傳輸速率制定出不同的壓縮比率,從而實現(xiàn)在低速率的網(wǎng)絡上進行影像數(shù)據(jù)實時傳送和播放?!?.6多媒體視頻信息處理(4)3GP3GP是一種3G流媒體的視頻編碼格式,主要是為了配合3G網(wǎng)絡的高傳輸速度而開發(fā)的。§4.6多媒體視頻信息處理目前,具有多媒體功能的計算機越來越普及,其中最廣泛、最基本的是多媒體個人計算機(MPC)。多媒體計算機使得計算機的外部設備日益豐富。通過多媒體計算機,人們可以處理聲音、視頻圖像(靜態(tài)、動態(tài))等各種媒體信息。我們現(xiàn)在所說的“多媒體”,常常不是指多種媒體本身,而主要是指處理和應用它的一整套技術(shù)。通常多媒體技術(shù)是指把文字、音頻、視頻、圖形、圖像、動畫等多媒體信息通過計算機進行數(shù)字化采集、獲取、壓縮/解壓縮、編輯、存儲等加工處理,再以單獨或合成形式表現(xiàn)出來的一體化技術(shù)。本章小結(jié)本章介紹了多媒體技術(shù)的基本概念和主要媒體在計算機中的信息表示方式與數(shù)字化過程。內(nèi)容涉及光盤存儲技術(shù)、音頻數(shù)字化過程及處理、圖像數(shù)字化過程及處理、對視頻信息獲取與處理的基本原理。無論何種媒體形式,其數(shù)字化過程都是一致的,即包括采樣、量化和編碼三個步驟。模擬量是連續(xù)量,而數(shù)字量是離散量,因此采樣是將在時間上連續(xù)的模擬量離散化。量化操作實質(zhì)上是用有限的離散量在取值空間上取代無限的連續(xù)模擬量的映射操作。為減少數(shù)字化后的存儲容量,一般對多媒體數(shù)據(jù)都要進行壓縮和編碼。本章小結(jié)一、思考與練習1.什么是媒體?媒體是如何分類的?一種是指用以存儲信息的實體(媒質(zhì));另一種是指信息的載體。多媒體計算機技術(shù)中的媒體是指后者。媒體可分為以下五種,如圖4-1所示。(1)感覺媒體(perception)(2)表示媒體(presentation)(3)顯示媒體(display)(4)存儲媒體(storage)(5)傳輸媒體(transmission)2.什么是多媒體?多媒體技術(shù)有哪些關(guān)鍵特性?各種感覺媒體的組合,也就是聲音、圖像、圖形、動畫、文字、數(shù)據(jù)、文件等各種媒體的組合。所謂多媒體就是在數(shù)值、文字、圖形等由計算機處理的信息中,使靜止圖像、語音、影像等時間序列信息相互關(guān)聯(lián),同步處理的技術(shù)。思考與練習一、思考與練習2.什么是多媒體?多媒體技術(shù)有哪些關(guān)鍵特性?多媒體技術(shù)就是計算機交互式綜合處理多種媒體信息——文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個系統(tǒng)并具有交互性。信息媒體的多樣性、多種技術(shù)的集成性和處理過程的交互性。大容量數(shù)據(jù)存儲技術(shù)、多媒體數(shù)據(jù)壓縮編碼與解碼技術(shù)、虛擬現(xiàn)實技術(shù)、多媒體數(shù)據(jù)庫技術(shù)、智能多媒體技術(shù)、多媒體信息檢索。3.一個完整的多媒體計算機系統(tǒng)包括哪幾個層次的結(jié)構(gòu)?硬件系統(tǒng)軟件系統(tǒng)API(接口)創(chuàng)作工具軟件多媒體應用系統(tǒng)思考與練習一、思考與練習4.相對于其他存儲介質(zhì)而言,光盤存儲具有哪些特點?如大容量、耐用、易保存、標準化等。5.常見的光盤標準是如何劃分的?可分為哪些類型?國際標準CD-DA標準CD-ROM標準Video-CD標準DVD標準1.只讀型光盤存儲器只讀光盤中的數(shù)據(jù)是用壓?;蚧瘜W刻寫方法制成的,用戶只能讀取上面的數(shù)據(jù),而不能寫入或修改光盤中的數(shù)據(jù)。2.一次可寫光盤存儲器一次性可寫光盤的每一個記憶單元只可以寫入一次,不可抹去。3.多次可擦寫光盤存儲器多次可擦寫光盤具有磁盤一樣的可擦寫性,允許用戶存儲、移動、修改光盤上的數(shù)據(jù),適合作為計算機的新型標準外存設備。思考與練習一、思考與練習6.DVD與藍光DVD能夠?qū)崿F(xiàn)大容量存儲的原因是什么?通過激光束來讀取。隨著軌道密度的增加及使用的激光束波長越來越短,光盤的存儲容量呈倍數(shù)增長。以前的CD光盤及VCD光盤只能進行單面數(shù)據(jù)存儲,而如今的DVD光盤不僅可以進行單面存儲,而且可以進行雙層儲存,最高版本的達到雙面雙層,共四層儲存空間。一張普通單面DVD光盤的存儲量為1.7GB,大約是一張普通VCD容量(640MB)的7倍,而四層DVD可以將存儲空間擴大到8.5GB。
Blu-ray的命名是來自于其采用的激光波長405納米(nm),剛好是光譜之中的藍光,因而得名。(DVD采用650nm波長的紅光讀寫器,CD則是采用780nm波長)7.簡述光盤系統(tǒng)記錄與讀取信息的原理。光盤存儲技
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四年級上冊語文教學計劃集合7篇
- 我的大學讀后感-15篇
- 《貓城記》讀書筆記個人書評
- 醫(yī)學生自我介紹范文集合四篇
- 冠心病二級預防他汀治療的理想與現(xiàn)實-血脂回顧和展望
- 淺析建筑物區(qū)分所有權(quán)制度
- 教師年度總結(jié)范文5篇
- 健身徒步旅行合同
- 2025年放射性核素遠距離治療機合作協(xié)議書
- 餐館租賃合同范本
- 旅行社公司章程53410
- 小學班主任工作總結(jié)PPT
- 起世經(jīng)白話解-
- 螺桿式制冷壓縮機操作規(guī)程完整
- 頜下腺囊腫摘除手術(shù)
- 五金件成品檢驗報告
- CDN基礎介紹PPT課件
- SPC八大控制圖自動生成器v1.01
- 復晶砂、粉在硅溶膠精密鑄造面層制殼中的應用
- 實驗室設備和分析儀器的確認和驗證
- 銻雜廢料的回收應用項目建議
評論
0/150
提交評論