




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
理解多媒體、多媒體技術(shù)的概念明確多媒體中的主要元素及其特點(diǎn)了解多媒體的關(guān)鍵特性以及這些特 性之間的關(guān)系了解多媒體的關(guān)鍵技術(shù)、主要應(yīng)用 領(lǐng)域和發(fā)展方向了解多媒體數(shù)據(jù)中的冗余以及幾種 主要壓縮算法學(xué)習(xí)目標(biāo)1.1多媒體的基本概念多媒體技術(shù)的應(yīng)用與發(fā)展多媒體的關(guān)鍵技術(shù)多媒體信息的計(jì)算機(jī)表示多媒體數(shù)據(jù)壓縮技術(shù)多媒體與因特網(wǎng)目錄1.1
多媒體的基本概念多媒體的定義多媒體技術(shù)及其特性多媒體中的媒體元素及其特征1.1.1
多媒體的定義何謂多媒體呢?“多媒體”一詞譯自英文“Multimedia”即“Multiple”和”Media”的合成其核心詞是媒體媒體(medium)在計(jì)算機(jī)領(lǐng)域有兩種含義:即媒質(zhì)和媒介。媒質(zhì):存儲(chǔ)信息的實(shí)體,如磁盤、光盤、磁帶、半導(dǎo)體存儲(chǔ)器等。
媒介:傳遞信息的載體,如數(shù)字、文字、聲音、圖形和圖像等。通常概念的“媒體”,可分為以五種類型:通常概念的“媒體”,可分為以下五種類型:感覺媒體表示媒體顯示媒體存儲(chǔ)媒體傳輸媒體感覺媒體:能直接作用于人們的感覺器官,從而能使人產(chǎn)生直接感覺的媒體。如語音、音樂、各種圖像、動(dòng)畫、文本等。表示媒體:為了傳送感覺媒體而人為研究出來的媒體。借助于此種媒體,便能更有效的存儲(chǔ)或傳送感覺媒體。如語言編碼、電報(bào)碼等。顯示媒體:用于通信中使電信號(hào)和感覺媒體之間產(chǎn)生轉(zhuǎn)換用的媒體。如輸入、輸出設(shè)施,鍵盤鼠標(biāo)器、顯示器、打印機(jī)等。傳輸媒體:用于傳輸某些媒體的媒體,如電話線、電纜光纖等。存儲(chǔ)媒體:用于存放某種媒體的媒體如紙張、磁帶、磁盤、光盤等。1.1.2
計(jì)算機(jī)技術(shù)及其特性多媒體計(jì)算機(jī)技術(shù)的定義:計(jì)算機(jī)綜合處理多種媒體信息,文本圖形、圖像、音頻和視頻,使多種信息建立邏輯連接,集成為一個(gè)系統(tǒng)并具有交互性。多媒體計(jì)算機(jī)技術(shù)的三個(gè)主要特性信息載體的多樣性交互性 集成性信息載體的多樣性是相對(duì)于計(jì)算機(jī)而言的,即指信息媒體的多樣性。多媒體就是要把計(jì)算機(jī)處理的信息多樣化或多維化,從而改變計(jì)算機(jī)信息處理的單一模式,使人們能交互的處理多種信息。信息載體的多樣性交互性多媒體的交互性是指用戶可以與計(jì)算機(jī)的多種信息媒體進(jìn)行交互操作從而為用戶提供了更加有效地控制和使用信息的手段。集成性集成性是指以計(jì)算機(jī)為中心綜合處理多種信息媒體,它包括信息媒體的集成和處理這些媒體的設(shè)備的集成。信息媒體的集成包括信息的多通道統(tǒng)一獲取、多媒體信息的統(tǒng)一組織和存儲(chǔ)、多媒體信息表現(xiàn)合成等方面。多媒體設(shè)備的集成包括硬件和軟件兩個(gè)方面。多媒體媒體元素是指多媒體應(yīng)用中可顯示給用戶的媒體組成。1.1.3
多媒體中的媒體元素及特征動(dòng)畫音頻視頻文本圖形圖像文本文本分為非格式化文本文件和格式化文本文件。非格式化文本文件:只有文本信息沒有其他任何有關(guān)格式信息的文件,又稱為純文本文件。如“.TXT
”文件。格式化文本文件:帶有各種文本排版信息等格式信息的文本文件。如“.DOC”文件。圖形圖形(Graphic)一般指用計(jì)算機(jī)繪制的畫面,如直線、圓、圓弧、矩形、任意曲線和圖表等。圖形的格式是一組描述點(diǎn)、線、面等幾何圖形的大小、形狀及其位置、維數(shù)的指令集合。在圖形文件中只記錄生成圖的算法和圖上的某些特征點(diǎn),因此也稱矢量圖。用于產(chǎn)生和編輯矢量圖形的程序通常稱為“draw
”程序。微機(jī)上常用的矢量圖形文件有:
“.3DS”(用于3D造型)、“.DXF”(用于
CAD)、“.WMF”(用于桌面出版)等等。由于圖形只保存算法和特征點(diǎn),因此占用的存儲(chǔ)空間很小。但顯示時(shí)需經(jīng)過重新計(jì)算,因而顯示速度相對(duì)慢些。圖像圖像(Image)是指由輸入設(shè)備捕捉的實(shí)際場景畫面,或以數(shù)字化形式存儲(chǔ)的任意畫面。靜止的圖像是一個(gè)矩陣,陣列中的各項(xiàng)數(shù)字用來描述構(gòu)成圖像的各個(gè)點(diǎn)(稱為像素點(diǎn)pixel
)的強(qiáng)度與顏色等信息。這種圖像也稱為位圖(
bit-mapped
picture
)。分辨率圖像深度與顯示深度圖像文件大小用于生成和編輯位圖圖像的軟件通常稱為“paint”程序。圖像文件在計(jì)算機(jī)中的存儲(chǔ)格式有多種,如BMP、PCX、TIF、TGA、GIF、JPG等,一般數(shù)據(jù)量都較大。圖像處理時(shí)要考慮三個(gè)因素:分辨率圖像深度與顯示深度圖像文件大小分辨率屏幕分辨率:顯示器屏幕上的最大顯示區(qū)域,即水平與垂直方向的像素個(gè)數(shù)。圖像分辨率:數(shù)字化圖像的大小,即該圖像的水平與垂直方向的像素個(gè)數(shù)。像素分辨率:像素的寬和高之比一般為1:1。圖像深度和顯示深度圖像深度(也稱圖像灰度、顏色深度)表示數(shù)字位圖圖像中每個(gè)像素上用于表示顏色的二進(jìn)制數(shù)字位數(shù)。顯示深度:表示顯示器上每個(gè)點(diǎn)用于顯示顏色的2
進(jìn)制數(shù)字位數(shù)。若顯示器的顯示深度小于數(shù)字圖像的深度,就會(huì)使數(shù)字圖像顏色的顯示失真。顏色深度顏色總數(shù)圖像名稱12單色圖像416索引16
色圖像8256索引256
色圖像1665536HI—Color
圖像2416672216True
Color
圖像顏色深度與顯示的顏色數(shù)目圖像文件大小用字節(jié)表示圖像文件大小時(shí),一幅未經(jīng)壓縮的數(shù)字圖像的數(shù)據(jù)量大小計(jì)算如下:圖像數(shù)據(jù)量大小=像素總數(shù)×圖像深度÷8例如:一幅640×480的256色圖像為
640×480×8/8=307200字節(jié)Comparison:寬度:271寬度:271高度:300高度:300顏色:2顏色:4大?。?.9KB大?。?9.8
KBComparison:寬度:271寬度:271高度:300高度:300顏色:256顏色:真彩色大?。?9.4KB大?。?38.2
KB音頻數(shù)字音頻(Audio)可分為波形聲音語音和音樂。波形聲音實(shí)際上已經(jīng)包含了所有的聲音形式,它可以將任何聲音都進(jìn)行采樣量化,相應(yīng)的文件格式是WAV文件或
VOC文件。語音也是一種波形,所以和波形聲音的文件格式相同。音樂是符號(hào)化了的聲音,樂譜可轉(zhuǎn)變?yōu)榉?hào)媒體形式。對(duì)應(yīng)的文件格式是
MID或CMF文件。計(jì)算機(jī)音頻技術(shù)主要包括聲音的采集、數(shù)字化、壓縮/解壓縮以及聲音的播放。數(shù)字化主要包括采樣和量化這兩個(gè)方面。采樣頻率(sampling
rate)是將模擬聲音波形轉(zhuǎn)換為數(shù)字時(shí),每秒鐘所抽取聲波幅度樣本的次數(shù),單位是
Hz(赫茲)。量化數(shù)據(jù)位數(shù)(也稱量化級(jí))是每個(gè)采樣點(diǎn)能夠表示的數(shù)據(jù)范圍,經(jīng)常采用的有8位、12位和16位。例如,8位量化級(jí)表示每個(gè)采樣點(diǎn)可以表示256個(gè)不同量化值,而16位量化級(jí)則可以表示65536個(gè)不同的量化值記錄聲音時(shí),如果每次生成一個(gè)聲道數(shù)據(jù),稱為單聲道;每次生成兩個(gè)聲波數(shù)據(jù),稱為立體聲(雙聲道)。數(shù)字音頻的存儲(chǔ)量:可用以下公式估算聲音數(shù)字化后每秒所需的存儲(chǔ)量(未經(jīng)壓縮的)存儲(chǔ)量=采樣頻率×量化位數(shù)÷8若使用雙聲道,存儲(chǔ)量再增加一倍例如,數(shù)字激光唱盤(CD-DA)的標(biāo)準(zhǔn)采樣頻率為44.1kHz,量化位數(shù)為16位,立體聲。一分鐘CD-DA音樂所需的存儲(chǔ)量為44.1
K×16×2×60÷8
=
10584
KBSamplingResolution8
bitSamplingFrequency11
KHz+127…+64+320-32-64…-12801001010Comparison:SamplingResolution16
bitSamplingFrequency22
KHz+32767…+512+1280-128-512…-327680010101100011000Comparison:動(dòng)畫是活動(dòng)的畫面,實(shí)質(zhì)是一幅幅靜態(tài)圖像的連續(xù)播放。動(dòng)畫的連續(xù)播放既指時(shí)間上的連續(xù),也指圖像內(nèi)容上的連續(xù)。計(jì)算機(jī)設(shè)計(jì)動(dòng)畫有兩種:一種是幀動(dòng)畫,一種是造型動(dòng)畫。動(dòng)畫幀動(dòng)畫是由一幅幅位圖組成的連續(xù)的畫面,就如電影膠片或視頻畫面一樣要分別設(shè)計(jì)每屏幕顯示的畫面。造型動(dòng)畫是對(duì)每一個(gè)運(yùn)動(dòng)的物體分別進(jìn)行設(shè)計(jì),賦予每個(gè)動(dòng)元一些特征,然后用這些動(dòng)元構(gòu)成完整的幀畫面。動(dòng)元的表演和行為是由制作表組成的腳本來控制。存儲(chǔ)動(dòng)畫的文件格式有FLC、MMM等視頻視頻是由一幅幅單獨(dú)的畫面序列(幀frame)組成,這些畫面以一定的速率(fps)連續(xù)地投射在屏幕上,使觀察者具有圖像連續(xù)運(yùn)動(dòng)的感覺。視頻文件的存儲(chǔ)格式有AVI、MPGMOV等。視頻標(biāo)準(zhǔn)主要有NTSC制和PAL制兩種。NTSC標(biāo)準(zhǔn)為30fps,每幀525行。
PAL標(biāo)準(zhǔn)為25fps,每幀625行。視頻的技術(shù)參數(shù)有:幀速數(shù)據(jù)量
圖像質(zhì)量1.2
多媒體技術(shù)的應(yīng)用與發(fā)展多媒體技術(shù)的應(yīng)用多媒體技術(shù)的發(fā)展方向1.2.1
多媒體技術(shù)的應(yīng)用就目前而言,多媒體技術(shù)已在商業(yè)教育培訓(xùn)、電視會(huì)議、聲像演示等方面得到了充分應(yīng)用。在教育與培訓(xùn)方面的應(yīng)用在通信方面的應(yīng)用在其他方面的應(yīng)用在教育與培訓(xùn)方面的應(yīng)用多媒體技術(shù)使教材不僅有文字、靜態(tài)圖像,還具有動(dòng)態(tài)圖像和語音等。使教育的表現(xiàn)形式多樣化,可以進(jìn)行交互式遠(yuǎn)程教學(xué)。利用多媒體計(jì)算機(jī)的文本、圖形、視頻、音頻和其交互式的特點(diǎn),可以編制出計(jì)算機(jī)輔助教學(xué)CAI(ComputerAssisted
Instruction)軟件,即課件。在通信方面的應(yīng)用多媒體技術(shù)在通信方面的應(yīng)用主要有:可視電話視頻會(huì)議信息點(diǎn)播(Information
Demand)計(jì)算機(jī)協(xié)同工作CSCW(Computer
SupportedCooperative
Work)信息點(diǎn)播有桌上多媒體通信系統(tǒng)和交互電視ITV。計(jì)算機(jī)協(xié)同工作CSCW是指在計(jì)算機(jī)支持的環(huán)境中,一個(gè)群體協(xié)同工作以完成一項(xiàng)共同的任務(wù)。計(jì)算機(jī)的交互性,通信的分布性和多媒體的現(xiàn)實(shí)性相結(jié)合,將構(gòu)成繼電報(bào)電話、傳真之后的第四代通信手段。在其他方面的應(yīng)用多媒體技術(shù)給出版業(yè)帶來了巨大的影響,其中近年來出現(xiàn)的電子圖書和電子報(bào)刊就是應(yīng)用多媒體技術(shù)的產(chǎn)物。利用多媒體技術(shù)可為各類咨詢提供服務(wù),如旅游、郵電、交通、商業(yè)、金融、賓館等。多媒體技術(shù)還將改變未來的家庭生活,多媒體技術(shù)在家庭中的應(yīng)用將使人們?cè)诩抑猩习喑蔀楝F(xiàn)實(shí)。1.2.2
多媒體技術(shù)的發(fā)展方向目前,多媒體主要從以下幾個(gè)方向發(fā)展:多媒體通信網(wǎng)絡(luò)環(huán)境的研究和建立將使多媒體從單機(jī)單點(diǎn)向分布、協(xié)同多媒體環(huán)境發(fā)展,在世界范圍內(nèi)建立一個(gè)可全球自由交互的通信網(wǎng)。對(duì)該網(wǎng)絡(luò)及其設(shè)備的研究和網(wǎng)上分布應(yīng)用與信息服務(wù)研究將是熱點(diǎn)。1利用圖像理解、語音識(shí)別、全文檢索等技術(shù),研究多媒體基于內(nèi)容的處理、開發(fā)能進(jìn)行基于內(nèi)容的處理系統(tǒng)是多媒
體信息管理的重要方向。多媒體標(biāo)準(zhǔn)仍是研究的重點(diǎn):各類標(biāo)準(zhǔn)的研究將有利于產(chǎn)品規(guī)范化,應(yīng)用更方便。它是實(shí)現(xiàn)多媒體信息交換和大規(guī)模產(chǎn)業(yè)化的關(guān)鍵所在。23多媒體技術(shù)與相鄰技術(shù)相結(jié)合,提供了完善的人機(jī)交互環(huán)境。多媒體仿真
智能多媒體等新技術(shù)層出不窮,擴(kuò)大了
原有技術(shù)領(lǐng)域的內(nèi)涵,并創(chuàng)造新的概念。多媒體技術(shù)與外圍技術(shù)構(gòu)造的虛擬現(xiàn)實(shí)研究仍在繼續(xù)進(jìn)展。多媒體虛擬現(xiàn)
實(shí)與可視化技術(shù)需要相互補(bǔ)充,并與語
音、圖像識(shí)別、智能接口等技術(shù)相結(jié)合,建立高層次虛擬現(xiàn)實(shí)系統(tǒng)。45將來多媒體技術(shù)將向著以下六個(gè)方向發(fā)展;高分辨化,提高顯示質(zhì)量;高速度化,縮短處理時(shí)間;簡單化,便于操作;高維化,三維、四維或更高維;智能化,提高信息識(shí)別能力;標(biāo)準(zhǔn)化,便于信息交換和資源共享。1.3
多媒體的關(guān)鍵技術(shù)視頻音頻數(shù)據(jù)壓縮/解壓縮技術(shù)多媒體專用芯片技術(shù)大容量信息存儲(chǔ)技術(shù)多媒體輸入與輸出技術(shù)多媒體軟件技術(shù)多媒體通信技術(shù)虛擬現(xiàn)實(shí)技術(shù)1.3.1
視頻音頻數(shù)據(jù)壓縮/解壓縮技術(shù)研制MPC需要解決的關(guān)鍵問題之一是要使計(jì)算機(jī)能適時(shí)地綜合處理聲、文圖信息。選用合適的數(shù)據(jù)壓縮技術(shù),有可能將字符數(shù)據(jù)量壓縮到原來的1/2左右,語音數(shù)據(jù)量壓縮到原來的1/2-1/10,圖像數(shù)據(jù)量壓縮到原來的1/2-1/60。如今已有壓縮編碼/解壓縮編碼的國際標(biāo)準(zhǔn)JPEG
和MPEG
。1.3.2
多媒體專用芯片技術(shù)專用芯片是多媒體計(jì)算機(jī)硬件體系結(jié)構(gòu)的關(guān)鍵。為了實(shí)現(xiàn)音頻、視頻信號(hào)的快速壓縮、解壓縮和播放處理,需要大量的快速計(jì)算,只有采用專用芯片,才能取得滿意的效果。多媒體計(jì)算機(jī)專用芯片可歸納為兩種類型:一種是固定功能的芯片;另一種是可編程的數(shù)字信號(hào)處理器(DSP)芯片。1.3.3
大容量信息存儲(chǔ)技術(shù)利用數(shù)據(jù)壓縮技術(shù),在一張CD-ROM光盤上能夠存取70多分鐘全運(yùn)動(dòng)的視頻圖像或者十幾個(gè)小時(shí)的語言信息或數(shù)千幅靜止圖像。在CD-ROM基礎(chǔ)上,還開發(fā)了CD-I和CD-V、可錄式光盤CD-R、高畫質(zhì)、高音質(zhì)的光盤DVD以及PHOTO
CD等。1.3.4
多媒體輸入與輸出技術(shù)多媒體輸入/輸出技術(shù)包括媒體變換技術(shù)、媒體識(shí)別技術(shù)、媒體理解技術(shù)和綜合技術(shù)。媒體變換技術(shù)是指改變媒體的表現(xiàn)形式。如當(dāng)前廣泛使用的視頻卡、音頻卡(聲卡)都屬媒體變換設(shè)備。媒體識(shí)別技術(shù)是對(duì)信息進(jìn)行一對(duì)一的映像過程。例如,語音識(shí)別技術(shù)和觸摸屏技術(shù)等。媒體理解技術(shù)是對(duì)信息進(jìn)行更進(jìn)一步的分析處理和理解信息內(nèi)容。如自然語言理解、圖像理解、模式識(shí)別等技術(shù)。媒體綜合技術(shù)是把低維信息表示映像成高維的模式空間的過程。例如語音合成器就可以把語音的內(nèi)部表示綜合為聲音輸出。1.3.5
多媒體軟件技術(shù)多媒體軟件技術(shù)主要包括以下六個(gè)方面的內(nèi)容:多媒體操作系統(tǒng)多媒體素材采集與制作技術(shù)多媒體編輯與創(chuàng)作工具多媒體數(shù)據(jù)庫技術(shù)超文本/超媒體技術(shù)多媒體應(yīng)用開發(fā)技術(shù)多媒體操作系統(tǒng)多媒體操作系統(tǒng)是多媒體軟件的核心。它負(fù)責(zé)多媒體環(huán)境下多任務(wù)的調(diào)度、保證音頻、視頻同步控制以及信息處理的實(shí)時(shí)性,提供多媒體信息的各種基本操作和管理;具有對(duì)設(shè)備的相對(duì)獨(dú)立性與可擴(kuò)展性。Windows、OS/2和Macintosh操作系統(tǒng)都提供了對(duì)多媒體的支持。多媒體素材采集與制作技術(shù)素材的采集與制作主要包括采集并編輯多種媒體數(shù)據(jù)。如聲音信號(hào)的錄制編輯和播放;圖像掃描及預(yù)處理;全動(dòng)態(tài)視頻采集及編輯;動(dòng)畫生成編輯;音/視頻信號(hào)的混合和同步等。多媒體編輯與創(chuàng)作工具多媒體編輯創(chuàng)作軟件又稱多媒體創(chuàng)作工具,是多媒體專業(yè)人員在多媒體操
作系統(tǒng)之上開發(fā)的,供特定應(yīng)用領(lǐng)域的
專業(yè)人員組織編排多媒體數(shù)據(jù),并把它
們連接成完整的多媒體應(yīng)用系統(tǒng)的工具。高檔的創(chuàng)作工具用于影視系統(tǒng)的動(dòng)畫制作及特技效果,中檔的用于培訓(xùn)、教育和娛樂節(jié)目制作,低檔的用于商業(yè)簡介、家庭學(xué)習(xí)材料的編輯。多媒體數(shù)據(jù)庫技術(shù)多媒體信息是結(jié)構(gòu)型的,致使傳統(tǒng)的關(guān)系數(shù)據(jù)庫已不適用于多媒體的信息管理,需要從下面四個(gè)方面研究數(shù)據(jù)庫1).多媒體數(shù)據(jù)模型2).媒體數(shù)據(jù)壓縮和解壓縮的模式3).多媒體數(shù)據(jù)管理及存取方法4).用戶界面超文本/超媒體技術(shù)超文本是一種新穎的文本信息管理技術(shù),它提供的方法是建立各種媒體信息之間的網(wǎng)狀鏈接結(jié)構(gòu),這種結(jié)構(gòu)由節(jié)點(diǎn)組成。對(duì)超文本進(jìn)行管理使用的系統(tǒng)稱為超文本系統(tǒng)。也即瀏覽器,或稱為導(dǎo)航圖。若超文本中的節(jié)點(diǎn)的數(shù)據(jù)不僅可以是文本,還可以是圖像、動(dòng)畫、音頻、視頻,則稱為超媒體。多媒體應(yīng)用開發(fā)技術(shù)多媒體應(yīng)用的開發(fā)會(huì)使一些采用不同問題解決方法的人集中到一起,包括計(jì)算機(jī)開發(fā)人員、音樂創(chuàng)作人員,圖像藝術(shù)家等,他們的工作方法以及思考問題的方法都將是完全不同的。對(duì)于項(xiàng)目管理者來說,研究和推出一個(gè)多媒體應(yīng)用開發(fā)方法學(xué)將是極為重要的。1.3.6
多媒體通信技術(shù)多媒體通信技術(shù)包含語音壓縮、圖像壓縮及多媒體的混合傳輸技術(shù)。寬帶綜合業(yè)務(wù)數(shù)字網(wǎng)(B-ISDN)是解決多媒體數(shù)據(jù)的傳輸問題的一個(gè)比較完整的方法,其中ATM(異步傳送模式)是近年來在研究和開發(fā)上的一個(gè)重要成果。1.3.7
虛擬現(xiàn)實(shí)技術(shù)虛擬現(xiàn)實(shí)的定義可歸納為:利用計(jì)算機(jī)技術(shù)生成的一個(gè)逼真的視覺、聽覺觸覺及嗅覺等的感覺世界,用戶可以用人的自然技能對(duì)這個(gè)生成的虛擬實(shí)體進(jìn)行交互考察。虛擬現(xiàn)實(shí)技術(shù)是在眾多相關(guān)技術(shù)上發(fā)展起來的一個(gè)高度集成的技術(shù),是計(jì)算機(jī)軟硬件技術(shù)、傳感技術(shù)、機(jī)器人技術(shù)、人工智能及心理學(xué)等飛速發(fā)展的結(jié)晶。1.4
多媒體信息的計(jì)算機(jī)表示聲音文件的基本格式圖像及圖像文件格式視頻和動(dòng)畫的文件格式1.4.1
聲音文件的基本格式WAV文件MIDIVOC文件MOD文件WAV文件Windows所用的標(biāo)準(zhǔn)數(shù)字音頻稱為波形文件,文件的擴(kuò)展名是“.WAV”,它記錄了對(duì)實(shí)際聲音進(jìn)行采樣的數(shù)據(jù)。它
可以重現(xiàn)各種聲音,但產(chǎn)生的文件很大。采用的軟件壓縮方法主要有ACM和PCM等。人的講話聲使用8位量化級(jí)11.025KHz采樣率就能較好的還原。CD音質(zhì)需要16位量化級(jí)、44.1KHz的采樣率。MIDIMIDI文件的擴(kuò)展名為“.MID”,它與波形文件不同,記錄的不是聲音本身,而是將每個(gè)音符記錄為一個(gè)數(shù)字,因此比較節(jié)省空間,可以滿足長時(shí)間音樂的需要。MIDI的主要限制是缺乏重現(xiàn)真實(shí)自然的能力。采用波表法進(jìn)行音樂合成的聲音卡可以使MIDI音樂的質(zhì)量大大提高。VOC文件:VOC文件也是一種數(shù)字聲音文件,主要用于DOS程序。與波形文件相似,可以方便地互相轉(zhuǎn)換。MOD文件:MOD文件是移植過來的
MODULE音樂。它主要由一些業(yè)余音樂愛好者通過網(wǎng)絡(luò)和BBS支持。1.4.2
圖像及圖像文件格式圖像是由一些排成行和列的點(diǎn)組成的,通常稱為位圖或點(diǎn)陣圖。圖像文件在計(jì)算機(jī)中的存儲(chǔ)格式有多種,如”.BMP”、”.PCX”、”.TIF”、”.TGA“.GIF”、”.JPG”
等。1.BMP格式BMP是標(biāo)準(zhǔn)的WINDOWS和OS/2的圖形和圖像的基本位圖格式,有壓縮(RLE)和非壓縮之分。BMP支持黑白圖像、16色和256色的偽彩色圖像以及
RGB真彩色圖像。2.PCX格式是使用游程長編碼(RLE)方法進(jìn)行壓縮的圖像文件格式文件。支持黑白圖像、16色和256色的偽彩色圖像、灰度圖像以及RGB真彩色圖像,3.GIF格式GIF是壓縮圖像存儲(chǔ)格式,它使用
LZW壓縮方法,壓縮比較高,文件長度較小。支持黑白圖像、16色和256色的彩色圖像。4.TIF格式TIF格式是工業(yè)標(biāo)準(zhǔn)格式,支持所有圖像類型。文件分成壓縮和非壓縮兩大類。5.JPG和PIC格式JPG和PIC都使用JPEG方法進(jìn)行圖像數(shù)據(jù)壓縮。這兩種格式的最大特點(diǎn)是文件非常小。它是一種有損壓縮的靜態(tài)圖像文件存儲(chǔ)格式。支持灰度圖像、
RGB真彩色圖像和CMYK真彩色圖像。6.PCD格式PCD格式是Photo-CD的專用存儲(chǔ)格式,文件中含有從專業(yè)攝影照片到普通顯示用的多種分辨率的圖像,所以數(shù)據(jù)量都非常大。Comparison:Einstein.bmp顏色:真彩色Einstein.gif顏色:256大?。?39.1KB大?。?1.4
KB壓縮比:1.0壓縮比:1.3Comparison:Einstein.jpg顏色:真彩色大?。?1.1
KB壓縮比:21.4Einstein.tif顏色:真彩色
大?。?38.4
KB壓縮比:1.01.4.3
視頻和動(dòng)畫的文件格式動(dòng)畫文件的格式主要有兩種:
FLIC格式和MMM格式。視頻文件的使用一般與標(biāo)準(zhǔn)有關(guān),主要有AVI、MOV、MPG、DAT、DIR等。FLIC動(dòng)畫早期版本的FLIC文件只支持
320×200×256色模式,文件的擴(kuò)展名為“.FIY”。較新版本支持的分辨率和顏色數(shù)都有所提高,文件的擴(kuò)展名也改為
“.FLC”。它使用了無損壓縮方法,畫面效果十分清晰,但本身不能存儲(chǔ)同步聲音。MMM動(dòng)畫MMM格式是微軟多媒體動(dòng)畫的文件格式。AVI文件AVI文件將視頻和音頻信號(hào)混合交錯(cuò)地存儲(chǔ)在一起。其文件擴(kuò)展名為“.AVI”,采用了Intel公司的Indeo視頻有損壓縮
技術(shù),較好地解決了音頻信息與視頻信息同步的問題。MOV文件MOV是Macintosh計(jì)算機(jī)用的影視文件格式。也采用了Intel公司的Indeo視頻有損壓縮技術(shù),以及視頻與音頻信息混排技術(shù)。MPG文件是PC機(jī)上全屏幕活動(dòng)視頻的標(biāo)準(zhǔn)文件格式,它是使用MPEG方法進(jìn)行壓縮的全運(yùn)動(dòng)視頻圖像。DAT文件DAT是Video
CD或KaraokeCD數(shù)據(jù)文件的擴(kuò)展名,也是基于MPEG壓縮方法的一種文件格式。DIR格式DIR是Marco
Media公司使用的
Director多媒體著作工具產(chǎn)生的電影文件格式。1.5
多媒體數(shù)據(jù)壓縮技術(shù)多媒體數(shù)據(jù)的冗余類型數(shù)據(jù)壓縮方法視頻編碼的國際標(biāo)準(zhǔn)1.5.1
多媒體數(shù)據(jù)的冗余類型1.空間冗余2.時(shí)間冗余3.視覺冗余圖像數(shù)據(jù)表示中存在著大量的冗余,圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下:空間冗余時(shí)間冗余視覺冗余空間冗余一幅圖像表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性,基于離散像素采樣來表示物體表面顏色的像素存儲(chǔ)方式可利用空間連貫性,達(dá)到減少數(shù)據(jù)量的目的。例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點(diǎn)的光強(qiáng)和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。時(shí)間冗余運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場景畫面,所以稱為時(shí)間冗余。同理,語音數(shù)據(jù)中也存在著時(shí)間冗余。視覺冗余人類的視覺系統(tǒng)對(duì)圖像場的敏感度是非均勻的。但是,在記錄原始的圖像數(shù)據(jù)時(shí),通常假定視覺系統(tǒng)近似線性的和均勻的,對(duì)視覺敏感和不敏感的部分同等對(duì)待,從而產(chǎn)生比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來的編碼)更多的數(shù)據(jù),這就是視覺冗余。1.5.2
數(shù)據(jù)壓縮方法無損壓縮混合壓縮有損壓縮壓縮處理一般是由兩個(gè)過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便存儲(chǔ)與傳輸;二是解碼過程,此過程對(duì)編碼數(shù)據(jù)進(jìn)行解碼,還原為可以使用的數(shù)據(jù)。數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮 有損壓縮混合壓縮無損壓縮無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。其原理是統(tǒng)計(jì)壓縮數(shù)據(jù)中的冗余
(重復(fù)的數(shù)據(jù))部分。常用的有:RLE
(run
length
encoding)行程編碼
Huffman
編碼算術(shù)編碼LZW
(lempel-ziv-welch)編碼(1)、行程編碼(RLE)RLE編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號(hào)表示。例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B。RLE編碼簡單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.(2)、Huffman編碼它是一種對(duì)統(tǒng)計(jì)獨(dú)立信源能達(dá)到最小平均碼長的編碼方法。其原理是,先統(tǒng)計(jì)數(shù)據(jù)中各字符出現(xiàn)的概率后,再按字符出現(xiàn)頻率高低的順序分別賦以由短到長的代碼,從而保證了文件的整體的大部分字符是由較短的編碼構(gòu)成的。(3)、算術(shù)編碼其方法是將被編碼的信源消息表示成實(shí)數(shù)軸0-1之間的一個(gè)間隔,消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位數(shù)就越多。該方法實(shí)現(xiàn)較為復(fù)雜,常與其它有損壓縮結(jié)合使用,并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。(4)、LZW編碼LZW(Lempel-Ziv-Welch)壓縮使用字典庫查找方案。它讀入待壓縮的數(shù)據(jù)并與一個(gè)字典庫(庫開始是空的)中的字符串對(duì)比,如有匹配的字符串,則輸出該字符串?dāng)?shù)據(jù)在字典庫中的位置索引,否則將該字符串插入字典中。許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。另外,.GIF和.TIF格式的圖形文件也是按這一文件存儲(chǔ)的。有損壓縮圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對(duì)頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價(jià),換取了較高的壓縮比。常用的有損壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測編碼、變換編碼、插值與外推等。新一代的數(shù)據(jù)壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等?;旌蠅嚎s混合壓縮是利用了各種單一壓縮的長處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。該方法在許多情況下被應(yīng)用,如
JPEG和MPEG標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。1.5.3
視頻編碼的國際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)3.視頻通信編碼標(biāo)準(zhǔn)靜止圖像壓縮標(biāo)準(zhǔn)國際標(biāo)準(zhǔn)化組織(ISO)和國際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的
“聯(lián)合照片專家組“JPEG(joint
photographic
experts
group)于1991年提出的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小班兒童自我管理能力的提升計(jì)劃
- 制定應(yīng)對(duì)突發(fā)事件的工作方案計(jì)劃
- 財(cái)務(wù)發(fā)展實(shí)施計(jì)劃
- 四年級(jí)思想與社會(huì)上冊(cè) 家鄉(xiāng)的故事教學(xué)實(shí)錄1 北師大版
- 員工離職面談的重要性與方法計(jì)劃
- 保安工作總結(jié)計(jì)劃藥店行業(yè)保安工作的藥品儲(chǔ)存
- 五年級(jí)品德與社會(huì)下冊(cè) 第四單元 我們生活的地球 2 我們的地球村教學(xué)實(shí)錄 新人教版
- 《貴州圖南礦業(yè)(集團(tuán))有限公司興仁市下山鎮(zhèn)四海煤礦(變更)礦產(chǎn)資源綠色開發(fā)利用方案(三合一)》專家組評(píng)審意見
- 《貴陽市白云區(qū)興旺鋁土礦有限公司白云區(qū)沙文鄉(xiāng)興旺鋁土礦(延續(xù))礦產(chǎn)資源綠色開發(fā)利用方案(三合一)》評(píng)審意見
- 七年級(jí)地理上冊(cè) 6.2 聚落的發(fā)展與保護(hù)教學(xué)實(shí)錄 晉教版
- 《數(shù)字孿生技術(shù)應(yīng)用指南》
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)教程(各類院校創(chuàng)新創(chuàng)業(yè)課程)全套教學(xué)課件
- 2024年5月泉州市高三語文高考三模質(zhì)檢試卷附答案解析
- 建設(shè)工程安全生產(chǎn)管理模擬練習(xí)題及答案
- 2024年刑法知識(shí)考試題庫及答案(典優(yōu))
- (高清版)JTGT 5440-2018 公路隧道加固技術(shù)規(guī)范
- 追悼會(huì)主持詞開場白-追悼會(huì)流程主持詞
- 國家基本藥物臨床應(yīng)用指南最完整版
- 急性髓系白血病小講課
- 大氣冬季滑雪旅游宣傳
- 2016-2023年株洲師范高等??茖W(xué)校高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
評(píng)論
0/150
提交評(píng)論