基于OPENCV的視頻播放器設(shè)計(jì)_第1頁(yè)
基于OPENCV的視頻播放器設(shè)計(jì)_第2頁(yè)
基于OPENCV的視頻播放器設(shè)計(jì)_第3頁(yè)
基于OPENCV的視頻播放器設(shè)計(jì)_第4頁(yè)
基于OPENCV的視頻播放器設(shè)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩68頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

沈陽(yáng)理工大學(xué)學(xué)士學(xué)位論文摘要關(guān)鍵詞Abstract1緒論 12視頻技術(shù)概述 7 3OPENCV庫(kù)使用 184VC開發(fā)環(huán)境 22 5視頻播放器的設(shè)計(jì)與實(shí)現(xiàn) 25 6程序運(yùn)行結(jié)果及分析 35結(jié)論 38致謝 39參考文獻(xiàn) 40附錄A英文原文 41附錄B漢語(yǔ)翻譯 47附錄C程序源代碼 521緒論1.1概述C++語(yǔ)言是一種優(yōu)秀的面向?qū)ο蟪绦蛟O(shè)計(jì)語(yǔ)言,它在C語(yǔ)言的基礎(chǔ)上發(fā)展而來,但它比C語(yǔ)言更容易為人們學(xué)習(xí)和掌握。C++以其獨(dú)特的語(yǔ)言機(jī)制在計(jì)算機(jī)科學(xué)的各個(gè)領(lǐng)域中得到了廣泛的應(yīng)用。面向?qū)ο蟮脑O(shè)計(jì)思想是在原來結(jié)構(gòu)化程序設(shè)計(jì)方法基礎(chǔ)上的一個(gè)質(zhì)的飛躍,C++完美地體現(xiàn)了面向?qū)ο蟮母鞣N特性。[1]C++程序設(shè)計(jì)語(yǔ)言是由來自AT&TBellLaboratories的BjarneStroustrup設(shè)計(jì)和實(shí)現(xiàn)的,它兼具Simula語(yǔ)言在組織與設(shè)計(jì)方面的特性以及適用于系統(tǒng)程序設(shè)計(jì)的C語(yǔ)言設(shè)施。C++最初的版本被稱作“帶類的C(Cwithclasses)”[Stroustrup,1980],在1980年被第一次投入使用;當(dāng)時(shí)它只支持系統(tǒng)程序設(shè)計(jì)和數(shù)據(jù)抽象技術(shù)。支持面向?qū)ο蟪绦蛟O(shè)計(jì)的語(yǔ)言設(shè)施在1983年被加入C++;之后,面向?qū)ο笤O(shè)計(jì)方法和面向?qū)ο蟪绦蛟O(shè)計(jì)技術(shù)就逐漸進(jìn)入了C++領(lǐng)域。在1985年,C++第一次投入商業(yè)市場(chǎng)。在1987至1989年間,支持范型程序設(shè)計(jì)的語(yǔ)言設(shè)施也被加進(jìn)了C++。[2]隨著若干獨(dú)立開發(fā)的C++實(shí)現(xiàn)產(chǎn)品的出現(xiàn)和廣泛應(yīng)用,正式的C++標(biāo)準(zhǔn)化工作在1990年啟動(dòng)。標(biāo)準(zhǔn)化工作由ANSI(AmericanNationalStandardInstitute)以及后來加入的ISO(InternationalStandardsOrganization)負(fù)責(zé)。1998年正式發(fā)布了C++語(yǔ)言的國(guó)際標(biāo)準(zhǔn)[C++,1998]。而VC是基于C,C++語(yǔ)言,主要由是MFC組成,是與系統(tǒng)聯(lián)系非常緊密的編程工具,它兼有高級(jí),和低級(jí)語(yǔ)言的雙重性,功能強(qiáng)大,靈活,執(zhí)行效率高,幾乎可說VC在Windows平臺(tái)無所不能。[3]AVI可以算是Windows操作系統(tǒng)上最基本的也是最常用的一種媒體文件格式,兼容性比較好。OpenCV是Intel公司支持的開源計(jì)算機(jī)視覺庫(kù)。它輕量級(jí)而且高效——由一系列C函數(shù)和少量C++類構(gòu)成,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺方面的很多通用算法。計(jì)算機(jī)視覺市場(chǎng)巨大而且持續(xù)增長(zhǎng),且這方面沒有標(biāo)準(zhǔn)API,目前的計(jì)算機(jī)視覺軟件大概有以下三種:

1.研究代碼(慢,不穩(wěn)定,獨(dú)立并與其他庫(kù)布兼容)

2.耗費(fèi)很高的商業(yè)化工具(比如Halcon,MATLAB+Simulink)

3.依賴硬件的一些特別的解決方案(比如視頻監(jiān)控,制造控制系統(tǒng),醫(yī)療設(shè)備)

這是目前的現(xiàn)狀。而標(biāo)準(zhǔn)的API將簡(jiǎn)化計(jì)算機(jī)視覺程序和解決方案的開發(fā)。OpenCV致力于成為這樣的標(biāo)準(zhǔn)API。本文在此基礎(chǔ)上設(shè)計(jì)一個(gè)基于OpenCV的視頻播放器,可以更簡(jiǎn)捷的實(shí)現(xiàn)avi格式視頻文件的播放,暫停,停止等操作。1.2OPENCV簡(jiǎn)介1.2.1OpenCVOpenCV是Intel資助的開源計(jì)算機(jī)視覺庫(kù)。它由一系列C函數(shù)和少量C++類構(gòu)成,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺方面的很多通用算法。OpenCV擁有包括300多個(gè)C/C++函數(shù)的跨平臺(tái)的中、高層API。它不依賴與其它的外部庫(kù),盡管也可以使用某些外部庫(kù)。OpenCV對(duì)非商業(yè)應(yīng)用和商業(yè)應(yīng)用都是免費(fèi)的。另外OpenCV也為Intel公司的IntegratedPerformancePrimitives(IPP)提供了透明接口。這意味著如果有為特定處理器(INTEL的處理器)優(yōu)化的的IPP庫(kù),OpenCV將在運(yùn)行時(shí)自動(dòng)加載這些庫(kù)。OpenCV的一個(gè)目標(biāo)是構(gòu)建一個(gè)簡(jiǎn)單易用的計(jì)算機(jī)視覺框架,以幫助開發(fā)人員更便捷地設(shè)計(jì)更復(fù)雜的計(jì)算機(jī)視覺相關(guān)應(yīng)用程序。OpenCV包含的函數(shù)有500多個(gè),覆蓋了計(jì)算機(jī)視覺的許多應(yīng)用領(lǐng)域,如工廠產(chǎn)品檢測(cè)、醫(yī)學(xué)成像、信息安全、用戶界面、攝像機(jī)標(biāo)定、立體視覺和機(jī)器人等。因?yàn)橛?jì)算機(jī)視覺和機(jī)器學(xué)習(xí)密切相關(guān),所以O(shè)penCV還提供了MLL(MachineLearningLibrary)機(jī)器學(xué)習(xí)庫(kù)。該機(jī)器學(xué)習(xí)庫(kù)側(cè)重于統(tǒng)計(jì)方面的模式識(shí)別和聚類(clustering)。MLL除了用在視覺相關(guān)的任務(wù)中,還可以方便地應(yīng)用于其他的機(jī)器學(xué)習(xí)場(chǎng)合。開發(fā)OpenCV的目的是為了促進(jìn)CPU密集型應(yīng)用。為了達(dá)到這一目的,Intel啟動(dòng)了多個(gè)項(xiàng)目,包括實(shí)時(shí)光線追蹤和三維顯示墻。一個(gè)在Intel工作的OpenCV作者在訪問一些大學(xué)時(shí),注意到許多頂尖大學(xué)中的研究組(如MIT媒體實(shí)驗(yàn)室)擁有很好的內(nèi)部使用的開放計(jì)算機(jī)視覺庫(kù)——

(在學(xué)生們之間互相傳播的代碼),這會(huì)幫助一個(gè)新生從高的起點(diǎn)開始他/她的計(jì)算機(jī)視覺研究。這樣一個(gè)新生可以在以前的基礎(chǔ)上繼續(xù)開始研究,而不用從底層寫基本函數(shù)。因此,OpenCV的目的是開發(fā)一個(gè)普遍可用的計(jì)算機(jī)視覺庫(kù)。在Intel的性能庫(kù)團(tuán)隊(duì)的幫助下,OpenCV實(shí)現(xiàn)了一些核心代碼以及算法,并發(fā)給Intel俄羅斯的庫(kù)團(tuán)隊(duì)。這就是OpenCV的誕生之地:在與軟件性能庫(kù)團(tuán)隊(duì)的合作下,它開始于Intel的研究中心,并在俄羅斯得到實(shí)現(xiàn)和優(yōu)化。1.2.2OpenCV的應(yīng)用領(lǐng)域大多數(shù)計(jì)算機(jī)科學(xué)家和程序員已經(jīng)意識(shí)到計(jì)算機(jī)視覺的重要作用。但是很少有人知道計(jì)算機(jī)視覺的所有應(yīng)用。例如,大多數(shù)人或多或少地知道計(jì)算機(jī)視覺可用在監(jiān)控方面,也知道視覺被越來越多地用在網(wǎng)絡(luò)圖像和視頻方面。少數(shù)人也了解計(jì)算機(jī)視覺在游戲界面方面的應(yīng)用。但是很少有人了解大多數(shù)航空和街道地圖圖像(如Google的StreetView)也大量使用計(jì)算機(jī)定標(biāo)和圖像拼接技術(shù)。一些人知道安全監(jiān)控、無人飛行器或生物醫(yī)學(xué)分析等方面的應(yīng)用,但是很少人知道機(jī)器視覺是多么廣泛地被用在工廠中:差不多所有的大規(guī)模制造的產(chǎn)品都在流水線上的某個(gè)環(huán)節(jié)上自動(dòng)使用視覺檢測(cè)。OpenCV所有的開放源代碼協(xié)議允許用戶使用OpenCV的全部代碼或者OpenCV的部分代碼生成商業(yè)產(chǎn)品。使用了OpenCV后,用戶不必對(duì)公眾開放自己的源代碼或改善后的算法,雖然Intel公司非常希望用戶能夠開放源代碼。許多公司(IBM,Microsoft,,SONY,Siemens和Google等其他公司)和研究單位(例如斯坦福大學(xué)、MIT、CMU、劍橋大學(xué)和INRIA)中的人都廣泛使用OpenCV,其部分原因是OpenCV采用了這個(gè)寬松的協(xié)議。Yahoogroups里有一個(gè)OpenCV論壇(/group/OpenCV),用戶可以在此發(fā)帖提問和討論;該論壇大約有20

000個(gè)會(huì)員。OpenCV在全世界廣受歡迎,在中國(guó)、日本、俄羅斯、歐洲和以色列都有龐大的用戶群。自從OpenCV在1999年1月發(fā)布alpha版本開始,它就被廣泛用在許多應(yīng)用領(lǐng)域、產(chǎn)品和研究成果中。相關(guān)應(yīng)用包括衛(wèi)星地圖和電子地圖的拼接,掃描圖像的對(duì)齊,醫(yī)學(xué)圖像去噪(消噪或?yàn)V波),圖像中的物體分析,安全和入侵檢測(cè)系統(tǒng),自動(dòng)監(jiān)視和安全系統(tǒng),制造業(yè)中的產(chǎn)品質(zhì)量檢測(cè)系統(tǒng),攝像機(jī)標(biāo)定,軍事應(yīng)用,無人飛行器,無人汽車和無人水下機(jī)器人。將視覺識(shí)別技術(shù)用在聲譜圖上,OpenCV可以進(jìn)行聲音和音樂識(shí)別。在斯坦福大學(xué)的Stanley機(jī)器人項(xiàng)目中,OpenCV是其視覺系統(tǒng)的關(guān)鍵部分。Stanley在DARPA機(jī)器人沙漠挑戰(zhàn)賽中,贏得了二百萬(wàn)美元獎(jiǎng)金[Thrun06]。[4]1.2.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺是將來自靜止圖像或視頻的數(shù)據(jù)轉(zhuǎn)換成一個(gè)決策或者一種新的表達(dá)方式的過程,所有的這些轉(zhuǎn)換都是為了達(dá)到某個(gè)目標(biāo)。輸入數(shù)據(jù)可以包含一些輔助信息,如“攝像機(jī)架在汽車上”或“激光掃描儀在1米處發(fā)現(xiàn)一個(gè)物體”。最終的決策可能是“場(chǎng)景中有一個(gè)人”或“在這個(gè)切片中有14個(gè)腫瘤細(xì)胞”。一種新的表達(dá)方式可以是將一張彩色照片轉(zhuǎn)為灰度照片,或者從圖像序列中去除攝像機(jī)晃動(dòng)影響。因?yàn)槿祟愂且曈X動(dòng)物,所以會(huì)誤以為可以很容易地實(shí)現(xiàn)計(jì)算機(jī)視覺。當(dāng)人們凝視圖像時(shí),就會(huì)很容易從中找到一輛汽車。人們憑直覺會(huì)覺得很容易。人腦將視覺信號(hào)劃分入很多個(gè)通道,將各種不同的信息輸入了大腦。大腦有一個(gè)關(guān)注系統(tǒng),會(huì)根據(jù)任務(wù)識(shí)別出圖像的重要部分,并做重點(diǎn)分析,而其他部分則分析得較少。在人類視覺流中存在大量的反饋,但是目前我們對(duì)之了解甚少。肌肉控制的傳感器以及其他所有傳感器的輸入信息之間存在廣泛的關(guān)聯(lián),這使得大腦可以依賴從出生以來所學(xué)到的信息。大腦中的反饋在信息處理的各個(gè)階段都存在,在傳感器硬件(眼睛)中也存在。在眼睛中通過反饋來調(diào)節(jié)通過瞳孔的進(jìn)光量,以及調(diào)節(jié)視網(wǎng)膜表面上的接收單元。在計(jì)算機(jī)視覺系統(tǒng)中,計(jì)算機(jī)接接收到的是來自攝像機(jī)或者磁盤文件的一個(gè)數(shù)值矩陣。一般來說,沒有內(nèi)置的模式識(shí)別系統(tǒng),沒有自動(dòng)控制的對(duì)焦和光圈,沒有多年來經(jīng)驗(yàn)的積累。視覺系統(tǒng)通常很低級(jí)。實(shí)際上,計(jì)算機(jī)視覺問題比前面我們提到的更糟糕,它是不可解的。給出三維世界的二維視圖,是沒有固定方法來重建出三維信息的。在理論上,此類病態(tài)問題沒有惟一和確定的解。即使數(shù)據(jù)很完美,同一張二維圖像也可以表示多種三維場(chǎng)景。然而,如前面提到的,數(shù)據(jù)會(huì)被噪聲和形變影響。這些影響來自真實(shí)世界的變化(天氣、光線、反射、運(yùn)動(dòng)),鏡頭和機(jī)械結(jié)構(gòu)的不完美,傳感器上的長(zhǎng)時(shí)間感應(yīng)(運(yùn)動(dòng)模糊),傳感器上和其他電子器件上的電子噪聲,以及圖像采集后的圖像壓縮引入的變化。都是很令人頭疼的問題。設(shè)計(jì)實(shí)際系統(tǒng)時(shí),為了克服視覺傳感器的限制,通常會(huì)使用一些其他的上下文知識(shí)。考慮這樣一個(gè)例子,移動(dòng)機(jī)器人在室內(nèi)尋找并撿起訂書機(jī)。機(jī)器人可以利用這個(gè)先驗(yàn)知識(shí):可在辦公室內(nèi)發(fā)現(xiàn)桌子,訂書機(jī)最可能在桌子上被找到。這給出了一個(gè)隱含的尺寸參考或參照,也就是訂書機(jī)能夠放在桌子上。這也可以用于消除在不可能的地方(例如在天花板或者窗戶上)錯(cuò)誤識(shí)別出訂書機(jī)的可能性。機(jī)器人也完全可以忽略一個(gè)200英尺大小的跟訂書機(jī)形狀類似的廣告飛艇,因?yàn)轱w艇周圍沒有桌子的木紋背景。與之相反,在圖像檢索中,數(shù)據(jù)庫(kù)中的所有訂書機(jī)圖像都是對(duì)真正的訂書機(jī)拍攝的,而且尺寸很大和形狀不規(guī)劃的訂書機(jī)圖像一般不可能被拍到。也就是拍攝者一般只拍攝真正的、普通大小的訂書機(jī)圖像。而且人們拍照時(shí)一般會(huì)將被拍物體置于中心,且將物體放在最能表現(xiàn)其特征的方向上。因此在由人拍攝的圖像中,具有相當(dāng)多的隱含信息。[5]人們也可以使用機(jī)器學(xué)習(xí)技術(shù)對(duì)上下文信息進(jìn)行顯式建模。隱含的變量(例如物體大小、重力方向及其他變量)都可以通過標(biāo)記好的訓(xùn)練數(shù)據(jù)里的數(shù)值來校正?;蛘?,也可以通過其他的傳感器來測(cè)量隱含的變量。使用激光掃描儀可以精確測(cè)量出一個(gè)物體的大小。計(jì)算機(jī)視覺面臨的另一個(gè)難題是噪聲問題。我們一般使用統(tǒng)計(jì)的方法來克服噪聲。例如,一般來說不可能通過比較一個(gè)點(diǎn)和它緊密相鄰的點(diǎn)來檢測(cè)圖像里的邊緣。但是如果觀察一個(gè)局部區(qū)域的統(tǒng)計(jì)特征,邊緣檢測(cè)會(huì)變得容易些。由局部區(qū)域卷積的響應(yīng)連成的點(diǎn)串,構(gòu)成邊緣。另外可以通過時(shí)間維度上的統(tǒng)計(jì)來抑制噪聲。還有一些其他的技術(shù),可以從數(shù)據(jù)中學(xué)習(xí)顯式模型,來解決噪聲和畸變問題。例如鏡頭畸變,可以通過學(xué)習(xí)一個(gè)簡(jiǎn)單多項(xiàng)式模型的參數(shù)來描述這種畸變,然后可以幾乎完全校正這種畸變。計(jì)算機(jī)視覺擬根據(jù)攝像機(jī)數(shù)據(jù)來采取行動(dòng)或者做出決策,這樣的行動(dòng)或決策是在一個(gè)指特定目的或任務(wù)的環(huán)境中來解決。我們從圖像去除噪聲和損壞區(qū)域,可以讓監(jiān)控系統(tǒng)在有人爬過柵欄時(shí)給出報(bào)警,或者在一個(gè)游樂園里監(jiān)控系統(tǒng)能夠數(shù)出總共有多少人通過了某個(gè)區(qū)域。在辦公室巡游的機(jī)器人的視覺軟件所采用的方法與固定攝像機(jī)的不同,因?yàn)檫@兩個(gè)系統(tǒng)有不同的應(yīng)用環(huán)境和目標(biāo)。通用的規(guī)律是:對(duì)計(jì)算機(jī)視覺應(yīng)用環(huán)境的約束越多,則越能夠使用這些約束來簡(jiǎn)化問題,從而使最終的解決方案越可靠。[6]OpenCV的目標(biāo)是為解決計(jì)算機(jī)視覺問題提供基本工具。在有些情況下,它提供的高層函數(shù)可以高效地解決計(jì)算機(jī)視覺中的一些很復(fù)雜的問題。當(dāng)沒有高層函數(shù)時(shí),它提供的基本函數(shù)足夠?yàn)榇蠖鄶?shù)計(jì)算機(jī)視覺問題創(chuàng)建一個(gè)完整的解決方案。對(duì)于后者,有幾個(gè)經(jīng)過檢驗(yàn)且可靠的使用OpenCV的方法;所有這些方法都是首先大量使用OpenCV函數(shù)來解決問題。一旦設(shè)計(jì)出解決方案的第一個(gè)版本,便會(huì)了解它的不足,然后可以使用自己的代碼和知識(shí)來解決(更為廣知的一點(diǎn)是“解決實(shí)際遇到的問題,而不是我們想像出來的問題”)。解決方案所存在的不足可以通過系統(tǒng)所用的環(huán)境限制來解決。[7]1.3論文主要研究?jī)?nèi)容及研究意義OpenCV一個(gè)基于OpenCV的視頻播放器OpenCV)的應(yīng)用,使人們對(duì)其有較深的認(rèn)識(shí),深入了解OpenCV的發(fā)展歷史,主要特點(diǎn)。1.4論文組織結(jié)構(gòu)OpenCVOpenCV函數(shù)庫(kù)做了一些相關(guān)介紹包括特點(diǎn)及主要應(yīng)用等;第四章是對(duì)VC6.0的開發(fā)環(huán)境做了較詳細(xì)的介紹包括2視頻技術(shù)概述對(duì)于視頻,我們并不陌生,日常生活中經(jīng)??吹碾娪啊㈦娨暰褪且曨l的典型應(yīng)用。人類接收的信息中約有70%來自視覺,周圍景物在人眼視網(wǎng)膜上的映像是人類最有效、最重要的信息交流方式。視頻具有確切、直觀、具體生動(dòng)、真實(shí)和高效的特點(diǎn),這正是視頻技術(shù)的無窮魅力所在。簡(jiǎn)介動(dòng)態(tài)圖像傳輸在電信領(lǐng)域被稱為視頻業(yè)務(wù)或視訊業(yè)務(wù),在計(jì)算機(jī)界常常稱為多媒體通信、流媒體(下載像流水)通信等。視頻通信技術(shù)是實(shí)現(xiàn)和完成視頻業(yè)務(wù)的主要技術(shù)。其壓縮標(biāo)準(zhǔn)是MPEG(動(dòng)態(tài)圖像專家小組),它提出了一種電視圖像和聲音編碼的國(guó)際標(biāo)準(zhǔn),用在數(shù)據(jù)傳輸率為1.5Mb/s。對(duì)于視頻業(yè)務(wù)應(yīng)用而言,主要是寬帶網(wǎng)絡(luò)技術(shù)。

隨著計(jì)算機(jī)軟硬件技術(shù)的迅猛發(fā)展,視頻技術(shù)也得到了飛速發(fā)展。現(xiàn)在,數(shù)字娛樂、多媒體通信、高清晰度電視、數(shù)字電視、寬帶網(wǎng)絡(luò)等都是圍繞如何有效地交流視頻信息而展開研究的。但是,由于視頻信息十分豐富且信息量大,故對(duì)視頻信號(hào)的處理、傳輸、存儲(chǔ)和顯示等都提出了新的要求。因此,視頻技術(shù)的研究和應(yīng)用是目前信息技術(shù)領(lǐng)域最熱門的話題之一。2.1多媒體技術(shù)多媒體究竟是什么?通常,每個(gè)人對(duì)此都有自己的觀點(diǎn)。多媒體曾經(jīng)被用來描述很多東西,從復(fù)雜的新型交互式藝術(shù)到搖滾音樂會(huì)中閃爍的彩色聚光燈。但是多媒體是一種真正的媒體,不能局限于一個(gè)簡(jiǎn)單的,有框架的定義。今天,這個(gè)詞可能會(huì)更加模糊,就象“數(shù)字化”這個(gè)詞,在它的全盛時(shí)期也讓入迷惑一樣?!岸嗝襟w”一詞譯自英文“Multimedia”,媒體(medium)原有兩重含義,一是指存儲(chǔ)信息的實(shí)體,如磁盤、光盤、磁帶、半導(dǎo)體存儲(chǔ)器等,中文常譯作媒質(zhì);二是指?jìng)鬟f信息的載體,如數(shù)字、文字、聲音、圖形等,中文譯作媒介。從字面上看,多媒體就是由單媒體復(fù)合而成的。多媒體技術(shù)從不同的角度有著不同的定義。有人定義多媒體計(jì)算機(jī)是一組硬件和軟件設(shè)備;結(jié)合了各種視覺和聽覺媒體,能夠產(chǎn)生令人印象深刻的視聽效果。在視覺媒體上,包括圖形、動(dòng)畫、圖像和文字等媒體,在聽覺媒體上,則包括語(yǔ)言、立體聲響和音樂等媒體。用戶可以從多媒體計(jì)算機(jī)同時(shí)接觸到各種各樣的媒體來源。也有人定義多媒體是“文字、圖形、圖像以及邏輯分析方法等與視頻、音頻以及為了知識(shí)創(chuàng)建和表達(dá)的交互式應(yīng)用的結(jié)合體”。概括起來就是:多媒體技術(shù)是以數(shù)字技術(shù)為基礎(chǔ),把通信技術(shù)(電話和傳真),廣播技術(shù)(電臺(tái)和電視)和計(jì)算機(jī)技術(shù)融于一體,能夠?qū)ξ淖?,圖形,圖像,聲音,視頻等多種媒體信息進(jìn)行存儲(chǔ),傳送和處理的綜合性高新技術(shù)。簡(jiǎn)言之,多媒體技術(shù)就是具有集成性、實(shí)時(shí)性和交互性的計(jì)算機(jī)綜合處理聲文圖信息的技術(shù)。在人類信息科學(xué)技術(shù)史上,它是繼活字印刷,無線電-電視技術(shù),計(jì)算機(jī)技術(shù)之后的又一次新的技術(shù)革命,在信息社會(huì)中占有重要的地位。多媒體技術(shù)的發(fā)明,終于使人和機(jī)器從原來的對(duì)立中擺脫出來,人性化的局面、虛擬現(xiàn)實(shí)的出現(xiàn),直到人工智能的進(jìn)步,語(yǔ)音的輸入使我們剎時(shí)感到PC已不再冰冷,芯片上已能出現(xiàn)人的情感,而且是高智能的集成。眾所周知,早期的計(jì)算機(jī)僅處理數(shù)值或文字信息,其輸入和輸出信息只能以“文本”的形式出現(xiàn)。20世紀(jì)80年代問世的圖形用戶界面,使計(jì)算機(jī)可用圖形來參與人-機(jī)交互,從此令用戶界面面目一新。從20世紀(jì)90年代以來,多媒體技術(shù)逐步成熟,先后發(fā)布了MPC1.0,MPC2.0,MPC3.0等多媒體個(gè)人計(jì)算機(jī)技術(shù)規(guī)范,推動(dòng)了多媒體計(jì)算機(jī)的性能不斷提高。但是,多媒體技術(shù)的應(yīng)用并不限于多媒體計(jì)算機(jī)。在現(xiàn)代生活中,從VCD光盤的播放到電子出版物的制作,從多媒體萬(wàn)維網(wǎng)到電視會(huì)議的運(yùn)行,處處都包含了多媒體技術(shù)的應(yīng)用。多媒體技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),已成為當(dāng)代計(jì)算機(jī)應(yīng)用中最熱門的兩個(gè)主題。多媒體技術(shù)不僅集成了多媒體,而且集成可多種技術(shù),包括計(jì)算機(jī)技術(shù),通信技術(shù),電視技術(shù)和其他音像處理技術(shù)。通過在一個(gè)文件中把來自多個(gè)通道的信息同一獲取,組織,存儲(chǔ)和合成,使文字,圖像,聲音等各種信息能在播放時(shí)同步的作用于我們的聽覺,視覺等感官,從而取得最佳的效果。在多媒體系統(tǒng)中,聲音和活動(dòng)著的視頻圖像都是與時(shí)間軸密切相關(guān)的。隨著多媒體技術(shù)的進(jìn)步,多媒體系統(tǒng)已經(jīng)具備對(duì)多媒體信息進(jìn)行實(shí)時(shí)處理的能力。可視電話,電視會(huì)議,遠(yuǎn)程教學(xué),遠(yuǎn)程醫(yī)療,使千里之外的人物與場(chǎng)景猶如近在咫尺,可面對(duì)面地實(shí)現(xiàn)對(duì)話。交互性是多媒體技術(shù)的關(guān)鍵特性之一。傳統(tǒng)電視中也包含了多媒體的信息,但它缺乏交互性,用戶只能被動(dòng)的收看。在多媒體系統(tǒng)中,用戶借助交互活動(dòng)可控制信息的傳播,甚至參與信息的組織過程,使之能夠?qū)Ω信d趣的畫面或內(nèi)容進(jìn)行記錄或者專門的研究。[8]我們知道,多媒體技術(shù)是建立在計(jì)算機(jī)技術(shù)的基礎(chǔ)之上的,而計(jì)算機(jī)只能識(shí)別“0”,“1”這兩種二進(jìn)制數(shù)據(jù)。因此在多媒體系統(tǒng)中,所有的多媒體信息都是用數(shù)字信號(hào)表示。與傳統(tǒng)電視使用的模擬信號(hào)相比,數(shù)字信號(hào)不僅易于進(jìn)行加密,壓縮等數(shù)值運(yùn)算,因而可提高信息的安全與處理速度;而且由于它只有“0”,“1”這兩種狀態(tài),所以抗干擾能力強(qiáng),在信號(hào)存儲(chǔ)和復(fù)制中能夠達(dá)到更高的保真度,尤其是用于遠(yuǎn)程距離的無失真?zhèn)鬏敗6嗝襟w技術(shù)的無限發(fā)展需要計(jì)算機(jī)硬件的支持,早期的PC只能處理文本和數(shù)字,借助鍵盤和顯示器用文本媒體進(jìn)行人-機(jī)交互。多媒體個(gè)人計(jì)算機(jī)(MPC)的誕生,使計(jì)算機(jī)能夠集聲音,文,圖,像的處理于一身,同時(shí)把人-機(jī)交互擴(kuò)充到聲音和圖像等媒體。所謂多媒體個(gè)人電腦(MultimediaPersonalComputer,MPC)就是具有了多媒體處理功能的個(gè)人計(jì)算機(jī),它的硬件結(jié)構(gòu)與一般所用的個(gè)人機(jī)并無太大的差別,只不過是多了一些軟硬件配置而已。一般用戶如果要擁有MPC大概有兩種途徑:一是直接夠買具有多媒體功能的PC機(jī);二是在基本的PC機(jī)上增加多媒體套件而構(gòu)成MPC。其實(shí),現(xiàn)在最近用戶所購(gòu)買的個(gè)人電腦絕大多都具有了多媒體應(yīng)用功能。[9]一般的多媒體系統(tǒng)主要由四個(gè)部分的內(nèi)容組成:多媒體硬件系統(tǒng)、多媒體操作系統(tǒng)、媒體處理系統(tǒng)工具和用戶應(yīng)用軟件。(1)多媒體硬件系統(tǒng):包括計(jì)算機(jī)硬件、聲音/視頻處理器、多種媒體輸入/輸出設(shè)備及信號(hào)轉(zhuǎn)換裝置、通信傳輸設(shè)備及接口裝置等。其中,最重要的是根據(jù)多媒體技術(shù)標(biāo)準(zhǔn)而研制生成的多媒體信息處理芯片、光盤驅(qū)動(dòng)器等(2)多媒體操作系統(tǒng):也稱為多媒體核心系統(tǒng)(Multimediakernelsystem),具有實(shí)時(shí)任務(wù)調(diào)度、多媒體數(shù)據(jù)轉(zhuǎn)換和同步控制對(duì)多媒體設(shè)備的驅(qū)動(dòng)和控制,以及圖形用戶界面管理等。(3)媒體處理系統(tǒng)工具:或稱為多媒體系統(tǒng)開發(fā)工具軟件,是多媒體系統(tǒng)重要組成部分。(4)用戶應(yīng)用軟件:根據(jù)多媒體系統(tǒng)終端用戶要求而定制的應(yīng)用軟件或面向某一領(lǐng)域的用戶應(yīng)用軟件系統(tǒng),它是面向大規(guī)模用戶的系統(tǒng)產(chǎn)品。一般來說,多媒體個(gè)人計(jì)算機(jī)(MPC)的基本硬件結(jié)構(gòu)可以歸納為七部分:①至少一個(gè)功能強(qiáng)大、速度快的中央處理器(CPU);②可管理、控制各種接口與設(shè)備的配置;③具有一定容量(盡可能大)的存儲(chǔ)空間;④高分辨率顯示接口與設(shè)備;⑤可處理音響的接口與設(shè)備;⑥可處理圖像的接口設(shè)備;⑦可存放大量數(shù)據(jù)的配置等;這樣提供的配置是最基本MPC的硬件基礎(chǔ),它們構(gòu)成MPC的主機(jī)。除此以外,MPC能擴(kuò)充的配置還可能包括如下幾個(gè)方面:光盤驅(qū)動(dòng)器:包括可重寫光盤驅(qū)動(dòng)器(CD-R)、WORM光盤驅(qū)動(dòng)器和CD-ROM驅(qū)動(dòng)器。其中CD-ROM驅(qū)動(dòng)器為MPC帶來了價(jià)格便宜的650M存儲(chǔ)設(shè)備,存有圖形、動(dòng)畫、圖像、聲音、文本、數(shù)字音頻、程序等資源的CD-ROM早已廣泛使用,因此現(xiàn)在光驅(qū)對(duì)廣大用戶來說已經(jīng)是必須配置的了。音頻卡:又稱聲卡,聲卡用處理音頻信息。它可以把話筒、唱機(jī)(包括激光唱機(jī))、錄音機(jī)、電子樂器等輸入的聲音信息進(jìn)行模數(shù)轉(zhuǎn)換、壓縮處理,也可以把經(jīng)過計(jì)算機(jī)處理的數(shù)字化的聲音信號(hào)通過還原(解壓縮)、數(shù)模轉(zhuǎn)換后用揚(yáng)聲器放出或記錄下來。聲卡和多媒體計(jì)算機(jī)中所處理的數(shù)字化聲音信息通常有多種不同的采樣頻率和量化精度可以選擇,以適應(yīng)不同應(yīng)用場(chǎng)合的質(zhì)量要求。采樣頻率越高,量化位數(shù)越多,質(zhì)量越高。圖形加速卡:圖文并茂的多媒體表現(xiàn)需要分辨率高,而且同屏顯示色彩豐富的顯示卡的支持,同時(shí)還要求具有Windows的顯示驅(qū)動(dòng)程序,并在Windows下的像素運(yùn)算速度要快。所以現(xiàn)在帶有圖形用戶接口GUI加速器的局部總線顯示適配器使得Windows的顯示速度大大加快。視頻卡:可細(xì)分為視頻捕捉卡、視頻處理卡、視頻播放卡以及TV編碼器等專用卡,其功能是連接攝像機(jī)、VCR影碟機(jī)、TV等設(shè)備,以便獲取、處理和表現(xiàn)各種動(dòng)畫和數(shù)字化視頻媒體。掃描卡:它是用來連接各種圖形掃描儀的,是常用的靜態(tài)照片、文字、工程圖輸入設(shè)備。打印機(jī)接口:用來連接各種打印機(jī),包括普通打印機(jī)、激光打印機(jī)、彩色打印機(jī)等,打印機(jī)現(xiàn)在已經(jīng)是最常用的多媒體輸出設(shè)備之一了。交互控制接口:它是用來連接觸摸屏、鼠標(biāo)、光筆等人機(jī)交互設(shè)備的,這些設(shè)備將大大方便用戶對(duì)MPC的使用。網(wǎng)絡(luò)接口:是實(shí)現(xiàn)多媒體通信的重要MPC擴(kuò)充部件。計(jì)算機(jī)和通信技術(shù)相結(jié)合的時(shí)代已經(jīng)來臨,這就需要專門的多媒體外部設(shè)備將數(shù)據(jù)量龐大的多媒體信息傳送出去或接收進(jìn)來,通過網(wǎng)絡(luò)接口相接的設(shè)備包括視頻電話機(jī)、傳真機(jī)、LAN和ISDN等。多媒體計(jì)算機(jī)的具體應(yīng)用除了要具有一定的硬件設(shè)備外,更重要的是軟件系統(tǒng)的開發(fā)和應(yīng)用。自從多媒體計(jì)算機(jī)問世以來,許多國(guó)家和部門都在軟件的的開發(fā)和應(yīng)用上下了很大功夫。Microsoft、IBM、和Apple等公司相繼推出了在基本功能上旗鼓相當(dāng)?shù)亩嗝襟w軟件平臺(tái),而其特點(diǎn)又都是在已有的操作系統(tǒng)上追加實(shí)現(xiàn)多媒體功能的擴(kuò)充模塊而形成的,這就為用戶提供了較為方便和實(shí)用的使用環(huán)境。在多媒體語(yǔ)言中,對(duì)存放在CD--ROM上的多媒體應(yīng)用軟件產(chǎn)品,稱作多媒體CD-ROM節(jié)目(MultimediaCD-ROMTitle)。在多媒體節(jié)目中包含了文本、圖形、聲音、動(dòng)畫和影視等視聽媒體。這些多媒體節(jié)目大致上可分為下列幾個(gè)方面的應(yīng)用:教育、商業(yè)、電子出版、娛樂、游戲以及通信工程中的多媒體終端和多媒體通信系統(tǒng)。多媒體技術(shù)主要應(yīng)用于多媒體個(gè)人計(jì)算機(jī)、多媒體信息管理系統(tǒng)、多媒體通信、多媒體電子出版物等,近期以來,運(yùn)用多媒體手段來對(duì)學(xué)術(shù)科技期刊進(jìn)行編輯加工、行政管理和發(fā)行宣傳,也成為一種顯著的趨向。多媒體技術(shù)的應(yīng)用將引發(fā)傳統(tǒng)編輯手段的全面變革。傳統(tǒng)編輯方法與手段同多媒體技術(shù)結(jié)合后,將給未來學(xué)術(shù)科技期刊的編輯工作帶來全新的變化。多媒體技術(shù)與計(jì)算機(jī)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)、數(shù)字技術(shù)的結(jié)合,使期刊出版工作過程和學(xué)術(shù)科研信息傳播不受時(shí)間、地點(diǎn)、國(guó)界、環(huán)境等影響,這將有利于提高世界信息的流通速度,促進(jìn)遠(yuǎn)隔重洋的各民族文化科技的及時(shí)交流。多媒體綜合了報(bào)紙、廣播、電視等功能,將文字、聲音、圖像、動(dòng)畫等要素結(jié)合起來,這一結(jié)合也成為學(xué)術(shù)期刊編輯、發(fā)行的一種全新形式,給受眾以全方位的、多維的信息,光纖通道將電視網(wǎng)、電話網(wǎng)、計(jì)算機(jī)網(wǎng)三網(wǎng)合一,使三大傳統(tǒng)媒介開始走向高度的綜合。充分利用多媒體文、圖、聲、像的優(yōu)勢(shì),有利于全面提高學(xué)術(shù)期刊編輯工作效率和刊物質(zhì)量,促進(jìn)電腦多媒體編輯技術(shù)的有的放矢地發(fā)展,并為今后計(jì)算機(jī)技術(shù)的普及、繁榮打下良好基礎(chǔ)。多媒體編輯要處理大量的3D圖形、數(shù)字音頻和視頻信息,還有從Web網(wǎng)絡(luò)傳來的高帶寬信息。加速圖形端口(AGP)即將大量投入應(yīng)用,這是一種用來連接CPU和圖形加速器、比PCI更快的總線,AGP同時(shí)還提供圖形適配器與系統(tǒng)內(nèi)存之間的連接,有了這種連接,在3D應(yīng)用程序中就可以將大量的紋理貼圖保存在系統(tǒng)內(nèi)存中。近期出版的一些專業(yè)電子排版系統(tǒng),已集文字處理與圖形圖像處理功能于一身。不僅大大降低了此前許多排版軟件在文稿中植入特定圖像時(shí)的繁瑣操作和不便,而且可以利用軟件提供的多種繪圖、制圖功能,使非美工專業(yè)人員也能方便地制作出具有專業(yè)水準(zhǔn)的圖形圖像,并通過手寫板或掃描儀順利實(shí)現(xiàn)圖文混排。使數(shù)學(xué)、化學(xué)、物理等科學(xué)公式的排版簡(jiǎn)便規(guī)范,同時(shí)提供各種流程圖、電子電路以及各類圖庫(kù)。IBM公司分別推出中、英文語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音錄入軟件,它們以聲音接收裝置為媒介,將閱讀文稿的語(yǔ)音直接轉(zhuǎn)化成計(jì)算機(jī)上文本的版面,盡管目前此類軟件在配置、環(huán)境、程序設(shè)計(jì)等方面有不少尚待完善之處,但隨著新的優(yōu)化軟件的不斷問世,它必將極大地提高文字輸入的速度,從而最大限度地改變期刊計(jì)算機(jī)排版采用鍵盤輸入的格局??梢灶A(yù)見在不久的將來,我們真的可以與計(jì)算機(jī)進(jìn)行交談,正如一些科幻電影中描述的一樣,計(jì)算機(jī)可以聽懂我們?cè)捳Z(yǔ),并按我們所說的去做。計(jì)算機(jī)輔助教學(xué)系統(tǒng)在教學(xué)上的運(yùn)用,標(biāo)志著教學(xué)媒體質(zhì)的飛躍。計(jì)算機(jī)的應(yīng)用,使教學(xué)手段更加豐富,將對(duì)教學(xué)效果的提高起到促進(jìn)作用。由于計(jì)算機(jī)是人腦的延伸,是人腦思維活動(dòng)的模擬,是對(duì)人類思維活動(dòng)的結(jié)構(gòu)、功能及其規(guī)律的把握,因此,其在教學(xué)上的運(yùn)用十分有利于學(xué)生的發(fā)展,符合現(xiàn)代化教學(xué)規(guī)律的要求。多媒體技術(shù)是信息領(lǐng)域的又一次革命,在教學(xué)上,它既能向?qū)W生快速提供豐富多彩的集圖、文、聲于一體的教學(xué)信息,又能為學(xué)生提供生動(dòng)、友好、多樣化的交互方式。多媒體教學(xué)可產(chǎn)生優(yōu)良的視聽效果。因?yàn)槿说囊曈X、聽覺是接收信息的主要渠道,獲得的信息也最大。多媒體教學(xué)有利于信息傳遞和學(xué)生對(duì)信息的接受、儲(chǔ)存。其特有的優(yōu)勢(shì)對(duì)學(xué)生產(chǎn)生一定強(qiáng)度的刺激,引起學(xué)生的注意。如果沒有注意,感知就不會(huì)產(chǎn)生強(qiáng)烈觀察力。而觀察力是在感知過程中并以感知為基礎(chǔ)形成起來的,離開了感知也就沒有了觀察。利用多媒體的優(yōu)勢(shì)引人入勝,可以不斷提高學(xué)生注意的品質(zhì),使學(xué)生心理活動(dòng)處于積極狀態(tài)。多媒體能克服時(shí)間和空間的限制。教學(xué)中常有一些宏觀的自然現(xiàn)象、逝去的景色或者需長(zhǎng)時(shí)間才能感知的事物,因受時(shí)間和空間的制約,無法讓學(xué)生親眼看見;一些微觀的事物和微小的變化,無法通過儀器設(shè)備讓學(xué)生進(jìn)行觀察,這些都是課堂教學(xué)難點(diǎn)。多媒體的運(yùn)用,為學(xué)生提供了形象生動(dòng)、內(nèi)容豐富、直觀具體、感染力強(qiáng)的感性認(rèn)識(shí)材料,使學(xué)生看到了事物在運(yùn)動(dòng)、發(fā)展、變化。真情實(shí)感取代了憑空想象,難題無須多講,“百聞不如一見”。學(xué)生通過聽、視、評(píng)、悟充分感知原先較為抽象的教學(xué)內(nèi)容,適應(yīng)了學(xué)生從具體到抽象的認(rèn)識(shí)規(guī)律,從而保證了教學(xué)活動(dòng)的順利進(jìn)行。多媒體教學(xué)是提高課堂教學(xué)效果的先進(jìn)教學(xué)手段。多媒體的恰當(dāng)運(yùn)用,使課堂教學(xué)活動(dòng)更加符合學(xué)生的心理特點(diǎn)和認(rèn)識(shí)規(guī)律,促使學(xué)生始終在愉悅的氛圍中積極主動(dòng)地獲取知識(shí),學(xué)會(huì)學(xué)習(xí),提高能力。學(xué)生當(dāng)堂學(xué)習(xí)新知識(shí),當(dāng)堂消化吸收,無須課上損失課下補(bǔ),減輕了學(xué)生的學(xué)習(xí)負(fù)擔(dān),提高了課堂教學(xué)效率。事實(shí)表明,許多好課使學(xué)生久久不忘,對(duì)學(xué)生產(chǎn)生深遠(yuǎn)的影響。隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)多媒體技術(shù)的發(fā)展,可視電話、視頻會(huì)議系統(tǒng)將為人類提供更全面的信息服務(wù)。可視電話可使單身在外的游子通過電視傳真,身臨其境地參加新年的家庭聚會(huì),也可以讓分布在各地的工作人員講座設(shè)計(jì)方案,交流經(jīng)驗(yàn)。實(shí)際上,多媒體系統(tǒng)現(xiàn)代商業(yè)、通信、藝術(shù)等人類工作和生活的各個(gè)領(lǐng)域,正改變著人類的生活和工作的方式,描繪著一個(gè)絢麗多彩的劃時(shí)代的多媒體世界。2.2視頻格式及視頻流播放回放2.2.1視頻格式分類視頻大概有以下幾種:本地影像視頻;網(wǎng)絡(luò)影像視頻;手機(jī)電影視頻。其中每類視頻又有各自的格式:1、本地影像視頻AVI格式:它的英文全稱為AudioVideoInterleaved,即音頻視頻交錯(cuò)格式。它于1992年被Microsoft公司推出,隨Windows3.1一起被人們所認(rèn)識(shí)和熟知。所謂“音頻視頻交錯(cuò)”,就是可以將視頻和音頻交織在一起進(jìn)行同步播放。這種視頻格式的優(yōu)點(diǎn)是圖像質(zhì)量好,可以跨多個(gè)平臺(tái)使用,其缺點(diǎn)是體積過于龐大,而且更加糟糕的是壓縮標(biāo)準(zhǔn)不統(tǒng)一,最普遍的現(xiàn)象就是高版本W(wǎng)indows媒體播放器播放不了采用早期編碼編輯的AVI格式視頻,而低版本W(wǎng)indows媒體播放器又播放不了采用最新編碼編輯的AVI格式視頻,所以我們?cè)谶M(jìn)行一些AVI格式的視頻播放時(shí)常會(huì)出現(xiàn)由于視頻編碼問題而造成的視頻不能播放或即使能夠播放,但存在不能調(diào)節(jié)播放進(jìn)度和播放時(shí)只有聲音沒有圖像等一些莫名其妙的問題,如果用戶在進(jìn)行AVI格式的視頻播放時(shí)遇到了這些問題,可以通過下載相應(yīng)的解碼器來解決。nAVI格式:nAVI是newAVI的縮寫,是一個(gè)名為ShadowRealm的地下組織發(fā)展起來的一種新視頻格式(與我們上面所說的AVI格式?jīng)]有太大聯(lián)系)。它是由MicrosoftASF壓縮算法的修改而來的,但是又與下面介紹的網(wǎng)絡(luò)影像視頻中的ASF視頻格式有所區(qū)別,它以犧牲原有ASF視頻文件視頻“流”特性為代價(jià)而通過增加幀率來大幅提高ASF視頻文件的清晰度。DV-AVI格式:DV的英文全稱是DigitalVideoFormat,是由索尼、松下、JVC等多家廠商聯(lián)合提出的一種家用數(shù)字視頻格式。目前非常流行的數(shù)碼攝像機(jī)就是使用這種格式記錄視頻數(shù)據(jù)的。它可以通過電腦的IEEE1394端口傳輸視頻數(shù)據(jù)到電腦,也可以將電腦中編輯好的的視頻數(shù)據(jù)回錄到數(shù)碼攝像機(jī)中。這種視頻格式的文件擴(kuò)展名一般是.avi,所以也叫DV-AVI格式。MPEG格式:它的英文全稱為MovingPictureExpertGroup,即運(yùn)動(dòng)圖像專家組格式,家里??吹腣CD、SVCD、DVD就是這種格式。MPEG文件格式是運(yùn)動(dòng)圖像壓縮算法的國(guó)際標(biāo)準(zhǔn),它采用了有損壓縮方法減少運(yùn)動(dòng)圖像中的冗余信息,說的更加明白一點(diǎn)就是MPEG的壓縮方法依據(jù)是相鄰兩幅畫面絕大多數(shù)是相同的,把后續(xù)圖像中和前面圖像有冗余的部分去除,從而達(dá)到壓縮的目的(其最大壓縮比可達(dá)到200:1)。目前MPEG格式有三個(gè)壓縮標(biāo)準(zhǔn),分別是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7與MPEG-21仍處在研發(fā)階段。MPEG-1:制定于1992年,它是針對(duì)1.5Mbps以下數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音編碼而設(shè)計(jì)的國(guó)際標(biāo)準(zhǔn)。也就是我們通常所見到的VCD制作格式。使用MPEG-1的壓縮算法,可以把一部120分鐘長(zhǎng)的電影壓縮到1.2GB左右大小。這種視頻格式的文件擴(kuò)展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盤中的.dat文件等。MPEG-2:制定于1994年,設(shè)計(jì)目標(biāo)為高級(jí)工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率。這種格式主要應(yīng)用在DVD/SVCD的制作(壓縮)方面,同時(shí)在一些HDTV(高清晰電視廣播)和一些高要求視頻編輯、處理上面也有相當(dāng)?shù)膽?yīng)用。使用MPEG-2的壓縮算法,可以把一部120分鐘長(zhǎng)的電影壓縮到4到8GB的大小。這種視頻格式的文件擴(kuò)展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盤上的.vob文件等。MPEG-4:制定于1998年,MPEG-4是為了播放流式媒體的高質(zhì)量視頻而專門設(shè)計(jì)的,它可利用很窄的帶度,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求使用最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。目前MPEG-4最有吸引力的地方在于它能夠保存接近于DVD畫質(zhì)的小體積視頻文件。另外,這種文件格式還包含了以前MPEG壓縮標(biāo)準(zhǔn)所不具備的比特率的可伸縮性、動(dòng)畫精靈、交互性甚至版權(quán)保護(hù)等一些特殊功能。這種視頻格式的文件擴(kuò)展名包括.asf、.mov和DivXAVI等。DivX格式:這是由MPEG-4衍生出的另一種視頻編碼(壓縮)標(biāo)準(zhǔn),也即我們通常所說的DVDrip格式,它采用了MPEG4的壓縮算法同時(shí)又綜合了MPEG-4與MP3各方面的技術(shù),說白了就是使用DivX壓縮技術(shù)對(duì)DVD盤片的視頻圖像進(jìn)行高質(zhì)量壓縮,同時(shí)用MP3或AC3對(duì)音頻進(jìn)行壓縮,然后再將視頻與音頻合成并加上相應(yīng)的外掛字幕文件而形成的視頻格式。其畫質(zhì)直逼DVD并且體積只有DVD的數(shù)分之一。這種編碼對(duì)機(jī)器的要求也不高,所以DivX視頻編碼技術(shù)可以說是一種對(duì)DVD造成威脅最大的新生視頻壓縮格式,號(hào)稱DVD殺手或DVD終結(jié)者。MOV格式:美國(guó)Apple公司開發(fā)的一種視頻格式,默認(rèn)的播放器是蘋果的QuickTimePlayer。具有較高的壓縮比率和較完美的視頻清晰度等特點(diǎn),但是其最大的特點(diǎn)還是跨平臺(tái)性,即不僅能支持MacOS,同樣也能支持Windows系列。2、網(wǎng)絡(luò)影像視頻ASF格式:它的英文全稱為AdvancedStreamingformat,它是微軟為了和現(xiàn)在的RealPlayer競(jìng)爭(zhēng)而推出的一種視頻格式,用戶可以直接使用Windows自帶的WindowsMediaPlayer對(duì)其進(jìn)行播放。由于它使用了MPEG-4的壓縮算法,所以壓縮率和圖像的質(zhì)量都很不錯(cuò)(高壓縮率有利于視頻流的傳輸,但圖像質(zhì)量肯定會(huì)的損失,所以有時(shí)候ASF格式的畫面質(zhì)量不如VCD是正常的)。WMV格式:它的英文全稱為WindowsMediaVideo,也是微軟推出的一種采用獨(dú)立編碼方式并且可以直接在網(wǎng)上實(shí)時(shí)觀看視頻節(jié)目的文件壓縮格式。WMV格式的主要優(yōu)點(diǎn)包括:本地或網(wǎng)絡(luò)回放、可擴(kuò)充的媒體類型、部件下載、可伸縮的媒體類型、流的優(yōu)先級(jí)化、多語(yǔ)言支持、環(huán)境獨(dú)立性、豐富的流間關(guān)系以及擴(kuò)展性等。RM格式:RealNetworks公司所制定的音頻視頻壓縮規(guī)范稱為RealMedia,用戶可以使用RealPlayer或RealOnePlayer對(duì)符合RealMedia技術(shù)規(guī)范的網(wǎng)絡(luò)音頻/視頻資源進(jìn)行實(shí)況轉(zhuǎn)播并且RealMedia可以根據(jù)不同的網(wǎng)絡(luò)傳輸速率制定出不同的壓縮比率,從而實(shí)現(xiàn)在低速率的網(wǎng)絡(luò)上進(jìn)行影像數(shù)據(jù)實(shí)時(shí)傳送和播放。這種格式的另一個(gè)特點(diǎn)是用戶使用RealPlayer或RealOnePlayer播放器可以在不下載音頻/視頻內(nèi)容的條件下實(shí)現(xiàn)在線播放。另外,RM作為目前主流網(wǎng)絡(luò)視頻格式,它還可以通過其RealServer服務(wù)器將其它格式的視頻轉(zhuǎn)換成RM視頻并由RealServer服務(wù)器負(fù)責(zé)對(duì)外發(fā)布和播放。RM和ASF格式可以說各有千秋,通常RM視頻更柔和一些,而ASF視頻則相對(duì)清晰一些。RMVB格式:這是一種由RM視頻格式升級(jí)延伸出的新視頻格式,它的先進(jìn)之處在于RMVB視頻格式打破了原先RM格式那種平均壓縮采樣的方式,在保證平均壓縮比的基礎(chǔ)上合理利用比特率資源,就是說靜止和動(dòng)作場(chǎng)面少的畫面場(chǎng)景采用較低的編碼速率,這樣可以留出更多的帶寬空間,而這些帶寬會(huì)在出現(xiàn)快速運(yùn)動(dòng)的畫面場(chǎng)景時(shí)被利用。這樣在保證了靜止畫面質(zhì)量的前提下,大幅地提高了運(yùn)動(dòng)圖像的畫面質(zhì)量,從而圖像質(zhì)量和文件大小之間就達(dá)到了微妙的平衡。另外,相對(duì)于DVDrip格式,RMVB視頻也是有著較明顯的優(yōu)勢(shì),一部大小為700MB左右的DVD影片,如果將其轉(zhuǎn)錄成同樣視聽品質(zhì)的RMVB格式,其個(gè)頭最多也就400MB左右。不僅如此,這種視頻格式還具有內(nèi)置字幕和無需外掛插件支持等獨(dú)特優(yōu)點(diǎn)。要想播放這種視頻格式,可以使用RealOnePlayer2.0或RealPlayer8.0加RealVideo9.0以上版本的解碼器形式進(jìn)行播放。QuickTime(MOV)是Apple(蘋果)公司創(chuàng)立的一種視頻格式,在很長(zhǎng)的一段時(shí)間里,它都是只在蘋果公司的MAC機(jī)上存在。后來才發(fā)展到支持WINDOWS平臺(tái)的,但平心而論,它無論是在本地播放還是作為視頻流格式在網(wǎng)上傳播,都是一種優(yōu)良的視頻編碼格式。到目前為止,它共有4個(gè)版本,其中以4.0版本的壓縮率最好。3、手機(jī)電影視頻AVI,RMVB,WMV適合有存儲(chǔ)卡,帶操作系統(tǒng)的智能手機(jī)。優(yōu)點(diǎn):視頻質(zhì)量好;缺點(diǎn):文件較大。MP4適合所有手機(jī),特別是帶存儲(chǔ)卡的手機(jī),優(yōu)點(diǎn):圖像清晰,文件大小適中。3GP適合所有手機(jī),特別是內(nèi)存小的手機(jī)。優(yōu)點(diǎn):文件小。很多人都對(duì)3GPP有一個(gè)誤區(qū)就是質(zhì)量差,其實(shí)不然。一個(gè)視頻質(zhì)量的好壞和很多因素有關(guān),比如源文件的質(zhì)量,轉(zhuǎn)換時(shí)設(shè)置的參數(shù)。之所以很多3GP的視頻音質(zhì)不好,主要是因?yàn)橐纛l設(shè)置是“語(yǔ)音”而不是“立體聲AAC”的原因。特別是諾基亞的視頻轉(zhuǎn)換器根本就沒有AAC。所以很多人聽到3GP覺得很差。3GP是通訊業(yè)標(biāo)準(zhǔn)協(xié)議的格式。最大的優(yōu)點(diǎn)就是視頻文件可以壓縮的很小。但同時(shí)就會(huì)損失它的視頻質(zhì)量,但也不是所有的3GP視頻都很差的。一個(gè)視頻質(zhì)量的好壞跟視頻文件的大小是成正比的。我舉例說明:一個(gè)4分鐘左右的MTV,轉(zhuǎn)換成音頻設(shè)置為“語(yǔ)音”的3GP視頻,文件大約為3M左右,甚至可以更?。ㄈ绻曨l再設(shè)置的低些)。但如果視頻設(shè)置為MPEG_4,音頻為AAC_96k的話,文件大小約為7M,甚至更大。這也就說明視頻和音頻設(shè)置參數(shù)越高,視頻質(zhì)量越好,文件也就越大。至于選擇哪種格式的視頻傳到我們的愛機(jī)上,還要根據(jù)自己手機(jī)的能力和需求而定啦!其實(shí)AVI的格式設(shè)置的對(duì)的話,文件也不太大,大小和3GP的差不多!如果手機(jī)支持AVI格式,我推薦使用AVI格式的影音,手機(jī)端也可以用AVI格式的,不一定都得有擴(kuò)展卡。優(yōu)點(diǎn):不光是圖象清晰,而且支持全屏播放,快進(jìn)后退,亮度調(diào)節(jié)等。還有一些大家常用的格式也可以說是視頻文件,象FLASH這類動(dòng)畫,經(jīng)常見到的格式是SWF,我們也可以用專業(yè)軟件進(jìn)行轉(zhuǎn)換以后壓縮成自己想要的格式。視頻流播放與回放視頻流(VideoStreaming)是指視頻數(shù)據(jù)的傳輸,例如,它能夠被作為一個(gè)穩(wěn)定的和連續(xù)的流通過網(wǎng)絡(luò)處理。因?yàn)榱鲃?dòng),客戶機(jī)瀏覽器或插件能夠在整個(gè)文件被傳輸完成前顯示多媒體數(shù)據(jù)。視頻流技術(shù)基于2密鑰技術(shù),視頻譯碼技術(shù)和可升級(jí)的視頻分發(fā)技術(shù)發(fā)展。流媒體系統(tǒng)的組成流媒體系統(tǒng)包括以下5個(gè)方面的內(nèi)容:1.編碼工具:用于創(chuàng)建、捕捉和編輯多媒體數(shù)據(jù),形成流媒體格式2.流媒體數(shù)據(jù)3.服務(wù)器:存放和控制流媒體的數(shù)據(jù)4.網(wǎng)絡(luò):適合多媒體傳輸協(xié)議甚至是實(shí)時(shí)傳輸協(xié)議的網(wǎng)絡(luò)5.播放器:供客戶端瀏覽流媒體文件這5個(gè)部分有些是網(wǎng)站需要的,有些是客戶端需要的,而且不同的流媒體標(biāo)準(zhǔn)和不同公司的解決方案會(huì)在某些方面有所不同。3OPENCV庫(kù)使用OpenCV全程opensourcecomputervisionlibrary.是Intel開發(fā)的一個(gè)計(jì)算機(jī)視覺庫(kù),包含了多種計(jì)算機(jī)圖形圖像處理的庫(kù),目前版本為V1.0,可以在商業(yè)和研究領(lǐng)域免費(fèi)實(shí)用。主要用于處理圖像處理計(jì)算機(jī)視覺模式識(shí)別物體識(shí)別(人臉識(shí)別,Object識(shí)別)運(yùn)動(dòng)跟蹤等等方面,源庫(kù)由C和一少部分C++寫成。包含了很多算法的實(shí)現(xiàn),而且而且,她有python版本的移植,想象一下,一個(gè)高效率的圖形處理庫(kù)(跟pil不是一個(gè)方向,沒有可比性)與一個(gè)高效率的開發(fā)語(yǔ)言python結(jié)合。目前,計(jì)算機(jī)視覺市場(chǎng)巨大而且持續(xù)增長(zhǎng),且這方面沒有標(biāo)準(zhǔn)API,面臨著研究代碼(慢,不穩(wěn)定,獨(dú)立并與其他庫(kù)不兼容)、耗費(fèi)很高的商業(yè)化工具(比如Halcon,MATLAB+Simulink)、依賴硬件的一些特別的解決方案(比如視頻監(jiān)控,制造控制系統(tǒng),醫(yī)療設(shè)備)的現(xiàn)狀綜上所述,標(biāo)準(zhǔn)的API將簡(jiǎn)化計(jì)算機(jī)視覺程序和解決方案的開發(fā)。OpenCV即是為此目的開發(fā)的API庫(kù)。3.1在VC下安裝OpenCV4VC開發(fā)環(huán)境VisualC++6.0是運(yùn)行在Windows平臺(tái)上的交互式的可視化集成開發(fā)環(huán)境。一方面,VisualC++(簡(jiǎn)稱VC)與Windows平臺(tái)的結(jié)合十分完美,利用它開發(fā)的程序具有強(qiáng)大的功能;另一方面,它與Windows同步更新的優(yōu)勢(shì)對(duì)程序員也具有極強(qiáng)的吸引力。C語(yǔ)言是結(jié)構(gòu)化和模塊化的語(yǔ)言,它是面向過程的。在處理較小規(guī)模的程序時(shí),程序員用C語(yǔ)言較得心應(yīng)手。但是當(dāng)問題比較復(fù)雜、程序的規(guī)模比較大時(shí),結(jié)構(gòu)化程序設(shè)計(jì)方法就顯出它的不足。C程序的設(shè)計(jì)者必須細(xì)致地設(shè)計(jì)程序中的每一個(gè)細(xì)節(jié),準(zhǔn)確地考慮到程序運(yùn)行是每一時(shí)刻發(fā)生的事情,例如各自變量是如何變化的,什么時(shí)候應(yīng)該進(jìn)行哪些輸入,在屏幕上應(yīng)該輸出什么等。這對(duì)程序員的要求是比較高的。如果面對(duì)的是一個(gè)復(fù)雜的問題。程序員往往感到力不從心。當(dāng)初提出結(jié)構(gòu)化程序設(shè)計(jì)方法的目的是解決軟件設(shè)計(jì)危機(jī),但是這個(gè)目標(biāo)并未完全實(shí)現(xiàn)。為了解決軟件設(shè)計(jì)危機(jī),在20世紀(jì)80年代提出了面向?qū)ο蟮某绦蛟O(shè)計(jì),在這種情況下,C++應(yīng)運(yùn)而生。C++是由貝爾實(shí)驗(yàn)室的BjarneStroustrup博士及其同事在C語(yǔ)言的基礎(chǔ)上開發(fā)成功的。C++保留了C語(yǔ)言原有的所有優(yōu)點(diǎn),增加了面向?qū)ο蟮臋C(jī)制。C++與C完全兼容,用C語(yǔ)言寫的代碼可以不加修改的用于C++。從C++的名字就可以看出它是對(duì)C語(yǔ)言的擴(kuò)充,是C的超集。它既可用于結(jié)構(gòu)化程序設(shè)計(jì),又可用于面向?qū)ο蟮某绦蛟O(shè)計(jì),因此它是一個(gè)功能強(qiáng)大的混合型的程序設(shè)計(jì)語(yǔ)言。[10]VisualStudio集成開發(fā)環(huán)境(ID

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論