視頻基礎(chǔ)知識詳解_第1頁
視頻基礎(chǔ)知識詳解_第2頁
視頻基礎(chǔ)知識詳解_第3頁
視頻基礎(chǔ)知識詳解_第4頁
視頻基礎(chǔ)知識詳解_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

視頻基礎(chǔ)知識詳解視頻技術(shù)發(fā)展到現(xiàn)在已經(jīng)有100多年的歷史,雖然比照相技術(shù)歷史時間短,但在過去很長一段時間之內(nèi)都是最重要的媒體。由于互聯(lián)網(wǎng)在新世紀(jì)的崛起,使得傳統(tǒng)的媒體技術(shù)有了更好的發(fā)展平臺,應(yīng)運而生了新的多媒體技術(shù)。而多媒體技術(shù)不僅涵蓋了傳統(tǒng)媒體的表達,又增加了交互互動功能,成為了目前最主要的信息工具。在多媒體技術(shù)中,最先獲得發(fā)展的是圖片信息技術(shù),由于信息來源更加廣泛,生成速度高生產(chǎn)效率高,加上應(yīng)用門檻較低,因此一度是互聯(lián)網(wǎng)上最有吸引力的內(nèi)容。然而隨著技術(shù)的不斷進步,視頻技術(shù)的制作加工門檻逐漸降低,信息資源的不斷增長,同時由于視頻信息內(nèi)容更加豐富完整的先天優(yōu)勢,在近年來已經(jīng)逐漸成為主流。那么我們就對視頻信息技術(shù)做一個詳細的介紹。模擬時代的視頻技術(shù)最早的視頻技術(shù)來源于電影,電影技術(shù)則來源于照相技術(shù)。由于現(xiàn)代互聯(lián)網(wǎng)視頻信息技術(shù)原理則來源于電視技術(shù),所以這里只做電視技術(shù)的介紹。世界上第一臺電視誕生于1925年,是由英國人約翰貝德發(fā)明。同時也是世界上第一套電視拍攝、信號發(fā)射和接收系統(tǒng)。而電視技術(shù)的原理大概可以理解為信號采集、信號傳輸、圖像還原三個階段。攝像信號的采集,通過感光器件獲取到光線的強度(早期的電視是黑白的,所以只取亮度信號)。然后每隔30?40毫秒,將所采集到光線的強度信息發(fā)送到接收端。而對于信號的還原,也是同步的每隔30?40毫秒,將信號掃描到熒光屏上進行展示。那么對于信號的還原,由于熒光屏電視采用的是射線槍將射線打到熒光圖層,來激發(fā)熒光顯示,那么射線槍繪制整幅圖像就需要一段時間。射線槍從屏幕頂端開始一行一行的發(fā)出射線,一直到屏幕底端。然后繼續(xù)從頂部開始一行一行的發(fā)射,來顯示下一幅圖像。但是射線槍掃描速度沒有那么快,所以每次圖像顯示,要么只掃單數(shù)行,要么只掃雙數(shù)行。然后兩幅圖像疊加,就是完整的一幀畫面。所以電視在早期都是隔行掃描。那么信號是怎么產(chǎn)生的呢?跟相機感光原理一樣,感光器件是對光敏感的設(shè)備,對于進光的強弱可以產(chǎn)生不同的電壓。然后再將這些信號轉(zhuǎn)換成不同的電流發(fā)射到接收端。電視機的掃描槍以不同的電流強度發(fā)射到熒光屏上時,熒光粉接收到的射線越強,就會越亮,越弱就會越暗。這樣就產(chǎn)生了黑白信號。那么幀和場的概念是什么?前面說到,由于攝像采集信號屬于連續(xù)拍攝圖像,比如每隔40毫秒截取一張圖像,也就是說每秒會產(chǎn)生25副圖像。而每個圖像就是一幀畫面,所以每秒25副圖像就可以描述為幀率為25FPS(framespersecond)。而由于過去電視熒光屏掃描是隔行掃描,每兩次掃描才產(chǎn)生一副圖像,而每次掃描就叫做1場。也就是說每2場掃描生成1幀畫面。所以幀率25FPS時,隔行掃描就是50場每秒。模擬時代在全世界電視信號標(biāo)準(zhǔn)并不是統(tǒng)一的,電視場的標(biāo)準(zhǔn)有很多,叫做電視信號制式標(biāo)準(zhǔn)。黑白電視的時期制式標(biāo)準(zhǔn)非常多,有A、B、C、D、E、G、H、I、K、K1、L、M、N等,共計13種(我國采用的是D和K制)。到了彩色電視時代,制式簡化成了三種:NTSC、PAL、SECAM,其中NTSC又分為NTSC4.43和NTSC3.58。我國彩色電視采用的是PAL制式中的D制調(diào)幅模式,所以也叫PAL-D制式。有興趣的可以百度百科“電視制式”來詳細了解。另外你可能會發(fā)現(xiàn),場的頻率其實是和交流電的頻率一致的。比如我國的電網(wǎng)交流電的頻率是50Hz,而電視制式PAL-D是50場每秒,也是50Hz。這之間是否有關(guān)聯(lián)呢?可以告訴你的是,的確有關(guān)聯(lián),不過建議大家自己去研究。如果確實不懂的同學(xué)可以@我。彩色信號又是怎么產(chǎn)生的呢?

其實有了基礎(chǔ)的黑白攝像技術(shù)之后,人們就一直想實現(xiàn)彩色攝像。早在1861年,英國物理學(xué)家麥克斯韋就論證了所有彩色都可以使用紅、藍、綠三種基色來疊加生成。但是感光器件只是對光線敏感,但是對顏色卻無法識別。為了實現(xiàn)對顏色的識別,人們用分光鏡加濾光片的方式,將光線分解成為三種基色的純色模式。然后分別對三個基色的純色亮度進行采集,然后再把信號疊加實現(xiàn)了對彩色信號的采集能力。WhiteLightGreenWhiteLightGreen采用3CCD彩色攝儂機的工作原理色彩信號是如何表達的?因為原來黑白電視的時候,基本上只需要一路信號就可以還原圖像(同步信號后面講)。但是有了彩色之后,一路信號能否表達一副完整的彩色圖像,以及如何表達呢?彩色電視出現(xiàn)之后,為了兼容早期的黑白電視信號(也就是黑白電視機可以接收彩色信號,但是只顯示黑白),科學(xué)家引入了YUV色彩表示法。YUV信號有多種叫法,可以稱作色差信號(Y,R-Y,B-Y),也可以稱作分量信號(YCbCr,或者Component、YPbPr)。它是由一個亮度信號Y(Luminance或Luma),和兩個色度信號U和V組成(Chrominance或Chroma)。黑白電視只使用亮度信號Y,彩色電視可以額外使用兩個色度信號,來實現(xiàn)彩色效果。但是YUV信號是怎么來的呢?首先,是因為考慮到黑白電視兼容,所以基礎(chǔ)信號仍然采用亮度信號。而顏色表達本身是通過RGB三基色的疊加來實現(xiàn)的,為了能夠?qū)UV信號可以還原成三基色RGB色彩值,數(shù)學(xué)家利用了色差算法,即選取一路Cr信號和一路Cb信號。Cr信號是指RGB的紅色信號部分與RGB亮度值之間的差異,Cb信號是指RGB的藍色信號與RGB亮度值之間的差異。所以YUV信號有時候也表達為Y,R-Y和B-Y,所以也叫色差信號。為什么YUV色彩會延續(xù)至今?如果大家平時經(jīng)常拿手機拍攝視頻,你可以把拍攝的視頻文件傳輸?shù)诫娔X上,然后用MediaInfo軟件打開,你會發(fā)現(xiàn)很多關(guān)于視頻的參數(shù)信息。而這些參數(shù)信息里面,你一定會發(fā)現(xiàn)手機拍攝的視頻色彩也是使用YUV信號模式。為什么不用RGB來表達?現(xiàn)在早都沒有黑白電視了啊?其實不必考慮兼容性的原因,因為你無論是什么信號模式拍攝的視頻,只要是數(shù)字化的信息文件形式,都可以與播放設(shè)備的信號模式無關(guān)。因為播放設(shè)備在播放視頻文件時需要解碼,再進行渲染。這時候不管什么信號模式還是色彩空間,都能轉(zhuǎn)化成設(shè)備兼容的方式。至于為什么YUV信號模式一直會持續(xù)至今,最主要的原因不是因為兼容性考慮,而是YUV信號有個巨大的優(yōu)勢,就是節(jié)省帶寬。這在數(shù)字媒體領(lǐng)域是很重要的。人眼的視覺特點是,人眼對于亮度信號最為敏感,對色度信號敏感度要弱一些。所以可以適當(dāng)減少色度信號的容量,也不會被人眼觀察到差異。就好比音頻里面的MP3壓縮格式,是將耳朵不敏感的頻率信號容量降低或去除掉,以大大降低文件的大小,但是人耳卻基本聽不到差異。至于YUV信號是如何做到降低信息容量的,可以看下面的引文:YUV主要的采樣格式有YCbCr4:2:QYCbCr4:2:2.YCbCr4:1:1和YCbCr4:4:4。其中YCbCr4:1:1比較常用,其含義為:每個點保存一48bit的亮度值(也就是Y值),每2x2個點保存一個Cr和Cb值,圖像在肉眼中的感覺不會起太大的變化。所以,原來用RGB(R,G,B都是8bit3$18限通模型,1個點需要8x3=24bits(如下圖第一個圖)(全采樣后,YUV仍各占8bit)。按4:1:1采樣后,而現(xiàn)在平均僅需要8+(8/4)+(8/4)=12bits(4個點,8*4(Y)+8(U)+8(V)=48bit),平均每個點占12bits。這樣就把圖像的數(shù)據(jù)壓縮了一半。以上內(nèi)容引自百度百科“YUV”條目。限于篇幅原因,對于YUV的各種采樣模式不再祥加描述,大家可以參考百度百科中的詳細解釋。如有不懂的同學(xué)可以@我。數(shù)字化時代的視頻技術(shù)視頻技術(shù)發(fā)展到了數(shù)字化時代,其實原理上并沒有太多變化。這也就是為什么前面要提到模擬時代視頻技術(shù)的知識的原因。但是數(shù)字化的視頻技術(shù),雖然基礎(chǔ)原理沒有改變,但是各方面的性能和功能有了很大的提升。這些就重點講一下數(shù)字化之后的視頻技術(shù)有了哪些突破:彩色攝像的演進前面講到,實現(xiàn)彩色攝像其實是把光線分解成為三個基色分別取亮度值,但是這種結(jié)構(gòu)比較復(fù)雜,成本也高。因為實現(xiàn)彩色攝像需要有一個分光用的棱鏡,然后采集光線必須要用到三片感光器件(CCD或CMOS)。這種結(jié)構(gòu)帶來第二個不好的地方就是結(jié)構(gòu)會比較龐大,不利于小型化微型化。后來呢,德國人拜耳發(fā)明了一種濾鏡,是一種馬賽克濾鏡。將含三基色的馬賽克濾鏡覆蓋在感光器件上面,這樣就可以實現(xiàn)用一片感光器件來采集三種顏色,同時也取消了分光棱鏡這種結(jié)構(gòu)。這樣下來,不僅成本降低了,結(jié)構(gòu)也簡化了。有了這種技術(shù)之后,攝像設(shè)備就可以越做越小,現(xiàn)在集成在手機上的攝像頭整體厚度只有2?3毫米,尺寸只有1?3毫米。當(dāng)然在專業(yè)領(lǐng)域,高端的攝像機仍然采用分光棱鏡加3CCD的技術(shù),原因不是他們不愿意改,而是3CCD的色彩豐度更好。而且專業(yè)攝像機CCD技術(shù)也從IT型發(fā)展到了FIT型,感興趣的同學(xué)可以查看一下SONY公司關(guān)于FIT型CCD專業(yè)攝像機的介紹來了解??偠灾褪敲裼妙I(lǐng)域和專業(yè)領(lǐng)域發(fā)展方向不一樣,所以路線也不同。場概念消失在模擬電視時代,受限于顯像管技術(shù)原因,采用的是隔行掃描技術(shù)來還原圖像顯示。但是現(xiàn)在都是平板電視了(液晶電視、等離子電視、激光電視),電視的成像方式不再是一條線一條線的掃描,而是一次性全畫面呈現(xiàn)。所以現(xiàn)在的視頻拍攝一般都沒有場的概念,當(dāng)然為了向前兼容,在視頻文件信息中,你會看到掃描模式的參數(shù)。利用手機拍攝的視頻文件,其掃描模式的參數(shù)都是Progressive,就是逐行掃描的意思。采樣率和采樣精度大家都知道模擬和數(shù)字的最大差別就是信息存儲和傳遞方式,一個是模擬量一個是數(shù)字量化的。那么數(shù)字化對于連續(xù)過程的量化就必須用到采樣過程,也可以理解為片段化。例如音頻數(shù)字化,就是把音頻在每個很小的時間間隔上獲取音頻的信息然后進行數(shù)字量化,最后把所有連續(xù)采樣的數(shù)字量化數(shù)據(jù)組合,來形成最終的信息。視頻也是這樣,按照一定的時間間隔,把獲取到的圖像進行數(shù)字量化,然后連續(xù)的數(shù)字量化的集合就是一段完整的視頻文件。但是視頻的采樣率并非是大家理解的那樣,每秒鐘產(chǎn)生25幀的圖像,采樣率就是25Hz。實際上,ITU(InternationalTelecommunicationsUnion,國際電信聯(lián)盟)在CCIR601標(biāo)準(zhǔn)中,對于視頻的采樣標(biāo)準(zhǔn)有了明確的界定:一、采樣頻率:為了保證信號的同步采樣頻率必須是電視信號行頻的倍數(shù)。CCIR為NTSC、PAL和SECAM制式制定的共同的電視圖像采樣標(biāo)準(zhǔn):fs=13.5MHz這個采樣頻率正好是PAL、SECAM制行頻的864倍,NTSC制行頻的858倍,可以保證采樣時采樣時鐘與行同步信號同步。對于2:2的采樣格式,亮度信號用£$頻率采樣,兩個色差信號分別用fs/2=6.75MHz的頻率采樣。由此可推出色度分量的最小采樣率是.375乂血。二、分辨率:根據(jù)采樣頻率,可算出對第1和SECAM制式,每一掃描行采樣864個樣本點;對于NTSC制則是858個樣本點。由于電視信號中每一行都包括一定的同步信號和回掃信號,故有效的圖像信號樣本點并沒有那么多CCIR601規(guī)定對所有的制式,其每一行的有效樣本點數(shù)兆0點。由于不同的制式其每幀的有效行數(shù)不同(PAL和SECAM制為576行,NTSC制為484行),CCIR定義720X484為高清晰度電視HDTV(HighDefinitionTV的基本標(biāo)準(zhǔn)。實際計算機顯示數(shù)字視頻時,通常采用下表的參數(shù):電視制式分辨率幀率NTSC640X48030PAL、SECAM768X57625三、數(shù)據(jù)量:CCIR601規(guī)定,每個樣本點都按8位數(shù)字化,也即有256個等級。但實際上亮度信號比20級,色度信號占225級,其它位作同步、編碼等控制用。如果按fs的采樣率、4:2:2的格式采樣,則數(shù)字視頻的數(shù)據(jù)量為:13.5(MHz)X8(bit)+2X6.75(MHz)X8(bit)二27Mbyte/s同樣可以算出,如果按4:4:4的方式采樣,數(shù)字視頻的數(shù)據(jù)量為每秋0兆字節(jié)!按每秒27兆字節(jié)的數(shù)據(jù)率計算,一^0秒鐘的數(shù)字視頻要占用270兆字節(jié)的存儲空間。按此數(shù)據(jù)率,一張680兆字節(jié)容量的光盤只能記錄約5秒的數(shù)字視頻數(shù)據(jù)信息,而且即使當(dāng)前高倍速的光驅(qū),其數(shù)據(jù)傳輸率也遠遠達不到每秒兆字節(jié)的傳輸要求,視頻數(shù)據(jù)將無法實時回放這種未壓縮的數(shù)字視頻數(shù)據(jù)量對于當(dāng)前的計算機和網(wǎng)絡(luò)來說無論是存儲或傳輸都是不現(xiàn)實的因此,在多媒體中應(yīng)用數(shù)字視頻的關(guān)鍵問題是數(shù)字視頻的壓縮技術(shù)。由上述引文可知,YUV的采樣率和采樣精度,是數(shù)字視頻從模擬向數(shù)字化過渡中兼容性的解決方案。延續(xù)了模擬視頻以行為單位掃描的機制(模擬視頻沒有分辨率概念,只有行的概念)。由于這套標(biāo)準(zhǔn)是面向數(shù)字電視廣播系統(tǒng)制定的統(tǒng)一標(biāo)準(zhǔn),一般只在廣播電視領(lǐng)域中才會看到,而在其他的數(shù)字化視頻體系中基本沒有體現(xiàn)。比如你在視頻文件信息中找不到關(guān)于采樣率的參數(shù)。視頻分辨率視頻分辨率也是數(shù)字化視頻時代的主要特征,由于模擬視頻采用線掃描機制,也就是按行顯示圖像,而每一行的視頻線中并沒有進行數(shù)字量化,所以模擬視頻都是以多少行來界定的。比如PAL制式采用576行,NTSC制式采用480行。到了數(shù)字化時代,為了量化視頻的具體信息,就必須對每行的信息進行采樣并量化,就形成了分辨率的概念。如果采用PAL制式的視頻,每行量化的圖像點為768個,那么分辨率就是768X576。也就是說把PAL制的視頻圖像可以分解為768X576個像素點組成。雖然簡單的看視頻分辨率的概念挺簡單的,但實際上并沒有那么簡單。原因就是數(shù)字化視頻的應(yīng)用領(lǐng)域非常的多,從最早的廣播電視應(yīng)用,到監(jiān)控安防,到互聯(lián)網(wǎng)應(yīng)用,后來又到了高清數(shù)字電視,以及移動互聯(lián)網(wǎng)等等。而因為涉及的行業(yè)很多,每個行業(yè)都會制定自己的標(biāo)準(zhǔn),所以就形成了對視頻圖像分辨率的定義有了很多標(biāo)準(zhǔn)。我們就拿最常見的廣播電視、監(jiān)控安防為例:大家在計算機領(lǐng)域也都有接觸過分辨率的概念,比如VGA(640X480)、SVGA(800X600)、XGA(1024X768)、SXGA(1280X1024)、SXGA+(1400X1050)、UXGA(1600X1200)、WXGA(1280X800)、WXGA+(1280X854/1440X900)、WSXGA(1600X1024)、WSXGA+(1680X1050)、WUXGA(1920X1200)等等?,F(xiàn)在最高的標(biāo)準(zhǔn)是WQUXGA(3840X2400)。這個標(biāo)準(zhǔn)最早是由IBM制定的模擬信號的電腦顯示標(biāo)準(zhǔn),后來被各廠家繼續(xù)沿用和升級。再后來被VESA標(biāo)準(zhǔn)化組織統(tǒng)一制定。但是為什么分辨率就不能是簡單的數(shù)字,非要在前面弄一堆字母呢?這一堆字母絕對能把一大群人搞暈掉。原因在于制定一個輸出的分辨率,并不是簡單的設(shè)置有多少個像素點,而是還要考慮到實現(xiàn)這個像素點成像的方法。包括色階多少、帶寬多大、掃描方式怎樣,如果深入的講還有電路形式、增益控制、時序方式、尋址方式等等。如果沒有詳細制定這些圖像是如何生成的,那么各個廠家之間的產(chǎn)品可能很難兼容,也就不會見到今天如此發(fā)達的計算機市場了。同樣的道理,制定標(biāo)準(zhǔn)化的分辨率和實現(xiàn)方式,有助于行業(yè)的統(tǒng)一和兼容。監(jiān)控安防領(lǐng)域有什么分辨率標(biāo)準(zhǔn)呢?下面請看:圖像格式分辨率色度取樣個數(shù)色度取樣行數(shù)Sub-QCIF128X966448QCIF176X1448872CIF352X288176144HalfD1704X288352144D1(4CIF)704X57635228816CIF1408X1152704576這里解釋一下,CIF是CommonIntermediateFormat的縮寫,即通用影像傳輸視頻會議(videoconference)中常使用的影像傳輸格式,是ITUH.261協(xié)議中的一部分。大家可能發(fā)現(xiàn)了,每個分辨率的色度取樣個數(shù)和行數(shù)都是對應(yīng)分辨率的一半。沒錯,因為這個標(biāo)準(zhǔn)因為考慮到攝像頭的性能和傳輸?shù)男阅苡绊懀扇〉氖情g隔像素采樣和隔行掃描機制,而間隔像素采樣通過插值進行補齊。不過這些參數(shù)貌似現(xiàn)在很難見到了,為什么呢?很簡單,因為監(jiān)控安防現(xiàn)在都是高清化了,都是D2、D3這種級別的,對應(yīng)分辨率是720P和1080P這一類。那么在廣播電視領(lǐng)域,對于分辨率的定義又是怎樣呢?前面已經(jīng)提到了關(guān)于PAL制和NTSC制式的視頻分辨率標(biāo)準(zhǔn),另外還有一個SECAM制式,SECAM的分辨率為720X576。那么你會發(fā)現(xiàn)SECAM制式和PAL制的行數(shù)是一樣的,只有每行的分辨率不同。這是由于SECAM調(diào)制載波方式不同造成的。在標(biāo)清電視時代,對于分辨率方面理解與現(xiàn)在其實有所不同。比如SECAM制式每幀圖像是625行,但是分辨率是720X576,也就是只有576行。是因為視頻信號傳輸過程中分幀正程和幀逆程,而幀逆程就是回掃,反向回去。在視頻信號正常顯示時,需要消除行幀逆程掃描對畫面的干擾,所以就變成了576行。到了高清時代,數(shù)字電視推出了HDTV標(biāo)準(zhǔn),它對于顯示分辨率的定義為1280X720逐行掃描,也就是俗稱的720P;1920X1080隔行掃描,也就是俗稱的1080i;1920X1080逐行掃描,也就是所謂的1080P。當(dāng)然高清數(shù)字電視已經(jīng)逐漸普及了,目前正在面向4K高清過渡,也就是所謂的UHDTV(UltraHighDefinitionTelevision,超高清數(shù)字電視)。UHDTV草案定義了兩個分辨率標(biāo)準(zhǔn),及4K(3840X2160)和8K(7680X4320),支持50Hz、60Hz、和59.94Hz三種幀率,只采用逐行掃描。UHDTV采用正交采樣,像素縱橫比(PAR)為1:1,顯示縱橫比(DAR)為16:9。關(guān)于像素縱橫比和顯示縱橫比的概念,相對比較簡單,這里就不做解釋了。如果不清楚的可以搜索一下,當(dāng)然同樣也可以@我。關(guān)于信號同步信號同步是在廣播電視領(lǐng)域中非常重要的技術(shù),因為它如果出現(xiàn)問題,你的電視畫面一定是沒法看的,比如下面這種情況:

產(chǎn)生這種畫面的原因,在于信號沒有同步。導(dǎo)致行掃描時,沒有在指定的位置。產(chǎn)生這種畫面的原因,在于信號沒有同步。導(dǎo)致行掃描時,沒有在指定的位置。要想圖像內(nèi)容在正確的位置顯示,就必須提供同步信號來進行約束。而不管是模擬電視時代,還是在數(shù)字電視時代,不管是電視機還是顯示器都需要信號同步。同步信號一般有兩種,分別為場同步(VSYNC)和行同步(HSYNC)。不論是什么類型的信號接口,都包含有一個或兩個同步信號。1、紅接色4、能讓碼7、綠池10.數(shù)字地1工行同步2、綠基色工自測試雷雷她LL地址碣14,場同步三藍基色6、紅地9.電源L2,地址碣15、地址碼VGA信號線的引腳定義另外一種形式的VGA接口,也叫RGBHV接口DVI接口引腳定義專業(yè)設(shè)備中的專用視頻同步接口雖然有很多設(shè)備如電視機的復(fù)合信號輸入(Composite)、HDMI輸入,顯示器的DisplayPort輸入,專業(yè)設(shè)備的SDI和HDSDI輸入,都沒有專門的視頻場同步和行同步信號接口,但并不是說這些信號不需要同步。而是這些信號接口把場同步和行同步信號已經(jīng)調(diào)制到了信號中。也就是說我們平時見到的視頻信號接口中,并非只有純粹的視頻信息,還包含了很多的信息,比如同步信號、時鐘信號(TC,TimeCode)、CEC控制信號、HDCP版權(quán)保護信息、SerialClock設(shè)備與分辨率識別信息等。視頻編碼與壓縮視頻編碼與壓縮,是數(shù)字化視頻非常重要的技術(shù),以至于它直接影響到視頻在各個領(lǐng)域的應(yīng)用。如果沒有視頻編碼技術(shù)的不斷提高,我們今天也不可能在方方面面享受到視頻的便利性。首先,視頻編碼是一項非常復(fù)雜的工程,遠超過對音頻和圖像壓縮的難度。其次,視頻編碼是一個多級壓縮的過程,而非單一壓縮方案。當(dāng)然如果不是有著這么復(fù)雜的一項工程,視頻文件遠比我們想象的要大的多。我們來舉一個例子:按照CCIR601的視頻信號采集標(biāo)準(zhǔn),一個標(biāo)準(zhǔn)PAL制式電視信號轉(zhuǎn)換成數(shù)字信號,按照常見的非專業(yè)級采樣標(biāo)準(zhǔn)4:2:0(你想支持更高的也不行啊,民用級的設(shè)備做不到更高的采樣率),則每秒鐘產(chǎn)生的視頻內(nèi)容所生成的數(shù)字文件為21MB。那么1分鐘的視頻文件有多大呢?1260MB那么大。那如果按照RGB色彩表達方式,720X576分辨率,每個采樣點3個基色,每個基色是8bit數(shù)據(jù),每秒25幀畫面。得出來的結(jié)果是720X576X3X8X25=237.3Mbit=29.67MByte。那么1分鐘的視頻就是1780MB……我想從來沒有用戶見到過1分鐘的視頻會生成這么大的文件吧。這還僅僅是標(biāo)清,如果是高清1080P的話,那就是69.5TB!!從上面的例子可以看出,即便是不壓縮視頻,采用YUV顏色來存儲信息,比起使用RGB顏色來存儲信息,容量還是要小一些的。所以也可以說YUV顏色方式算是視頻編碼的最初一級壓縮方法。這里面需要穿插一個話題,關(guān)于色階。

色階的意思,就是顏色從無到最大時,中間的過渡梯級有多少。假如說亮度的黑白信號,色階為2時,那么它就只有兩種顏色,全白和全黑。那如果變?yōu)?56級是(比較常見的色階標(biāo)準(zhǔn)),結(jié)果就是下面這樣:同樣的RGB三基色中,每種顏色都有色階。8bit數(shù)據(jù)能夠存儲256個色階,那么RGB三基色就可以實現(xiàn)1677萬種顏色,也就是24位色。注:計算機顏色體系中有32位色,實際上是24位色之外增加了一個8位的Alpha透明層,所以也叫RGBA。那能不能使用更高的色階呢?大于256級色階好不好?當(dāng)然好了,不過一般的顯示器不支持。但是的確是有高色階的顯示器,目前色階最高的顯示器可以支持10bit顏色信息,也就是1024級色階。當(dāng)然價格是不可想象的!EIZOGX540醫(yī)學(xué)顯示器,1024級色階黑白顯示器,價格不明,但不會少于10萬元(當(dāng)然也有彩色的10bit顯示器,那更是天價)SONYBVM-X300主控監(jiān)視器,OLED顯示10bit彩色,可以顯示10億種顏色價格嘛,我記得大概是36萬多吧還有得告訴大家一個不好的消息,一般民用的低端顯示器采用的TN型液晶面板,都是6bit的,也就是RGB每種顏色只有64級,一共可以顯示顏色只有26萬種。當(dāng)然你可以選擇32位色模式,只不過它的1677萬種顏色,是通過插值換算出來的,并不是真正的1677萬種顏色。真正支持1677萬種顏色的顯示器,其實也不是很便宜的。畫面壓縮如果每一幀的視頻畫面,按照RGB顏色保存的話,文件會非常大。例如PAL制視頻畫面所產(chǎn)生的文件有1.2MB。如果將每幀的視頻畫面壓縮,那么可能大大減小視頻的文件大小。而我們所知的最常見圖像壓縮算法就是jpeg。JPEG是JointPhotographicExpertsGroup(聯(lián)合圖像專家小組)的縮寫,是第一個國際圖像壓縮標(biāo)準(zhǔn)。首先JPEG壓縮是對圖像的YUV色彩分量進行分別編碼,所用的編碼主要算法是DCT(DCTforDiscreteCosineTransform,離散余弦變換)。它是與傅里葉變換相關(guān)的一種變換,它類似于離散傅里葉變換(DFTforDiscreteFourierTransform)但是只使用實數(shù)。DCT是一種非常高壓縮率低失真的壓縮算法,可以將圖像壓縮至1/5到1/10大小,而且畫質(zhì)基本沒有太大變化。那么利用JPEG壓縮算法,原本每幀圖像大小為1.2MB,現(xiàn)在就變成了180KB左右,減小了很多。而每秒鐘的視頻大小就變成了4.4MB,1分鐘的視頻就是263MB。頓時小了很多。使用這種算法的視頻編碼方式叫做MotionJPEG,也叫MJPEG。注意,視頻壓縮里面也有個比較知名的方法叫做MPEG,但不等同于MJPEG,兩者截然不同。運動壓縮雖然通過JPEG算法,可以將視頻變小了好幾倍,但是還是比較大。對于傳輸來說和存儲來說,門檻還是太高了,只能適合像廣播電視行業(yè)這種專業(yè)機構(gòu)使用。那么還有什么辦法可以把視頻文件壓縮的更小呢?那就是幀間壓縮方法。說到幀間壓縮,那必須提到一個組織。MPEG(MovingPictureExpertsGroup,動態(tài)圖像專家組)是ISO(InternationalStandardizationOrganizati,onH際標(biāo)準(zhǔn)化組織)與IEC(InternationalElectrotechnicalCommission國際電工委員會)于1988年成立的專門針對運動圖像和語音壓縮制定國際標(biāo)準(zhǔn)的組織?,F(xiàn)在知道了吧,MPEG其實是一個組織的名字。當(dāng)然這個組織有很多有代表性的壓縮算法,都是以MPEG-X命名的。所以大家也就習(xí)慣的把MPEG稱作壓縮方法。首先,運動壓縮采用的是幀間壓縮法。而什么是幀間壓縮法呢?由于視頻是由很多幀的畫面集合組成,而鑒于運動的特性,在很短的間隔時間內(nèi)運動幅度很小。另外就是運動的畫面中,存在很多并沒有運動的畫面信息。甚至有時候拍攝的畫面有很多幀圖像之間幾乎沒有變化。這樣重復(fù)的記錄這些沒有變化的圖像信息,簡直是太浪費了。幀間壓縮,就是盡可能的剔除那些相鄰畫面中沒有變化的內(nèi)容信息。舉個例子,比如畫面是一個人騎自行車,背景不變,而騎自行車的人從畫面一端跑到另外一端。那么這個時候,就可以把沒有遮蓋到的背景部分,只保存一份就行了。剩下的只是記錄人騎自行車的整個動態(tài)畫面就OK。當(dāng)時原理上比較簡單,實現(xiàn)起來就比較困難了。幀間壓縮的時候首先要用到關(guān)鍵幀和非關(guān)鍵幀的概念。關(guān)鍵幀就是指你要保存畫面上所有數(shù)據(jù)的那一幀圖像,并且以這個圖像作為參考。關(guān)鍵幀后面每一幀都會比照關(guān)鍵幀和此前一幀的畫面,記錄畫面改變的地方,去掉重復(fù)的信息。早期的壓縮算法就是采取這種策略,比如MPEG-1。它的應(yīng)用產(chǎn)品大家可能更熟悉——VCD。這里順便提一下MP3,MP3的全名叫做MPEG-1layer3。也就是說MP3壓縮格式是MPEG-1壓縮標(biāo)準(zhǔn)里面的一個子集。跟MP4是完全不同的概念。VCD雖然在一張光盤里(650MB容量)可以放得下差不多一部電影的長度,已經(jīng)是壓縮率很驚人了。當(dāng)然這也是犧牲畫面為前提的:VCD的分辨率很低,只有352X288(對應(yīng)PAL制),比標(biāo)準(zhǔn)的電視畫面的清晰度小很多。VCD在運動不太明顯的情況下畫質(zhì)還可以接受,如果是運動很快的畫面中,就會出現(xiàn)很多慘不忍睹的馬賽克。有了VCD產(chǎn)品,國人們是皆大歡喜。這里可以順帶講一下,VCD機是中國人發(fā)明的,那家公司叫萬燕。但是呢,VCD技術(shù)是飛利浦、SONY、松下、JVC等公司聯(lián)合制定的標(biāo)準(zhǔn),而生產(chǎn)VCD芯片的公司是美國的C-CUBE公司。怎么說呢,技術(shù)雖然是老外們發(fā)明的,不過他們并不看重這項技術(shù),所以就沒形成產(chǎn)品。反倒是國人把它發(fā)揚光大了。與此同時,歐美國家其實對VCD是不太感冒的。因為他們還在VHS時代(感興趣的同學(xué)可以搜索一下VHS,以及SONY的betacam與JVC的VHS制式標(biāo)準(zhǔn)大戰(zhàn)),而且VCD第一不便宜,第二畫質(zhì)也不高,第三還不能錄像只能播放。其實有了VCD產(chǎn)品之后,對世界還是很震驚的。大家都覺得把一部電影放在一張小小的碟片里面真的很方便。但是VCD畫質(zhì)真的不好,有沒有什么新的技術(shù)可以做到更小的容量更高的清晰度呢?那就是后來推出的MPEG-2。MPEG-2這個標(biāo)準(zhǔn)是最早風(fēng)靡全球的壓縮技術(shù),標(biāo)準(zhǔn)制定的時間是1994年(VCD標(biāo)準(zhǔn)是1993年)。雖然已經(jīng)過去20多年了,卻仍然是當(dāng)今最重要的視頻壓縮格式之一。除了還有大量的DVD產(chǎn)品以外,更重要的是目前廣播電視領(lǐng)域的數(shù)字電視DVB-T標(biāo)準(zhǔn),仍然使用的是MPEG-2壓縮標(biāo)準(zhǔn)(在中國)。MPEG-2相對于MPEG-1有什么提升呢?.畫面有了很大的提升,且更加靈活了。MPEG-1幾乎所有的應(yīng)用都集中在VCD上,分辨率很小,且不能改變。MPEG-2可以適合中等清晰度(D1標(biāo)準(zhǔn)、PAL制或者NTSC等制式電視標(biāo)準(zhǔn))到高清晰度視頻內(nèi)容的展示。也就是說即便是720P、1080P等這樣的高分辨率視頻,MPEG-2仍然適用。.增加了GOP模式,使用IBP幀結(jié)構(gòu)。原來的幀間壓縮方式,在大動態(tài)場景下馬賽克很嚴重。到了MPEG-2之后就有了很大的提升,因為使用了參考幀B幀,使用了向前預(yù)測幀方式,而且壓縮率是可變的??偟膩碚f,就是大動態(tài)時候不會有馬賽克了。.增加了很多額外的信息,功能更加強大。比如支持更強的交互與命令控制(大家有沒有想起來VCD2.0時候畫面有菜單可以選,DVD比這個強大),支持傳輸流形式(TS,TransportStream,就是可以用于直播,也不怕文件損壞就全完),多音軌而且多聲道……但是MPEG-2也有不足的,主要就是它是面向工業(yè)化視頻信息生產(chǎn)發(fā)行領(lǐng)域的,也就是說只適合電視臺、DVD發(fā)行商、衛(wèi)星通信等領(lǐng)域,不適合民用。因為碼流真的很大,比MPEG-1要大。雖然一張光盤就可以裝的下一整部電影,那是因為光盤的容量從650MB提升到了4.3GB,甚至7.2GB?;ヂ?lián)網(wǎng)視頻應(yīng)用的到來早期的寬帶速度只有1?2Mbps(56Kmodem和ISDN時代根本就沒視頻什么事),想要在線播放DVD影片是不可能的(至少5?10Mbps),VCD也不行而且技術(shù)上不支持。MPEG組織的科學(xué)家就開始研究能夠適合在網(wǎng)絡(luò)上播放的視頻壓縮方法,也就是后面推出的MPEG-4壓縮格式。MPEG-4很明顯的特征就是適合在網(wǎng)絡(luò)上播放,靈活度更高,功能更加強大:1.壓縮比更高更靈活。MPEG-1壓縮比為20?30倍,MPEG-2壓縮比為10?20倍,MPEG-4壓縮比從幾十到一百多倍不等;.對于畫面內(nèi)容可以使用不同的壓縮比率,可以對非重要對象使用高壓縮比,對重要對象使用低壓縮比。這樣可以在保證主要畫質(zhì)情況下壓縮比更高;.不同對象可以使用不同編碼算法,進一步提升壓縮效率;.音視頻搭配更靈活;.交互性更強,尤其適合互聯(lián)網(wǎng)這種模式。MPEG-4后來產(chǎn)生了很多衍生壓縮算法,比較著名的就是Xvid和Dvix了。其實MPEG-4的知名度不如Xvid和Dvix,因為在那個時期,MPEG-4為了適應(yīng)互聯(lián)網(wǎng)較低的帶寬速度,大部分應(yīng)用都是一些低分辨率低碼流的視頻。而Xvid和Dvix雖然源自MPEG-4體系,但是面向視頻文件存檔進行了優(yōu)化,可以比DVD小3?4倍的大小,存儲與DVD畫質(zhì)非常接近的視頻內(nèi)容。受到了用戶的極大喜愛,以至于在那個時期已經(jīng)成為盜版影片的必選格式。RealMedia,曾經(jīng)的王者曾經(jīng)互聯(lián)網(wǎng)視頻最大的贏家是RealNetwork,也是它最早實現(xiàn)了基于互聯(lián)網(wǎng)的流媒體視頻(在線觀看)。想當(dāng)年還在56KModem窄帶時期,RealNetwork公司就已經(jīng)提供了視頻在線觀看功能。筆者曾經(jīng)在那個還在PSTN上進行撥號的時代,體驗過通過realplayer觀看NBA的直播。如果以現(xiàn)在的標(biāo)準(zhǔn)來衡量那個時期的產(chǎn)品,那就是延時巨大(經(jīng)常要loading幾分鐘)、畫質(zhì)慘不忍睹(分辨率超低,馬賽克嚴重)、經(jīng)常性的卡頓。但是隨著寬帶的逐漸普及,RealMedia的巨大優(yōu)勢得以施展。在那個時期,RealMedia是當(dāng)之無愧的王者。首先,RealMedia壓縮標(biāo)準(zhǔn)并非是MPEG-4衍生的版本,而是一個私有的壓縮標(biāo)準(zhǔn)。這個標(biāo)準(zhǔn)由RealNetwork公司創(chuàng)立,且獨有。RealMedia擁有極大的壓縮比,遠超MPEG家族。比如說一部標(biāo)準(zhǔn)DVD格式的電影,大約4.3GB容量,如果采用Dvix壓縮的話,大概能壓縮到700MB,而使用RM格式壓縮,連700MB的一半都不到。即便是到了后期的RMVB壓縮格式,也基本不會超500MB。第二,RealNetwork公司在當(dāng)時提供了世界上最完善的流媒體系統(tǒng)方案,只不過是收費的。那個時候的競爭對手只有微軟的WindowsMediaEncoder,免費但是功能不完善。而RealMediaEncoder提供了VOD模式和LIVE模式完整的流媒體解決方案,雖然比較貴(印象中大概1萬多美金)。JU2dnrtiEits同電運板口也直⑵L<UR神| 甩里方式玷)|則械⑴| "國息也1|加JU2dnrtiEits同電運板口也直⑵L<UR神| 甩里方式玷)|則械⑴| "國息也1|加6 30y.r7國七閩gk畫畫?,田分獨—勝出1Mal「同口.臼司一%|rea/PLUSPLUS對于商業(yè)化應(yīng)用的企業(yè)而言,要想做直播和點播業(yè)務(wù),自然 RealMediaEncoder服務(wù)會更加靠譜。雖然是收費的,但是系統(tǒng)穩(wěn)定、可靠性強、又有服務(wù)支持(WindowsMediaEncoder只能在MSDN社區(qū)尋求幫助,沒有技術(shù)支持)。所以說那個時期Real公司已經(jīng)處于壟斷地位了。不過在那個時期,Real公司面臨最大的問題是盜版。因為RealMedia的播放器雖然是免費的,但是編碼器、解碼器、流媒體服務(wù)器等等都是收費的。隨著real格式日漸盛行,盜版就變得非常猖獗。當(dāng)然Real公司沒有微軟那么財大氣粗,所以自然要到處封殺。這只能說是在21世紀(jì)初期的互聯(lián)網(wǎng)現(xiàn)狀,如果要是放到現(xiàn)在,像Real這種公司風(fēng)投還不擠破大門?公司的估值少說也得幾百億美金吧。可惜的是,由于封閉而且收費,加上到處封殺,給了競爭對手很多機會。然后就有了Flash流媒體的崛起。RealMedia能強大到什么程度呢?在21世紀(jì)初一直到2010年之前的差不多十年間,real格式一度成為了互聯(lián)網(wǎng)視頻格式的幾乎唯一選擇。那時候幾乎所有盜版的電影和視頻文件,全都是基于RM和RMVB格式的。21世紀(jì)以前呢?那是avi的天下,呵呵。RealMedia的視頻壓縮主要分為兩個階段,第一階段就是RM格式,第二階段是RMVB。由于RM格式雖然壓縮率出奇的高,但帶來的問題就是畫質(zhì)很差,馬賽克嚴重。隨著寬帶逐漸普及,人們對畫質(zhì)的要求逐漸提高,加上競爭對手的

壓力(Dvix和Xvid),RM升級到了RMVB。多出來“VB”這兩個字幕,其實指的就是“VariableBitrate”動態(tài)碼率或者叫可變碼率。關(guān)于碼率的解釋我們在文章最后來做。rmvbrmvbRM升級到RMVB之后,一直被詬病的畫質(zhì)問題得到了提升,同時也可以支持較高的清晰度(最大到720P)。但是RMVB推出的時間已經(jīng)晚于競爭對手,加上商業(yè)化的原因,以及更新速度越來越慢。最終消失在互聯(lián)網(wǎng)的視野中。FlashVideo的崛起不同于RealMedia的全行業(yè)流行,F(xiàn)lashVideo(以下簡稱FLV)主要應(yīng)用在流媒體領(lǐng)域,提供VOD點播和LIVE直播服務(wù)。與Dvix和Xvid一起成為了第二階段的黃金組合。FLV的壓縮編碼也不是源自MPEG-4,而是另外一個強大的標(biāo)準(zhǔn)H.26x體系,最早出現(xiàn)在1997年的MacWorldExpo大會上。說來很有意思,F(xiàn)LV天生就和蘋果是一對,到最后卻被蘋果拋棄……首先,F(xiàn)LV并非是一種壓縮編碼格式,而是封包格式(比如AVI、MKV、MP4、MOV這些文件,都是一種封包格式。關(guān)于封包格式的問題,由于涉及技術(shù)過深,在這里暫不作詳解。感興趣的用戶可以自己了解掌握,@我也行哦)。FLV采用的視頻壓縮編碼其實有蠻多的,開始是SorensonVideo和SorensonVideoPro,以及SonrensonSpark;后來加入了SorensonMPEG1/2/4,再后來就是目前最流行的H.264。其實早期Sonrenson的很多壓縮編碼格式源自QuickTime壓縮編碼,也是基于H.263的壓縮編碼應(yīng)用。所以我們就不單獨介紹這種編碼的特點了。至于FLV在市場上的表現(xiàn),其實大部分人都可能比較了解。畢竟國內(nèi)的視頻大站,比如優(yōu)酷土豆、酷6、PPS、PPTV等,早期全都是用的FLV;國外的大站如youtube也是最早的FLV用戶。只是隨著蘋果公司倡導(dǎo)的全面去flash化運動,所有視頻大站不得不開始往HTML5轉(zhuǎn)型。WindowsMediaVideoWMV一直是一種不溫不火的壓縮編碼格式,出道很早,但應(yīng)用很少。早在RealMedia時期,微軟就已經(jīng)推出了WMV壓縮格式。并可以配合WindowsMediaEncoder實現(xiàn)流媒體應(yīng)用,也可以單獨編碼以文件形式存儲??梢哉f路數(shù)跟Real公司一樣,只不過是免費的。其實WindowsMediaEncoder(以下簡稱WME)一直都沒有什么起色,屬于那種歷史悠久但無人知曉的品種。早期在跟RealMedia競爭中處于下風(fēng),但至少有不少用戶知道。后來有了FLV之后,基本就看不到WME的身影了。至于WMV的壓縮格式,最開始也是一種私有格式。只不過到了WMV9.0的時候,微軟向SMPTE學(xué)會提交的標(biāo)準(zhǔn)化方案,并入到了VC-1標(biāo)準(zhǔn)體系中。也就是其他家也可以共享這種編碼技術(shù)。在早期的WMV標(biāo)準(zhǔn)里面,比如WMV7.0,是基于MPEG-4part2實現(xiàn)的編碼算法。最早期的版本沒有資料,但是可以看得出,WMV主流的版本主要是基于MPEG-4編碼的。H.26x家族除了知名度很高的MPEG組織(隸屬于ISO國際標(biāo)準(zhǔn)化組織下面的部門),還有一個在視頻編碼壓縮領(lǐng)域有突出貢獻的組織,那就是VCEG(VideoCodingExpertsGroup,視頻編碼專家組)。VCEG屬于另外一個非常厲害的組織ITU(國際電信聯(lián)盟)下屬的部門,可能大部分人都不知道這個名字,但你一定知道他們提供的標(biāo)準(zhǔn)——H.264。VCEG組織主要編撰的是H.26x標(biāo)準(zhǔn)體系,主要有H.261,H.263,H.264。H.261主要是面向視頻會議領(lǐng)域的,也主要應(yīng)用在監(jiān)控安防領(lǐng)域。前面曾講到的,都是低分辨率低碼流視頻。H.263算是H.261的加強版本,主要是支持更高的分辨率(16CIF),采用了更高級的運動補償算法。后期又升級到了H.263+和H.263++,使得算法性能和分辨率等都有了明顯的提升。除了知名度很高的H.264以外,還有一個H,262標(biāo)準(zhǔn),只不過應(yīng)用非常少,就不講了。H.264、MPEG-4part10AVC目前大家最熟悉的壓縮編碼格式莫過于H.264了,其實它還有另外一個名稱MPEG-4part10AVC(AdvancedVideoCoding)。原因是這個標(biāo)準(zhǔn)不是一家制定的,而是兩家世界上最權(quán)威的編碼專家組織一同來完成的。那就是ITU下面的VCEG組織和ISO下面的MPEG組織。大家有興趣的話,可以搜索一下ITU,就知道它在世界標(biāo)準(zhǔn)體系里面的重要性了。目前全世界的通信網(wǎng)絡(luò)標(biāo)準(zhǔn),比如2G的GSM、3G的WCDMA、TD-SCDMA、CDMA2000,以及4G的FDD-LTE和TDD-LTE都是ITU來發(fā)布的。H.264/MPEG-4AVC是融合了兩家權(quán)威組織的知識結(jié)晶,是目前世界上最優(yōu)秀的編碼算法。它的特點非常多,我只列舉一下大家能感知到的一些特點。更多的內(nèi)容大家可以自行查閱資料。編碼壓縮率較高,也很靈活。同等畫質(zhì)下,壓縮率為MPEG-2的2倍,MPEG-4的1.5?2倍。而且可以用很高的碼率(MPEG-2接近)和很低的碼率(MPEG-2的1/8),來實現(xiàn)更快的傳輸需要和更高的畫質(zhì)需要。動態(tài)效果更出色,基本上徹底消除了馬賽克現(xiàn)象。比如像《變形金剛》電影里面的大動態(tài)場景,你仍然可以非常清晰的看清畫面。壓縮效率更高,比如靜態(tài)畫面可以實現(xiàn)超高的壓縮比。這是因為H.264/MPEG-4AVC最大程度的去除冗余數(shù)據(jù),使得編碼效率提升。錯誤修復(fù)能力,可以在網(wǎng)絡(luò)QOS較差的環(huán)境下更高效率的傳輸。適合各種行業(yè)應(yīng)用,不管是視頻會議、安防監(jiān)控這類的高壓縮使用,還是互聯(lián)網(wǎng)流媒體的動態(tài)網(wǎng)絡(luò)環(huán)境使用,以及廣播電視這類高畫質(zhì)標(biāo)準(zhǔn)使用。所以你看到的結(jié)果就是,幾乎所有行業(yè)都在使用這個標(biāo)準(zhǔn)(國內(nèi)的有線電視仍然是MPEG-2,主要是由于有線電視的帶寬很高且目前還比較充裕,加上技術(shù)升級成本很高)。比如小到CIF尺寸的視頻,大到4K標(biāo)準(zhǔn)的電影文件,你會發(fā)現(xiàn)他們基本都是基于H.264/MPEG-4AVC壓縮的。行業(yè)應(yīng)用廣泛還得益于H.264/MPEG-4AVC這種編碼格式的產(chǎn)品線健全。大家可能都知道的一個道理,當(dāng)壓縮率越高的時候(同等畫質(zhì)下),編碼就越復(fù)雜,計算量越高。所以對于H.264的編碼和解碼,其計算量比過去的MPEG-2、MPEG-4等都高了很多。所以也就會出現(xiàn)較早期的電腦在軟解碼(CPU解碼)H.264視頻的時候,容易出現(xiàn)卡頓。就是因為對計算性能要求較高。但是好在有大量的專用編碼解碼芯片,以及專門對H.264編解碼優(yōu)化過的GPU(手機GPU和電腦顯卡GPU),使得流暢性和速度得到了保障。所以你會發(fā)現(xiàn)某些高畫質(zhì)的視頻,可能在電腦上播放會很卡,但是在一些機頂盒上播放會非常流暢。H.265H.265

HEVC

HighEfficiencyVideoCoding其實在H.264還沒流行起來,H.265標(biāo)準(zhǔn)就已經(jīng)建立了。主要特點是壓縮效率進一步提升,對UHDTV的支持,更好的信噪比等等。目前已經(jīng)有一部分手機、監(jiān)控安防設(shè)備、視頻會議設(shè)備開始使用H.265編碼格式。預(yù)計以后會更多,并且逐漸普及。QuickTime家族QuickTimeQuickTime說起QuickTime,大家一定會想起蘋果公司。沒錯,quicktime就是蘋果公司推出的一整套編碼、解碼、播放和流媒體解決方案。quicktime的壓縮格式早期是私有的,由于早期MAC系列電腦(那時候沒有iphone)普及率很低,所以使用quicktime這種格式的非常少,包括他們的流媒體應(yīng)用。只是到了后期,隨著iphone的大量用戶,quicktime才被大家所知。但這個時候蘋果早就將quicktime標(biāo)準(zhǔn)加入到了MPEG-4標(biāo)準(zhǔn)體系中,以及后來H.264出現(xiàn)。結(jié)果大家都清楚了,蘋果目前也在用H.264壓縮標(biāo)準(zhǔn)。壓縮編碼全集其實除了上面講到的主流非主流的視頻壓縮編碼格式以外,還有很多大家不了解的。因為應(yīng)用非常少,且現(xiàn)在幾乎都是被H.264統(tǒng)一了市場,所以就不做介紹了。下面的表格是目前所有的視頻壓縮編碼標(biāo)準(zhǔn)集合:ISO/IEC標(biāo)準(zhǔn)MJPEG,MotionJPEG2000,MPEG-1,MPEG-2Part2,MPEG-4Part2/ASPPart10/AVCMPEG-HPart2/HEVCITU-T標(biāo)準(zhǔn)H.120,H.261,H.262,H.263,H

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論