版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
安全防范監(jiān)控數字視音頻編解碼技術要求2010-12-23發(fā)布2011-05-01實施中華人民共和國國家質量監(jiān)督檢驗檢疫總局發(fā)布I 2規(guī)范性引用文件 3術語、定義和縮略語 13.1術語和定義 13.2縮略語 4約定 4.1算術運算符 4.2邏輯運算符 4.3關系運算符 4.4位運算符 4.5賦值運算符 4.6數學函數 4.7語法元素、變量和表 4.8邏輯運算符的文字描述 4.9過程 5視頻部分 5.1編碼比特流和輸出數據的格式 5.2語法和語義 205.3解碼過程 5.4解析過程 6音頻部分 6.1總體描述 6.2編碼器功能描述 6.3解碼器功能描述 6.4比特分配描述 附錄A(規(guī)范性附錄)假設參考解碼器(HRD) 附錄B(規(guī)范性附錄)字節(jié)流的格式 附錄C(規(guī)范性附錄)視頻檔次與級別 附錄D(規(guī)范性附錄)視頻可用性信息(VUI) 附錄E(規(guī)范性附錄)補充增強信息(SEI) 附錄F(規(guī)范性附錄)變長碼表 附錄G(規(guī)范性附錄)音頻檔次和級別 附錄H(規(guī)范性附錄)異常聲音事件類型定義 附錄I(資料性附錄)VAD檢測 附錄J(資料性附錄)噪聲消除 參考文獻 Ⅲ請注意,本標準的某些內容有可能涉及專利,本標準的發(fā)布機構不承擔識別這些專利的責任。本標準的附錄A~附錄H為規(guī)范性附錄,附錄I和附錄J為資料性附錄。本標準由中華人民共和國公安部提出。本標準由全國安全防范報警系統(tǒng)標準化技術委員會(SAC/TC100)歸口。本標準起草單位:公安部第一研究所、北京中星微電子有限公司、北京中盾安全技術開發(fā)公司、中星電子股份有限公司、清華大學、香港大學、大連理工大學、江蘇東奇信息科技有限公司、中國傳媒大學信息工程學院、國家多媒體軟件工程技術研究中心、寧波艾利特科技發(fā)展有限公司、杭州恒生數字設備科技有限公司、公安部第三研究所、浙江大華技術股份有限公司、北京聲迅電子有限公司、天津市亞安科技電子有限公司、深圳市艾立克電子有限公司、浙江大立科技股份有限公司、北京國通創(chuàng)安信息技術有限公司、天津天地偉業(yè)數碼科技有限公司、金鵬電子信息機器有限公司、北京蛙視通信技術有限責任公司、杭州海康威視數字技術股份有限公司、中國科學院軟件研究所、深圳中興力維技術有限公司、北京漢邦高科數字技術有限公司、寧波舜宇光電信息有限公司、數維科技(北京)有限公司、新太科技股份有限公司、星際控股集團有限公司、浙江警官職業(yè)學院、北京富盛星電子有限公司、杭州華三通信技術有限公司、廣東志成冠軍集團有限公司。IVGB/T25724—2010目前國內、國際沒有專門針對安全防范監(jiān)控應用的視音頻編解碼標準,現有的視音頻編解碼標準,都是針對廣播電視和大眾娛樂方面的應用,在安全防范領域直接采用具有很大的不適應性。本標準專門針對安防監(jiān)控領域應用的特殊性,如:視頻圖像的實時傳輸性、全天候24h監(jiān)控環(huán)境的適應性、場景視音頻信息的忠實還原性等要求制定。本標準主要技術特點有:a)支持高精度視頻數據編碼,適應寬動態(tài)范圍,保留更多的圖像細節(jié),滿足忠實于場景的要求。視頻支持8bit~10bit數據,并保留未來擴充到12bit~16bit的可能;b)支持幀內4×4預測與變換量化、自適應幀一場編碼(AFF)和上下文自適應二進制算術編碼(CABAC)等技術,獲得更好的圖像質量和更高的編碼效率;c)支持感興趣區(qū)域(ROI)變質量編碼,在傳輸網絡帶寬或數據存儲空間有限的情況下,優(yōu)先保證ROI圖像質量,節(jié)省非ROI的開銷,提供更符合監(jiān)控需要的高質量視頻編碼,提高監(jiān)控系統(tǒng)整體性能;d)支持可伸縮性視頻編碼(SVC),對視頻數據分層次編碼,滿足不同傳輸網絡帶寬和數據存儲環(huán)境的需求;e)支持代數碼書激勵線性預測(ACELP)和變換音頻編碼(TAC)切換的雙核音頻編碼,既保證對語音信號具有較好的編碼效果,也保證環(huán)境(背景)聲音的編碼效果;f)支持聲音識別特征參數的編碼,避免編碼失真對語音識別和聲紋識別的影響;g)支持絕對時間參考信息、特殊監(jiān)控事件等監(jiān)控專用信息。監(jiān)控專用信息通過專門語法與視音頻h)支持數據安全保護,規(guī)定加密和認證接口及數據格式,保證數據的安全性、完整性和非否認性。既保證格式的統(tǒng)一,便于互聯互通,也保留足夠的擴展靈活性,支持更高性能的加密和認證方式的增加和擴充。相關專利情況說明本文件的發(fā)布機構提請注意,聲明符合本文件時,可能涉及與、、、本文件的發(fā)布機構對于該專利的真實性、有效性和范圍無任何立場。該專利持有人已向本文件的發(fā)布機構表示,他愿意同任何申請人在合理且無歧視的條款和條件下,就專利授權許可進行談判。該專利持有人的聲明已在本文件的發(fā)布機構備案。相關信息可以通過以下聯系方式獲得:專利持有人名稱北京中星微電子有限公司北京海淀學院路35號世寧大廈(100191)北京中盾安全技術開發(fā)公司北京海淀區(qū)首體南路1號(100048)中星電子股份有限公司天津經濟技術開發(fā)區(qū)第四大街80號天大科技園A1座2層(300457)清華大學北京海淀區(qū)清華園(100084)數維科技(北京)有限公司北京海淀區(qū)中關村南大街2號(100086)武漢大學湖北武漢市武漢大學(430079)通訊地址:北京海淀區(qū)學院路35號世寧大廈16層通訊地址:北京海淀區(qū)首體南路1號請注意除上述專利外,本文件的某些內容仍可能涉及專利。本文件的發(fā)布機構不承擔識別這些專V1GB/T25724—2010安全防范監(jiān)控數字視音頻編解碼技術要求1范圍本標準規(guī)定了安全防范領域監(jiān)控應用的數字視音頻編碼、解碼過程的技術要求。本標準適用于安全防范領域的視音頻實時壓縮、傳輸、播放和存儲等業(yè)務,對于其他需要視音頻編解碼的領域也可參考采用。2規(guī)范性引用文件下列文件中的條款通過本標準的引用而成為本標準的條款。凡是注日期的引用文件,其隨后所有的修改單(不包括勘誤的內容)或修訂版均不適用于本標準,然而,鼓勵根據本標準達成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標準。GB/T20090.2—2006信息技術先進音視頻編碼第2部分:視頻下列術語、定義和縮略語適用于本標準。3.1術語和定義“Z”字形掃描zig-zagscan變換系數從較低的空域頻率到較高空域頻率(近似)的一個明確排列順序?!癦”字形掃描用于幀宏塊中的變換系數。B條帶Bslice根據同一條帶內的已解碼樣點利用幀內預測進行解碼,或者根據先前解碼的參考圖像利用雙向預測進行解碼的條帶,對每個塊進行幀間預測時最多使用兩個運動矢量和參考索引。I條帶Islice根據同一條帶內的已解碼樣點利用幀內預測進行解碼的條帶。P條帶Pslice根據同一條帶內的已解碼樣點利用幀內預測進行解碼,或者根據先前解碼的參考圖像利用前向預測進行解碼的條帶,對每個塊進行幀間預測時最多使用一個運動矢量和參考索引。NAL單元NALunit一個語法結構,包含后續(xù)數據的類型指示和所包含的字節(jié)數,數據以RBSP形式出現,必要時其中還包括認證數據及散布的防偽字節(jié)。NAL單元流NALunitstream由NAL單元組成的序列。2GB/T25724—2010某些語法元素的特定取值,供中國安全防范監(jiān)控數字視音頻編解碼技術標準工作組將來使用。符合本標準的比特流不應使用這些值,但是這些值將來可能在本標準的擴展版本中用到。閉環(huán)基音搜索closed-looppitchsearch即自適應碼書搜索,從加權輸入信號和長時預測濾波器狀態(tài)估計基音延遲的過程。編碼視音頻及其相關數據,構成一個或多個編碼視音頻序列的比特序列。比特流既可用來表示頻率域的標量,與解碼過程的反變換部分中一個特定的一維或二維頻率索引相關聯的系數。變換系數幅值transformcoefficientlevel一個與特定二維頻率索引相關聯的整數量值,解碼過程中用于計算變換系數的值。編碼場codedfield一個場的編碼表示。編碼過程encodingprocess產生符合本標準的比特流的過程,本標準對視頻編碼過程不做規(guī)定。實現編碼過程的實體,包括軟件及硬件。編碼視頻序列codedvideosequence按照解碼順序排列的IDR圖像和緊隨其后的零個或多個非IDR圖像組成的圖像序列。編碼條帶NAL單元codedsliceNALunit包含編碼圖像的一個條帶的NAL單元。一幅圖像的編碼表示。一個編碼圖像可以是一個編碼場,也可以是一個編碼幀。編碼圖像緩存區(qū)codedpicturebuffer一個先入先出緩存區(qū),其存儲方式按解碼順序排列。編碼幀codedframe一個幀的編碼表示。樣點或數據元素預測值與解碼值之間的差值。3參考場referencefield一個標記為參考圖像的場,用于編碼場中P條帶和B條帶的解碼過程中的幀間預測。參考圖像的索引。參考圖像referencepicture對解碼順序上后續(xù)圖像的解碼過程進行幀間預測的樣點圖像。參考幀referenceframe一個標記為參考圖像的幀,用于編碼幀中的P條帶和B條帶的解碼過程中的幀間預測。序列參數集、圖像參數集或安全參數集中的一個語法元素。參數也用于量化參數一詞中。沒有分支等級關系中的一組句法結構。高層包含低層。編碼層指編碼圖像序列層、圖像層、條帶層和宏塊層。對于可伸縮性視頻編碼圖像,不同層的圖像具有不同的可伸縮性(如不同的空間分辨率)。一幀中的相隔行的集合。一幀由兩場組成,包括一個頂場和一個底場。所包含的樣點僅來自一個編碼場的宏塊。一個編碼場的所有宏塊均為場宏塊。變換系數的排列順序。與“Z”字形掃描順序不同的是,它對列的掃描快于對行的掃描。場掃描用于場宏塊中的變換系數。代數碼書algebraiccodebook脈沖幅度和位置組成的一個集合。通過碼字索引k按照一定的規(guī)則得到第k個激勵碼矢量的脈沖幅度和位置。本標準中的一個特定語法子集。底場bottomfield組成幀的兩個場中的一個。底場的每一行在空間位置上均位于其對應的頂場行的下面。電導頻譜對immittancespectralpair線性預測系數的變換稱為電導頻譜對。將逆濾波器傳輸函數A(z)分解為一個偶對稱和一個奇對稱多項式函數,該函數在單位圓上的根,即電導頻譜對。4GB/T25724—20103.1.34頂場topfield組成幀的兩個場中的一個。頂場的每一行在空間位置上均位于其對應的底場行的上面。短時合成濾波器shorttermsynthesisfilter對聲道脈沖響應進行建模的濾波器。激勵信號通過該濾波器可得到合成信號。二進制位bin二進制位串中的1bit。二進制位串binstring一串二進制位。二進制位串為二值化的語法元素值的二進制表示。語法元素所有可能值與一組二進制位串之間的唯一映射。反變換inversetransform解碼過程的一部分,將變換系數矩陣轉換為空域樣點矩陣的過程。一個字節(jié),其值等于0x03,可能在NAL單元中出現。防偽字節(jié)的出現可以保證在NAL單元的后續(xù)字節(jié)對齊的字節(jié)流中不會含有起始碼前綴。非參考圖像non-referencepicture不用于對任何其他圖像進行幀間編碼的圖像。圖像的三個樣點矩陣(一個亮度矩陣,兩個色度矩陣)中的一個矩陣或矩陣中的單個樣點。在音頻部分,也指矢量中的元素或信號中的某些頻率成分。感知加權濾波perceptualweightingfilter利用共振峰處的噪聲掩蔽特性,在共振峰區(qū)域分配比較大的失真,來減少峰谷主觀感覺噪聲的濾波。信號通過傅立葉變換后得到幅度譜的平方。矩形二維圖像到一維圖像的映射過程,一維圖像的第一組值來自于二維圖像最上邊一行的從左到右掃描,然后依次是第二行、第三行等。對于圖像每行(由上到下)都是從左到右掃描的。宏塊macroblock一個16×16的亮度樣點塊和相應的兩個色度樣點塊。5編碼幀中,宏塊索引為幀圖像的宏塊光柵掃描順序的序號,起始序號為0。編碼場中,宏塊索引為場圖像的宏塊光柵掃描順序的序號,起始序號為0。使用顯示順序上在后的解碼圖像中的樣點對當前圖像中的樣點進行預測。將一個集合分為子集的過程。集合中的每個元素屬于且只屬于某一個子集?;緦訄D像baselayerpicture不需要參考其他圖像層信息即可以解碼的圖像。級別level本標準中的一個特定檔次中的參數取值的限定集合。一個檔次可以包含一個或多個級別。對所有檔次定義了一組相同的級別,不同檔次的每個級別大部分特性都是通用的。對于一個獨立的實現,在一定的約束條件下,可以支持多個級別。即時解碼刷新(IDR)圖像instantaneousdecodingrefresh(IDR)picture一幅編碼圖像,其中所有條帶為I條帶。IDR圖像解碼之后,解碼順序上所有后續(xù)的編碼圖像都可以不用根據任何在IDR圖像之前解碼的圖像來進行幀間預測解碼。每個編碼視頻序列的第一幅圖像為IDR圖像。假設參考解碼器hypotheticalreferencedecoder一個假設的解碼器模型,規(guī)定了對于符合本標準的NAL單元流或字節(jié)流的可變性的約束。解碼過程decodingprocess讀入編碼的比特流后產生解碼圖像或者音頻數據的過程。解碼順序decodingorder解碼過程中處理語法元素的順序。解碼圖像decodedpicture通過解碼一幅編碼圖像得到的圖像。一幅解碼圖像既可以是一個解碼幀,也可以是一個解碼場。一個解碼場可以是頂場,也可以是底場。解碼圖像緩存區(qū)decodedpicturebuffer保存解碼圖像的緩存區(qū),用于附錄A中規(guī)定的預測參考、輸出重排序或輸出延時等。6開環(huán)基音搜索open-looppitchsearch直接從加權輸入信號中估計最優(yōu)基音延遲的過程。開環(huán)基音搜索簡化了基音分析,并且將閉環(huán)基音搜索限定在開環(huán)基音搜索的延遲值附近。可變長度編碼variablelengthcoding可逆的熵編碼過程,為出現概率大的符號分配較短的碼字,為出現概率小的符號分配較長的碼字??缮炜s性視頻編碼scalablevideocoding編碼序列中的圖像具有一定的可伸縮性。具有可伸縮性的圖像通常包含基本層圖像和增強層圖像。在視頻信號空間中,指一個M×N(M列N行)的樣點矩陣,或者一個M×N的變換系數矩陣。在音頻信號空間中,指一個一維矢量。一個樣點矩陣或單個樣點,用于描述信號的單色表示。亮度所用符號為Y。量化參數quantizationparameter解碼過程中對變換系數幅值進行反量化時使用的參數。零輸入響應zeroinputresponse濾波器當前輸入為零時,由過去輸入而產生的輸出。美爾Mel一種非線性的頻率刻度,根據主觀音高進行劃分。美爾頻率倒譜系數Mel-frequencycepstralcoefficients用FFT將時域信號轉化到頻域,對其對數能量譜依照Mel刻度分布的三角濾波器組進行卷積,對各個濾波器的輸出構成的向量進行DCT得到的系數,即美爾頻率倒譜系數。內部采樣頻率internalsamplingfrequency音頻編碼器的采樣頻率,范圍為12800Hz~38400Hz,采用F,表示。逆濾波器inversefilter去除信號短時相關性的濾波器。與解碼過程中反變換之前的變換系數相關的一維或二維索引。起始碼前綴startcodeprefix字節(jié)流中唯一等于0x000001的3個字節(jié)的序列,作為每個NAL單元的前綴。解碼器可以利用起7始碼前綴的位置來確定一個新的NAL單元的開始和前一個NAL單元的結束。NAL單元中通過加入防偽字節(jié)來防止假冒的起始碼前綴出現。前向預測forwardprediction使用顯示順序上在前的解碼圖像中的樣點對當前圖像中的樣點進行預測。P圖像幀間預測中只使用前向預測解碼的圖像。一個樣點矩陣或單個樣點,用于描述代表兩個相對于基色的色差信號中的一個。色度所用符號為Cb和Cr。一種熵編碼方法,根據上下文內容對二進制位進行編碼,產生比特流。聲紋識別voiceprintrecognition根據語音的聲學特征識別該段語音所對應的說話人的過程。3.1.77數據比特串stringofdatabits語法元素的若干比特位的序列,出現在原始字節(jié)序列負載中原始字節(jié)序列負載截止位之前。在SODB中,最左邊的比特位表示第一位即最高位,最右邊的比特位表示最后一位即最低位。雙向預測bidirectionalprediction使用顯示順序上在前及在后的解碼圖像中的樣點對當前圖像中的樣點進行預測。雙向幀間解碼圖像bidirectionalinterdecodedpictureB圖像幀間預測中使用雙向預測解碼的圖像。特定區(qū)域內部按照光柵掃描順序排列的整數個宏塊。雖然一個條帶包含區(qū)域內部按照光柵掃描順序排列的整數個宏塊,但這些宏塊在圖像內部并不一定是按照光柵掃描順序連續(xù)排列的。宏塊索引可以通過條帶的第一個宏塊的索引以及宏塊到條帶的映射得到。條帶頭sliceheader編碼條帶的一部分,包含與該條帶中第一個或者全部宏塊有關的數據元素。跳過宏塊skippedmacroblock沒有編碼數據的宏塊。3.1.838視頻,一幅圖像指一幀,或組成該幀的頂場或底場。圖像參數集pictureparameterset一個語法結構,包含應用于零個或多個編碼圖像的語法元素,由每個條帶頭中的語法元素pic_維納濾波器wienerfilter根據最小均方誤差準則,即濾波器的輸出信號與期望信號之差的均方值最小,計算得到的最佳線性濾波器,稱為維納濾波器。線性預測系數LPcoefficients短時預測濾波器系數,也稱為LPC系數。序列參數集sequenceparameterset一個語法結構,包含應用于零個或多個完整編碼視頻序列的語法元素,由條帶頭中的語法元素pic_parameter_set_id確定所引用的圖像參數集,由圖像參數集中的語法元素seq_parameter_set_id確定所引用的序列參數集。由若干音頻幀組成,目前本標準規(guī)定音頻超幀中只包含一個音頻幀。音頻幀的一部分,在F,/2采樣頻率下,由64個樣本構成的數據塊。解碼過程中連續(xù)出現的數據元素的數目。在某些上下文環(huán)境中,游程指“Z”字形掃描或場掃描后產生的變換系數數組中非0系數之前的0值變換系數的數目。使用預測值來提供當前解碼的樣點值或數據元素的估計。以前解碼的樣點值或數據元素的線性組合。零個或多個語法元素按照規(guī)定順序一起出現在比特流中。比特流中表示數據的元素。語音識別speechrecognition根據語音的聲學特征和語言模型,將該段語音翻譯為文本的過程。9編碼前視音頻素材或者素材的某些屬性。原始字節(jié)序列負載rawbytesequencepayload一個語法結構,包含整數個封裝于NAL單元中的字節(jié)。RBSP或者為空,或者包含具有數據比特串形式的語法元素,其后跟隨RBSP截止位和零個或多個連續(xù)的0值比特。原始字節(jié)序列負載(RBSP)截止位rawbytesequencepayload(RBSP)stopbit值為1的一個比特,出現在原始字節(jié)序列負載(RBSP)中的數據比特串之后。RBSP中數據比特串的結束位置可以通過搜索RBSP中的RBSP截止位得到。二維矢量,用于幀間預測,表示匹配對象在解碼圖像和參考圖像中的位置偏移。增強層圖像enhancelayerpicture需要參考其他圖像層信息進行解碼的圖像。本標準中的一個增強層圖像在解碼時可以參考位于其下的相鄰的圖像層信息,同時該增強層圖像的空間分辨率在水平和垂直方向上均為位于其下的相鄰的(用來參考的)圖像層的二倍。在視頻信號空間中由一個亮度樣點矩陣(Y)和兩個可能存在的色度樣點矩陣(Cb和Cr)構成。在音頻信號空間中,作為音頻處理的基本數據塊。在F,采樣頻率下,512個樣本構成一幀,在F,/2采樣頻率下,256個樣本構成一幀。幀宏塊framemacroblock一個編碼幀中的所有宏塊均為幀宏塊。使用幀間預測對塊、宏塊、條帶或圖像進行編碼。利用已解碼的參考圖像得到當前樣點的預測值的過程。幀內編碼intracoding使用幀內預測對塊、宏塊、條帶或圖像進行編碼。3.1.106幀內解碼圖像intradecodedpictureI圖像只使用幀內預測解碼的圖像。利用同一圖像中已解碼的樣點得到當前樣點的預測值的過程。連續(xù)的8bit,讀寫時左邊第一位為最高位,右邊第一位為最低位。表示為比特序列時,字節(jié)的最高有效位為第一位。從比特流的第一個比特開始的8的倍數的位置為字節(jié)對齊的位置。比特或字節(jié)或語法元素為字節(jié)對齊的,指它出現在比特流中字節(jié)對齊的位置上。NAL單元流的封裝,包含起始碼前綴和附錄B定義的NAL單元。3.1.111自適應碼書adaptivecodebook通過長時預測濾波器狀態(tài)得到的碼書,由每個子幀自適應的激勵矢量構成。音頻信號的直流分量。3.2縮略語ACELPAlgebraicCodeExcitedLinearPrediction代數碼書激勵線性預測BWEBandwidthExtension帶寬擴展CABACContextAdaptiveBinaryArithmeticCoding上下文自適應二進制算術編碼CBRConstantBitRate恒定比特率CPBCodedPictureBuffer編碼圖像緩存區(qū)CRCCyclicRedundancyCode循環(huán)冗余校驗碼DCTDiscreteCosineTransform離散余弦變換DFTDiscreteFourierTransform離散傅立葉變換DPBDecodedPictureBuffer解碼圖像緩存區(qū)FFTFastFourierTransform快速傅立葉變換FIRFiniteImpulseResponse有限沖擊響應HRDHypotheticalReferenceDecoder假設參考解碼器IDCTInverseDiscreteCosineTransform離散余弦逆變換IDFTInverseDiscreteFourierTransform離散傅立葉逆變換IDRInstantaneousDecodingRefresh即時解碼刷新IFFTInverseFastFourierTransform快速傅立葉逆變換ISFImmittanceSpectralFrequency電導譜頻率ISPImmittanceSpectralPair電導譜對LPLinearPrediction線性預測LPCLinearPredictiveCoding線性預測編碼LSBLeastSignificantBit最低有效位LTPLongTermPredictor長時預測MAMovingAverage滑動平均MBMacroblock宏塊MFCCMel-FrequencyCepstralCoefficients美爾頻率倒譜系數MSBMostSignificantBit最高有效位MSVQMulti-StageVectorQuantization多級矢量量化NALNetworkAbstractionLayer網絡抽象層PCMPulseCodeModulation脈沖編碼調制RBSPRawByteSequencePayload原始字節(jié)序列負載ROIRegionOfInterest感興趣區(qū)域SEISupplementEnhancementInformation補充增強信息SNRSignalNoiseRatio信噪比SODBStringOfDataBits數據比特串SVCScalableVideoCoding可伸縮性視頻編碼TACTransformAudioCoding變換域音頻編碼TVCTransformVectorCoding變換域矢量編碼VADVoiceActivityDetection語音活動檢測VBRVariableBitRate可變比特率VCLVideoCodingLayer視頻編碼層VLCVariableLengthCoding可變長度編碼VQVectorQuantization矢量量化VUIVideoUsabilityInformation視頻可用性信息4約定4.1算術運算符算術運算符定義見表1。1+加法運算2一減法運算(二元運算符)或取反(一元前綴運算符)3×乘法運算4×卷積運算5x°指數運算,表示x的y次冪。在不是表示指數的情況下也可表示上標6/除法運算,不做截斷或四舍五入7÷除法運算,不做截斷或四舍五入8除法運算,不做截斷或四舍五入9自變量i取由x到y(tǒng)(含y)的所有整數值時,函數f(i)的累加和模運算,x除以y的余數,其中x與y都是正整數在沒有以插入括號來明確指定運算優(yōu)先次序的情況下,遵守如下規(guī)則:——乘法和除法運算先于加法和減法運算;——乘法和除法運算從左到右進行;——加法和減法運算從左到右進行。4.2邏輯運算符邏輯運算符定義見表2。表2邏輯運算符定義1&.&.邏輯“與”運算2H邏輯“或”運算3!邏輯“非”運算4x?y:z如果x為真或非0值,則取值為y;否則取值為z4.3關系運算符關系運算符定義見表3。表3關系運算符定義1>大于2大于或等于3<小于4小于或等于5等于6不等于4.4位運算符位運算符定義見表4。表4位運算符定義1&.果兩個二進制運算數中一個位數小于另外一個,則較短的運算數高位加0補齊2l果兩個二進制運算數中一個位數小于另外一個,則較短的運算數高位加0補齊3x》y將x以2的補碼整數表示的形式向右移y位。僅當y取非負數時定義此運算。右移運算移入MSB的位應該等于移位運算前x的MSB的值4x<y將y以2的補碼整數表示的形式向左移y位。僅當y取非負數時定義此運算。左移運算移入LSB的位值為04.5賦值運算符賦值運算定義見表5。表5賦值運算定義1賦值運算符2十十遞增,例如x++相當于x=x+1;當用于數組下標時,在自加運算前先求變量值3遞減,例如x——相當于x=x-1;當用于數組下標時,在自減運算前先求變量值4自加指定值,例如x+=3相當于x=x+3,x+=(-3)相當于x=x+(-3)5自減指定值,例如x-=3相當于x=x-3,x-=(-3)相當于x=x-(-3)4.6數學函數數學函數計算公式如下:GB/T25724—2010Ceil(x)取不小于x的最小整數Clip1Y(x)=Clip3(0,(1<BitDepthY)-1,x)CliplC(x)=Clip3(0,(1<BitDepthC)-1,x)Cos(x)表示x的余弦函數表示從M個數中取出N個數的組合數Exp(x)表示e的x次冪Floor(x)取不大于x的最大整數Ln(x)取以e為底的x的對數Logio(x)取以10為底的x的對數Median(x,y,z)=x+y+z-Min(x,Min(y,z))-Max(x,Max(y,z))Round(x)=Sign(x)×Floor(Abs(x)+0.5)Sin(x)表示x的正弦函數4.7語法元素、變量和表語法元素在比特流中以粗體字出現。當表格或正文中用到某個語法元素的值時,則以常規(guī)字體出現。每個語法元素均表示為名稱(所有字母小寫,以下劃線連接),和一到兩個代表其編碼表示方式的描述符。解碼過程根據語法元素以及之前已解碼的語法元素的取值進行解碼。某些情況下語法表可能使用根據語法元素值導出的其他變量的值。這些變量出現在語法表或正文中,以小寫和大寫混合的形式命名,并且名稱中不含下劃線。以大寫字母開頭的變量是根據當前語法結構和所有相關語法結構的解碼導出的。在某些情況下,語法元素值或變量值的識記名稱與其數值等同。有時,識記名稱與其值無關。二者的關聯在正文中做出規(guī)定。識記名稱由一組或多組字母由下劃線連接而成。每組字母均以大寫字母開頭,可包括多個大寫字母。函數用名稱來描述,函數名由語法元素名稱和左右圓括號中的零個或多個以逗號(若有多個變量時)分隔的變量名稱(用于定義)或值(用于使用)構成。一維的陣列稱為數組,二維的陣列稱為矩陣。陣列可以是語法元素,也可以是變量。下標或方括號可用來表示一個陣列的索引。對于一個矩陣,第一個下標為行(垂直)索引,第二個下標為列(水平)索引。使用方括號表示時,索引的順序則正好相反。比如,一個矩陣S中的水平位置x和垂直位置y上的元素可表示為S[x,y]或Sg。單引號之間的一串比特值為二進制符號。例如,‘10000100’表示一個第一位和倒數第三位等于1的8比特串。十六進制符號,以前綴“0x”表示,當所表示的比特位數為4的整數倍時可替代二進制符號使用。例如,“0x84”表示一個第一位和倒數第三位等于1的8比特串。不使用單引號括起來的或不帶前綴“0x”的數值為十進制值。條件語句中等于0的值代表假(FALSE)的情況。用其他非零值代表真(TRUE)。4.8邏輯運算符的文字描述在正文中,含有邏輯運算符的下列偽碼語句:if(條件0)語句0elseif(條件1)語句1……………else/*解釋其他情況的注釋*/語句n可描述如下:——如果條件0,則語句0——否則,如果條件1,語句1——否則(說明性文字,表示其他情況),語句nif(條件0a&&條件0b)語句0語句1……………語句n可描述如下:——如果下列所有條件為真,聲明0——條件0a——條件0b——否則,如果下列任何一個條件為真,聲明1——條件la——條件1b…………if(條件0)聲明0if(條件1)聲明1——當條件0時,聲明0——當條件1時,聲明1過程用于描述語法元素的解碼。所有屬于當前語法結構的語法元素和大寫的變量,以及相關的語法結構,在過程的規(guī)范和調用中都是可用的。過程的規(guī)范中可能還含有明確指定為輸入的小寫的變量。每個規(guī)范均明確地規(guī)定了輸出。輸出可以是大寫的變量,也可以是小寫的變量。5視頻部分5.1編碼比特流和輸出數據的格式5.1.1比特流格式本條規(guī)定NAL單元流和字節(jié)流之間的關系,二者均稱為比特流。NAL單元流格式由一系列稱為NAL單元的語法結構組成,按照解碼順序排序。NAL單元流中NAL單元的解碼順序和內容是受約束的。字節(jié)流可以用NAL單元流構造,通過將NAL單元按照解碼順序排列,并且為每個NAL單元添加一個起始碼前綴和若干零值字節(jié)形成一個字節(jié)流。NAL單元流格式可以通過在字節(jié)流中搜索唯一的起始碼前綴,從字節(jié)流格式中提取出來。除字節(jié)流格式以外,構造NAL單元的其他方法,本標準不做規(guī)定。字節(jié)流格式在附錄B中規(guī)定。5.1.2圖像格式本條規(guī)定由比特流確定的源與已解碼幀和場之間的關系。比特流所表示的視頻源是一系列按解碼順序排列的幀或場或幀場的組合。每個源或已解碼圖像(幀或場)都是由一個或多個視頻樣點陣列組成的: ——亮度和兩個色度(YCbCr)的陣列;——綠、藍和紅(GBR,也稱為RGB)的陣列;——表示其他未定義的單色或三基色樣點(例如YZX,也稱為XYZ)的陣列。為了便于標記和命名,本標準不考慮實際使用的顏色表示方法,與這些陣列相關的變量和詞語均指亮度和色度,亮度陣列用Y表示,兩個色度陣列分別用Cb和Cr表示。本標準支持的色彩格式有4:0:0(單色),4:2:0和4:2:2,見表6。變量SubWidthC和SubHeightC在表6中規(guī)定,它們取決于通過chroma_format_idc表示的色度chroma_format_idcSubWidthCSubHeightC04:0:0(單色) 14:2:02224:2:221注:“一”表示SubWidthC或SubHeightC的值未定義。在單色采樣中只有一個樣點陣列,名義上當作亮度陣列。亮度陣列的高度和寬度為16的整數倍。在4:2:0格式下,兩個色度陣列的高度和寬度均為亮度陣列的一半;色度陣列的高度和寬度為8的整數倍。在4:2:2格式下,兩個色度陣列的高度等于亮度陣列的高度,寬度為亮度陣列的一半;色度陣列的寬度為8的整數倍,高度為16的整數倍。如果作為兩場獨立編碼,整幀圖像的亮度陣列的高度為32的整數倍,4:2:0格式下色度矩陣的高度為16的整數倍,而4:2:2格式下色度矩陣的高度為32的整數倍。除非特別說明,亮度和色度(當出現時)陣列的語法順序為:當三個分量的數據都出現時,首先是亮度陣列的數據,然后是Cb陣列數據,最后是Cr陣列數據。對于使用同一個序列參數集編碼的場和幀,它們寬度相同,場的高度是幀的一半。視頻序列中用來表示每個亮度或色度樣點的比特位數至少為8,表示亮度陣列樣點的比特位數和表示色度陣列樣點的比特位數可能不相同。在4:2:0格式下,一幀中亮度和色度樣點的垂直和水平相對位置如圖1所示。圖1幀圖像中4:2:0亮度和色度樣點垂直和水平位置一幅編碼圖像可以是一個編碼幀,也可以是一個編碼場。符合本標準的編碼視頻序列可能含有編碼幀和編碼場的組合。場編碼圖像分為兩類:頂場和底場。幀中序號為0(最上行)、2、4……的行為頂場行,幀中序號為1、3、5……的行為底場行。頂場由幀中所有的頂場行組成,底場由幀中所有底場行組成。也就是說,一幀圖像也可以由一個頂場和一個底場組成。如果以場的形式顯示,應先顯示頂場,后顯示底場。當兩場同時顯示,或者聯合起來被用做參考幀時,它們是以幀的形式交織在一起的。如果一個解碼幀的頂場或底場被用做參考場,這時僅使用該解碼幀中的頂場行或底場行。在4:2:0格式下,頂場和底場中亮度和色度樣點的垂直和水平相對位置如圖2所示。頂場中色度樣點的垂直樣點位置相對于場的采樣格點上移四分之一個亮度樣點的高度。底場中色度樣點的垂直位置相對于場的采樣格點下移四分之一個亮度樣點的高度。×——亮度樣點的位置;O——色度樣點的位置。圖2頂場和底場中4:2:0亮度和色度樣點的垂直和水平位置GB/T25724—2010在4:2:2格式下,色度樣點和對應的亮度樣點處于同一位置上,幀和場中的樣點位置分別如圖3和圖4所示?!痢炼葮狱c的位置;O——色度樣點的位置。圖3幀圖像中4:2:2亮度和色度樣點的垂直和水平位置×——亮度樣點的位置;O——色度樣點的位置。圖4頂場和底場中4:2:2亮度和色度樣點的垂直和水平位置一幀圖像中左上角亮度樣點的位置坐標(x,y)為(0,0),樣點每右移一列,x的取值增加1,樣點每樣點是以宏塊為單元進行處理的。每個宏塊中的樣點陣列的高和寬均為16個樣點。變量MbWidthC和MbHeightC分別規(guī)定了每個宏塊中色度陣列的寬度和高度,其推導過程如下: 如果chromaformatidc等于0,則MbWidthC和MbHeightC均為0(單色視頻沒有色度陣列);——否則,MbWidthC和MbHeightC按下式得到:MbWidthC=16/SubWidthCMbHeightC=16/SubHeightC5.1.3圖像和條帶的空間分割條帶的劃分本條規(guī)定一幅圖像如何分割為條帶和宏塊。圖像被劃分為條帶,條帶由一系列的宏塊組成。GB/T25724—2010每個宏塊均包含一個16×16的亮度陣列,當色彩格式不是單色時,還包含兩個相應的色度陣列。每個宏塊代表圖像中的一個空間矩形區(qū)域。如圖5所示,一幅圖像被分為兩個條帶。圖5分割為兩個條帶的11×9個宏塊的圖像當roi_flag等于1時,一幀圖像被分為一個背景區(qū)域和num_roi個感興趣區(qū)域(ROI)。每個ROI是一個由top_left和bottom_right所規(guī)定的矩形區(qū)域,不同ROI不應重疊。每個條帶由同一區(qū)域內的為16×32樣點陣列的整倍數,同時ROI中左上角亮度樣點的位置坐標(x?,yo)和右下角的位置坐標(x?,y?)應滿足下述條件:圖6包含ROI的圖像條帶分割當roi_flag等于0時,一個條帶由圖像內按光柵掃描順序排列的連續(xù)宏塊組成。當roi_flag等于1時,一個條帶由所在區(qū)域內按光柵掃描順序排列的連續(xù)宏塊組成。一個視頻序列中的所有圖像條帶的解碼順序應與其編碼順序及在碼流中的傳送順序相同。宏塊的劃分宏塊左上角的點不應超出圖像邊界。在比特流中,當圖像以編碼場的形式出現時,任一宏塊的樣點應來自同一場。宏塊的劃分如圖7所示,這種劃分用于運動補償。圖7中矩形里的數字表示宏塊劃分后運動矢量和參考索引在編碼視頻序列中的順序。01宏塊劃分01宏塊劃分2個16×8亮度塊和相應的色度塊2個8×16亮度塊和相應的色度塊4個8×8亮度塊和相應的色度塊0123圖7宏塊的劃分在4:2:0格式下,一個宏塊包括4個8×8亮度塊(Y)和2個8×8色度塊(1個Cb,1個Cr)。如圖8所示,圖中數字為宏塊中8×8塊在編碼視頻序列中的順序。圖8宏塊劃分為8×8塊(4:2:0格式)在4:2:2格式下,一個宏塊包括4個8×8亮度塊(Y)和4個8×8色度塊(2個Cb,2個Cr)。如圖9所示,圖中數字為宏塊中8×8塊在編碼視頻序列中的順序。圖9宏塊劃分為8×8塊(4:2:2格式)一個8×8亮度塊可能會被劃分為4個4×4子塊。如圖10所示,圖中數字為4×4塊在編碼視頻序列中的順序。Y圖10相鄰塊可用性的推導過程8×8亮度塊劃分為4×4子塊之間的空間位置如圖11所示。如果E屬于一個場宏塊,A、B、C和D為同一場圖像中與E相鄰的塊。E的大小可以是16×16、16×8、8×16、8×8或者4×4。塊A是塊E的左邊塊,塊B是塊E的上邊塊。設塊E左上角樣點在圖像中的坐標是(x?,yo),右上角樣點在圖像中的坐標是(x?,y?),塊X(X為A、B、C或D)為表7中列出的樣點所屬的塊。表7中坐標均為樣點在幀圖像中的位置坐標。圖11塊E和相鄰塊的空間位置關系field_pic_flag塊A右上角樣點位置塊B左下角樣點位置塊C左下角樣點位置塊D右下角樣點位置10如果一相鄰塊X(X為A、B、C或D)在圖像內并且該塊與當前塊E屬于同一條帶,則該相鄰塊標記為存在;否則該相鄰塊標記為不存在。如果一相鄰塊標記為不存在或者尚未解碼,則該塊標記為不可用;否則該塊標記為可用。如果某樣點所在的塊標記為不存在或者該樣點尚未解碼,則該樣點標記為不可用;否則該樣點標記為可用。5.2語法和語義5.2.1以表格形式描述語法的方法語法表格規(guī)定了所有允許的比特流的超集。附加的語法限定可能在其他條中直接或間接規(guī)定。注:實際的解碼器宜有識別比特流入口點的方法,并且可以分辨和處理不一致的比特流。分辨和處理錯誤以及類似情形的方法不在本標準中描述。表8給出了描述語法的偽代碼例子。規(guī)定了當syntax_element出現時,從比特流中解析語法元素,并將指針移向比特流中下一個語法元素位置上的過程。表8偽代碼例程表描述符/*語句可以是一個關聯某一語法類別的語法元素和描述符,或者用于說明語法元素的存在、類型和數值的表達式,下面給出兩個例子。*/syntax_elementue(v)條件語句/*花括號括起來的語句組是復合語句,在功能上視作單個語句。*/{語句語句}/*“while”語句測試條件是否為TRUE,如果為TRUE,則重復執(zhí)行循環(huán)體,直到條件不為TRUE。*/while(條件)語句/*“do…while”語句先執(zhí)行循環(huán)體一次,然后測試條件是否為TRUE,如果為TRUE,則重復執(zhí)行循環(huán)體,直到條件不為TRUE。*/語句while(條件)表8(續(xù))描述符/*“if…else”語句首先測試條件,如果為TRUE,則執(zhí)行主要語句,否則執(zhí)行另選語句。如果另選語句不需要執(zhí)行,結構的“else”部分和相關的另選語句可忽略。*/if(條件)主要語句另選語句/*“for”語句首先執(zhí)行最初語句,然后測試條件,如果條件為TRUE,則重復執(zhí)行主要語句和隨后語句直到條件不為TRUE。*/for(最初語句;條件;隨后語句)主要語句5.2.2語法函數和描述符的規(guī)范語法函數的規(guī)范以下函數用于語法描述。這些函數假定解碼器中存在一個比特流指針,這個指針指向比特流中解碼過程要讀取的下一個比特的位置。byte_aligned()的規(guī)定如下:——如果比特流的當前位置是在字節(jié)的邊界,即比特流中的下一個比特是字節(jié)的第一個比特,那么byte_aligned()的返回值為TRUE;——否則,byte_aligned()的返回值為FALSE。more_data_in_byte_stream(),在附錄B規(guī)定的字節(jié)流NAL單元語法結構中使用,規(guī)定如下:——如果字節(jié)流中后續(xù)還有更多數據,more_data_in_byte_stream()的返回值為TRUE;——否則,more_data_in_byte_stream()的返回值為FALSE。more_rbsp_data()的規(guī)定如下:——如果在rbsp_trailing_bits()之前的RBSP中有更多數據,more_rbsp_data()的返回值為TRUE;——否則,more_rbsp_data()的返回值為FALSE。判斷RBSP中是否有更多數據的方法由應用規(guī)定。next_bits(n)提供比特流中接下來的n個比特,不改變比特流指針。該函數使比特流中的下n個比特可見,n在這里是函數的參數。當用在附錄B規(guī)定的字節(jié)流中時,如果剩余的字節(jié)流已不足n個比read_bits(n)從比特流中讀取下面的n個比特,并且將比特流指針向前移動n個比特。當n等于0時,read_bits(n)的返回值為0并且不移動比特流指針。描述符的規(guī)范下述描述符規(guī)定了每個語法元素的解析過程。對于某些語法元素,使用通過豎線分開的兩個描述符。在這些情況下,左邊的描述符在entropy_coding_mode_flag等于0的時候有效,右邊的描述符在entropy_coding_mode_flag等于1的時候有效:——ae(v):上下文自適應二進制算術編碼語法元素。該描述符的解析過程在5.4.3中規(guī)定;——b(8):任意形式的8比特字節(jié)。該描述符的解析過程通過函數read_bits(8)的返回值來規(guī)定;——ce(v):可變長度熵編碼語法元素。該描述符的解析過程在中規(guī)定;——f(n):n位比特串(由左至右),左位在先,該描述符的解析過程通過函數read_bits(n)的返回值來規(guī)定;——i(n):n位有符號整數。在語法表中,如果n是‘v’,其比特數由其他語法元素值確定。解析過程由函數read_bits(n)的返回值規(guī)定,該返回值用最高有效位在前的2的補碼表示;——me(v):映射的指數哥倫布碼編碼的語法元素,左位在先。解析過程在中定義;——se(v):有符號整數指數哥倫布碼編碼的語法元素,左位在先。解析過程在中定義;——u(n):n位無符號整數。在語法表中,如果n是‘v’,其比特數由其他語法元素值確定。解析過程由函數read_bits(n)的返回值規(guī)定,該返回值用最高有效位在前的二進制表示;——ue(v):無符號整數指數哥倫布碼編碼的語法元素,左位在先。解析過程在中定義。5.2.3以表格形式表示的語法NAL單元語法NAL單元語法見表9。表9NAL單元語法表nal_unit(NumBytesInNALunit){描述符forbidden_zero_bitnal_ref_idcu(1)nal_unit_typeu(4)u(1)authentication_idcu(1)NumByteslnHeader=1if(authentication_idc){authentication_data_length_minus2u(8)NumBytesInHeader+=1}NumBytesInPayload=0for(i=NumBytesInHeader;i<NumBytesInNALunit;i++){if(i+2<NumBytesInNALunit&&next_bits(24)==0x000003){payload_byte[NumByteslnPayload++]b(8)payload_byte[NumBytesInPayload++]b(8)emulation_prevention_three_byte/*應等于0x03*/}payload_byte[NumByteslnPayload++]b(8)}}RBSP語法.1序列參數集RBSP語法序列參數集RBSP語法見表10。表10序列參數集RBSP語法表描述符profile_idu(8)level_idu(8)seq_parameter_set_idue(v)chroma_format_idcu(2)bit_depth_luma_minus8ue(v)bit_depth_chroma_minus8ue(y)pic_width_in_mbs_minuslue(v)pic_height_in_mbs_minus1ue(v)progressive_seq_flagu(1)roi_flagu(1)sve_flagu(1)vui_parameters_present_flagu(1)if(vui_parameters_present_flag)vui_parameters()rbsp_trailing_bits()}.2圖像參數集RBSP語法圖像參數集RBSP語法見表11。表11圖像參數集RBSP語法表pic_parameter_set_rbsp(){描述符pic_parameter_set_idue(y)seq_parameter_set_idue(v)entropy_coding_mode_flagu(1)pic_init_qpu(v)if(roi_flag){ue(v)if(num_roi>0){non_roi_skip_flagu(1)if(!non_roi_skip_flag&&sve_flag)u(1)pic_init_qp_for_roiu(v)for(i=0;i<num_roi;i++){ue(v)bottom_right[i]ue(v)}表11(續(xù))pic_parameter_set_rbsp(){描述符fixed_pic_qpu(1)weighting_pred_flagu(1)loop_filter_disable_flagu(1)rbsp_trailing_bits()}.3安全參數集RBSP語法安全參數集RBSP語法見表12。表12安全參數集RBSP語法表sec_parameter_set_rbsp(){描述符encryption_flagu(1)authentication_flagu(1)if(encryption_flag)encryption_typeu(4)if(authentication_flag){hashtypeu(4)hash_hierarchy_flagu(1)hash_discardppicturesu(1)hashdiscardbpicturesu(1)hash_discard_extension_datau(1)u(4)if(signature_type>0){successive_hash_pictures_miu(8)signature_data_lengthu(8)}rbsp_trailing_bits()}.4補充增強信息RBSP語法補充增強信息RBSP語法見表13。表13補充增強信息RBSP語法表sei_rbsp(){描述符sei_message()表13(續(xù))sei_rbsp(){描述符while(more_rbsp_data())rbsp_trailing_bits()}補充增強信息消息語法見表14。表14補充增強信息消息語法表sei_message(){描述符PayloadType=0while(next_bits(8)==0xFF)ff_byte/*應等于0xFF*/PayloadType+=255}u(8)PayloadType+=last_payload_type_bytePayloadSize=0while(next_bits(8)==0xFF){ff_byte/*應等于0xFF*/PayloadSize+=255}u(8)PayloadSize+=last_payload_size_bytesei_payload(PayloadType,PayloadSize)}.5序列結尾RBSP語法序列結尾RBSP語法見表15。表15序列結尾RBSP語法表描述符}.6流結尾RBSP語法流結尾RBSP語法見表16。表16流結尾RBSP語法表end_of_stream_rbsp(){描述符}.7編碼條帶RBSP語法編碼條帶RBSP語法見表17。表17編碼條帶RBSP語法表slice_layer_rbsp(){描述符slice_header()slice_data()rbsp_trailing_bits()}.8RBSP尾比特語法RBSP尾比特語法見表18。表18RBSP尾比特語法表rbsp_trailing_bits(){描述符rbsp_stop_one_bit/*應等于1*/while(!byte_aligned())rbsp_alignment_zero_bit/*應等于0*/}.9填充數據RBSP語法填充數據RBSP語法見表19。表19填充數據RBSP語法表filler_data_rbsp(){描述符while(next_bits(8)==0xFF)ff_byte/*應等于0xFF*/rbsp_trailing_bits()}條帶頭語法條帶頭語法見表20。表20條帶頭語法表slice_header(){描述符pic_parameter_set_idue(v)u(8)if(nal_unit_type==2l|nal_unit_type==4)idr_pic_idue(v)if(!progressive_seq_flag)(field_pic_flagu(1)if(field_pic_flag)bottom_field_flagu(1)}ue(v)ue(v)表20(續(xù))slice_header(){描述符if(!(slice_type==B&&!field_pic_flag)&&!(slice_type==I))picture_reference_flagu(1)if(!fixed_pic_qp){u(1)}if(slice_type!=I&&.weighting_pred_flag){u(1)if(slice_weighting_flag){num_of_references_minus1u(2)for(i=0;i<num_of_references;i++){u(8)luma_shiftmarker_bitu(8)chroma_shiftmarker_bit}mb_weighting_flagu(1)if(!loop_filter_disable){loop_filter_parameter_flagu(1)if(loop_filter_parameter_flag)slice_alpha_c0_offsetslice_beta_offset}}條帶數據語法條帶數據語法見表21。表21條帶數據語法表slice_data(){描述符if(entropy_coding_mode_flag)while(!byte_aligned())表21(續(xù))描述符cabac_alignment_one_moreDataFlag=1if(slice_type!=I){if(!entropy_coding_mode_flag){mb_skip_runue(v)moreDataFlag=more_rbsp_data()}else{mb_skip_flagae(v)moreDataFlag=!mb_skip_flag}}if(moreDataFlag){if(svc_flag&&(nal_unit_type==4||nal_unit_type==3))macroblock_scalable()macroblock()}if(!entropy_coding_mode_flag){moreDataFlag=more_rbsp_data()end_of_slice_flagae(v)moreDataFlag=!end_of_slice_flag}}while(moreDataFlag)}宏塊語法宏塊語法見表22。表22宏塊語法表macroblock(){描述符ue(v)|ae(v)if(MbType!=P_Skip&&.MbType!=B_Skip){if(MbType==B_8×8){macroblock(){描述符for(i=0;i<4;i++)mb_part_typeu(2)|ae(v)}if(MbType==I_8×8){for(i=0;i<4;i++){pred_mode_flagu(1)|ae(v)if(!pred_mode_flag)u(2)|ae(v)if(chroma_format_idc>0)ue(v)|ae(v)if(chroma_format_idc==2)ue(v)|ae(v)}for(i=0;i<16;i++){pred_mode_flagu(1)|ae(v)if(!pred_mode_flag)u(2)|ae(v)}if(chroma_format_idc>0)ue(v)|ae(v)if(chroma_format_idc==2)ue(v)|ae(y}if(slice_type==P|l(slice_type==B&&.field_pic_flag)&&!picture_reference_flag){for(i=0;i<MvNum;i++)mb_reference_indexu(1)|u(2)|ae(v)}for(i=0;i<MvNum;i++)(mv_diff_xse(v)|ae(v)mv_diff_yse(v)|ae(v)if(mb_weighting_flag)表22(續(xù))macroblock(){描述符weighting_predictionu(1)|ae(v)if(MbType!=I_8×8llentropy_coding_mode_flag)me(v)|ae(v)if(chroma_format_idc==2)me(v)|ae(v)if(MbType==I_4×4){for(i=0;i<4;i++)if(MbCBP&1<i)coded_block_pattern_4×4me(v)|ae(v)}if((MbCBP>0||MbCBP422>0)&.&.!fixed_slice_qp)mb_qp_deltase(v)|ae(v)for(i=0;i<CbNum;i++)block(i)}}可伸縮性視頻編碼(SVC)增強層宏塊語法SVC增強層宏塊語法見表23。表23SVC增強層宏塊語法表macroblock_scalable(){描述符ue(v)|ae(v)if(mb_type==I_4×4l|mb_type==I_8×8)u(1)|ae(v)if(!svc_mode_flag&&.MbType!=P_Skip&.&.MbType!=B_Skip)(if(MbType==B_8×8){for(i=0;i<4;i++)mbpart_typeu(2)|ae(v)}if(MbType==I_8×8){for(i=0;i<4;i++){u(1)|ae(v)if(!pred_mode_flag)u(2)|ae(v)}if(chroma_format_idc>0)表23(續(xù))macroblock_scalable(){描述符ue(v)|ae(v)if(chroma_format_idc==2)ue(v)|ae(v)if(MbType==I_4×4){for(i=0;i<16;i++){pred_mode_flagu(1)|ae(v)if(!pred_mode_flag)u(2)|ae(v)}if(chroma_format_idc>0)ue(v)|ae(v)if(chroma_format_idc==2)ue(v)|ae(v)if(slice_type==P||(slice_type==B&&field_pic_flag)&&.!picture_reference_flag){for(i=0;i<MvNum;i++)mb_reference_indexu(1)|u(2)|ae(v)}for(i=0;i<MvNum;i++){mv_diff_xse(v)|ae(v)mv_diff_yse(v)|ae(v)if(mb_weighting_flag)weighting_predictionu(1)|ae(v)}if(MbType!=P_Skip&&MbType!=B_Skip)(if(MbType!=I_8×8llentropy_coding_mode_flag)me(v)|ae(v)if(chroma_format_idc==2)me(v)|ae(v)if(MbType==I_4×4){for(i=0;i<4;i++)if(MbCBP&1<i)表23(續(xù))macroblock_scalable(){描述符coded_block_pattern_4×4me(v)|ae(v)if((MbCBP>0||MbCBP422>0)&&!fixed_slice_qp)mb_qp_deltase(v)|ae(v)for(i=0;i<CbNum;i++)block(i)}塊語法塊語法見表24。表24塊語法表block(i){描述符if(cbp_8×8&1<i){if(Transform8×8Flag){ce(v)|ae(v)if(trans_coefficient>=59&.&.!entropy_coding_mode_flag)ce(v)}while(trans_coefficient!=‘EOB’)for(j=0;j<4;j++){if(cbp_4×4[i]&1<j){ce(v)|ae(v)if(trans_coefficient>=59&&!entropy_coding_mode_flag)ce(v)}while(trans_coefficient!='EOB’)}}}}監(jiān)控擴展數據單元語法.1監(jiān)控擴展數據單元語法通則監(jiān)控擴展數據單元語法見表25。表25監(jiān)控擴展數據單元語法表surveillance_extension_rbsp(){描述符while(next_bits(8)!=0x80)(if(next_bits(8)==0x01)roi_extension()elseif(next_bits(8)==0x02)event_extension()elseif(next_bits(8)==0x03)alert_extension()elseif(next_bits(8)==0x04)time_extension()reserved_extension()}surveillance_extension_stop_b}.2感興趣區(qū)域擴展語法感興趣區(qū)域擴展語法見表26。表26感興趣區(qū)域擴展語法表描述符extension_idu(8)extension_lengthu(8)position_idcu(8)camera_idcu(16)region_numu(4)reserved_bitsfor(i=0;i<region_num;i++){region_top_left_mbx[i]u(8)region_top_left_mby[i]u(8)region_width_in_mbs_minusl[i]u(8)region_height_in_mbs_minusl[i]u(8)}}.3監(jiān)控事件擴展語法監(jiān)控事件擴展語法見表27。表27監(jiān)控事件擴展語法表event_extension()(描述符extension_idu(8)extension_lengthu(8)position_idcu(8)camera_idcu(16)region_numu(4)reserved_bitsfor(i=0;i<=region_num;i++){u(8)for(j=0;j<event_num[i];j++){region_event_id[i,j]u(8)}}.4監(jiān)控報警擴展語法監(jiān)控報警擴展語法見表28。表28監(jiān)控報警擴展語法表alert_extension(){描述符extension_idu(8)extension_lengthu(8)position_idcu(8)camera_idcu(16)alert_numu(6)reserved_bitsfor(i=0;i<alert
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025標準的攝影作品使用許可合同
- 二零二五年度凈水器綠色環(huán)保認證采購合同
- 2025年度文化產業(yè)分紅合作協(xié)議范本(含IP授權)3篇
- 2025年度公司設立前股東合作協(xié)議書(含知識產權保護)3篇
- 2025年度公司股東間應急事件處理合作協(xié)議書3篇
- 2025年度農產品電商平臺農產品物流配送優(yōu)化合同版3篇
- 2025年度農機租賃與農業(yè)科研合作開發(fā)合同3篇
- 二零二五年度農村宅基地租賃及土地流轉服務協(xié)議
- 2025年度農產品深加工項目原料供應合同版3篇
- 二零二五年度婚慶服務市場區(qū)域保護競業(yè)禁止合同2篇
- GB/T 9755-2024合成樹脂乳液墻面涂料
- 嗶哩嗶哩MATES人群資產經營白皮書【嗶哩嗶哩】
- 【歷史】第一、二單元測試題2024~2025學年統(tǒng)編版七年級歷史上冊
- 婚姻家庭規(guī)劃
- 認識實習報告(10篇)
- 【MOOC】內科護理學-中山大學 中國大學慕課MOOC答案
- 2024年商業(yè)地產買賣合同樣本
- 2023-2024學年廣東省深圳市福田區(qū)七年級(上)期末英語試卷
- 雙碳全景系列培訓第一章碳達峰、碳中和
- 【企業(yè)盈利能力探析的國內外文獻綜述2400字】
- 變電檢修班組規(guī)范化建設實施細則
評論
0/150
提交評論