版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、人體行為識別技術(shù)在計算機(jī)視覺領(lǐng)域中,人體運(yùn)動行為識別是一個被廣泛關(guān)注的熱點(diǎn)問題,在 智能監(jiān)控、機(jī)器人、人機(jī)交互、虛擬現(xiàn)實(shí),智能家居,智能安防,運(yùn)動員輔助訓(xùn) 練等方面有巨大應(yīng)用價值。行為識別問題一般遵從如下基本過程:數(shù)據(jù)圖像預(yù)處 理,運(yùn)動人體檢測、運(yùn)動特征提取、特征訓(xùn)練與分類、行為識別。著重從這幾方 面逐一回顧了近年來人體行為識別的發(fā)展現(xiàn)狀和常有方法。 并對當(dāng)前該研究方向 上待解決的問題和未來趨勢做了分析。行為理解可以簡單地認(rèn)為是時變數(shù)據(jù)的分 類問題,即將測試序列與預(yù)先標(biāo)定的代表典型行為的參考序列進(jìn)行匹配。通過對大量行為理解研究文獻(xiàn)的整理發(fā)現(xiàn):人行為理解研究一般遵從特征提取與運(yùn)動表 征、行為識別
2、、高層行為與場景理解等幾個基本過程。特征提取與運(yùn)動表征是在對目標(biāo)檢測、 分類和跟蹤等底層和中層處理的基礎(chǔ) 上,從目標(biāo)的運(yùn)動信息中提取目標(biāo)圖像特征并用來表征目標(biāo)運(yùn)動狀態(tài);行為識別則是將輸入序列中提取的運(yùn)動特征與參考序列進(jìn)行匹配,判斷當(dāng)前的動作處于哪種行為模型;高層行為與場景理解是結(jié)合行為發(fā)生的場景信息和相關(guān)領(lǐng)域知識, 識別復(fù)雜行為,實(shí)現(xiàn)對事件和場景的理解。【2】1、行為識別的應(yīng)用從應(yīng)用領(lǐng)域的分類來講,可以將人體運(yùn)動分析的應(yīng)用分成如下幾個領(lǐng)域: 智能監(jiān)控這里所指的“智能”包含兩個方面的含義。一種“智能”是指系統(tǒng)能夠在一 定的場景中檢測是否有人的出現(xiàn)(如通過檢測人臉的方法)防止只是簡單的通過 運(yùn)動目
3、標(biāo)檢測所造成的錯誤報警(例如因?yàn)閯游锘顒踊蛘吖物L(fēng)搖動樹枝等等而造 成誤報)。另外一種“智能”是指系統(tǒng)能夠監(jiān)視一定場所中人的活動,并對其行 為進(jìn)行分析和識別,跟蹤可疑行為(如經(jīng)常在重要地點(diǎn)徘徊等等行為)從而采取相 應(yīng)的報警措施。通常把報警系統(tǒng)設(shè)置于銀行、機(jī)場、車站、碼頭、超市、辦公大 樓、住宅小區(qū)等地,以實(shí)現(xiàn)對這些場所的智能監(jiān)控。 虛擬現(xiàn)實(shí)跟蹤現(xiàn)實(shí)世界人的姿態(tài),從而創(chuàng)建一個虛擬的仿真場景,實(shí)現(xiàn)人與這個虛擬 世界的交互。該領(lǐng)域的具體應(yīng)用涉及視頻游戲、虛擬攝影棚、計算機(jī)動畫等方面。 高級用戶接口指可以通過對用戶手勢的識別來代替?zhèn)鹘y(tǒng)的鼠標(biāo)和鍵盤輸入, 從而實(shí)現(xiàn)人與 計算機(jī)之間的智能交互。此外,通過對手
4、勢語言的理解,還可以進(jìn)行聾人與計算 機(jī)之間的手語交流。 運(yùn)動分析人體運(yùn)動分析可以運(yùn)用于基于內(nèi)容的視頻檢索領(lǐng)域。例如可以檢索在運(yùn)動會 上單杠比賽中運(yùn)動員的杠上動作。這樣可以節(jié)省用戶大量的查詢視頻資料的時間 和精力。另外一種應(yīng)用是用于各種體育項(xiàng)目中,提取運(yùn)動員的各項(xiàng)技術(shù)參數(shù)(如關(guān)節(jié)位置、角度和角速度,等等),通過分析這些信息,可以為運(yùn)動員的訓(xùn)練提 供指導(dǎo)和建議,有助于提高運(yùn)動員的訓(xùn)練水平。 此外,還可以用于體育舞蹈動作 的分析,以及臨床矯形術(shù)的研究等領(lǐng)域。 基于模型的視頻編碼通過提取一定的靜態(tài)場景中人物的形態(tài)特征參數(shù)和 3D姿態(tài)參數(shù),以較低的 數(shù)據(jù)量對視頻數(shù)據(jù)流加以描述,實(shí)現(xiàn)視頻數(shù)據(jù)的壓縮和低比特
5、率傳送。 可以用于 在因特網(wǎng)上展開遠(yuǎn)程視頻會議以及 VOD(Video-0n-Demand視頻點(diǎn)播??傊?,人體運(yùn)動跟蹤的研究已涉及到計算機(jī)視覺、模式識別、視頻圖像處理 等方面的理論問題和實(shí)際應(yīng)用問題,對人體這一帶有關(guān)節(jié)旋轉(zhuǎn)運(yùn)動的非剛體目標(biāo) 的跟蹤與分析將會促進(jìn)這些領(lǐng)域在理論上產(chǎn)生新的處理方法,并將對諸多應(yīng)用領(lǐng)域產(chǎn)生潛在的影響。2、行為識別研究難點(diǎn)行為識別發(fā)展至今,取得了很大的進(jìn)展,在低層,中層和高層都取得了一定 的突破,但是行為識別算法并不成熟,目前不存在一個算法適合所有的行為分類, 3個視覺層次中都還有很多嚴(yán)峻的問題有待解決。其研究的難點(diǎn)主要體現(xiàn)在以下幾個方面:1)動作類內(nèi)類間的變化太大對于
6、大多數(shù)的動作,即使是同一動作都有不同的表現(xiàn)形式。比如說走路,可 以在不同的背景環(huán)境中完成,走路的速度也可以從慢到快,走路的步長亦有長有 短。其它的動作也有類似的結(jié)果,特別是一些非周期的運(yùn)動,比如過馬路時候的 走路,這與平時周期性的走路步伐明顯不同。由此可見,動作的種類本身就很多, 再加上每一種類又有很多個變種,所以給行為識別的研究帶來了不少麻煩。2)環(huán)境背景等影響環(huán)境問背景等因素的影響可謂是計算機(jī)視覺各個領(lǐng)域的最大難點(diǎn)。主要有視角的多樣性,同樣的動作從不同的視角來觀察會得到不同的二維圖像;人與人之間,人與背景之間的相互遮擋也使計算機(jī)對動作的分類前期特征提取帶來了困難, 目前解決多視覺和遮擋問題
7、,有學(xué)者提出了多攝像機(jī)融合通過3維重建來處理;另外其影響因素還包括動態(tài)變化和雜亂的背景,環(huán)境光照的變化,圖像視頻的低 分辨率等。3)時間變化的影響人體的行為離不開時間這個因素。而我們拍攝的視頻其存放格式有可能不同, 其播放速度有慢有快,這就導(dǎo)致了我們提出的系統(tǒng)需對視頻的播放速率不敏感。4)數(shù)據(jù)的獲取和標(biāo)注既然把行為識別問題當(dāng)成一個分類問題,就需要大量的數(shù)據(jù)來訓(xùn)練分類模型。 而這些數(shù)據(jù)是視頻數(shù)據(jù),每一個動作在視頻中出現(xiàn)的位置和時間都不確定, 同時 要考慮同一種動作的不同表現(xiàn)形式以及不同動作之間的區(qū)分度,即數(shù)據(jù)的多樣性和全面性。這一收集過程的工作量不小,網(wǎng)上已經(jīng)有一些公開的數(shù)據(jù)庫供大家用 來實(shí)驗(yàn),
8、這將在本文的第3部分進(jìn)行介紹。另外,手動對視頻數(shù)據(jù)標(biāo)注非常困難。當(dāng)然,有學(xué)者也提出了一些自動標(biāo)注 的方法,比如說利用網(wǎng)頁圖片搜索引擎,利用視頻的字幕,以及利用電影描述的 文本進(jìn)行匹配。5)高層視覺的理解上面一提到,目前對行為識別的研究尚處在動作識別這一層。 其處理的行為 可以分為2類,一類是有限制類別的簡單規(guī)則行為,比如說走、跑、揮手、彎腰、 跳等。另一類是在具體的場景中特定的行為,如檢測恐怖分子異常行為,丟包后 突然離開等。在這種場景下對行為的描述有嚴(yán)格的限制, 此時其描述一般采用了 運(yùn)動或者軌跡。這2種行為識別的研究都還不算完善, 遇到了不少問題,且離高 層的行為識別要求還相差很遠(yuǎn)。因此高
9、層視覺的理解表示和識別是一個巨大的難 題。3人體行為分析研究一般的運(yùn)動人體行為分析主要包括一下幾個流程:1)數(shù)據(jù)庫建立;2)運(yùn)動人體檢測;3)運(yùn)動特征提?。?)行為理解與識別。在我們的運(yùn)動人體行為分析研究中,重點(diǎn)研究運(yùn)動人體檢測和運(yùn)動特征提取。如圖1所示是運(yùn)動行為分析研究的整體框架:覘域鈾入 數(shù)堀旗處理 運(yùn)初人體松測 f 運(yùn)動特捉取圖13.1運(yùn)動目標(biāo)檢測對于不依賴先驗(yàn)知識的目標(biāo)跟蹤來講,運(yùn)動檢測是實(shí)現(xiàn)跟蹤的第一步,運(yùn)動檢測即為 從序列圖像中將變化區(qū)域從背景圖像中提取出來。目前,已有的運(yùn)動目標(biāo)檢測方法按照算法的基本原理可以分為三類:幀間差分法、背景減除法和光流法。三類方法各有其優(yōu)缺點(diǎn)。(1)背景
10、減除法背景減除法是預(yù)先選取不含前景運(yùn)動目標(biāo)的背景圖像,然后將當(dāng)前圖像幀與背景圖像 相減得到前景目標(biāo)。最常用且有效的是背景減除法。此類算法的缺點(diǎn)是由于通常需要緩沖若干幀來學(xué)習(xí)背景,因此往往需要消耗大量的內(nèi)存,這使其使用范圍受到了限制。此外,對于大范圍的背景擾動,此類算法的檢測效果也不理想。Stauffer和Grimson提出的高斯混合模型是使用最為廣泛的背景建模方法。高斯混合 模型通過多個高斯分布對背景建模,每個分布對應(yīng)一種背景像素的模態(tài),從而能夠適應(yīng)像素層面上的背景擾動問題,并能通過對背景的不斷更新,使系統(tǒng)能對背景的變化自適應(yīng)。但是,高斯混合模型對于全局光照變化、陰影非常敏感,對于緩慢的運(yùn)動目
11、標(biāo)檢測效果也不理想。(2) 幀間差分法幀間差分法的主要思想就是利用視頻圖像序列中連續(xù)兩幀或三頓的差異來檢測發(fā)生運(yùn) 動的區(qū)域。Lipton等人提出的用于實(shí)時視頻流中運(yùn)動冃標(biāo)檢測的算法就是頓間差分的方法 Lipton98。頓間差分法的特點(diǎn)是動態(tài)性強(qiáng),能夠適應(yīng)動態(tài)背景下的運(yùn)動目標(biāo)檢測。但是,這類算法檢測出的目標(biāo)輪廓非常不理想,在目標(biāo)內(nèi)部會留有許多空洞,在目標(biāo)運(yùn)動較快時目標(biāo)的輪廓會被擴(kuò)大,在目標(biāo)運(yùn)動較慢時甚至有可能無法得到目標(biāo)的邊界。(3) 基于光流的運(yùn)動目標(biāo)檢測算法基于光流的運(yùn)動目標(biāo)檢測算法是利用光流方程計算出每個像素點(diǎn)的運(yùn)動狀態(tài)矢量,從而發(fā)現(xiàn)運(yùn)動的像素點(diǎn),并且能夠?qū)@些像素點(diǎn)進(jìn)行跟蹤。在攝像機(jī)運(yùn)動
12、、背景變化時,光流法也能檢測出運(yùn)動目標(biāo),并且它能同時完成運(yùn)動目標(biāo)檢測和跟蹤 ,但是該方法的計算復(fù)雜度高,在 沒有專用硬件支持的情況下很難做到實(shí)時檢測,同時,光流場的計算非常容易受到噪聲、光照變化和背景擾動的影響。采用光流場計算的方法也很難將運(yùn)動目標(biāo)的輪廓完整地提取出來。3.2運(yùn)動目標(biāo)分類復(fù)雜場景小檢目標(biāo)分類是指從運(yùn)動目標(biāo)檢測到的前景運(yùn)動區(qū)域中提取感興趣目標(biāo)區(qū)域。測到的前景區(qū)域可能包含不同種類的目標(biāo),如行人、車輛、飛鳥、劉云、搖動的樹枝等,在人體運(yùn)動分析系統(tǒng)中, 只對運(yùn)動人體感興趣,因此需要對運(yùn)動目標(biāo)的類型進(jìn)行分析識別,基于形狀信 息的分類根據(jù)運(yùn)動區(qū)域的形狀 特征進(jìn)行分類使用簡單的人體輪廓模式的
13、形狀參數(shù)檢測運(yùn)動人體提取區(qū)域的分散度、面積、寬高比等 特征,采用三層神經(jīng)網(wǎng)絡(luò)將前景目標(biāo) 分類為人、人群、車輛和背景干擾分散度和面積信息區(qū)分人、車 輛及混亂擾動取人體目標(biāo)。目前常用的目標(biāo)分類方法有如圖2:這兩類目標(biāo)分類方法 也可結(jié)合使用,以得 到更準(zhǔn)確的分類結(jié)果目標(biāo)分類基于運(yùn)動信息的分類T*(利用人體運(yùn)動的周 期性進(jìn)行分類通過計算運(yùn)動區(qū)域的殘余光流來 分析運(yùn)動目標(biāo)的剛性和周期性根據(jù)人體運(yùn)動的周期性特性,采用 時頻分析法判斷運(yùn)動軌跡是否存在 周期性,從而識別出運(yùn)動人體與剛性車輛的運(yùn)動相比,非剛性的人體運(yùn)動具有較高的平均殘余光流并且人體運(yùn)動呈現(xiàn)周期性,因此可將人體區(qū)分出來3.3運(yùn)動目標(biāo)跟蹤依據(jù)運(yùn)動目
14、標(biāo)的表達(dá)和相似性度量,運(yùn)動目標(biāo)跟蹤算法可以分為四類:基于主動輪廓的跟蹤、基于特征的跟蹤、基于區(qū)域的跟蹤和基于模型的跟蹤。跟蹤算法的精度和魯棒性很大程度上取決于對運(yùn)動目標(biāo)的表達(dá)和相似性度量的定義,跟蹤算法的實(shí)時性取決于匹配搜索策略和濾波預(yù)測算法。1)基于主動輪廓的跟蹤Kass等人提出的主動輪廓模型,即Snake模型,是在圖像域內(nèi)定義的可變形曲線,通 過對其能量函數(shù)的最小化,動態(tài)輪廓逐步調(diào)整自身形狀與目標(biāo)輪廓相一致,該可變形曲線又稱為Snake曲線。Snake技術(shù)可以處理任意形狀物體的任意形變,首先將分割得到的物體邊界作為跟蹤的初始模板,然后確定表征物體真實(shí)邊界的目標(biāo)函數(shù),并通過降低目標(biāo)函數(shù)值,使
15、初始輪廓逐漸向物體的真實(shí)邊界移動?;谥鲃虞喞櫟膬?yōu)點(diǎn)是不但考慮來自圖像的灰度信息,而且考慮整體輪廓的幾何信息,增強(qiáng)了跟蹤的可靠性。由于跟蹤過程實(shí)際上是解的尋優(yōu)過程,帶來的計算量比較大,而且由于Snake模型的盲目性,對于快速運(yùn)動的物體或者形變較大的情況,跟蹤效果不夠理想 2)基于特征的跟蹤基于特征匹配的跟蹤方法不考慮運(yùn)動目標(biāo)的整體特征,只通過目標(biāo)圖像的一些顯著特征來進(jìn)行跟蹤。假定運(yùn)動目標(biāo)可以由惟一的特征集合表達(dá),搜索到該相應(yīng)的特征集合就認(rèn)為跟蹤上了運(yùn)動目標(biāo)。除了用單一的特征來實(shí)現(xiàn)跟蹤外,還可以采用多個特征信息融合在一起作為跟蹤特征。2)基于特征的跟蹤基于特征的跟蹤主要包括特征提取和特征匹配
16、兩個方面。(1)特征提取,特征提取是指從景物的原始圖像中提取圖像的描繪特征,理想的圖像特征應(yīng)具備的特點(diǎn)是a)特征應(yīng)具有直觀意義,符合人們的視覺特性;b)特征應(yīng)具備較好的分類能力 ,能夠區(qū)分不同的圖像內(nèi)容 c)特征計算應(yīng)該相對簡單,以便于快速識別;d)特征應(yīng)具備圖像平移、旋轉(zhuǎn)、尺度變化等不變性。目標(biāo)跟蹤中常用的運(yùn)動目標(biāo)的特征主要包括顏色、紋理、邊緣、塊特征、光流特征、周長、面積、質(zhì)心、角點(diǎn)等。提取對尺度伸縮、形變和亮度變化不敏感的有效特征至今仍是圖像處理研究領(lǐng)域中一個比較活躍的方面。(2)特征匹配,特征提取的目的是進(jìn)行幀間目標(biāo)特征的匹配,并以最優(yōu)匹配來跟蹤目標(biāo)。常見的基于特征匹配的跟蹤算法有:
17、基于二值化目標(biāo)圖像匹配的跟蹤、基于邊緣特征匹配或角點(diǎn)特征匹配的跟蹤、基于目標(biāo)灰度特征匹配的跟蹤、基于目標(biāo)顏色特征匹配的跟蹤等?;谔卣鞯母櫵惴ǖ膬?yōu)點(diǎn)在于對運(yùn)動目標(biāo)的尺度、形變和亮度等變化不敏感,即使目標(biāo)的某一部分被遮擋,只要還有一部分特征可以被看到,就可以完成跟蹤任務(wù);另外,這種方法與K al man濾波器聯(lián)合使用, 也具有很好的跟蹤效果。但是其對于圖像模糊、噪聲等比較敏感,圖像特征的提取效果也依賴于各種提取算子及其參數(shù)的設(shè)置,此外,連續(xù)幀間的特征對應(yīng)關(guān)系也較難確定,尤其是當(dāng)每一幀圖像的特征數(shù)目不一致、存在漏檢、特征增加或減少等情況。3)基于區(qū)域的跟蹤基于區(qū)域的跟蹤算法基本思想是:a)得到包
18、含目標(biāo)的模板,該模板可通過圖像分割獲得或預(yù)先人為確定,模板通常為略大于目標(biāo)的矩形,也可為不規(guī)則形狀;b)在序列圖像中, 運(yùn)用相關(guān)算法跟蹤目標(biāo)。這種算法的優(yōu)點(diǎn)在于當(dāng)目標(biāo)未被遮擋時,跟蹤精度非常高、跟蹤非常穩(wěn)定。但其缺點(diǎn)首先是費(fèi)時,當(dāng)搜索區(qū)域較大時情況尤其嚴(yán)重 ;其次,算法要求目標(biāo)變 形不大,且不能有太大遮擋,否則相關(guān)精度下降會造成目標(biāo)的丟失。近年來,對基于區(qū)域的跟蹤方法關(guān)注較多的是如何處理模板變化時的情況,這種變化是由運(yùn)動目標(biāo)姿態(tài)變化引起的,如果能正確預(yù)測目標(biāo)的姿態(tài)變化,則可實(shí)現(xiàn)穩(wěn)定跟蹤。4)基于模型的跟蹤基于模型的跟蹤是通過一定的先驗(yàn)知識對所跟蹤目標(biāo)建立模型,然后通過匹配跟蹤目標(biāo)進(jìn)行模型的實(shí)時
19、更新。對于剛體目標(biāo)來說,其運(yùn)動狀態(tài)變換主要是平移、旋轉(zhuǎn)等,可以利用該方法實(shí)現(xiàn)目標(biāo)跟蹤。但是實(shí)際應(yīng)用中跟蹤的不僅僅是剛體,還有一大部分是非剛體,目標(biāo)確切的幾何模型不容易得到。這種方法不易受觀測視角的影響,具有較強(qiáng)的魯棒性,模 型匹配跟蹤精度高,適合于機(jī)動目標(biāo)的各種運(yùn)動變化,抗干擾能力強(qiáng),但由于計算分析復(fù) 雜、運(yùn)算速度慢,模型的更新較為復(fù)雜,實(shí)時性較差。準(zhǔn)確建立運(yùn)動模型是模型匹配能否 成功的關(guān)鍵。3.4運(yùn)動目標(biāo)的特征運(yùn)動目標(biāo)的特征,是判斷一個目標(biāo)區(qū)別于另外一個目標(biāo)的重要依據(jù)。有效的運(yùn)動目標(biāo)特征集可以準(zhǔn)確地區(qū)分不同目標(biāo)。運(yùn)動目標(biāo)特征的提取是實(shí)現(xiàn)運(yùn)動目標(biāo)分類的重要步驟。運(yùn)動目標(biāo)分類方法概述目前,基于視
20、頻的運(yùn)動目標(biāo)分類方法已經(jīng)有很多,主要有3類:基于靜態(tài)特征的分類,基于動態(tài)特征的分類和基于靜態(tài)、動態(tài)特征相結(jié)合的分類。1)基于靜態(tài)特征的分類基于靜態(tài)信息的分類, 即利用檢測出來的運(yùn)動區(qū)域的形狀、顏色等物理特征進(jìn)行目標(biāo)分類的方法。Lipt on等利用離散度和面積信息對運(yùn)動區(qū)域進(jìn)行分類,區(qū)分人、車、及混亂擾 動,并利用時間一致性約束使分類更準(zhǔn)確,把除人、車外的目標(biāo)當(dāng)成干擾物, 實(shí)現(xiàn)簡單。Zang等人利用長寬比、角點(diǎn)特征對運(yùn)動區(qū)域進(jìn)行分類,區(qū)分人、汽車。Rivlin、Bogomolov等利用外接橢圓的長寬比以及星形骨架等形狀特征,區(qū)分人、動物、汽車。Hu等定義了目標(biāo)輪廓上的點(diǎn)與幾何中心的距離為“中距離
21、”,利用中距離的離散度、最大中距離與最小中距離的比值作為分類特征,區(qū)分人、自行車、汽車。方帥等利用最大互信息獲得一組可靠、獨(dú)立 且具辨認(rèn)力的目標(biāo)特征集, 并用有向無環(huán)圖的多類支持向量機(jī)進(jìn)行分類,區(qū)分人、汽車o Otoom等人以角點(diǎn)的個數(shù)、圓的個數(shù)、離散度為分類特征,區(qū)分機(jī)場周圍的人、人群、包裹、手推 車,該文分類效果較差, 主要是因?yàn)橥粋€目標(biāo)角點(diǎn)的個數(shù)與離攝像頭遠(yuǎn)近差別很大,而且圓的個數(shù)判斷人、人群依賴目標(biāo)姿勢。2)基于動態(tài)特征的分類基于動態(tài)特征的分類,即利用人體運(yùn)動的周期性或其他與運(yùn)動相關(guān)的特征進(jìn)行目標(biāo)分類 的方法。采用靜態(tài)特征往往會造成在特征提取上對姿勢依賴的問題,而有效的動態(tài)特征可以減
22、少對姿勢的依賴。Cutler與Davis對目標(biāo)隨著時間變化的自相關(guān)特性進(jìn)行計算,再通過時頻化方法分析目標(biāo)是否存在周期性的運(yùn)動特征而將人識別出來。Yang Ran與Tsaac Weiss基于周期性分類人和車輛,對目標(biāo)較小、圖像分辨率低的航空和紅外圖片有比較好的分類效 果。Javed、Shah等利用是否有人體周期性運(yùn)動特征、圓的個數(shù)等特征,分類人、人群和車 輛。3)基于靜態(tài)與動態(tài)特征相結(jié)合的分類Bogomolov、Dror等的系統(tǒng)是基于目標(biāo)靜態(tài)特征和動態(tài)運(yùn)動特性相結(jié)合進(jìn)行目標(biāo)分類的, 采用了屬于同類目標(biāo)的靜態(tài)輪廓的相似性和身體的傾斜角、腳之間的距離等運(yùn)動特征, 用支持向量機(jī)分類器進(jìn)行分類,提高了精
23、確度和魯棒性。Aggarwal等利用緊湊度值以及運(yùn)動方向的變化量,區(qū)分人、人群、汽車、自行車,運(yùn)動方向的變化量區(qū)分度不是很好。Li等使用速度、長寬比、離散度等特征,以BP神經(jīng)網(wǎng)絡(luò)作為分類器,區(qū)分交通場景中的人、自行車,較好地對復(fù)雜場景下人、自行車進(jìn)行分類。常見的運(yùn)動目標(biāo)特征分析一個運(yùn)動目標(biāo)特征往往無法識別三個以上的目標(biāo),或者識別的準(zhǔn)確率不夠高,一般目標(biāo)分類研究都是選擇至少兩個特征。通用特征指的是能反映所有目標(biāo)特性的特征;屬性特征, 顧名思義,某個目標(biāo)的所固有的特征是特別能反映該目標(biāo)特性的特征。1)運(yùn)動目標(biāo)的通用特征常見的通用特征主要有面積、長寬比、離散度、空隙率(緊湊度)等。目標(biāo)面積是在像素平
24、面的投影面積,不是目標(biāo)的實(shí)際目標(biāo),同一位置的不同目標(biāo)大小各異,但是攝像機(jī)拍攝的目標(biāo)近大遠(yuǎn)小,即使是同一目標(biāo),攝像頭拍攝的距離不同,面積也是不一樣的,在固定單攝 像機(jī)的情況下,面積對不同類目標(biāo)之間的區(qū)分度不是很大;攝像機(jī)標(biāo)定后該特征有一定的應(yīng)用。長寬比即目標(biāo)外接矩形的長寬比例,與距離攝像頭遠(yuǎn)近無關(guān),具有歸一化的特性, 能真實(shí)反映目標(biāo)的形狀比例, 是最常用的一種目標(biāo)特征。 離散度即運(yùn)動目標(biāo)周長的平方與面積的 比值,外形越復(fù)雜的目標(biāo),離散度越大;對于目標(biāo)碎片比較多的運(yùn)動目標(biāo),由于目標(biāo)的輪廓準(zhǔn)確獲取不易,離散度計算比較復(fù)雜并且計算的準(zhǔn)確性無法保證。空隙率即目標(biāo)外接矩形內(nèi)部非目標(biāo)像素點(diǎn)所占的比例,與其相
25、反的特征就是緊湊度。2)運(yùn)動目標(biāo)的屬性特征人的屬性特征主要有圓、人體運(yùn)動周期性等。人頭近似圓,從人的頭頂往下的角度看, 人頭所在位置可以檢測到圓;研究中發(fā)現(xiàn)圓特征嚴(yán)重依賴目標(biāo)角度、姿勢,正面、側(cè)面的角度下,圓特征不明顯、人頭所在位置常常無法檢測到圓。人體運(yùn)動周期性特征反映的是人體步態(tài)的規(guī)律性變化,周期性特征的提取對目標(biāo)的觀察角度有很高的要求,只有人體目標(biāo)偏側(cè)面才能準(zhǔn)確提取到該特征。汽車的屬性特征主要有運(yùn)動速度、離散度變化量等。運(yùn)動速度即相鄰兩幀的目標(biāo)像素距離與時間間隔的比值, 該特征在一定程度上反應(yīng)了目標(biāo)在視頻圖像中的運(yùn)動快慢,汽車的運(yùn)動速度比較快;但是由于目標(biāo)在不同的視頻中所處的環(huán)境和位置不
26、同,攝像頭拍攝的角度和距離也不同,該特征與面積特征一樣,只有進(jìn)行攝像機(jī)標(biāo)定后,才有實(shí)際應(yīng)用意義。離散度變化量反映了各個目標(biāo)的變化幅度。離散度變化量特征與離散度一樣,計算比較復(fù)雜并且計算的準(zhǔn)確性無法保證??障堵首兓坑嬎愫唵危材芊从掣鱾€目標(biāo)的變化幅度,并且在目標(biāo)碎片比較多的情況下也能很好的提取,可以較好地替代離散度變化量特征。自行車既不是剛體,也不是非剛體,是一種介于剛體(汽車)與非剛體(人)的目標(biāo)。目前很少 有文獻(xiàn)提起自行車行之有效的屬性特征,其特征一般都是介于人、汽車之間。運(yùn)動目標(biāo)特征的選取由于實(shí)驗(yàn)中提取到的前景目標(biāo)存在多角度、目標(biāo)含有少量影子、目標(biāo)區(qū)域提取不完整和目標(biāo)較小等情況,采用基于形狀的特征分類目標(biāo),可較好地適應(yīng)這些情況。因此,我們參賽的特征主要是基于形狀的特征。目標(biāo)基于形狀的特征主要有目標(biāo)輪廓、面積、長寬比、離散度、質(zhì)心、外接矩形等。目前研究中廣泛使用的目標(biāo)特征主要有長寬比P、面積信息S、離散度(區(qū)域致密性) D慣性主軸方向、Hu不變矩等區(qū)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度新能源材料名義合伙人合同4篇
- 2025年儲煤場租賃與智能化倉儲解決方案合同4篇
- 二零二五年度農(nóng)藥產(chǎn)品市場拓展銷售合同4篇
- 二零二五美容院美容院美容院美容院美容產(chǎn)品售后服務(wù)合同2篇
- 二零二五年度醫(yī)療健康行業(yè)借款合同協(xié)議2篇
- 2025年度個人鋼結(jié)構(gòu)景觀構(gòu)筑物施工合同范本2篇
- 2025年廚房改造與承包施工合同范本4篇
- 二零二五年度爬架租賃與環(huán)保驗(yàn)收合同4篇
- 2025年度車輛牌照租賃與新能源補(bǔ)貼申請服務(wù)合同3篇
- 二零二五年度電梯工程智能化控制系統(tǒng)開發(fā)合同范本3篇
- 霧化吸入療法合理用藥專家共識(2024版)解讀
- 2021年全國高考物理真題試卷及解析(全國已卷)
- 拆遷評估機(jī)構(gòu)選定方案
- 趣味知識問答100道
- 鋼管豎向承載力表
- 2024年新北師大版八年級上冊物理全冊教學(xué)課件(新版教材)
- 人教版數(shù)學(xué)四年級下冊核心素養(yǎng)目標(biāo)全冊教學(xué)設(shè)計
- JJG 692-2010無創(chuàng)自動測量血壓計
- 三年級下冊口算天天100題(A4打印版)
- 徐州市2023-2024學(xué)年八年級上學(xué)期期末地理試卷(含答案解析)
- CSSD職業(yè)暴露與防護(hù)
評論
0/150
提交評論