![[碩士論文精品]經(jīng)網(wǎng)絡(luò)的微弱運動目標的檢測與跟蹤_第1頁](http://file.renrendoc.com/FileRoot1/2017-12/8/f1f54fe3-9bc9-41e2-a7ac-822d285c3593/f1f54fe3-9bc9-41e2-a7ac-822d285c35931.gif)
![[碩士論文精品]經(jīng)網(wǎng)絡(luò)的微弱運動目標的檢測與跟蹤_第2頁](http://file.renrendoc.com/FileRoot1/2017-12/8/f1f54fe3-9bc9-41e2-a7ac-822d285c3593/f1f54fe3-9bc9-41e2-a7ac-822d285c35932.gif)
![[碩士論文精品]經(jīng)網(wǎng)絡(luò)的微弱運動目標的檢測與跟蹤_第3頁](http://file.renrendoc.com/FileRoot1/2017-12/8/f1f54fe3-9bc9-41e2-a7ac-822d285c3593/f1f54fe3-9bc9-41e2-a7ac-822d285c35933.gif)
![[碩士論文精品]經(jīng)網(wǎng)絡(luò)的微弱運動目標的檢測與跟蹤_第4頁](http://file.renrendoc.com/FileRoot1/2017-12/8/f1f54fe3-9bc9-41e2-a7ac-822d285c3593/f1f54fe3-9bc9-41e2-a7ac-822d285c35934.gif)
![[碩士論文精品]經(jīng)網(wǎng)絡(luò)的微弱運動目標的檢測與跟蹤_第5頁](http://file.renrendoc.com/FileRoot1/2017-12/8/f1f54fe3-9bc9-41e2-a7ac-822d285c3593/f1f54fe3-9bc9-41e2-a7ac-822d285c35935.gif)
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀
[碩士論文精品]經(jīng)網(wǎng)絡(luò)的微弱運動目標的檢測與跟蹤.pdf 免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
摘要摘要基于視頻的運動分析主要針對包含各種運動目標的視頻圖像序列進行處理,從場景中檢測、跟蹤、分類識別目標,并對其行為進行理解和描述。運動目標檢測與跟蹤是計算機視覺的核心課題之一,它融合了圖像處理、模式識別、人工智能、自動控制等相關(guān)領(lǐng)域的研究成果,在視頻監(jiān)控、機器人導航、視頻傳輸、視頻檢索、醫(yī)學圖像分析、氣象分析等許多領(lǐng)域有著廣泛的應(yīng)用,因此本課題具有重要的理論意義和廣闊的實用價值。本文研究基于BP網(wǎng)絡(luò)的微弱目標檢測與跟蹤技術(shù)。在總結(jié)分析目標檢測研究現(xiàn)狀和當前國內(nèi)外已有算法的基礎(chǔ)上,提出了一種在戶外場景下運動目標的檢測算法。在此基礎(chǔ)上,運用MATLAB編程實現(xiàn)了對視頻圖像目標的跟蹤檢測,并通過檢測算法的實現(xiàn)過程,分析了用BP網(wǎng)絡(luò)進行圖像目標模式識別的具體思路和方法。主要工作如下1,首先,對輸入圖像進行預處理,并對圖像進行二值化,確定目標區(qū)域并對目標進行跟蹤。在此基礎(chǔ)上,對運動目標進行特征提取。本文選擇目標的空問特征作為輸入特征集。2,采用“鄰域?qū)ο袼亍钡姆椒ń⒘艘环N輸入和輸出的關(guān)系。即采用3X3的模板在圖像上滑動,并以中心為采樣點對圖像進行采樣。這樣不僅降低了輸入數(shù)據(jù)的維數(shù),更提高了BP網(wǎng)絡(luò)的訓練速度。3,構(gòu)建了基于小樣本學習理論的BP網(wǎng)絡(luò)分類器,用已標記樣本對分類器進行訓練,較好地解決了非線性目標的自動檢測與跟蹤問題。訓練好的BP網(wǎng)絡(luò)便可以用來對未知目標樣本進行識別。實驗結(jié)果表明,本文提出的方法可以較好地識別出運動目標,并能有效地抑制背景噪聲,而且算法簡潔有效,操作效率高,對復雜背景的低信躁比圖像環(huán)境表現(xiàn)出良好的濾波性能和穩(wěn)健的適應(yīng)能力。關(guān)鍵詞目標檢測與跟蹤,BP神經(jīng)網(wǎng)絡(luò),特征提取,學習算法ABSTRACTABSTRACTVIDEOBASEDMOTIONANALYSISAIMSATDETECTING,TRACKINGANDIDENTIFYINGMOVINGOBJECTS,ANDMOREGENERALLY,UNDERSTANDINGOBJECTSBEHAVIORSTHROUGHANALYSISANDPROCESSINGIMAGESEQUENCESWITHMOVINGOBJECTSTHE、DETECTIONANDTRACKINGOFTHEMOVINGOBJECTSISONEOFTHEMOSTIMPORTANTBRANCHESINTHECOMPUTERVISION,WHICHCOMBINESADVANCEDTECHNOLOGIESANDRESEARCHACHIEVEMENTSINIMAGEPROCESSING,PATTEMRECOGNITION,ARTIFICIALINTELLIGENCE,AUTOMATICCONTROLANDOTHERRELATIVEFIELDSITHASBROADLYAPPLIEDINVIDEOSURVEILLANCE,ROBOTSNAVIGATION,VIDEOTRANSMISSION,VIDEORETRIEVAL,MEDICALIMAGEANALYSIS,METEOROLOGICALANALYSISANDOTHERFIELDS,SOTHISSUBJECTHASIMPORTANTTHEORETICALSIGNIFICANCEANDWIDEPRACTICALVALUETHEAUTOMATICTARGETDETECTINGANDTRACKINGWHICHISBASEDONBPBACKPROPAGATIONNETSISSTUDIEDINTHISPAPERONTHEBASISOFSUMMARIZINGANDANALYZINGACTUALITYRESEARCHANDALGORITHMSBOTHHEREANDABOARD,ANALGORITHMOFMOVINGOBJECTSDETECTINGINTHEOUTDOORSCENESISPROPOSEDANDTHISPAPEROFFERSAKINDOFPROGRAMMINGR弓ALIZATIONOFUSINGBPNETWORKTODETECTANDTRACKTHEMOVINGOBJECTSFURTHER,THROUGHTHEREALIZATIONCOURSEOFTHERECOGNITIONALGORITHM,THISPAPERANALYSESTHECONCRETETHINKINGANDMETHODOFUSINGBPNETWORKINPATTERNRECOGNITIONAPPLICATIONOFPICTUREOBJECTSTHEMAINWORKISASFOLLOWSI,F(xiàn)IRSTLY,VIDEOIMAGESARECONVERTEDTOTHEBINARYTHROUGHTHEPRETREATINGPROCESS,THENCONFIRMINGTHEOBJECTSAREAANDTRACKINGTHEMONTHEBASISOFPRETREATMENT,F(xiàn)EATURESOFMOVINGOBJECTAREEXTRACTED2,ADOPTTHEMETHODOFNEIGHBOURTOPELSTOFOUNDARELATIONBETWEENIMPORTANDOUTPORTTHATISUSING3MULTIPLY3TEMPLATESLIPPINGONTHEIMAGES,ANDSAMPLINGTHEIMAGEBYTHECENTEROFTHESPOTITNOTONLYREDUCETHEDIMENIONOFTHEPICTURE,BUTALSOIMPROVETHESPEEDOFTHETRAINING3,BPNETWORKCLASSIFIERBASEDONSMALLSAMPLEISBUILTLABELEDSAMPLESAREUSEDTOTRAINTHECLASSIFIERTHEPROBLEMOFNONLINEAROBJECTCLASSIFICATIONCANBESOLVEDBETTERTHETRAINEDCLASSIFIERCANBEUSEDTODETECTANDTRACKUNKNOWNOBJECTSAMPLESIIABSTRACTSIMULATIONRESULTSSHOWTHATTHISMETHODCALLRECOGNIZETHEMOVINGOBJECTS,ANDRESTRAINTHEBACKGROUNDNOISEEFFICIENTLYINCONCLUSION,THISMETHODISCONCISEANDEFFICIENTITCANPROVIDEGOODFILTERINGRESULTSANDROBUSTADAPTABILITYTOIMAGETARGETSWITHCLUTTERBACKGROUNDKEYWORDSTARGETSDETECTINGANDTRACKING,BPNEURALNETWORK,F(xiàn)EATUREEXTRACTING,LEARNINGALGORITHMIII獨創(chuàng)性聲明本人聲明所呈交的學位論文是本人在導師指導下進行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得電子科技大學或其它教育機構(gòu)的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示謝意。簽名玉衛(wèi)LU日期力閃驢年石月2弓關(guān)于論文使用授權(quán)的說明日本學位論文作者完全了解電子科技大學有關(guān)保留、使用學位論文的規(guī)定,有權(quán)保留并向國家有關(guān)部門或機構(gòu)送交論文的復印件和磁盤,允許論文被查閱和借閱。本人授權(quán)電子科技大學可以將學位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存、匯編學位論文。保密的學位論文在解密后應(yīng)遵守此規(guī)定簽名翻奄奄導師簽名閉手日期加年月2弓ET第一章緒論11研究背景及意義第一章緒論圖像識別是模式識別的重要內(nèi)容,而模式識別又是人工智能的重要分支之一。模式識別技術(shù)是用機器來模擬人的各種識別能力當前主要是模擬人的視覺與聽覺能力,即用機器來做圖像的識別和理解工作,用機器來做語言或各種聲音的識別和理解工作。因此,圖像識別的目的是對文字、圖像、圖片、景物等模式信息加以處理和識別,以解決計算機與外部直接通信這一重要問題??梢哉f,圖像識別的研究目標是為機器配置視覺器官,讓機器具有視覺能力,以便直接接受外界的各種視覺信劇。隨著計算機技術(shù)與信息技術(shù)的發(fā)展,圖像識別技術(shù)獲得了越來越廣泛的應(yīng)用。例如醫(yī)療診斷中各種醫(yī)學圖片的分析與識別、天氣預報中的衛(wèi)星云圖識別、遙感圖片識別、指紋識別、臉譜識別、虹膜識別、手勢鑒別、漢字識別、機器人視覺等??偠灾?,圖像識別技術(shù)不僅在工業(yè)、農(nóng)業(yè)、國防和高科技產(chǎn)業(yè)中普遍使用,而且越來越多得滲透到我們的日常生活中。本文研究的基于神經(jīng)網(wǎng)絡(luò)的微弱目標檢測與跟蹤便是圖像識別的一種,它在現(xiàn)代信息社會中具有十分重要的意義。由于視覺過程本身的高度非線性,采用非線性的信息處理技術(shù)就自然成為圖像領(lǐng)域的一種發(fā)展趨勢。近20年來,國際上開始興起了一些按自然法則計算,即模擬大自然的某種客觀規(guī)律來設(shè)計求解復雜系統(tǒng)相關(guān)問題的算法,比較有代表性的如人工神經(jīng)網(wǎng)絡(luò)、模擬退火和遺傳算法等。它們對付大規(guī)模復雜系統(tǒng)中出現(xiàn)的組合爆炸問題非常有力,往往不僅具有通用、穩(wěn)健、簡單、便于并行處理等優(yōu)點,而且有望成為數(shù)值計算與語義表達、形象思維等高級智能行為聯(lián)系的橋梁,被視為是今后10年對計算技術(shù)有重大影響的關(guān)鍵技術(shù)。有觀點認為,這些智能計算方法已廣泛用于優(yōu)化搜索等問題,并取得了良好的實用效果,但從理論上講目前除了模擬退火外,大部分尚沒有完備的數(shù)學論證,缺乏深入的理論分析,這也正是科學家大有可為的探索領(lǐng)域【2J【31。目前,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)展成為十分熱門的交叉學科,它涉及生物、電子、計算機、數(shù)學和物理等學科,有著廣泛的應(yīng)用背景,特別是在圖像處理領(lǐng)域目標跟蹤、目標辨識、數(shù)據(jù)壓縮、特征提取、噪聲抑制、圖像識別等具有重要的電子科技大學碩士學位論文地位。當然隨著人工神經(jīng)網(wǎng)絡(luò)應(yīng)用的深入,人們發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)也不是盡善盡美的,它的模型和算法都在進一步的探索之中,相信隨著人工神經(jīng)網(wǎng)絡(luò)研究的進一步深入,其應(yīng)用領(lǐng)域會更廣,用途會更大。12相關(guān)技術(shù)及其研究動態(tài)121圖像識別系統(tǒng)圖11給出了圖像識別系統(tǒng)框圖。由圖可見,圖像識別系統(tǒng)由三個環(huán)節(jié)組成。待識別圖像圖11圖像識別系統(tǒng)框圖結(jié)果輸出1數(shù)據(jù)獲取來自現(xiàn)實世界的模擬數(shù)據(jù),如圖片、照片、圖像、景物等由一個傳感器收集,且被轉(zhuǎn)換成適合計算機處理的形式,即將物理量變成_組測量值。2數(shù)據(jù)處理數(shù)據(jù)處理包括預處理、特征提取和特征選擇。預處理技術(shù)的目的是改善圖像質(zhì)量,清除圖像中的噪聲,減輕或消除因傳感器與傳輸介質(zhì)本身不完善而引起的退化現(xiàn)象,便于機器分析處理等。特征提取就是從圖像中提取一組反映圖像特征的基本元素或數(shù)字值。特征選擇則是從已經(jīng)抽取的特征中選擇能夠更好地完成分類識別任務(wù)的特征來表示原圖像。3判決分類判決分類就是采用一定的準則或機制建立分類規(guī)則,并用它們對未知圖像模式進行分類識別。用于解決圖像識別的方法可以概括成三種一般性的處理方法,即統(tǒng)計法、句法法和模糊法。本文采用的是統(tǒng)計法中的人工神經(jīng)網(wǎng)絡(luò)識別。2第一章緒論122人工神經(jīng)網(wǎng)絡(luò)概述人工神經(jīng)網(wǎng)絡(luò)ARTIFICIALNEURALNETWORK,ANN是采用物理可實現(xiàn)的系統(tǒng)來模仿人腦神經(jīng)細胞的結(jié)構(gòu)和功能,由大量人工神經(jīng)元廣泛互連而成的網(wǎng)絡(luò)。ANN是在現(xiàn)代神經(jīng)科學研究成果的基礎(chǔ)上提出來的,是大腦認知活動的一種數(shù)學模型。ANN從腦的神經(jīng)系統(tǒng)結(jié)構(gòu)出發(fā)來研究腦的功能,研究大量簡單的神經(jīng)元的集團處理能力及其動態(tài)行為。ANN的研究重點在于模擬和實現(xiàn)人的認知過程中的感知過程、形象思維、分布式記憶和自學習、自組織過程,特別是對并行搜索、聯(lián)想記憶、時空數(shù)據(jù)統(tǒng)計描述的自組織以及一些相關(guān)聯(lián)的活動中自動獲取知識。ANN的信息處理由神經(jīng)元之間的相互作用來實現(xiàn);知識與信息的存儲表現(xiàn)為互連的網(wǎng)絡(luò)元件間分布式的物理聯(lián)系;網(wǎng)絡(luò)的識別學習和識別決定于各神經(jīng)元連接權(quán)的動態(tài)演化過程【41。人工神經(jīng)網(wǎng)絡(luò)的主要特征表現(xiàn)在1分布式存儲信息。其信息的存儲分布在不同的位置,神經(jīng)網(wǎng)絡(luò)是用大量神經(jīng)元之間的連接及對各連接權(quán)值的分布來表示特定的信息,從而使網(wǎng)絡(luò)在局部網(wǎng)絡(luò)受損或輸入信號因各種原因發(fā)生部分畸變時,仍然能夠保證網(wǎng)絡(luò)的正確輸出,提高網(wǎng)絡(luò)的容錯性。2并行協(xié)同處理信息。神經(jīng)網(wǎng)絡(luò)中的每個神經(jīng)元都可以根據(jù)接收到的信息進行獨立的運算和處理,并輸出結(jié)果,同一層中的各神經(jīng)元的輸出結(jié)果可被同時計算出來,然后傳輸給下一層做進一步處理,這體現(xiàn)了神經(jīng)網(wǎng)絡(luò)并行運算的特點,這一特點使網(wǎng)絡(luò)具有非常強的實時性。雖然各個神經(jīng)元的結(jié)構(gòu)極其簡單,功能有限,但大量神經(jīng)元構(gòu)成的網(wǎng)絡(luò)系統(tǒng)所能實現(xiàn)的行為是極其豐富多彩的。3信息處理和存儲合二為一。神經(jīng)網(wǎng)絡(luò)的每個神經(jīng)元都兼有信息處理和存儲功能,神經(jīng)元之間的連接強度的變化,既反映了對信息的記憶,同時又與神經(jīng)元對激勵的響應(yīng)一起反映了對信息的處理。4對信息的處理具有自組織、自學習的特點,便于聯(lián)想、綜合和推廣。神經(jīng)網(wǎng)絡(luò)的神經(jīng)元之間的連接強度用權(quán)值大小來表示,這種權(quán)值可以通過對訓練樣本的學習而不斷變化,而且隨著訓練樣本量的增加和反復學習,這些神經(jīng)元之間的連接強度會不斷增加,從而提高神經(jīng)元對這些樣本特征的反應(yīng)靈敏度。3電子科技大學碩士學位論文現(xiàn)在,人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用已經(jīng)滲透到各個領(lǐng)域,在職能控制、模式識別、計算機視覺、自適應(yīng)濾波和信號處理、非線性優(yōu)化、自動目標識別、連續(xù)語音識別、知識處理、傳感技術(shù)與機器人、生物醫(yī)學工程等方面取得了令人滿意的進展。13主要研究工作與研究成果目標的檢測與跟蹤是人工視覺的重要分支,在軍事信息處理領(lǐng)域中有重要的應(yīng)用意義。通常目標識別既要區(qū)分相近的不同目標又要在同一目標發(fā)生畸變時不致誤判,因而導致識別過程非常復雜,信息量和計算量都很大,然而有實用意義的目標檢測跟蹤必須在足夠短的時間內(nèi)完成。基于人工神經(jīng)網(wǎng)絡(luò)的多信息目標檢測跟蹤技術(shù)具有很大的優(yōu)越性,因為人工神經(jīng)網(wǎng)絡(luò)具有自學、聯(lián)想記憶、計算和智能控制能力,能通過簡單的非線性單元的復合映射而獲得較強的非線性處理能力51。而目前應(yīng)用最多的是前饋型神經(jīng)網(wǎng)絡(luò),特別是BP網(wǎng)絡(luò)。BPBACKPROPAGATION算法是基于梯度下降原理,該算法存在收斂速度慢和收斂精度受限制等問題,本文采用附加動量項的改進BP算法,提高了網(wǎng)絡(luò)處理精度。由于目標圖像存在噪聲干擾等因素,本文在完成了兩類常用的形態(tài)濾波開與閉運算神經(jīng)網(wǎng)絡(luò)設(shè)計的基礎(chǔ)上,結(jié)合實際應(yīng)用要求,采用了從實例集訓練樣本空間中進行優(yōu)化訓練的概念學習方法。在BP神經(jīng)網(wǎng)絡(luò)對實例的學習過程中,通過神經(jīng)元的相互競爭與協(xié)作,不斷調(diào)整其網(wǎng)絡(luò)權(quán)值并分布式地存儲于各神經(jīng)元中,從而完成知識的自動獲取,將外部圖像環(huán)境的特征規(guī)律反映到自身結(jié)構(gòu)上來,賦予神經(jīng)網(wǎng)絡(luò)某種特定的智能,進而實現(xiàn)圖像目標的自動檢測功能。論文的主要研究成果可以歸納為如下幾個方面1采用了一種非線性映射關(guān)系。建立非線性映射關(guān)系現(xiàn)在主要有兩方法一是,鄰域?qū)︵徲蚍椒ǎ欢?,鄰域?qū)ο袼胤椒ā1疚牟扇∴徲驅(qū)ο袼氐姆椒?,建立了一種輸入和輸出的關(guān)系。即采用3X3的模板在圖像上滑動,并以中心為采樣點對圖像進行采樣。這樣不僅降低了輸入的維數(shù),更提高了BP網(wǎng)絡(luò)的訓練速度。2運用圖像的空間特征對圖像進行特征提取。首先對輸入圖像進行預處理,并根據(jù)先驗知識將圖像轉(zhuǎn)化為二值圖像,這樣極大地降低了圖像處理的數(shù)據(jù)容量。然后利用目標的位置特征和云層的灰度特征對圖像進行特征提取,構(gòu)造樣本特征集。4第一章緒論3利用BP神經(jīng)網(wǎng)絡(luò)算法對圖像目標進行檢測與跟蹤。在待檢測的幾十幀圖像中,特征相似的目標和背景都在不停地移動變化,并且有噪聲的干擾。用其中一幅圖像作為輸入樣本,通過BP神經(jīng)網(wǎng)絡(luò)對其進行訓練,在一定的學習規(guī)則下,使網(wǎng)絡(luò)權(quán)值記下了目標和背景的特征。這樣,對于剩下的圖像,BP神經(jīng)網(wǎng)絡(luò)則可以自動地檢測出目標,并能成功地抑制背景和噪聲。14論文安排全文共分為五章,內(nèi)容如下第一章為緒論,介紹了基于BP網(wǎng)絡(luò)的目標檢測與跟蹤的研究背景、意義以及目前的研究、應(yīng)用現(xiàn)狀,明確了本文的研究內(nèi)容,并對本文所做的主要工作做了簡要歸納。第二章介紹了BP網(wǎng)絡(luò)的基本理論,從生物神經(jīng)元引出了人工神經(jīng)元的模型,并介紹了人工神經(jīng)網(wǎng)絡(luò)的主要結(jié)構(gòu)和學習方式;然后重點介紹了BP網(wǎng)絡(luò)結(jié)構(gòu)及其學習算法;最后,提出了BP網(wǎng)絡(luò)應(yīng)用于目標檢測與跟蹤的總體設(shè)計方案。第三章首先介紹了目標檢測的方法,并大致介紹了圖像特征的描述和提取,然后對現(xiàn)有的目標檢測與跟蹤相關(guān)問題做了一個概要性總結(jié),為特征提取和選擇奠定了理論基礎(chǔ)。第四章在已有研究成果的基礎(chǔ)上,對目標圖像進行預處理和特征分析,并訓練出了一種9維輸入L維輸出的BP網(wǎng)絡(luò),用于對目標的自動檢測跟蹤;最后用MATLAB軟件對圖像進行了仿真實驗。第五章對全文做了總結(jié),并對下一步工作做了展望。5電子科技大學碩士學位論文第二章BP網(wǎng)絡(luò)理論1974年,PWERBOS在其博士論文中提出了第一個適合多層網(wǎng)絡(luò)的學習算法,但該算法并未受到足夠的重視和廣泛的應(yīng)用,直到20世紀80年代中期,美國加利福利亞的PDPPARALLELDISTRIBUTEDPROCESSION小組于1986年發(fā)表了PARALLELDISTRIBUTEDPROCESSING一書,將該算法應(yīng)用于神經(jīng)網(wǎng)絡(luò)的研究,才使之成為迄今為止最著名的多層網(wǎng)絡(luò)學習算法一BP算法,由此算法訓練的神經(jīng)網(wǎng)絡(luò),稱之為BP神經(jīng)網(wǎng)絡(luò)。在人工神經(jīng)網(wǎng)絡(luò)的實際運用中,BP網(wǎng)絡(luò)廣泛應(yīng)用于函數(shù)逼近、模式識別、數(shù)據(jù)壓縮等,8090的人工神經(jīng)網(wǎng)絡(luò)模型是采BP網(wǎng)絡(luò)或它的變化形式,它也是前饋網(wǎng)絡(luò)的核心部分,體現(xiàn)了人工神經(jīng)網(wǎng)絡(luò)最精華的部分。21人工神經(jīng)網(wǎng)絡(luò)的理論基礎(chǔ)211生物神經(jīng)元人工神經(jīng)網(wǎng)絡(luò)與它對應(yīng)的生物神經(jīng)網(wǎng)絡(luò)有很大區(qū)別。本節(jié)將簡單介紹人腦功能中那些對人工神經(jīng)網(wǎng)絡(luò)研究有啟示的特征16JF7J。人腦由大量約1011個高度互連的單元每個單元約有104個連接組成。這些單元被稱為神經(jīng)元。神經(jīng)元由三部分組成樹突、細胞體、軸突。樹突是樹狀的神經(jīng)纖維接受網(wǎng)絡(luò),它將電信號傳送到細胞體,細胞體對這些輸入信號進行整合并進行閾值處理。軸突是單根長纖維,它把細胞體的輸出信號導向其他神經(jīng)元。一個神經(jīng)細胞的軸突和另一個神經(jīng)細胞樹突的結(jié)合點稱為突觸。神經(jīng)元的排列和突觸的強度由復雜的化學過程決定確立了神經(jīng)網(wǎng)絡(luò)的功能。神經(jīng)細胞單元的信息是寬度和幅度都相同的脈沖串,若某個神經(jīng)元細胞興奮,其軸突輸出的脈沖串的頻率就高;若某個神經(jīng)細胞抑制,其軸突輸出的脈沖串的頻率就低,甚至無脈沖發(fā)出。根據(jù)突觸對下一個神經(jīng)細胞的功能活動的影響,突觸又可分為興奮性的和抑制性的兩種。神經(jīng)細胞的細胞膜將細胞體內(nèi)外分開,從而使細胞體內(nèi)外有不同的電位,一般內(nèi)部的電位比外部低,其內(nèi)外電位之差稱之為膜電位。突觸使神經(jīng)細胞的膜電位發(fā)生變化,且電位的變化是可以累加的,該6第二章BP網(wǎng)絡(luò)理論神經(jīng)細胞膜電位是它所有突觸產(chǎn)生的電位總和,當該神經(jīng)細胞的膜電位升高到超過一個閾值時,會產(chǎn)生一個脈沖,從而總和的膜電位直接影響該神經(jīng)細胞興奮發(fā)放的脈沖數(shù)。一些神經(jīng)結(jié)構(gòu)是與生俱來的,而其他部分則是在學習的過程中形成的。在學習的過程中,可能會產(chǎn)生一些新的連接,一些連接也可能會消失。神經(jīng)結(jié)構(gòu)在整個生命期內(nèi)不斷進行著改變,后期的改變主要是加強或減弱突觸連接。例如,現(xiàn)在已經(jīng)確認,新記憶的形成是通過改變突觸強度而實現(xiàn)的。人工神經(jīng)網(wǎng)絡(luò)卻沒有人腦這么復雜,但它們之間有兩個關(guān)鍵相似之處。首先,兩個網(wǎng)絡(luò)的構(gòu)成都是可計算單元的高度互連雖然人工神經(jīng)元比生物神經(jīng)元簡單得多。其次,處理單元之間的連接決定了網(wǎng)絡(luò)的功能。人工神經(jīng)網(wǎng)絡(luò)的根本目標就是在網(wǎng)絡(luò)中采用合適的連接來解決特定問題。212人工神經(jīng)元模型按照生物神經(jīng)元的結(jié)構(gòu)和工作原理,構(gòu)造一個人工神經(jīng)元結(jié)構(gòu)如圖2I所示。來其神兀輸?shù)娜隤1P2P連接權(quán)A外部輸入圖2I人工神經(jīng)元模型人工神經(jīng)元是人工神經(jīng)網(wǎng)絡(luò)的基本單元,從圖中可以看出,它相當于一個多輸入單輸出的非線性閾值器件。定義PPL,P2,PR】T表示其他神經(jīng)元的軸突輸出,亦即該神經(jīng)元的輸入向量;0【IL,【I2,1R】表示其他神經(jīng)元與該神經(jīng)元R個突觸的連接強度,亦即權(quán)值向量,其每個元素的值可正可負,分別表示為興奮R性突觸和移植性突觸;B為神經(jīng)元的閾值,如果神經(jīng)元輸入的加權(quán)和善IIPI大于7自他經(jīng)電子科技大學碩士學位論文B,則該神經(jīng)元被激活,所以輸入向量的加權(quán)和也稱為激活值;F表示神經(jīng)元的輸入輸出關(guān)系函數(shù),亦即傳輸函數(shù)。因為激活值越大,表示神經(jīng)元的膜電位總和越大,該神經(jīng)元興奮所發(fā)放的脈沖數(shù)越多,所以脈沖函數(shù)一般為單調(diào)升函數(shù)。但它又是一個有限值函數(shù),因為神經(jīng)元發(fā)放的脈沖數(shù)是有限的。這樣,神經(jīng)元的輸出可以表示為RAF善OOIPIB21從以上分析可以看出,人工神經(jīng)元反映了生物神經(jīng)元的基本功能。213神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)只有上億個生物神經(jīng)元連接成生物神經(jīng)網(wǎng)絡(luò),才能完成對外部感知信息進行的處理、記憶、學習等。同樣,單個人工神經(jīng)元往往不能完成對輸入信號的處理,它要按一定的規(guī)則連接成網(wǎng)絡(luò),并讓網(wǎng)絡(luò)中每個神經(jīng)元的權(quán)值和閾值按一定的規(guī)則變化,才能實現(xiàn)所設(shè)計神經(jīng)網(wǎng)絡(luò)的功能要求。人工神經(jīng)網(wǎng)絡(luò)的連接形式和拓撲結(jié)構(gòu)多種多樣,但總的來說有兩種形式,即分層型和互連型神經(jīng)網(wǎng)絡(luò)。分層型神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)如圖22所示,它又分為簡單前饋型網(wǎng)絡(luò)、反饋型前饋網(wǎng)絡(luò)和內(nèi)層互連前饋網(wǎng)絡(luò)。分層型神經(jīng)網(wǎng)絡(luò)將所有神經(jīng)元按功能分為若干層,一般有輸入層、中間層和輸出層,各層順序連接。因為中間層不直接與外部輸入和輸出打交道,所以又稱為隱層。根據(jù)處理功能的不同,隱層可以有多層一般不超過兩層,也可以沒有。A一般前饋網(wǎng)絡(luò)8B反饋型前饋網(wǎng)絡(luò)第二章BP網(wǎng)絡(luò)理論C內(nèi)層互連前饋網(wǎng)絡(luò)圖22分層型神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)互連型神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)如圖23所示,其網(wǎng)絡(luò)的任意兩個神經(jīng)元都相互連接,構(gòu)成全互連神經(jīng)網(wǎng)絡(luò);如果不是全部的神經(jīng)元都彼此相互連接,則構(gòu)成局部互連神經(jīng)網(wǎng)絡(luò)。圖23互連型神經(jīng)網(wǎng)絡(luò)在人工神經(jīng)網(wǎng)絡(luò)的發(fā)展過成中,對生物神經(jīng)系統(tǒng)已從不同的角度進行了不同層次的描述和模擬,提出了各種各樣的神經(jīng)網(wǎng)絡(luò)模型,其中最具代表性的網(wǎng)絡(luò)模型有感知器神經(jīng)網(wǎng)絡(luò)、線性神經(jīng)網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)、自組織網(wǎng)絡(luò)、反饋網(wǎng)絡(luò)等。214神經(jīng)網(wǎng)絡(luò)的學習方式人工神經(jīng)網(wǎng)絡(luò)與生物神經(jīng)網(wǎng)絡(luò)一樣,必須經(jīng)過學習,才具有智能特性。人工神經(jīng)網(wǎng)絡(luò)的學習過程,實際上就是調(diào)節(jié)權(quán)值和閾值的過程。模仿人的學習過程,人們提出了多種神經(jīng)網(wǎng)絡(luò)的學習方法,其中主要有三種形式有教師學習、無教師學習和強化學習。1,有教師學習監(jiān)督學習有教師學習是在有“教師“指導和考察的情況下進行學習的方式,如圖249電子科技大學碩士學位論文所示。期望輸出輸出圖24有教師學習方式這種學習方式,教師給出了與所有輸入模式P對應(yīng)的輸出模式的“正確答案,即期望輸出T目標,用于學習的輸入輸出模式的集合稱為訓練樣本集;神經(jīng)網(wǎng)絡(luò)學習系統(tǒng)根據(jù)一定的學習規(guī)則進行學習,每一次學習過程完成后,“教師“都要考察學習的結(jié)果,即實際輸出A與期望輸出T的差別誤差E,以此決定網(wǎng)絡(luò)是否需要再次學習,并根據(jù)誤差信號調(diào)整學習的進程,使網(wǎng)絡(luò)實際輸出和期望輸出的誤差隨著學習的反復進行而逐漸縮小,直至達到要求的性能指標為止。對誤差信號可以有不同的定義,常用的有1均方誤差MSEMEANSQUAREDERRORMSEEE】幫NTKAK2JIJ11N式中N輸出單位數(shù);A廠第K個輸出單元的實際值;T廣第K個輸出單元的期望目標值。2平均絕對誤差MAEMEANABSOLUTEERROR1022第二章BP網(wǎng)絡(luò)理論MAEN著1ITKAKLN3誤差平方和SSESUMSQUAREDERRORSSE2薈TK_AK22無教師學習無監(jiān)督學習無教師學習不存在“教師“的指導和考察,所示。2324是靠神經(jīng)網(wǎng)絡(luò)本身完成,如圖25圖25無教師學習方式由于沒有現(xiàn)成的信息作為響應(yīng)的校正,學習則是根據(jù)輸入的信息,根據(jù)其特有的網(wǎng)絡(luò)結(jié)構(gòu)和學習規(guī)則來調(diào)節(jié)自身的參數(shù)或結(jié)構(gòu)這是一種自學習、自組織過程,從而使網(wǎng)絡(luò)的輸出反映輸入的某種固有特性如聚類或某種統(tǒng)計上的分布特征。3強化學習再勵學習強化學習介于上述學習方式之間,如圖26所示。外部環(huán)境對學習后的輸出結(jié)果只給出評價信息獎或懲,而不給出正確答案。神經(jīng)網(wǎng)絡(luò)學習系統(tǒng)通過強化那些受獎勵的行為來改善自身的性能。無論哪種學習方式,其學習過程都有一定的規(guī)則,神經(jīng)網(wǎng)絡(luò)典型的學習規(guī)則有HEBB學習規(guī)則、誤差糾正學習規(guī)則、競爭學習規(guī)則等,在下面將結(jié)合具體的網(wǎng)絡(luò)模型進行介紹。電子科技大學碩士學位論文圖26強化學習方式22BP網(wǎng)絡(luò)模型及學習算法由非線性變換單元組成的前饋網(wǎng)絡(luò),簡稱BP網(wǎng)糾7】。221BP神經(jīng)元及BP網(wǎng)絡(luò)模型BP神經(jīng)元模型如圖27所示。輸入神經(jīng)元廣廠JP1P2PR圖27BP神經(jīng)網(wǎng)的一般模型BP神經(jīng)網(wǎng)絡(luò)與其他神經(jīng)元類似,不同的是BP神經(jīng)元的傳輸函數(shù)見表21為非線性函數(shù),最常用的函數(shù)是LOSIG和TANSIG函數(shù),有的輸出層也采用線性函數(shù)PURELIN。其輸出為ALOSIGWPB2512第二章BP網(wǎng)絡(luò)理論表21傳輸函數(shù)名稱輸入輸出故關(guān)系圖標MATLAB函數(shù)硬極限函數(shù)A0,N0線性函數(shù)ANPURELIN飽和線性函數(shù)A0,NL對稱飽和線性A1,IIL對數(shù)S形函數(shù)1A一1EN109SIG雙曲正切S形ENE一ATANSIG函數(shù)E“EN正線性函數(shù)A0,N,P2,T2,PQ,TQ這里PQ是網(wǎng)絡(luò)的輸入,TQ是對應(yīng)的目標輸出。每輸入一個樣本便將網(wǎng)絡(luò)輸出與目標輸出相比較。算法將調(diào)整網(wǎng)絡(luò)參數(shù)以使均方誤差最小化ECO,,I2ETA2】TK一AK】229近似均方誤差的最速下降算法為1。K1鋤K一0【罷0CO,I2K1鴨K一0【罷DI210這里C【為學習速度。到此為止,整個過程和LMS算法是一樣的。下面將敘述偏導數(shù)的計算。2222鏈法則211因為誤差是隱層中的權(quán)值的隱函數(shù),所以下面將用微積分中的鏈法則來計算偏導數(shù)。因為罷罷粵一譏S1IAO嚕一A0VS1土“S1A0因為面面薔D【1I。、F噸忸。一0E里墮S,墊S,002A1;S,A1A蛐ON,A姚。A蛐。一所以T01K111K一僅S1A。02K102K一QS2。A1這里,SII1,2為E對第I層的輸入元素變化的敏感性。212213214215第二章BP網(wǎng)絡(luò)理論2223敏感性的反向傳播現(xiàn)在還需要計算敏感性SI,這要求再次使用鏈式法則。正是這個過程給出了反向傳播這個詞,因為它描述了第I層的敏感性通過第IL層的敏感性來計算的遞推關(guān)系。因為S。罷昌罷誓S210O一2A12161AN,AN,ANAN而JON一20JCA1宣O皇奠;I20FLN102TN。217OAN,AN,N,0N,“、所以S1S2602。F1N1218S2;罷箋笪;一2TA_0A一AN,AN,、,AN,又因為ZZZ。一2TA皇蘭三Q立一2TA重2N2所以S22TAF2N2由式220和式218可知,第二層的敏感性可以由已知算出,敏感性由第二層的敏感性推出,這就是反向傳播。2224小結(jié)下面小結(jié)BP算法。第一步是通過網(wǎng)絡(luò)將輸入向前傳播AOPAM“FMLCOM“AMBM1,MO,1,M一1AAM17219220第一層的221222223電子科技大學碩士學位論文。F一步是通過網(wǎng)絡(luò)將敏感性反向傳播SM一2童MNMTA224SMFMNM1M1TSMLMML2,1225最后使用近似的最速下降法更新權(quán)值和偏離值IMK1IMK一ASMAM“T226BMK1BMK一ASM22723BP網(wǎng)絡(luò)應(yīng)用于目標檢測與跟蹤的總體設(shè)計方案231統(tǒng)計模式識別方法統(tǒng)計模式識別方法又稱為判別理論或判別式方法,人工神經(jīng)網(wǎng)絡(luò)識別屬于此類判別。統(tǒng)計法是模式識別研究中展開得最早并獲得最大成功得課題。統(tǒng)計法以概率統(tǒng)計理論為基礎(chǔ),其基本思想是無論輸入的對象是什么,它都被表示為一個數(shù)組。這組數(shù)組不是任意的,而是適當選擇的、對原始數(shù)據(jù)進行各種測量的結(jié)果,它們刻畫了輸入對象的特征,故稱之為對象的特征向量。如果用N個特征來表示模式,則模式的機器表示就是N維特征向量【9J11。對于每一個確定的對象或模式,都有一個特征向量與之對應(yīng)。特征向量的全體就構(gòu)成模式的特征空間。特征向量是特征空間中的點,輸入模式就與特征空間中的點對應(yīng)。盡管來自統(tǒng)一類模式的對象的特征向量往往是不同的隨機的,但就空間幾何距離而論,它們在特征空間中的對應(yīng)點總是互相接近的。于是,統(tǒng)計模式識別問題就變成尋找空間中一些區(qū)域來識別每一輸入對象的問題。換言之,統(tǒng)計模式識別是將特征空間劃分為若干個比如K個子空間,每個子空間就對應(yīng)一個模式類,則將所有模式分為K類。當未知模式的特征向量落在代表第L類模式的子空間中,則斷定該未知模式屬于第L類。18第二章BP網(wǎng)絡(luò)理論232基本流程和思路基于BP網(wǎng)絡(luò)的目標檢測與跟蹤系統(tǒng)框圖如圖210所示。由圖可見,整個系統(tǒng)由兩個連貫的階段即分析階段和識別階段組成。圖中下半部分是識別階段,即對未知類別的樣本進行分類;上半部分為分析階段,即對己知類別的樣本的樣本制定出判別函數(shù)及判別規(guī)則,以便對待識別樣本進行分類識別。訓練樣本未知樣本自適應(yīng)部分段段圖210基于BP網(wǎng)絡(luò)的目標檢測與跟蹤系統(tǒng)1待識別樣本是從未知模式類中隨機抽取的一個樣本。訓練樣本是人工識別的用于制定分類判別函數(shù)的抑制類別模式。2預處理包括清除噪聲和干擾,過濾、復原和增強、模式的編碼和近似以及數(shù)據(jù)壓縮等。對于不同的模式有不同的要求,常選擇不同的預處理方法。預處理是一個非常重要的環(huán)節(jié),如果不能得到一個良好的預處理結(jié)果,模式識別就不會得到好的結(jié)果,有時甚至無法進行。3特征抽取是將待識別對象的某些特征無論是物理的還是形態(tài)的都加以數(shù)字化的過程,即將一個客觀實體即模式轉(zhuǎn)換為數(shù)字特征集。4特征選擇是從經(jīng)過預處理的模式中挑選一批樣本進行分析,選取對完成分類要求來說最可能達到目的的特征集。19電子科技大學碩士學位論文特征抽取與特征選擇是模式識別的關(guān)鍵。當己知某一個特征集可以區(qū)分模式時,實際上模式識別任務(wù)已接近完成。當選定某一組特征后,并按該特征對模式進行抽取以致分類,如果得不到滿意結(jié)果,還要回過頭來重新選取特征,改進特征抽取方法,如此反復多次,直到得到滿意結(jié)果為止。5自適應(yīng)部分是根據(jù)訓練樣本集找出一個有效的分類規(guī)律。其基本過程是當訓練樣本根據(jù)某些準則制定出一些判決規(guī)則以后,再對這些訓練樣本逐個進行檢測,觀察是否有誤差,如果有的話,就需要進一步改善判別規(guī)則,直到滿意為止。在用了越來越多的樣本以后,分類器的性能將可以得到改善。第三章運動目標檢測與跟蹤的相關(guān)研究第三章運動目標檢測與跟蹤的相關(guān)研究為了方便后續(xù)章節(jié)的理解,本章首先介紹了運動目標檢測和跟蹤的方法;然后介紹了常用的圖像特征描述方法,包括顏色、紋理、形狀等特征,并對現(xiàn)有的目標提取方法進行了總結(jié)接著介紹了運動目標檢測涉及到的幾個問題;最后探討了目前目標檢測和識別研究遇到的難點問題,為后面的BP網(wǎng)絡(luò)設(shè)計指明了重點和方向。31運動目標的檢測和跟蹤方法按照目標與攝像機之間的關(guān)系,運動目標檢測可以分為靜態(tài)背景下運動目標檢測和動態(tài)背景下的運動目標檢測。所謂靜態(tài)背景下的運動目標檢測是指攝像機在整個監(jiān)視過程中不發(fā)生移動,只有被監(jiān)視目標在攝像機的視場內(nèi)運動,這個過程只有目標相對于攝像機的運動動態(tài)背景下運動目標檢測是指攝像機在整個監(jiān)視過程中發(fā)生了移動如平動、旋轉(zhuǎn)或多自由度運動,被監(jiān)視目標在攝像機的視場內(nèi)也發(fā)生了運動,即在監(jiān)視過程中目標與攝像機之間產(chǎn)生了復雜的相對運動。311運動目標的檢測靜態(tài)背景下運動目標檢測主要有三種常用方法幀差法【11】121,背景差分法113J和光流法【1416。幀差法是根據(jù)圖像中像素點的灰度差計算出運動物體的位置和形狀等信息,這種方法對于動態(tài)環(huán)境有很好的適應(yīng)性,但不能提取出較完整的運動目標背景差分法是一種特殊的幀差法,它能夠較完整的提取出運動目標,但對光照和外部條件造成的動態(tài)場景變化過于敏感光流法是基于對光流場的估算進行檢測分割的方法。針對光流法中的孔徑問題,人們提出了各種方法來克服這一問題。例如使用光流全局平滑性假設(shè)來求解光流的HORNSHCUNCK方法;使用一個模型通過最小二乘法來擬合像素點領(lǐng)域內(nèi)的光流值,約束光流進行局部調(diào)整的LUCASKNADA方法利用二階導數(shù)求光流的NGAEL方法和利用魯棒回歸算法計算光流,克服遮擋時運動邊界信息不可靠問題的魯棒計算法等。光流法經(jīng)過改進,能夠在21電子科技大學碩士學位論文攝像機運動情況下較好地檢測出運動目標,但是這種方法的計算復雜,不適于實時處理。動態(tài)背景下的運動檢測由于存在著目標與攝像機之間復雜的相對運動,所以算法也要比靜態(tài)背景下運動目標檢測算法復雜的多,常用的動態(tài)背景下運動檢測算法有塊匹配法、光流估計法、圖像匹配法以及全局運動估計法等。312運動目標跟蹤方法基于視頻或圖像序列的運動目標跟蹤長期以來都是計算機視覺,數(shù)字視頻與圖像處理和模式識別領(lǐng)域中一個非常重要和活躍的研究課題。所謂運動目標跟蹤,就是在運動目標檢測的基礎(chǔ)上,利用目標的有效特征,使用適當?shù)钠ヅ渌惴?,在序列圖像中尋找與目標模板最相似候選目標的位置,簡單說就是在序列圖像的每一幅圖像中為目標定位。在研究過程中,運動目標跟蹤是銜接運動目標檢測和目標行為分析與理解的一個重要環(huán)節(jié),在實際應(yīng)用中,運動目標跟蹤不僅可以提供目標的運動軌跡和準確的位置,而且反過來還可以為運動目標檢測提供幫助,從而更有利于運動目標的跟蹤。運動目標跟蹤的方法中不論目標是剛體與非剛體目標,單目標與多目標,攝像機固定下的目標與攝像機運動下的目標,復雜場景中的目標與簡單背景中的目標,都是要依據(jù)目標和目標所處的環(huán)境,選擇一個或多個能唯一表示目標的特征,然后在后續(xù)圖像中搜索與所選征最匹配的目標位置,所以運動目標跟蹤的主要工作就是選擇好的目標特征和采用適用的算法。目前的運動目標跟蹤算法有的是針對提高跟蹤匹配的準確性而提出的,其主要特點是通過選取好的跟蹤特征來提高目標的搜索匹配速度和匹配的正確程度,有的是針對縮小目標搜索范圍從而提高匹配準確性和速度而提出的,其主要特點是通過某種方法預測目標下一時刻可能出現(xiàn)的位置或確定一個目標的搜索方向,通過縮小目標的搜索范圍來縮短目標搜索的時間同時又提高了搜索的準確性。運動目標跟蹤一般有以下幾個部分組成L,在視頻或圖像序列中檢測到新的運動目標及運動區(qū)域2,對檢測到的運動目標提取有效特征并建立目標模板3,找到合適的算法進行跟蹤。第三章運動目標檢測與跟蹤的相關(guān)研究32圖像特征及提取321圖像的特征描述視頻是在時間上連續(xù)的一系列圖像幀的集合。視頻數(shù)據(jù)所包含的視覺內(nèi)容包括顏色、紋理、形狀和運動信息。其中,運動信息是視頻區(qū)別于一般靜態(tài)圖像數(shù)據(jù)所特有的內(nèi)容,如運動對象的大小變化、運動軌跡等?;谝曨l的運動分析獲取的原始數(shù)據(jù)為視頻或圖像序列。數(shù)字視頻有其自身的特點視頻數(shù)據(jù)含有豐富的信息內(nèi)容,表現(xiàn)在視頻數(shù)據(jù)有較高的信息分辨率,內(nèi)容的多樣性,解釋的多樣性及模糊性;視頻數(shù)據(jù)既有空間屬性又有時間屬性;視頻數(shù)據(jù)有巨大的數(shù)據(jù)量。數(shù)內(nèi)字視頻有容上的層次性。數(shù)字視頻作為一種重要的多媒體信息,屬于一種非字符數(shù)值數(shù)據(jù),它與字符數(shù)值數(shù)據(jù)有很大的不同,是有多幅連續(xù)的圖像序列構(gòu)成。其中X軸及Y軸表示水平及垂直方向的空間維,而T軸表示時間維。若一幅圖像沿時間軸保持一個時間段T,利用人眼的視覺暫留作用,可形成連續(xù)運動圖像的感覺。人眼在亮度信號消失后亮度感可保持120110秒的時間。如果每幀圖像交換速度足夠快一般為每秒25。30幀,人眼就感覺不到圖像的不連續(xù)。由圖210可以看出特征的提取與選擇在目標識別中的重要作用,本節(jié)將簡單介紹一下常用的圖像特征表示方法,以方便更好地選取適用于本文目標識別的特征,為特征的提取與表示奠定基礎(chǔ)。L,形狀特征預處理得到的目標區(qū)域,經(jīng)常使用一種適合于計算機進一步處理的形式,對得到的像素區(qū)域進行表示和描述?;旧希硎疽粋€區(qū)域包括兩種選擇可以用其外部特性如它的邊界,也可以用其內(nèi)部特性來表示區(qū)域如組成區(qū)域的像素。即形狀描述可分為兩個范疇基于邊界和基于區(qū)域。這兩個范疇最成功的描述是傅立葉描述子和不變矩。2,紋理特征紋理是所有物體具有的特性,是區(qū)域的屬性,如云彩,樹木,磚,頭發(fā)等,它有不同的表面結(jié)構(gòu)等重要信息。雖然每個人都能夠辨識紋理,但是很難給紋理下一個準確的定義,當前,通常比較粗略的可將紋理定義為紋理是對圖像的象素灰度級在空間上的分布模式的描述,反映物品的質(zhì)地,如粗糙度、光滑性、顆電子科技大學碩士學位論文粒度、隨機性和規(guī)范性等。當圖像中大量出現(xiàn)同樣的或差不多的基本圖像元素模式時,紋理分析是研究這類圖像的重要的手段之一。紋理特征就是從物體圖像中計算出一個值,對物體灰度級變化的特征進行量化。3,顏色特征在圖像處理中,顏色作為描述圖像的重要特征一直受到研究人員的重視。運用顏色主要受兩個因素推動。第一,人可以辨別幾千種顏色色調(diào)和亮度,相形之下只能辨別幾十種灰度層次,此因素對于人工圖像分析特別重要。第二,顏色是一個強有力的描述子,它常常可簡化目標物的區(qū)分及從場景中抽取目標??傊环鶊D像有很多特征表示方法。常用的形狀、紋理、顏色等都屬于底層視覺特征,選擇什么樣的特征表示圖像取決于具體的應(yīng)用。除了基于視頻的運動分析研究課題外,特征描述也是許多其他研究、應(yīng)用領(lǐng)域涉及的重要問題,如圖像分割、基于內(nèi)容的圖像檢索、基于內(nèi)容的視頻檢索、人臉檢測、表情分析等。322目標的特征提取提取特征是運動目標識別的一個重要環(huán)節(jié),根據(jù)所研究的對象和對象所處的環(huán)境選擇適合的目標特征也是一個關(guān)鍵步驟。圖像目標特征又可以根據(jù)識別情況分為三類全局特征、局部特征和關(guān)系特征。全局特征通常是整幅圖像區(qū)域的一些特征,如目標面積、周長、傅立葉描述子、不變矩特征和自回歸模型等特征,全局特征可以通過考慮區(qū)域內(nèi)的所有點來得到,或只考慮區(qū)域邊界上的所有點來得到,全局特征是考慮所有點的位置、強度特性和空間關(guān)系來得到,所以全局特征對隨機噪聲具有一定的魯棒性。由于全局特征是基于整體統(tǒng)計特性的特征,當目標有部分缺損時,缺損部分對其影響很大,因此識別效果將會變差。局部特征代表了目標的局部信息,通常位于目標的邊界上或者表示區(qū)域中可分辨的一個小曲面,比如高曲率點也叫做角點。局部特征既有有計算頂點處的角度和相鄰邊的長度來得到,也有用求局部輪廓序列等方法來得到,在有遮擋或圖像不完整的情況下,使用目標的局部特征比用目標的局特征更有效,但是局部特征對噪聲較為敏感。關(guān)系特征是基于區(qū)域、封閉輪廓或局部特征等不同實體的相對位置建的,這些特征通常包括特征之間的距離和相對方位測量值等等,它們在基于使用圖像區(qū)域或局部特征來識別和描述物體目標時是非常有用的。第三章運動目標檢測與跟蹤的相關(guān)研究一般情況下,我們可以選擇一個有區(qū)分度的目標特征作為目標特征匹配的標準實現(xiàn)運動目標的跟蹤,如目標的邊緣、輪廓或目標的顏色直方圖等而在對復雜目標跟蹤時,如對人或人的某個部分的跟蹤,由于人或人的某個部分是非剛體目標,隨著人的運動形狀和姿態(tài)都會發(fā)生變化,所以聯(lián)合多種特征進行目標跟蹤是一種很直接,也是很有效的方法。在完成了目標特征的選取后,就要選擇適用的算法來實現(xiàn)目標的定位。下面介紹目標識別的相關(guān)問題。33目標檢測與跟蹤的相關(guān)問題目標檢測跟蹤是可以看作是這樣一個處理過程得到未知目標的觀測數(shù)據(jù),用一組合適的特征代表目標作為輸入,輸出此目標的位置或者運動軌跡。331運動目標的定位問題為了描述目標,首先需要確定圖像中有可能對應(yīng)于目標區(qū)域的像素集合,即目標定位。目標定位通常有兩種常用的處理方法,基于運動的策略和特定目標檢索基于圖像的策略,這兩種方法在一定程度上有互補性。1,基于運動策略的目標定位方法基于運動的策略【17】假定是在靜止攝像機或靜止背靜情況下,檢測出場景中與背景有相對運動的像素集合,并對這些像素進行去噪、分割等處理以確定可能對應(yīng)于目標的前景區(qū)域。目前,通常運用背景減除法、幀差分法或者光流法提取出視頻圖像中的運動區(qū)域;跟蹤檢測到的運動區(qū)域;然后對跟蹤區(qū)域執(zhí)行分類算法以確定它們的類別將目標區(qū)域分類為飛機、云層、。大樹等等?;谶\動的目標定位方法主要是根據(jù)目標相對于背景運動這一特性來檢測目標區(qū)域。這種方法的特點是幾乎不需要場景中目標類別的任何先驗知識,而對檢測到的運動區(qū)域進行目標分類的工作可以留到分類算法中實現(xiàn)。運動檢測處理后,對于提取到的運動目標需要進一步抽取特征,設(shè)計分類器以實現(xiàn)目標分類算法。2,基于圖像的特定目標檢索策略基于圖像的特定目標檢索策略不依賴于目標運動,直接在整幅圖像中進行全局搜索,判斷圖像中是否包含屬于特定類別的目標【L踟。每一幅圖像以整體作為輸入,然后在整個圖像空間中尋找符合感興趣目標典型特征的像素區(qū)域,即比較所電子科技大學碩士學位論文有可能的待檢測區(qū)域與目標模板的匹配度,例如人臉、車輛或花朵等。這種特定目標模板需要事先利用一組屬于此類目標的已標記樣本進行訓練得到。本文結(jié)合實際,采用的是基于圖像的特定目標檢索策略對目標區(qū)域進行特征提取。332有監(jiān)督學習目標識別問題通常被歸為有監(jiān)督的學習問題。監(jiān)督學習必須對所有的學習樣本做類別標記,學習算法是通過對一組已標記樣本數(shù)據(jù)的訓練來實現(xiàn)的。監(jiān)督式學習是從問題中取得訓練范例的輸入變數(shù)值和對應(yīng)的目標輸出變數(shù)值,進而從中學習輸入和目標輸出問的關(guān)系。學習算法或分類器確定某個判決界限,使得按這種判決規(guī)則對待識別對象與訓練樣本有相同分布進行分類所造成的錯誤識別率最小。目前,已經(jīng)有多種用于實現(xiàn)目標識別問題的學習算法,如支持向量機、BOOSTING、最近鄰分類器,邏輯線性分類器,神經(jīng)網(wǎng)絡(luò)和貝葉斯分類器等等。34運動目標檢測與跟蹤的難點問題對于計算機來說運動目標的檢測與跟蹤是一件有難度的工作,將不同的像素區(qū)域分類為有意義的目標區(qū)域需要一定的智能和很多有用的視覺信息顏色,形狀,局部特征,空間上的連續(xù)性等等。但是計算機不同于人類,沒有關(guān)于視覺設(shè)備的方位和距離上的先驗知識,而且攝像機只能捕獲到真實目標在像素平面的投影圖像,即使運用多攝像機進行運動目標的三維恢復來解決遮擋和深度問題,也涉及到多攝像機之間的選擇和信息融合等較復雜的問題。概括的講目標檢測研究主有以下幾方面的難點1,運動目標提取的準確性直接影響目標檢測跟蹤的準確性。由于攝像機性能和環(huán)境變化等許多因素的影響,提取目標前景區(qū)域時的精確性有時不盡理想,影響了后續(xù)任務(wù)的有效性。例如,有些目標前景區(qū)域提取不完整、有些包含部分影子,這些都會改變目標的原有形狀,使目標的檢測跟蹤更復雜,因此需要目標檢測算法具有一定魯棒性。2,解決特征向量對目標姿態(tài)的容忍性是非常必要的。由于待檢測目標的運動性及攝像機與目標相對位置的差異,同一個運動目標即使在相同的環(huán)境下也可以第三章運動目標檢測與跟蹤的相關(guān)研究得到不同姿態(tài)的運動目標圖像,例如,同一個人的正面和側(cè)面輪廓就有較大差別。目標檢測處理應(yīng)對目標姿態(tài)的變化有一定容忍性。3,尋找一組穩(wěn)定的特征量,給運動目標分類器提供良好的輸入。雖然理論上可以將提取到的運動目標圖像作為輸入,但是圖像所獲得的數(shù)據(jù)量是相當大的,并且不容易反映不同類別間的本質(zhì)區(qū)別。因此,需要尋找一組穩(wěn)定的、最能反映分類本質(zhì)的特征量。目前尚沒有一致公認有效的特征集合??偨Y(jié)以上論述可以看出,運動目標檢測跟蹤是基于視頻的運動分析中的一個重要的研究內(nèi)容,對目標檢測的研究應(yīng)該在借鑒已有成果的基礎(chǔ)上進行,重點針對目標的特征提取和學習算法進行分析研究。電子科技大學碩士學位論文第四章基于BP網(wǎng)絡(luò)的目標檢測與跟蹤的實現(xiàn)方法BP神經(jīng)網(wǎng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 管理崗位績效管理辦法
- 學校地基歸誰管理辦法
- 競賽教練考核管理辦法
- 腸息肉中醫(yī)教學課件
- 福建第三次質(zhì)檢數(shù)學試卷
- 汾陽初中二模數(shù)學試卷
- 畢業(yè)設(shè)計(論文)-家用照明智能控制系統(tǒng)的設(shè)計
- 2025至2030大米行業(yè)市場深度研究與戰(zhàn)略咨詢分析報告
- 德國職業(yè)教育的數(shù)字化轉(zhuǎn)型:戰(zhàn)略規(guī)劃、項目布局與效果評估
- 麗水農(nóng)林技師學院招聘教師筆試真題2024
- 水利工程隱患排查課件
- 醫(yī)藥公司廉政管理制度
- T/CEPPEA 5023-2023風光儲充一體化充電站設(shè)計規(guī)范
- (人教2024版)英語七下期末全冊分單元總復習課件(新教材)
- 碳資產(chǎn)管理與碳金融 課件 第9章 碳資產(chǎn)管理案例
- 木質(zhì)纖維素納米纖絲基水凝膠傷口敷料的制備與性能研究
- 八五普法自查自評情況報告
- 2025三季度四川經(jīng)準檢驗檢測集團股份限公司招聘48人易考易錯模擬試題(共500題)試卷后附參考答案
- 網(wǎng)約車法律培訓
- 深圳市羅湖區(qū)2025年小升初數(shù)學模擬試卷含解析
- 軸承加工合同協(xié)議
評論
0/150
提交評論