




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
PAGE24基于內(nèi)容的圖像檢索-—累加直方圖算法?摘要?隨著多媒體、網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,圖像信息的應(yīng)用日益廣泛,對規(guī)模越來越大的圖像數(shù)據(jù)庫、可視信息進(jìn)行有效的管理成為迫切需要解決的問題,靈活、高效、準(zhǔn)確的圖像檢索策略是解決這一問題的關(guān)鍵技術(shù)之一。因此,基于內(nèi)容的圖像檢索已成為國內(nèi)外學(xué)者研究的主要熱點(diǎn)問題,并取得了不少的成果。本文主要對當(dāng)今熱門的基于內(nèi)容的圖像檢索技術(shù)進(jìn)行了研究,重點(diǎn)對它的算法進(jìn)行研究。在半年的時(shí)間里,通過查閱很多相關(guān)的資料,并認(rèn)真學(xué)習(xí)了基于內(nèi)容的圖像檢索的基本理論,特別是深入研究了顏色直方圖理論和累加直方圖算法,最后在MATLAB平臺(tái)下編程實(shí)現(xiàn)此系統(tǒng),該系統(tǒng)可以實(shí)現(xiàn)基本圖像檢索的功能,根據(jù)用戶輸入的樣本圖像來與圖像庫中的圖像進(jìn)行特征匹配,然后找出與樣本圖像距離比較小的若干幅圖像,并按照圖像之間的距離由小到大的順序顯示給用戶。經(jīng)過對該系統(tǒng)進(jìn)行反復(fù)的調(diào)試運(yùn)行后,該系統(tǒng)所實(shí)現(xiàn)的功能基本達(dá)到了設(shè)計(jì)目標(biāo),并且運(yùn)行良好。當(dāng)用戶提供出所要查詢的關(guān)鍵圖后,系統(tǒng)就可以從用戶提供的圖像庫中檢索到與關(guān)鍵圖相似的圖片并排序返回給用戶,達(dá)到了預(yù)期效果。關(guān)鍵詞:圖像檢索累加直方圖顏色特征MATLABTitleContent-BasedImageRetrieval—-cumulativehistogramalgorithmAbstractWiththerapiddevelopmentofthemultimediaandthenetworktechnology,theimageinformationbecomesmorewidelyavailable,increasingthesizeoftheimagedatabase,visualinformationforeffectivemanagementofanurgentnee(cuò)dtoaddresstheproblem,flexible,efficientandaccurateimageretrievalstrategysolvethisproblemoneofthekeytechnologies.TheresearchersaresokeenonContent—BasedImageRetrievalthattheyhavemademuchprogress。Inthispaper,today’spopularcontent-basedimageretrievaltechnologyisanalyzed。Anditmainlyfocusesontheresearchofitsalgorithm。Inaperiodofhalfayear,Throughaccesstorelevantinformationandtoseriouslystudythecontent-basedimageretrievalofthebasictheory,inparticular,in-depthstudyofthecolorhistogramtheoryandcumulat(yī)ivehistogramalgorithm。Finally,thissystemshouldbeimplementedundertheplatformoftheMATLABbyprogramming。Inthissystem,thebasicimageretrievalfunctionscanbeachieved。itcanaccordtothesamplesuserinputsandthepicturesoftheimagelibrarytomatch.Italsocanidentifytheimagesthathaveashortdistancetothesampleimages,andpresenttotheuserinaccordancewiththeordersteeled.Afterrepeatedlyonthissystemdebuggingoperation,thesystemhaveachievethebasicfunctionsofthedesigngoals,andrunninggood.Whenuserswanttoprovideamapforthekey,thesystemcanprovideimagesfromtheimagelibrarytoretrievethekeyplansandsimilarsortofpicturethenreturnedthemtotheuser.Itachievedtheexpectedresults.KeywordsImageRetrievalCumulativeHistogramAlgorithmColorFeaturesMATLAB目次TOC\o"1—3"\h\z\uHYPERLINK\l”_1__緒論”1緒論?PAGEREF_Toc167715557\h1HYPERLINK\l”_1.1__(dá)國內(nèi)外的研究現(xiàn)狀”1.1國內(nèi)外的研究現(xiàn)狀?1HYPERLINK\l”_1。2_選題意義及本文研究的內(nèi)容"1。2選題意義及本文研究的內(nèi)容?3HYPERLINK\l"_2__基于內(nèi)容的圖像檢索的簡介”2基于內(nèi)容的圖像檢索的簡介?4HYPERLINK\l”_2。1_基于內(nèi)容的圖像檢索概述"2.1基于內(nèi)容的圖像檢索技術(shù)的概述?4HYPERLINK\l”_2.2_基于內(nèi)容的圖像檢索的關(guān)鍵技術(shù)”2。2基于內(nèi)容的圖像檢索的關(guān)鍵技術(shù)?5HYPERLINK\l”_3_基于內(nèi)容的圖像檢索原理和特點(diǎn)”3基于內(nèi)容的圖像檢索原理和特點(diǎn) 6HYPERLINK\l”_3.1_基于內(nèi)容的圖像檢索的原理及處理過程"3.1基于內(nèi)容的圖像檢索的原理及處理過程?6HYPERLINK\l”_3。2_基于內(nèi)容圖像檢索的特點(diǎn)"3。2基于內(nèi)容圖像檢索的特點(diǎn)?8HYPERLINK\l"_4_顏色特征理論”4顏色特征理論?8HYPERLINK\l”_4。1_顏色模型”4.1顏色模型?9HYPERLINK\l"_4.2_顏色特征提取”4.2顏色特征提取 10HYPERLINK\l"_5_顏色直方圖理論"5直方圖理論?12HYPERLINK\l"_5。1_顏色直方圖"5.1顏色直方圖?12HYPERLINK\l"_5.2_直方圖的矩"5。2直方圖的矩?13HYPERLINK\l"_5.3_直方圖均衡化算法"5.3直方圖均衡化算法?14HYPERLINK\l"_5.4_基于直方圖的圖像檢索技術(shù)分析"5.4基于直方圖的圖像檢索技術(shù)分析?14HYPERLINK\l”_6_累加直方圖算法”6累加直方圖算法?16HYPERLINK\l"_6。1_累加直方圖"6.1累加直方圖?16HYPERLINK\l"_6.2_算法實(shí)現(xiàn)”6.2算法實(shí)現(xiàn)?18HYPERLINK\l”_6.3_改進(jìn)的局部累加直方圖算法”6.3改進(jìn)的局部累加直方圖算法 18HYPERLINK\l”_6。4_算法總結(jié)"6。4算法總結(jié) 19HYPERLINK\l"_6。5_實(shí)驗(yàn)結(jié)果”6.5實(shí)驗(yàn)結(jié)果?19HYPERLINK\l"_7_系統(tǒng)的性能評價(jià)"7系統(tǒng)的性能評價(jià)?22HYPERLINK\l”_7。1_查全率和查準(zhǔn)率"7。1查全率和查準(zhǔn)率?22HYPERLINK\l"_7.2_排序評價(jià)方法"7.2排序評價(jià)方法?23HYPERLINK\l"_結(jié)__論”結(jié)論?24HYPERLINK\l"_致__謝”致謝?25HYPERLINK\l”_參_考_文_獻(xiàn)”參考文獻(xiàn)?261緒論隨著多媒體技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,全球的數(shù)字圖像的容量正以驚人的速度增長。面對如此豐富且散布在世界范圍內(nèi)的海量圖像資源,如何從海量的圖像數(shù)據(jù)中高效、快速地檢索出所需信息是當(dāng)前許多應(yīng)用領(lǐng)域所面臨的重要問題.傳統(tǒng)的基于關(guān)鍵詞、文本的圖像檢索技術(shù)的不足日益凸顯,主要體現(xiàn)在僅用關(guān)鍵詞對圖像資源描述的局限性,這種基于個(gè)體對圖像特征主觀認(rèn)識(shí)的描述方法不能充分描述圖像資源;而基于內(nèi)容的圖像檢索技術(shù)(Content—BasedImageRetrieval,CBIR)的研究就是在這種現(xiàn)實(shí)需要的前提下提出并展開的.基于內(nèi)容的圖像檢索這一課題目前已是一個(gè)非?;钴S的研究領(lǐng)域,其在數(shù)字圖書館、數(shù)據(jù)挖掘及多媒體視覺內(nèi)容檢索等領(lǐng)域都起著十分重要的作用,在工業(yè)和科研領(lǐng)域具有廣泛的應(yīng)用性,例如醫(yī)學(xué)研究機(jī)構(gòu)的病理圖像資料管理、公安機(jī)關(guān)的犯罪數(shù)據(jù)分析、氣象局的衛(wèi)星照片管理和網(wǎng)上時(shí)興的電子購物等。但是CBIR評價(jià)研究還處于起步階段,評價(jià)方案和評價(jià)標(biāo)準(zhǔn)都處在探索之中,而特征維度較高、缺乏大規(guī)模的公用測試數(shù)據(jù)集等問題也給CBIR評價(jià)的研究工作帶來了很大的困難和挑戰(zhàn)。本論文的研究工作就是在這樣的情況下開展的。1.1國內(nèi)外的研究現(xiàn)狀1.1.1國內(nèi)的研究現(xiàn)狀隨著我國社會(huì)和經(jīng)濟(jì)的發(fā)展,使得從公共媒體到家庭娛樂,從自然科學(xué)到社會(huì)科學(xué),每一個(gè)領(lǐng)域都滲透著對多媒體技術(shù)和因特網(wǎng)技術(shù)的應(yīng)用,都要求對各種資料的智能化的管理。隨著我國國防科技和航天事業(yè)的快速發(fā)展,軍事領(lǐng)域?qū)D像檢索技術(shù)也提出了更高的要求,大量的宇航圖片和衛(wèi)星圖片的產(chǎn)生,要求高效率的管理和查找。因此,在國內(nèi)不論是民用還是軍用,都使圖像檢索技術(shù)的研究具有極為重要的應(yīng)用價(jià)值。在我國從上個(gè)世紀(jì)末至今,基于內(nèi)容的圖像檢索技術(shù)逐漸成為研究和應(yīng)用的熱點(diǎn)。目前,我國的醫(yī)藥衛(wèi)生領(lǐng)域,工業(yè)生產(chǎn)和機(jī)械制造加工領(lǐng)域,農(nóng)業(yè)生產(chǎn)領(lǐng)域,國防科技領(lǐng)域,以及娛樂文化領(lǐng)域等都逐漸研究并應(yīng)用這項(xiàng)技術(shù)。在醫(yī)學(xué)領(lǐng)域,利用基于內(nèi)容的圖像檢索技術(shù)對醫(yī)學(xué)病理圖像進(jìn)行檢索,輔助醫(yī)生的診斷和治療。工業(yè)生產(chǎn)中,利用這項(xiàng)技術(shù)對加工的產(chǎn)品進(jìn)行質(zhì)量檢測,在新研制的汽車維修和零件銷售中,進(jìn)行網(wǎng)上選購和訂貨。農(nóng)業(yè)生產(chǎn)中對農(nóng)作物進(jìn)行病蟲害的監(jiān)測和防治工作。軍事領(lǐng)域中,開發(fā)智能導(dǎo)彈自動(dòng)選擇目標(biāo)實(shí)施攻擊。這些領(lǐng)域都是我國己經(jīng)和正在發(fā)展及應(yīng)用的實(shí)例[1]。從目前究和應(yīng)用的現(xiàn)狀來看,基于內(nèi)容的圖像家檢索技術(shù)主要應(yīng)用在專業(yè)圖庫中進(jìn)行圖像的檢索.如在商標(biāo)圖庫中,在掃描得到的報(bào)紙庫中,在農(nóng)產(chǎn)品如煙葉圖庫中.目前,市場上推出的基于圖像內(nèi)容的檢索系統(tǒng)軟件雖然各有所長,但是始終不能盡如人意,而且針對海量數(shù)據(jù)的特點(diǎn)如何快速地進(jìn)行圖像的檢索還需要解決。1.1.2國外的研究現(xiàn)狀在國外,基于圖像內(nèi)容的檢索技術(shù)是隨著數(shù)字圖書館的發(fā)展,而逐漸發(fā)展并成為一個(gè)研究熱點(diǎn)。1994年美國啟動(dòng)了持續(xù)四年的“數(shù)字圖書館”項(xiàng)目。1998年,美國自然科學(xué)基金會(huì),國防部高級研究計(jì)劃署,國家航空航天局,國家醫(yī)學(xué)圖書館,國會(huì)圖書館,國家人文科學(xué)基金會(huì)和聯(lián)邦調(diào)查局聯(lián)合自主第二期計(jì)劃的的實(shí)施,掀起了全球性的數(shù)字圖書館研究熱潮[2]在數(shù)字圖書館中,其中一個(gè)關(guān)鍵的問題是檢索問題,集中在以下兩個(gè)方面:一是解決目前Internet的信息檢索問題,二是多媒體信息的檢索。因?yàn)閳D像屬于一種視覺信息,所以圖像檢索問題在兩個(gè)方面中都存在[3]。IBM公司的QBIC系統(tǒng)可能是最著名的產(chǎn)品,它可以作為獨(dú)立的軟件產(chǎn)品使用,也可以作為IBM公司的數(shù)字圖書館的一個(gè)組成部分.QBIC系統(tǒng)實(shí)現(xiàn)了基于顏色、紋理或形狀的組合查詢,以及文字關(guān)鍵字的查詢。查詢接口方式實(shí)現(xiàn)了基于模板圖像的查找,基于調(diào)色板的查找,基于草圖的查找。Virage公司的VIR圖像工程系統(tǒng)也具有獨(dú)立性及附屬性,并且被應(yīng)用于AltaVista的網(wǎng)絡(luò)圖片查詢工具AVPhotoFinder中.Excalibur公司的Excalibur視覺檢索產(chǎn)品是在公司長期研究的模式識(shí)別理論和數(shù)據(jù)庫技術(shù)的基礎(chǔ)上研制出來的,現(xiàn)已被成功地應(yīng)用于Yaho上,即圖像沖浪組件,實(shí)現(xiàn)了基于內(nèi)容的圖像檢索。這些產(chǎn)品共同特征是:都是基于圖像特征矢量的檢索,數(shù)據(jù)庫中的每一幅圖像都由一個(gè)不超過500個(gè)元素的特征矢量描述。特征矢量一旦產(chǎn)生,就永久性地存儲(chǔ)下來,查詢時(shí)的搜索只是基于特征矢量的查詢。特征矢量之間的歐氏距離作為相似性度量的準(zhǔn)則,按照距離的大小給出查詢結(jié)果[4]。1。2選題意義及本文研究的內(nèi)容1.2.1課題的目的和意義隨著Internet網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)用戶越來越多,網(wǎng)絡(luò)已成為目前最重要的信息來源之一。事實(shí)上,來自網(wǎng)絡(luò)的信息量比任何一種渠道的信息量都要大。所涉及的領(lǐng)域之廣、更新速度之快和搜集成本之低也是其他任何手段無法比擬的。網(wǎng)絡(luò)將會(huì)改變?nèi)祟惖囊磺?這已不是謠言,而是一個(gè)不爭的事實(shí)。但是,網(wǎng)絡(luò)的確是一個(gè)名副其實(shí)的“雙刃劍”,利用好它可以發(fā)揮它無窮的威力;反之,就會(huì)給自己帶來無窮的禍害,給國家?guī)砭薮蟮膿p失.從廣義上講,網(wǎng)絡(luò)就是一個(gè)巨型數(shù)據(jù)庫,人人都可以從中取到自己所需的東西。利用搜索引擎合法的在網(wǎng)上搜索特定信息本身就是網(wǎng)絡(luò)的建設(shè)目的之一。目前,國內(nèi)外許多研究者正在研究基于網(wǎng)絡(luò)的信息收集和檢索技術(shù)。特別是隨著網(wǎng)絡(luò)的普及,數(shù)據(jù)檢索和收集顯得越來越重要,已成為人們達(dá)到特定目的最有效的方法和手段之一.隨著圖像處理、圖像理解和模式識(shí)別研究的發(fā)展和深入,以及對人眼圖像理解機(jī)制的深入研究,基于圖像的搜索引擎得到了很大的發(fā)展,從傳統(tǒng)的語義注釋的圖像檢索到基于圖像內(nèi)容的圖像檢索技術(shù)(CBIR,Content-BasedImageRetrieval)發(fā)展,標(biāo)志著圖像檢索技術(shù)根本性的變革。CBIR技術(shù)是隨著計(jì)算機(jī)視覺、圖像理解與圖像處理研究的進(jìn)步而逐漸發(fā)展成熟的一種圖像媒體檢索技術(shù).1。2.2研究的主要內(nèi)容本文主要討論了基于顏色直方圖的圖像檢索技術(shù)一些基本的理論知識(shí),著重研究的是用累加直方圖算法來實(shí)現(xiàn)一個(gè)系統(tǒng),并用該系統(tǒng)達(dá)到實(shí)現(xiàn)圖像檢索的目的,還要給出對該系統(tǒng)性能評價(jià)的一般標(biāo)準(zhǔn)。下面是本文的內(nèi)容介紹:本文第一部分簡要介紹了基于內(nèi)容地圖像檢索技術(shù)的背景資料和研究發(fā)展?fàn)顩r,說明了研究該項(xiàng)技術(shù)的必要性.第二部分說明基于內(nèi)容的圖像檢索的基本概念綜述以及其關(guān)鍵技術(shù)。第三部分講述基于內(nèi)容的圖像檢索的原理工作過程和其特點(diǎn)。第四和第五部分主要講顏色特征理論和直方圖理論,這是為后面的算法研究打下理論基礎(chǔ)。第六部分主要介紹累加直方圖算法,這也是本文的最核心部分。后面一個(gè)部分講的是基于內(nèi)容的圖像檢索的評價(jià)標(biāo)準(zhǔn)。最后結(jié)論部分介紹的是總結(jié)和圖像檢索的研究趨勢.2基于內(nèi)容的圖像檢索的簡介2。1基于內(nèi)容的圖像檢索技術(shù)的概述基于內(nèi)容的圖像檢索涉及到圖像處理、計(jì)算機(jī)視覺、模式識(shí)別以及神經(jīng)網(wǎng)絡(luò)等學(xué)科,同時(shí)也和人腦的認(rèn)識(shí)程度緊密相關(guān),這諸多因素使得基于內(nèi)容的圖像檢索的研究成為一項(xiàng)極富挑戰(zhàn)性的課題.本章從基于內(nèi)容的圖像檢索的基本原理、流程、關(guān)鍵技術(shù)、特點(diǎn)等多個(gè)方面對基于內(nèi)容的圖像檢索進(jìn)行介紹和分析。2.1。1基于內(nèi)容的圖像檢索的基本概念所謂基于內(nèi)容的圖像檢索技術(shù)(Content-BasedImageRetrieval,CBIR),它是指利用圖像的顏色(灰度)、形狀、紋理、語義等特征對圖像進(jìn)行查詢,試圖在理解圖像內(nèi)容的基礎(chǔ)上,檢索出與示例相類似的圖像。這種檢索不同于傳統(tǒng)的檢索,它用于檢索的是反映媒體內(nèi)容并與媒體存儲(chǔ)在一起的各種量化特征,使用的是基于相似性度量的示例查詢(QueryByExample)方法。它區(qū)別于傳統(tǒng)的檢索手段,融合了圖像理解技術(shù)、模式識(shí)別技術(shù),從而可以為信息用戶提供更加有效的檢索手段.2.1。2基于內(nèi)容的圖像檢索的體系結(jié)構(gòu)基于內(nèi)容的圖像檢索涉及了數(shù)據(jù)庫管理、計(jì)算機(jī)視覺、圖像處理、模式識(shí)別、信息檢索和認(rèn)知心理學(xué)等諸多學(xué)科。目前圖像檢索系統(tǒng)的高性能還必須建立在人機(jī)交互的基礎(chǔ)上,如圖2。1為一種系統(tǒng)結(jié)構(gòu)圖[6]。系統(tǒng)結(jié)構(gòu)中有三個(gè)數(shù)據(jù)庫。原始圖像數(shù)據(jù)庫存儲(chǔ)用于視覺顯示的所有原始圖像??紤]到在圖像檢索過程中可能對圖像的分辨率由不同要求,因此,需對圖像進(jìn)行預(yù)處理.視覺特征數(shù)據(jù)庫用來存儲(chǔ)提取出的圖像視覺特征,這是基于內(nèi)容的圖像檢索的必備信息,主要涉及計(jì)算機(jī)視覺和圖像理解技術(shù)。文本注釋數(shù)據(jù)庫包括圖像的關(guān)鍵詞和對圖像自由描述的文本。它是基于內(nèi)容的圖像檢索的必要補(bǔ)充,主要涉及文本信息檢索和數(shù)據(jù)庫管理技術(shù)。多維索引模塊是為了提高在大規(guī)模圖像庫中檢索圖像時(shí)的運(yùn)行速度。盡管目前大部分實(shí)驗(yàn)系統(tǒng)上未能采用這項(xiàng)技術(shù),但它是未來高性能圖像檢索系統(tǒng)必不可少的部分。這個(gè)模塊主要涉及計(jì)算幾何、數(shù)據(jù)庫管理和模式識(shí)別技術(shù).搜索引擎模塊包括查詢接口子模塊和查詢處理子模塊。前者主要是檢索用戶的信息需求,并顯示系統(tǒng)的檢索結(jié)果,后者確保系統(tǒng)能夠以最佳的方式處理用戶的查詢.查詢查詢接口查詢處理多維索引原始圖像庫可視化特征庫文本注釋庫特征提取及索引圖2.1基于內(nèi)容的圖像檢索系統(tǒng)結(jié)構(gòu)圖2.2基于內(nèi)容的圖像檢索的關(guān)鍵技術(shù)基于內(nèi)容的圖像檢索系統(tǒng)的關(guān)鍵技術(shù)包括以下幾個(gè)方面:(1)數(shù)學(xué)模型。數(shù)學(xué)模型是CBIR系統(tǒng)的核心,它決定了CBIR所能支持的查詢類型和檢索性能.建立的數(shù)學(xué)模型要充分反映圖像對象的內(nèi)容,反映與領(lǐng)域無關(guān)的和能夠有效存儲(chǔ)的物理特性及邏輯特征。(2)特征提取.特征提取是基于內(nèi)容的圖像檢索的基礎(chǔ)。特征提取算法應(yīng)簡單易用,且具有自動(dòng)提取的功能,所選擇的特征應(yīng)盡可能表達(dá)原始圖像的信息。同時(shí)可以借助一些先進(jìn)的數(shù)學(xué)工具來提取圖像特征。(3)索引技術(shù).在對圖像的檢索中,最主要的方式是相似性檢索。即在圖像數(shù)據(jù)庫中找到與給定圖像最為相似的一幅。它的一般做法是提取出圖像的特征建立特征庫。由于圖像特征一般都是高維的矢量數(shù)據(jù),所以這時(shí)圖像檢索就轉(zhuǎn)化為對空間數(shù)據(jù)庫中高維數(shù)的近鄰檢索問題.為了能夠高效的進(jìn)行數(shù)據(jù)特征索引,從而實(shí)現(xiàn)圖像信息的檢索,目前對索引技術(shù)的研究主要集中在降低索引維數(shù)和建立良好的索引方法上.(4)累加直方圖算法。累加直方圖能體現(xiàn)信號(hào)在分布軸上各抽樣點(diǎn)間的相關(guān)性,即分布軸上相對某個(gè)抽樣點(diǎn)距離越近的點(diǎn),在某種特性意義上就越相似于該抽樣點(diǎn)。但是累加直方圖能體現(xiàn)這個(gè)性質(zhì)的前提是:信號(hào)本身要有這樣的特性,即特征分布軸上距離小的兩點(diǎn)要比距離大的兩點(diǎn)更相似。3基于內(nèi)容的圖像檢索原理和特點(diǎn)3.1基于內(nèi)容的圖像檢索的原理及處理過程3.1。1基于內(nèi)容的圖像檢索的原理目前,基于內(nèi)容的圖像檢索的研究主要是借助圖像的特征來進(jìn)行的,其基本工作原理是在建立圖像庫時(shí),分析輸入圖像,提取圖像的特征作為特征向量,與圖像一起存儲(chǔ)在數(shù)據(jù)庫中。圖像檢索時(shí),則提取給定查詢范例圖像的特征或由用戶指出要查詢圖像的特征,與數(shù)據(jù)庫中的特征向量進(jìn)行匹配,并根據(jù)匹配結(jié)果返回相應(yīng)圖像。一個(gè)基于內(nèi)容的圖像檢索系統(tǒng)通常由四個(gè)組成部分(如圖3.1):圖像數(shù)據(jù)庫管理、相似匹配、查詢方式、結(jié)果輸出與反饋機(jī)制。根據(jù)CBIR系統(tǒng)的原理,可歸納出以下幾部分[7]:(1)圖像數(shù)據(jù)庫系統(tǒng)。由圖像庫、特征庫、和知識(shí)庫組成。圖像庫的內(nèi)容為數(shù)字化的圖像信息;特征庫存儲(chǔ)是從圖像中提取的各種特征;知識(shí)庫包含專門和通用的知識(shí),以利于查詢優(yōu)化和快速匹配;有效地組織圖像數(shù)據(jù)庫并建立高效的索引,加快圖像的檢索速度。(2)圖像預(yù)處理。圖像格式轉(zhuǎn)換、尺寸統(tǒng)一、圖像增強(qiáng)與去噪聲等功能。(3)特征提取。包括特征選擇和提取特征,特征選擇即選取適當(dāng)?shù)膱D像特征組成特征空間,一旦特征確定了,其對應(yīng)的特征空間也就確定了。選擇的特征對于相似的圖像具有穩(wěn)定性,對于不同的圖像要具有較強(qiáng)的區(qū)分性。提取特征是指從包含大量信息的圖像中分解出不同種類的特征信息.特征的提取可以是整幅圖像,也可以是圖像的某個(gè)區(qū)域或具體的內(nèi)容對象。(4)相似匹配。如何進(jìn)行圖像匹配,即確定相似性度量算法?;趦?nèi)容的圖像檢索中,圖像之間的匹配不是傳統(tǒng)意義下的精確匹配,而是一種相似匹配。檢索是利用特征之間的距離函數(shù)來進(jìn)行相似性匹配,模仿人類的認(rèn)知過程,可以從特征庫中尋找匹配的特征,也可以臨時(shí)計(jì)算對象的特征。匹配引擎中包括一個(gè)較為有效、可靠的相似度函數(shù)集。特征1特征1特征n反饋信息檢索結(jié)果特征提取特征比較特征數(shù)據(jù)庫特征提取圖像數(shù)據(jù)庫范例圖像或草圖查詢方式結(jié)果輸出與反饋機(jī)制相似匹配圖像數(shù)據(jù)庫管理圖3.1系統(tǒng)原理框圖3.1.2基于內(nèi)容圖像檢索的處理過程基于內(nèi)容的查詢和檢索是一個(gè)逐步求精的過程,存在著一個(gè)特征調(diào)整、重新匹配的循環(huán)過程,如圖3。2所示。(1)提查詢要求。用戶查找一個(gè)數(shù)據(jù)對象時(shí),利用系統(tǒng)人機(jī)界面提供的輸入方式形成一個(gè)查詢條件。查詢接口一般要對所提交的數(shù)據(jù)進(jìn)行預(yù)處理,然后再傳遞給搜索引擎。(2)相似性匹配。用戶提交的查詢要求經(jīng)處理形成查詢特征,將查詢特征與數(shù)據(jù)庫中的特征按照一定的匹配算法進(jìn)行匹配。用戶的查詢說明用戶的查詢說明·示例·一般性描述相似性匹配修改查詢說明返回一組候選結(jié)果滿意?結(jié)束從候選結(jié)果中選擇一個(gè)示例NY圖3。2基于內(nèi)容圖像檢索的處理過程(3)返回查詢結(jié)果.滿足一定相似性的一組候選結(jié)果按相似度大小排列返回給用戶,因此,系統(tǒng)人機(jī)界面要有顯示瀏覽查詢結(jié)果的功能。(4)調(diào)整查詢特征。對系統(tǒng)返回的一組查詢結(jié)果,用戶可以通過遍歷挑選滿意的結(jié)果,也可以從候選結(jié)果中選擇一個(gè)示例,進(jìn)行查詢特征調(diào)整,形成一個(gè)新的查詢。如此逐步求精,直到滿意為止.用戶提交查詢樣本用戶提交查詢樣本選擇檢索類型庫中圖像對查詢樣本提取特征輸出檢索結(jié)果從特征庫中提取特征圖像檢索圖3。3圖像查詢流程圖3.2基于內(nèi)容圖像檢索的特點(diǎn)基于內(nèi)容的圖像檢索具有下列主要特點(diǎn):(1)從圖像內(nèi)容中由計(jì)算機(jī)自動(dòng)提取視覺特征,并根據(jù)這些特征從圖像數(shù)據(jù)庫中查找、檢索出具有相似特征的圖像數(shù)據(jù)?;趦?nèi)容的圖像檢索直接對圖像內(nèi)容進(jìn)行分析,抽取特征和語義,把檢索過程與語義提取直接聯(lián)系起來,使得檢索過程更加有效,適應(yīng)性更強(qiáng)。(2)使用相似匹配代替精確匹配。在傳統(tǒng)的基于文本的圖像檢索中,是以精確匹配為主.在基于內(nèi)容的圖像檢索中,通常采用相似匹配方式,從而獲得類似圖像,不斷縮小檢索范圍,直至定位于所要求的目標(biāo),與傳統(tǒng)數(shù)據(jù)庫檢索的精確匹配不同.(3)直觀的可視化查詢方式,交互性強(qiáng).基于內(nèi)容的圖像檢索通常采用范例檢索方式,在許多現(xiàn)存的基于內(nèi)容的圖像檢索系統(tǒng)中都運(yùn)用其中的一種或幾種相結(jié)合的查詢方式。(4)滿足多層次的檢索要求。系統(tǒng)通常包含圖像庫、特征庫,可滿足多方面的檢索要求。用戶可以向系統(tǒng)提交與所需查詢的圖像一致或類似的例圖、繪制草圖或進(jìn)行單個(gè)特征的檢索、基于多個(gè)特征的綜合檢索、基于對象的檢索等。4顏色特征理論顏色特征是圖像檢索中使用最廣泛的一種視覺特征,也是最直觀和最簡單的一種,它具有很多優(yōu)良的性質(zhì),它對于圖像的平移、旋轉(zhuǎn)、大小的變化具有良好的適應(yīng)能力。顏色直方圖是提取顏色特征最常用的一種表示方法。最早采用顏色進(jìn)行圖像檢索是由Swain和Ballard提出的基于顏色直方圖的檢索方法[8],其核心思想是在一定的顏色空間中對圖像中的各種顏色出現(xiàn)的頻數(shù)進(jìn)行統(tǒng)計(jì),然后圖像之間相似的問題就轉(zhuǎn)化成比較圖像直方圖之間的相似性問題。4.1顏色模型4.1.1RGB顏色模型RGB模型是基于三基色模型的代表。整個(gè)顏色空間位于邊長為1的立方體中,每個(gè)像素實(shí)際上任何可能量化的顏色都能用三維空間中第一個(gè)象限的一個(gè)點(diǎn)來表示,如圖4.1所示:藍(lán)(0,0,1)藍(lán)(0,0,1)青(0,1,1)白(1,1,1)綠(0,1,0)RGB紅(1,0,0)品紅(1,0,1)黃(1,1,0)黑(0,0,0)灰度圖4.1RGB顏色模型這個(gè)模型基于笛卡兒坐標(biāo)系。原點(diǎn)上,任一基色均沒有亮度,即原點(diǎn)對應(yīng)于黑色.三個(gè)軸分別為R、G、B三基色.離原點(diǎn)最遠(yuǎn)的頂點(diǎn)對應(yīng)于白色。亮度較低的等量的三種基色產(chǎn)生灰色的陰影,所有這些點(diǎn)均落在彩色立方體的對角線上,該對角線被稱為灰色線。該模型是數(shù)字圖像處理所使用的最重要的彩色模型。然而,RGB顏色模型與人的視覺感知有一定差距,例如給定一個(gè)顏色,人很難判定其中的R,G,B分量,這時(shí)使用面向視覺感知的顏色模型比較方便一些。4.1.2HSV顏色模型從數(shù)字圖像中一般都得到RGB值,但RGB顏色空間中的顏色不能與感知上的顏色模型聯(lián)系.在所有的顏色空間中,HSV模型對應(yīng)于畫家配色模型,它能較好反映人對顏色的感知和鑒別能力,非常適合基于顏色的圖像相似比較,而且HSV和RGB顏色空間的轉(zhuǎn)換是可逆的.視頻采集卡得到幀圖像一般采用RGB模型,因此要把RGB模型轉(zhuǎn)換成HSV模型,具體算法如下[9]:設(shè)定義為:則v=/255(4.1)(4.2)這里,,。4。2顏色特征提取顏色是一種能簡化目標(biāo)提取和分類的重要描述符,所以選擇合適,對顏色的表達(dá)方式是很重要的.另一方面,對顏色的特征表達(dá)依賴于所用的顏色模型,最好選擇與人的感覺相一致的顏色空間.最早在基于內(nèi)容的圖像索引的色彩直方圖中得到應(yīng)用.顏色特征定義比較明確,抽取也相對容易,并且具有尺度不變性、旋轉(zhuǎn)不變性和位置不變性等特點(diǎn),因此在圖像檢索中得到廣泛的重視和研究,并提出了很多改進(jìn)算法。最早的全局色彩特征索引方法是由Swain和Ballard提出的基于色彩直方圖的檢索法,其主要思想是在一定的色彩空間中對圖像各種色彩出現(xiàn)的頻數(shù)進(jìn)行統(tǒng)計(jì),既描述的是不同色彩在整幅圖像中所占的比例。而并不關(guān)心每種色彩所處的空間位置,所以顏色直方圖特別適合于描述那些難以進(jìn)行自動(dòng)分割的圖像和不需要考慮物體空間位置的圖像。顏色直方圖可以基于不同的顏色空間和坐標(biāo)系。大部分的數(shù)字圖像采用RGB色彩空間,但這種空間結(jié)構(gòu)并不符合人們對顏色相似性的主觀判斷.因此,有人提出了基于HSV空間、Luv空間和Lab空間的顏色直方圖.除了基于這些顏色空間的直方圖外,還提出了許多改進(jìn)的方法,例如,何恒等提出的綜合顏色和紋理特征的模糊直方圖方法,該方法將圖像分快處理,得到圖像在HSV空間的顏色模糊直方圖,然后用紋理特征對顏色模糊直方圖進(jìn)行擴(kuò)展,從而得到綜合模糊直方圖,同時(shí)還給出了抽取圖像顏色和紋理特征的方法和建立圖像綜合模糊直方圖的計(jì)算程。王禹等提出的基于廣義直方圖的圖像檢索方法[10],該方法把圖像和它的平滑圖像組合起來,形成一個(gè)二元組即“廣義圖像”,廣義圖像的直方圖稱為廣義直方圖。除此之外還有累積直方圖法、均值直方圖法等。5直方圖理論5.1顏色直方圖顏色直方圖是最常用的顏色特征提取方法之一,其核心思想是在一定的顏色空間中對圖像各種顏色出現(xiàn)的頻數(shù)進(jìn)行統(tǒng)計(jì)。目前,幾乎所有的基于顏色特征的檢索算法都是以顏色直方圖為基礎(chǔ)的。它的優(yōu)點(diǎn)就在于它能簡單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動(dòng)分割的圖像和不需要考慮物體空間位置的圖像[11].計(jì)算顏色直方圖需要將顏色空間劃分為若干個(gè)小的顏色區(qū)間,每個(gè)區(qū)間成為直方圖的一個(gè)柄(bin)。這個(gè)過程稱為顏色量化(colorquantizat(yī)ion).然后,通過計(jì)算顏色落在每個(gè)小區(qū)間的像素?cái)?shù)量可以得到顏色直方圖。橫坐標(biāo)表示顏色的色彩歸一化后的值,縱坐標(biāo)表示每個(gè)小的顏色區(qū)間中所對應(yīng)的圖像像素的總和。顏色直方圖可以對應(yīng)于不同的顏色空間。最常用的是RGB顏色空間,因?yàn)榇蟛糠值臄?shù)字圖像都是用這種顏色空間表達(dá)的。當(dāng)圖像用RGB顏色空間表示時(shí),彩色圖像的直方圖可以用R、G、B三個(gè)單色的直方圖來表示或者用一個(gè)RGB聯(lián)合分布的顏色直方圖來表示。當(dāng)用三個(gè)單色直方圖表示時(shí),各個(gè)直方圖表示的是圖像在這種顏色分量的統(tǒng)計(jì)分布,總共有三個(gè)不同的概率分布。而彩色圖像直接用一個(gè)顏色直方圖表示時(shí),其統(tǒng)計(jì)的是不同顏色出現(xiàn)的頻數(shù),以色彩作為橫坐標(biāo),縱坐標(biāo)為色彩出現(xiàn)的頻數(shù).在RGB顏色空間中,顏色直方圖可以看成是一個(gè)離散函數(shù),即(5.1)其中,k表示圖像的特征取值,L表示特征可取值的個(gè)數(shù),凡表示圖像中具體征值為k的像素個(gè)數(shù),n表示圖像像素的總個(gè)數(shù)。由此看出,顏色直方圖具有下列性質(zhì):位置無關(guān)性直方圖描述了每個(gè)灰度級的像素的個(gè)數(shù),但不能為這些像素在圖像中的位置提供任何線索。當(dāng)一幅圖像被壓縮為直方圖后,所有的空間信息將全部丟失。因此,任一特定的圖像具有唯一的直方圖,例如圖5.1中(a)、(b)、(c)和(d)四幅圖像,如果陰影部分具有相同的灰度值而且面積相等,那么這四幅圖像的直方圖卻是完全相同的,這說明了不同的圖像可能具有完全相同的直方圖。(a)(a)(b)(c)(d)圖5.1直方圖的位置無關(guān)性疊加性如果一幅圖像由兩個(gè)不連接的區(qū)域組成,并且每個(gè)區(qū)域的直方圖己知,則整幅圖像的直方圖是該兩個(gè)區(qū)域的直方圖之和。顯然,該結(jié)論可推廣到任何數(shù)目的不連接區(qū)域的情形??傮w性(a)(a)(b)(c)(d)圖5.2直方圖的總體性直方圖是總體灰度概念,從直方圖中可以看出圖像整體的性質(zhì).如圖5。2所示:直方圖(a)表示圖像總體偏暗:直方圖(b)表示圖像總體偏亮;直方圖(c)表示圖像的灰度動(dòng)態(tài)范圍太小,許多細(xì)節(jié)必然分辨不清楚;直方圖(d)表示圖像灰度級分布均勻,給人以清晰、明快的感覺。5.2直方圖的矩對直方圖來說,一、二、三階中心矩分別為:(5.2)(5。3)(5.4)設(shè),,分別為圖像Q的H(色度),S(飽和度),V(亮度)的階中心矩,分別為圖像I中的H,S,V的階中心矩,則距離度量函數(shù)為:(5。5)其中分別為加權(quán)系數(shù)。5.3直方圖均衡化算法(1)直方圖修正.空域圖像增強(qiáng)的基本方法是通過對圖像做灰度T:一般情況下,例如灰度級線性拉伸,我們直接指定所要進(jìn)行的變換T.而直方圖修正也是灰度變換的一種,它試圖尋找這樣的灰度變換函數(shù)T,它能把映射為,使得的直方圖具有指定的(希望的)形式。因此它不是事先指定變換函數(shù)T,而是從及中計(jì)算得到T.(2)直方圖均衡化。直方圖均衡化是一種最常用的直方圖修正技術(shù),它是把給定圖像的直方圖分布改造成均勻直方圖分布,使輸出像素灰度的概率密度均勻分布。用信息學(xué)的理論來解釋,即具有最大嫡(信息量)的圖像為均衡化圖像。直方圖均衡化的基本原理是:當(dāng)圖像中當(dāng)所有的灰度級出現(xiàn)的概率是一個(gè)均勻分布時(shí),圖像所暴露出來的信息量最大??紤]如下的變換:(5。6)即取變換函數(shù)為累積分布函數(shù)CDF。所以有:(5。7)由上式又能得出:這樣就得到了我們想要的均勻分布.5。4基于直方圖的圖像檢索技術(shù)分析灰度直方圖是反映灰度圖像的亮度概率分布的有效工具。顏色特征是圖像最直觀、明顯的特征,一般采用直方圖來描述?;陬伾珯z索的基本思想是將圖像間的距離歸結(jié)為其顏色直方圖間的差距,從而圖像檢索也就轉(zhuǎn)化為顏色直方圖的匹配。第一,直方圖的計(jì)算。圖像直方圖是一個(gè)N維向量,為灰度或顏色的級別數(shù),圖像直方圖對圖像的平移和旋轉(zhuǎn)具有不變性。當(dāng)對圖像直方圖進(jìn)行歸一化,將中灰度或顏色的頻數(shù)變成頻數(shù)比率,歸一化直方圖對圖像的尺寸變化具有不變性。(1)歸一化直方圖的計(jì)算記為圖像P某一特征值為的像素?cái)?shù),N為圖像P的總像素?cái)?shù),則圖像P的該特征的直方圖為:其中(5.8),N均為整數(shù)。(2)累積直方圖的計(jì)算己知圖像某一特征的歸一化直方圖為則該特征的累積直方圖可由下式計(jì)算:其中(5。9)為整數(shù)。第二,直方圖的匹配。常用兩種距離度量函數(shù):設(shè)分別為圖像的歸一化直方圖。(1)一般歐氏距離函數(shù)(5.10)(2)加權(quán)距離函數(shù)(5.11)傳統(tǒng)的顏色直方圖,要計(jì)算和存儲(chǔ)整幅圖像顏色空間的直方圖,計(jì)算量和存儲(chǔ)量巨大,這對于圖像檢索是沒有必要的,因?yàn)槿四苡X察到的圖像顏色一般不過幾十種。因此這些都需要分析研究、進(jìn)一步去改進(jìn)。6累加直方圖算法6。1累加直方圖在許多應(yīng)用中,圖像檢索結(jié)果只能由人來做主觀評價(jià)。人眼對顏色的分辨能力是有限的,例如對色調(diào)(Hue)的微小變化不敏感.換言之,在相同亮度和飽和度下,色調(diào)在一定范圍的變化,人眼無法覺察。如何適應(yīng)人的這個(gè)視覺特性,人們首先想到了加大量化間隔,將相近的顏色量化到Hue軸同一坐標(biāo)上。有實(shí)驗(yàn)表明,采用一般直方圖,當(dāng)量化間隔時(shí),檢索效果有很大改善。但這種簡單量化存在兩個(gè)嚴(yán)重問題,首先,對兩個(gè)相近顏色,這種量化既可能將它們量化到同一個(gè)Hue坐標(biāo)上,也可能量化到不同的兩個(gè)Hue坐標(biāo)上??梢姡唵蔚募哟罅炕g隔會(huì)導(dǎo)致誤檢。再者,色調(diào)(Hue)的分布有其自身的特殊性,從視覺角度來看,其相似性的分布并非均勻分布,如藍(lán)色的相近色的分布范圍要比黃色的更寬些,簡單的等間隔量化并不適合色調(diào)(Hue)信號(hào)。一般直方圖方法對每個(gè)顏色分量平等對待,沒有考慮顏色軸上相鄰顏色的相似性,在一些情況下可能會(huì)漏檢。如有三幅單色圖像,顏色分別為紅色、粉紅色和藍(lán)色,用歐幾里德距離對三幅圖像進(jìn)行度量,結(jié)果粉紅圖像與紅色圖像的相似程度等同于藍(lán)色圖像與紅色圖像的相似程度,這不符合人的視覺感覺.在圖6。1中給出的三幅圖像的直方圖,人的視覺感覺很容易判斷和較相似,而它們與的區(qū)別顯著。但是用前述的距離度量方法,結(jié)果不如人意,例如歐幾里德距離:(6。1)H1H1H2H3圖6。1三幅顏色直方圖利用二次距離可以在一定程度上克服這一缺陷,但是相比其復(fù)雜的計(jì)算,其性能的提高是有限的。累加直方圖可以較好的解決這一問題。累加直方圖是以顏色作為橫坐標(biāo),縱坐標(biāo)為顏色累加出現(xiàn)的頻數(shù),以此繪出的圖形。這樣圖像的累加直方圖空間可以定義為:(6.2)表示種顏色的像素的累加頻數(shù):圖6.1直方圖對應(yīng)的累加直方圖如圖6。2所示。可見,在累加直方圖中,相鄰顏色在頻數(shù)上是相關(guān)的。累加直方圖消除了一般直方圖中常見的零值,也克服了一般直方圖量化過細(xì)過粗檢索效果都會(huì)下降的缺陷。圖6.2與圖6。1直方圖對應(yīng)的累加直方圖累加直方圖的距離度量采用一般直方圖的前三種方法。例如用歐氏距離,圖6.2的距離比較如下:(6.3)與人的視覺感覺相符.累加直方圖是密集的,即使其對應(yīng)的一般直方圖是稀疏的(有較多的0值)。相比一般直方圖,累加直方圖的存儲(chǔ)量和計(jì)算量有很小的增加,但是,累加直方圖有更好的魯棒性,因此我們可以用更寬的量化間隔來減少存儲(chǔ)量和計(jì)算量。6。2算法實(shí)現(xiàn)分塊非等色調(diào)區(qū)間局部累加直方圖計(jì)算在實(shí)際計(jì)算時(shí),把每幀圖像分成2×2的子塊。對每一子塊,對色調(diào)取量化間隔為,分別計(jì)算每個(gè)相似色調(diào)區(qū)間的局部累加直方圖;對飽和度S和亮度V空間進(jìn)行非均勻量化,量化為3個(gè)間隔:[0,0.2]、[0.2,0。7]、[0.7,1],并按上述量化間隔計(jì)算一般直方圖[12]。(1)一般直方圖計(jì)算:(6.4)其中L為量化間隔數(shù),為幀圖像某一特征量的第k區(qū)間,是幀圖像某一特征量在區(qū)間取值的象素的個(gè)數(shù)。(2)累加直方圖計(jì)算:(6.5)(3)近似匹配度量設(shè),分別為幀圖像Q和S的歸一化直方圖,對色調(diào)按歐氏距離法進(jìn)行度量:(6。6)對飽和度和亮度用相交法進(jìn)行度量:(6。7)按加權(quán)法計(jì)算每一子塊總匹配度:(6.8)最后,若兩幀圖像每個(gè)子塊都小于域值T,則認(rèn)為匹配。6.3改進(jìn)的局部累加直方圖算法對色彩比較復(fù)雜的自然景物圖象,一般累加直方圖算法在檢索中就會(huì)將不同色度的信號(hào)混淆起來。使用局部累加直方圖代替一般的累加直方圖需要對色度相似區(qū)進(jìn)行合理的劃分[13]。算法1:當(dāng)對色度的量化間隔為1°時(shí),采用為區(qū)間的長度,將H軸共分成6個(gè)局部區(qū)間,通過分別計(jì)算每個(gè)局部區(qū)間的累加直方圖進(jìn)行檢索。算法2:色度軸上各種顏色的分布實(shí)際上是連續(xù)過渡的,各顏色區(qū)之間并不存在截然的界限.算法1以為間隔來劃分相似色區(qū)域,雖然保證了在各局部區(qū)間內(nèi)使用累加直方圖的條件,但在區(qū)間分界處附近忽視了顏色的相似連續(xù)性,會(huì)造成與量化間隔過大而產(chǎn)生的相同問題。在算法2,先采用算法1計(jì)算出每個(gè)局部區(qū)間的累加直方圖,再改變區(qū)間的劃分為計(jì)算出這時(shí)每個(gè)局部區(qū)間的累加直方圖,最后將這2次計(jì)算的累加直方圖逐項(xiàng)相加取平均,作為最終的特征直方圖用于檢索.這樣在以歐氏距離為相似度測度時(shí),更能體現(xiàn)色度信號(hào)在分布軸上各抽樣點(diǎn)間的相關(guān)性。算法3:將色度進(jìn)行變換后,消除了一些參數(shù)變化的影響.算法3在此基礎(chǔ)上對以為間隔進(jìn)行新的相似色區(qū)間劃分并按算法1計(jì)算局部累加直方圖進(jìn)行檢索。算法4:類似算法2對算法1的改進(jìn),先用算法3計(jì)算出每個(gè)局部區(qū)間的累加直方圖,再改變區(qū)間劃分并計(jì)算出這時(shí)每個(gè)局部區(qū)間的累加直方圖。最后將這2次計(jì)算的累加直方圖逐項(xiàng)相加取平均,作為最終的特征直方圖用于檢索。6.4算法總結(jié)在以歐氏距離為相似度測度時(shí),累加直方圖能體現(xiàn)信號(hào)在分布軸上各抽樣點(diǎn)間的相關(guān)性,即分布軸上相對某個(gè)抽樣點(diǎn)距離越近的點(diǎn),在某種特性意義上就越相似于該抽樣點(diǎn)。但是累加直方圖能體現(xiàn)這個(gè)性質(zhì)的前提是:信號(hào)本身要有這樣的特性,即特征分布軸上距離小的2點(diǎn)要比距離大的2點(diǎn)更相似。色度信號(hào)相關(guān)的性質(zhì)比較簡單,故累加直方圖算法的檢索結(jié)果還比較令人滿意[14]。而對色彩比較復(fù)雜的自然景物圖像,一般累加直方圖算法在檢索中就會(huì)將不同色度的信號(hào)混淆起來,而在各局部區(qū)間內(nèi)分別應(yīng)用累加直方圖法就可以解決這個(gè)問題.累加顏色直方圖檢索算法是將顏色直方圖中每個(gè)分量進(jìn)行逐步累加,生成新的直方圖,利用新的直方圖進(jìn)行圖像的相似匹配,完成圖像的檢索。該算法能夠收到較好的檢索結(jié)果,但它必須有一個(gè)前提,即信號(hào)本身在特征分布軸上距離小的兩點(diǎn)要比距離大的兩點(diǎn)更相似。為此,有人提出局部累加直方圖檢索算法。該算法把色度沿分布軸分成若干個(gè)局部區(qū)間,而在各個(gè)局部區(qū)間內(nèi)分別應(yīng)用累加直方圖算法。實(shí)驗(yàn)證明,局部累加直方圖檢索算法的檢索效率要優(yōu)于一般累加直方圖檢索算法。6.5實(shí)驗(yàn)結(jié)果(1)測量歐幾里德距離和加權(quán)距離下面是兩幅花朵的圖片,現(xiàn)在在Matlab環(huán)境中編程實(shí)現(xiàn)用累加直方圖方法測歐氏距離和一般直方圖法測加權(quán)距離,經(jīng)過實(shí)驗(yàn)測得:用累加直方圖法測得的歐氏距離為0。3442用一般直方圖法測加權(quán)距離為0。0065圖6.3測歐氏距離所用到的圖片(2)通過Mat(yī)lab程序?qū)崿F(xiàn)對輸入一幅彩色圖像,先將其灰度化,再繪制直方圖,最后輸出原來的輸入圖像和原圖像的直方圖。下圖分別給出了實(shí)驗(yàn)結(jié)果:圖6.4輸入的圖像和輸出的直方圖(3)圖像檢索實(shí)例在對系統(tǒng)進(jìn)行了多次調(diào)試運(yùn)行后,系統(tǒng)基本達(dá)到設(shè)計(jì)目標(biāo),下圖6.5和圖6.6所示為兩次檢索結(jié)果的實(shí)例??梢钥吹剑鶕?jù)用戶提供的查詢關(guān)鍵圖,系統(tǒng)從用戶選擇的圖像庫中檢索到與關(guān)鍵圖相似的圖片并排序返回給用戶。實(shí)驗(yàn)中選擇了100多幅真彩圖作為測試圖像,基本達(dá)到了預(yù)期效果。左邊一幅為待查詢圖,其余從左到右相似度依次減小。以天空為范例的檢索結(jié)果為:圖6。5以天空為范例的檢索結(jié)果以大海為范例的檢索結(jié)果為:圖6。6以大海為范例的檢索結(jié)果7系統(tǒng)的性能評價(jià)7。1查全率和查準(zhǔn)率查全率與查準(zhǔn)率是信息檢索中的標(biāo)準(zhǔn)評價(jià)方法[15],現(xiàn)在已被越來越多地使用在基于內(nèi)容的圖像檢索當(dāng)中[16~18].QBIC中就使用了該方法。以下用圖7.1的a,b,c,d的關(guān)系來說明檢索過程的查全率和查準(zhǔn)率[19]:ccbad圖7。1a,b,c,d關(guān)系示意圖(圖中a+b+c+d=Qa+c=Aa+b=B)圖中Q為整個(gè)圖像數(shù)據(jù)庫,A代表相關(guān)圖像的集合,B代表檢索出的圖像集合。則查準(zhǔn)率(7。1)查全率(7.2)誤檢率(7.3)即表示的意思如下:查全率的主要含義是在一次查詢過程中,用戶所查到的相關(guān)圖像的數(shù)目和數(shù)據(jù)庫中與目標(biāo)圖像相關(guān)的所有圖像數(shù)目之比;而查準(zhǔn)率主要指在一次查詢過程中所查到的相關(guān)圖像數(shù)目同該次查到的所有圖像數(shù)目之比。用戶在評價(jià)算法的時(shí)候,可以預(yù)先選定含有特有目標(biāo)的圖像作為一組相關(guān)的圖像,然后根據(jù)返回的結(jié)果計(jì)算查全率和查準(zhǔn)率。查全率和查準(zhǔn)率越高,說明該檢索算法的效果越好。用查全率R作為x軸,查準(zhǔn)率P作為y軸,繪制一條查準(zhǔn)率-查全率曲線,簡稱為PVR曲線。設(shè)PVR曲線為,則與-軸圍成的面積為:(7.4)稱為PVR指數(shù).據(jù)研究,該指數(shù)越大,圖像檢索性能越好。由此可以看出,查全率反映檢索的全面性,而查準(zhǔn)率則反映檢索的準(zhǔn)確性,因此可以用查全率和查準(zhǔn)率來評價(jià)系統(tǒng)的有效性.該方法的局限性在于沒有考慮檢索結(jié)果中相似圖像所處的位置,同時(shí),高的準(zhǔn)確率與查全率并不一定表明一個(gè)系統(tǒng)工作得好,這還要視具體的應(yīng)用而定[21]。7.2排序評價(jià)方法設(shè)查詢的返回圖像幅數(shù)為N,在N幅返回圖像中,為檢索到的相關(guān)圖像的數(shù)目,為相關(guān)圖像的排序序號(hào),為實(shí)際的相關(guān)圖像數(shù),則評價(jià)參數(shù)如下[22]:檢索到的相關(guān)圖像的平均排序?yàn)椋?.5)理想的相關(guān)圖像的平均排序?yàn)?7.6)相關(guān)圖像的丟失率r?yàn)?7.7)表示理想情況下的平均排序,即返回相關(guān)圖像全部排在最前面時(shí)的平均序號(hào).越接近,表示查詢效果越好。此外,還有人提出了使用以下標(biāo)準(zhǔn)化的平均排序方法:(7.8)對于最理想的檢索,是0。結(jié)論本文開篇先談了基于內(nèi)容的圖像檢索的國內(nèi)外現(xiàn)狀,這也主要是說明該課題研究的必要性。接著比較詳細(xì)地介紹了目前基于內(nèi)容的圖像檢索技術(shù)中的關(guān)鍵技術(shù)和檢索原理和檢索流程,為下面進(jìn)一步的研究打下理論基礎(chǔ).又對利用直方圖算法所用到的基礎(chǔ)理論進(jìn)行介紹,主要介紹的是其中的顏色特征理論和顏色直方圖理論,因?yàn)檫@是本文直方圖算法的重點(diǎn)理論部分。在本文的第六部分又詳細(xì)介紹了本文的核心部分即累加直方圖算法理論及實(shí)際中的實(shí)驗(yàn)結(jié)果。最后內(nèi)容還提到對基于內(nèi)容的圖像檢索系統(tǒng)的評價(jià)以及圖像檢索今后的研究趨勢。經(jīng)過實(shí)驗(yàn),我對我的系統(tǒng)進(jìn)行了多次的修改,基本實(shí)現(xiàn)了預(yù)計(jì)的目標(biāo),圖像檢索的功能比較好的實(shí)現(xiàn)出來了,面且還證明了累加直方圖算法相比較于其它的算法是比較優(yōu)越的一種算法。目前,在基于內(nèi)容的圖像檢索領(lǐng)域,在諸多研究方面,如視覺特征提取、多特征組合檢索,以及高維索引的結(jié)構(gòu)等,己經(jīng)取得定進(jìn)展,然而依然還有許名有待進(jìn)一步解決的問題,(1)從自動(dòng)分析到人機(jī)交互?;谟?jì)算機(jī)視覺的模式識(shí)別系統(tǒng)和圖像檢索系統(tǒng)的根本區(qū)別在于后者中人的參與是不可缺少的.早期人們強(qiáng)調(diào)全
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 經(jīng)濟(jì)衰退后的政策選擇試題及答案
- 2025年軟件設(shè)計(jì)師考試的知識(shí)應(yīng)用能力提升試題及答案
- 跨文化交流與2024年高考作文試題及答案
- 網(wǎng)絡(luò)管理員考試重點(diǎn)內(nèi)容試題及答案2025
- 梳理知識(shí)點(diǎn)2025年中級會(huì)計(jì)實(shí)務(wù)考試試題及答案
- 法學(xué)概論理論問題及試題和答案詳解
- 行政法學(xué)發(fā)展歷程中的試題及答案
- 后端架構(gòu)設(shè)計(jì)試題及答案
- 高考作文訓(xùn)練的方法與建議試題及答案
- 2025協(xié)商解除勞動(dòng)合同協(xié)議書范本(標(biāo)準(zhǔn))
- 廣西建設(shè)工程造價(jià)咨詢服務(wù)行業(yè)收費(fèi)參考標(biāo)準(zhǔn)
- 綜合布線-r4.1-雙絞線鏈路測試
- 汽車保養(yǎng)與維護(hù)實(shí)操考核
- 圖紙會(huì)審會(huì)議紀(jì)要范本
- GB∕T 17466.1-2019 家用和類似用途固定式電氣裝置的電器附件安裝盒和外殼 第1部分:通用要求
- 鉆探設(shè)備工具材料共12
- 得到上市招股書:北京思維造物信息科技股份有限公司
- 淺談高速公路瀝青混凝土路面橋頭跳車幾種處理措施
- 機(jī)動(dòng)車檢測站授權(quán)簽字人內(nèi)部培訓(xùn)考題(含答案)
- 病例報(bào)告表(CRF)模板
- 幼兒園:周佳茵 中班科學(xué)教案《有趣的紙橋》
評論
0/150
提交評論