




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、圖像檢索技術(shù)綜述,本文主要內(nèi)容,圖像檢索技術(shù)的發(fā)展歷史 當前主流的圖像檢索技術(shù)介紹 一個圖像搜索引擎的系統(tǒng)模型,20世紀70年代: TBIR (Text-based Image Retrieval) 基于文本的圖像檢索技術(shù) 沿用了傳統(tǒng)文本檢索技術(shù),利用文本描述的方式表示圖像的特征。,早期的TBIR: 手工對圖像進行注釋,工作量相當大,不可避免地會帶來主觀性和不精確性 Internet環(huán)境下的TBIR: 網(wǎng)頁信息的自動采集和標引技術(shù) 索引方式:全文索引和關(guān)鍵詞索引 Google,Yahoo和百度等搜索引擎所提供的圖像檢索服務(wù),它們采用的都是TBIR技術(shù),TBIR的優(yōu)點:使用成熟的文本檢索和搜索引
2、擎技術(shù),符合人們的檢索習慣,實現(xiàn)簡單,TBIR的缺點:標注的準確性差,也不能滿足用戶對圖像原始特征信息的檢索,MPEG-7 國際標準化組織ISOIEC 制定的MPEG-7國際標準,該標準的正式名稱為“多媒體內(nèi)容描述接口”(Multimedia Content Description Interface),為各類多媒體信息提供一種標準化的描述,并將該描述與所描述的內(nèi)容相關(guān)聯(lián),極大地促進了對各種多媒體信息的快速查詢和訪問。 該標準于1998年10月提出,于2001年最終完成并公布。,MPEG-7標準化的范圍包括: 一系列的描述子(描述子是特征的表示法,一個描述子就是定義特征的語法和語義學); 一系
3、列的描述結(jié)構(gòu)(詳細說明成員之間的結(jié)構(gòu)和語義); 一種詳細說明描述結(jié)構(gòu)的語言、描述定義語言(DDL); 一種或多種編碼描述方法。,90年代以來: CBIR (Content-based Image Retrieval) 基于內(nèi)容的圖像檢索 對圖像的視覺內(nèi)容,如圖像的顏色、紋理、形狀等進行分析和檢索圖像。 其特點是圖像本身包含的客觀視覺特性,不需要人為干預(yù)和解釋,能夠通過計算機自動實現(xiàn)對圖像特征的提取和存儲。,CBIR進行檢索時利用的是第2層的特征。特征提取是CBIR系統(tǒng)最基礎(chǔ)的部分,在很大程度上決定了CBIR系統(tǒng)的成敗 1,特征提取,1 基于顏色特征的檢索,實踐表明,基于顏色的CBIR系統(tǒng)具有較
4、好的性能,而且實現(xiàn)相對容易最常用的表達顏色特征的方法是顏色直方圖。 其他常用的顏色特征表示方法還有顏色矩和顏色相關(guān)圖。 2,2 基于紋理特征的檢索,紋理是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺特征,對圖像灰度變化的特征進行量化,與對象的位置、走向、大小、形狀有關(guān),與平均灰度級無關(guān)。 圖像檢索中用到的紋理特征表示方法主要有:Tamura法、小波變換和自回歸紋理模型。 3,3 基于形狀特征的檢索,形狀特征常與目標聯(lián)系在一起,需提取目標的輪廓或描述目標輪廓所包圍的區(qū)域的性質(zhì)。因此形狀比顏色和紋理的語義性更強。 基于邊界的表示:代表方法是傅里葉描述子。其基本思想是用對圖像進行傅里葉變換得到的
5、邊界作為形狀描述. 其中一個優(yōu)點就是把二維問題簡化為一維問題。 基于區(qū)域的表示:代表方法是不變矩法。,CBIR系統(tǒng)向用戶提供的查詢方式,示例查詢就是由用戶提交一個或幾個例子圖像,然后由系統(tǒng)檢索出特征與之相似的圖像這里的“相似”,指的是上述的顏色、紋理和形狀等幾個視覺特征上的相似。 草圖查詢:用戶可以簡單地畫一幅草圖,由系統(tǒng)檢索出視覺特征上與之相似的圖像。,目前基于內(nèi)容圖像檢索技術(shù)已經(jīng)取得了不少的成就,一些著名的圖像檢索系統(tǒng)相繼被推出,有IBM的 QBIC 系統(tǒng),哥倫比亞大學開發(fā)的 Visual-SEEK,MIT多媒體實驗室開發(fā)的 Photo-Book,U C Berkeley開發(fā)的 Chabo
6、t 系統(tǒng)等。,CBIR利用圖像本身固有的物理信息,能夠?qū)D像的顏色、紋理和形狀等特征進行比較,在指紋識別、商標檢索和醫(yī)學圖像檢索等特定領(lǐng)域得到了廣泛應(yīng)用,因為這些領(lǐng)域的圖像在某些特征上容易識別,比如同一個手指的指紋其紋理是一樣的。 然而,Internet上的圖像來自不同的領(lǐng)域,根本無法捕獲其共同點,用基于內(nèi)容的方法對這些圖像進行檢索,其效果遠不能令人滿意,基于語義的圖像檢索,基于語義的圖像檢索的目的,就是要使計算機檢索圖像的能力達到人的理解水平。 在圖1所示的圖像內(nèi)容層次模型中,語義位于最高層:第3層。第2層和第3層之間的差別被許多學者稱為“語義鴻溝” (semantic gap)。縮小語義鴻
7、溝的辦法有2種:由高層語義導(dǎo)出低層特征和由低層特征向高層語義的轉(zhuǎn)換。,在原有檢索系統(tǒng)中加入高級語義到低層特征的轉(zhuǎn)化,可以在不改變現(xiàn)有的圖像特征庫和匹配方式的情況下,實現(xiàn)基于語義的圖像檢索,其基本框圖見圖2. 圖像語義的提前過程是由低層特征向高層語義轉(zhuǎn)化的過程。在獲取語義和有效地表達語義的基礎(chǔ)上,可以建立語義索引,提取圖像語義的模型見圖3。,基于反饋的圖像檢索,相關(guān)反饋方法的基本思想是在檢索過程中,允許用戶對檢索結(jié)果進行評價和標記,指出結(jié)果中哪些是用戶希望得到的查詢圖像,哪些是不相關(guān)的,然后將用戶標記的相關(guān)信息作為訓練樣本反饋給系統(tǒng)進行學習,指導(dǎo)下一輪檢索,從而使得檢索結(jié)果更符合用戶的需要。,基
8、于知識的圖像檢索,將人工智能領(lǐng)域的基于知識的處理方法引入到圖像處理領(lǐng)域,通過對圖像理解、知識表達、機器學習,并結(jié)合專家和用戶的先驗知識,建立圖像知識庫實現(xiàn)對圖像數(shù)據(jù)庫的智能檢索。主要涉及到自然語言理解、專家系統(tǒng)、知識表達和機器學習等人工智能的主要研究領(lǐng)域。,一個圖像搜索引擎的系統(tǒng)模型,SeekImg系統(tǒng)是華中科技大學圖像識別與人工智能研究所開發(fā)的,一個www上的圖像搜索引擎的原型系統(tǒng)。4 該系統(tǒng)采用Internet搜索技術(shù)、圖像自動識別技術(shù)和基于內(nèi)容的圖像檢索技術(shù),基于C1ientServer 架構(gòu)和 Microsoft SQL ServerNT 平臺研制開發(fā)。,SeekImg由四部分組成:爬
9、蟲部分、圖像處理、圖像數(shù)據(jù)庫和查詢服務(wù)器。,爬蟲又稱為“www圖片自動搜尋和下載模塊”,主要完成從www網(wǎng)站上尋找圖片并下載到系統(tǒng)的服務(wù)器上;圖像處理部分是SeekImg的核心模塊,主要完成下載的圖像的自動分析和特征信息的自動提?。粩?shù)據(jù)庫部分在服務(wù)器端完成SeekImg的圖像信息組織,在客戶端接受用戶的例子圖像,通過基于內(nèi)容的圖像檢索算法,完成對服務(wù)器端圖像信息的檢索,并將結(jié)果輸出給用戶。5,用戶可采用的三種查詢方式: 當用戶采用傳統(tǒng)的關(guān)鍵字檢索方式時,利用圖像數(shù)據(jù)庫中的關(guān)鍵字字段進行檢索。 當用戶提供了示例圖像時,先對示例圖像產(chǎn)生索引向量,采用某種距離度量算法,算出示例圖像和圖像數(shù)據(jù)庫中圖片
10、的索引向量之間的距離,得到距離最近的若干幅圖片。 用戶也可以指定圖像特征,例如,紅色30,黃色50。服務(wù)器將構(gòu)造出索引向量,然后找出距離最近的若干幅圖片。,參考文獻,1賀玲, 吳玲達, 蔡益朝 CBIR 中的索引技術(shù)綜述J.小型微型計算機系統(tǒng).2006,vol.27:141-145 2劉忠偉,章毓晉十種基于顏色特征的圖像檢索算法的比較和分析J信號處理,2OOO,16(1):79-84 3MA W Y,ZHANG H JBenchmarking of Image Features for Content-based RetrievalCThe 32nd Asilomar Conference on Signals,Systems Computers
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鄉(xiāng)鎮(zhèn)煙花爆竹經(jīng)銷店安全檢查表
- 網(wǎng)點用戶體驗提升策略-洞察闡釋
- 蛋白質(zhì)相互作用網(wǎng)絡(luò)與疾病關(guān)聯(lián)研究-洞察闡釋
- 安全員證和c證
- 幼兒注意力培養(yǎng)的教育心理學技巧
- 船舶安全生產(chǎn)月活動方案
- 環(huán)境保護鑒定-洞察及研究
- 從業(yè)人員安全生產(chǎn)管理制度
- 加強國際交流促進中醫(yī)教育現(xiàn)代化發(fā)展
- 食堂安全管理應(yīng)急預(yù)案
- 手電筒產(chǎn)品課程設(shè)計報告書
- 《優(yōu)質(zhì)客戶服務(wù)技巧》
- TL4型彈性套柱銷聯(lián)軸器零件工藝規(guī)程及加工柱銷孔液動夾具設(shè)計
- 05-衣之鏢-輔行訣湯液經(jīng)法用藥圖釋義
- LS/T 3240-2012湯圓用水磨白糯米粉
- GB/T 15298-1994電子設(shè)備用電位器第一部分:總規(guī)范
- 2023高中學業(yè)水平合格性考試歷史重點知識點歸納總結(jié)(復(fù)習必背)
- 自然指數(shù)NatureIndex(NI)收錄的68種自然科學類期刊
- 手術(shù)報告審批單
- 《專業(yè)導(dǎo)論光電信息科學與工程》教學大綱
- 少兒美術(shù)國畫- 少兒希望 《紫藤課件》
評論
0/150
提交評論