基于詞袋模型的圖像分類_第1頁(yè)
基于詞袋模型的圖像分類_第2頁(yè)
基于詞袋模型的圖像分類_第3頁(yè)
基于詞袋模型的圖像分類_第4頁(yè)
基于詞袋模型的圖像分類_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Image Category ClassificationUsing Bag of FeaturesCONTENTS02實(shí)現(xiàn)方法實(shí)現(xiàn)方法Method03Matlab實(shí)驗(yàn)實(shí)驗(yàn)Demo01問題介紹問題介紹Introduction 01問題介紹Introduction圖像分類圖像分類是根據(jù)圖像的語(yǔ)義信息將不同類別圖像區(qū)分開來,是計(jì)算機(jī)視覺中重要的基本問題,也是圖像檢測(cè)、圖像分割、物體跟蹤、行為分析等其他高層視覺任務(wù)的基礎(chǔ)。圖像分類在很多領(lǐng)域有廣泛應(yīng)用,包括安防領(lǐng)域的人臉識(shí)別和智能視頻分析等,交通領(lǐng)域的交通場(chǎng)景識(shí)別,互聯(lián)網(wǎng)領(lǐng)域基于內(nèi)容的圖像檢索和相冊(cè)自動(dòng)歸類,醫(yī)學(xué)領(lǐng)域的圖像識(shí)別等。主要問題問題描述已有

2、固定分類標(biāo)簽,對(duì)于輸入的圖像,預(yù)測(cè)其所屬的分類標(biāo)簽。問題難點(diǎn)圖像視角變化(viewpoint variation)圖像大小變化(scale variation)圖像形變(deformation)圖像遮擋(occlusion)圖像光照條件(illumination conditions)圖像背景干擾(background clutter)圖像類內(nèi)差異(intra-class variation)02實(shí)現(xiàn)方法Method一般流程一般來說,圖像分類通過手工特征或特征學(xué)習(xí)方法對(duì)整個(gè)圖像進(jìn)行全部描述,然后使用分類器判別物體類別,因此如何提取圖像的特征至關(guān)重要。在深度學(xué)習(xí)算法之前使用較多的是基于詞袋(Ba

3、g of Words)模型的物體分類方法。詞袋方法從自然語(yǔ)言處理中引入,即一句話可以用一個(gè)裝了詞的袋子表示其特征,袋子中的詞為句子中的單詞、短語(yǔ)或字。對(duì)于圖像而言,詞袋方法需要構(gòu)建字典。最簡(jiǎn)單的詞袋模型框架可以設(shè)計(jì)為底層特征抽取、特征編碼、分類器設(shè)計(jì)三個(gè)過程。BOWBag of WordsBag-of-Words模型源于文本分類技術(shù),在信息檢索中,它假定對(duì)于一個(gè)文本,忽略其詞序和語(yǔ)法、句法。將其僅僅看作是一個(gè)詞集合,或者說是詞的一個(gè)組合,文本中每個(gè)詞的出現(xiàn)都是獨(dú)立的,不依賴于其他詞是否出現(xiàn),或者說這篇文章的作者在任意一個(gè)位置選擇詞匯都不受前面句子的影響而獨(dú)立選擇的。BOFBag of Feat

4、ures圖像可以視為一種文檔對(duì)象,圖像中不同的局部區(qū)域或其特征可看做構(gòu)成圖像的詞匯,其中相近的區(qū)域或其特征可以視作為一個(gè)詞。這樣,就能夠把文本檢索及分類的方法用到圖像分類及檢索中去。BOF算法實(shí)現(xiàn)過程Bag-of-Features模型仿照文本檢索領(lǐng)域的Bag-of-Words方法,把每幅圖像描述為一個(gè)局部區(qū)域/關(guān)鍵點(diǎn)(Patches/Key Points)特征的無序集合。使用某種聚類算法(如K-means)將局部特征進(jìn)行聚類,每個(gè)聚類中心被看作是詞典中的一個(gè)視覺詞匯(Visual Word),相當(dāng)于文本檢索中的詞,視覺詞匯由聚類中心對(duì)應(yīng)特征形成的碼字(code word)來表示(可看當(dāng)為一種特征量化過程)。所有視覺詞匯形成一個(gè)視覺詞典(Visual Vocabulary),對(duì)應(yīng)一個(gè)碼書(code book),即碼字的集合,詞典中所含詞的個(gè)數(shù)反映了詞典的大小。圖像中的每個(gè)特征都將被映射到視覺詞典的某個(gè)詞上,這種映射可以通過計(jì)算特征間的距離去實(shí)現(xiàn),然后統(tǒng)計(jì)每個(gè)視覺詞的出現(xiàn)與否或次數(shù),圖像可描述為一個(gè)維數(shù)相同的直方圖向量,即Bag-of-Features。03Matlab實(shí)驗(yàn)demo準(zhǔn)備數(shù)據(jù)集一:文件管理器打開172.22.108.160二:瀏覽器打開進(jìn)入目錄 “Matlab實(shí)驗(yàn)” 復(fù)制或下載所需數(shù)據(jù)集Matlab實(shí)驗(yàn)Matlab實(shí)驗(yàn)Matlab實(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論