ASP.NET WEB中圖像的檢索技術(shù)研究開題報(bào)告.doc_第1頁(yè)
ASP.NET WEB中圖像的檢索技術(shù)研究開題報(bào)告.doc_第2頁(yè)
ASP.NET WEB中圖像的檢索技術(shù)研究開題報(bào)告.doc_第3頁(yè)
ASP.NET WEB中圖像的檢索技術(shù)研究開題報(bào)告.doc_第4頁(yè)
ASP.NET WEB中圖像的檢索技術(shù)研究開題報(bào)告.doc_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1附件6:本科生畢業(yè)論文(設(shè)計(jì))開題報(bào)告論文題目:Web中圖像的檢索技術(shù)研究.學(xué)生姓名:童宏梁年級(jí)(學(xué)號(hào)):9906528.二級(jí)學(xué)院:信息工程學(xué)院專業(yè):電子信息工程.指導(dǎo)教師:張量職稱:副教授.填表日期:2004年2月25日杭州師范學(xué)院教務(wù)處制2一、選題依據(jù)(背景與意義、國(guó)內(nèi)外研究現(xiàn)狀與發(fā)展趨勢(shì))隨著網(wǎng)絡(luò)傳送速度與計(jì)算機(jī)信息處理速度的提高,網(wǎng)頁(yè)中對(duì)多媒體信息的使用變得十分普及,特別是圖像信息,己經(jīng)成為表示網(wǎng)頁(yè)內(nèi)容不可缺少的組成部分。因此人們對(duì)多媒體信息的檢索需求也就隨之隨之變得特別迫切。但由于圖像檢索系統(tǒng)涉及了多學(xué)科的知識(shí),實(shí)現(xiàn)和應(yīng)用的難度相當(dāng)高,所以已有的圖像檢索系統(tǒng)都有這樣或那樣的缺陷。而傳統(tǒng)的信息檢索主要集中于文字的檢索,在多媒體方面的研究并不是很多。互聯(lián)網(wǎng)上的多媒體以圖像為主,因此圖像的檢索就成為了目前研究的熱點(diǎn)。圖像檢索經(jīng)歷了兩個(gè)階段:第一階段是以文本為基礎(chǔ)的檢索。第二階段是以圖像自身的內(nèi)容為基礎(chǔ)的檢索。上個(gè)世紀(jì)70年代開始,有關(guān)圖像檢索的研究就已開始,當(dāng)時(shí)主要是基于文本的圖像檢索技術(shù)利用文本描述的方式描述圖像的特征。到90年代以后,出現(xiàn)了對(duì)圖像的內(nèi)容語(yǔ)義,如圖像的顏色、紋理、布局等進(jìn)行分析和檢索的圖像檢索技術(shù),即基于內(nèi)容的圖像檢索技術(shù)。而無(wú)論是什么引擎,它首先都必須遵循以下幾個(gè)要點(diǎn):(1)索引文檔的容量:現(xiàn)在最大的搜索引擎可能包含了超過(guò)100,000,000個(gè)鏈接,但這也只是整個(gè)Web網(wǎng)上的一小部分。因?yàn)槭占Y料的Robot,只能從“已知”的鏈接開始收集網(wǎng)頁(yè)資料,而只有一小部分Web網(wǎng)頁(yè)和這些“已知”的網(wǎng)頁(yè)有連接;現(xiàn)在還沒(méi)有一個(gè)搜索引擎能夠隨網(wǎng)頁(yè)內(nèi)容的更新比較及時(shí)地更新索引;(2)覆蓋面:地理覆蓋面和主題覆蓋面;(3)索引更新頻率:不同的搜索引擎,索引更新頻率相差很大,有的是幾周,有的是一年。索引更新頻率有兩種定義,一種比較少用的定義是新的網(wǎng)頁(yè)能被收錄進(jìn)索引數(shù)據(jù)庫(kù)中,另一種是同一頁(yè)多少時(shí)間才被檢查一次,有必要時(shí)更新索引。有的搜索引擎會(huì)對(duì)經(jīng)常更新的網(wǎng)頁(yè)和多人訪問(wèn)的網(wǎng)頁(yè)進(jìn)行更頻繁的重建索引工作;(4)采集過(guò)程:采集過(guò)程有寬度優(yōu)先、深度優(yōu)先兩種算法;一般認(rèn)為寬度優(yōu)先對(duì)擴(kuò)大內(nèi)容的覆蓋面有利,深度優(yōu)先算法有助于提供更多的細(xì)節(jié)資料;(5)索引算法:有的搜索引擎只處理元標(biāo)記和一小部分文檔內(nèi)容,而有一些搜索引擎則是對(duì)全文進(jìn)行索引;(6)結(jié)果顯示:有的搜索引擎只顯示網(wǎng)頁(yè)的標(biāo)題,有些則有更詳細(xì)的一些信息,比如網(wǎng)頁(yè)的內(nèi)容,更新日期等;(7)查詢算法:一個(gè)優(yōu)秀的查詢算法是很重要的,最基本的布爾查詢,短語(yǔ)查詢,有的搜索引擎還提供指定屬性的查詢,比如可以指定對(duì)網(wǎng)頁(yè)的作者、主題進(jìn)行查詢。另外有的搜索引擎還采用了相關(guān)度反饋、概念查詢等算法;(8)用戶界面:很多搜索引擎都提供了簡(jiǎn)單查詢和高級(jí)查詢兩個(gè)界面。并且提供了必要的幫助和范例。在檢索原理上,無(wú)論是基于文本的圖像檢索還是基于內(nèi)容的圖像檢索,主要包括三方面:一方面對(duì)用戶需求的分析和轉(zhuǎn)化,形成可以檢索索引數(shù)據(jù)庫(kù)的提問(wèn);另一方面,收集和加工圖像資源,提取特征,分析并進(jìn)行標(biāo)引,建立圖像的索引數(shù)據(jù)庫(kù);最后一方面是根據(jù)相似度算法,計(jì)算用戶提問(wèn)與索引數(shù)據(jù)庫(kù)中記錄的相似度大小,提取出滿足閾值的記錄作為結(jié)果,按照相似度降序的方式輸出。為了進(jìn)一步提高檢索的準(zhǔn)確性,許多系統(tǒng)結(jié)合相關(guān)反饋技術(shù)來(lái)收集用戶對(duì)檢索結(jié)果的反饋信息,這在CBIR中顯得更為突出,因?yàn)镃BIR實(shí)現(xiàn)的是逐步求精的圖像檢索過(guò)程,在同一次檢索過(guò)程中需要不斷地與用戶進(jìn)行交互?;谖谋竞突趦?nèi)容是圖像檢索發(fā)展的兩個(gè)分支,不過(guò)從目前圖像檢索研究的趨勢(shì)而言,尤其結(jié)合網(wǎng)絡(luò)環(huán)境下圖像的特征嵌入在具有文本內(nèi)容的Web文檔中,出現(xiàn)了三個(gè)不同的研究著眼點(diǎn)。立足于文本,對(duì)圖像進(jìn)行檢索。試圖將傳統(tǒng)的文本檢索技術(shù)移植于對(duì)多媒體信息的檢索上,因?yàn)榛谖谋镜臋z索技術(shù)發(fā)展已經(jīng)成熟。如Page-Rank方法、概率方法、位置方法、摘要方法、分類或聚類方法、詞性標(biāo)注法等,不僅技術(shù)發(fā)展較為成熟,同時(shí)分析和實(shí)現(xiàn)的難度略小。但是因?yàn)槭芸卦~匯本身的局限,易歧義,更新慢,所以不太容易應(yīng)對(duì)網(wǎng)絡(luò)上日新月異的各類圖像。立足于圖像內(nèi)容,對(duì)圖像進(jìn)行分析和檢索。相比而言,盡管圖像檢索已經(jīng)出現(xiàn)了諸如直方圖、顏色矩、顏色集等多種表征圖像特征的方法,但是要突破對(duì)低層次特征的分析,實(shí)現(xiàn)更高語(yǔ)義上的檢索,實(shí)現(xiàn)難度大,進(jìn)展慢。不過(guò),基于內(nèi)容的圖像檢索建立在多媒體信息的內(nèi)容語(yǔ)義上,能夠更為客觀地反映媒體本質(zhì)的特征。結(jié)合文本和內(nèi)容,進(jìn)行融合性研究。發(fā)揮各自的優(yōu)勢(shì)促進(jìn)圖像的高效、簡(jiǎn)單檢索方式的實(shí)現(xiàn),尤其是網(wǎng)絡(luò)環(huán)境下,結(jié)合圖像所在Web文檔的特征分析,推斷圖像的特征,同時(shí)結(jié)合對(duì)圖像的內(nèi)容分析,共同標(biāo)引達(dá)到對(duì)圖像的分析和檢索。3可以說(shuō),三個(gè)方向都是相互影響和促進(jìn)的,任何一個(gè)方向的進(jìn)展都會(huì)促進(jìn)圖像檢索技術(shù)向前更進(jìn)一步。由于搜索引擎技術(shù)的開發(fā)牽涉到信息檢索、人工智能、計(jì)算機(jī)網(wǎng)絡(luò)、分布式處理、數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘、自然語(yǔ)言處理等許多基礎(chǔ)研究領(lǐng)域的理論和技術(shù),因此至今還沒(méi)有真正脫離實(shí)驗(yàn)室的階段,中文搜索引擎的開發(fā)就更涉及到語(yǔ)言習(xí)慣的差異、智能切分詞等棘手的問(wèn)題,而且中文搜索引擎技術(shù)的起步也較晚,還遠(yuǎn)沒(méi)能滿足中國(guó)網(wǎng)民的需求。如今圖像檢索技術(shù)的研究和應(yīng)用為我國(guó)數(shù)字圖書館工程中的核心問(wèn)題提供了理論和實(shí)踐依據(jù)。因此怎樣揚(yáng)長(zhǎng)避短選擇一種最適合中國(guó)國(guó)情的圖像檢索技術(shù)就是本文研究的目的和意義。二、研究目標(biāo)與主要內(nèi)容(含論文提綱)在網(wǎng)絡(luò)和多媒體技術(shù)越來(lái)越發(fā)達(dá)的今天,信息檢索技術(shù)成了現(xiàn)在計(jì)算機(jī)領(lǐng)域的重要內(nèi)容,而圖像檢索技術(shù)又正是這其中的重要內(nèi)容之一。而網(wǎng)絡(luò)資源的極大豐富以及圖像檢索技術(shù)不斷發(fā)展成熟,使得圖像檢索技術(shù)的應(yīng)用領(lǐng)域不斷擴(kuò)大,這為圖像檢索技術(shù)的繼續(xù)研究提供條件。人們?yōu)榱藢?duì)圖像進(jìn)行更好的使用和組織管理,便開發(fā)出了多種多樣圖像檢索技術(shù),本文首先要將各種圖像檢索技術(shù)的工作原理、研究現(xiàn)狀、相關(guān)圖像搜索引擎與發(fā)展趨勢(shì)作一個(gè)介紹。隨著網(wǎng)絡(luò)傳送速度與計(jì)算機(jī)信息處理速度的提高,網(wǎng)頁(yè)中對(duì)多媒體信息的使用變得十分普及,特別是圖像信息,己經(jīng)成為表示網(wǎng)頁(yè)內(nèi)容不可缺少的組成部分。在實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)中文本信息提取的同時(shí),如何再為用戶抽取所需的圖片資料,是信息檢索中一個(gè)重要的方面。于是各種基于Web的圖像檢索系統(tǒng)應(yīng)運(yùn)而生。它們采用不同的工作方式,極大地方便了用戶對(duì)網(wǎng)上圖像進(jìn)行檢索。目前圖像檢索技術(shù)的發(fā)展正走向更加成熟和完善,其中Web圖像搜索技術(shù)也更加完善,本文將介紹這種圖像檢索技術(shù)并闡述Web頁(yè)中的圖像與文本之間的關(guān)系,對(duì)相似度等作出了詳細(xì)的論述。4三、擬采取的研究方法、研究手段及技術(shù)路線、實(shí)驗(yàn)方案等如今在Web中處理圖像檢索有很多成熟的技術(shù),如基于Web的數(shù)據(jù)倉(cāng)庫(kù)、Web數(shù)據(jù)挖掘、Web數(shù)據(jù)源集成技術(shù)等。為此,必須為Web建立適當(dāng)?shù)臄?shù)據(jù)模型,利用數(shù)據(jù)模型有效地從Web中獲取信息。為了處理Web的中文數(shù)據(jù),還必須使用一系列中文自然語(yǔ)言處理技術(shù)。比較基礎(chǔ)的技術(shù)有自動(dòng)分詞、人名和機(jī)構(gòu)名的自動(dòng)識(shí)別、自動(dòng)標(biāo)引等,其他像信息抽取、自動(dòng)文摘、文檔自動(dòng)分類、中文概念詞的自動(dòng)發(fā)現(xiàn)以及概念詞之間的語(yǔ)義關(guān)系的確定等技術(shù)都必不可少。我們可以根據(jù)現(xiàn)有的參考資料以及當(dāng)前的技術(shù),先搞清傳統(tǒng)的搜索引擎的工作實(shí)質(zhì)和原理,比如網(wǎng)絡(luò)信息搜索關(guān)鍵詞的匹配原理和相象或類似計(jì)算方法,研究搜索引擎的內(nèi)在關(guān)鍵,提出搜索相似度的算法。然而現(xiàn)有的搜索引擎雖然給我們的信息搜索帶來(lái)了很大的方便,但由于其中程序過(guò)于復(fù)雜,反饋保存的內(nèi)容過(guò)多,因此給我們的很容易過(guò)多占去我們所擁有的CPU資源和網(wǎng)絡(luò)資源,從而降低我們的搜索速度。這里我們提出了在Web中的一種簡(jiǎn)單而有效的搜索方法,雖然計(jì)算方法簡(jiǎn)單,在網(wǎng)絡(luò)中的信息搜索可能不是很精確,但對(duì)計(jì)算方法進(jìn)行改進(jìn),同時(shí)引進(jìn)了有效的反饋機(jī)制,只要對(duì)其在實(shí)驗(yàn)中多次的進(jìn)行反饋訓(xùn)練和投入使用后的用戶使用,同樣能給我們提高搜索精度,但所占用的資源卻要小的多,相對(duì)速度也就要快很多。四、中外文參考文獻(xiàn)目錄(作者、書名論文題目、出版社或刊號(hào)、出版年月或出版期號(hào))(1)張量,詹國(guó)華,袁貞明,基于Web的圖像搜索,計(jì)算機(jī)工程,2002.5(2)朱學(xué)芳,多媒體信息處理與檢索技術(shù)M,電子工業(yè)出版社,2003(3)陳瀅,徐宏炳,王能斌,協(xié)作式Web資源發(fā)現(xiàn)系統(tǒng)模型,計(jì)算機(jī)學(xué)報(bào),1998.4(4)陽(yáng)小華,周龍?bào)J,WorldWideWeb的索引與查詢技術(shù),計(jì)算機(jī)科學(xué),1997(5)吳立德等,大規(guī)模中文文本處理,復(fù)旦大學(xué)出版社,1997(6)李唐,解讀網(wǎng)絡(luò)圖像搜索引擎,Internet網(wǎng)絡(luò),2001(7)陳立娜,Internet上的圖像檢索技術(shù),天極yesky,2001.5(8)黃博士,網(wǎng)絡(luò)環(huán)境下的圖像檢索技術(shù),中國(guó)計(jì)算機(jī)用戶,2003.12.30(9)DunlopM.D.(1991).MultimediaInformationRetrieval,Ph.D.Thesis.ComputingScienceDepartment,UniversityofGlasgow,Report199l/R21.(10)EllenM.VoorheesandYuan-WangHou,VectorExpansioninaLargeCollection”,FirstTextREtrievalConference(TREC-1),1993.(11)FrisseM.E,(1988).Searchingforinformationinahypertextmedicalhandbook.CommunicationsoftheACM,3I(7),pp.880-886.(12)R.Price,T.SChua,andS.Al-Hawamdeh,Applyingrelevancefeedbackonaphotoarchivalsystem.JournalofInformationScience,18:203-215,1992(13)W.Niblack,R.Barber,andW.Equitz.theqbibproject:queryingimagesbycont

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論