人工智能結果論文報告_第1頁
人工智能結果論文報告_第2頁
人工智能結果論文報告_第3頁
人工智能結果論文報告_第4頁
人工智能結果論文報告_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

PAGE2人工智能結課報告學院:信息工程與自動化學院專業(yè):計算機科學與技術教師:年級:班級:姓名:學號:人工智能結果論文報告移動Web搜索研究ResearchonMobileWebSearch摘要:隨著3G時代的到來和Web資源的飛速增長,移動互聯(lián)網(wǎng)呈現(xiàn)出快速發(fā)展的趨勢,人們可以利用移動終端設備便捷地訪問網(wǎng)絡,從中獲取用戶想要信息。然而如何對Web資源進行地理標記,并將地理數(shù)據(jù)與Web數(shù)據(jù)進行無縫集成,為移動用戶提供有價值的高度相關的信息,卻都是十分具有挑戰(zhàn)性的技術研究。我學習了這一篇文章,《移動Web搜索研究》提出了一個移動Web搜索的系統(tǒng)框架,該框架對移動Web搜索領域關鍵性技術進行了分類概括總結。在對已有技術進行深入對比分析的基礎上,指出了該領域未來的研究工作和面臨的挑戰(zhàn),具有深遠的認識和影響。應用價值:隨著移動通信和Internet在人們?nèi)粘I钪械娜找嫫占啊⒁苿油ㄐ艓挼拇蠓忍岣咭约耙苿咏K端功能的逐漸增強,傳統(tǒng)的服務已經(jīng)不能滿足用戶多元化的需求,人們希望隨時隨地訪問互聯(lián)網(wǎng)上的服務,從中獲取豐富的信息。移動互聯(lián)網(wǎng)實現(xiàn)了Web和移動通信的逐步融合,加入了移動性、位置可確定性、終端個人化等固有屬性,使其成為產(chǎn)業(yè)界備受關注的領域,同時也帶來了許多新的挑戰(zhàn)。在移動環(huán)境下,根據(jù)移動用戶的需求,準確地標記Web資源的地理位置,并將用戶上下文信息(比如位置、時間等)與Web中的數(shù)據(jù)結合起來去回答提出的搜索,在此基礎上進行高效的面向移動用戶的查詢處理,獲得高度精確的滿足用戶需求的結果,從而為用戶提供精確便利的服務,都具有非常重要的研究價值,為3G時代下的移動Web搜索提供了一條新道路,具有十分廣闊的應用前景和市場價值。必將成為業(yè)界的頂尖技術和研究項目。難點:通過查詢各種資料,我了解到移動Web搜索研究還處于起步階段,在地理標記Web資源、混合索引的構建、面向移動用戶的查詢處理方法、相關排名技術以及查詢結果的處理與可視化等主要技術都只處于理論性研究,考慮到用戶終端設備和用戶所在區(qū)域的各異性,加入了移動性、位置不可確定性、終端個人化等因素,使得移動Web搜索的發(fā)展和推廣存在巨大障礙,更多的技術細節(jié)還有待學習和研究。收獲:經(jīng)過這段時間的學習,我知道移動Web搜索是以移動網(wǎng)絡為數(shù)據(jù)傳輸承載,將分布在傳統(tǒng)互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)上的數(shù)據(jù)信息進行搜集整理,供手機用戶查詢的業(yè)務。移動搜索是搜索技術與移動通信技術的一種結合體,融合了兩種技術各自的特點。移動搜索的出現(xiàn)真正打破了地域、網(wǎng)絡的局限性,滿足了手機用戶隨時隨地的搜索服務請求。不僅具有傳統(tǒng)搜索引擎的頁面、圖片、新聞搜索功能,而且移動搜索可以使用定位功能自動定位出用戶當前的位置,當用戶使用本地搜索時,搜索結果中會融入用戶的位置信息,可以實時地獲得更加準確、實用的信息。此外,移動版的即時瀏覽功能可以進行直觀的比較搜索結果與網(wǎng)頁預覽等,我也感覺到自己專業(yè)與這一研究領域的相關度,日后會更加關注和學習移動Web搜索的相關知識。綜述:移動Web搜索一直是我最感興趣和想了解的技術。從小就一直接觸手機,可是以前的手機只能打電話和發(fā)短信,還有基本的單一功能,如音樂播放器、相機、視頻播放器等??珊髞淼男滦褪謾C功能更加強大,加入了很多功能,如QQ、飛信、MSN等網(wǎng)絡通信功能。通過自己的專業(yè)學習,我對電子網(wǎng)絡更加感興趣。而且隨著3G時代的到來,越來越多的用戶使用移動終端就能夠便捷地訪問網(wǎng)絡。根據(jù)中國互聯(lián)網(wǎng)絡信息中心發(fā)表的最新報告,手機網(wǎng)民數(shù)已達4億,并呈直線上升趨勢。而移動Web搜索是用戶在訪問網(wǎng)絡時最經(jīng)常進行的活動之一。在日常生活中,我們隨處可見人們在用著手機,不僅僅是打電話和發(fā)短信,人們還用移動設備查詢各種他們需要的信息民。人們經(jīng)常會碰到很多“NowandHere”的問題,需要查詢與其正在進行的活動相關的信息,如:我要找的地方位于什么位置?附近有沒有比較好的吃晚餐的地方?現(xiàn)在有一些什么優(yōu)惠活動?電影院現(xiàn)在正在放映什么電影,離自己位置最近的影院有無剩余的票?我需要停車,現(xiàn)在最近的有停車位的停車場在哪里?怎么乘車才能到達自己想去的地方等等。由以上問題可以看出,人們使用移動設備搜索時大多數(shù)需求都與位置密切相關,很多人都會有相同的處境,那就是自己開車到別的地方(城市)去,手拿著地圖,卻不知道自己在什么位置,人們都會想要是手機能搜索到電子地圖且能標出自己所處位置就好了。但傳統(tǒng)的搜索引擎僅僅利用純粹的文本搜索,用戶往往不能獲得理想的查詢結果.此外,與傳統(tǒng)互聯(lián)網(wǎng)搜索環(huán)境相比,移動終端受到屏幕尺寸小、網(wǎng)絡帶寬有限等限制,這些不同點為新環(huán)境下移動Web搜索帶來了許多新的機遇和挑戰(zhàn)。我也是大眾中的一員,也深深的體會到其帶來的便利。出于興趣和好奇,我開始向這一領域了解學習。因為剛開始了解,我憑自己的專業(yè)常識,從理論到實踐的過程,我查閱了很多相關的書集和資料,從最初的《移動Web實現(xiàn)指南:面向移動設備的網(wǎng)站優(yōu)化、開發(fā)和設計》提供了很多實例,學習起來不是那么難,但在于很多的專業(yè)名詞不理解,只好半知半解的看了些,至今都還沒看完。后來我又在網(wǎng)上看到了《智能手機Web標準開發(fā)實戰(zhàn):為iPhone、Android、PalmPre、BlackBerry、WindowsMobile及NokiaS60開發(fā)通用的基于Javascript、CSS、HTML和Ajax的Web應用(移動與嵌入式開發(fā)技術)》的書,看了簡介感覺這本書比前一本要實用,且較容易理解。我花了30元買翻譯過的中文版,在自己的專業(yè)水平上看了一些,如Javascript、CSS、HTML代碼等,還是從中學到了很多不知道的程序知識。雖然看了些書和資料,我還是不明白它們其中的真正技術。之后我又在計算機學報中搜集到《移動Web搜索研究》的剘刊,現(xiàn)在讀完了這一文章。雖然文章講的不是具體的實現(xiàn)技術,但其中分析中很多關于移動Web搜索的概念及其特點,移動Web搜索的整體流程及相關技術和關鍵技術的分析。其中提到了IR-tree算法,和我所學過的樹的相關算法很相似。這也是我讀完這文章后最大的收獲,就是能完全的理解IR-tree算法。其中還講了幾種算法的時間復雜度和空間復雜度,從用戶角度出發(fā),分析了從用戶開始搜索到系統(tǒng)運行,再到系統(tǒng)響應用戶的過程,來講解移動Web搜索的整個過程。使我讀完這一文章之后,能夠?qū)σ苿覹eb搜索有一個完整的思路,學習起來也很多容易,且記憶牢固、長久。分析:在之前在學習和讀完《移動Web搜索研究》文章之后,我對移動Web搜索有了一個經(jīng)較完整的思維架構。特別是在閱讀完《移動Web搜索研究》這一文章之后,我更明確了移動Web搜索的整個流程,主要分為兩個過程:(1)移動客戶端通過Internet訪問Web服務器,通過連接GPS設備獲取當前位置坐標。當用戶提交一個基于關鍵字的查詢時,如果想要獲得本地信息,需將用戶自己的位置信息附在提交的查詢中一起傳遞給Web服務器,否則直接將用戶自己的查詢提交給服務器進行處理。(2)服務器檢索到相關的信息并將結果返回給移動客戶端,然后顯示給用戶。移動Web搜索流程大體如下圖:之所心將整個流程分成兩部分主要有以下的優(yōu)點:客戶端僅僅需要顯示處理得到的結果,并不需要在大型數(shù)據(jù)庫中做過多的過濾和搜索工作。這使得該系統(tǒng)可以運行在具有低處理能力的設備上,而讓服務器端做大多數(shù)重量級的工作,使整個流程簡單化?!兑苿覹eb搜索研究》文章中提出的框架被劃分為4個模塊:數(shù)據(jù)收集模塊、預處理模塊、索引模塊、搜索模塊。這四個模塊中,包含很多移動Web搜索關鍵技術,比如地理標記Web資源、混合索引的構建、面向移動用戶的查詢處理、查詢結果的處理與可視化等。而地理標記Web資源對于移動Web搜索是最重要的部分,一方面,許多與地理相關的興趣點,比如商店、旅游景點、餐館、娛樂服務、公共交通等都與描述性文本相關聯(lián);另一方面,Web文檔顯式或隱式地包含地理信息,地理位置和文本文檔的集成使得查詢不僅要考慮位置相近性,還需要考慮文本相關性。其中又包括眾多的小模塊,如地名識別、地名分辨、地理聚焦點的確定等。查找出文檔所覆蓋的地理區(qū)域,目前已提出了多種方法,文章中提到Web-a-Where使用層次本體確定地理聚焦點,在層次結構中分辨出來的每一個地名為其父節(jié)點貢獻分值,然后選擇分值最高的本體節(jié)點作為該文檔的地理聚焦點。但該方法不能處理包含有多個地理聚焦點的文檔。另外一種普遍使用的策略是選擇出現(xiàn)頻度最高的地名作為地理聚焦點。都沒辦法達到完美,這仍是一項技術難題。在以上的基礎上,就到服務器索引相關的文檔的過程。說索引,目前已有很多搜索方法,而在移動環(huán)境中,移動性與位置相關性使得移動Web搜索需要同時考慮文本信息和位置信息。此外,位置信息額外增加了CPU和存儲的開銷,使得對建立以文本和地理位置為基礎的高效索引要求很多高。我們都知道普通的文本搜索索引是面向集合的,主要索引技術有倒排文件、位圖、簽名文件等。而位置信息是面向二維空間的,主要索引技術有R-tree、R*-tree、四分樹、網(wǎng)格。在《移動Web搜索研究》文章中研究者提出了一種高效的索引存儲結構―――QUOTE-tree(informationretrievalR-tree),它是以R-tree為基礎,并將R-tree和簽名文件相結合組成的一種混合索引。在該結構節(jié)點中的每一項包含兩部分信息:空間信息和關鍵字信息,前者用最小邊界區(qū)域表示,后者用簽名文件表示。IR2-tree的葉子節(jié)點中每一項用三元組(A,N,S)表示,其中,A和N定義在R-tree中,N表示節(jié)點的邊界區(qū)域;S是A所指向?qū)ο髮暮灻募?。在非葉子節(jié)點中,每一項用三元組(A,N,S)表示,S是簽名文件。一個節(jié)點的簽名是該節(jié)點所有項簽名的疊加,就相當于以該節(jié)點為根的子樹中所有文檔簽名的疊加。QUOTE-tree采用插入和刪除操作對索引進行維護,是R-tree相應操作的修改和擴充。都采用樹的相關遍歷加以實現(xiàn),這也讓我想起了樹的深度優(yōu)先遍歷和廣度優(yōu)先遍歷的兩種算法。而由于IR-tree在構造過程中僅考慮了位置信息,為了進一步提高查詢處理的各種性能,又想到對IR-tree進行擴展。也有研究者提出了一種稱為DIR-tree的混合索引結構,這種索引在構造的過程中綜合考慮位置信息和文本相似度,IR-tree可以看作是DIR-tree的一種特殊情況。但DIR-tree混合索引結構我至今弄不明白是怎么回事,也沒有更多的中文資料詮釋它,而我自己的英語水平又不高,對于英文資料的閱讀理解相當困難,且也沒有那么多時間去查詢翻譯。此外還提到很多混合索引結構,例如bR*-tree、Light-Weighted索引結構。bR*-tree、Light-Weighted索引都使用距離互斥和關鍵字互斥、加速剪枝的剪枝策略,所不同的是前者基于先驗的搜索策略,而后者是用自底向上先驗搜索策略。在對搜索完成后,就是搜索結果排序部分了。結果排序是搜索技術中最關鍵的部分之一,排序策略和誹序算法決定了排序效果的優(yōu)劣。移動設備由于自身的特點只能為用戶提供較小的顯示區(qū)域,無法瀏覽大量的信息,如果用戶被淹沒于大量查詢結果中,會導致用戶的滿意度下降。對檢索結果的排序需要綜合考慮多個因素對排序的影響,有文本信息、位置信息和周圍環(huán)境等。目前,已有的對地理和文本排序進行整合方法的的研究相對較少,在《移動Web搜索研究》文章中主要采用的是與查詢關鍵字、位置信息相似度和相關性的高低順序排序。此外,在文章中還提到另一種排序方法,可惜的是文章只理論性講解,查詢結果按照排名函數(shù)f(distance(o.loc,Q.loc),IRscore(o.doc,Q.keywords))進行排序。其中,(0,1),用來權衡空間相近性和文本相關性所占的比重;D(Q.loc;o.loc)表示Q和o之間的歐幾里德距離;maxD是數(shù)據(jù)庫D中兩個對象之間的最大距離,用來對距離進行歸一化處理;文本相關性使用語言模型進行計算,maxP用來對文本進行歸一化處理。由于移動設備固有的一些局限(比如屏幕小、電量有限、與用戶的交互能力較差等),已有的Web搜索信息發(fā)現(xiàn)機制并不適合移動環(huán)境下查詢結果的可視化。在《移動Web搜索研究》文章中提到多種查詢結果處理與可視化的方法,主要有基于摘要的方法、單列方法、和Fisheye可視化方法等。在多種查詢結果處理與可視化的方法中,各有優(yōu)缺點,而在我看來,這里的方法可以跟據(jù)客戶端的設備來選擇,這樣就可以滿足不同用戶的要求,也減少了系統(tǒng)響應時間,從而達到移動Web搜索最佳

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論