站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)_第1頁(yè)
站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)_第2頁(yè)
站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)_第3頁(yè)
站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)_第4頁(yè)
站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、畢 業(yè) 論 文(設(shè) 計(jì))論文(設(shè)計(jì))題目:站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)目 錄摘 要1ABSTRACT2第1章 緒論31.1 課題的研究背景與意義31.2 研究現(xiàn)狀41.3 本文的工作4第2章 站內(nèi)搜索引擎相關(guān)技術(shù)介紹62.1 全文檢索技術(shù)62.2 .NET相關(guān)技術(shù)72.2.1 .NET平臺(tái)72.2.2 Visual Studio2012開(kāi)發(fā)平臺(tái)72.3 Lucene.NET介紹8第3章 站內(nèi)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)93.1 站內(nèi)搜索引擎功能需求93.2 站內(nèi)搜索引擎總體設(shè)計(jì)及數(shù)據(jù)庫(kù)設(shè)計(jì)10第4章 站內(nèi)搜索引擎關(guān)鍵代碼實(shí)現(xiàn)114.1 主界面11第5章 總結(jié)與展望14參考文獻(xiàn)15摘 要淘寶的出現(xiàn),電子

2、商務(wù)井噴式的發(fā)展,以及越來(lái)越多的社交網(wǎng)站、團(tuán)購(gòu)網(wǎng)站、專門(mén)類(lèi)信息網(wǎng)站的出現(xiàn),海量的數(shù)據(jù)蘊(yùn)含在網(wǎng)站之內(nèi)。巨大的信息量無(wú)疑是把雙刃劍,在給用戶提供豐富信息的同時(shí),也給用戶提了一個(gè)大大的難題,如何在這海量信息中找到用戶想得到的信息,尤其是當(dāng)用戶提供的是一組信息不是十分明確的詞組時(shí),如何能講有用的信息條理清晰地提供給用戶,這進(jìn)一步刺激了站內(nèi)搜索技術(shù)的發(fā)展。本文在總結(jié)站內(nèi)搜索功能的同時(shí),在研究了站內(nèi)搜索相關(guān)技術(shù)的基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)簡(jiǎn)易的站內(nèi)搜索引擎,實(shí)現(xiàn)了在內(nèi)搜索的主要功能。關(guān)鍵詞:站內(nèi)搜索;.NET;Lucene.NETABSTRACTThe Taobao emergence of e-comme

3、rce development spurt, as well as a growing number of social networking sites, group buying sites, the emergence of specialized class information website contains vast amounts of data within the website. A huge amount of information is undoubtedly double-edged sword, giving users a wealth of informa

4、tion, but also to provide the user a big problem, how to find a user wants information in this mass of information, especially when the user is offered a when information is not very clear set of phrases, how can speak clarity of useful information available to users, which further stimulated the de

5、velopment of the station search technology.This paper summarizes the station search function at the same time, in the study of the station search related technologies, based on the design and implementation of a simple site search engine, including the realization of the main functions of the search

6、.Key words: Site Search; .NET; Lucene.NET16第1章 緒論自從有了計(jì)算機(jī)以后,人類(lèi)開(kāi)始用計(jì)算機(jī)保存信息,有保存就需要查找,于是出現(xiàn)了檢索技術(shù)。文本檢索技術(shù)的發(fā)展從最初的SMART文檔檢索系統(tǒng)到AltaVista搜索引擎,到現(xiàn)在的搜索巨頭Google,人們習(xí)慣在互聯(lián)網(wǎng)上搜索需要的信息1。同時(shí)在同一個(gè)網(wǎng)站內(nèi)往往擁有大量的資源,怎樣在網(wǎng)站內(nèi)部使用戶能夠迅速的找到所需信息,已成為一個(gè)網(wǎng)站能夠吸引用戶的重要方面。隨著信息地快速增長(zhǎng),這一方面的需求越來(lái)越大,在很大程度上嚴(yán)重影響到 Web 站點(diǎn)的成功2。因此,建立站內(nèi)搜索引擎成為必要。所謂站內(nèi)搜索無(wú)非就是對(duì)數(shù)據(jù)庫(kù)信息

7、的檢索,當(dāng)然,數(shù)據(jù)庫(kù)通過(guò)SQL查詢也在一定程度上提供了這樣的功能。但是,數(shù)據(jù)庫(kù)所提供的Like%key-word%查詢,不但效率不高,尤其是在多字段查詢時(shí),而且所提供的僅僅是關(guān)鍵字的全信息匹配,所查詢到的內(nèi)容必須是“key-word”的順序匹配,這對(duì)于大多數(shù)網(wǎng)站,尤其是大型網(wǎng)站來(lái)說(shuō),基于數(shù)據(jù)庫(kù)查詢的站內(nèi)搜索往往出現(xiàn)檢索數(shù)據(jù)不準(zhǔn)確、更新慢、無(wú)法控制檢索等問(wèn)題3。那么,如何來(lái)解決這個(gè)問(wèn)題呢?搜索引擎的出現(xiàn)給了人們帶來(lái)了一線希望。諸如Google、Baidu等全文搜索引擎能夠提供一種基于全文信息的搜索方式,并且能夠在所提供的一個(gè)或一組詞中分離出具有一定含義的詞,并以這些詞為關(guān)鍵字搜索并得到包含這些關(guān)

8、鍵字的信息4。然而,我們無(wú)法做到在自己的網(wǎng)站中做出一個(gè)如Baidu、Google那樣的搜索引擎。但是,Lucene的出現(xiàn),使這種實(shí)現(xiàn)成為可能,它是一個(gè)開(kāi)放源代碼的全文檢索引擎工具包,利用 Lucene 建立的全文檢索系統(tǒng)可以通過(guò)其豐富的分析技術(shù)達(dá)到令人滿意的檢索效果5。1.1 課題的研究背景與意義在以往網(wǎng)站建設(shè)、企業(yè)信息系統(tǒng)搭建過(guò)程中,由于信息結(jié)構(gòu)簡(jiǎn)單、內(nèi)容稀缺,站內(nèi)搜索乃至搜索都不是網(wǎng)站系統(tǒng)的必要裝備。但隨著Web2.0帶來(lái)的海量信息井噴式涌現(xiàn),企業(yè)自身對(duì)信息架構(gòu)、管理、發(fā)布的需求,以及用戶對(duì)信息的組織、查詢、可尋性的要求越來(lái)越高,于是站內(nèi)搜索出現(xiàn)了。淘寶的出現(xiàn),電子商務(wù)井噴式的發(fā)展,以及越

9、來(lái)越多的社交網(wǎng)站、團(tuán)購(gòu)網(wǎng)站、專門(mén)類(lèi)信息網(wǎng)站的出現(xiàn),海量的數(shù)據(jù)蘊(yùn)含在網(wǎng)站之內(nèi)。巨大的信息量無(wú)疑是把雙刃劍,在給用戶提供豐富信息的同時(shí),也給用戶提了一個(gè)大大的難題,如何在這海量信息中找到用戶想得到的信息,尤其是當(dāng)用戶提供的是一組信息不是十分明確的詞組時(shí),如何能講有用的信息條理清晰地提供給用戶,這進(jìn)一步刺激了站內(nèi)搜索技術(shù)的發(fā)展6。站內(nèi)搜索通俗來(lái)講是一個(gè)網(wǎng)站或商城的“大門(mén)口”,一般在形式上包括兩個(gè)要件:搜索入口和搜索結(jié)果頁(yè)面,但在其后臺(tái)架構(gòu)上是比較復(fù)雜的,其核心要件包括:中文分詞技術(shù)、頁(yè)面抓取技術(shù)、建立索引、對(duì)搜索結(jié)果排序以及對(duì)搜索關(guān)鍵詞的統(tǒng)計(jì)、分析、關(guān)聯(lián)、推薦等7。1.2研究現(xiàn)狀站內(nèi)搜索主要提供的是

10、全文搜索功能,常用的檢索技術(shù)分為如下兩種:(1)使用關(guān)系數(shù)據(jù)庫(kù)的 like %keyword%查詢來(lái)代替全文檢索系統(tǒng)。這種方法在信息量比較小的情況下,檢索速度比較快,但是由于查詢語(yǔ)句比較繁瑣,在面對(duì)海量信息的情況下,檢索速度會(huì)急劇降低,其性能也往往達(dá)不到要求,甚至影響數(shù)據(jù)庫(kù)的其他正常使用,尤其是在網(wǎng)絡(luò)狀態(tài)下,這方面的缺陷尤為明顯8。(2)使用通用的數(shù)據(jù)庫(kù)系統(tǒng)提供的全文檢索功能。一些信息化平臺(tái)雖稱實(shí)現(xiàn)了全文索引庫(kù),但其實(shí)質(zhì)是模擬的全文索引庫(kù),其通過(guò)先檢索放在關(guān)系數(shù)據(jù)庫(kù)里的結(jié)構(gòu)化數(shù)據(jù),如題目、摘要、內(nèi)容等,然后鏈接全文以獲得全文,而真正實(shí)現(xiàn)全文檢索的不多,而且在數(shù)據(jù)量比較大,特別是在海量數(shù)據(jù)的情況

11、下,檢索的效率仍然比較低9。1.3 本文的工作本論文在研究了全文搜索相關(guān)文獻(xiàn)的基礎(chǔ)上,分析了Lucene.NET框架,基于.NET平臺(tái),實(shí)現(xiàn)了一個(gè)簡(jiǎn)單的站內(nèi)搜索引擎,主要研究?jī)?nèi)容包括10:(1) 全文檢索知識(shí)的研究。包括全文檢索的基本原理和相關(guān)理論;(2) .NET平臺(tái)相關(guān)技術(shù)的研究。包括,.NET Framework介紹,Visual Studio開(kāi)發(fā)環(huán)境介紹;(3) 分詞框架研究。包括Lucene介紹及工作原理。(4)設(shè)計(jì)并實(shí)現(xiàn)一個(gè)簡(jiǎn)單的站內(nèi)搜索引擎。第2章 站內(nèi)搜索引擎相關(guān)技術(shù)介紹2.1 全文檢索技術(shù)所謂全文檢索,是一種將文件中所有文本與檢索項(xiàng)匹配的文字資料檢索方法。全文檢索系統(tǒng)是按照全

12、文檢索理論建立起來(lái)的用于提供全文檢索服務(wù)的軟件系統(tǒng)11。全文檢索能夠?qū)⒋鎯?chǔ)于數(shù)據(jù)庫(kù)中整本書(shū)、整篇文章中的任意內(nèi)容信息查找出來(lái)的檢索。它可以根據(jù)需要獲得全文中有關(guān)章、節(jié)、段、句、詞等信息,也就是說(shuō)類(lèi)似于給整本書(shū)的每個(gè)字詞添加一個(gè)標(biāo)簽,也可以進(jìn)行各種統(tǒng)計(jì)和分析。例如,它可以很快的回答“水滸傳一書(shū)中“宋江”一共出現(xiàn)多少次?”的問(wèn)題。全文搜索技術(shù)是指計(jì)算機(jī)索引程序通過(guò)掃描文章中的每一個(gè)詞,對(duì)每一個(gè)詞建立一個(gè)索引,指明該詞在文章中出現(xiàn)的次數(shù)和位置,當(dāng)用戶查詢時(shí),搜索程序就根據(jù)事先建立的索引進(jìn)行查找,并將查找的結(jié)果反饋給用戶的檢索方式。這個(gè)過(guò)程類(lèi)似于通過(guò)字典中的檢索字表查字的過(guò)程。檢索主要分為按字檢索和按

13、詞搜索兩種。按字檢索是指對(duì)于文章中的每一個(gè)字都建立索引,檢索時(shí)將詞分解為字的組合。對(duì)于各種不同的語(yǔ)言而言,字有不同的含義,比如英文中字與詞實(shí)際上是合一的,而中文中字與詞有很大分別。按詞搜索指對(duì)文章中的詞,即語(yǔ)義單位建立索引,檢索時(shí)按詞搜索,并且可以處理同義項(xiàng)等。英文等西方文字由于按照空白切分詞,因此實(shí)現(xiàn)上與按字處理類(lèi)似,添加同義處理也很容易。中文等東方文字則需要切分字詞,以達(dá)到按詞索引的目的,關(guān)于這方面的問(wèn)題,是當(dāng)前全文搜索技術(shù)尤其是中文全文檢索技術(shù)中的難點(diǎn)。 全文搜索系統(tǒng)是按照全文檢索理論建立起來(lái)的用于提供全文檢索服務(wù)的全文搜索系統(tǒng)。一般來(lái)說(shuō),全文搜索需要具備建立索引和提供查詢的基本功能,此

14、外現(xiàn)代的全文搜索系統(tǒng)還需要具有方便的用戶接口、面向WWW的開(kāi)發(fā)接口、二次應(yīng)用開(kāi)發(fā)接口等等。功能上,全文搜索系統(tǒng),核心具有建立索引、處理查詢返回增加索引、優(yōu)化索引結(jié)構(gòu)等等功能,外圍則由各種不同應(yīng)用具有的功能組成。結(jié)構(gòu)上,全文搜索系統(tǒng)核心具有索引引擎、查詢引擎、文本分析引擎、對(duì)外接口等等,加上各種外圍應(yīng)用系統(tǒng)等等共同構(gòu)成了全文檢索系統(tǒng)12。2.2 .NET相關(guān)技術(shù)2.2.1 .NET平臺(tái).NET框架是一種新的計(jì)算平臺(tái),它簡(jiǎn)化了在高度分布式Internet環(huán)境中的應(yīng)用程序開(kāi)發(fā)13。Microsoft .NET Framework結(jié)合強(qiáng)大的功能與跨技術(shù)邊界無(wú)縫通信新技術(shù),構(gòu)建一個(gè)能支持各種業(yè)務(wù)流程的應(yīng)

15、用程序。.NET 框架4.5可以更方便地編寫(xiě)異步代碼、同步代碼中的控制流混合,它提供了更高的性能、可靠性和安全性。它為軟件向多樣化的移動(dòng)組件發(fā)展的情況也提供了保護(hù)。在一個(gè)改進(jìn)的、可擴(kuò)展的策略下,用戶能夠運(yùn)行功能強(qiáng)大的代碼,而同時(shí)降低相關(guān)的風(fēng)險(xiǎn)。.NET平臺(tái)使人們能夠通過(guò)簡(jiǎn)單的方式在其上構(gòu)建各種應(yīng)用方式,多樣化地從網(wǎng)站獲取信息,并解決網(wǎng)站之間的協(xié)同工作。.NET Framework 4.5 提供了托管執(zhí)行環(huán)境、簡(jiǎn)化的開(kāi)發(fā)和部署以及與各種編程語(yǔ)言的集成,如圖1所示。圖1 .NET Framework2.2.2 Visual Studio2012開(kāi)發(fā)平臺(tái)Microsoft Visual Studio

16、(簡(jiǎn)稱VS)是美國(guó)微軟公司的開(kāi)發(fā)工具包系列產(chǎn)品。Visual Studio是一個(gè)基本完整的開(kāi)發(fā)工具集,它包括了整個(gè)軟件生命周期中所需要的大部分工具,是目前最流行的Windows平臺(tái)應(yīng)用程序的集成開(kāi)發(fā)環(huán)境。現(xiàn)在較新的版本是2012版本14。Visual Studio 2012作為一個(gè)集成解決方案,適用于無(wú)論是個(gè)人或者各種規(guī)模的開(kāi)發(fā)團(tuán)隊(duì)。Visual Studio2012實(shí)現(xiàn)了同事間的無(wú)縫協(xié)作,提高了生產(chǎn)效率與專注度,最終好的點(diǎn)子變成了優(yōu)秀的現(xiàn)實(shí)應(yīng)用。2.3 Lucene.NET介紹Lucene.NET是Lucene的.NET版本,被應(yīng)用于.NET平臺(tái)上。Lucene是一套用于全文檢索和搜尋的開(kāi)源

17、程式庫(kù),由Apache軟件基金會(huì)支持和提供。Lucene提供了一個(gè)簡(jiǎn)單卻強(qiáng)大的應(yīng)用程式接口,能夠做全文索引和搜尋。在Java開(kāi)發(fā)環(huán)境里L(fēng)ucene是一個(gè)成熟的免費(fèi)開(kāi)源工具。就其本身而言,Lucene是當(dāng)前以及最近幾年最受歡迎的免費(fèi)Java資訊檢索程式庫(kù)。人們經(jīng)常提到資訊檢索程式庫(kù),雖然與搜索引擎有關(guān),但不應(yīng)該將資訊檢索程式庫(kù)與搜索引擎相混淆15。作為一個(gè)開(kāi)放源代碼項(xiàng)目,Lucene從問(wèn)世之后,引發(fā)了開(kāi)放源代碼社群的巨大反響,程序員們不僅使用它構(gòu)建具體的全文檢索應(yīng)用,而且將之集成到各種系統(tǒng)軟件中去,以及構(gòu)建Web應(yīng)用,甚至某些商業(yè)軟件也采用了Lucene作為其內(nèi)部全文檢索子系統(tǒng)的核心。Lucen

18、e以其開(kāi)放源代碼的特性、優(yōu)異的索引結(jié)構(gòu)、良好的系統(tǒng)架構(gòu)獲得了越來(lái)越多的應(yīng)用。第3章 站內(nèi)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)3.1 站內(nèi)搜索引擎功能需求站內(nèi)搜索是提供網(wǎng)站內(nèi)部?jī)?nèi)容的檢索和搜索功能。隨著網(wǎng)站內(nèi)容的增長(zhǎng),站內(nèi)結(jié)構(gòu)也越來(lái)越復(fù)雜,用戶很難準(zhǔn)確瀏覽全部?jī)?nèi)容,查找所需信息也越來(lái)越難。站內(nèi)檢索的需求也逐漸顯露出來(lái)。一個(gè)好的站內(nèi)搜索引擎主要包含如下功能:l 搜索提示功能,用戶輸入關(guān)鍵字 ,自動(dòng)出現(xiàn)下拉框顯示相關(guān)搜素關(guān)鍵詞,這個(gè)功能大家都很熟悉了,比如百度淘寶都在用;實(shí)用性很強(qiáng),的確為用戶提供了很多方便;其實(shí)這個(gè)功能還有其他的作用,就是引導(dǎo)用,避免了原來(lái)用戶隨意輸入不太符合規(guī)則的關(guān)鍵字,導(dǎo)致搜搜無(wú)結(jié)果的尷尬。尤

19、其對(duì)產(chǎn)品銷(xiāo)售型的網(wǎng)站,友好的提示,讓客戶最快找到他要的東西。l 用戶搜素記錄,用戶在搜索的時(shí)候,做一下記錄處理,記錄一下用戶輸入的關(guān)鍵字。做搜索數(shù)量統(tǒng)計(jì),發(fā)覺(jué)自己網(wǎng)站用戶的搜索傾向,配合高搜索率的關(guān)鍵字做一些促銷(xiāo)及專題,滿足用戶的胃口。從這個(gè)功能的延伸,就是盡可能的獲取用戶的詳細(xì)信息,這個(gè)可以配合網(wǎng)站會(huì)員功能,具體實(shí)現(xiàn)起來(lái):當(dāng)用戶以登陸方式搜索時(shí)候,記錄搜索的關(guān)鍵字及用戶會(huì)員ID 。這樣就獲得了用戶信息,便可通過(guò)郵件等方式將其感興趣的內(nèi)容傳達(dá)給他。l 搜索熱門(mén)關(guān)鍵字,能讓用戶點(diǎn)的不讓用戶區(qū)輸入,這就是人性化,搜索框下最好有經(jīng)常被檢索的關(guān)鍵字,這個(gè)關(guān)鍵字可以用上述第2點(diǎn)獲取。而且對(duì)于銷(xiāo)售型的網(wǎng)站

20、不同時(shí)期都要及時(shí)的更新。l 搜索結(jié)果頁(yè)面,搜索出來(lái)后的結(jié)果頁(yè)面也是不可忽視的,經(jīng)??刺詫毜挠脩糁?,搜索結(jié)果頁(yè)面上方會(huì)有產(chǎn)品所屬的分類(lèi),所屬的型號(hào),品牌、其實(shí)還可以加入一排相關(guān)搜索關(guān)鍵字,類(lèi)似百度下方的相關(guān)搜索??傊徊讲降淖層脩舾鶕?jù)自己的需求找到相應(yīng)的產(chǎn)品,便捷從細(xì)節(jié)開(kāi)始。l 方便用戶查找網(wǎng)站信息。我們經(jīng)常會(huì)發(fā)生這樣的事情:明明記得有一篇寫(xiě)關(guān)于寶馬試駕的 的文件,就是想不起存放在什么地方了。訪問(wèn)者也有類(lèi)似困擾,只記得某個(gè)網(wǎng)站上說(shuō)了關(guān)于某一事件的新聞,但不知道具體的鏈接在哪里。另外,要是隱藏在目錄很深的html文檔可能自從網(wǎng)站建立到整個(gè)網(wǎng)站關(guān)閉也沒(méi)有一個(gè)人看過(guò),這些都不是我們所想要的。站內(nèi)檢索

21、毫無(wú)疑問(wèn)可以解決上述問(wèn)題。同時(shí),按照一個(gè)主題把所有相關(guān)文檔提供給訪問(wèn)者,可以讓訪問(wèn)者更全面的了解他所想要的東西,這增加了網(wǎng)站信息間的組織性和邏輯性,方便了訪問(wèn)者的使用,提升用戶體驗(yàn)度。3.2 站內(nèi)搜索引擎總體設(shè)計(jì)及數(shù)據(jù)庫(kù)設(shè)計(jì)本系統(tǒng)為實(shí)現(xiàn)一個(gè)簡(jiǎn)易的站內(nèi)搜索引擎,可以嵌入到其他實(shí)用網(wǎng)站之中。因此在設(shè)計(jì)上以簡(jiǎn)潔為主,總體設(shè)計(jì)如圖2。站內(nèi)搜索引擎檢索入口檢索引擎數(shù)據(jù)庫(kù)圖2 站內(nèi)搜索總體設(shè)計(jì)用戶通過(guò)輸入接口界面輸入想查詢的一個(gè)或若干個(gè)詞到檢索引擎,檢索引擎與數(shù)據(jù)庫(kù)通信,根據(jù)關(guān)鍵字查詢數(shù)據(jù)庫(kù)中相匹配的信息,在返回給用戶界面,并在返回信息中高亮出用戶所檢索的信息。為了模擬檢索過(guò)程和內(nèi)容,在數(shù)據(jù)庫(kù)中創(chuàng)建了一個(gè)

22、簡(jiǎn)單的數(shù)據(jù)表Article,如表1。字段名數(shù)據(jù)類(lèi)型是否允許為空說(shuō)明IDINT否編號(hào),關(guān)鍵字TitleNVARCHAR (50)否信息標(biāo)題ContentVARCHAR (MAX) 否信息內(nèi)容表1 Article表第4章 站內(nèi)搜索引擎關(guān)鍵代碼實(shí)現(xiàn)4.1 主界面圖3 主界面(搜索前)圖4 主界面(搜索后)主要代碼: protected List keywords = new List(); protected void btnSearch_Click(object sender, EventArgs e) string keywords = tbKeyWords.Text.Split(new str

23、ing , StringSplitOptions.RemoveEmptyEntries); if (keywords.Length = 0) lbAlert.Text = 請(qǐng)輸入關(guān)鍵字:.; return; this.keywords = keywords.ToList(); DataAccess dataAccess = new DataAccess(); List list = dataAccess.Search(this.keywords); ShowResult(list); long id = 0; if (!IsPostBack & !string.IsNullOrEmpty(Re

24、quest.QueryStringid) & long.TryParse(Request.QueryStringid, out id) DataAccess dataAccess = new DataAccess(); Data = dataAccess.GetArticle(id); if (Data = null) Data = new Article(); 用于高亮關(guān)鍵字的代碼: function HightLightKeywords() var container = document.getElementById(result); var keywords = new Array()

25、; % for (int i = 0; i for (var i = 0; i keywords.length; i+) var a = new RegExp(keywordsi, igm); container.innerHTML = container.innerHTML.replace(a, + keywordsi + ); HightLightKeywords();第5章 總結(jié)與展望本設(shè)計(jì)實(shí)現(xiàn)了一個(gè)簡(jiǎn)易的站內(nèi)搜索引擎,通過(guò)該設(shè)計(jì)的制作,使我對(duì)專業(yè)所學(xué)有了進(jìn)一步的認(rèn)識(shí),在增強(qiáng)實(shí)際操作能力的同時(shí),也對(duì)相關(guān)理論知識(shí)的關(guān)聯(lián)性有了更深的了解,更重要的是在這一過(guò)程中又學(xué)到了很多新的知識(shí)。系統(tǒng)在經(jīng)過(guò)

26、測(cè)試,在運(yùn)行過(guò)程中,能夠達(dá)到預(yù)期的基本目標(biāo),得到較好的效果。當(dāng)然,鑒于能力和時(shí)間所限,還有諸如自動(dòng)完成、關(guān)鍵字統(tǒng)計(jì)等功能還沒(méi)有完成,這都是以后需要加強(qiáng)的方向。參考文獻(xiàn)1陳立全文檢索引擎的設(shè)計(jì)研究J現(xiàn)代情報(bào),2007(10):56582蔡建超,郭一平,王亮基于Lucene.Net校園網(wǎng)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)J計(jì)算機(jī)技術(shù)與發(fā)展,2006(11):80823張校乾,金玉玲,侯玉波一種基于Lucene檢索系統(tǒng)的全文數(shù)據(jù)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)J現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(2):77794車(chē)東在應(yīng)用中加入全文檢索功能基于Java的全文索引引擎Lucene簡(jiǎn)介EB/OL,2002-085陳燁彬,黃琳基于Lucene.Net的知識(shí)檢索系統(tǒng)的設(shè)計(jì)與

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論