![畢業(yè)設(shè)計(jì)(論文)Web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)_第1頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-9/30/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a84/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a841.gif)
![畢業(yè)設(shè)計(jì)(論文)Web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)_第2頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-9/30/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a84/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a842.gif)
![畢業(yè)設(shè)計(jì)(論文)Web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)_第3頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-9/30/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a84/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a843.gif)
![畢業(yè)設(shè)計(jì)(論文)Web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)_第4頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-9/30/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a84/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a844.gif)
![畢業(yè)設(shè)計(jì)(論文)Web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)_第5頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-9/30/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a84/cb1707e2-02f5-4907-bdc0-4a3b3e9f0a845.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、49湖 南 科 技 大 學(xué)畢 業(yè) 設(shè) 計(jì)( 論 文 )題 目 web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì) 作 者 系 別 計(jì)算機(jī)科學(xué)與工程 專 業(yè) 計(jì)算機(jī)科學(xué)與技術(shù) 學(xué) 號(hào) 7 指導(dǎo)教師 目 錄前言11. 課題的研究意義12. 論文目的、內(nèi)容及主要貢獻(xiàn)11 發(fā)展現(xiàn)狀與設(shè)計(jì)目標(biāo)21.1 web信息檢索工具搜索引擎21.2 傳統(tǒng)www信息檢索服務(wù)的特點(diǎn)31.3 主動(dòng)信息服務(wù)的必要性41.4 主動(dòng)推送信息服務(wù)系統(tǒng)原理42 開發(fā)工具及關(guān)鍵技術(shù)介紹62.1 eclipse(myeclipse)62.2 java(jsp、j2ee)62.2.1 java62.2.2 jsp72.2.3 j2ee92.3 tomcat92
2、.4 mysql102.5 jdbc102.5.1 jdbc概述102.5.2 jdbc數(shù)據(jù)訪問模型102.6 基于b/s模型的web應(yīng)用程序102.7 google web api133 要解決的幾個(gè)關(guān)鍵問題153.1 研究設(shè)計(jì)中要解決的問題153.2 具體實(shí)現(xiàn)中采用的關(guān)鍵技術(shù)及復(fù)雜性分析154系統(tǒng)結(jié)構(gòu)與模型164.1 基于向量空間模型的信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)164.2 向量空間模型(vsm)系統(tǒng)處理流程圖184.3 建立向量空間模型的關(guān)鍵中文分詞184.4 漢語(yǔ)詞法分析系統(tǒng)ictclas的介紹214.5 數(shù)據(jù)流圖和系統(tǒng)結(jié)構(gòu)圖215 系統(tǒng)實(shí)現(xiàn)245.1 系統(tǒng)結(jié)構(gòu)設(shè)計(jì)245.1.1 目標(biāo)設(shè)計(jì)24
3、5.1.2 設(shè)計(jì)思路245.1.3 系統(tǒng)功能分析與設(shè)計(jì)255.2 數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)265.2.1 數(shù)據(jù)庫(kù)需求分析265.2.2 數(shù)據(jù)庫(kù)邏輯設(shè)計(jì)265.3 整個(gè)系統(tǒng)連接數(shù)據(jù)庫(kù)中心代碼(連接到mysql)275.4 用戶信息管理模塊275.5 自動(dòng)推薦系統(tǒng)模塊275.6 系統(tǒng)管理模塊326 性能測(cè)試與分析346.1 測(cè)試實(shí)例(測(cè)試集)的選擇346.2 測(cè)試環(huán)境與測(cè)試條件346.3 測(cè)試步驟346.4 測(cè)試結(jié)果356.5 性能分析36結(jié)論37參考文獻(xiàn)38致謝39附錄 jsp開發(fā)運(yùn)行環(huán)境的安裝40web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)專業(yè):計(jì)算機(jī)科學(xué)與技術(shù) 作者:張慧 指導(dǎo)老師:廖祝華摘要:隨著網(wǎng)絡(luò)技術(shù)的應(yīng)用與發(fā)展
4、,互連網(wǎng)已經(jīng)成為信息的重要來源地。到1999年底,已經(jīng)至少有1,600萬(wàn)臺(tái)主機(jī)接入互連網(wǎng),互聯(lián)網(wǎng)上網(wǎng)頁(yè)總數(shù)已達(dá)到10多億頁(yè),并且以每月近千萬(wàn)的數(shù)目遞增。搜索引擎以一定的策略在互聯(lián)網(wǎng)中搜集、發(fā)現(xiàn)信息,對(duì)信息進(jìn)行理解、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航的目的,互聯(lián)網(wǎng)用戶使用網(wǎng)絡(luò)獲取信息過程中,搜索引擎也成為必不可少的工具。調(diào)查表明,當(dāng)前的所有互連網(wǎng)應(yīng)用中,網(wǎng)絡(luò)信息搜索是僅次于電子郵件的第二大應(yīng)用,而這些搜索絕大多數(shù)是專門的,高度復(fù)雜的搜索引擎實(shí)現(xiàn)的。傳統(tǒng)的www搜索引擎是“提問搜索”方式,通過一種簡(jiǎn)單的操作界面接受用戶的提問,再把搜索到的結(jié)果返回給用戶。使用這種方式去檢索信息
5、的缺點(diǎn)有:對(duì)于所有用戶給出同樣的關(guān)鍵字得到的檢索結(jié)果都是一樣的,不能根據(jù)不同的用戶的興趣愛好給出相應(yīng)的建議。其次,用戶的興趣的狀態(tài)信息沒有保留下來,用戶每次查詢是相互獨(dú)立的。本文討論了利用向量空間模型進(jìn)行個(gè)性化搜索,實(shí)現(xiàn)web信息自動(dòng)推薦。論文的主要工作集中在:1. 學(xué)習(xí)了與web搜索有關(guān)的網(wǎng)絡(luò)技術(shù)。2. 了解和掌握了向量空間模型的原理和實(shí)現(xiàn)方法。3. 熟悉了基于j2ee開發(fā)平臺(tái)的軟件開發(fā)方法,初步掌握了jdk,eclipse等開發(fā)工具的使用。4. 設(shè)計(jì)和實(shí)現(xiàn)了一個(gè)基于向量空間模型的web信息自動(dòng)推薦系統(tǒng)。5. 對(duì)向量空間模型檢索出的信息與搜索引擎檢索出來的信息進(jìn)行了分析和比較,證明向量空間模
6、型檢索信息的優(yōu)越性、正確性、主動(dòng)性、智能性。本文的組織結(jié)構(gòu)主要包括:發(fā)展現(xiàn)狀及設(shè)計(jì)目標(biāo),開發(fā)工具及關(guān)鍵技術(shù)介紹,要解決的關(guān)鍵問題,系統(tǒng)結(jié)構(gòu)與模型,系統(tǒng)實(shí)現(xiàn),性能測(cè)試與分析,結(jié)論。關(guān)鍵詞:www搜索引擎;向量空間模型;自動(dòng)推薦;j2eethe design of system automatic recommendation web informationmajor:computer science and technology author:zhang hui supervisor: liao zhuhuaabstract:along with the networking applicati
7、on and the development, the internet has already become an important source of the information. by the end of year 1999, at least some 1,600 ten thousand servers turn on interconnection network. on the internet the homepage total has already achieved more than 10 hundred million pages, and the numbe
8、r increased to nearly 10 million monthly. the search engine collects and discovery information by certain strategy on the internet; to understand, extract, the organization and process the information; and provide the retrieval service for the users; thus get up the goal of information navigation. i
9、n the process of using network to obtain information, the search engine also becomes the essential tool. the investigation indicated that, in all the network application at present, the network information search is only inferior to the email; but these searches are realized overwhelmingly by specia
10、l, highly complex search engine. the traditional www search engine is “the inquiry - search” the way, accepting the user' inquiry through one kind of simple operation surface, then return the result. using this way to retrieve the information has some shortcomings: give the retrieval result rega
11、rding all users which the same key words; cannot give the corresponding suggestions according to the different users' the interests. next, user's information of interest condition has not retained, so the user' inquiry is mutually independent each time. this article has carried on the pe
12、rsonalized search using the vector space model and the realization of automatic recommendation web information. article prime task concentrates in:1 learning network technology with web searches.2 understanding and mastering the principles and the realization of the vector space mode.3 be familiar w
13、ith the software development platform based on j2ee development methods, such as the initial master jdk,eclipse development tools.4 the design and realization of a web-based vector space model for automatic information systems. 5 carry on the analysis of the information retrieved by the vector space
14、 model, and compare the information retrieved by the search engine, and proving that using vector space model to retrieve the information has several advantages: the superiority, the accuracy, the initiative, the intelligence. this article's structure as follows: the present situation of develop
15、ment and the design goal; introducing the tools development and the key technologies; several key questions need to solve; system structure and model; system realization; performance test and analysis; conclusion.keywords:www search engine; vector space model; automatic recommendation; j2ee前言1. 課題的研
16、究意義隨著信息技術(shù)的發(fā)展和社會(huì)信息化過程的快,作為全球最大的信息載體國(guó)際互聯(lián)網(wǎng)在給人們帶來海量的信息資源,以及獲取信息的方便性的同時(shí),又帶來諸多負(fù)面效應(yīng)。網(wǎng)上的信息良莠不齊,又缺乏次序,各種無(wú)用的垃圾信息鋪天蓋地的傳遞給用戶,用戶往往為為獲得需要的信息花費(fèi)大量的時(shí)間和精力。1而傳統(tǒng)的www搜索系統(tǒng)查詢的結(jié)果往往會(huì)與用戶真實(shí)的需求相差甚遠(yuǎn),而且產(chǎn)生的無(wú)用信息量會(huì)非常大,許多用戶希望的個(gè)性化查詢無(wú)法實(shí)現(xiàn)(個(gè)性化查詢就是將一般的查詢結(jié)果根據(jù)用戶的個(gè)性模型進(jìn)行二次檢索,以適應(yīng)用戶個(gè)人的需要)為此人們從許多方面對(duì)此技術(shù)進(jìn)行了優(yōu)化和改進(jìn),以期獲得更高的查詢精度和效率。而如何能夠根據(jù)用戶的興趣特征更主動(dòng)地向
17、用戶提供信息已成為網(wǎng)絡(luò)信息服務(wù)提供商的發(fā)展均勢(shì)之一。2本文就采用向量空間模型來實(shí)現(xiàn),設(shè)計(jì)一個(gè)基于b/s模型的web信息自動(dòng)推薦系統(tǒng)(web網(wǎng)站系統(tǒng))。本文首先介紹了搜索引擎及與其技術(shù)的原理,然后討論了向量空間模型的原理和實(shí)現(xiàn)技術(shù)。web信息自動(dòng)推薦系統(tǒng)設(shè)計(jì)的具體實(shí)現(xiàn):用戶使用前向系統(tǒng)注冊(cè)興趣信息(某一領(lǐng)域的知識(shí),主要是文本信息),以后系統(tǒng)打開時(shí)自動(dòng)利用其它搜索引擎搜索相關(guān)信息,然后利用向量空間模型檢索出用戶比較感興趣的信息。2. 論文目的、內(nèi)容及主要貢獻(xiàn)(1) 論文目的:熟悉向量空間模型的原理,掌握向量空間模型的實(shí)現(xiàn)方法,利用用戶興趣信息和向量空間模型實(shí)現(xiàn)web信息的自動(dòng)推薦。同時(shí)在論文工作過
18、程中學(xué)會(huì)查閱文獻(xiàn)資料,提高自我學(xué)習(xí)能力,動(dòng)手能力,自我思考能力。(2) 論文內(nèi)容:分析搜索引擎的現(xiàn)狀、主動(dòng)服務(wù)機(jī)制,學(xué)習(xí)和掌握向量空間模型的原理與實(shí)現(xiàn)方法,設(shè)計(jì)面向web信息的自動(dòng)推薦算法,實(shí)現(xiàn)web信息自動(dòng)推薦系統(tǒng)等。(3) 主要貢獻(xiàn):對(duì)傳統(tǒng)的www搜索機(jī)制做出了分析,提出了使用向量空間模型來實(shí)現(xiàn)個(gè)性化搜索,實(shí)現(xiàn)了自動(dòng)推薦的服務(wù)機(jī)制。1 發(fā)展現(xiàn)狀與設(shè)計(jì)目標(biāo)1.1 web信息檢索工具搜索引擎web給信息檢索帶來了新的挑戰(zhàn),web上的信息量快速增長(zhǎng),同時(shí)不斷有毫無(wú)經(jīng)驗(yàn)的新用戶來體驗(yàn)web這門藝術(shù),如何在浩瀚的信息海洋中準(zhǔn)確、方便、快速地找到自己所需的信息,從1995年開始出現(xiàn)的信息檢索工具搜索引
19、擎(serach engines),并且它所提供的導(dǎo)航服務(wù)已成為internet中最要的網(wǎng)絡(luò)服務(wù)之一。目前搜索引擎已從一種單純的it技術(shù)上升為搜索經(jīng)濟(jì),有望成為繼無(wú)線增值和游戲之后,互聯(lián)網(wǎng)企業(yè)又一重要的利潤(rùn)增長(zhǎng)點(diǎn)。3按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類:(1) 目錄式搜索引擎,以人工方式或半自動(dòng)方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中,由于web信息的海量性和人工處理能力、經(jīng)濟(jì)代價(jià)的限制,這類搜索引擎信息的即時(shí)性和全面性難以保證它的優(yōu)秀代表是yahoo等。(2) 機(jī)器人搜索引擎,由一個(gè)稱為蜘蛛(spider)的機(jī)器人程序
20、以某種策略自動(dòng)地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫(kù),并將查詢結(jié)果返回給用戶,這類搜索引擎實(shí)現(xiàn)較為復(fù)雜,但能很好的實(shí)現(xiàn)信息的全面獲取和即時(shí)更新,它的優(yōu)秀代表是google等,后文如非特別說明,都指這類搜索引擎。(3) 元搜索引擎,這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶,這類搜索引擎兼集多個(gè)搜索引擎的信息,并且加入新的排序和信息過濾,可以很好的提高用戶滿意度,它的優(yōu)秀代表是vivisino等。web搜索引擎的原理通常為:首先是用蜘蛛(sp
21、ider)進(jìn)行全網(wǎng)搜索,自動(dòng)抓取網(wǎng)頁(yè);然后將抓取的網(wǎng)頁(yè)進(jìn)行索引,同時(shí)也會(huì)記錄與檢索有關(guān)的屬性,中文搜索引擎中還需要首先對(duì)中文進(jìn)行分詞;最后,接受用戶查詢請(qǐng)求,檢索索引文件并按照各種參數(shù)進(jìn)行復(fù)雜的計(jì)算,產(chǎn)生結(jié)果并返回給用戶?;谏厦娴脑恚旅鎸⒑?jiǎn)要介紹web搜索引擎的實(shí)現(xiàn)。(1) 利用網(wǎng)絡(luò)蜘蛛獲取網(wǎng)絡(luò)資源。這是一種半自動(dòng)化的資源(由于此時(shí)尚未對(duì)資源進(jìn)行分析和理解,不能成為信息而僅是資源)獲取方式。所謂半自動(dòng)化,是指搜索器需要人工指定起始網(wǎng)絡(luò)資源url(uniform resource locator),然后獲取該所url指向的網(wǎng)絡(luò)資源,并分析該資源所指向的其他資源并獲取。網(wǎng)絡(luò)蜘蛛訪問資源的過程
22、,是對(duì)互聯(lián)網(wǎng)上信息遍歷的過程。在實(shí)際的蜘蛛程序中,為了保證信息收集的全面性,及時(shí)性,還有多個(gè)蜘蛛程序的分工和合作問題,往往有復(fù)雜的控制機(jī)制。如google的在利用蜘蛛程序獲取網(wǎng)絡(luò)資源時(shí),是由一個(gè)認(rèn)為管理程序負(fù)責(zé)任務(wù)的分配和結(jié)果的處理,多個(gè)分布式的蜘蛛程序從管理程序活動(dòng)任務(wù),然后將獲取的資源作為結(jié)果返回,并從新獲得任務(wù)。(2) 利用索引器從搜索器獲取的資源中抽取信息,并建立利于檢索的索引表。當(dāng)用網(wǎng)絡(luò)蜘蛛獲取資源后后,需要對(duì)這些進(jìn)行加工過濾,去掉網(wǎng)控制代碼及無(wú)用信息,提取出有用的信息,并把信息用一定的模型表示,使查詢結(jié)果更為準(zhǔn)確。其中信息的表示模型一般有布爾模型,向量模型,概率模型和神經(jīng)網(wǎng)絡(luò)模型等
23、。web上的信息一般表現(xiàn)為網(wǎng)頁(yè),對(duì)每個(gè)網(wǎng)頁(yè),須生成一個(gè)摘要,此摘要將顯示在查詢結(jié)果的頁(yè)面中,告訴查詢用戶各網(wǎng)頁(yè)的內(nèi)容概要。模型化的信息將存放在臨時(shí)數(shù)據(jù)庫(kù)中,由于web數(shù)據(jù)的數(shù)據(jù)量極為龐大,為了提高檢索效率,須按照一定規(guī)則建立索引。不同搜索引擎在建立索引時(shí)會(huì)考慮不同的選項(xiàng),如是否建立全文索引,是否過濾無(wú)用詞匯,是否使用meta信息等。索引的建立包括:分析過程,處理文檔中可能的錯(cuò)誤;文檔索引,完成分析的文檔被編碼進(jìn)存儲(chǔ)桶,有些搜索引擎還會(huì)使用并行索引;排序,將存儲(chǔ)桶按照一定的規(guī)則排序,生產(chǎn)全文存儲(chǔ)桶。最終形成的索引一般按照倒排文件的格式存放。(3) 檢索及用戶交互。前面兩部分屬于搜索引擎的后臺(tái)支持
24、。本部分在前面信息索引庫(kù)的基礎(chǔ)上,接受用戶查詢請(qǐng)求,并到索引庫(kù)檢索相關(guān)內(nèi)容,返回給用戶。這部分的主要內(nèi)容包括:用戶查詢(query)理解,即最大可能貼近的理解用戶通過查詢串想要表達(dá)的查詢目的,并將用戶查詢轉(zhuǎn)換化為后臺(tái)檢索使用的信息模型;根據(jù)用戶查詢的檢索模型,在索引庫(kù)中檢索出結(jié)果集;結(jié)果排序:通過特定的排序算法,對(duì)檢索結(jié)果集進(jìn)行排序?,F(xiàn)在用的的排序因素一般有查詢相關(guān)度,google發(fā)明的pagerank計(jì)術(shù),baidu的競(jìng)價(jià)技術(shù)等。由于web數(shù)據(jù)的海量性和用戶初始查詢的模糊性,檢索結(jié)果集一般很大,而用戶一邊不會(huì)有足夠的耐性逐個(gè)查看所有的結(jié)果,所以怎樣設(shè)計(jì)結(jié)果集的排序算法,把用戶感興趣的結(jié)果排在
25、前面就十分重要。搜索引擎的評(píng)價(jià)指標(biāo)有響應(yīng)時(shí)間、查全率、查準(zhǔn)率和用戶滿意度等。其中響應(yīng)時(shí)間是從用戶提交查詢請(qǐng)求到搜索引擎給出查詢結(jié)果的時(shí)間間隔,響應(yīng)時(shí)間必須在用戶可以接受的范圍之內(nèi)。查全率是指查詢結(jié)果集信息的完備性。查準(zhǔn)率是指查詢結(jié)果集中符合用戶要求的數(shù)目與結(jié)果總數(shù)之比。用戶滿意度是一個(gè)難以量化的概念,除了搜索引擎本身的服務(wù)質(zhì)量外,它還和用戶群體,網(wǎng)絡(luò)環(huán)境有關(guān)系。在搜索引擎可以控制的范圍內(nèi),其核心是搜索結(jié)果的排序,即前文提到的如何把最合適的結(jié)果排到前面。而當(dāng)前搜索引擎服務(wù)提高的挑戰(zhàn)主要來之兩方面,一個(gè)是用戶初始查詢請(qǐng)求描述的不準(zhǔn)卻性,用戶往往難以清楚的表達(dá)其信息需求。所以,當(dāng)前以及今后一段時(shí)間內(nèi)
26、,對(duì)如何根據(jù)用戶模糊的查詢請(qǐng)求,較為準(zhǔn)確、全面的理解用戶的實(shí)際信息需求的研究,將是搜索引擎技術(shù)研究的一個(gè)重要方面。目前這方面的研究主要集中于查詢結(jié)果文檔的信息挖掘,這方面的努力已經(jīng)取得很多的成果。另一方面,挖掘用戶的個(gè)性化信息,將是一個(gè)能產(chǎn)生突破性成果的方法:根據(jù)用戶的背景信息,如知識(shí)水平,專業(yè)方向,職業(yè)和興趣等,將極大的促進(jìn)用戶初始查詢理解的準(zhǔn)確性和全面性。另外,對(duì)用戶網(wǎng)絡(luò)使用的日志分析,也能提供準(zhǔn)確的用戶網(wǎng)絡(luò)行為,從而為用戶信息需求分析提供重要依據(jù)。綜上所述,對(duì)個(gè)性化搜索引擎的實(shí)現(xiàn)的研究,將成為近段時(shí)間研究的重點(diǎn)和突破點(diǎn)。1.2 傳統(tǒng)www信息檢索服務(wù)的特點(diǎn)基于www的信息檢索服務(wù)是int
27、erent最主要的功能之一,用戶只要擁有一臺(tái)接入interent的計(jì)算機(jī)就可以在網(wǎng)上遨游,檢索幾乎任何方面的知識(shí)。但是由于技術(shù)或者理念的原因,這種信息檢索服務(wù)也存在諸多缺點(diǎn):4(1) 傳統(tǒng)www信息檢索是“提問搜索”方式,通過一種簡(jiǎn)單的操作界面接受用戶的提問,再把搜索到的結(jié)果返回給用戶。缺點(diǎn):對(duì)于所有用戶給出同樣的關(guān)鍵字得到的檢索結(jié)果都是一樣的,不能根據(jù)不同的用戶的興趣愛好給出相應(yīng)的建議。(2) 用戶的興趣的狀態(tài)信息沒有保留下來,用戶每次查詢是相互獨(dú)立的。(3) 網(wǎng)上www服務(wù)器一般使用公共網(wǎng)關(guān)接口(common gateway interface,cgi)來查詢數(shù)據(jù)庫(kù),cgi結(jié)構(gòu)簡(jiǎn)單形式單一
28、,不能和用戶進(jìn)行很好的交互,很難根據(jù)用戶的反應(yīng)調(diào)整檢索策略。(4) cgi程序與后數(shù)據(jù)庫(kù)耦合度圈套,不易移植,導(dǎo)致多個(gè)數(shù)據(jù)庫(kù)之間無(wú)法互操作。提高查全率和查準(zhǔn)率一直是網(wǎng)上檢索系統(tǒng)追求的目標(biāo),但是傳統(tǒng)的檢索模型卻同時(shí)被不準(zhǔn)確、完全的查詢結(jié)果和不一致的文檔相關(guān)性所困擾。出現(xiàn)這種矛盾的主要原因是現(xiàn)存的信息服務(wù)模式及相應(yīng)的服務(wù)支持技術(shù)不能滿足海量信息環(huán)境和多樣化客戶需求的要求。現(xiàn)有的信息服務(wù)模式的主要特征是信息服務(wù)方是被動(dòng)式服務(wù),即信息的所有者(如情報(bào)所) 擁有大量的信息,被動(dòng)地等待信息使用者的訪問,并且對(duì)信息使用者歷史資料也不保留或未加以分析利用。信息使用者(如高新技術(shù)企業(yè)、高等院校、研究機(jī)構(gòu)等) 也
29、是被動(dòng)地使用信息,通常是在項(xiàng)目立項(xiàng)、鑒定、技術(shù)攻關(guān)等特定時(shí)期,有信息檢索需求時(shí),才自己去檢索資料。為解決上述問題,必須改進(jìn)服務(wù)模式,改變過去的被動(dòng)服務(wù)方式,采用主動(dòng)信息服務(wù)。1.3 主動(dòng)信息服務(wù)的必要性在當(dāng)今信息社會(huì),主動(dòng)信息服務(wù)系統(tǒng)有很重大的意義。首先是重大的社會(huì)意義。對(duì)于企業(yè)而言,他們必然要關(guān)心競(jìng)爭(zhēng)對(duì)手、合作伙伴、市場(chǎng)變換等企業(yè)外部環(huán)境,因此,及時(shí)高效地獲得企業(yè)所需信息是企業(yè)提高效益的前提之一;對(duì)于高等院?;蜓芯繖C(jī)構(gòu)而言,及時(shí)把握科技發(fā)展新動(dòng)態(tài),獲取最新的、來自世界范圍的和自己所感興趣的情報(bào)信息,經(jīng)常進(jìn)行課題查新,可促進(jìn)其研究走在科學(xué)研究的前列。主動(dòng)服務(wù)信息系統(tǒng)必將推動(dòng)情報(bào)機(jī)構(gòu)信息服務(wù)的水
30、平,會(huì)為企業(yè)、高校、研究機(jī)構(gòu)及科技工作者個(gè)人及時(shí)地提供最新理論、技術(shù)、產(chǎn)品、發(fā)展新動(dòng)向,會(huì)逐漸增強(qiáng)他們的科技競(jìng)爭(zhēng)力,從而推動(dòng)科技、產(chǎn)業(yè)的發(fā)展,最終對(duì)經(jīng)濟(jì)、文化發(fā)展產(chǎn)生重要影響。其次是將產(chǎn)生直接經(jīng)濟(jì)效益。直接經(jīng)濟(jì)效益體現(xiàn)在兩個(gè)方面:對(duì)信息服務(wù)機(jī)構(gòu)而言,現(xiàn)在信息大多是有償使用,組織或機(jī)構(gòu)用重金購(gòu)來的信息資源,只有在為社會(huì)提供更多的有效服務(wù)時(shí),才能節(jié)約資金、減少浪費(fèi),因此為了信息服務(wù)機(jī)構(gòu)的自身發(fā)展,必須改變被動(dòng)服務(wù)模式,選擇主動(dòng)服務(wù)模式;對(duì)信息使用者而言,及時(shí)的信息服務(wù)會(huì)為信息的使用者帶來相當(dāng)多的直接經(jīng)濟(jì)效益。5發(fā)現(xiàn)有用戶需求的信息時(shí),應(yīng)當(dāng)能自動(dòng)將信息通過interent等方式,運(yùn)用信息推送(pus
31、h)方法,及時(shí)將信息發(fā)送給用戶。于是基于push技術(shù)的主動(dòng)信息服務(wù)模式被提出來并用于實(shí)踐。主動(dòng)推送服務(wù)是通過http、ftp傳輸協(xié)議,在獲取了挖掘或是定制的用戶需求后,定期主動(dòng)傳送用戶需信息的計(jì)算機(jī)通訊技術(shù)??梢杂蒩gent完成信息的推送,也可以也通過email和人工參與的主動(dòng)信息推送等。1.4 主動(dòng)推送信息服務(wù)系統(tǒng)原理主動(dòng)推送技術(shù)(push)是1996年底在美國(guó)興起的一項(xiàng)新的網(wǎng)上信息獲取技術(shù)。這種方式通常需要一個(gè)中間的服務(wù)模塊用來搜集、分類、整理將要推送出去的信息內(nèi)容,并將信息推送出去。用戶可以先行向系統(tǒng)注冊(cè)興趣信息,以后用戶登錄時(shí),系統(tǒng)自動(dòng)利用搜索引擎檢索與用戶相關(guān)的興趣信息并存入索引數(shù)據(jù)
32、庫(kù)。使用這種push技術(shù)可大大提高用戶獲取信息的能力,如用戶可根據(jù)自己的興趣信息進(jìn)行修改與刪除,希望每天能收到他感興趣的信息,而不像報(bào)紙樣包含很多個(gè)人不感興趣的信息,從而滿足了網(wǎng)上信息服務(wù)的個(gè)性化和主動(dòng)性要求。這種主動(dòng)推送信息服務(wù)系統(tǒng)原理可以用圖1來表示。6用戶索引數(shù)據(jù)庫(kù)瀏覽器檢索接口資源接收用戶注冊(cè)/登錄搜索引擎因特網(wǎng)用戶特征數(shù)據(jù)庫(kù)用戶特征識(shí)別 服務(wù)器端瀏覽器端圖1 主動(dòng)推送系統(tǒng)結(jié)構(gòu)意圖該系統(tǒng)采用browser/server(瀏覽器/服務(wù)器)結(jié)構(gòu)。瀏覽器端用戶工作分為:用戶向系統(tǒng)提交自己需要的信息特征。服務(wù)器端的工作包括兩部分:一部分是搜索引擎自動(dòng)根據(jù)用戶信息特征從因特網(wǎng)上搜索信息并將信息寫
33、入索引數(shù)據(jù)庫(kù);另一部分是從用戶注冊(cè)系統(tǒng)中取得用戶的個(gè)性特征建立用戶特征數(shù)據(jù)庫(kù)。與傳統(tǒng)的信息檢索機(jī)制不同,我們?cè)O(shè)計(jì)了一個(gè)用戶特征識(shí)別模塊,將用戶的特征值與檢索的結(jié)果結(jié)合起來進(jìn)行相關(guān)性判斷,提供更高精度的檢索結(jié)果。由主動(dòng)推送信息服務(wù)系統(tǒng)的結(jié)構(gòu)圖可以看出,要實(shí)現(xiàn)主動(dòng)推送功能最重要的模塊之一是將索引數(shù)據(jù)庫(kù)與用戶特征庫(kù)進(jìn)行相關(guān)性判斷。在本文中,我們采用了向量空間模型來實(shí)現(xiàn)這一功能。我們將在以后的章節(jié)中介紹向量空間模型的原理與實(shí)現(xiàn)技術(shù)。1.4 web信息自動(dòng)推薦系統(tǒng)的設(shè)計(jì)目標(biāo)web信息自動(dòng)推薦系統(tǒng)是基于主動(dòng)推送機(jī)制而實(shí)現(xiàn)的,具體實(shí)現(xiàn):用戶可以注冊(cè)興趣信息然后提交,則以后系統(tǒng)打開時(shí)自動(dòng)利用搜索引擎搜索相關(guān)信
34、息,最后利用向量空間模型檢索出用戶比較感興趣的信息。在windowsxp環(huán)境下利用eclipse3.1 + myeclipse4.1+ tomcat5.0 + j2sdk5.0 搭建j2ee開發(fā)環(huán)境,用mysql數(shù)據(jù)庫(kù)做后臺(tái)完成一個(gè)基于b/s模式的web信息自動(dòng)推薦系統(tǒng)。2 開發(fā)工具及關(guān)鍵技術(shù)介紹2.1 eclipse(myeclipse)2001 年11 月 ibm 宣布捐出了價(jià)值 4 千萬(wàn)美金的開發(fā)軟件給開放源碼的 eclipse 項(xiàng)目。如此受青睞的 eclipse 是什么樣子呢,如何使用呢?通過介紹將會(huì)使你對(duì)eclipse有一個(gè)初步的認(rèn)識(shí)。并且,eclipse這個(gè)號(hào)稱未來能進(jìn)行任何語(yǔ)言開
35、發(fā)的ide集大成者,又將如何實(shí)現(xiàn)它的這一宏偉目標(biāo)?其次介紹的eclipse3.1的特性。7eclipse 是替代ibm visual age for java(以下簡(jiǎn)稱ivj)的下一代ide開發(fā)環(huán)境,但它未來的目標(biāo)不僅僅是成為專門開發(fā)java程序的ide環(huán)境,根據(jù)eclipse的體系結(jié)構(gòu),通過開發(fā)插件,它能擴(kuò)展到任何語(yǔ)言的開發(fā),甚至能成為圖片繪制的工具。目前,eclipse已經(jīng)開始提供c語(yǔ)言開發(fā)的功能插件。更難能可貴的是,eclipse是一個(gè)開放源代碼的項(xiàng)目,任何人都可以下載eclipse的源代碼,并且在此基礎(chǔ)上開發(fā)自己的功能插件。也就是說未來只要有人需要,就會(huì)有建立在eclipse之上的co
36、bol,perl,python等語(yǔ)言的開發(fā)插件出現(xiàn)。同時(shí)可以通過開發(fā)新的插件擴(kuò)展現(xiàn)有插件的功能,比如在現(xiàn)有的java開發(fā)環(huán)境中加入tomcat服務(wù)器插件。可以無(wú)限擴(kuò)展,而且有著統(tǒng)一的外觀,操作和系統(tǒng)資源管理,這也正是eclipse的潛力所在。eclipse3.1的新特性:(1) 速度更快,效率更高。我們打開eclipse3.1一看,包括啟動(dòng),開發(fā)的速度都 比3.0快很多了,我大約測(cè)試一下,同一個(gè)環(huán)境下,比3.0啟動(dòng)快了幾十秒。(2) 組件功能更強(qiáng)大,并帶有非常強(qiáng)大圖形編輯功能,支持可視化的applet,swing,awt等圖形組件的開發(fā)。(3) 支持ejb3.0。(4) 支持uml2.0,并帶
37、有uml2.0模型編輯器。(5) 帶有商業(yè)智能的報(bào)表項(xiàng)目和報(bào)表開發(fā)。(6) 支持新版的aop插件用于可視化的開發(fā)aop應(yīng)用程序和調(diào)試aop的應(yīng)用程序。(7) 不像3.0一定需要jdk5.0的jre,它只需要jdk1.4.1以上就可以了。myeclipse為eelipse開發(fā)j2ee提供的一個(gè)整合開發(fā)環(huán)境,可以開發(fā)web,ejb,java運(yùn)用程序等。它為eclipse提供了一個(gè)大量私有和開源的java工具的集合,這解決了各種開源工具不一致的缺點(diǎn)。2.2 java(jsp、j2ee)2.2.1 javajava是一種簡(jiǎn)單的、面象對(duì)象的、分布式的、解釋的、鍵壯的、安全的,結(jié)構(gòu)的、中立的,可移植的、性
38、能很優(yōu)異的、多線程的、動(dòng)態(tài)的語(yǔ)言。目前,java 2平臺(tái)有3個(gè)版本,它們是適用于小型設(shè)備和智能卡的java 2平臺(tái)micro版(java 2 platform micro edition,j2me)、適用于桌面系統(tǒng)的java 2平臺(tái)標(biāo)準(zhǔn)版(java 2 platform standard edition,j2se)、適用于創(chuàng)建服務(wù)器應(yīng)用程序和服務(wù)的java 2平臺(tái)企業(yè)版(java 2 platform enterprise edition,j2ee)。最初java當(dāng)時(shí)僅僅被用來為網(wǎng)站制作一些動(dòng)態(tài)應(yīng)用,諸如動(dòng)畫圖片之類,但這仍然引起了很多web開發(fā)者們的注意,他們非??释幸环N安全的語(yǔ)言,可以在
39、靜態(tài)的html網(wǎng)頁(yè)上制作動(dòng)畫圖片。sun最終把java集成到netscape瀏覽器。同時(shí)因?yàn)樗哂小爸粚懸淮危S處運(yùn)行”的特性,而引起了很多開發(fā)者的注意,他們可以再也不用為了使程序能夠在不同型號(hào)的硬件上運(yùn)行而耗費(fèi)大量的時(shí)間來編譯代碼了。8j2se 5.0(代號(hào)project tiger)于2004年9月底發(fā)布。它是java平臺(tái)標(biāo)準(zhǔn)版多年來的重大更新之一。java社區(qū)為其新增功能歡呼不已,然而這些新增功能還無(wú)法全面地描述此版本的特色。與以往任何版本相比,這一平臺(tái)更能滿足高水平的測(cè)試要求,更適合于任務(wù)關(guān)鍵型產(chǎn)品的開發(fā)。 java特點(diǎn)有如下:(1) 平臺(tái)無(wú)關(guān)性平臺(tái)無(wú)關(guān)性是指java能運(yùn)行于不同的平臺(tái)
40、。java引進(jìn)虛擬機(jī)原理,并運(yùn)行于虛擬機(jī),實(shí)現(xiàn)不同平臺(tái)的java接口之間。使用java編寫的程序能在世界范圍內(nèi)共享。java的數(shù)據(jù)類型與機(jī)器無(wú)關(guān),java虛擬機(jī)(java virtual machine)是建立在 硬件和操作系統(tǒng)之上,實(shí)現(xiàn)java二進(jìn)制代碼的解釋執(zhí)行功能,提供于不同平臺(tái)的接口的。 (2) 安全性 java的編程類似c+,學(xué)習(xí)過c+的讀者將很快掌握java的精髓。java舍棄了c+的指針對(duì)存儲(chǔ)器地址的直接操作,程序運(yùn)行時(shí),內(nèi)存由操作系統(tǒng)分配,這樣可以避免病毒通過指 針侵入系統(tǒng)。java對(duì)程序提供了安全管理器,防止程序的非法訪問。 (3) 面向?qū)ο骿ava 吸取了c+面向?qū)ο蟮母拍?/p>
41、,將數(shù)據(jù)封裝于類中,利用類的優(yōu)點(diǎn),實(shí)現(xiàn)了程序的簡(jiǎn)潔性和便于維護(hù)性。類的封裝性、 繼承性等有關(guān)對(duì)象的特性,使程序代碼只需一次編譯,然后通過上述特性反復(fù)利用。程序員只需把主要精力用在類和接口的設(shè)計(jì)和應(yīng)用上。java提供了眾多的一般對(duì)象的類,通過繼承即可使用父類的方法。在java 中,類的繼承關(guān)系是單一的而非多重的,一個(gè)子類只有一個(gè)父類,子類的父類又有一個(gè)父類。java 提供的object 類及其子類的繼承關(guān)系如同一棵倒立的樹形,根類為 object 類,object 類功能強(qiáng)大,經(jīng)常會(huì)使用到它及其它派生的子類。(4) 分布式j(luò)ava建立在擴(kuò)展tcp/ip網(wǎng)絡(luò)平臺(tái)上。庫(kù)函數(shù)提供了用http和ftp協(xié)
42、議傳送和接受信息的方法。這使得程序員使用網(wǎng)絡(luò)上的文件和使用本機(jī)文件一樣容易。(5) 鍵壯性java致力于檢查程序在編譯和運(yùn)行時(shí)的錯(cuò)誤。類型檢查幫助檢查出許多開發(fā)早期出現(xiàn)的錯(cuò)誤。java可以自己操縱內(nèi)存減少了內(nèi)存出錯(cuò)的可能性。java還實(shí)現(xiàn)了真數(shù)組,避免了覆蓋數(shù)據(jù)的可能。這些功能特征大大提高了開發(fā)java應(yīng)用程序的周期。2.2.2 jsp 在介紹jsp之前,我們先看看servlet。servlet是也是sun公司推出的,它提供的功能包含了cgi(common gateway interface)之類的功能,它相對(duì)于在clent端執(zhí)行的applet。發(fā)展至今,servlet api的最新版本為2.
43、4。jsp(javaserver pages)是由sun microsystems公司倡導(dǎo)、許多公司參與一起建立的一種動(dòng)態(tài)網(wǎng)頁(yè)技術(shù)標(biāo)準(zhǔn)。該技術(shù)為創(chuàng)建顯示動(dòng)態(tài)生成內(nèi)容的web頁(yè)面提供了一個(gè)簡(jiǎn)捷而快速的方法。jsp技術(shù)的設(shè)計(jì)目的是使得構(gòu)造基于web的應(yīng)用程序更加容易和快捷,而這些應(yīng)用程序能夠與各種web服務(wù)器、應(yīng)用服務(wù)器、瀏覽器和開發(fā)工具共同工作。 jsp規(guī)范是web服務(wù)器、應(yīng)用服務(wù)器、交易系統(tǒng)、以及開發(fā)工具供應(yīng)商間廣泛合作的結(jié)果。在傳統(tǒng)的網(wǎng)頁(yè)html文件(*.htm,*.html)中加入java程序片段(scriptlet)和jsp標(biāo)記(tag),就構(gòu)成了jsp網(wǎng)頁(yè)
44、(*.jsp)。web服務(wù)器在遇到訪問jsp網(wǎng)頁(yè)的請(qǐng)求時(shí),首先執(zhí)行其中的程序片段,然后將執(zhí)行結(jié)果以html格式返回給客戶。程序片段可以操作數(shù)據(jù)庫(kù)、重新定向網(wǎng)頁(yè)以及發(fā)送 email 等等,這就是建立動(dòng)態(tài)網(wǎng)站所需要的功能。所有程序操作都在服務(wù)器端執(zhí)行,網(wǎng)絡(luò)上傳送給客戶端的僅是得到的結(jié)果,對(duì)客戶瀏覽器的要求最低,可以實(shí)現(xiàn)無(wú)plugin,無(wú)activex,無(wú)java applet,甚至無(wú)frame。jsp技術(shù)是能夠讓網(wǎng)頁(yè)人員輕易建立起功能強(qiáng)大、有彈性的動(dòng)態(tài)內(nèi)容。類似其他的技術(shù)標(biāo)準(zhǔn),如asp、php或是coldfusion,等等。9jsp技術(shù)有下列優(yōu)點(diǎn):(1) 將內(nèi)容的生成
45、和顯示進(jìn)行分離使用jsp技術(shù),web頁(yè)面開發(fā)人員可以使用html或者xml標(biāo)識(shí)來設(shè)計(jì)和格式化最終頁(yè)面。使用jsp標(biāo)識(shí)或者小腳本來生成頁(yè)面上的動(dòng)態(tài)內(nèi)容。生成內(nèi)容的邏輯被封裝在標(biāo)識(shí)和javabeans組件中,并且捆綁在小腳本中,所有的腳本在服務(wù)器端運(yùn)行。如果核心邏輯被封裝在標(biāo)識(shí)和beans中,那么其他人,如web管理人員和頁(yè)面設(shè)計(jì)者,能夠編輯和使用jsp頁(yè)面,而不影響內(nèi)容的生成。在服務(wù)器端,jsp引擎解釋jsp標(biāo)識(shí)和小腳本,生成所請(qǐng)求的內(nèi)容,并且將結(jié)果以html(或者xml)頁(yè)面的形式發(fā)送回瀏覽器。這有助于作者保護(hù)自己的代碼,而又保證任何基于html的web瀏覽器的完全可用性。(2) 強(qiáng)調(diào)可重用的
46、組件絕大多數(shù)jsp頁(yè)面依賴于可重用的,跨平臺(tái)的組件(javabeans或者enterprise javabeanstm組件)來執(zhí)行應(yīng)用程序所要求的更為復(fù)雜的處理。開發(fā)人員能夠共享和交換執(zhí)行普通操作的組件,或者使得這些組件為更多的使用者或者客戶團(tuán)體所使用?;诮M件的方法加速了總體開發(fā)過程,并且使得各種組織在他們現(xiàn)有的技能和優(yōu)化結(jié)果的開發(fā)努力中得到平衡。(3) 采用標(biāo)識(shí)簡(jiǎn)化頁(yè)面開發(fā)web頁(yè)面開發(fā)人員不會(huì)都是熟悉腳本語(yǔ)言的編程人員。java server page技術(shù)封裝了許多功能,這些功能是在易用的、與jsp相關(guān)的xml標(biāo)識(shí)中進(jìn)行動(dòng)態(tài)內(nèi)容生成所需要的。標(biāo)準(zhǔn)的jsp標(biāo)識(shí)能夠訪問和
47、實(shí)例化javabeans組件,設(shè)置或者檢索組件屬性,下載applet,以及執(zhí)行用其他方法更難于編碼和耗時(shí)的功能。jsp技術(shù)很容易整合到多種應(yīng)用體系結(jié)構(gòu)中,以利用現(xiàn)存的工具和技巧,并且擴(kuò)展到能夠支持企業(yè)級(jí)的分布式應(yīng)用。作為采用java技術(shù)家族的一部分,以及java 2(企業(yè)版體系結(jié)構(gòu))的一個(gè)組成部分,jsp技術(shù)能夠支持高度復(fù)雜的基于web的應(yīng)用。由于jsp頁(yè)面的內(nèi)置腳本語(yǔ)言是基于java編程語(yǔ)言的,而且所有的jsp頁(yè)面都被編譯成為java servlet,jsp頁(yè)面就具有java技術(shù)的所有好處,包括健壯的存儲(chǔ)管理和安全性。作為java平臺(tái)的一部分,jsp擁有java編程語(yǔ)言“
48、一次編寫,各處運(yùn)行”的特點(diǎn)。隨著越來越多的供應(yīng)商將jsp支持添加到他們的產(chǎn)品中,您可以使用自己所選擇的服務(wù)器和工具,更改工具或服務(wù)器并不影響當(dāng)前的應(yīng)用。當(dāng)與java 2平臺(tái),j2ee和enterprise javabean技術(shù)整合時(shí),jsp頁(yè)面將提供企業(yè)級(jí)的擴(kuò)展性和性能,這對(duì)于在虛擬企業(yè)中部署基于web的應(yīng)用是必需的。jsp的運(yùn)作模式將在2.6節(jié)介紹。2.2.3 j2eej2ee是一種利用java 2平臺(tái)來簡(jiǎn)化企業(yè)解決方案的開發(fā)、部署和管理相關(guān)的復(fù)雜問題的體系結(jié)構(gòu)。j2ee技術(shù)的基礎(chǔ)就是核心java平臺(tái)或java 2平臺(tái)的標(biāo)準(zhǔn)版,j2ee不僅鞏固了標(biāo)準(zhǔn)版中的許多優(yōu)點(diǎn),例如&
49、quot;編寫一次、隨處運(yùn)行"的特性、方便存取數(shù)據(jù)庫(kù)的jdbc api、corba技術(shù)以及能夠在internet應(yīng)用中保護(hù)數(shù)據(jù)的安全模式等等,同時(shí)還提供了對(duì) ejb(enterprise javabeans)、java servlets api、jsp(java server pages)以及xml技術(shù)的全面支持。其最終目的就是成為一個(gè)能夠使企業(yè)開發(fā)者大幅縮短投放市場(chǎng)時(shí)間的體系結(jié)構(gòu)。 j2ee體系結(jié)構(gòu)提供中間層集成框架用來滿足無(wú)需太多費(fèi)用而又需要高可用性、高可靠性以及可擴(kuò)展性的應(yīng)用的需求。通過提供統(tǒng)一的開發(fā)平臺(tái),j2ee降低了開發(fā)多層應(yīng)用的費(fèi)用和復(fù)雜性,同時(shí)提供對(duì)現(xiàn)有應(yīng)用程序集成強(qiáng)有
50、力支持,完全支持enterprise javabeans,有良好的向?qū)еС执虬筒渴饝?yīng)用,添加目錄支持,增強(qiáng)了安全機(jī)制,提高了性能。j2ee使用多層分布式的應(yīng)用模型,這個(gè)多層通常通過三層或四層來實(shí)現(xiàn):(1) 客戶層,運(yùn)行在客戶計(jì)算機(jī)上的組件。(2) web層,運(yùn)行在j2ee服務(wù)器上的組件。(3) 業(yè)務(wù)層,同樣是運(yùn)行在j2ee服務(wù)器上的組件。(4) 企業(yè)信息系統(tǒng)層(eis),是指運(yùn)行在eis服務(wù)器上的軟件系統(tǒng)以上層次一般也指三層應(yīng)用,因分布在三個(gè)不同位置:客戶計(jì)算機(jī)、j2ee服務(wù)器及后臺(tái)的數(shù)據(jù)庫(kù)或過去遺留下來的系統(tǒng),j2ee體系結(jié)構(gòu)圖如圖2所示。圖2 j2ee體系結(jié)構(gòu)圖2.3 tomcattom
51、cat的目前的版本為5.0.30,它是javasoft 和apache開發(fā)團(tuán)隊(duì)共同提出合作計(jì)劃(apache jakarta project)下的產(chǎn)品。tomcat嚴(yán)格意義上并不是一個(gè)真正的web服務(wù)器(app server),它只是一個(gè)可以支持運(yùn)行serlvet/jsp的web容器,不過tomcat也擴(kuò)展了一些app server的功能,如jndi,數(shù)據(jù)庫(kù)連接池,用戶事務(wù)處理等等。tomcat運(yùn)行穩(wěn)定、性能可靠,被非常廣泛的應(yīng)用在中小規(guī)模的java web應(yīng)用中。2.4 mysql mysql目前的版本為5.0,它是完全網(wǎng)絡(luò)化的跨平臺(tái)關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng),一個(gè)真正的多用戶、多線程sql數(shù)據(jù)庫(kù)服務(wù)
52、器,同時(shí)是具有客戶機(jī)/服務(wù)器體系結(jié)構(gòu)的分布式數(shù)據(jù)庫(kù)管理系統(tǒng)。它具有功能強(qiáng)、使用簡(jiǎn)便、管理方便、運(yùn)行速度快、安全可靠性強(qiáng)等優(yōu)點(diǎn),用戶可利用許多語(yǔ)言編寫訪問mysql數(shù)據(jù)庫(kù)的程序,對(duì)于中、小型應(yīng)用系統(tǒng)是非常理想的。除了支持標(biāo)準(zhǔn)的ansi sql語(yǔ)句,更重要的是,它還支持多種平臺(tái),而在unix系統(tǒng)上該軟件支持多線程運(yùn)行方式,從而能獲得相當(dāng)好的性能。對(duì)于不使用unix的用戶,它可以在windows nt系統(tǒng)上以系統(tǒng)服務(wù)方式運(yùn)行,或者在windows 98/2000/xp系統(tǒng)上以普通進(jìn)程方式運(yùn)行。而在unix/linux系統(tǒng)上,mysql支持多線程運(yùn)行方式,從而能獲得相當(dāng)好的性能,而且它是屬于開放源代碼
53、軟件。 2.5 jdbc 2.5.1 jdbc概述jdbc(java database connectivity)是sun基于x/open sql cli的數(shù)據(jù)庫(kù)技術(shù),它是一種能夠通過java語(yǔ)言訪問結(jié)構(gòu)化數(shù)據(jù)庫(kù)的應(yīng)用程序接口(jdbc api),對(duì)于一些使用結(jié)構(gòu)化查詢語(yǔ)言的關(guān)系型數(shù)據(jù)庫(kù)尤為有效。jdbc不但提供了標(biāo)準(zhǔn)的api連接數(shù)據(jù)源,而且還為數(shù)據(jù)庫(kù)互生產(chǎn)廠家提供了標(biāo)準(zhǔn)的驅(qū)動(dòng)程序,使得用戶可方便地使自己的java應(yīng)用程序與數(shù)據(jù)庫(kù)互相通信。jdbc最大的特點(diǎn)是:對(duì)下,jdbc封裝了各種底層數(shù)據(jù)源之間的差異;對(duì)上,jdbc提供標(biāo)準(zhǔn)的sql界面。這使得上層應(yīng)用對(duì)底層數(shù)據(jù)源的訪問完全透明,大大地簡(jiǎn)化
54、了訪問底層數(shù)據(jù)源的復(fù)雜性,真正做到了無(wú)障礙溝通。2.5.2 jdbc數(shù)據(jù)訪問模型sun公司定義了4種數(shù)據(jù)庫(kù)驅(qū)動(dòng)程序類型,它們分別是:(1) 本地api部分java驅(qū)動(dòng)程序(2) jdbc-net純java驅(qū)動(dòng)程序(3) 本地協(xié)議java驅(qū)動(dòng)程序(4) jdbc-odbc橋驅(qū)動(dòng)程序在本論只介紹使用廣泛的模型即本地api部分java驅(qū)動(dòng)程序,這種驅(qū)動(dòng)程序?qū)dbc的命令轉(zhuǎn)換成數(shù)據(jù)管理系統(tǒng)指定的本地調(diào)用,然后由本地調(diào)用直接操作數(shù)據(jù)庫(kù)(如圖3所示)。這種兩層模型比jdbc-odbc橋驅(qū)動(dòng)程序要快,但是每個(gè)客戶端需要裝載必要的文件?,F(xiàn)在大多數(shù)的數(shù)據(jù)庫(kù)廠商都在其數(shù)據(jù)庫(kù)中提供該驅(qū)動(dòng)程序。本系統(tǒng)使用的是mys
55、ql數(shù)據(jù)庫(kù)。 mysql提供的驅(qū)動(dòng)程序稱為connect/j,且是支持jdbc3.0的版本為:3.1.7。102.6 基于b/s模型的web應(yīng)用程序(1) 定義:動(dòng)態(tài)的網(wǎng)頁(yè)有著網(wǎng)頁(yè)的外觀,而實(shí)質(zhì)上是建立在b/s模型上的服務(wù)器web應(yīng)用程序。也就是說,一幅瀏覽器端的顯示的網(wǎng)頁(yè),是一段服務(wù)器程序運(yùn)行的結(jié)果。所以應(yīng)該從編程的角度理解、構(gòu)思網(wǎng)頁(yè)的結(jié)構(gòu)和功能。java運(yùn)行環(huán)境廠商專用api數(shù)據(jù)庫(kù)data basejava應(yīng)用程序jdbc驅(qū)動(dòng)程序圖3 本地api部分java驅(qū)動(dòng)程序(2) 工作原理:www(world wide web)技術(shù)作為internet 上信息資源共享的解決方案,它是構(gòu)建在瀏覽器/
56、服務(wù)器(b/s)模型以及http的基礎(chǔ)上的,其運(yùn)作模式可以描述為:請(qǐng)求>處理>應(yīng)答。b/s模型的構(gòu)成及關(guān)系示意圖,如圖4所示。從瀏覽器提交的請(qǐng)求通過web服務(wù)器給應(yīng)用程序服務(wù)器,由它調(diào)用相關(guān)的網(wǎng)頁(yè)應(yīng)用程序進(jìn)行處理,處理結(jié)果網(wǎng)頁(yè)交給web服務(wù)器,web服務(wù)器把這個(gè)網(wǎng)頁(yè)作為請(qǐng)求的應(yīng)答發(fā)送給瀏覽器。至于對(duì)提交的信息如何處理,就交由網(wǎng)站的開發(fā)人員編寫相關(guān)的網(wǎng)頁(yè)應(yīng)用程序來決定反饋到瀏覽器的內(nèi)容;如果需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行訪問,開發(fā)人員還可以利用應(yīng)用程序服務(wù)器所提供的接口對(duì)其進(jìn)行操作。如前所示,網(wǎng)頁(yè)內(nèi)容的動(dòng)態(tài)發(fā)布是web應(yīng)用程序的主要實(shí)現(xiàn)方法,通常這種方法同服務(wù)器端提供的www服務(wù)技術(shù)密不可分。一般
57、來說,在internet服務(wù)器上可以通過多種途徑實(shí)現(xiàn)動(dòng)態(tài)發(fā)布,最常見的技術(shù)包括jsp、cgi、isapi和asp等。jsp的運(yùn)行模式,如何在b/s模型上動(dòng)作的?圖5所示即為jsp運(yùn)作原理模型。當(dāng)web服務(wù)器招收到一個(gè)后綴是.jsp頁(yè)的請(qǐng)求時(shí),觸發(fā)jsp引擎。jsp引擎首先檢查jsp文件是否修改過,如果是則將其轉(zhuǎn)換成java servlet源程序,然后編譯成擴(kuò)展名為.class的servlet字節(jié)代碼,再由servlet引擎運(yùn)行該文件,最后將運(yùn)行結(jié)果返回web服務(wù)器,web服務(wù)器將其返回瀏覽如果沒修改,則直接運(yùn)行。web服務(wù)器web應(yīng)用程序1web應(yīng)用程序2數(shù)據(jù)庫(kù)url地址及參數(shù)表單提交的請(qǐng)求請(qǐng)求交由應(yīng)用程序服務(wù)器分析處理處理的結(jié)果-web頁(yè)返回web服務(wù)器應(yīng)用程序服務(wù)器如需訪問數(shù)據(jù)庫(kù)則由dbms處理將web頁(yè)反饋至瀏覽器返回訪問結(jié)果服務(wù)器端圖4 b/s模型示意圖瀏覽器1瀏覽器2瀏覽器端web服務(wù)器web應(yīng)用程序1web應(yīng)用程序2數(shù)據(jù)庫(kù)url地址及參數(shù)表單提交的請(qǐng)求請(qǐng)求交由應(yīng)用程序服務(wù)器分析處理處理的結(jié)果-web頁(yè)返回web服務(wù)器應(yīng)用程序服務(wù)器如需訪問數(shù)據(jù)庫(kù)則
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 服務(wù)升級(jí)客戶合同(2篇)
- 2025年度旅游行業(yè)高級(jí)管理人才引進(jìn)合同
- 2025年度稅務(wù)局查賬財(cái)務(wù)清算合同
- 2025年度智能新能源汽車合作協(xié)議轉(zhuǎn)讓股份合同模板
- 二零二五年度合同主體變更補(bǔ)充協(xié)議的履行與變更
- 二零二五年度茶樓轉(zhuǎn)讓及茶藝養(yǎng)生館合作合同范本:茶樓與茶藝養(yǎng)生館合作轉(zhuǎn)讓協(xié)議
- 二零二五年度行政事業(yè)單位國(guó)有房屋租賃合同(安全風(fēng)險(xiǎn)評(píng)估)
- 二零二五年度訂車合同違約賠償標(biāo)準(zhǔn)與汽車行業(yè)信用體系建設(shè)協(xié)議
- 二零二五年度商業(yè)秘密侵權(quán)違約賠償合同樣本
- 二零二五年度旅游行業(yè)連帶擔(dān)保合同
- 2025年度高端商務(wù)車輛聘用司機(jī)勞動(dòng)合同模板(專業(yè)版)4篇
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
- 2025長(zhǎng)江航道工程局招聘101人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年黑龍江哈爾濱市面向社會(huì)招聘社區(qū)工作者1598人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 《妊娠期惡心嘔吐及妊娠劇吐管理指南(2024年)》解讀
- 【獨(dú)家揭秘】2024年企業(yè)微信年費(fèi)全解析:9大行業(yè)收費(fèi)標(biāo)準(zhǔn)一覽
- 1-1 擁抱夢(mèng)想:就這樣埋下一顆種子【2022中考作文最熱8主題押題24道 構(gòu)思點(diǎn)撥+范文點(diǎn)評(píng)】
- 職業(yè)暴露與防護(hù)
- 酒店行業(yè)客源渠道分析
- AVL-CRUISE-2019-整車經(jīng)濟(jì)性動(dòng)力性分析操作指導(dǎo)書
- 腸道醫(yī)學(xué)解剖和生理學(xué)
評(píng)論
0/150
提交評(píng)論