




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
大學(xué)計(jì)算機(jī)基礎(chǔ)湖南工業(yè)大學(xué)計(jì)算機(jī)與通信學(xué)院湖南工業(yè)大學(xué)計(jì)算機(jī)公共基礎(chǔ)課程系列第七章信息檢索與應(yīng)用基礎(chǔ)湖南工業(yè)大學(xué)計(jì)算機(jī)與通信學(xué)院湖南工業(yè)大學(xué)《大學(xué)計(jì)算機(jī)基礎(chǔ)》學(xué)習(xí)目標(biāo)1.了解信息檢索相關(guān)的概念。2.掌握信息檢索的方法和技術(shù)。3.了解常用中外數(shù)據(jù)庫檢索系統(tǒng)。4.了解如何利用綜合信息資源。重點(diǎn)
、難點(diǎn)*3W+1H學(xué)習(xí)法WhyWhereHowWhat什么是信息檢索和檢索系統(tǒng)?如何利用計(jì)算機(jī)資源進(jìn)行信息檢索?
*為什么要學(xué)習(xí)要信息檢索的相關(guān)方法和技巧?*信息檢索的應(yīng)用和強(qiáng)大功能體現(xiàn)在哪些方面?3W+1H
目錄一種多方互動(dòng)式學(xué)教系統(tǒng)(發(fā)明專利)7.1信息檢索概述一種多方互動(dòng)式學(xué)教系統(tǒng)(發(fā)明專利)7.2網(wǎng)絡(luò)信息檢索的方法和技巧一種多方互動(dòng)式學(xué)教系統(tǒng)(發(fā)明專利)一種多方互動(dòng)式學(xué)教系統(tǒng)(發(fā)明專利)7.5本章小結(jié)7.3常用數(shù)據(jù)庫檢索系統(tǒng)的介紹7.4信息資源的綜合利用信息檢索概述7.1.1問題提出信息檢索的定義What
所謂“信息檢索(InformationStorageandRetrieval)”,它是指將信息按照一定的方式組織和存儲(chǔ)起來,并能根據(jù)用戶的需要找出其中相關(guān)信息的過程。信息檢索系統(tǒng)(InformationRetrievalSystem)是指根據(jù)特定的信息需求而建立起來的一種有關(guān)信息搜集、加工、存儲(chǔ)和檢索的程序化系統(tǒng),其主要目的是為人們提供信息服務(wù)。
發(fā)展原理7.1.2信息檢索的發(fā)展歷程計(jì)算機(jī)信息檢索的發(fā)展過程:第一階段第二階段第三階段脫機(jī)批處理檢索聯(lián)機(jī)檢索
網(wǎng)絡(luò)化信息檢索7.1.3信息檢索的原理信息檢索的基本原理:
信息檢索廣義上講包括信息的存儲(chǔ)和檢索兩個(gè)方面:
信息的存儲(chǔ)過程是:將收集到的原始文獻(xiàn)進(jìn)行主題概念分析,根據(jù)一定的檢索語言抽取出主題詞、分類號(hào)以及文獻(xiàn)的其他特征進(jìn)行標(biāo)識(shí)或者寫出文獻(xiàn)的內(nèi)容摘要。然后再把這些經(jīng)過“前處理”的數(shù)據(jù)按一定格式輸入到計(jì)算機(jī)存儲(chǔ)起來。信息的檢索過程是:用戶對(duì)檢索課題加以分析,明確檢索范圍,弄清主題概念,并用系統(tǒng)檢索語言來表示,然后形成相應(yīng)的檢索標(biāo)識(shí)及檢索策略進(jìn)行檢索。7.2信息檢索的方法和技巧信息檢索的方法與技巧7.2.1信息檢索的方法1、布爾邏輯檢索
即運(yùn)用布爾邏輯算符對(duì)檢索詞進(jìn)行邏輯組配,來表達(dá)兩個(gè)概念之間的邏輯關(guān)系。布爾邏輯算符主要有:AND(*)、OR(+)、NOT(-)
如邏輯與:用運(yùn)算符AND或*連接檢索詞例1:查“有關(guān)計(jì)算機(jī)在圖書館中的應(yīng)用”的文獻(xiàn),
檢索式=計(jì)算機(jī)*圖書館例3:
查“玉米但不是甜玉米”方面的文獻(xiàn)。
檢索式=玉米—甜玉米例2:查“蘋果或梨”方面的文獻(xiàn)
檢索式=蘋果+梨2、位置算符檢索
在檢索式中,檢索詞的相對(duì)次序不同,表達(dá)的檢索意圖也不一樣,布爾邏輯運(yùn)算符有時(shí)難以表達(dá)某些檢索課題的確切提問要求,用詞間位置算符來限定和組配檢索詞,可彌補(bǔ)布爾邏輯算符造成誤檢的不足。
位置算符檢索就是利用一些特定的位置算符來表達(dá)檢索詞之間的位置關(guān)系,有的書上把這種檢索稱為原文檢索。常用的位置算符有:W、W/N、WITH、WITHIN、nW、PRE、N、NEAR、ADJ、nN、F、SAME。下面介紹使用頻率較高的幾個(gè)位置算符。(1)W、W/N、WITH、WITHIN:功能:兩詞相鄰,按輸入時(shí)順序排列(也有數(shù)據(jù)庫允許順序顛倒)表達(dá)式:Education(W)school或EducationWITHschool檢索結(jié)果:Educationschool;educationschools(2)SAME:功能:兩詞出現(xiàn)在同一自然句中,其詞序與詞量不受限制表達(dá)式:EducationSAMEschool檢索結(jié)果:Education和school兩詞出現(xiàn)在同一句子中即可3、截詞檢索截詞運(yùn)算符號(hào)有兩個(gè):“?、*”。它們?cè)诓煌到y(tǒng)中表示的含義不同。(1)有限截詞。即在檢索詞后后截幾個(gè)有限的字母,如名詞的單復(fù)數(shù),動(dòng)詞的詞尾變化等。原因:在英語詞匯中,一個(gè)詞可能有多種形態(tài),如詞的單、復(fù)數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如輸入computer??表示有0-2個(gè)字母變化,可檢出computer和computers。
輸入stud???表示截?cái)嗵幱?-3個(gè)字母變化,可檢出study,studies,tudied,studing。(2)無限截詞:在檢索詞后加一個(gè)“*“,表示該詞后可加任意個(gè)字符。使用無限截詞,所截詞根不能太短,否則會(huì)輸出許多無關(guān)文獻(xiàn),造成誤檢。如:computer*可檢出computers,computering,computered,computerization.(3)中間截詞:在檢索詞中間加一個(gè)或幾個(gè)?號(hào),主要解決一些英美拼寫不同,可簡化單復(fù)數(shù)形式不同的詞的輸入。
如:輸入wom?n可檢出woman,women4、詞組檢索
將一個(gè)詞組或短語用雙引號(hào)“”括起作為一個(gè)獨(dú)立運(yùn)算單元,進(jìn)行嚴(yán)格匹配,以提高檢索準(zhǔn)確度。如:“GlobalPositioningSystem”,只檢索出規(guī)定字段中包含完整詞組的記錄。5、字段限制檢索將檢索詞限定在某一字段中,檢索時(shí),計(jì)算機(jī)只對(duì)限定字段進(jìn)行運(yùn)算,以提高檢索效果。常用的檢索符號(hào)有:
in、=、<、>、≤、≥例:限定在某字段中檢索,后跟一個(gè)字段名,如appleinti(ti表示題目字段),表示命中文獻(xiàn)中“apple”一詞必須在題目中出現(xiàn)。6、括號(hào)檢索用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的做優(yōu)先運(yùn)算。
如比較(GPS
OR
GIS)AND
China
GPS
OR
GISAND
China總結(jié):在一個(gè)復(fù)雜的檢索式中,不僅可以有多個(gè)運(yùn)算符,也可以使用括號(hào)來指定運(yùn)算的優(yōu)先順序、以及體現(xiàn)概念的完整性。7.2.2網(wǎng)絡(luò)信息檢索的常用技術(shù)1.全文信息檢索技術(shù)
全文檢索是指以文檔的全部文本信息作為檢索對(duì)象的一種信息檢索技術(shù),目前搜索引擎基本上都采用全文檢索技術(shù)。
搜索引擎(searchengine)是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對(duì)信息進(jìn)行組織和處理后,將信息顯示給用戶。目前常用的搜索引擎有百度、google等。(1)百度搜索
2000年1月1日,公司創(chuàng)始人李彥宏、徐勇攜120萬美元風(fēng)險(xiǎn)投資,從美國硅谷回國,創(chuàng)建了百度公司?,F(xiàn)在百度已是全球最大的中文搜索引擎。
在瀏覽器的地址欄中輸入()即進(jìn)入百度搜索。
演示常用的搜索引擎(2)Google搜索引擎
Google成立的第一步始于1998年,Google創(chuàng)始人LarryPage和SergeyBrin在斯坦福大學(xué)的學(xué)生宿舍內(nèi)共同開發(fā)了全新的在線搜索引擎。在瀏覽器的地址欄中輸入/,即進(jìn)入Google首頁。(3)其他搜索引擎
除上述兩種最常用的搜索引擎外,還有其它一些搜索引擎:搜狗:/雅虎全能搜:/,搜索范圍涵蓋生活服務(wù)、黃頁、資訊、音樂、圖片、知識(shí)堂等領(lǐng)域。奇虎問答:是一個(gè)互助問答平臺(tái),網(wǎng)址為:/CNKI知識(shí)搜索:主要是學(xué)術(shù)方面的搜索,網(wǎng)址:/狗狗搜索:主要用于搜索影視、軟件,網(wǎng)址為:。2.多媒體信息檢索技術(shù)
多媒體信息資源是數(shù)字圖書館中獨(dú)具特色的一類信息資源,既包括數(shù)字化的文本信息、圖形與圖像信息,又包括數(shù)字化的視頻與音頻信息。當(dāng)詞語難以形象和準(zhǔn)確地描述視覺或聽覺感知時(shí),例如一種東西的式樣、顏色或紋理,用戶就需要利用媒體呈現(xiàn)的視覺和聽覺特性來查詢。多媒體信息檢索包括:(1)圖像信息檢索(2)音頻信息檢索(3)視頻信息檢索3.超文本和超媒體信息檢索技術(shù)
超媒體和超文本都以非線性方式組織信息,本質(zhì)上具有同一性。在超文本中,信息的主要形態(tài)是文本和圖形,以節(jié)點(diǎn)形式存儲(chǔ)信息,實(shí)現(xiàn)相關(guān)節(jié)點(diǎn)間的非線性、聯(lián)想式檢索。而超媒體是一種在一條條信息間創(chuàng)建明確關(guān)系的方法,它把超文本的含義擴(kuò)展為包含多媒體對(duì)象,而且能夠?qū)崿F(xiàn)音頻與視頻信號(hào)的同步。Internet上的WWW可以實(shí)現(xiàn)超文本和超媒體的信息檢索。4.智能信息檢索技術(shù)
數(shù)據(jù)庫系統(tǒng)是儲(chǔ)存某個(gè)學(xué)科大量事實(shí)的計(jì)算機(jī)系統(tǒng),隨著應(yīng)用的進(jìn)一步發(fā)展,存儲(chǔ)的信息量越來越大,因此解決智能檢索的問題具有了實(shí)際意義。
智能信息檢索系統(tǒng)應(yīng)具有如下的功能:
(1)能理解自然語言,允許用自然語言提出各種問題;(2)具有推理能力,能根據(jù)存儲(chǔ)的事實(shí),演繹出所需的答案;(3)系統(tǒng)具有一定的常識(shí)性知識(shí)來補(bǔ)充學(xué)科范圍的專業(yè)知識(shí)。系統(tǒng)根據(jù)這些常識(shí),將能演繹出更一般的答案來。
當(dāng)然,實(shí)現(xiàn)這些功能要應(yīng)用人工智能的方法。5.文本聚類技術(shù)
文本聚類是進(jìn)行文本信息檢索的重要方法,被廣泛應(yīng)用于網(wǎng)絡(luò)信息和檔案資料的篩選和檢索,聚類就是按照事物間的相似性進(jìn)行區(qū)分和分類的過程。國內(nèi)外的研究者提出了很多聚類算法,這些算法被用于眾多應(yīng)用領(lǐng)域,如模式識(shí)別、數(shù)據(jù)分析、圖象處理以及市場(chǎng)研究等。7.2.3
網(wǎng)絡(luò)信息檢索的策略與技巧網(wǎng)絡(luò)信息檢索存在的問題網(wǎng)絡(luò)信息檢索的技巧(檢索策略)什么是檢索策略?
為實(shí)現(xiàn)檢索目標(biāo)而制定的全盤計(jì)劃或方案。檢索策略的概念未完待續(xù)。。。。。。信息檢索策略常用數(shù)據(jù)庫檢索系統(tǒng)的介紹
本節(jié)通過對(duì)國內(nèi)外常用數(shù)據(jù)庫資源的介紹,讓大家對(duì)各個(gè)數(shù)據(jù)庫的收錄范圍、檢索功能、收錄核心期刊、檢索結(jié)果等情況進(jìn)行有效地分析和評(píng)價(jià),因而能夠確切地區(qū)分其特點(diǎn)和功能,進(jìn)行有目的地選用。7.3
常用數(shù)據(jù)庫檢索系統(tǒng)的介紹7.3.1常用中文檢索數(shù)據(jù)庫1、期刊檢索
CNKI(中國知識(shí)基礎(chǔ)設(shè)施工程)工程于1995年正式立項(xiàng),在政府及社會(huì)各界多方努力下,經(jīng)過10年建成了世界上全文信息量規(guī)模最大的“CNKI數(shù)字圖書館”,并全力建設(shè)《中國知識(shí)資源總庫》,以“中國知網(wǎng)()”為網(wǎng)絡(luò)出版與知識(shí)服務(wù)平臺(tái),通過產(chǎn)業(yè)化運(yùn)作,為全社會(huì)提供最豐富的信息資源和數(shù)字化學(xué)習(xí)平臺(tái)??梢酝ㄟ^中國知識(shí)基礎(chǔ)設(shè)施工程(CNKI)的網(wǎng)址:/,或者各高校圖書館的“數(shù)字資源”,進(jìn)入中國期刊全文數(shù)據(jù)庫并實(shí)施數(shù)據(jù)庫的檢索。如圖7-4所示,首次閱讀時(shí),要先下載閱讀器,如CAJViewer和AdobeReader等。演示圖7-4中國期刊全文數(shù)據(jù)庫檢索主頁
目前有很多電子圖書的檢索,下面先介紹一種目前最方便、也頗受爭(zhēng)議的電子圖書——google電子圖書。電子圖書是指以數(shù)字代碼方式將圖、文、聲、像等信息存儲(chǔ)在磁、光、電介質(zhì)上,通過計(jì)算機(jī)或類似設(shè)備使用,并可復(fù)制發(fā)行的大眾傳播體。2、電子圖書檢索
方法舉例
進(jìn)入google電子圖書很容易,它無需任何閱讀器,即能在IE上閱讀。在IE地址欄上網(wǎng)址:/即進(jìn)入。
如圖所示。舉例:查詢關(guān)于EXCEL這本書。方法:在搜索欄中輸入“excel”,然后單擊“搜索圖書”,則搜索出如圖所示,選擇感興趣的圖書即可。3、中國學(xué)位論文文摘檢索數(shù)據(jù)庫(CDDB)
收錄了自1977年恢復(fù)高考以來我國自然科學(xué)、哲學(xué)、經(jīng)濟(jì)、管理、語言、文學(xué)等領(lǐng)域博士、博士后及碩士研究生論文,其中文摘已達(dá)40余萬篇,它不但是我國最早建設(shè)的全國性學(xué)位論文數(shù)據(jù)庫,而且也是我國目前收錄學(xué)位論文信息最多、最全的數(shù)據(jù)庫。(1)中國學(xué)位論文全文數(shù)據(jù)庫檢索介紹先登錄某圖書館(清華)主頁-數(shù)據(jù)庫-中文數(shù)據(jù)庫-萬方數(shù)據(jù)資源系統(tǒng)-學(xué)位論文全文,如圖所示。(2)其他中文學(xué)位論文網(wǎng)站①CNKI中國優(yōu)秀博碩士論文全文數(shù)據(jù)庫:至2005年8月止,累積博碩士學(xué)位論文全文文獻(xiàn)近25萬篇。文摘網(wǎng)上可免費(fèi)檢索/②國家科技圖書文獻(xiàn)中心學(xué)位論文:1984-,收藏我國高等院校、研究生院及研究院所的碩博士論文和博士后報(bào)告,涉及自然科學(xué)各專業(yè)領(lǐng)域,并兼顧人文社科,目前包含50余萬條記錄,每年新增6萬余條記錄,中文學(xué)位論文663796條(文摘),外文74350(文摘)/nstl/user/ywjsdg.jsp③國家圖書館學(xué)位論文:1981,國家圖書館是教育部指定的全國博士論文、博士后研究報(bào)告收藏機(jī)構(gòu),并收藏我國海外留學(xué)生的部分博士論文。7.3.2三大外文檢索數(shù)據(jù)庫1、EI數(shù)據(jù)庫檢索(1)簡介
美國《工程索引》(TheEngineeringIndex)簡稱EI,創(chuàng)刊于1884年,由美國工程信息公司編輯出版。所報(bào)道的文獻(xiàn)學(xué)科覆蓋面廣,涉及工程技術(shù)領(lǐng)域各個(gè)方面。經(jīng)過100多年的發(fā)展,《工程索引》已經(jīng)成為全球工程技術(shù)領(lǐng)域最著名的檢索系統(tǒng),同時(shí)它也是世界引文分析和文獻(xiàn)評(píng)價(jià)的四大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年高中歷史課時(shí)作業(yè)13宗教改革的歷史背景新人教版選修1
- 第三章 算法的基礎(chǔ)知識(shí) 教學(xué)設(shè)計(jì)-高中信息技術(shù)必修1 數(shù)據(jù)與計(jì)算 教學(xué)設(shè)計(jì)+教學(xué)設(shè)計(jì) (粵教版2019)
- 10 唐雎不辱使命2024-2025學(xué)年九年級(jí)下冊(cè)語文同步教案(統(tǒng)編版)標(biāo)簽標(biāo)題
- 第五課互聯(lián)網(wǎng)接入 教學(xué)設(shè)計(jì) 2024-2025學(xué)年浙教版(2023)初中信息技術(shù)七年級(jí)上冊(cè)
- 25《灰雀》(教學(xué)設(shè)計(jì))2024-2025學(xué)年部編版三年級(jí)語文上冊(cè)
- 2025年鋁合金預(yù)拉伸厚板和蒙皮鋁合金板項(xiàng)目合作計(jì)劃書
- 2025-2031年中國施工升降機(jī)防墜安全器行業(yè)市場(chǎng)調(diào)查研究及發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- Unit 6 Useful numbers Period 2(教學(xué)設(shè)計(jì))-2024-2025學(xué)年人教PEP版(2024)英語三年級(jí)上冊(cè)
- 5《一個(gè)豆莢里的五粒豆》(第二課時(shí))教學(xué)設(shè)計(jì)-2024-2025學(xué)年四年級(jí)上冊(cè)語文統(tǒng)編版
- 測(cè)量學(xué)實(shí)習(xí)報(bào)告格式 測(cè)量學(xué)實(shí)習(xí)報(bào)告模板
- 【我國農(nóng)村數(shù)字普惠金融的發(fā)展問題及完善策略12000字(論文)】
- 重慶建設(shè)-花籃拉桿式懸挑腳手架工藝標(biāo)準(zhǔn)(試行)
- 動(dòng)物疫病傳染病防控培訓(xùn)制度
- DL-T-5115-2016混凝土面板堆石壩接縫止水技術(shù)規(guī)范
- 數(shù)據(jù)驅(qū)動(dòng)歷史研究
- 全國川教版信息技術(shù)八年級(jí)下冊(cè)第二單元第1節(jié)《設(shè)計(jì)文創(chuàng)作品》教學(xué)設(shè)計(jì)
- 危貨押運(yùn)員考試答案(題庫版)
- QCT267-2023汽車切削加工零件未注公差尺寸的極限偏差
- 2022-2023學(xué)年浙江省紹興市高一(下)期末數(shù)學(xué)試卷含答案
- 初中英語七選五經(jīng)典5篇(附帶答案)
- 租房協(xié)議書 租房協(xié)議書范本
評(píng)論
0/150
提交評(píng)論