《信息素養(yǎng)概論(第三版)》課件第5章 信息檢索技術(shù)_第1頁
《信息素養(yǎng)概論(第三版)》課件第5章 信息檢索技術(shù)_第2頁
《信息素養(yǎng)概論(第三版)》課件第5章 信息檢索技術(shù)_第3頁
《信息素養(yǎng)概論(第三版)》課件第5章 信息檢索技術(shù)_第4頁
《信息素養(yǎng)概論(第三版)》課件第5章 信息檢索技術(shù)_第5頁
已閱讀5頁,還剩29頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

《信息技術(shù)與人工智能》第五章信息檢索技術(shù)第5章信息檢索技術(shù)目錄城市全景搜索1畢業(yè)論文檢索--數(shù)字化期刊全文數(shù)據(jù)庫檢索2目錄城市全景搜索1畢業(yè)論文檢索--數(shù)字化期刊全文數(shù)據(jù)庫檢索2第5章信息檢索技術(shù)提問什么是信息檢索?信息檢索(InformationRetrieval)是指信息按一定的方式組織起來,并根據(jù)用戶的需要找出有關(guān)信息的過程和技術(shù)。狹義的信息檢索就是信息檢索過程的后半部分,即從信息集合中找出所需信息的過程,也就是人們常說的信息查尋(InformationSearch或InformationSeek)。任務(wù)1城市全景搜索任務(wù)分析有時你會不會覺得雖然知道上網(wǎng),可是上網(wǎng)找需要的東西還是有些不得心應(yīng)手,甚至因?yàn)榫W(wǎng)絡(luò)資源太多而不知從何下手?湖南狀元令狐沖今年考上北京大學(xué),剛到北京,人生地不熟,對北京的飲食文化、交通旅游等都是一無所知。如何能夠在短時間內(nèi)讓令狐沖對北京的整體情況有個相對全面地了解,以便今后更好地在北京學(xué)習(xí)和生活呢?定義搜索引擎(searchengine)是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從因特網(wǎng)上搜集信息,在對信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。谷歌(Google)搜索引擎、百度搜索引擎、搜狗搜索引擎Ask(,又名askjeeves)dmoz(,又名ODP)search()認(rèn)識搜索引擎常見搜索引擎其他搜索引擎網(wǎng)址為:特點(diǎn):擁有龐大的數(shù)據(jù)庫,提供全面的結(jié)果信息,例如,文章的日期,大小等等??伤阉魉芯W(wǎng)站,快速有效的搜索到自己所需內(nèi)容是一個快速、強(qiáng)大的搜索引擎,用戶界面簡潔美觀。具有一定的大寫、名詞識別能力的快速搜索引擎谷歌(Google)搜索引擎網(wǎng)址為:百度搜索引擎擁有目前世界上最大的中文搜索引擎,總量超過3億頁以上,并且還在保持快速的增長。百度搜索引擎具有高準(zhǔn)確性、高查全率、更新快以及服務(wù)穩(wěn)定的特點(diǎn),在中文搜索方面,甚至比Google更勝一籌百度搜索引擎網(wǎng)址為:/特點(diǎn):全球首個第三代互動式中文搜索引擎。搜狗的其他搜索產(chǎn)品各有特色:音樂搜索小于2%的死鏈率,圖片搜索獨(dú)特的組圖瀏覽功能,新聞搜索及時反映互聯(lián)網(wǎng)熱點(diǎn)事件的看熱鬧首頁,地圖搜索的全國無縫漫游功能搜狗搜索引擎是全球第三代互動式搜索引擎,支持微信公眾號和文章搜索、知乎搜索、英文搜索及翻譯等搜狗搜索引擎()5個基本原則原則1:通常情況下,使用名詞做關(guān)鍵詞;原則2:搜索式中可以使用2-3個關(guān)鍵詞;原則3:搜索式中可以使用同義詞、近義詞或相關(guān)詞;原則4:根據(jù)搜索結(jié)果,及時調(diào)整檢索策略;原則5:搜索通常不是一蹴而就的,而是一個多步驟的過程,需要逐步接近目標(biāo)。關(guān)鍵詞的選取與檢索4-1對北京的全景如旅游、交通、飲食、文化等有個粗略的了解①可以選擇“北京”作為第一個考慮的關(guān)鍵詞,然后考慮“全景”作為第二個關(guān)鍵詞②點(diǎn)擊【百度一下】按鈕,搜索結(jié)果如圖關(guān)鍵詞的選取和搜索4-2對北京的全景如旅游、交通、飲食、文化等有個粗略的了解這時根據(jù)原則四,調(diào)整搜索策略。此時把“全景”這個關(guān)鍵詞換一下,換成它的近義詞“概況”試試關(guān)鍵詞的選取和搜索4-3關(guān)鍵詞的選取和搜索4-4想對北京的全景如旅游、飲食、文化等有個較為全面和詳細(xì)的了解和認(rèn)識①根據(jù)原則五,此時搜索任務(wù)分步驟進(jìn)行。北京的全景主要分為旅游、美景、飲食、文化等幾個方面,分為三個子任務(wù)進(jìn)行搜索。確定三個子任務(wù)的關(guān)鍵式分別為“北京旅游”、“北京飲食”、“北京文化”。②在百度搜索引擎搜索欄中分別搜索“北京旅游”、“北京飲食”、“北京文化”四個搜索式。提問什么是關(guān)鍵詞?在搜索引擎中,關(guān)鍵詞是用戶在搜索引擎上尋找內(nèi)容時輸入的詞語、詞組,是搜索應(yīng)用的重要因素。這些關(guān)鍵詞是用戶認(rèn)為與其搜索信息相關(guān)的短語,往往是產(chǎn)品相關(guān)詞、主題相關(guān)詞,最能體現(xiàn)所尋找信息的詞語。簡單的說,關(guān)鍵詞就是網(wǎng)站中出現(xiàn)頻率較高,與網(wǎng)站主題最相關(guān)的詞語。關(guān)鍵詞可以使用單個詞,也可以是由幾個詞語組成的詞組。用戶尋找信息搜索的詞、公司的產(chǎn)品信息相關(guān)的詞,這些都可以說是關(guān)鍵詞。小結(jié)信息的選取和整合的基本原則原則1:信息的相關(guān)性。該信息和搜索任務(wù)的相關(guān)程度。例如在百度搜索欄中輸入北京文化時,出現(xiàn)的百度文庫中的北京文化介紹和搜索任務(wù)貼近,可以選取。原則2:信息的權(quán)威性。指信息真實(shí)性或者說信息的可靠性程度。如搜索北京旅游時,來源于百度旅游網(wǎng)的條目,點(diǎn)擊第一個條目顯示網(wǎng)頁內(nèi)容如圖所示,該網(wǎng)站相對比較正規(guī),信息是相對可靠的信息的選取與整合2-1信息的選取與整合2-2信息的選取和整合的基本原則原則3:信息的完整性。信息的完整性是搜索到的某條信息是否符合“搜索任務(wù)”或至少符合“能夠相對獨(dú)立地完成一部分搜索任務(wù)”

原則4:信息的實(shí)效性。這里講的信息的實(shí)效性是指信息是否具有時間效力的訓(xùn)練目的利用搜索引擎搜索自己家鄉(xiāng)的全景;學(xué)會關(guān)鍵字的選取訓(xùn)練內(nèi)容利用網(wǎng)絡(luò),借助baidu與谷歌二種搜索引擎較為全面地搜索出家鄉(xiāng)的全景(例如旅游、飲食、文化等)?!倔w驗(yàn)步驟】①根據(jù)搜索任務(wù),選擇一種搜索引擎;②分析搜索任務(wù),合理選取關(guān)鍵詞進(jìn)行搜索;③觀察搜索結(jié)果,科學(xué)選取信息,并對信息進(jìn)行歸納整理得出結(jié)果。任務(wù)體驗(yàn)?zāi)夸洺鞘腥八阉?畢業(yè)論文檢索--數(shù)字化期刊全文數(shù)據(jù)庫檢索2第5章信息檢索技術(shù)認(rèn)識數(shù)字化期刊全文數(shù)據(jù)庫1.中國期刊網(wǎng)全文數(shù)據(jù)庫2.維普中文科技期刊數(shù)據(jù)庫3.萬方數(shù)據(jù)庫資源系統(tǒng)數(shù)字化期刊任務(wù)2畢業(yè)論文檢索--數(shù)字化期刊全文數(shù)據(jù)庫檢索

《中國期刊網(wǎng)全文數(shù)據(jù)庫》(簡稱中國知網(wǎng)CNKI或“知網(wǎng)”)是由清華同方光盤股份有限公司、光盤國家工程研究中心和中國學(xué)術(shù)期刊(光盤版)電子雜志社共同研制出版的綜合性全文數(shù)據(jù)庫。中國知網(wǎng)的資源需安裝其專門的閱讀器CAJViewer閱讀或PDF閱讀器。網(wǎng)址為:/,知網(wǎng)的主頁如圖所示中國期刊網(wǎng)全文數(shù)據(jù)庫維普中文科技期刊數(shù)據(jù)庫《中文科技期刊數(shù)據(jù)庫》(簡稱“維普”)由科技部西南信息中心主辦,重慶維普資訊有限公司制作。其前身為《中文科技期刊篇名數(shù)據(jù)庫》。維普網(wǎng)址:/,維普主頁如圖所示。萬方數(shù)據(jù)庫資源系統(tǒng)數(shù)字化期刊萬方數(shù)據(jù)資源系統(tǒng)是建立在因特網(wǎng)上的大型科技、商務(wù)信息平臺,內(nèi)容涉及自然科學(xué)和社會科學(xué)各個專業(yè)領(lǐng)域。包含的數(shù)據(jù)庫主要有:(1)中國學(xué)位論文文摘數(shù)據(jù)庫(2)數(shù)字化期刊全文數(shù)據(jù)庫(3)中文會議論文全文數(shù)據(jù)庫萬方數(shù)據(jù)庫網(wǎng)址為:/index.html信息檢索中的需求表達(dá)5-1

1.設(shè)置信息檢索范圍:用戶檢索時,可以限定到某一個特殊的范圍,根據(jù)具體的檢索需求來進(jìn)行選擇例如:如果需要了解人工智能最新的技術(shù),我們可以選定【工程科技Ⅰ輯】、【工程科技Ⅱ輯】、【信息科技】這三個范圍:

2.檢索方式:在標(biāo)準(zhǔn)檢索中,將檢索過程規(guī)范為三個步驟:第一步:輸入主題、篇名、關(guān)鍵詞、作者、單位等內(nèi)容檢索條件;第二步:限定發(fā)表時間、文獻(xiàn)來源、支持基金等檢索控制條件;第三步:對檢索結(jié)果進(jìn)行分組分析和排序分析,反復(fù)篩選修正檢索條件得到最終結(jié)果。信息檢索中的需求表達(dá)5-2填寫文獻(xiàn)內(nèi)容的基本步驟如下:第一步:在下拉框中,選擇一種文獻(xiàn)類型,在其后的檢索框中輸入一個關(guān)鍵字;第二步:若一個檢索項(xiàng)需要兩個關(guān)鍵字,可選擇“并含”、“或含”、“不含”的關(guān)系,在第2個檢索框中輸入一個關(guān)鍵字;第三步:單擊檢索項(xiàng)前的“+”號,添加另一個文獻(xiàn)內(nèi)容關(guān)鍵字;第四步:添加完所有檢索項(xiàng)后,單擊“檢索”,進(jìn)行檢索。信息檢索中的需求表達(dá)5-33.高級檢索:高級檢索的功能更為豐富,可將在初級檢索中需要通過二次檢索完成的操作一次完成,高級檢索條件界面如圖所示高級檢索特有的功能是多項(xiàng)雙詞邏輯組合檢索、雙詞頻控制??梢詥螕簟拜斎霗z索條件”下的“+”和“-”來控制增加或減少檢索框,最多有7個檢索字段。通過“并且”、“或者”和“不含”進(jìn)行組配,三種運(yùn)算的優(yōu)先級相同,并按照先后順序進(jìn)行組合信息檢索中的需求表達(dá)5-4

4.專業(yè)檢索:專業(yè)檢索的功能比高級檢索功能更為強(qiáng)大,但要使用邏輯運(yùn)算符和關(guān)鍵詞構(gòu)造檢索方式進(jìn)行檢索,一般用于圖書情報(bào)人員查新及信息分析等工作時使用,單擊菜單命令“專業(yè)檢索”按鈕,打開如圖所示的專業(yè)檢索界面信息檢索中的需求表達(dá)5-5假設(shè)你是一名大三學(xué)生,需要結(jié)合本人的實(shí)習(xí)工作撰寫一篇畢業(yè)論文,在撰寫論文前,需了解畢業(yè)論文撰寫的主要方法、前沿技術(shù)、論文格式等等。因此需要下載相關(guān)文獻(xiàn)以便參考需求分析使用中國知網(wǎng)查找畢業(yè)論文參考文獻(xiàn)5-1(1)進(jìn)入學(xué)校圖書館主頁,單擊菜單【數(shù)字圖書館】|【中國知網(wǎng)CNKI】,打開如圖所示的中國知網(wǎng)CNKI訪問指南,單擊網(wǎng)址

即可打開中國知網(wǎng)主頁。溫馨提示①如果直接輸入中國知網(wǎng)主頁

,由于權(quán)限限制,檢索到的數(shù)據(jù)可能導(dǎo)致不能下載。②如果在校外訪問圖書館主頁,進(jìn)入中國知網(wǎng)主頁前,需先使用【VPN校外訪問系統(tǒng)】,先登錄vpn;退出非我校賬號;使用賬號密碼登錄:gdkjzy密碼:kjzy進(jìn)入中國知網(wǎng)主頁。使用中國知網(wǎng)查找畢業(yè)論文參考文獻(xiàn)5-2使用中國知網(wǎng)查找畢業(yè)論文參考文獻(xiàn)5-3(2)根據(jù)你需要檢索的學(xué)科領(lǐng)域和專業(yè),首先設(shè)置檢索范圍,也可以直接輸入關(guān)鍵字進(jìn)行檢索。如你是大數(shù)據(jù)專業(yè)的學(xué)生,從事大數(shù)據(jù)分析崗位,可以在【關(guān)鍵詞】輸入“大數(shù)據(jù)分析”關(guān)鍵字?;蜻M(jìn)一步細(xì)化,輸入“大數(shù)據(jù)分析工具”、“大數(shù)據(jù)分析方法”、“大數(shù)據(jù)分析平臺”、“大數(shù)據(jù)分析技術(shù)”、“大數(shù)據(jù)分析算法”等關(guān)鍵詞。這是輸入“大數(shù)據(jù)分析技術(shù)”,彈出如圖所示的文獻(xiàn)列表。使用中國知網(wǎng)查找畢業(yè)論文參考文獻(xiàn)5-4(3)單擊文獻(xiàn)列表中的具體文獻(xiàn),如單擊“大數(shù)據(jù)分析技術(shù)在金融風(fēng)險(xiǎn)控制中的應(yīng)用研究”,彈出“大數(shù)據(jù)分析技術(shù)在金融風(fēng)險(xiǎn)控制中的應(yīng)用研究”的簡要介紹,如作者、摘要、關(guān)鍵詞、中圖分類號;最底部有【HTML閱讀】、【CAJ下載】、【PDF下載】三個具體的下載按鈕,如果直接查閱,點(diǎn)擊【HTML閱讀】;一般選擇【CAJ下載】,下載CAJ文件;選擇【PDF下載】,下載PDF文件。溫馨提示(1)CAJ文件是CNKI提供的一種文件格式,如果下載了CAJ文件,需要在知網(wǎng)頁面上提供下載的CAJView軟件打開,PDF文件可以使用AdobeAcrobat軟件打開。(2)我們也可以輸入篇名、作者、單位、文獻(xiàn)來源等內(nèi)容進(jìn)行檢索,步驟基本類似。(3)如果我們需要檢索外文文獻(xiàn),可以在列表中切換到【外文文獻(xiàn)】,即可下載外文文獻(xiàn)。(4)維普中文科技期刊數(shù)據(jù)庫、萬方數(shù)據(jù)庫資源系統(tǒng)數(shù)字化期刊和中國知網(wǎng)CNKI檢索方法基本類似,在此不再重復(fù)。使用中國知

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論