信息檢索重點_第1頁
信息檢索重點_第2頁
信息檢索重點_第3頁
信息檢索重點_第4頁
信息檢索重點_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信息的基本概述一信息:1.信息的特征(5個普遍性與客觀性、依存性與傳遞性、可知性與共享型、可擴充性與可壓縮性、時效性與滯后性)數(shù)據(jù)信息、知識、文獻、情報、智慧 DIKW看截圖(匹配過程)進而滿足用的信息需求的過程二信息資源(定義信息資源是人類在認識世界和改造世界過程中產(chǎn)生、整理、記錄的有用信息的集合)1.信息資源的類型按時間的產(chǎn)生順序先導信息資源、即時信息資源、滯后信息資源按傳播形式口頭信息資源、文獻信息資源、實物信息資源按載體形式書寫型、印刷型、縮微型、視聽型、數(shù)字型(十大科技情報源)標準文獻、技術(shù)檔案、產(chǎn)品資料、政府出版物按加工深度(零次一次,二次)一次文獻知識的首次固化期刊論文、標準、報告、文獻等:是依據(jù)作者本人的科研成果而撰寫的首次記錄科研成果的原始文獻二次文獻檢索工具題錄,目錄,書錄,文摘,索引:是對分散的無組織的一次文獻進行加工整理、壓縮、提煉、簡化、整理的產(chǎn)物三次文獻直接提供答案百科全書,詞典,手冊:對大量一次文獻經(jīng)過綜合、分析、提煉撰寫而成零次文獻實驗數(shù)據(jù),觀察記錄,手稿等:是形成一次文獻之前的信息、知識、情報、即未公開記錄或未公開與社會的最原始的文獻,或沒有正式的發(fā)表的文字材料信息資源的特點能夠重復使用、具有整合性、具有流動性、信息資源的作用運營成本三信息社會(概述與內(nèi)容包括哪三類資源)信息素養(yǎng)的三個層次:基礎(chǔ)性、自我滿足性、自我實現(xiàn)性信息素養(yǎng)((定義美國圖書館協(xié)會:能夠有效的識別、獲取、評價、和利用所需要的信息)信息素養(yǎng)的內(nèi)涵:興趣的動力和源泉信息知識信息的基本知識(相關(guān)理論、知識與方法,信息技術(shù)和知識(信息技術(shù)原理)等信息能力獲取、理解、處理、表達、評價、利用、創(chuàng)新等信息法律與道德(又稱信息倫理)了解利用信息所涉及的經(jīng)濟、法律和社會問題,合理、合法地獲取和利用信息第二章信息檢索緒論一信息檢索概述信息檢索概念廣義:存儲和查詢將信息按一定的方式組織和存儲,并根據(jù)信息用戶需求查找所需信息的過程俠義:查詢從信息集合中查詢信息用戶所需信息的過(查詢出所需要的信息的過程)信息檢索原理信息需求與信息集合:匹配檢索者將檢索提問式與存儲與檢索系統(tǒng)的文獻標引詞進行匹配對比,取得一致性即為最符合要求的結(jié)果信息檢索類型信息檢索內(nèi)容對象數(shù)據(jù)、事實、文獻信息檢索組織方式全文、超文本、超媒體信息檢索的手段手工與計算機信息檢索步驟6個獲取原始文獻。信息檢索模型布爾邏輯模型只有0和1 要么有要么就沒優(yōu)點:形式簡潔,結(jié)構(gòu)簡單出的文獻過度或過少向量空間模型余弦值(cos)考慮索引詞在文檔中的詞頻和權(quán)重、TF-TDF出現(xiàn)的次數(shù)成反比式根據(jù)文獻與查詢之間的相似度對文獻進行排序不足:標引詞被認為在彼此之間相互獨立概率模型優(yōu)點:從理論上來講,文獻根據(jù)他們相關(guān)的概率按遞減的順序排列缺點:需要最初把文獻分成相關(guān)的集合和不相關(guān)的集合二信息檢索系統(tǒng)結(jié)構(gòu)物理結(jié)構(gòu)硬件資源、軟件數(shù)據(jù)庫(結(jié)構(gòu)字段(最小的存儲單元)...記錄(很多個字段組成的)...文檔.()..數(shù)據(jù)庫、倒排文檔(按文獻的內(nèi)外部特征等檢索標識)倒排文檔是以記錄中的字段作為處理和檢索單元邏輯結(jié)構(gòu)系統(tǒng)所包括的功能或子系統(tǒng)及相互關(guān)系信息存儲子系統(tǒng)標引子系統(tǒng)信息查詢子系統(tǒng)三信息檢索語言外部特征內(nèi)容特征分類語言:國內(nèi):中圖法、22)國外:主題語言:標題詞、單元詞、敘詞、關(guān)鍵詞四信息檢索系統(tǒng)的評價(信息檢索系統(tǒng)含義:具有信息存儲和信息查詢功能的一類信息服務(wù)設(shè)施類型:按照信息存儲與檢索的設(shè)備劃分書本式、卡片式、穿孔式、縮微式、計算機化系統(tǒng)、網(wǎng)絡(luò)檢索系統(tǒng)按照檢索功能劃分:文獻檢索、數(shù)據(jù)庫管理、自動問答、管理信息、決策支持)效率:時間開銷、空間開銷、響應速度效果:查準率、查全率、誤檢率、漏檢率其他指標第三章信息檢索方法與技術(shù)基本方法布爾邏輯運算andornot(not作用可以縮小檢索范圍,提高查準率)優(yōu)先級or>and>not>()截詞符*?前中后前后截斷字段如:la(language),ab(abstract)精確檢索y”位置檢索次序位置不變with、nWith次序位置不限near、nNear其他檢索:(概念對主題詞或副主題詞的下位詞一起檢索)加權(quán)檢索(概念定量檢索從量的方面對檢索詞之間的組配關(guān)系加以限制和表示;作用:縮小檢索范圍,提高查準率)二次檢索將本次檢索與上次檢索進行邏輯“與”運算(縮小檢索范圍,提高查準率)主要技術(shù)全文、多媒體、超文本、智能檢索、可視化、跨語言、文本聚類擴大當檢索結(jié)果為0或檢索結(jié)果太少時,就需要擴大檢索范圍在檢索詞選擇方面可以使用布爾邏輯“或”連接表達某一概念的近義詞,同義詞或相關(guān)詞減少使用布爾邏輯and,取消某些限制,使用分類號進行族性檢索使用截詞檢索利用某些檢索工具提供的“自動擴檢”功能使用原搜索引擎使用信息資源整合平臺檢索來自于不同提供方的各種數(shù)據(jù)庫縮小檢索結(jié)果太多或檢索不相關(guān)使用邏輯與連接更多關(guān)鍵詞使用位置限制檢索使用字段限制檢索使用短語檢索進行精確檢索限制查詢范圍第四章搜索引擎搜索引擎概述概念(是一種WEB上的軟件系統(tǒng),是一定策略在WEBWEB信息查詢服務(wù))搜索引擎的系統(tǒng)結(jié)構(gòu):檢索器:針對具體搜索引擎所配置的專業(yè)檢索程序包用戶接入索引器索引數(shù)據(jù)庫 看截圖工作原理:匹配:用戶需求與網(wǎng)絡(luò)信息資源基本分類信息采集方式人工、機器人 看ppt信息內(nèi)容組織關(guān)鍵詞、目錄式信息資源范圍綜合性、專業(yè)性信息搜索功能獨立性、元搜索引擎(區(qū)別,前者有獨立數(shù)據(jù)庫)國內(nèi)百度國外必應谷歌3國內(nèi)百度、讀秀國外谷歌學術(shù)(思謀學術(shù),必應學術(shù)第五章國內(nèi)重要信息檢索系統(tǒng)(常用中文數(shù)據(jù)庫)重點;電子資源概念是一種數(shù)字化的文獻,以數(shù)據(jù)庫形式存在服務(wù)方式、(專線方式、本地鏡像方式、Internet方式)瀏覽與檢索常見問題中文全文數(shù)據(jù)庫的各自優(yōu)缺點清華同方、維普、萬方優(yōu)點:提供·1全文字段的檢索,有助于文獻的查全都可以進行簡單檢索、二次檢索、高級檢索等,檢索策略可以保存,編輯免去了檢索書目數(shù)據(jù)庫后還得費力去獲取全文的麻煩缺點:計算機內(nèi)必須安裝全文瀏覽器pdf,html常用的中文全文數(shù)據(jù)庫中文全文數(shù)據(jù)庫知網(wǎng):普通檢索、高級檢索、出版物檢索、專業(yè)檢索、文獻可視化分析、文獻題錄導出功能維普、萬方國家圖書館中國高等教育文獻保障系統(tǒng)(CALIS)國家科技圖書文獻中心(NSTL)中國人民大學復印報刊資料第六章國外重要信息檢索系統(tǒng)(常見外文數(shù)據(jù)庫)外文全文數(shù)據(jù)庫每年更新碩博士論文:webofscience(內(nèi)容:SCISSCIA&HCI.功能:布爾、截詞、字段、位置、二次、文獻題導出、文獻分析基本檢索、高級檢索、其他檢索)、醫(yī)學數(shù)據(jù)庫:PubMed、圖書情報專業(yè)文摘型數(shù)據(jù)庫LISA、LISTA其他數(shù)據(jù)庫researchgate、谷歌學術(shù) DOI:sci-hub第七章專利信息檢索重難點:專利、商標、學位、會議論文檢索1專利信息數(shù)據(jù)庫國內(nèi)知網(wǎng)、萬方等國外德溫特政府網(wǎng)站國內(nèi)國家知識產(chǎn)權(quán)局、國家科技圖書文獻中心國外世界知識產(chǎn)權(quán)組織、美國專利商標局、歐洲專利局、日本特許廳搜索引擎國內(nèi)Soopat、知創(chuàng)大為innojoy國外Google商標數(shù)據(jù)庫legalforce政府網(wǎng)站國內(nèi)中國知網(wǎng)產(chǎn)權(quán)局、中國商標局 國外:全球品牌數(shù)據(jù)庫、美國專利商標局國內(nèi)大陸:數(shù)據(jù)庫 知網(wǎng)、萬方、中國科學院學位論文數(shù)據(jù)庫政府網(wǎng)站CALIS 中國高等教育文獻保障系統(tǒng) NSTL國家科技圖書文獻中心NLC國家圖書館港臺:香港香港大學論文在線、香港科技大學電子學位論文數(shù)據(jù)庫、博碩論文收藏臺灣eThesys國外、NDLTD網(wǎng)絡(luò)化的博碩士論文數(shù)字圖書館第八章多媒體信息檢索基本內(nèi)涵概念CBR:算,查詢和返回用戶所需信息,通過與用戶之間的反饋,不斷優(yōu)化、調(diào)整顯示結(jié)果的過程流程特征提取、元數(shù)據(jù)描述、索引數(shù)據(jù)庫、相似度匹配、查詢與反饋、優(yōu)化與調(diào)整原理(了解)類型基于文本的多媒體信息檢索于文本的信息檢索類型:手工或自動:OCR技術(shù),語音視頻技術(shù)、信息抽取技術(shù)基于內(nèi)容的多媒體信息檢索類型:基于內(nèi)容的圖像信息檢索顏色特征、紋理特征、形狀特征、空間關(guān)系和組合特基于內(nèi)容的音頻信息檢索 語音、音樂基于內(nèi)容的視頻檢索基于幀、基于視頻語義、基于運動特征第九章開放存取廣義俠義實現(xiàn)途徑OA期刊與OA知識庫前者基于現(xiàn)象層面的描述性研究,后者基于用戶層面的解釋性研究預印本網(wǎng)站:國內(nèi)中國科技論文在線、NSTL、中科院國外ArXiv、生物醫(yī)藥類bioxivbiomedicalpubmed、瑞典DOAJ機構(gòu)庫:國內(nèi)武大、南京大學、中科院、人大、大連理工等國外麻省理工等意義影響作用:科

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論