文獻信息檢索與科技論文寫作PPT課件_第1頁
文獻信息檢索與科技論文寫作PPT課件_第2頁
文獻信息檢索與科技論文寫作PPT課件_第3頁
文獻信息檢索與科技論文寫作PPT課件_第4頁
文獻信息檢索與科技論文寫作PPT課件_第5頁
已閱讀5頁,還剩386頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2020/5/18,1,文獻信息檢索與科技論文寫作,2020/5/18,2,2科技論文的基本內(nèi)容,2.1標題及層次標題2.2署名及作者單位2.3摘要2.4關(guān)鍵詞2.5中圖分類號2.6前(引)言(概述)2.7正文2.8結(jié)論和建議2.9致謝2.10參考文獻2.11附錄、注釋,2020/5/18,3,2.1標題及層次標題,標題,又稱文題、題目、總標題(以區(qū)別層次標題),是論文的總綱,是能反映論文最重要的特定內(nèi)容的最恰當、最簡明的詞語的邏輯組合。,2020/5/18,4,2.1.1標題的一般要求,準確得體標題應(yīng)準確表達論文的中心內(nèi)容,恰如其分地反映論文涉及的范圍和深度,不應(yīng)使用籠統(tǒng)、泛指性很強的詞語和華而不實的辭藻。常見的問題:題目過大過于一般化,不能充分反映論文內(nèi)容的特點(題目過大必然一般化。應(yīng)盡量反映論文的特點,如新理論、新方(算)法、新設(shè)備、新工藝等。人為拔高:慎用“機理、規(guī)律”等。,2020/5/18,5,1)題目過大*計算機應(yīng)用*計算機在工程中的應(yīng)用*計算機在橋梁工程中的應(yīng)用*計算機在橋梁設(shè)計中的應(yīng)用*計算機在鐵路橋梁設(shè)計中的應(yīng)用*AutoCAD在鐵路橋梁設(shè)計中的應(yīng)用*AutoCAD在鐵路橋梁設(shè)計中的應(yīng)用,2020/5/18,6,2)簡短精練GB771387規(guī)定,題名“一般不超過20字”。一般情況下,這是上限,在準確反映“最主要的特定內(nèi)容”的前提下,字數(shù)越少越好。的研究“的研究”可刪除分析研究“分析”與“研究”重復刪除不必要的“的”必要時可加副標題(英文論文和社科類論文較常見),但應(yīng)避免濫用。例:(I)理論分析(II)試驗研究(III)應(yīng)用實例,2020/5/18,7,3)便于檢索題名中應(yīng)有盡量多的關(guān)鍵詞。這與題名應(yīng)避免籠統(tǒng)和空泛是相輔相成的。4)容易認讀避免使用非公知公用的略縮語、縮寫、符號、代號等。,2020/5/18,8,2.1.2標題的文字要求,在文字表達上,題目比正文的要求更高,需更加仔細推敲,使其符合現(xiàn)代漢語的語法、修辭和邏輯規(guī)則,避免語病和歧義。研究新方法新方法研究(用偏正結(jié)構(gòu),不用動賓結(jié)構(gòu)。但中心動詞有狀語時可用動賓結(jié)構(gòu),如:用研究)拱壩的應(yīng)力特點和分布規(guī)律拱壩應(yīng)力的特點和分布規(guī)律例,2020/5/18,9,2.1.3層次標題,格式:用阿拉伯數(shù)字連續(xù)編碼,不同層次的2個數(shù)字之間用下圓點隔開,末位數(shù)字后不加任何符號。0前(引)言(“0”和“前言”等往往不寫出)11.11.21.2.11.2.21.323,2020/5/18,10,不同層次的問題不能用相同層次標題,同一層次的問題應(yīng)用相同層次的標題。(此類問題較常見)例:的研制概述1理論分析2的研制(一級標題與總標題重復)3結(jié)論也有層次標題之間互相混淆的情況,2020/5/18,11,避免將層次標題與要點混淆(一般用帶括號的編號或字母等表示要點)。層次標題必須按要求格式編寫。要點可單獨占行,也可與下文接排。層次標題不應(yīng)過細。很多情況下可去掉,或改成要點。同一級層次標題盡量采用排比。一級標題難以做到,二級及以下級別標題應(yīng)盡量做到。結(jié)構(gòu)相同或相似意義相關(guān)語氣一致,2020/5/18,12,3署名及作者單位,論文署名只限于直接參與課題研究、論文撰寫,能對內(nèi)容負責,并對論文具有答辯能力的人員。作者單位需盡量詳細(不能用簡稱、縮寫等),大學應(yīng)寫出院(系、所),英文翻譯應(yīng)準確、統(tǒng)一。各單位應(yīng)重視本單位名稱的統(tǒng)一英(外)文譯名。(SouthwestJiaotongUniversitySWJTU)有的期刊要求提供作者簡介、照片。,2020/5/18,13,摘要是對論文內(nèi)容不加注釋和評論的簡要陳述。作用:使讀者盡快了解論文的主要內(nèi)容,補充題目的不足。為科技信息檢索機構(gòu)提供方便。,4摘要,2020/5/18,14,分類報道性摘要:提供論文中全部創(chuàng)新內(nèi)容和盡可能多的定量或定性的信息。學術(shù)性期刊一般采用此類摘要。一般200300字。英文摘要可適當詳細一些。一般包括研究工作的“目的、方法、結(jié)果和結(jié)論。”指示性摘要:簡要介紹研究的目的和方法等。50100字。報道-指示性摘要:介于上述2者之間。重要的部分按報道性摘要寫,其它部分按指示性摘要寫。100200字。,2020/5/18,15,摘要的寫作要求用第三人稱:不用我(們)、筆者等作主語。一般也不用“作者”。一般不用“本文”:“本文研究(對進行了試驗,認為,提出)了”邏輯上不通?!氨疚慕榻B(報道)”,邏輯上沒問題,但不必要。簡短精練,明確具體,準確反映論文主要內(nèi)容(重要內(nèi)容不漏掉,也不超出論文內(nèi)容)。不應(yīng)出現(xiàn)類似課題鑒定的自我評價,如“具有意義”、“填補了空白”,等。采用規(guī)范術(shù)語,一般不用數(shù)學公式和化學結(jié)構(gòu)式。除非要反駁某篇論文(觀點),一般不出現(xiàn)參考文獻。不應(yīng)簡單重復標題內(nèi)容,也不應(yīng)羅列層次標題。,2020/5/18,16,5關(guān)鍵詞,為滿足文獻標引或檢索的需要從論文中選出的詞或詞組。盡量選用主題詞,也可用自由詞。主題詞是經(jīng)過規(guī)范化的詞,如漢語主題詞表中收錄的詞,國內(nèi)期刊以此為主。自由詞則是還未規(guī)范化的詞(未收入主題詞表)。數(shù)量為38個。*由于主題詞的選取比較復雜,一般編輯需根據(jù)作者提供的關(guān)鍵詞進行加工。因此作者最好能根據(jù)漢語主題詞表查出主題詞,必要時可稍多,供編輯參考。,2020/5/18,17,6中圖分類號,根據(jù)中國圖書資料分類法(圖書館、各院系資料室和學報編輯部有)。由于涉及的學科比較復雜,作者最好能提供準確定分類號。,2020/5/18,18,7前(引)言(概論、概述),一般可包括如下內(nèi)容:研究或論文寫作的目的和背景。理論依據(jù)、試驗或研究方法。預期的結(jié)果以及本研究成果的地位、作用和意義。*1)和2)兩點類似于“綜述”,應(yīng)對相關(guān)的研究前沿進行評述,以說明作者開展的研究的必要性。,2020/5/18,19,前言的寫作要求:言簡意賅,突出重點。開門見山,不饒圈子。尊重科學,不落俗套?!跋抻跁r間和水平”、“不足之處在所難免”,等都是不負責任的說法,而不是客套。如實評述,避免吹噓自己的或貶低別人的成果。*前言雖然不是最重要的部分,但一定要特別重視。,2020/5/18,20,7正文,提出論點,通過論據(jù)(事實或數(shù)據(jù)、已有的理論等)對論點加以論證。常見的論證方法:舉例用具體事實(包括數(shù)據(jù))證明論點。屬歸納推理。事理引伸用已知的道理為論據(jù)證明論點。屬演繹推理。類比將A事物與B事物對比,以B事物的正確與否證明A事物的正確與否。屬類比推理。,2020/5/18,21,反證如數(shù)學上的反證法。屬演繹推理。對比將截然相反的情況作對比,形成鮮明的對照,從而證實(明)一種事物的存在或正確。屬類比推理。因果互證通過事理分析,揭示論點與論據(jù)之間的因果關(guān)系,以證明論點的正確性。屬歸納推理。歸謬法先假定某論點正確,然后以此為前提,導出一個顯然荒謬的結(jié)論,從而證明假定的論點是錯的。此方法只適用于駁論。屬演繹反駁推理。,2020/5/18,22,常見的問題:主題不明確。加入無關(guān)的內(nèi)容。*學位論文要能反映作者的工作,但在期刊上發(fā)表的論文則不能這樣寫。過多引用、重復已有的成果,沖淡了作者本人的工作。*在研究生的論文中較多,往往由于作者缺乏自信,或研究工作還沒有實質(zhì)性的成果。過多采用承上啟下的句子。一般來講,此類句子是沒有必要的?!跋旅嬗懻摗睕]有按規(guī)范標注參考文獻,使讀者難以分清哪些是作者的工作,哪些是引用的成果。,2020/5/18,23,8結(jié)論(和建議)(結(jié)束語),一般可包括如下內(nèi)容:本研究成果得出了什么規(guī)律性的東西,解決了什么問題,提出了什么理論。對前人的有關(guān)本問題的看法作了哪些檢驗,哪些與本研究結(jié)果一致,哪些不一致,作者作了哪些修正、補充、發(fā)展或否定。本文所報道的研究的不足之處或遺留問題。*1)是必需的,2)和3)視論文具體內(nèi)容可有可無;有的論文不能得出明確結(jié)論,也可沒有結(jié)論而只進行討論。,2020/5/18,24,結(jié)論的寫作要求概括準確,措詞嚴謹。避免使用“可能”、“大概”等模能兩可的詞。明確具體,簡短精練。結(jié)論有相對獨立性,專業(yè)讀者和情報人員可只看摘要和(或)結(jié)論就能對論文有大致的了解。結(jié)論中不再作討論?!巴ㄟ^,得出如下結(jié)論”及類似的行文都應(yīng)刪除。不作自我評價。但對研究成果應(yīng)用的范圍可給出說明(但必須是經(jīng)過論證的)。,2020/5/18,25,9致謝,對研究工作和論文寫作給予指導、幫助,或提出過建議等的相關(guān)的人或機構(gòu)表示謝意。不是必須的項目,2020/5/18,26,10參考文獻,參考文獻著錄的目的和作用反映作者的科學態(tài)度和論文具有廣泛的科學依據(jù),也反映出論文的起點和深度。區(qū)別作者本人的成果和已有的成果。尊重他人成果,免除抄襲、剽竊嫌疑。索引作用。便于讀者對有關(guān)問題有更深入的了解。節(jié)省論文篇幅??萍记閳笕藛T進行研究和文獻計量學研究。,2020/5/18,27,參考文獻著錄的原則只著錄最必要、最新的文獻。只著錄公開發(fā)表的文獻。必須按有關(guān)標準,采用規(guī)范的著錄格式。*作者應(yīng)保證著錄項目齊全(格式可由編輯統(tǒng)一處理)。*我國科技期刊采用“順序編碼制”。國外有的期刊采用“著者-出版年”制。*按文獻在正文(含前言)中出現(xiàn)的順序編碼,編碼的數(shù)字置于方括號內(nèi)。需讀出的編碼按正常行文編排,不讀出的編碼用上標。,2020/5/18,28,11附錄和注釋,一般有關(guān)的注釋、說明都在正文中解決了,因此沒有此2項。如認為必須采用,最好與編輯部協(xié)商。,2020/5/18,29,教學目的,文獻檢索課程是培養(yǎng)學生的情報意識,掌握用手工方式和計算機方式從文獻中獲取知識和情報的一門科學方法課,是提高學生自學能力和獨立研究問題能力的工具課。,2020/5/18,30,教學要求,本課程的任務(wù)是使學生了解本專業(yè)及相關(guān)專業(yè)文獻的基本知識,學會常用手工檢索工具、計算機檢索工具的使用方法,懂得如何獲得與利用文獻情報,增強自學能力和研究能力。初步掌握科技論文的寫作。,2020/5/18,31,教學參考資料,1陳雅芝等編著,信息檢索,清華大學出版社,2006年1月2王細榮,韓玲,張勤編著,文獻信息檢索與論文寫作,上海交通大學出版社,2006年8月3章云蘭,萬躍華,舒炎祥編著,數(shù)字資源檢索教程,科學出版社,2006年7月4張海濤等編著,信息檢索,機械工業(yè)出版社,2006年8月5Internet,2020/5/18,32,學科領(lǐng)域,信息檢索同時被情報科學領(lǐng)域和計算機科學領(lǐng)域所使用。,信息檢索,2020/5/18,33,內(nèi)容提要原理篇,第一講信息檢索概述第二講信息檢索模型第三講信息檢索系統(tǒng)的結(jié)構(gòu)與評價第四講文本操作技術(shù)第五講搜索引擎第六講Web檢索技術(shù),2020/5/18,34,內(nèi)容提要應(yīng)用篇,第七講圖書及其檢索第八講學術(shù)、學位論文及其檢索第九講會議文獻、科技報告及其檢索第十講專利及其檢索第十一講三大檢索刊物及其檢索第十二講中國綜合數(shù)據(jù)庫及其檢索第十三講網(wǎng)絡(luò)信息及其檢索第十四、十五講信息檢索實訓第十六講信息檢索的現(xiàn)狀與未來,2020/5/18,35,內(nèi)容提要原理篇,第一講信息檢索概述學科領(lǐng)域信息檢索的概念信息檢索的意義信息檢索的基本流程信息檢索的基本方法信息檢索的關(guān)鍵技術(shù)信息檢索的應(yīng)用領(lǐng)域,2020/5/18,36,與信息檢索相關(guān)的學科(1/3),信息檢索是一門多學科交叉的應(yīng)用技術(shù)學科。,自然語言處理:自然語言處理是利用計算機技術(shù)處理語言信息的科學,其目標是讓計算機能夠“理解”人類的語言自然語言。對于信息檢索來說,僅僅停留在處理表層文本信息是遠遠不夠的,字符層面的匹配與相似度計算并不能幫助計算機理解待檢索文本的“含義”,也不能深入理解用戶的檢索意圖,檢索出的結(jié)果非常有可能偏離用戶的需求。要提高檢索系統(tǒng)自身的智能化水平,以及檢索系統(tǒng)人機交互界面的自然度,就需要不斷地將自然語言處理結(jié)合到文本信息檢索中來。,分布式計算:面對巨大的文本數(shù)據(jù)、大量的檢索請求和用戶對于檢索時間的苛刻要求,信息檢索的效率成為一個亟待解決的問題,依靠單臺計算機不可能完成這樣的任務(wù),必須依靠分布式信息檢索技術(shù)才能解決。事實上,幾乎所有實用的大型搜索系統(tǒng)都采用了分布式的體系結(jié)構(gòu)來解決信息檢索中的效率問題。,2020/5/18,37,與信息檢索相關(guān)的學科(2/3),數(shù)據(jù)庫:數(shù)據(jù)庫和信息檢索儼然一對姐妹。與信息檢索不同,數(shù)據(jù)庫的處理對象是結(jié)構(gòu)化信息。數(shù)據(jù)庫技術(shù)已經(jīng)有比較完備的理論基礎(chǔ),而信息檢索技術(shù)的經(jīng)驗性比較強,理論基礎(chǔ)相對薄弱,需要進一步借鑒數(shù)據(jù)庫中的一些成熟理論。信息檢索中的信息抽取技術(shù)旨在把非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),以數(shù)據(jù)庫形式存放,這樣,一些信息檢索問題就可以轉(zhuǎn)化為數(shù)據(jù)庫查詢問題了。,數(shù)據(jù)挖掘:數(shù)據(jù)挖掘一般是針對數(shù)據(jù)庫進行的,借鑒到信息檢索中就成為文本挖掘。面向非結(jié)構(gòu)化數(shù)據(jù)的文本挖掘,將幫助用戶對Internet上龐雜的信息進行綜合分析,找出這些信息背后所蘊含的規(guī)律和趨勢,找出事情的本質(zhì),提升搜索技術(shù)的內(nèi)涵。此外,對用戶日志進行數(shù)據(jù)挖掘能夠從總體上觀察分析用戶的行為,也能夠針對每個個體用戶的需求提供個性化服務(wù)。,2020/5/18,38,與信息檢索相關(guān)的學科(3/3),情報學:情報學是研究情報的產(chǎn)生、傳遞、利用規(guī)律和用現(xiàn)代化信息技術(shù)與手段,使情報流通過程、情報系統(tǒng)保持最佳效能狀態(tài)的一門科學。它幫助人們充分利用信息技術(shù)和手段,提高情報產(chǎn)生、加工、存儲、流通、利用的效率。信息檢索和情報學有緊密的歷史淵源,情報學的理論對信息檢索系統(tǒng)的設(shè)計仍有指導意義。,社會學:社會學研究社會發(fā)展中的現(xiàn)象和規(guī)律。隨著搜索引擎技術(shù)的使用越來越廣泛,社會學家通過對眾多用戶使用搜索引擎的行為(比如瀏覽了哪些網(wǎng)頁,輸入了哪些查詢詞等)進行分析和統(tǒng)計來研究社會心理和行為的狀態(tài)和趨勢,比如時尚流行、語言變化、使用習慣等。,2020/5/18,39,39,內(nèi)容提要,第一講信息檢索概述學科領(lǐng)域信息檢索的概念信息檢索的意義信息檢索的基本流程信息檢索的基本方法信息檢索的關(guān)鍵技術(shù)信息檢索的應(yīng)用領(lǐng)域,原理篇,2020/5/18,40,第一章信息檢索原理,第一節(jié)信息與信息源第二節(jié)信息檢索原理第三節(jié)檢索工具第四節(jié)信息檢索的方法與程序,2020/5/18,41,第一節(jié)信息與信息源,一、信息概述,信息的含義文獻的定義:以各種技術(shù)手段,把一定的信息內(nèi)容記錄到一定的載體上形成的存儲型傳遞媒介?!拔墨I”一詞出自于“論語。最初,“文”與“獻”是兩個詞,“文”,指有關(guān)典章制度的文字資料;“獻”,指多聞熟悉掌故的人。后來融合為一,泛指有史料價值的文章和圖書。信息的特征,二、信息源,信息的載體形式信息的級別信息級別示意圖信息的出版形式,Return,2020/5/18,42,普遍認同的一個定義信息普遍存在于自然界、人類社會和思維領(lǐng)域中,它是客觀世界中各種事物變化和特征的反映,是客觀事物之間相互作用和聯(lián)系的表征,是客觀事物經(jīng)過感知或認識后的再現(xiàn)。信息的特性可識別性。信息是可以識別的,識別又可分為直接認別和間接識別,直接認別是指通過感官的識別,間接識別是指通過各種測試手段的識別。不同的信息源有不同的識別方法??纱鎯π?。信息是可以通過各種方法存儲的??蓴U充性。信息隨著時間的變化,將不斷擴充??蓧嚎s性。人們對信息進行加工、整理、概括、歸納就可使之精練,從而濃縮??蓚鬟f性。信息的可傳遞性是信息的本質(zhì)特征。可轉(zhuǎn)換性。信息可以由一種形態(tài)轉(zhuǎn)換成另一種形態(tài)。特定范圍有效性。信息在特定的范圍內(nèi)是有效的,否則是無效的。,什么是信息,2020/5/18,43,2020/5/18,44,信息資源的類型(2/2),按信息內(nèi)容的保密程度劃分有公開信息源、半公開信息源和非公開信息源。按信息內(nèi)容的應(yīng)用范圍劃分分為科技信息源、經(jīng)濟信息源、管理信息源及生活信息源。按載體形式劃分印刷型(以紙張為介質(zhì),以鉛印、油印、膠印、復印等手段記錄信息的載體)、縮微型(以感光材料為介質(zhì),以縮微照相為手段記錄信息的載體)、機讀型(以磁性材料為載體,通過編碼和程序設(shè)計,由計算機輸入和輸出的信息)、聲像型(以電磁材料為載體,借助特殊設(shè)備,直接將聲音和圖像等信息記錄下來的一種動態(tài)信息),2020/5/18,45,信息資源的類型(2/2),按信息傳輸形式劃分網(wǎng)絡(luò)信息源(各種網(wǎng)絡(luò)上的信息集合),非網(wǎng)絡(luò)信息源(不用通信設(shè)施就能獲得的信息集合),2020/5/18,46,一、信息檢索的含義二、信息檢索原理信息檢索原理圖三、信息檢索類型,以檢索內(nèi)容劃分以信息存儲和檢索的方式和技術(shù)劃分,四、信息檢索的意義,Return,第二節(jié)信息檢索原理,2020/5/18,47,2020/5/18,48,信息檢索的概念(1/6),信息檢索(InformationRetrieval,IR)是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。狹義的信息檢索就是信息檢索過程的后半部分,即從信息集合中找出所需要的信息的過程,也就是我們常說的信息查尋(InformationSearch或InformationSeek)。,2020/5/18,49,信息檢索的概念(1/6),IR不僅僅是查詢,IR系統(tǒng)也不僅僅是搜索引擎。例1:返回與信息檢索相關(guān)的網(wǎng)頁搜索引擎(SearchEngine,SE)例2:毛主席的生日是哪天?問答系統(tǒng)(QuestionAnswering,QA)例3:返回聯(lián)想PC的型號、配置、價格等信息信息抽取(InformationExtraction,IE)例4:訂閱有關(guān)NBA的新聞信息過濾(InformationFiltering)、信息推薦(InformationRecommending),2020/5/18,50,信息檢索的概念(2/6),也可以這樣說,狹義的IR通常是指InformationSearch,而廣義的IR包含非常多的內(nèi)容(SE,QA,IE,)。用戶需求(UserNeed,UN):用戶需要獲得的信息嚴格地說,UN只存在于用戶的內(nèi)心,但是通常用文本來描述,如查找與2010世界杯相關(guān)的新聞,有時也稱為主題(Topic)UN提交給檢索系統(tǒng)時,稱為查詢式(Query)。如2010世界杯,對同一個UN,不同人不同時候可以構(gòu)造出不同的Query上述需求還可表示成2010世界杯新聞Query在IR系統(tǒng)中往往還有內(nèi)部表示,2020/5/18,51,信息檢索的概念(3/6),文檔(Document):檢索的對象可以是文本,也可以是圖像、視頻、語音等多媒體文檔,textretrieval/imageretrieval/videoretrieval/speechretrieval/multimediaretrieval可以是無格式、半格式、有格式的文檔集合(Collection):所有待檢索的文檔構(gòu)成的集合也稱為Repository,Corpus,2020/5/18,52,信息檢索的概念(4/6),相關(guān)(relevant、相關(guān)度relevance)相關(guān)取決于用戶的判斷,是一個主觀概念不同用戶做出的判斷很難保證一致即使是同一用戶在不同時期、不同環(huán)境下做出的判斷也不盡相同,2020/5/18,53,信息檢索的概念(5/6),定義“相關(guān)性”的兩個角度系統(tǒng)角度:系統(tǒng)輸出結(jié)果,用戶是信息的接受者。這種理解置用戶于被動的地位,基于這種理解,研究的重心落在系統(tǒng)本身。主題相關(guān)性:檢索系統(tǒng)檢出的文檔的主題即核心內(nèi)容與用戶的信息需求相匹配。系統(tǒng)角度相關(guān)并不和用戶脫節(jié)。系統(tǒng)角度定義的相關(guān)簡單可以計算。用戶角度:觀察用戶對檢索結(jié)果的反應(yīng),是系統(tǒng)輸出向用戶需求的投射。相關(guān)性被認為是用戶方面的屬性。用戶角度定義的相關(guān)目前仍然難以計算?,F(xiàn)代信息檢索研究中仍然主要采用系統(tǒng)角度定義的主題相關(guān)性概念,當然也強調(diào)考慮用戶的認知因素。,2020/5/18,54,信息檢索的概念(6/6),形式上說,信息檢索中的相關(guān)度是一個函數(shù)R,輸入是查詢Q、文檔D和文檔集合C,返回的是一個實數(shù)值R=f(Q,D,C)信息檢索就是給定一個查詢Q,從文檔集合C中計算每篇文檔D與Q的相關(guān)度并排序(Ranking)。相關(guān)度通常只有相對意義,對一個Q,不同文檔的相關(guān)度可以比較,而對于不同的Q的相關(guān)度不便比較,2020/5/18,55,信息檢索的概念(6/6),相關(guān)度的輸入信息可以更多,比如用戶的背景信息、用戶的查詢歷史等等現(xiàn)代信息檢索中相關(guān)度不是唯一度量,還有重要度、權(quán)威度、新穎度等度量。或者說這些因子都影響“相關(guān)度”。Google中據(jù)說用了上百種排名因子,2020/5/18,56,信息檢索的研究范圍,信息檢索作為一門學科,有它自己的研究范圍和對象,也有自己的理論、方法和技術(shù)。信息檢索的研究范圍包括一切與信息存儲與檢索有關(guān)的系統(tǒng)、過程、理論和方法。一切可供存儲和檢索利用的信息類型,如文獻、數(shù)據(jù)、事實、知識、聲音、圖形等;各種信息檢索系統(tǒng)及其運行過程,如信息采集、標引、組織、存貯、處理、匹配、傳送等各種過程中使用的方法;以及在信息檢索實踐和研究的基礎(chǔ)上形成的各種理論和假設(shè),均包括在這個范圍內(nèi)。信息類型側(cè)重于文本。,2020/5/18,57,信息檢索的研究對象(1/3),信息檢索理論主要包括檢索語言與標引理論、信息檢索的數(shù)學模型、知識表示理論、相關(guān)性理論等。信息檢索系統(tǒng)它是實現(xiàn)信息檢索的物質(zhì)基礎(chǔ),是現(xiàn)實的研究對象,主要研究它的結(jié)構(gòu)、功能、演變,它的設(shè)計開發(fā)技術(shù)、管理維護技術(shù)和評價技術(shù),還研究它與其他信息系統(tǒng)乃至整個外部世界的關(guān)系。其中,數(shù)據(jù)庫是信息檢索系統(tǒng)的核心部分之一。數(shù)據(jù)庫的建造和維護是一類非常重要的信息技術(shù)。數(shù)據(jù)庫的質(zhì)量直接影響信息檢索系統(tǒng)的功能和效率。,2020/5/18,58,信息檢索的研究對象(2/3),計算機信息檢索它涉及到許多計算機設(shè)備、軟件技術(shù)、存儲技術(shù)、檢索技術(shù)、系統(tǒng)管理和經(jīng)營知識、市場營銷技術(shù)等,是一門綜合性很強的技術(shù)。檢索策略與方法它是用戶從信息檢索系統(tǒng)中獲取有關(guān)信息所必需的。好的檢索策略是檢索成功的必要前提,計算機的應(yīng)用為檢索策略和方法的發(fā)展提供了有力的支持。,2020/5/18,59,信息檢索的研究對象(2/3),檢索策略與方法近30年來,涌現(xiàn)了許多新穎而有效的檢索技術(shù)和方法,如布爾檢索、位置檢索、截詞檢索、加權(quán)檢索、聚類檢索、全文檢索、超文本檢索、超媒體檢索、智能檢索、知識檢索等。人們利用、研究、評價和完善現(xiàn)有的各種檢索策略和方法,研究開發(fā)新的更有效的策略和方法。,2020/5/18,60,信息檢索的研究對象(3/3),用戶研究與培訓用戶是信息檢索系統(tǒng)的生命,無論是系統(tǒng)的研制開發(fā)、管理維護、功能和服務(wù)的擴展,還是系統(tǒng)評價,都離不開用戶研究工作。用戶培訓是用戶研究的繼續(xù),是與用戶建立緊密聯(lián)系和發(fā)展新用戶的一種非常有效的措施。,2020/5/18,61,第一章文獻信息源,1文獻的特點2文獻的類型3文獻信息服務(wù)系統(tǒng),高洪民,2020/5/18,62,大家的風采,李政道教授曾經(jīng)在一次科學演講的開場白中這樣說道:“到昨天晚上11點30分為止,世界物理學前沿的發(fā)展情況是這樣的:”。借助現(xiàn)代信息技術(shù),我們也可以做到這一點。,2020/5/18,63,63,內(nèi)容提要,第一講信息檢索概述學科領(lǐng)域信息檢索的概念信息檢索的意義信息檢索的基本流程信息檢索的基本方法信息檢索的關(guān)鍵技術(shù)信息檢索的應(yīng)用領(lǐng)域,原理篇,2020/5/18,64,信息的表現(xiàn)形式,大多數(shù)信息都是文本形式的,沒有預先定義的格式。有人統(tǒng)計認為80%的信息是非結(jié)構(gòu)化的什么是“非結(jié)構(gòu)化信息”呢?一篇新聞是一條非結(jié)構(gòu)化信息,新聞中會出現(xiàn)一些人名、地名、機構(gòu)名稱等實體,以及這些實體之間的關(guān)系(比如某人是某地區(qū)某機關(guān)的負責人),還有這些實體相關(guān)的事件(比如某人訪問了某地)。但是這些人、事、物、關(guān)系和事件并不像關(guān)系數(shù)據(jù)庫的二維表中存放的信息那樣,被精確地分割并嚴格地存放在合適的字段或記錄中。這種在現(xiàn)實世界中自然存在的模糊而帶有歧義且沒有經(jīng)過規(guī)格化的信息被稱為“非結(jié)構(gòu)化的”信息。非結(jié)構(gòu)化信息的類型:文本信息(網(wǎng)頁,郵件,博客,論壇上的帖子,聊天記錄,短信等)及圖像、圖形、語音、視頻等多媒體信息。,2020/5/18,65,網(wǎng)絡(luò)信息的發(fā)展趨勢,大量的數(shù)據(jù)(非結(jié)構(gòu)化)向IR技術(shù)提出挑戰(zhàn)以前認為幾百兆的數(shù)據(jù)就是大數(shù)據(jù)集,現(xiàn)在一個單獨的數(shù)據(jù)庫就能夠處理10-50G以上的數(shù)據(jù),全球網(wǎng)頁服務(wù)器數(shù)(1996.12010.4),2020/5/18,66,中國互聯(lián)網(wǎng)發(fā)展趨勢(1/3),截至2010年6月,總體網(wǎng)民規(guī)模達到4.2億,突破了4億關(guān)口。,2020/5/18,67,中國互聯(lián)網(wǎng)發(fā)展趨勢(2/3),自2002年1.6億個網(wǎng)頁開始,中國的網(wǎng)頁規(guī)模一直保持高速增長,2009年網(wǎng)頁數(shù)達到336億個。,2020/5/18,68,中國互聯(lián)網(wǎng)發(fā)展趨勢(3/3),中國分類域名數(shù)(截止2010年7月),2020/5/18,69,信息過載,“全世界每年產(chǎn)生1到2EB信息,相當于地球上每個人大概產(chǎn)生250MB信息。其中紙質(zhì)信息僅占所有信息的0.03%.”(Lyman能夠識別多種類型與格式的潛在信息源;知道獲取信息的費用以及產(chǎn)生的效益;具備對所需信息內(nèi)容與范圍進行重新評價的能力。標準2,高效地獲取所需信息。具體指標包括:選擇合適的調(diào)查方法或信息檢索系統(tǒng),以獲取所需信息;構(gòu)建與實施有效的檢索策略;利用聯(lián)機檢索終端或親自使用一組方法檢索所需信息;必要時改進檢索策略;獲取、記錄、管理信息與信息源。,2020/5/18,79,標準3,能客觀、審慎地評估信息與信息源,并將其納入信息庫與評價系統(tǒng)。具體指標包括:具有從獲取信息中提煉信息主題的能力;為評估信息與信息源形成最初的標準;復合主題概念以形成新的概念;能通過對新舊的知識的比較而確定信息的增加值;能確定新的知識對個人價值體系的影響,并使其融合于個人的價值體系中;能通過與個人、領(lǐng)域?qū)<壹捌渌藛T的交流,對信息的理解與解釋的有效性加以判斷;決定是否有必要修訂初始的查詢。標準4,個人或作為群體的一員能有效地利用信息以完成特定的任務(wù)。具體指標包括:能夠利用各種可獲得的信息以完成計劃,以及產(chǎn)生特定的信息產(chǎn)品或成果;修訂產(chǎn)生信息產(chǎn)品或成果的過程;有效地將信息產(chǎn)品、成果與他人交流。,2020/5/18,80,標準5,理解有關(guān)信息使用的經(jīng)濟、法律以及社會因素,獲取與使用信息要符合道德與法律規(guī)范。具體指標包括:了解信息與信息技術(shù)使用的相關(guān)法律、道德倫理以及社會經(jīng)濟問題;在存取、使用信息資源時能夠遵守法律、法規(guī)、信息資源提供的規(guī)定以及約定俗成的一些規(guī)則;對引用的成果表示致謝。以上的信息素質(zhì)評價標準,涵蓋了信息意識、信息能力與信息道德三個方面的內(nèi)容,有較強的可操作性,可以作為我們進行研究生信息素質(zhì)教育的參考和借鑒。,2020/5/18,81,本課程學習目的,培養(yǎng)和強化學生的信息素養(yǎng),即信息意識、信息技能和信息道德。八個方面的信息能力(1)運用信息工具的能力(2)獲取信息工具的能力(3)處理信息的能力(4)創(chuàng)造信息的能力(5)表達信息的能力(6)發(fā)揮信息作用的能力(7)信息協(xié)作意識與能力(8)信息免疫能力,2020/5/18,82,課程學習內(nèi)容文獻和信息檢索基礎(chǔ)知識計算機信息檢索知識中外文網(wǎng)絡(luò)數(shù)據(jù)庫的使用因特網(wǎng)上信息資源特征及檢索利用特種文獻數(shù)據(jù)庫的檢索利用工具書的使用原始文獻的獲取文獻信息綜合利用與論文寫作。,2020/5/18,83,參考書:1.徐慶寧等.信息檢索與利用.上海:華東理工大學出版社,2006,2020/5/18,84,2020/5/18,85,3.符紹宏等.因特網(wǎng)信息資源檢索與利用.北京:清華大學出版社,2002,2020/5/18,86,2020/5/18,87,成績評定辦法:1.上課考勤占10%2.檢索作業(yè)占40%3.檢索報告和文獻綜述占50%,實習課:自行解決圖書館,教室,宿舍,2020/5/18,88,第一章信息檢索緒論,第一節(jié)信息素質(zhì)與信息利用第二節(jié)基本概念第三節(jié)信息資源的類型和特點第四節(jié)信息資源評價,2020/5/18,89,第一節(jié)信息素質(zhì)與信息利用,一、信息素質(zhì)二、信息檢索與利用教學內(nèi)容三、信息素質(zhì)、信息檢索與利用的意義,2020/5/18,90,一、信息素質(zhì),關(guān)于信息素質(zhì)的研究是從20世紀70年代開始的,對信息素質(zhì)的認識經(jīng)歷了一個漸進的過程,信息素質(zhì)可以概括為個體在現(xiàn)實需求的驅(qū)動下,能有效地發(fā)現(xiàn)、獲取、評價和利用信息。它包含四個層面的含義:第一,用戶有一定的信息需求,即在某個時候需要了解某方面信息。第二,掌握了主要的信息源和信息工具的知識及技能。第三,能夠分析評價選擇相關(guān)信息。第四,利用信息的目的是為了有效地解決具體問題。信息素質(zhì)主要表現(xiàn)為信息理論素養(yǎng)和信息的實踐能力,包括信息意識、信息知識、信息能力和信息道德等內(nèi)容。,2020/5/18,91,(一)信息意識,所謂信息意識,簡單地說,是人們利用信息系統(tǒng)獲取所需信息的內(nèi)在動因,具體表現(xiàn)為對信息的敏感性、選擇能力和消化吸收能力。有無信息意識決定著人們捕捉、判斷和利用信息的自覺程度。而信息意識的強烈與否對能否挖掘出有價值的信息、對文獻獲取能力的提高起著關(guān)鍵的作用。同樣重要的信息,有的人善于抓住,有的人卻漠然視之。這是由于各人的信息意識強弱不同。信息技能的掌握在很大程度上取決于信息意識的提高。,2020/5/18,92,(二)信息知識,是關(guān)于信息的特點、性質(zhì)、運動規(guī)律、信息方法與技術(shù)、信息系統(tǒng)的有關(guān)知識。其中信息方法是指如何以信息的觀點來分析和解決人們在工作和生活中遇到的問題的方法,把無序而良莠不齊的信息轉(zhuǎn)化為有效信息加以利用,創(chuàng)造出新的價值。信息技術(shù)是關(guān)于信息提取、檢測、處理、轉(zhuǎn)換、傳遞、控制等技術(shù),如計算機技術(shù)、數(shù)據(jù)庫技術(shù)、通信技術(shù)、網(wǎng)絡(luò)技術(shù)等。,2020/5/18,93,(三)信息能力,大學期間,信息能力具體表現(xiàn)為以下6種能力:明確任務(wù)(TaskDefinition):了解問題的癥結(jié),確定所需信息和目的,分清任務(wù)的輕重緩急;信息查詢策略(InformationSeekingStrategies):了解各種信息源,能夠作出評價并確定優(yōu)先查找的次序;查找和檢索(LocationandAccess):確定信息藏址,從信息源中找出信息;信息利用(UseofInformation):能夠讀懂(或聽懂、理解)查出的信息,了解信息在滿足需求中的特定價值;信息綜合(Synthesis):能夠組織信息,提供信息產(chǎn)品(論文、報告等);信息評價(Evaluation):評價查找結(jié)果和解決問題的過程(效率)。,2020/5/18,94,(四)信息道德,是指在信息活動中調(diào)節(jié)和控制信息生產(chǎn)者、信息服務(wù)者、信息利用者及其相互關(guān)系、倫理道德和行為規(guī)范的總和。具體有遵守國家有關(guān)信息的法律法規(guī)、不制作不傳播不利用違反國家政策的信息和不健康信息、不制作不傳播虛假信息、不侵犯知識產(chǎn)權(quán)、不利用信息技術(shù)謀取不正當利益和從事違法活動等。在日趨繁雜的信息環(huán)境中,自覺而良好的信息道德,是信息素質(zhì)中不可忽略的一部分。在信息素質(zhì)四個方面的內(nèi)容中,信息意識是前提,信息知識是基礎(chǔ),信息能力是核心,信息道德是準則,它們的有機結(jié)合構(gòu)成信息素質(zhì)整體。,2020/5/18,95,二、信息檢索與利用課的教學內(nèi)容,信息檢索與利用是大學生信息素質(zhì)教育課程體系中一門最重要基礎(chǔ)課,它圍繞相關(guān)信息的科學查詢及利用這個核心,介紹信息檢索與利用的基本概念、基本理論和基本方法、并結(jié)合各學科的實際問題講解和剖析了檢索、分析、評價和利用。通過學習能使學生具備最基本的信息素質(zhì)。,2020/5/18,96,三、信息素質(zhì)、信息檢索與利用的意義,世界上的文獻信息已經(jīng)匯集成一個巨大的知識寶庫,其數(shù)量龐大、增長迅速、類型繁多、文種多樣、新陳代謝頻繁。信息檢索是幫助人們打開知識寶庫的鑰匙,是開發(fā)人類智力資源的有效手段。面對人類浩瀚的知識海洋,只有具有良好的信息素質(zhì),才能迅速而全面地獲得所需的信息,并通過各種處理而有效地利用信息。切實地掌握并有效地利用各種信息資源,不但可以更新知識、開拓視野、啟迪思維、激發(fā)創(chuàng)造力,而且可以增強競爭力,提高各種效益。,2020/5/18,97,1信息素質(zhì)與綜合素質(zhì)的關(guān)系信息素質(zhì)是綜合素質(zhì)的重要組成因素,二者相輔相成,良好的信息素質(zhì)可以極大地提高綜合素質(zhì),而良好的綜合素質(zhì)也直接影響信息素質(zhì)的提高。,2020/5/18,98,2信息素質(zhì)與學習、創(chuàng)新能力沒有知識就不能創(chuàng)新這是大家的共識。而人們的知識一方面來自自己對客觀世界的觀察與認識,另一方面則來自對其他個體(包括前人)的吸收與繼承。人們的知識創(chuàng)新與技術(shù)創(chuàng)新需要大量的有關(guān)信息。今天的世界并不缺乏創(chuàng)新所需的信息,而在于知識的存貯過于龐大和無序,信息存貯的無序化以及過多的老化信息和偽信息加劇了“信息污染”的程度。今天的社會沒有良好的信息素質(zhì)是很難全面、系統(tǒng)、及時地掌握創(chuàng)新所需的信息的。可以這樣的認為,信息素質(zhì)是學習、創(chuàng)新能力的重要因素,良好的學習、創(chuàng)新能力依賴于優(yōu)秀的信息素質(zhì)。,2020/5/18,99,3.信息利用與事業(yè)進步,信息是生命、是財富、是力量、是事業(yè)核心競爭力的重要組成因素。具體體現(xiàn)在以下幾個方面:1不斷更新知識,增強生存能力2節(jié)省時間,提高效率3避免重復研究和勞動、防止浪費。4幫助制定高明謀略5有助于人們占領(lǐng)科技制高點。,2020/5/18,100,第二節(jié)基本概念,一、信息二、知識三、情報四、文獻五、信息資源,2020/5/18,101,2020/5/18,102,2020/5/18,103,2020/5/18,104,十大文獻信息資源科技圖書科技期刊特種文獻(科技報告政府出版物會議文獻標準文獻專利文獻科技檔案學位論文產(chǎn)品樣本),本章學習要點:信息檢索一四十,2020/5/18,105,一、信息,信息,最初的含義是指音信和消息,南唐李中暮春懷故人詩“夢斷美人沉信息,目穿長路倚樓臺”及宋代陳亮梅花詩“欲傳春信息,不怕雪埋藏”中的信息就是這個概念。隨著社會的進步和科技的發(fā)展,信息遠遠超出了原先的含義,是指通過各種手段傳遞的一切符號,它已經(jīng)成為我們使用頻率最高的詞匯之一。,2020/5/18,106,信息(information)一詞在日常生活中,常被人們理解為以口頭、書面或其他方式傳遞的消息。就信息的基本內(nèi)涵來講,信息是自然界、人類社會以及思維活動中普遍存在的現(xiàn)象,是一切事物的存在方式和運動狀態(tài)的表達。信息不是物質(zhì)本身,而是物質(zhì)的一種基本屬性。信息與客觀事物一樣,無處不在,無時不在。該課所指的信息,是指經(jīng)過采集、處理、記錄并以可檢索的形式存儲的數(shù)據(jù),屬于信息資源管理學范疇對信息的描述。人類認識世界的過程,實際上就是不斷從外界獲取信息、加工信息和傳遞信息的過程。在當今信息社會中,競爭性信息已成為企業(yè)的第四競爭力。,2020/5/18,107,信息概述,2020/5/18,108,信息的結(jié)構(gòu),精煉的知識,記錄下來的知識,對信息的理解與認識,有組織的數(shù)據(jù),信息的原材料,智慧,文獻,知識,信息,數(shù)據(jù),客觀事物本身的運動,2020/5/18,109,信息,數(shù)據(jù),客觀事物的運動,客觀事物的運動,2020/5/18,110,信息、知識與文獻,數(shù)據(jù):是對客觀事物本身運動的記錄,是信息的原材料。信息:是有組織的數(shù)據(jù),是對數(shù)據(jù)整理提煉出來的消息,是知識得以形成和傳播的中介,而不是知識本身。知識:是對信息的理解與認識。知識是經(jīng)過精心研究、領(lǐng)會后的有用信息,是人類對信息加工處理后的產(chǎn)物。獲得知識有賴于獲得信息;,2020/5/18,111,信息、知識與文獻,傳遞運用后,2020/5/18,112,二、知識,知識(knowledge)是人類社會實踐的總結(jié),是人類通過信息對自然界、人類社會以及思維方式與運動規(guī)律的認識和掌握,是人腦通過思維重新組合的系統(tǒng)化的信息集合。信息通過人腦的接收、選擇、整理和提煉等過程,形成各種各樣的知識。知識的產(chǎn)生離不開信息和信息傳遞,它是信息的一個重要組成部分。,2020/5/18,113,第一節(jié)四次文獻和十大文獻信息源,2020/5/18,114,2020/5/18,115,2020/5/18,116,2020/5/18,117,2020/5/18,118,1.信息、知識、情報和文獻的關(guān)系;2.科技文獻的分類(加工深度,補充:出版形式,符號如ISBN);,2020/5/18,119,信息是事物屬性的再現(xiàn)。信息不是事物本身,而是由事物發(fā)出的消息、指令、數(shù)據(jù)等所包及的內(nèi)容。,2020/5/18,120,普遍性多樣性時效性傳遞性共享性,2020/5/18,121,情報是指人們在一定時間內(nèi)為一定目的而傳遞的有使用價值的知識或信息。,2020/5/18,122,文獻是記錄有知識的一切載體。,知識,載體,記錄,文獻基本要素,2020/5/18,123,信息是產(chǎn)生知識的基礎(chǔ),知識是信息核心,情報是被激活的知識,知識記錄在一定形式的載體上即為文獻。,2020/5/18,124,2020/5/18,125,2020/5/18,126,2020/5/18,127,2020/5/18,128,2020/5/18,129,2020/5/18,130,2020/5/18,131,2020/5/18,132,2020/5/18,133,2020/5/18,134,2020/5/18,135,2020/5/18,136,2020/5/18,137,2020/5/18,138,2020/5/18,139,2020/5/18,140,2020/5/18,141,2020/5/18,142,2020/5/18,143,2020/5/18,144,2020/5/18,145,2020/5/18,146,2020/5/18,147,2020/5/18,148,2020/5/18,149,零次文獻按對文獻一次文獻信息內(nèi)容二次文獻加工深淺三次文獻科技圖書按文獻的科技期刊出版形式特種文獻劃分,四次文獻,十大文獻信息源,2020/5/18,150,文獻信息,零次文獻:普通網(wǎng)頁,電子郵件等一次文獻:正式在期刊上發(fā)表的論文等二次文獻:數(shù)據(jù)庫中的題錄、目錄等三次文獻:文獻綜述、進展報告等,2020/5/18,151,2020/5/18,152,2020/5/18,153,2020/5/18,154,零次文獻,指未經(jīng)公開發(fā)表或未交流的文獻。如實驗記錄、文章草稿、私人日記、筆記、書信、設(shè)計草圖、內(nèi)部報告、技術(shù)檔案等。,2020/5/18,155,2020/5/18,156,2020/5/18,157,零次文獻的特點,數(shù)量多,內(nèi)容新,更具有啟發(fā)性;信息反饋迅速、及時、準確;具有高度選擇性和針對性;有限性和不可靠性,要特別提防虛假信息。例如:清華女生朱令的鉈中毒病因確診,就是應(yīng)用零次文獻成功的范例。,2020/5/18,158,2020/5/18,159,(2)一次文獻(PrimaryDocument),2020/5/18,160,2020/5/18,161,2020/5/18,162,2020/5/18,163,2020/5/18,164,2020/5/18,165,一次文獻的特點,內(nèi)容比較具體、豐富,具有新穎性、創(chuàng)造性、系統(tǒng)性等特點;經(jīng)過權(quán)威機構(gòu)篩選,科學性基本有保證;可以回溯檢索,不像新聞那樣有時效性;由于數(shù)量巨大,往往檢索困難。一般都是首先檢索二次文獻后,再去查閱一次文獻。另外網(wǎng)上一次文獻資源相對較少。,2020/5/18,166,確定一篇文獻是否為一次文獻,應(yīng)根據(jù)文獻的內(nèi)容,而不是其形式。如,在科技期刊上發(fā)表的論文,很有可能是三次文獻。一次文獻是文獻的主體,是最基本的情報源,是文獻檢索最終查找的對象。,一次文獻(Primarydocument),2020/5/18,167,2020/5/18,168,2020/5/18,169,(3)二次文獻(SecondaryDocument),2020/5/18,170,2020/5/18,171,2020/5/18,172,什么是目錄?,目錄是指對產(chǎn)品或圖書的簡要介紹。當然,也可以是對一本書內(nèi)容的簡要描述。世界上第一個目錄誕生于15世紀的歐洲,是一個關(guān)于書籍的目錄。在美國,本富蘭克林(BenFranklin)于1744年印制了美國第一份目錄,其中列出了數(shù)百本圖書。,2020/5/18,173,什么是題錄?,題錄是二次文獻中的一種,通俗地說,是指文獻工作者對大量的原始文獻的題名、作者及刊登(發(fā)表)的處所進行著錄,并有序排列供人們了解查找原始文獻的一種工具。實際上,題錄就是計算機數(shù)據(jù)庫中的一條條記錄。,2020/5/18,174,按中圖法著錄的圖書在版編目,2020/5/18,175,2020/5/18,176,清華庫中的期刊論文題錄格式,2020/5/18,177,什么是索引?,索引是將圖書、報刊等文獻資料中具有檢索意義的信息,如字詞、語句、主題、人名、地名、物名、書名、篇名、名詞術(shù)語、引用文獻名等,分類摘錄,標明出處,頁碼,并按照一定次序加以編排,指引讀者據(jù)此查尋原始文獻的檢索工具。索引的印刷型載體是一本書或期刊,電子型載體則是索引數(shù)據(jù)庫。搜索引擎之所以能實現(xiàn)快速檢索,就是靠索引數(shù)據(jù)庫的支持。,2020/5/18,178,清華庫中關(guān)于Flash的索引,2020/5/18,179,清華庫中某篇文獻的題錄,2020/5/18,180,什么是文摘?,文摘(abstract),又分為報道性文摘、指示性文摘、報道指示性文摘、評述性文摘、模塊式文摘、專用文摘等幾種,它是指對一份文獻(或稱一個文獻單元)的內(nèi)容所做的簡略、準確的描述。這種二次文獻意義上的文摘,是索引形式的發(fā)展。,2020/5/18,181,清華庫中某篇文獻的文摘,2020/5/18,182,該文獻的原文?次文獻,2020/5/18,183,二次文獻的特點,具有濃縮性、匯集性、有序性等特點,檢索方便,網(wǎng)上二次文獻資源豐富;除網(wǎng)上圖書館目錄可以免費獲取外,大型國際聯(lián)機數(shù)據(jù)庫的檢索一般均須付費;受加工和出版周期的影響,一般二次文獻比一次文獻要晚幾個月甚至一年。,2020/5/18,184,2020/5/18,185,三次文獻(Tertiarydocument),利用二次文獻系統(tǒng)地檢索出一批有關(guān)的文獻,對其內(nèi)容進行比較分析,綜合述評而編撰的文獻。,2020/5/18,186,2020/5/18,187,2020/5/18,188,2020/5/18,189,2020/5/18,190,2020/5/18,191,2020/5/18,192,按文獻的加工深度分,二次文獻,一次文獻,三次文獻,零次文獻,2020/5/18,193,一次文獻是檢索的對象(目標)二次文獻是檢索的工具(手段)三次文獻是情報研究的成果(檢索目標+檢索手段),從檢索的角度來看:,2020/5/18,194,一次文獻是對知識的第一次加工(創(chuàng)造性)二次文獻是對知識的第二次加工(有序化)三次文獻是對知識的再加工(有序化+創(chuàng)造性),從知識加工角度來看:,2020/5/18,195,零次文獻按對文獻一次文獻信息內(nèi)容二次文獻加工深淺三次文獻科技圖書按文獻的科技期刊出版形式特種文獻劃分,四次文獻,十大文獻信息源,2020/5/1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論