淺談數據挖掘在圖書管理方面應用_第1頁
淺談數據挖掘在圖書管理方面應用_第2頁
淺談數據挖掘在圖書管理方面應用_第3頁
淺談數據挖掘在圖書管理方面應用_第4頁
淺談數據挖掘在圖書管理方面應用_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、淺談數據挖掘在圖書管理方面應用【摘要】本文以數據挖掘的定義出發(fā),對數據挖掘的功 能及分類進行簡要的概述,最終探討了數據挖掘技術在圖書 館管理以及讀者服務這兩方面的應用,希望給我們圖書員的 工作起到一定的指導效果。【關鍵詞】數據挖掘;圖書管理0.引言隨著社會的發(fā)展,圖書管理工作相對于以往面臨著更大 的難題,比如海量的數據、個性化需求等。在這種背景下, 數據挖掘技術在解決這些問題的過程中具有非常大的優(yōu)勢, 因此,本文關于數據挖掘在圖書管理方面運用有著很強的實 踐意義。1數據挖掘定義數據挖掘的英文全稱為data mining,被我們簡稱為dm, 主要是指從數據庫中抽取具備潛在應用價值、以前未知、隱

2、含信息的過程,主要用途是為決策者提供數據之間的關聯, 找尋被忽視的因素,因此,能夠對我們的預測及決策行為起 到很強的促進效果。在數據挖掘技術中,一個相關性非常強的概念為知識發(fā) 現,這是指在信息背景下從很多數據中找出有效的、新穎的、 可信的模式的處理過程,其主要的應用對象為vld13,目標是 發(fā)現數據庫中規(guī)律性的知識??梢哉f,數據挖掘屬于一種特 定的知識發(fā)現,也是知識發(fā)現過程中最為重要的一部分。2數據挖掘的分類數據具有多種多樣的表現形式,因此,我們可以以研究 對象數據結構的形式對數據挖掘進行劃分,具體來說,數據 挖掘可以分為數據挖掘、文本數據挖掘以及web數據挖掘這 三類。首先,數據挖掘。這一類

3、的數據挖掘對象主要是結構化 數據,比如在包括sql server qracle informix在內的一 些數據庫中可以應用這一類數據挖掘。其次,web數據挖掘。在廣義上說,這一類數據挖掘可 以看做是從互聯網中發(fā)現及分析有用的信息,具體來說,其 定義具有兩種意義:web內容挖掘,這是從數量極大的在線 數據庫及web站點中對信息、資料進行搜索及獲?。粀eb使 用挖掘,在這個過程中將建立并分析讀者所訪問站點及服務 的模型。一般情況下,在web挖掘過程中所使用的工具主要 有:speed tracer 以及 web log miner 等。第三,用戶挖掘。在數字圖書館中,用戶挖掘主要是通 過對用戶訪問

4、圖書館留下的記錄進行分析,進而對用戶訪問 模式及挖掘,最終為網站的經營及管理提供決策服務。這類 數據挖掘主要又可以分為訪問模式的追蹤以及個性化使用 記錄的追蹤這兩類。3. 數據挖掘的功能數據挖掘技術不但能夠幫助我們查詢及遍歷過去的數 據,還可以預測將來趨勢及行為,并對以前沒有發(fā)現的模式 進行自動探索,進而提升我們決策的可靠性??偨Y起來其功 能可以分為以下幾個方面:首先,關聯分析,在數據庫中,如果一些能夠被發(fā)現的、 重要的兩個或者多個變量之間存在著一種規(guī)律性的取值則 可以認為它們之間存在著關聯。我們進行關聯分析的主要作 用是探尋出數據庫里的隱藏關聯網。其次,聚類。所謂聚類主要是指數據庫中的記錄能

5、夠被 劃為一系列具有意義的子集。這一技術包含了傳統模式識別 方法數學分類學。它能夠提升我們認識客觀事實的效率,屬 于偏差分析以及概念描述的基礎和前提。第三,概念描述。這主要是描述某對象的內涵,并對其 中的有關特征進行概括,它包括區(qū)別性描述以及特征性描 述,在生成區(qū)別性描述的過程中主要的方法有遺傳算法、決 策樹算法等,而生成特征性描述的過程中則只會對所有對象 的共性進行涉及。最后,偏差檢測。在數據庫中,數據往往會存在異常記 錄,對于這些偏差進行檢測具有很強的意義。偏差中存在很 多潛在知識,舉例來說,分類過程中的反常實例、不符合規(guī) 則特例、模型預測及觀測結果的偏差等。4. 圖書管理中數據挖掘技術的

6、應用4.1應用于圖書館的管理圖書館的管理是圖書管理的前提和基礎,在圖書管理 中,數據挖掘技術主要起到以下作用:首先,數據挖掘技術能夠為圖書館更好的發(fā)展提供定 位。在圖書館經營的過程中,服務現實需求以及客觀條件制 約都是不可避免的,做好自身發(fā)展定位極為重要。因此我們 要對面向服務群及自身的潛在資源產生足夠的了解,而通過 數據挖掘技術則可以幫助我們提升規(guī)劃結果的科學性。其次,圖書館的經營過程中,人才是至關重要的,而所 謂人才無外乎專業(yè)水平、思想道德、現代化信息技術水平等。 因此,我們可以在收集相關文獻的基礎上,從中建立一個可 執(zhí)行、可調整以及可預測的模型,為人才的規(guī)劃提供科學依 據。第三,文獻管理

7、歸根結底屬于知識管理,而知識管理又 是從數據中對有效知識進行管理的過程,數據挖掘技術作為 從數據庫中抽取未知、隱含、具有潛在價值信息的過程,二 者兩雖有區(qū)別,但具有更大的一致性。因此,文獻信息管理 是可以利用數據挖掘技術來發(fā)現及解決問題的。尤其在當前 的環(huán)境下,資金比較受限制,如何做好各學科的分配更是非 常重要。4. 2應用于讀者服務(1) 為讀者起到導讀的作用。在圖書館中,讀者導讀 一直屬于一項工作重點。當前屬于數字化時代,信息資源無 論在數量上,還是在速度和來源上,相對以往都有很大的不 同,這就導致我們讀者容易產生信息過剩反而無從下手的感 覺。因此,導讀工作的重要性不言而喻。具體來說,分類

8、技 術能夠對數量龐大的信息資源進行分類;聚類技術則可以對 雜亂無序的信息進行歸類,進而給其標引或者建立一個相應 數據庫,這能夠幫助信息用戶群的不同信息需求。舉例來說, 我們可以以用戶角度出發(fā),對用戶在何種情況下需要何種信 息解決何種問題進行了解,也就是對用戶信息需求進行全面 的了解,進而確定信息使用模式,然后設計更為有效地信息 服務系統。此外,在讀者檢索的過程中,傳統的信息數據庫定題情 報服務當前存在著很大的難題,對于一些排列不規(guī)范或者無 序的電子信息要要在不同平臺上操作,效率很多。而通過數 據挖掘技術能夠對各種數據進行整合,把不同平臺電子版信 息及紙質圖書利用四種規(guī)則建立一惡搞統一平臺,這能

9、夠極 大地提升檢索效率。(2) 服務競爭情報。當前隨著市場化的加劇,圖書館 服務更為重視經濟及社會效益,使得不論是高校科研教育服 務,還是企業(yè)服務,競爭性都成為了一個重要的課題。在這 種背景下,數據挖掘技術可以對競爭情報起到服務的作用, 這方面的研究成果主要有專題情報價值數據挖掘、面向集成 競爭情報系統數據挖掘等,可以說已經獲得了較為廣泛的應 用。(3) 提供個性化web服務。所謂web個性化,主要是 通過web數據對網站的信息及服務進行調節(jié),進而滿足不同 客戶的不同需求。在這一過程中,我們主要的過程是對服務 器中保存的訪問日志數據、代理日志數據以及引用日志數據 進行收集,然后利用模型化算法或者一些其他信息處理技術 對這些數據進行加工,獲取我們所需要的決策信息,最終以 此為基礎建設特殊數字資源以及網絡虛擬資源,實現web個 性化服務。5. 結語在圖書管理中,數據挖掘技術將來必然會有有著更為廣 泛的應用,這些應用將體現在資源建設、讀者服務以及決策 管理等各個方面。因此,對于我們圖書館員來說,要加強自 身在這方面的水平,不僅要對一些基本技能進行掌握,平時 工作中還要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論