從知識(shí)運(yùn)轉(zhuǎn)模式論知識(shí)挖掘_第1頁(yè)
從知識(shí)運(yùn)轉(zhuǎn)模式論知識(shí)挖掘_第2頁(yè)
從知識(shí)運(yùn)轉(zhuǎn)模式論知識(shí)挖掘_第3頁(yè)
從知識(shí)運(yùn)轉(zhuǎn)模式論知識(shí)挖掘_第4頁(yè)
從知識(shí)運(yùn)轉(zhuǎn)模式論知識(shí)挖掘_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、從知識(shí)運(yùn)轉(zhuǎn)形式論知識(shí)挖掘隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)通訊技術(shù)、高密度存儲(chǔ)技術(shù)、數(shù)據(jù)挖掘技術(shù)等的廣泛應(yīng)用,改變了情報(bào)研究組織獲取信息的方式和方法,以及其內(nèi)部信息資源保障體系的效勞手段和工作重心。這就要求情報(bào)研究知識(shí)管理系統(tǒng)不僅要完成一般性的知識(shí)管理功能,還應(yīng)該在對(duì)知識(shí)管理的根底上應(yīng)用現(xiàn)代化手段實(shí)現(xiàn)知識(shí)挖掘,即利用智能工具挖掘蘊(yùn)藏于海量顯性知識(shí)中的隱性知識(shí)。1、知識(shí)與知識(shí)運(yùn)轉(zhuǎn)模型1.1顯性知識(shí)和隱性知識(shí)1958年,英國(guó)物理學(xué)家和哲學(xué)家.Planyi在其代表作?個(gè)體知識(shí)?中首先提出了隱性知識(shí)和顯性知識(shí)的概念,后來(lái),I.Nnaka又對(duì)隱性知識(shí)和顯性知識(shí)的概念進(jìn)展了較明確的定義1:隱性知識(shí)TaitKnledge

2、是建立在個(gè)人經(jīng)歷根底之上并涉及各種無(wú)形因素的知識(shí),多為主觀洞察力、直覺(jué)和預(yù)感性知識(shí)。其根植于個(gè)人行為、經(jīng)歷和知識(shí)情景中,與人們的行為嚴(yán)密相連,難以編碼和度量,是計(jì)算機(jī)不容易直接處理的知識(shí);顯性知識(shí)ExpliitKnledge是指那些有形媒體所攜有的知識(shí),可以以正式的語(yǔ)言,通過(guò)書(shū)面記錄、數(shù)字描繪、技術(shù)文件、手冊(cè)和報(bào)告等明確表達(dá)和交流的知識(shí),是可以被進(jìn)展編碼和度量的、可由計(jì)算機(jī)處理的知識(shí),是對(duì)隱性知識(shí)一定程度的抽象和概括。1.2基于知識(shí)管理的知識(shí)運(yùn)轉(zhuǎn)形式I.Nnaka和H.Takeuhi把知識(shí)轉(zhuǎn)化歸納為以下四種形式2:社會(huì)化、外在化、綜合化以及內(nèi)隱化。社會(huì)化是個(gè)人間分享隱性知識(shí)的過(guò)程;外在化是對(duì)隱

3、性知識(shí)的明晰表述,是從隱性知識(shí)向顯性知識(shí)的轉(zhuǎn)化;綜合化是一種知識(shí)擴(kuò)散的過(guò)程,通過(guò)分布式文檔管理、內(nèi)容管理、數(shù)據(jù)倉(cāng)庫(kù)等工具將個(gè)人知識(shí)上升為組織知識(shí);內(nèi)隱化意味著顯性的組織知識(shí)轉(zhuǎn)化為組織中其他成員的隱性知識(shí),成員吸收后在其工作過(guò)程中創(chuàng)造出新的隱性知識(shí)。在此根底上他們提出了“知識(shí)應(yīng)用知識(shí)獲泉知識(shí)組織知識(shí)擴(kuò)散的轉(zhuǎn)換過(guò)程,組織知識(shí)創(chuàng)造是隱性知識(shí)和顯性知識(shí)持續(xù)互動(dòng)的結(jié)果。個(gè)人隱性知識(shí)是組織知識(shí)創(chuàng)造的根底,在知識(shí)創(chuàng)造螺旋中四種知識(shí)轉(zhuǎn)化形式是互相連續(xù)的、螺旋上升的,不斷增加著個(gè)體和組織知識(shí)庫(kù)的容量。知識(shí)管理所要實(shí)現(xiàn)的是組織中個(gè)人的隱性知識(shí)即內(nèi)隱到組織的顯性知識(shí)外顯,再到組織的內(nèi)部知識(shí)之間的轉(zhuǎn)化。其目的是促進(jìn)系

4、統(tǒng)內(nèi)知識(shí)的獲娶存儲(chǔ)、開(kāi)展和共享。這就需要首先使知識(shí)可以在系統(tǒng)內(nèi)運(yùn)轉(zhuǎn)流動(dòng)起來(lái)。從知識(shí)之間的四種轉(zhuǎn)化形式分析得出,在系統(tǒng)知識(shí)管理過(guò)程中,知識(shí)運(yùn)轉(zhuǎn)經(jīng)歷以下幾個(gè)環(huán)節(jié):沉淀,即知識(shí)編碼,是知識(shí)從隱性到顯性的過(guò)程;共享,即知識(shí)可以為更多組織成員所學(xué)習(xí)和應(yīng)用的過(guò)程;學(xué)習(xí)和應(yīng)用,即吸收組織內(nèi)的隱性和顯性知識(shí)應(yīng)用于工作理論從而創(chuàng)造價(jià)值,與共享環(huán)節(jié)一起改善知識(shí)擴(kuò)散度;創(chuàng)新,即獲取外部新知識(shí)或提升內(nèi)部知識(shí)層次。沉淀、共享、學(xué)習(xí)和應(yīng)用、創(chuàng)新四個(gè)關(guān)鍵的知識(shí)運(yùn)轉(zhuǎn)環(huán)節(jié)組合成一個(gè)螺旋上升的閉環(huán),稱之為“知識(shí)運(yùn)轉(zhuǎn)形式。知識(shí)運(yùn)轉(zhuǎn)形式(略)說(shuō)明組織中的知識(shí)經(jīng)過(guò)沉淀、共享、學(xué)習(xí)和應(yīng)用、創(chuàng)新四個(gè)環(huán)節(jié)的循環(huán)之后,實(shí)現(xiàn)了螺旋式上升,組織中

5、的知識(shí)不斷地進(jìn)展著隱性知識(shí)和顯性知識(shí)的互相轉(zhuǎn)化。在這個(gè)過(guò)程中,從個(gè)人的內(nèi)隱知識(shí)轉(zhuǎn)化到組織的外顯知識(shí)時(shí),必須利用智能工具挖掘蘊(yùn)藏于海量顯性知識(shí)中的隱性知識(shí),知識(shí)挖掘技術(shù)起著非常重要的作用。2、知識(shí)挖掘概念知識(shí)挖掘?qū)儆谥R(shí)科學(xué)中的概念。知識(shí)挖掘是從資料集中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的形式的非平凡過(guò)程。知識(shí)挖掘是對(duì)資源所包含的顯性知識(shí)進(jìn)展提煉,如從各類文獻(xiàn)中提取斷言型、解釋型和數(shù)值型的知識(shí)元;對(duì)同類數(shù)值型知識(shí)元進(jìn)展列表比照,發(fā)現(xiàn)文獻(xiàn)的隱性關(guān)聯(lián);對(duì)知識(shí)元進(jìn)展可視化處理、文獻(xiàn)智能聚類等,使信息增值。知識(shí)挖掘的目的是運(yùn)用最新的智能工具來(lái)挖掘蘊(yùn)藏于海量顯性信息中的隱性知識(shí),并形成專業(yè)知

6、識(shí)庫(kù)和知識(shí)倉(cāng)庫(kù)。將隱性知識(shí)顯性化并給予管理利用,非常符合情報(bào)分析研究用戶對(duì)個(gè)性化、隱性知識(shí)的需求,可以真正支撐起情報(bào)分析研究知識(shí)管理系統(tǒng)的顯性知識(shí)與隱性知識(shí)全方位開(kāi)發(fā)戰(zhàn)略。3、Ltus知識(shí)發(fā)現(xiàn)實(shí)例分析Ltus的知識(shí)挖掘方案是一種成型的知識(shí)挖掘形式。這種形式主要是通過(guò)知識(shí)倉(cāng)庫(kù)來(lái)實(shí)現(xiàn),知識(shí)倉(cāng)庫(kù)是外部異構(gòu)的相關(guān)數(shù)據(jù)庫(kù)和本機(jī)構(gòu)知識(shí)庫(kù)構(gòu)成的虛擬“庫(kù)集合。知識(shí)庫(kù)中的所有知識(shí)單元被統(tǒng)一于同樣的標(biāo)準(zhǔn)之下3。這樣,知識(shí)挖掘就可以通過(guò)統(tǒng)計(jì)和分析工具在知識(shí)庫(kù)中完成。Ltus第三代A構(gòu)架(略)3.1Ltus知識(shí)發(fā)現(xiàn)的新理念Ltus知識(shí)發(fā)現(xiàn)解決方案是包括前端桌面應(yīng)用和后端效勞器應(yīng)用的完好系統(tǒng),可以幫助企業(yè)發(fā)現(xiàn)和有效利用

7、存儲(chǔ)在信息系統(tǒng)中的“信息內(nèi)容和掌握在人腦中的“專家技能。前端的Ltus知識(shí)工作站KStatin是一個(gè)基于eb的知識(shí)門(mén)戶解決方案,結(jié)合了Ltus先進(jìn)的門(mén)戶技術(shù)、實(shí)時(shí)協(xié)作平臺(tái)Saetie和群組協(xié)作解決方案QuikPlae等核心協(xié)作工具與效勞,集應(yīng)用、協(xié)作效勞和個(gè)人效勞3個(gè)根本層次于一體,把“人、場(chǎng)所和事件3個(gè)知識(shí)管理的根本因素統(tǒng)一到單一的界面上,提供群組協(xié)作應(yīng)用功能,允許相關(guān)人員通過(guò)LtusNtes客戶端或閱讀器單一訪問(wèn)入口,以發(fā)現(xiàn)、共享和傳遞知識(shí)。后端的LNs知識(shí)發(fā)現(xiàn)效勞器可以發(fā)現(xiàn)“人、場(chǎng)所和事件之間的關(guān)系,幫助用戶從存儲(chǔ)在企業(yè)文檔、數(shù)據(jù)庫(kù)、電子郵件、eb以及ERP等業(yè)務(wù)系統(tǒng)的信息中挖掘知識(shí)。3

8、.2Ltus第三代A構(gòu)架分析第三代辦公自動(dòng)化系統(tǒng)以知識(shí)管理為核心,隨著Internet技術(shù)的迅速開(kāi)展,Ltus進(jìn)一步將Internet/Intranet/Extranet因特網(wǎng)、內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)的技術(shù)和應(yīng)用與群件技術(shù)進(jìn)展成功的集成,從而形成了以知識(shí)管理為核心的信息技術(shù)。圖2顯示了Ltus第三代A構(gòu)架。其中底層是企業(yè)的根本信息支撐環(huán)境,它包括RPIIanufatureResurePlanningII、ISanageentInfratinSyste系統(tǒng)對(duì)企業(yè)內(nèi)部各種層次消費(fèi)經(jīng)營(yíng)管理過(guò)程的信息化支撐,以及對(duì)企業(yè)外部Internet的信息獲齲三類系統(tǒng)的互相作用表達(dá)了Intranet的思想,通過(guò)設(shè)計(jì)與實(shí)現(xiàn)

9、優(yōu)秀的Internet信息獲取工具,可以有效地利用外部的有用信息為企業(yè)內(nèi)部的經(jīng)營(yíng)管理過(guò)程效勞。第二層是企業(yè)多維知識(shí)倉(cāng)庫(kù),存在于底層企業(yè)信息支撐環(huán)境中的企業(yè)信息資源是龐雜而海量的,需要在數(shù)據(jù)挖掘與形式提取的工具支持下,開(kāi)掘其中有價(jià)值的形式與知識(shí),進(jìn)展嚴(yán)密而科學(xué)的組織,這是支持知識(shí)管理系統(tǒng)實(shí)現(xiàn)的有利根據(jù)。圖中的圓環(huán)代表了企業(yè)員工的工作環(huán)境,其上的各個(gè)結(jié)點(diǎn)代表企業(yè)中不同崗位上的企業(yè)員工。知識(shí)管理的目的就在于更好地支持各個(gè)層次企業(yè)員工的工作流過(guò)程,包括:a.員工與企業(yè)知識(shí)倉(cāng)庫(kù)之間的個(gè)人知識(shí)挖掘與交融過(guò)程,用于完成員工不斷根據(jù)個(gè)人需求在知識(shí)倉(cāng)庫(kù)中的映射與知識(shí)提取,以及員工個(gè)人知識(shí)不斷交融進(jìn)入企業(yè)整個(gè)知識(shí)

10、倉(cāng)庫(kù)的過(guò)程;b.員工之間的知識(shí)流轉(zhuǎn)與共享過(guò)程,提供了不同知識(shí)映射集合之間共享與穿插的可能,同時(shí)也提供了無(wú)法進(jìn)入企業(yè)知識(shí)倉(cāng)庫(kù)中的非構(gòu)造化個(gè)人頭腦知識(shí)的交流與互動(dòng)的時(shí)機(jī),從而可能引發(fā)新知識(shí)的產(chǎn)生;.個(gè)人知識(shí)支持的工作過(guò)程與信息反應(yīng)過(guò)程,是在個(gè)人知識(shí)平臺(tái)支持下指導(dǎo)實(shí)現(xiàn)員工的工作過(guò)程,以及工作結(jié)果的信息反應(yīng)過(guò)程。充分利用這一過(guò)程,可以及時(shí)地搜集知識(shí)利用的反應(yīng)信息,為閉環(huán)知識(shí)管理系統(tǒng)的完善與控制提供了必要基矗基于企業(yè)多維知識(shí)倉(cāng)庫(kù)還可以通過(guò)進(jìn)一步的知識(shí)支持與決策分析過(guò)程,建立面向決策的企業(yè)決策支持系統(tǒng),也就是圖中的第三層。通過(guò)建立決策模型與先進(jìn)系統(tǒng)理論的應(yīng)用,支持企業(yè)決策者高層次的管理決策過(guò)程,從根本上決

11、定與引導(dǎo)企業(yè)的開(kāi)展演變過(guò)程。由上述分析,可以看到知識(shí)在企業(yè)內(nèi)部的縱向提取過(guò)程、員工與知識(shí)系統(tǒng)的發(fā)散性交融作用、企業(yè)員工工作環(huán)境中員工知識(shí)的互相穿插作用,相增相長(zhǎng),以及員工知識(shí)在企業(yè)信息管理中的循環(huán)更新過(guò)程,這正是知識(shí)管理系統(tǒng)的邏輯實(shí)現(xiàn)模型。轉(zhuǎn)貼于論文聯(lián)盟.ll.4、基于知識(shí)挖掘的相關(guān)技術(shù)從對(duì)Ltus系統(tǒng)構(gòu)架的分析,可以看到知識(shí)挖掘所涉及的主要技術(shù)有知識(shí)分類技術(shù)、數(shù)據(jù)倉(cāng)庫(kù)技術(shù)、聯(lián)機(jī)分析挖掘技術(shù)、eb挖掘技術(shù)和信息可視化技術(shù)等。4.1知識(shí)分類技術(shù)Knledgelassifying知識(shí)分類是直接對(duì)知識(shí),而不是對(duì)圖書(shū)資料進(jìn)展分類,它不同于傳統(tǒng)的圖書(shū)分類法,知識(shí)分類是基于現(xiàn)代科學(xué)理論和認(rèn)知理論,參照教育

12、部制定的學(xué)科分類、科技部制定的自然科學(xué)基金學(xué)科指南以及其他分類方法編制的知識(shí)分類體系,據(jù)此對(duì)資源進(jìn)展知識(shí)層面上的分類。4.2數(shù)據(jù)倉(cāng)庫(kù)技術(shù)Knledgearehusing數(shù)據(jù)倉(cāng)庫(kù)概念的創(chuàng)始人.H.Inn在?BuildingtheDataarehuse?一書(shū)中指出:“數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)集合,用以支持經(jīng)營(yíng)管理中的決策制定過(guò)程4。首先,數(shù)據(jù)倉(cāng)庫(kù)用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫(kù);其次,數(shù)據(jù)倉(cāng)庫(kù)是對(duì)多個(gè)異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)展了重組,并包含歷史數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)體系構(gòu)造包括以下四個(gè)局部見(jiàn)圖3:a.數(shù)據(jù)源。是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的根

13、底,是整個(gè)系統(tǒng)的數(shù)據(jù)源泉。b.數(shù)據(jù)的存儲(chǔ)與管理。是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的核心,數(shù)據(jù)倉(cāng)庫(kù)的真正關(guān)鍵是數(shù)據(jù)的存儲(chǔ)和管理。數(shù)據(jù)倉(cāng)庫(kù)的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫(kù),同時(shí)也決定了其對(duì)外部數(shù)據(jù)的表現(xiàn)形式。.LAP效勞器。對(duì)分析需要的數(shù)據(jù)進(jìn)展有效集成,按多維模型予以組織,以便進(jìn)展多角度、多層次的分析,并發(fā)現(xiàn)趨勢(shì)。d.前端工具。主要包括各種報(bào)表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的應(yīng)用開(kāi)發(fā)工具。其中數(shù)據(jù)分析工具主要針對(duì)LAP效勞器,報(bào)表工具、數(shù)據(jù)挖掘工具主要針對(duì)數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)構(gòu)架(略)知識(shí)倉(cāng)庫(kù)強(qiáng)調(diào)為決策者提供一個(gè)提升知識(shí)管理流程全過(guò)程的智能分析平臺(tái)。知識(shí)倉(cāng)庫(kù)可以對(duì)不

14、同類型的知識(shí)顯性知識(shí)和隱性知識(shí)和不同形式的知識(shí)純文本、二進(jìn)制對(duì)象、模型、圖形等進(jìn)展捕捉、存儲(chǔ)、編碼、組織和分析。另外,這些知識(shí)還包括元知識(shí)關(guān)于知識(shí)的知識(shí)和分析后產(chǎn)生的新知識(shí)。數(shù)據(jù)倉(cāng)庫(kù)的目的是要建立一種體系化的數(shù)據(jù)存貯環(huán)境,將分析決策所需的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中別離出來(lái),使分散的、不一致的操作數(shù)據(jù)轉(zhuǎn)換成集成的、統(tǒng)一的信息,組織內(nèi)的成員都可以在此單一的環(huán)境之下,通過(guò)運(yùn)用其中的數(shù)據(jù)與信息,發(fā)現(xiàn)全新的視野和新的問(wèn)題、新的分析方法,進(jìn)而開(kāi)展成制度化的決策系統(tǒng),并獲取更大效益。知識(shí)倉(cāng)庫(kù)應(yīng)具備以下主要功能:消費(fèi)和組織知識(shí)的功能、檢索和管理知識(shí)的功能、隱性知識(shí)共享和轉(zhuǎn)化功能、知識(shí)存儲(chǔ)和檢索功能、知識(shí)分析和

15、決策功能、新知識(shí)的產(chǎn)生和反應(yīng)功能、用戶行為分析跟蹤功能等。4.3聯(lián)機(jī)分析挖掘技術(shù)LA,nlineAnalytialiningLA是LAP和D相結(jié)合的產(chǎn)物,LAPnlineAnalytialPressing,聯(lián)機(jī)分析處理與DDataining,數(shù)據(jù)挖掘是基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)而開(kāi)展起來(lái)的信息分析與挖掘工具。在系統(tǒng)中LA和LAP往往是集成應(yīng)用的如圖4。集成的LA和LAP構(gòu)造(略)LAP是驗(yàn)證型的,建立在多維視圖的根底上,重在根據(jù)已有的形式將直接源自數(shù)據(jù)倉(cāng)庫(kù)中的不同信息源的大量相關(guān)信息聯(lián)絡(luò)起來(lái),以給分析人員一個(gè)明晰、一致的視圖。LAP的多維數(shù)據(jù)分析與數(shù)據(jù)倉(cāng)庫(kù)的多維數(shù)據(jù)組織正好形成互相結(jié)合、互相補(bǔ)充的關(guān)系。

16、LAP的多維數(shù)據(jù)分析主要通過(guò)對(duì)多維數(shù)據(jù)的維進(jìn)展剖切、鉆取和旋轉(zhuǎn)來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)所提供的數(shù)據(jù)進(jìn)展深化分析,為決策者提供決策支持。多維構(gòu)造是決策支持的支柱,也是LAP的核心。多維構(gòu)造中的維打破了三維概念,可以是超立方體和多立方體的數(shù)據(jù)構(gòu)造。LAP主要有兩個(gè)特點(diǎn):一是在線性nline,即對(duì)用戶的懇求做出快速響應(yīng);二是可以應(yīng)用多種統(tǒng)計(jì)分析工具、算法對(duì)數(shù)據(jù)進(jìn)展多維分析ultianalysis。D是挖掘型的,建立在各種信息源的根底上,重在發(fā)現(xiàn)隱藏在大量原始數(shù)據(jù)深層中的對(duì)人們有用的形式patterns。D有兩個(gè)主要過(guò)程,即建立模型和預(yù)測(cè)將來(lái)結(jié)果。LA兼有LAP多維分析的在線性、靈敏性和D對(duì)數(shù)據(jù)處理的深化性,L

17、A效勞器可以執(zhí)行如概念描繪、關(guān)聯(lián)、分類、預(yù)測(cè)、聚類、時(shí)間序列分析等多種數(shù)據(jù)挖掘任務(wù),它通常由多個(gè)集成的數(shù)據(jù)挖掘模塊組成,比LAP效勞器復(fù)雜得多。目前LA正處于研究之中,針對(duì)LA的開(kāi)展驅(qū)動(dòng)力和根本構(gòu)造,以下幾點(diǎn)是必要的:LA建立在多維數(shù)據(jù)庫(kù)和LAP的根底之上,能對(duì)任何它想要的數(shù)據(jù)進(jìn)展挖掘;用戶對(duì)挖掘算法具有動(dòng)態(tài)選擇的權(quán)利;具有強(qiáng)大的基于超立方體的挖掘算法;可以協(xié)調(diào)好執(zhí)行效率與挖掘的準(zhǔn)確性之間的關(guān)系;具有靈敏的可視化工具和良好的擴(kuò)展性。通過(guò)把LA和技術(shù)相結(jié)合,形成網(wǎng)絡(luò)聯(lián)機(jī)分析挖掘技術(shù)。特別合適數(shù)據(jù)量宏大、信息類型復(fù)雜、表現(xiàn)形式繁多的網(wǎng)絡(luò)信息資源的挖掘和組織,這是目前最新的數(shù)據(jù)挖掘技術(shù)。4.4eb挖

18、掘技術(shù)ebining隨著Internet在流量、規(guī)模和復(fù)雜度等方面的飛速增長(zhǎng),成為一個(gè)宏大的、分布廣泛的、全球性的信息效勞中心。eb中包含了eb頁(yè)面的內(nèi)容信息、豐富的超鏈接信息以及eb頁(yè)面的訪問(wèn)和使用信息,為數(shù)據(jù)挖掘提供了豐富的資源。eb挖掘就是利用數(shù)據(jù)挖掘技術(shù)從eb文檔和eb活動(dòng)中抽取人們感興趣的、潛在的、有用的規(guī)律和形式。eb挖掘可分為三類:a.eb內(nèi)容挖掘ebntentining。對(duì)eb頁(yè)面的內(nèi)容進(jìn)展挖掘,主要是對(duì)各種非構(gòu)造化數(shù)據(jù),如文本、音頻、視頻和圖形圖像等各種數(shù)據(jù)相交融的多媒體數(shù)據(jù)挖掘。b.eb構(gòu)造挖掘ebStrutureining。對(duì)eb頁(yè)面之間的構(gòu)造進(jìn)展挖掘,從的組織構(gòu)造和連接

19、關(guān)系中推導(dǎo)知識(shí),如HITS算法5。.eb使用信息挖掘ebUsageining。通過(guò)eb日志文件和相關(guān)數(shù)據(jù),對(duì)用戶訪問(wèn)eb時(shí)留下的訪問(wèn)記錄進(jìn)展挖掘,發(fā)現(xiàn)用戶訪問(wèn)eb頁(yè)面的形式。4.5信息可視化技術(shù)InfratinVisualizatin信息可視化技術(shù)正在成為信息科學(xué)的一個(gè)重要分支。它的目的是實(shí)現(xiàn)信息的知覺(jué)化、感知化。信息可視化集成了多方面的內(nèi)容,包括信息抽取和描繪、人機(jī)交互、數(shù)據(jù)挖掘、制圖學(xué)和成像學(xué)等。信息可視化對(duì)知識(shí)挖掘的支持是將抽象的、典型的非數(shù)字化如文本信息轉(zhuǎn)換為二維或三維圖形的形式。它可幫助用戶理解大規(guī)模數(shù)據(jù)集合,在處理信息可視化空間內(nèi),可以顯示和觀察數(shù)據(jù)屬性,被顯示的對(duì)象之間的隱藏關(guān)系變得顯而易見(jiàn)。信息可視化參考模型(略)可視化信息系統(tǒng)的開(kāi)發(fā)由以下幾局部組成6:a.確定有意義的信息特征,即真正理解準(zhǔn)備可視化的信息;b.明晰地定義一個(gè)可視化空間二維或三維,這個(gè)空間用于存放可視化對(duì)象;.映射數(shù)字化描繪或者確定在二維或三維可視化環(huán)境中可視化對(duì)象的位置;d.集成用于搜索可視化信息和與其進(jìn)展交互的工具。信息可視化運(yùn)用圖形化技術(shù)支持多種多樣的交互功能,便于用戶探究概念關(guān)系和

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論