數(shù)據(jù)挖掘課程設(shè)計(jì)匯本_第1頁(yè)
數(shù)據(jù)挖掘課程設(shè)計(jì)匯本_第2頁(yè)
數(shù)據(jù)挖掘課程設(shè)計(jì)匯本_第3頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余14頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、本科課程設(shè)計(jì)及實(shí)驗(yàn)期末成績(jī)?cè)u(píng)估系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘設(shè)計(jì)課 課 學(xué) 學(xué) 學(xué) 系: 專 指 教 開(kāi)稱號(hào)名號(hào) 院數(shù)據(jù)挖掘08060116cwl2008052251信息科學(xué)技術(shù)學(xué)院計(jì)算機(jī)科學(xué)系業(yè)師位間軟件工程lb信息學(xué)院計(jì)算機(jī)系20102011學(xué)年度第二 學(xué)期2011年06月20日第1章概述1.1應(yīng)用背景和問(wèn)題的提出在大學(xué)生活中,我們大學(xué)生在某種程度上還是比擬重視自己的課程成績(jī)的。而有一個(gè)期末最終成績(jī)的評(píng)估系統(tǒng),無(wú)疑對(duì)同學(xué)們而言是很有用的。在這個(gè)系統(tǒng)中,只需輸入你估計(jì)的平時(shí)成績(jī)以及表現(xiàn)和期末考試的得分,就可以預(yù)測(cè)出最終的成績(jī)。而這個(gè)課程成績(jī)的組成以及得出是怎么樣的呢。這個(gè)最終的得分是受到什么影響呢

2、?本論文就以上問(wèn)題進(jìn)展了探討和挖掘。1.2設(shè)計(jì)容的介紹本課程設(shè)計(jì)主要是探討和研究在教師給定成績(jī)時(shí)考慮的因素,以及這些因素所占的比例。數(shù)據(jù)倉(cāng)庫(kù)為一份記錄著 600個(gè)同學(xué)的得分情況的數(shù)據(jù),數(shù)據(jù)挖掘那么采 用決策樹(shù)探究出影響結(jié)婚年齡的因素。第2章數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)2.1概念模型設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)里面有一個(gè)實(shí)體,也就是成績(jī)scoreo成績(jī)的決定因素有performanee也就平時(shí)表現(xiàn)情況,即根據(jù)其在課堂上的活潑程度以及認(rèn)真聽(tīng)課的情況來(lái)給的分, 還有averscore就是同學(xué)平時(shí)的作業(yè)得分以及平時(shí)測(cè)試或者期中測(cè)試的平均成績(jī),以及期末考試的成績(jī)lasttesto2.2邏輯模型設(shè)計(jì)2.3物理模型設(shè)計(jì)要解決數(shù)據(jù)的存儲(chǔ)構(gòu)造

3、、略、存儲(chǔ)分配優(yōu)化等問(wèn)一是提高性能,二是更好本數(shù)據(jù)倉(cāng)庫(kù)只有一個(gè)表,邏輯模型設(shè)計(jì)如下:在數(shù)據(jù)倉(cāng)庫(kù)的物理設(shè)計(jì)中,主數(shù)據(jù)的索引策略、數(shù)據(jù)的存儲(chǔ)策題。物理設(shè)計(jì)的主要目的有兩個(gè),地管理存儲(chǔ)的數(shù)據(jù)。訪問(wèn)的頻率、數(shù)據(jù)容量、選擇的RDBMS支持的特性和存儲(chǔ)介 質(zhì)的配置都會(huì)影響物理設(shè)計(jì)的最終結(jié)果。在本數(shù)據(jù)挖掘中,數(shù)據(jù)的索引策略采取的 并不是位圖索引而是按列索引2.4 OLAP模型設(shè)計(jì)在本設(shè)計(jì)中由于案例考慮的并不復(fù)雜,所以 OLAP模型設(shè)計(jì)也就比擬的簡(jiǎn)單F面的數(shù)據(jù)是保存在ExceI中的。大概的模型設(shè)計(jì)也就如下列圖所示2.5 OLAP前端展示設(shè)計(jì)第3章數(shù)據(jù)挖掘分析3.1期末成績(jī)?cè)u(píng)估系統(tǒng)應(yīng)用挖掘概述在本系統(tǒng)中,數(shù)據(jù)倉(cāng)

4、庫(kù)采用一個(gè)二維表來(lái)存儲(chǔ)和表示同學(xué)們的平時(shí)成績(jī),平時(shí) 表現(xiàn)得分,以及期末成績(jī)等屬性。數(shù)據(jù)挖掘那么采用關(guān)聯(lián)分析來(lái)將二維表中的實(shí)例 分開(kāi),并探究這些數(shù)據(jù)所蘊(yùn)含的規(guī)律。3.2數(shù)據(jù)挖掘?qū)嶒?yàn)實(shí)驗(yàn)環(huán)境Win dows XPMicrosoft SQL Server 2008Microsoft Visual Studio 2008Microsoft Office 2003 Excel Access數(shù)據(jù)準(zhǔn)備及預(yù)處理首先選擇數(shù)據(jù)源,以下幾個(gè)截圖是在做實(shí)驗(yàn)時(shí)的幾個(gè)步驟A 1.1 id ibvat<* Lise */jndos A«jthenitieal'iohU se SU L 8 erve

5、i Amthert ictionijger name:Pass wardr廠Flffh e-ahti曰1曰匕!=!舊:OHockbu O er slHrmotifeoinSp&eifi ikm litre to 亡茲口并 d-ata to巨冃齊iiimcti onl 鯊QjL biJi MTivr lmi|Liii rl n ri ili t W iJ呂口1_ G&rve-r Malive aieiit 1 0 O< 且uGkErnii小1fie 皿 >ftSurvEJi- Drri pcji t <1 in cl EjM.pur ti cJ*Q>uy

6、需 «nc D 奇 tdlTH& exociuion wqs sugc»a ttful11 T otai Eiroi11 匸ili亡亡亡田皇 XA/arKirbgIn和ali己irg ID a冶 Flow 7sl-IrhitializH-ki 匸d 門(mén)廠ueuli口邛壬5 LUU匸鼻£5:Sehina SOL Com man dS uc=&esSetting Source 匚已ulham5uc=£essSett*n口 D eCtf-ialiQnt ConnectionS iLjcos&s/-ahcdatingPi epare fo

7、r E xectMeS nicoesPreexeicuiteSuecesiEMBoubri 口S uccesrECcMiy to d)bo.H:iSutGSM599 roL triisfezriedPcsLue skddMd呂 bDC.D 賀 Et| 旦i-tinfI ix廠五雹n尸BwoitCIOUQ323實(shí)驗(yàn)容輸入數(shù)據(jù)集,選擇算法,輸出結(jié)果,比擬分析1建立一個(gè) Analysis Services Projects工程,在數(shù)據(jù)源中輸入數(shù)據(jù)集:Kl廠 nmrk:5eL-U2!4Loo on to the- s«FverC: IIII III i» Mrink44U.

8、1;rl'Cr3 LJs Wlndo wfIcjstlo nJl Os-e- OL Sts* vuF 疤匸口I e- st <Zoniriectlo«-iOfcHelp-AH說(shuō)明:以上實(shí)驗(yàn)室在實(shí)驗(yàn)室做的,由于時(shí)間不夠,回到宿舍自己安裝了中文版的SQL SERVE工具,并完成接下來(lái)的實(shí)驗(yàn)步驟。324算法選擇分類(lèi)的任務(wù)是通過(guò)分析由類(lèi)別數(shù)據(jù)對(duì)象組成的訓(xùn)練數(shù)據(jù)集,建立描述并區(qū)分?jǐn)?shù) 據(jù)對(duì)象類(lèi)別的分類(lèi)函數(shù)或分類(lèi)模型也常常稱作分類(lèi)器。分類(lèi)算法有多種,例如,決策樹(shù)分類(lèi)算法、神經(jīng)網(wǎng)絡(luò)分類(lèi)算法、貝葉斯分類(lèi)算 法等。這里需要用的是決策樹(shù)分類(lèi)算法。在本挖掘中選擇是 關(guān)聯(lián)分析,分析過(guò)程和結(jié)果如以

9、下列圖所示:F面是挖掘模型:J型查看蠱廚 穂掘推確性團(tuán)叢挖捆模型預(yù)測(cè)TALastLestBUI“U1UII£J Illi, bill !< Jill M4. j f erferniaiiceS acreMi crcs oft_Assoc i ati on_RulftE Fr#di ciKsyPredictPredictPr edict項(xiàng)集:關(guān)聯(lián)規(guī)那么:財(cái)翊車(chē)匚工6££制提升圖:分類(lèi)矩陣:依賴關(guān)系網(wǎng)絡(luò)圖:后來(lái)我用回歸預(yù)測(cè)法,得到了一個(gè)散點(diǎn)圖,說(shuō)明預(yù)測(cè)值和實(shí)際值是有一定的關(guān)聯(lián)的:巨挖捉蚊神的數(shù)掘挖靈敬必圈:Tt通過(guò)以上的分析,我們得出一個(gè)結(jié)論,就是期末成績(jī)?cè)谧罱K得分中所占的比例 最大,平時(shí)成績(jī)和平時(shí)表現(xiàn)的權(quán)重差不多,在這個(gè)結(jié)論中,期末考試的成績(jī)的重要 性,不言而喻,增加期末考試的成績(jī),最能提高最終成績(jī),平時(shí)成績(jī)和表現(xiàn)的得分 也很重要,但相對(duì)權(quán)重沒(méi)有期末成績(jī)大。一個(gè)分?jǐn)?shù)高的學(xué)生,他的所有成績(jī)都應(yīng)該 是很高的。參考文獻(xiàn):1 Jamie MacLe

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論