《數(shù)據(jù)挖掘原理與應(yīng)用》教學(xué)大綱_第1頁(yè)
《數(shù)據(jù)挖掘原理與應(yīng)用》教學(xué)大綱_第2頁(yè)
《數(shù)據(jù)挖掘原理與應(yīng)用》教學(xué)大綱_第3頁(yè)
《數(shù)據(jù)挖掘原理與應(yīng)用》教學(xué)大綱_第4頁(yè)
《數(shù)據(jù)挖掘原理與應(yīng)用》教學(xué)大綱_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《數(shù)據(jù)挖掘原理與應(yīng)用》教學(xué)大綱課程編號(hào):06220225英文名稱:Principleandapplicationofdatamining學(xué)分:4學(xué)時(shí):總學(xué)時(shí)64學(xué)時(shí),其中理論32學(xué)時(shí),實(shí)踐32學(xué)時(shí)先修課程:概率論、數(shù)理統(tǒng)計(jì)、線性代數(shù)課程類別:專業(yè)核心課程授課對(duì)象:大數(shù)據(jù)管理與應(yīng)用專業(yè)學(xué)生教學(xué)單位:商學(xué)院修讀學(xué)期:第3學(xué)期一、課程描述和目標(biāo)《數(shù)據(jù)挖掘原理與應(yīng)用》是大數(shù)據(jù)管理與應(yīng)用專業(yè)的核心專業(yè)課,主要講授數(shù)據(jù)挖掘的基本原理,以及如何應(yīng)用數(shù)據(jù)科學(xué)的方法對(duì)數(shù)據(jù)進(jìn)行分析、處理和挖掘。具體內(nèi)容包括,數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分類、關(guān)聯(lián)規(guī)則分析、相關(guān)分析、聚類分析、模型評(píng)價(jià)等內(nèi)容。通過本課程的學(xué)習(xí)和課程實(shí)踐,使學(xué)生掌握數(shù)據(jù)挖掘領(lǐng)域中必要的知識(shí)點(diǎn),達(dá)到學(xué)以致用的目的。本課程的教學(xué),主要為了實(shí)現(xiàn)以下三方面的課程目標(biāo)。1.專業(yè)知識(shí)目標(biāo):理解數(shù)據(jù)挖掘的基本概念,包括數(shù)據(jù)挖掘的定義、目的、過程和應(yīng)用領(lǐng)域。掌握數(shù)據(jù)預(yù)處理的重要性和步驟,包括數(shù)據(jù)清洗、數(shù)據(jù)變換和數(shù)據(jù)聚集。理解決策樹、神經(jīng)網(wǎng)絡(luò)和貝葉斯學(xué)習(xí)等不同類型的數(shù)據(jù)挖掘方法,并能夠識(shí)別其優(yōu)缺點(diǎn)和應(yīng)用場(chǎng)景。2.專業(yè)能力目標(biāo):能夠設(shè)計(jì)和實(shí)現(xiàn)簡(jiǎn)單的數(shù)據(jù)挖掘任務(wù),如特征提取、聚類、分類和回歸等。能夠進(jìn)行數(shù)據(jù)挖掘的編程工作。能夠理解和應(yīng)用常見的機(jī)器學(xué)習(xí)算法,如決策樹、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等。能夠分析和解釋數(shù)據(jù)挖掘的結(jié)果,并根據(jù)業(yè)務(wù)需求提出合理的建議。3.綜合能力目標(biāo):能夠在實(shí)際業(yè)務(wù)場(chǎng)景中應(yīng)用數(shù)據(jù)挖掘技術(shù),解決業(yè)務(wù)問題。能夠理解和評(píng)估不同數(shù)據(jù)挖掘方法的優(yōu)劣,并能夠根據(jù)實(shí)際情況選擇合適的方法。能夠進(jìn)行有效的團(tuán)隊(duì)協(xié)作,與其他團(tuán)隊(duì)成員協(xié)作完成復(fù)雜的數(shù)據(jù)挖掘任務(wù)。能夠獨(dú)立思考和解決問題,具備創(chuàng)新思維和問題解決能力。二、課程目標(biāo)對(duì)畢業(yè)要求的支撐關(guān)系畢業(yè)要求指標(biāo)點(diǎn)課程目標(biāo)權(quán)重1-1.思想道德修養(yǎng)課程目標(biāo)3L1-2.職業(yè)道德修養(yǎng)課程目標(biāo)3L2-1.大數(shù)據(jù)管理基礎(chǔ)理論課程目標(biāo)1M2-2.學(xué)科視野課程目標(biāo)1M2-4.國(guó)際化交流與現(xiàn)代化工作能力課程目標(biāo)2L3-1.問題分析能力課程目標(biāo)2M3-2.大數(shù)據(jù)管理技術(shù)綜合運(yùn)用能力課程目標(biāo)3M3-3.專業(yè)知識(shí)與素養(yǎng)課程目標(biāo)1L三、教學(xué)內(nèi)容、基本要求與學(xué)時(shí)分配序號(hào)教學(xué)內(nèi)容基本要求學(xué)時(shí)教學(xué)方式對(duì)應(yīng)課程目標(biāo)1數(shù)據(jù)挖掘的基本概念:1、數(shù)據(jù)的含義2、信息的含義3、數(shù)據(jù)挖掘的過程了解數(shù)據(jù)挖掘的基本概念,熟悉數(shù)據(jù)挖掘可以挖掘的模式,掌握數(shù)據(jù)挖掘的常用技術(shù),了解數(shù)據(jù)挖掘的應(yīng)用。2集中講授課程目標(biāo)1課程目標(biāo)22數(shù)據(jù)基本分析方法1、基本統(tǒng)計(jì)方法2、數(shù)據(jù)可視化的方法熟悉掌握數(shù)據(jù)的基本概念、基本統(tǒng)計(jì)方法、基本可視化方法及數(shù)據(jù)相似性的計(jì)算方法2集中講授課程目標(biāo)1課程目標(biāo)23數(shù)據(jù)預(yù)處理:1、數(shù)據(jù)質(zhì)量2、數(shù)據(jù)預(yù)處理的目的3、數(shù)據(jù)的特征結(jié)構(gòu)熟悉數(shù)據(jù)對(duì)象與熟悉類型,掌握數(shù)據(jù)的基本統(tǒng)計(jì)描述方法,掌握常用的度量數(shù)據(jù)相似性和相異性的測(cè)度,掌握數(shù)據(jù)預(yù)處理的基本步驟及其內(nèi)容。2集中講授課程目標(biāo)1課程目標(biāo)24分類的基本概念:1、數(shù)據(jù)分類的基本思想2、數(shù)據(jù)分類的主要框架理解分類器的設(shè)計(jì)思想,熟悉分類的基本框架,掌握分類歸納的基本原理。掌握基于規(guī)則的分類方法思想。2集中講授課程目標(biāo)1課程目標(biāo)25常見的分類技術(shù):1、樸素貝葉斯2、人工神經(jīng)網(wǎng)絡(luò)3、邏輯回歸掌握常用的分類方法,如最近鄰分類、樸素貝葉斯分類、貝葉斯信念網(wǎng)絡(luò)、邏輯回歸、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)以及集成的方法等。2集中講授課程目標(biāo)2課程目標(biāo)36規(guī)則和最近鄰分類器:1、數(shù)據(jù)規(guī)則的特點(diǎn)2、規(guī)則分析法熟悉規(guī)則分類法的特征和特點(diǎn);掌握規(guī)則分類法和最近鄰分類法2集中講授;案例分析課程目標(biāo)2課程目標(biāo)37回歸算法1、線性回歸2、邏輯回歸3、決策樹回歸熟悉線性回歸、邏輯回歸、決策樹回歸的基本概念及算法2集中講授;案例分析課程目標(biāo)2課程目標(biāo)38模型的評(píng)價(jià)與訓(xùn)練1、模型評(píng)價(jià)指標(biāo)2、過擬合與欠擬合理解模型的過擬合問題,掌握模型的選擇方法,熟練掌握模型的評(píng)估方法,熟練使用模型的超參數(shù)。2集中講授;案例分析課程目標(biāo)2課程目標(biāo)39支持向量機(jī)分類器1、支撐向量分類的思想2、邏輯回歸3、SVM分析熟悉支持向量機(jī)、深入支持向量機(jī)和非線性支持向量機(jī)的基本原理和算法2集中講授;案例分析課程目標(biāo)2課程目標(biāo)310神經(jīng)網(wǎng)絡(luò)分類器1、人工神經(jīng)網(wǎng)絡(luò)的發(fā)展2、人工神經(jīng)的數(shù)學(xué)模型熟悉人工神經(jīng)網(wǎng)絡(luò)法的發(fā)展歷程、基本數(shù)學(xué)模型,掌握人工神經(jīng)網(wǎng)絡(luò)感知機(jī)的訓(xùn)練方法和“異或”分類問題的解決2集中講授;案例分析課程目標(biāo)1課程目標(biāo)211多層感知神經(jīng)網(wǎng)絡(luò)后向傳播神經(jīng)網(wǎng)絡(luò)熟悉多層感知神經(jīng)網(wǎng)絡(luò)和后向傳播神經(jīng)網(wǎng)絡(luò)的基本原理和算法2集中講授;案例分析課程目標(biāo)1課程目標(biāo)2課程目標(biāo)312自然語言的神經(jīng)網(wǎng)絡(luò)模型:1、自然語言神經(jīng)網(wǎng)絡(luò)的分析框架2、分布詞向量熟悉自然語言處理基本框架,掌握分布式詞向量、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和BERT模型的基本使用方法。2集中講授;案例分析課程目標(biāo)1課程目標(biāo)2課程目標(biāo)313集成學(xué)習(xí):1、集成學(xué)校概論2、集成學(xué)習(xí)的具體方法熟悉集成學(xué)習(xí)的定義和基本思想,掌握Bagging、隨機(jī)森林、Boosting、GBDT等集成學(xué)習(xí)的算法。2集中講授;案例分析課程目標(biāo)1課程目標(biāo)2課程目標(biāo)314聚類算法1、聚類分析的基本框架2、聚類分析的具體算法熟悉聚類的基本定義和應(yīng)用要求;掌握聚類的層次法、密度法、網(wǎng)格法、圖論法。2集中講授;案例分析課程目標(biāo)2課程目標(biāo)315關(guān)聯(lián)規(guī)則挖掘1、關(guān)聯(lián)分析的概念及框架2、關(guān)聯(lián)規(guī)則挖掘的方法熟悉關(guān)聯(lián)規(guī)則的概念,掌握關(guān)聯(lián)規(guī)則的Apriori算法和FP-Growth算法2集中講授;案例分析課程目標(biāo)2課程目標(biāo)316信息推薦算法:1、信息推薦算法的框架2、信息推薦法的評(píng)價(jià)熟悉信息推薦算法的基本類型,掌握信息推薦算法的評(píng)價(jià)2集中講授;案例分析課程目標(biāo)1課程目標(biāo)2課程目標(biāo)3合計(jì)32實(shí)踐學(xué)時(shí):序號(hào)實(shí)驗(yàn)項(xiàng)目實(shí)驗(yàn)內(nèi)容與要求學(xué)時(shí)類型對(duì)應(yīng)課程目標(biāo)1數(shù)據(jù)預(yù)處理統(tǒng)計(jì)軟件的基本操作;數(shù)據(jù)的分類,數(shù)據(jù)的轉(zhuǎn)換,數(shù)據(jù)的預(yù)處理;必修。4綜合1、2、32回歸算法通過統(tǒng)計(jì)軟件實(shí)現(xiàn)線性回歸、邏輯回歸、決策樹回歸;必修4設(shè)計(jì)1、2、33神經(jīng)網(wǎng)絡(luò)分類模型神經(jīng)網(wǎng)絡(luò)的感知模型、多層感知神經(jīng)網(wǎng)絡(luò)模型、后向傳播神經(jīng)網(wǎng)絡(luò)模型;必修。6綜合1、2、34自然語言的神經(jīng)網(wǎng)絡(luò)模型通過統(tǒng)計(jì)軟件實(shí)現(xiàn)循環(huán)神經(jīng)網(wǎng)絡(luò)模型、卷積神經(jīng)網(wǎng)絡(luò)模型和BERT模型;必修。6綜合1、2、35集成學(xué)習(xí)的模型應(yīng)用隨機(jī)森林模型;GBD算法;必修。4綜合1、2、36聚類算法通過統(tǒng)計(jì)軟件實(shí)現(xiàn)聚類的層次法、密度法、網(wǎng)格法、圖論法;必修。4綜合1、2、37信息推薦算法基于內(nèi)容的信息推薦;基于用于的信息推薦;必修。4綜合1、2、3合計(jì)32四、課程教學(xué)方法采用集中講授、課堂演練、案例分析、小組討論、上機(jī)操作等教學(xué)方式。

五、學(xué)業(yè)評(píng)價(jià)和課程考核(一)考核方式及具體要求1.課程成績(jī)構(gòu)成與要求課程考核注重形成性和終結(jié)性評(píng)價(jià)相結(jié)合,考核內(nèi)容主要由課堂互動(dòng)(線上線下平臺(tái))、課程作業(yè)、期末考試組成,其中課堂互動(dòng)占20%、課程作業(yè)成績(jī)占30%、期末考試成績(jī)占50%。期末考試采用考試形式。課程作業(yè)為實(shí)踐報(bào)告,要求學(xué)生針對(duì)具體的管理問題,采集相應(yīng)數(shù)據(jù),應(yīng)用恰當(dāng)?shù)臄?shù)據(jù)工具分析,并以簡(jiǎn)單的論文形式報(bào)告數(shù)據(jù)分析結(jié)果以及對(duì)于管理問題的思考。2.課程目標(biāo)達(dá)成考核與評(píng)價(jià)序號(hào)教學(xué)環(huán)節(jié)課程目標(biāo)1(分值)課程目標(biāo)2(分值)課程目標(biāo)3(分值)合計(jì)1課堂互動(dòng)550202課程作業(yè)101010303期末考試20202050課程目標(biāo)對(duì)應(yīng)分值353530100(二)考核與評(píng)價(jià)標(biāo)準(zhǔn)1.課堂互動(dòng)考核與評(píng)價(jià)標(biāo)準(zhǔn)根據(jù)參與小組討論的情況、課堂回答、以及上機(jī)演示的情況相應(yīng)給分。對(duì)于有獨(dú)特、創(chuàng)新見解的回答給予高分,對(duì)于基本符合要點(diǎn)的回答給予中高分?jǐn)?shù),對(duì)于不到要點(diǎn)的回答給予低分。2.平時(shí)成績(jī)考核與評(píng)價(jià)標(biāo)準(zhǔn)分值觀測(cè)點(diǎn)90-100分70-89分60-69分0-59分作業(yè)按時(shí)完成,90%以上的作業(yè)內(nèi)容齊全,基本知識(shí)點(diǎn)理解、掌握到位。能夠運(yùn)用恰當(dāng)?shù)臄?shù)據(jù)分析工具識(shí)別并分析相關(guān)問題。按時(shí)完成,70%以上的作業(yè)內(nèi)容齊全,基本知識(shí)點(diǎn)理解、掌握較到位。能夠利用合適的數(shù)據(jù)分析工具識(shí)別并分析相關(guān)問題?;景磿r(shí)完成,60%以上的作業(yè)內(nèi)容齊全,基本知識(shí)點(diǎn)理解、掌握基本到位?;灸苓\(yùn)用數(shù)據(jù)分析工具對(duì)相關(guān)問題識(shí)別、分析。不交和補(bǔ)交,50%以下的作業(yè)內(nèi)容齊全,基本知識(shí)點(diǎn)理解、掌握有偏差。不能利用數(shù)據(jù)分析工具對(duì)相關(guān)問題進(jìn)行識(shí)別、分析。3.期末試卷考核與評(píng)價(jià)標(biāo)準(zhǔn)根據(jù)課程目標(biāo)及教學(xué)內(nèi)容,設(shè)計(jì)期末考核試題,綜合檢驗(yàn)學(xué)生對(duì)課程相關(guān)知識(shí)的掌握、綜合應(yīng)用及解決復(fù)雜問題的能力,根據(jù)考試題目設(shè)計(jì)相應(yīng)評(píng)分標(biāo)準(zhǔn)。六、教材與參考書1.《數(shù)據(jù)挖掘:原理與應(yīng)用》,丁兆云,周鋆,杜振國(guó)(著),機(jī)械工業(yè)出版社,2023;2.《數(shù)據(jù)挖掘原理與應(yīng)用》,葛東旭(著),機(jī)械工業(yè)出版社,2020。(二)參考資料1.《IntroductiontoDataMining》,Pang-Ni

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論