Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)-教學(xué)大綱_第1頁
Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)-教學(xué)大綱_第2頁
Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)-教學(xué)大綱_第3頁
Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)-教學(xué)大綱_第4頁
Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)-教學(xué)大綱_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)教學(xué)大綱課程名稱:Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)課程類別:必修適用專業(yè):大數(shù)據(jù)技術(shù)類相關(guān)專業(yè)先修課程:Python編程基礎(chǔ)總學(xué)時:64學(xué)時(其中理論28學(xué)時,實驗36學(xué)時)總學(xué)分:4.0學(xué)分一、課程的性質(zhì)隨著云時代的來臨,大數(shù)據(jù)技術(shù)將具有越來越重要的戰(zhàn)略意義。大數(shù)據(jù)已經(jīng)滲透到每一 個行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)要素,人們對于海量數(shù)據(jù)的運用將預(yù)示著新一 輪生產(chǎn)率增長和消費者盈余浪潮的到來。大數(shù)據(jù)分析技術(shù)將幫助企業(yè)用戶在合理時間內(nèi)攫取、 管理、處理、整理海量數(shù)據(jù),為企業(yè)經(jīng)營決策提供積極的幫助。大數(shù)據(jù)分析作為數(shù)據(jù)存儲和 挖掘分析的前沿技術(shù),廣泛應(yīng)用于物聯(lián)網(wǎng)、云

2、計算、移動互聯(lián)網(wǎng)等戰(zhàn)略性新興產(chǎn)業(yè)。雖然大 數(shù)據(jù)目前在國內(nèi)還處于初級階段,但是其商業(yè)價值已經(jīng)顯現(xiàn)出來,特別是有實踐經(jīng)驗的大數(shù) 據(jù)分析人才更是各企業(yè)爭奪的熱門。為了滿足日益增長的大數(shù)據(jù)分析人才需求,特開設(shè) Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)課程。二、課程的任務(wù)理論上,要求學(xué)生掌握Python數(shù)據(jù)挖掘編程基礎(chǔ)、數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘 算法基礎(chǔ)等數(shù)據(jù)分析與挖掘的主要方法。技能上,結(jié)合服裝店服裝銷售、沐浴露銷售、景區(qū)人流量、服裝企業(yè)貢獻率、餐飲系統(tǒng) 等現(xiàn)實場景,使學(xué)生學(xué)會使用Python語言進行數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、分類與預(yù)測、聚類 分析、時序預(yù)測、關(guān)聯(lián)規(guī)那么挖掘、智能推薦、偏差檢測等操作,并從信用

3、卡、餐飲企業(yè)、金 融服務(wù)、020優(yōu)惠券、電商產(chǎn)品等貼近學(xué)生生活的場景案例,進行知識點和真實案例相結(jié) 合,使學(xué)生進一步掌握數(shù)據(jù)分析與數(shù)據(jù)挖掘的流程和技能。思政上,將落實立德樹人的根本任務(wù),將育人元素揉入教學(xué)中,引導(dǎo)學(xué)生的環(huán)保理念, 增強學(xué)生法律意識,培養(yǎng)學(xué)生的工匠精神、平安生產(chǎn)、職業(yè)道德、技能珍貴、科學(xué)探索、獨 立思考、思辨能力等。三、教學(xué)條件Python 3.8.5+ Anaconda3 2020.11+ scikit-learn 0.22+ PyMySQL 0.10.0+ SciPy 1.4.1+四、課程學(xué)時分配序號教學(xué)內(nèi)容理論學(xué)時實驗學(xué)時其它1第1章數(shù)據(jù)挖掘基礎(chǔ)1第2章Python數(shù)據(jù)挖掘

4、編程基礎(chǔ)213第3章數(shù)據(jù)探索224第4章數(shù)據(jù)預(yù)處理425第5章數(shù)據(jù)挖掘算法基礎(chǔ)1056第6章信用卡高風(fēng)險客戶識別257第7章餐飲企業(yè)菜品關(guān)聯(lián)分析158第8章金融服務(wù)機構(gòu)資金流量預(yù)測149第9章020優(yōu)惠券使用預(yù)測2510第10章電視產(chǎn)品個性化推薦2511第11章基于TipDM數(shù)據(jù)挖掘平臺實現(xiàn)金 融服務(wù)機構(gòu)資金流量預(yù)測12總計2836五、教學(xué)內(nèi)容及學(xué)時安排1.理論教學(xué)序 號章節(jié)名稱主要內(nèi)容教學(xué)目標(biāo)學(xué)時1數(shù)據(jù)挖掘基礎(chǔ).掌握數(shù)據(jù)挖掘的流程.了解常用的數(shù)據(jù)挖掘建模工具.掌握Python數(shù)據(jù)挖掘環(huán)境配置的方法掌握數(shù)據(jù)挖掘的流 程12Python數(shù)據(jù)挖 掘編程基礎(chǔ).掌握Python的基本命令.掌握Pyth

5、on的數(shù)據(jù)結(jié)構(gòu).掌握Python中庫的導(dǎo)入與添加的方 法. 了解Python數(shù)據(jù)分析預(yù)處理常用庫.了解Python數(shù)據(jù)挖掘建模常用庫和 框架.了解Python的基 本命令、數(shù)據(jù)結(jié)構(gòu)以 及庫的導(dǎo)入與添加.熟悉Python數(shù)據(jù) 挖掘相關(guān)庫的安裝 和使用方法. 了解書本配套附 件的使用23數(shù)據(jù)探索.掌握一致性分析的方法.掌握缺失值分析的方法.掌握異常值分析的方法.掌握描述性統(tǒng)計分析的方法.掌握分布分析的方法.掌握比照分析的方法.掌握周期性分析的方法.掌握貢獻度分析的方法.掌握相關(guān)性分析的方法.掌握Python中數(shù) 據(jù)質(zhì)量分析的方法.掌握Python中數(shù) 據(jù)特征分析的方法24數(shù)據(jù)預(yù)處理.掌握重復(fù)值、缺

6、失值、異常值處理 方法.掌握數(shù)據(jù)規(guī)范化和離散化的方法.掌握獨熱編碼的方法.掌握多表合并的方法.掌握分組聚合的方法.掌握Python中數(shù) 據(jù)清洗的方法.掌握Python中數(shù) 據(jù)變換的方法.掌握Python中數(shù) 據(jù)合并的方法4.了解常用的分類與回歸算法.掌握線性模型的原理.掌握決策樹算法的原理.掌握最近鄰分類算法的原理.掌握支持向量機算法的原理.掌握神經(jīng)網(wǎng)絡(luò)算法的原理.掌握集成算法的原理.掌握分類與回歸算法的評價方法9,了解常用聚類分析算法.掌握聚類分析算法的評價方法.掌握K-Means聚類算法的原理.掌握密度聚類算法的原理.掌握層次聚類算法的原理. 了解Python主要關(guān)聯(lián)規(guī)那么算法.掌握Apr

7、iori算法的原理.掌握FP-Growth算法的原理. 了解Python主要智能推薦算法.掌握智能推薦模型的評價方法.掌握協(xié)同過濾推薦算法的原理.掌握基于流行度的推薦算法的原 理. 了解Python主要時序模式算法.掌握時間序列預(yù)處理的方法.了解平穩(wěn)時間序列分析.掌握非平穩(wěn)時間序列分析.掌握Python中分 類與回歸的方法.掌握Python中聚 類分析的方法.掌握Python中關(guān) 聯(lián)規(guī)那么分析的方法.掌握Python中智 能推薦的方法.掌握Python中時 序模式的分析方法10.分析信用卡高風(fēng)險客戶識別背景和 數(shù)據(jù).熟悉信用卡高風(fēng)險客戶識別的步驟 與流程.了解描述性統(tǒng)計分析. 了解K-Mean

8、s聚類算法.分析聚類結(jié)果.熟悉信用卡高風(fēng) 險客戶識別的步驟 與流程,掌握探索整體數(shù) 據(jù)分布和不同屬性 之間的關(guān)系的方法.掌握用K-Means 聚類算法對根據(jù)信 用卡客戶數(shù)據(jù)進行 客戶分群.掌握對聚類結(jié)果 進行特征分析的方 法2數(shù)據(jù)挖掘算法 基礎(chǔ)信用卡高風(fēng)險 客戶識別7餐飲企業(yè)菜品 關(guān)聯(lián)分析.分析餐飲企業(yè)菜品背景和數(shù)據(jù).熟悉餐飲企業(yè)菜品關(guān)聯(lián)分析的步驟 與流程.數(shù)據(jù)探索分析.數(shù)據(jù)清洗和屬性構(gòu)造.了解 Apriori 算法.評價Apriori模型.了解案例的背景、 數(shù)據(jù)說明和分析目 標(biāo).掌握每日用餐人 數(shù)、營業(yè)額和菜品熱 銷度的分析方法.掌握數(shù)據(jù)清洗、屬 性構(gòu)造的方法.掌握構(gòu)建Apriori 模型的

9、方法.掌握模型評價方 法18金融服務(wù)機構(gòu) 資金流量預(yù)測.分析金融服務(wù)機構(gòu)資金流量背景和 數(shù)據(jù).熟悉金融服務(wù)機構(gòu)資金流量預(yù)測的 基本流程與步驟. 了解平穩(wěn)性檢驗和白噪聲檢驗的方 法.了解時間序列模型的定階方法. 了解ARIMA算法.掌握時間序列模型的評價方法.了解案例的背景、 數(shù)據(jù)說明和分析目 標(biāo).熟悉金融服務(wù)機 構(gòu)資金流量預(yù)測的 步驟與流程.掌握數(shù)據(jù)平穩(wěn)性 的檢驗和處理方法, 以及白噪聲檢驗.掌握用ARIMA模 型對資金流量進行 預(yù)測5,掌握對ARIMA模 型的檢驗19020優(yōu)惠券使 用預(yù)測.分析020優(yōu)惠券使用的背景和數(shù)據(jù).熟悉020優(yōu)惠券使用預(yù)測的分析步 驟與流程.了解數(shù)據(jù)分析探索的方法.

10、了解決策樹算法.了解梯度提升算法. 了解XGBoost分類算法.掌握分類模型的評價方法.了解案例的背景、 數(shù)據(jù)說明和分析目 標(biāo),掌握描述性統(tǒng)計 分析方法.掌握分析優(yōu)惠形 式、用戶消費行為、 商戶投放優(yōu)惠券信 息的方法.掌握數(shù)據(jù)清洗和 數(shù)據(jù)變換的數(shù)據(jù)預(yù) 處理方法.掌握構(gòu)建決策樹、 梯度提升和 XGBoost分類模型 的方法.掌握模型評價方 法210電視產(chǎn)品個性 化推薦.分析電視產(chǎn)品個性化推薦的背景和 數(shù)據(jù).熟悉電視產(chǎn)品個性化推薦的步驟與 流程.了解基于物品的協(xié)同過濾算法.了解基于流行度的推薦算法.掌握智能推薦算法的評價方法. 了解電視產(chǎn)品個 性化推薦案例的背 景、數(shù)據(jù)說明和分析 目標(biāo),掌握常用的

11、數(shù)據(jù) 清洗方法,對數(shù)據(jù)進 行數(shù)據(jù)清洗.掌握常用的數(shù)據(jù) 探索方法,對數(shù)據(jù)進 行分布分析、比照分 析和貢獻度分析.掌握常用的屬性 構(gòu)造方法,構(gòu)建用戶 畫像標(biāo)簽.熟悉基于物品的 協(xié)同過濾算法和基 于流行度的推薦算 法,構(gòu)建推薦模型.掌握推薦系統(tǒng)的 評價方法,對構(gòu)建的 推薦模型進行模型 評價211基于TipDM數(shù) 據(jù)挖掘平臺實 現(xiàn)金融服務(wù)機 構(gòu)資金流量預(yù) 測.平臺簡介.配置數(shù)據(jù)組件.配置屬性構(gòu)造.配置數(shù)據(jù)篩選.配置周期性差分.配置序列檢驗.配置分析與建模1 .了解TipDM大數(shù) 據(jù)挖掘建模平臺的 相關(guān)概念和特點2,熟悉使用TipDM 大數(shù)據(jù)挖掘建模平 臺配置金融服務(wù)機 構(gòu)資金流量預(yù)測任 務(wù)的總體流程1

12、學(xué)時合計282 .實驗教學(xué)序號實驗工程名稱實驗要求學(xué)時1Python數(shù)據(jù)挖 掘編程基礎(chǔ).使用Python基本命令.使用Python的數(shù)據(jù)結(jié)構(gòu)12數(shù)據(jù)探索1 .使用Python進行數(shù)據(jù)質(zhì)量分析2.使用Python進行數(shù)據(jù)特征分析23數(shù)據(jù)預(yù)處理.使用Python進行數(shù)據(jù)清洗.使用Python進行數(shù)據(jù)變換.使用Python進行數(shù)據(jù)合并24數(shù)據(jù)挖掘算法1 .使用線性模型進行預(yù)測5基礎(chǔ).使用決策樹算法進行預(yù)測.使用最近鄰分類算法進行預(yù)測.使用支持向量機算法進行預(yù)測,使用神經(jīng)網(wǎng)絡(luò)算法進行預(yù)測.使用集成算法進行預(yù)測.使用K-Means算法進行聚類分析.使用密度聚類算法進行聚類分析.使用層次聚類算法進行聚類分

13、析.使用Apriori算法進行關(guān)聯(lián)分析11,使用FP-Growth算法進行關(guān)聯(lián)分析.使用協(xié)同過濾推薦算法進行推薦分析.使用基于流行度的推薦算法進行推薦分析14,使用ARIMA模型進行時間序列分析5信用卡高風(fēng)險 客戶識別.描述性統(tǒng)計分析.分析客戶歷史信用記錄.分析客戶經(jīng)濟情況.分析客戶經(jīng)濟風(fēng)險情況.清洗數(shù)據(jù).屬性構(gòu)造.構(gòu)建K-Means聚類模型.評價K-Means聚類模型56餐飲企業(yè)菜品 關(guān)聯(lián)分析.分析每日用餐人數(shù)和營業(yè)額.分析菜品熱銷度.清洗數(shù)據(jù).屬性構(gòu)造.構(gòu)建Apriori模型.評價Apriori模型57金融服務(wù)機構(gòu) 資金流量預(yù)測.屬性構(gòu)造.截取平穩(wěn)局部數(shù)據(jù).周期性差分.平穩(wěn)性檢驗和白噪聲檢

14、驗.時間序列模型的定階.評價ARIMA模型48020優(yōu)惠券使 用預(yù)測.描述性統(tǒng)計分析.分析優(yōu)惠形式信息.分析用戶消費行為信息.分析商戶投放優(yōu)惠券信息.清洗數(shù)據(jù).變換數(shù)據(jù).構(gòu)建決策樹分類模型.構(gòu)建梯度提升分類模型.構(gòu)建XGBoost分類模型.評價分類模型59電視產(chǎn)品個性1 .清洗數(shù)據(jù)5化推薦.探索數(shù)據(jù).構(gòu)造屬性.構(gòu)建基于物品的協(xié)同過濾算法的推薦模型.構(gòu)建基于流行度的推薦算法模型.評價智能推薦模型10基于TipDM數(shù) 據(jù)挖掘平臺實 現(xiàn)金融服務(wù)機 構(gòu)資金流量預(yù) 測.使用TipDM大數(shù)據(jù)挖掘建模平臺獲取數(shù)據(jù).使用TipDM大數(shù)據(jù)挖掘建模平臺進行分組聚合、數(shù)據(jù) 篩選、差分、序列檢驗等操作.使用TipDM大數(shù)據(jù)挖掘建模平臺進行時間序列模型構(gòu) 建、模型檢驗和模型評價等操作2學(xué)時合計36六、考核方式突出學(xué)生解決實際問題的能力,加強過程性考核。課程考核的成績構(gòu)成二平時作業(yè) (10%) +課堂參與(20%) +期末考核(70%),期末考試建議采用開卷形式,試題應(yīng)包 括基本概念、數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、分類與預(yù)測、聚

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論