Python金融數(shù)據(jù)分析與挖掘(微課版) 教案全套 黃恒秋_第1頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 教案全套 黃恒秋_第2頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 教案全套 黃恒秋_第3頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 教案全套 黃恒秋_第4頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 教案全套 黃恒秋_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

Python金融數(shù)據(jù)分析與挖掘課程教案一、課程教學安排總覽課程內(nèi)容教學方法學時安排理論講授實踐教學第二章科學計算包Numpy講授法、實驗教學法32第三章數(shù)據(jù)處理包Pandas講授法、實驗教學法55第四章數(shù)據(jù)可視化包Matplotlib講授法、實驗教學法23第五章機器學習與實現(xiàn)講授法、實驗教學法55第六章金融數(shù)據(jù)基礎講授法、實驗教學法41第七章基礎案例講授法、實驗教學法105第八章綜合案例一:上市公司綜合評價講授法、實驗教學法32第九章綜合案例二:股票價格漲跌趨勢預測講授法、實驗教學法55第十章綜合案例三:股票價格形態(tài)聚類與收益分析講授法、實驗教學法55第十一章綜合案例四:行業(yè)聯(lián)動與輪動分析講授法、實驗教學法32合計4535二、課程教學內(nèi)容計劃第二章科學計算包Numpy【教學目標】1.了解Numpy及導入使用;2.理解數(shù)組的創(chuàng)建、切片、連接、存取、排序及搜索相關技能;

3.掌握數(shù)組靈活切片的方法及數(shù)組連接、排序、搜索相關知識?!窘虒W重點】數(shù)組的切片、連接、改變形態(tài)。數(shù)組的相關方法。【教學難點】數(shù)組的切片及改變形態(tài)、線性代數(shù)運算。【教學時數(shù)】3學時【教學方法】講授法【教學內(nèi)容】1.導入并使用Numpy創(chuàng)建數(shù)組;2.數(shù)組的運算、切片、連接及存取、排序與搜索;數(shù)組相關屬性與方法;3.矩陣及線性代數(shù)運算第三章數(shù)據(jù)處理包Pandas【教學目標】1.了解Pandas導入及創(chuàng)建數(shù)據(jù)框和序列;2.理解數(shù)據(jù)框和序列的訪問、切片及方法;

3.掌握數(shù)據(jù)框和序列相關方法的靈活應用,數(shù)據(jù)框、序列、數(shù)組、列表之間的相關轉換及運用。4.熟練掌握常用時間處理函數(shù)、合并函數(shù)與關聯(lián)函數(shù),以及滾動計算、時間元素提取、映射與離散化、分組統(tǒng)計等相關數(shù)據(jù)處理與計算任務?!窘虒W重點】數(shù)據(jù)框、序列相關屬性、方法的應用,數(shù)據(jù)框和序列數(shù)據(jù)的訪問、切片及相互之間的轉換。常用外部數(shù)據(jù)文件的讀取、數(shù)據(jù)關聯(lián)與合并、滾動計算、時間元素提取與分組統(tǒng)計計算。【教學難點】數(shù)據(jù)框、序列的訪問及切片。數(shù)據(jù)框、序列、數(shù)組、列表相關數(shù)據(jù)結構之間的相互轉換。數(shù)據(jù)關聯(lián)和分組統(tǒng)計的函數(shù)理解與應用?!窘虒W時數(shù)】5學時【教學方法】講授法【教學內(nèi)容】1.導入并使用Pandas創(chuàng)建數(shù)據(jù)框和序列;2.數(shù)據(jù)框和序列相關屬性、方法的介紹及使用;3.數(shù)據(jù)框和序列的訪問、切片及運算;4.外部數(shù)據(jù)文件的讀取及滾動計算函數(shù)的使用;5.時間處理函數(shù)、合并函數(shù)與關聯(lián)函數(shù),以及滾動計算、時間元素提取、映射與離散化、分組統(tǒng)計等相關數(shù)據(jù)處理與計算任務。第四章數(shù)據(jù)可視化包Matplotlib【教學目標】1.了解Matplotlib中的pyplot模塊導入及簡單使用方法;2.理解利用Matplotlib中的pyplot模塊繪圖的基本流程及原理;

3.掌握利用Matplotlib中的pyplot模塊繪制散點圖、線性圖、柱狀圖、直方圖、餅圖、箱線圖和子圖的方法,以及中文字符的顯示、橫軸字符刻度和子圖的布局排列?!窘虒W重點】利用Matplotlib中的pyplot模塊進行散點圖、線性圖、柱狀圖、直方圖、餅圖、箱線圖和子圖的繪制。懂得圖形中文字符的顯示及橫軸字符刻度,子圖的布局排列。【教學難點】Matplotlib繪圖的基本流程及原理?!窘虒W時數(shù)】2學時【教學方法】講授法【教學內(nèi)容】1.導入并使用Matplotlib中的pyplot模塊進行簡單繪圖;2.Matplotlib中的pyplot模塊繪圖基本流程及原理;3.利用Matplotlib中的yplot模塊繪制常見的圖形,包括散點圖、線性圖、柱狀圖、直方圖、餅圖、箱線圖和子圖。第五章機器學習與實現(xiàn)【教學目標】1.了解Scikit-learn包及相關模塊導入及簡單使用方法;2.理解均值、中位數(shù)、最頻繁值的缺失值填充策略,均值-方差、極差數(shù)據(jù)規(guī)范化或標準化,主成分分析降維及綜合評價,線性回歸、神經(jīng)網(wǎng)絡非線性回歸預測,邏輯回歸、神經(jīng)網(wǎng)絡、支持向量機分類,K-mean聚類、關聯(lián)規(guī)則相關的基本原理與方法;

3.掌握均值、中位數(shù)、最頻繁值的缺失值填充策略,均值-方差、極差數(shù)據(jù)規(guī)范化或標準化,主成分分析降維及綜合評價,線性回歸、神經(jīng)網(wǎng)絡非線性回歸預測,邏輯回歸、神經(jīng)網(wǎng)絡、支持向量機分類,K-mean聚類、關聯(lián)規(guī)則的程序實現(xiàn)及案例應用?!窘虒W重點】均值、中位數(shù)、最頻繁值的缺失值填充策略,均值-方差、極差數(shù)據(jù)規(guī)范化或標準化,主成分分析降維及綜合評價,線性回歸、神經(jīng)網(wǎng)絡非線性回歸預測,邏輯回歸、神經(jīng)網(wǎng)絡、支持向量機分類,K-mean聚類、關聯(lián)規(guī)則相關原理的理解及程序實現(xiàn)。【教學難點】主成分分析降維及綜合評價,線性回歸、神經(jīng)網(wǎng)絡非線性回歸預測,邏輯回歸、神經(jīng)網(wǎng)絡、支持向量機分類,K-mean聚類、關聯(lián)規(guī)則相關原理的理解?!窘虒W時數(shù)】5學時【教學方法】講授法【教學內(nèi)容】1.導入Scikit-learn包及相關模塊;2.缺失值填充、數(shù)據(jù)規(guī)范化或標準化、主成分分析降維及綜合評價、線性回歸、邏輯回歸、神經(jīng)網(wǎng)絡、支持向量機、K-均值聚類、關聯(lián)規(guī)則相關的模型、算法與原理;3.利用Scikit-learn包相關模塊,完成案例教學,包括均值、中位數(shù)、最頻繁值的缺失值填充策略,均值-方差、極差數(shù)據(jù)規(guī)范化或標準化,主成分分析降維及綜合評價,線性回歸、神經(jīng)網(wǎng)絡非線性回歸預測,邏輯回歸、神經(jīng)網(wǎng)絡、支持向量機分類,K-mean聚類、關聯(lián)規(guī)則第六章金融數(shù)據(jù)基礎【教學目標】1.了解公司治理結構、財務報表、財務分析指標、股票高頻、股票日頻交易和股票價格指數(shù)相關數(shù)據(jù)及產(chǎn)生情景;2.理解上述金融數(shù)據(jù)的重要指標及數(shù)據(jù)形態(tài);

3.了解開源數(shù)據(jù)接口?!窘虒W重點】公司治理結構、財務報表、財務分析指標、股票高頻、股票日頻交易和股票價格指數(shù)相關核心指標數(shù)據(jù)。【教學難點】股票高頻數(shù)據(jù)的生成加工及理解。【教學時數(shù)】4學時【教學方法】講授法【教學內(nèi)容】1.公司治理結構、財務報表、財務分析指標相關數(shù)據(jù)及重要指標數(shù)據(jù)的解讀;2.股票高頻數(shù)據(jù)生產(chǎn)場景及數(shù)據(jù)加工、核心指標數(shù)據(jù)的理解;3.開源數(shù)據(jù)接口第七章基礎案例【教學目標】1.了解案例實現(xiàn)的基本思路。2.理解案例實現(xiàn)的具體算法及程序實現(xiàn),各種數(shù)據(jù)結構的相互轉換并實現(xiàn)程序計算;3.掌握案例實現(xiàn)的具體過程,包括思路、算法、數(shù)據(jù)處理、程序計算及結果展現(xiàn)?!窘虒W重點】案例的實現(xiàn)思路、算法及程序具體實現(xiàn)?!窘虒W難點】案例的實現(xiàn)算法、程序實現(xiàn)過程中各類數(shù)據(jù)結構的相互轉換?!窘虒W時數(shù)】10學時【教學方法】講授法【教學內(nèi)容】1.股票價格指數(shù)周收益率和月收益率的計算;2.上市公司凈利潤增長率的計算;3.股票價、量走勢圖繪制;4.股票價格移動平均線的繪制;5.滬深300指數(shù)走勢預測;6.基于主成分聚類的上市公司盈利能力分析7.國際股票指數(shù)關聯(lián)分析第八章綜合案例一:上市公司綜合評價【教學目標】1.了解上市公司綜合評價的基本概念及模型。2.理解業(yè)務數(shù)據(jù)、指標數(shù)據(jù)選取、預處理、量化投資設計的基本原理、原則及流程;3.掌握指標數(shù)據(jù)選取、預處理、程序實現(xiàn)、量化投資策略設計實現(xiàn)的全部流程?!窘虒W重點】業(yè)務數(shù)據(jù)理解、指標數(shù)據(jù)的選擇、預處理、程序實現(xiàn)?!窘虒W難點】業(yè)務數(shù)據(jù)理解、數(shù)據(jù)預處理、模型的理解?!窘虒W時數(shù)】3學時【教學方法】講授法【教學內(nèi)容】1.上市公司綜合評價模型及方法基本介紹;2.基于投資規(guī)模與效率指標的綜合評價方法;3.基于成長與價值指標的綜合評價方法;4.指標數(shù)據(jù)選取及數(shù)據(jù)預處理;5.主成分分析模型及程序實現(xiàn);6.量化投資策略設計實現(xiàn)及結果分析第九章綜合案例二:股票價格漲跌趨勢預測【教學目標】1.了解股票價格漲跌趨勢的基本概念。2.理解業(yè)務數(shù)據(jù)、技術分析指標數(shù)據(jù)計算、模型實現(xiàn)及驗證相關原理、方法及流程;3.掌握技術分析指標數(shù)據(jù)計算、模型檢驗、量化投資策略設計實現(xiàn)的全部流程?!窘虒W重點】業(yè)務數(shù)據(jù)理解、指標概念及公式理解、程序實現(xiàn)及模型檢驗?!窘虒W難點】業(yè)務數(shù)據(jù)理解、指標公式理解及量化投資策略設計實現(xiàn)?!窘虒W時數(shù)】5學時【教學方法】講授法【教學內(nèi)容】1.了解股票價格漲跌趨勢的基本概念。2.理解業(yè)務數(shù)據(jù)、技術分析指標數(shù)據(jù)計算、模型實現(xiàn)及驗證相關原理、方法及流程;3.掌握技術分析指標數(shù)據(jù)計算、模型檢驗、量化投資策略設計實現(xiàn)的全部流程第十章綜合案例三:股票價格形態(tài)聚類與收益分析【教學目標】1.了解股票價格形態(tài)分析的基本概念、關鍵價格點概念2.理解業(yè)務數(shù)據(jù)、關鍵價格點提取算法、形態(tài)特征表示、K-最頻繁值聚類算法;3.掌握關鍵價格點提取算法、形態(tài)特征表示方法、K-最頻繁值聚類算法的基本流程及程序實現(xiàn),以及量化投資策略設計與實現(xiàn)。【教學重點】業(yè)務數(shù)據(jù)理解、關鍵價格點提取算法、K-最頻繁值聚類算法。【教學難點】關鍵價格點提取算法、K-最頻繁值聚類算法、量化投資策略設計實現(xiàn)?!窘虒W時數(shù)】5學時【教學方法】講授法【教學內(nèi)容】1.股票價格形態(tài)分析的基本概念;2.股票關鍵價格點的概念及提取算法;3.形態(tài)特征的表示及計算4.K-最頻繁值算法及程序實現(xiàn);5.量化投資策略設計實現(xiàn)及結果分析第十一章綜合案例四:行業(yè)聯(lián)動與輪動分析【教學目標】1.解行業(yè)聯(lián)動與輪動的基本概念。2.理解行業(yè)聯(lián)動與輪動的指標表示、關聯(lián)規(guī)則挖掘算法及量化投資策略設計原理3.掌握行業(yè)聯(lián)動與輪動關聯(lián)規(guī)則挖掘算法及量化投資策略設計實現(xiàn)的全流程?!窘虒W重點】業(yè)務數(shù)據(jù)理解、行業(yè)輪動規(guī)則挖掘及量化投資策略設計實現(xiàn)?!窘虒W難點】行業(yè)輪動關聯(lián)規(guī)則挖掘及量化投資策略設計實現(xiàn)。【教學時數(shù)】3學時【教學方法】講授法【教學內(nèi)容】1.行業(yè)聯(lián)動與輪動的基本概念;2.行業(yè)聯(lián)動與輪動的指標表示與計算;3.日、周、月頻率的行業(yè)聯(lián)動與輪動關聯(lián)規(guī)則挖掘;4.量化投資策略設計實現(xiàn)及結果分析點三、實驗教學內(nèi)容計劃實驗一:NumPy數(shù)組操作(頭歌平臺配套的實驗課程第2章實驗)【實驗目的和要求】掌握NumPy數(shù)組的定義及操作方法。【實驗內(nèi)容】賦值定義較復雜數(shù)據(jù)結構請完成以下問題:將列表L1定義為一維數(shù)組l1,將嵌套列表L2定義為二維數(shù)組l22.內(nèi)嵌函數(shù)定義較復雜數(shù)據(jù)結構請完成以下任務:1)定義一個3行3列元素全為1的數(shù)組A2)定義一個3行3列元素全為0的數(shù)組B3)定義一個初始值為2、末值為9、步長為2的數(shù)組C4)定義一個默認初始值0,步長為1的,末值為9的一維數(shù)組D3.數(shù)組運算現(xiàn)給出數(shù)組A和B,請按順序完成以下任務:1)求解A的最大值、最小值、余弦值、正弦值、長度2)求A乘B3)返回計算結果Max_A,Min_A,cos_A,sin_A,le_A,result4.數(shù)組切片5.數(shù)組鏈接【教學方法】實驗法【教學時數(shù)】2實驗二:Pandas數(shù)據(jù)處理操作(頭歌平臺配套的實驗課程第3章實驗)【實驗目的和要求】掌握Pandas數(shù)據(jù)結構的定義及操作方法。【實驗內(nèi)容】1.序列和數(shù)據(jù)框請完成以下任務:1)導入pandas包2)定義列表L1、L2,元組T1、T2L1=[1,-2,2.3,'hq']L2=['kl','ht','as','km']T1=(1,8,8,9)T2=(2,4,7,'hp')3)基于定義的列表和元組構造數(shù)據(jù)框,默認索引,列名依次為a,b,c,d,返回計算結果A4)基于定義的列表和元組構造數(shù)據(jù)框,索引為a,b,c,d,列名為L1,L2,T1,T2,返回計算結果B2.外部數(shù)據(jù)文件讀取請完成以下任務:1)導入pandas包2)read_excel()函數(shù)讀取“一、車次上車人數(shù)統(tǒng)計表.xlsx”數(shù)據(jù)表,用數(shù)據(jù)框df1來存儲3)通過read_table()函數(shù)讀取"txt1.txt"文件中的數(shù)據(jù)(不帶表頭),用數(shù)據(jù)框df2來表示4)通過read_csv()函數(shù)分塊讀取的方式讀取“data.csv”文件,每次讀取20000行,并輸出每次讀取的數(shù)據(jù)集行數(shù)和數(shù)據(jù)集的尺寸,其格式為:“第n次讀取數(shù)據(jù)規(guī)模為:數(shù)據(jù)集行數(shù)(舉例:第1次讀取數(shù)據(jù)集規(guī)模為:20000)”“數(shù)據(jù)集尺寸(舉例:(20000,13))3.邏輯索引、切片方法,groupby分組計算函數(shù)應用請完成以下任務:1)請讀取地鐵站點進出站客流數(shù)據(jù)表(Data.xlsx),表結構字段如下:站點編號、日期、時刻、進站人數(shù)、出站人數(shù)2)取出第0列,通過去重的方式獲得地鐵站點編號列表,記為code3)采用數(shù)據(jù)框中的groupby分組計算函數(shù),統(tǒng)計出每個地鐵站點每天的進站人數(shù)和出站人數(shù),計算結果采用一個數(shù)據(jù)框sat_num來表示,其中列標簽依次為:站點編號、日期、進站人數(shù)和出站人數(shù);4)計算出每個站點國慶節(jié)期間(10.1~10.7)的進站人數(shù)和出站人數(shù),計算結果用一個數(shù)據(jù)框sat_num2來表示,其中列標簽依次為:A1_站點編號、A2_進站人數(shù)、A3_出站人數(shù)。4.數(shù)據(jù)框關聯(lián)操作5.數(shù)據(jù)框合并操作6.序列移動計算方法應用7.數(shù)據(jù)框切片(iloc、loc)方法請完成以下任務:1)導入pdndas包2)讀取地鐵站點進出站客流數(shù)據(jù)表(Data.xlsx),字段依次為:站點編號、日期、時刻、進站人數(shù)、出站人數(shù)3)采用索引(iloc)實現(xiàn)的方式,獲取135站點10月1日-10月2日早上9-11點3個時刻的進站客流量數(shù)據(jù)(取所有字段),記為A4)采用列標簽(loc)實現(xiàn)方式,獲取135站點10月1日-10月2日早上9-11點3個時刻的進站客流量數(shù)據(jù)(取所有字段),記為B。8.數(shù)據(jù)框排序請完成以下任務:1)導入pandas包2)用read_excel()函數(shù)讀取“data.xlsx"表,用數(shù)據(jù)框read表示3)提取600000.SH代碼交易數(shù)據(jù),并按交易日期從小到大進行排序,記為data4)對整個數(shù)據(jù)框read,按代碼、交易日期從小到大進行排序9.數(shù)據(jù)框綜合應用案例請完成以下任務:讀取地鐵站點進出站客流數(shù)據(jù)表(Data.xlsx),統(tǒng)計計算獲得每個站點每個時刻(除去國慶期間)的總進站客流量和總出站客流量,用一個數(shù)據(jù)框來R表示,結果返回R,列名依次為:A1_站點編號、A2_時刻、A3_總進站客流、A4_總出站客流10.序列及簡單隨機抽樣請完成以下任務:1)定義一個列表code,編號為1~302)對code,按30個元素一次隨機抽樣,記為A3)返回結果,為序列s,其中index為編號,值為抽樣結果11.序列及較復雜抽樣題目背景:某題庫有選擇、填空、判斷、計算和應用5種題型,每種題型題號從1開始依次按順序編號,其中選擇題70道,填空題80道,判斷題50道,計算題30道,應用題20道。現(xiàn)有40個同學參加考試,要求每個同學從5種題型中隨機抽取1道題目組成試卷,請編程實現(xiàn)給出每個同學試卷的具體題目編號。請完成以下任務:1)定義一個數(shù)據(jù)框A,index為默認序號(0~39),代表每一位同學2)數(shù)據(jù)框A的第0列表示每位同學隨機抽簽的第1種題型的序號,第1、2、3、4列依次類推【教學方法】實驗法【教學時數(shù)】5實驗三:數(shù)據(jù)可視化包Matplotlib應用(頭歌平臺配套的實驗課程第4章實驗)【實驗目的和要求】掌握數(shù)據(jù)可視化的基本使用方法?!緦嶒瀮?nèi)容】1.散點圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數(shù)據(jù).xlsx”,繪制站點155各時刻進站客流散點圖;2)最后,采用plt.savefig函數(shù)保存圖片,文件路徑如下:"學員4.1/155各時刻進站客流散點圖.png"。2.線性圖繪制請完成以下任務1)讀取“各站點各時刻進出站客流數(shù)據(jù).xlsx”,繪制站點155各時刻進站客流線性圖;2)最后,采用plt.savefig函數(shù)保存圖片,文件路徑如下:"學員4.2/155各時刻進站客流線性圖.png"。3.柱狀圖繪制請完成以下任務1)讀取“各站點各時刻進出站客流數(shù)據(jù).xlsx”,繪制站點155各時刻進站客流柱狀圖;2)最后,采用plt.savefig函數(shù)保存圖片,文件路徑如下:"學員4.3/155各時刻進站客流柱狀圖.png"。4.直方圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數(shù)據(jù).xlsx”,繪制站點155各時刻進站客流直方圖;2)最后,采用plt.savefig函數(shù)保存圖片,文件路徑如下:"學員4.4/155各時刻進站客流直方圖.png"。5.餅圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數(shù)據(jù).xlsx”,繪制站點157各時刻進站客流餅圖;2)最后,采用plt.savefig函數(shù)保存圖片,文件路徑如下:"學員4.5/157各時刻進站客流餅圖.png"。6.箱線圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數(shù)據(jù).xlsx”,繪制站點9時刻的進站客流箱線圖;2)最后,采用plt.savefig函數(shù)保存圖片,文件路徑如下:"學員4.6/9時刻各站點進站客流箱線圖.png"。7.子圖繪制請完成以下任務:1)讀取“各站點各時刻進出站客流數(shù)據(jù).xlsx”,獲得155、157、151、123四個站點在各時刻的進站客流,用一個2*2的子圖,繪制其線性圖;2)最后,采用plt.savefig函數(shù)保存圖片,文件路徑如下:"學員4.7/4個站點各時刻進站客流子圖.png"?!窘虒W方法】實驗法【教學時數(shù)】3實驗四:scikit-learn應用(頭歌平臺配套的實驗課程第5章實驗1-10)【實驗目的和要求】掌握機器學習包scikit-learn的基本使用方法?!緦嶒瀮?nèi)容】1.缺失值填充請完成以下任務:1)讀取“銀行貸款審批數(shù)據(jù).xlsx”表,自變量為x1~x15,決策變量為y(1-同意貸款,0-不同意貸款),其中x1~x6為數(shù)值變量,x7~x15為名義變量2)請對x1~x6中存在的缺失值用均值策略填充,x7~x15用最頻繁值策略填充3)最后返回填充處理后的X(即x1~x15),以及決策變量Y(即y)2.數(shù)據(jù)標準化請完成以下任務:1)在上一個實驗的基礎上,對自變量X中的數(shù)值變量(x1~x6)作均值-方差標準化處理,需要注意的是x7~x15名義變量不需要作標準化處理。2)返回結果X1,數(shù)據(jù)結構為數(shù)組形式,X1中含有標準化后的x1~x6和未標準化的x7~x15。3.缺失值填充請完成以下任務:1)在上一個實驗基礎上,對經(jīng)過缺失值填充、數(shù)值變量標準化后的數(shù)據(jù)集,取前600條記錄作為訓練數(shù)據(jù),后90條記錄作為測試數(shù)據(jù),構建支持向量機分類模型;2)返回計算結果為模型準確率rv和預測準確率r。4.邏輯回歸模型及其應用請完成以下任務:1)在第2個實驗基礎上,對經(jīng)過缺失值填充、數(shù)值變量標準化后的數(shù)據(jù)集,取前600條記錄作為訓練數(shù)據(jù),后90條記錄作為測試數(shù)據(jù),構建邏輯回歸模型;2)返回計算結果為模型準確率rv和預測準確率r。5.神經(jīng)網(wǎng)絡分類模型及其應用請完成以下任務:1)在第2個實驗基礎上,對經(jīng)過缺失值填充、數(shù)值變量標準化后的數(shù)據(jù)集,取前600條記錄作為訓練數(shù)據(jù),后90條記錄作為測試數(shù)據(jù),構建神經(jīng)網(wǎng)絡分類模型;2)返回計算結果為模型準確率rv和預測準確率r。6.線性回歸模型及其應用在發(fā)電場中電力輸出(PE)與AT(溫度)、V(壓力)、AP(濕度)、RH(壓強)有關,相關測試數(shù)據(jù)見“發(fā)電場數(shù)據(jù).xlsx”文件,請完成以下任務:1)求出PE與AT、V、AP、RH之間的線性回歸關系式系數(shù)向量,用列表b表示,其元素依次為常數(shù)項、AT回歸系數(shù)、V回歸系數(shù)、AP回歸系數(shù)、RH回歸系數(shù);2)求出回歸方程的擬合優(yōu)度(判定系數(shù)),用變量r表示;3)今有某次測試數(shù)據(jù)AT=28.4、V=50.6、AP=1011.9、RH=80.54,試利用構建的線性回歸模型預測其PE值。7.神經(jīng)網(wǎng)絡回歸模型及其應用請完成以下任務:1)基于上一個實驗數(shù)據(jù)集,構建神經(jīng)網(wǎng)絡回歸模型,返回計算結果模型準確率r;2)并針對測試數(shù)據(jù)AT=28.4、V=50.6、AP=1011.9、RH=80.54,預測其PE值。8.支持向量機回歸模型及其應用請完成以下任務:1)基于上一個實驗數(shù)據(jù)集,構建支持向量機回歸模型(采用線性核函數(shù)),返回計算結果模型的擬合優(yōu)度r;2)并針對測試數(shù)據(jù)AT=28.4、V=50.6、AP=1011.9、RH=80.54,預測其PE值。9.基于主成分分析的綜合評價讀取“農(nóng)村居民人均可支配收入來源2016.xlsx”數(shù)據(jù)表,其中數(shù)據(jù)來源于2016年《中國統(tǒng)計年鑒》,首先對指標數(shù)據(jù)進行均值方差標準化處理;其次對標準化處理后的指標數(shù)據(jù)做主成分分析,要求提取累計貢獻率在95%以上;再次基于提取的主成分計算綜合得分,綜合得分=提取的各主成分與對應貢獻率之和;最后基于綜合得分獲得各地區(qū)的排名,得分按從高到低排序,用一個序列Rs來表示,其中index為地區(qū)名稱,值為綜合得分。10.K均值聚類算法及其應用讀取“農(nóng)村居民人均可支配收入來源2016.xlsx”數(shù)據(jù)表,數(shù)據(jù)來源于2016年《中國統(tǒng)計年鑒》,首先對指標數(shù)據(jù)作均值-方差標準化處理,注意首列為地區(qū)名稱,不用標準化;其次對標準化后的指標數(shù)據(jù),作K-均值聚類分析(K=4);最后,給出聚類分析結果,用一個序列Fs來表示,其中index為地區(qū)名稱,值為所屬類別的標簽值(0、1、2、3)?!窘虒W方法】實驗法【教學時數(shù)】4實驗五:關聯(lián)規(guī)則基礎(頭歌平臺配套的實驗課程第5章實驗11-12)【實驗目的和要求】掌握一對一和多對一關聯(lián)規(guī)則的基本使用方法?!緦嶒瀮?nèi)容】1.布爾數(shù)據(jù)集構建將以下超市的購買記錄(已用一個"超市購買記錄.txt"來存放,讀取該文件即可),文件內(nèi)容存放與下列展示一致,即頓號分隔,文件編碼為utf-8):I1、西紅柿、排骨、雞蛋、毛巾、水果刀、蘋果I2、西紅柿、茄子、水果刀、香蕉I3、雞蛋、襪子、毛巾、肥皂、蘋果、水果刀I4、西紅柿、排骨、茄子、毛巾、水果刀I5、西紅柿、排骨、酸奶、蘋果I6、雞蛋、茄子、酸奶、肥皂、蘋果、香蕉I7、排骨、雞蛋、茄子、水果刀、蘋果I8、土豆、雞蛋、襪子、香蕉、蘋果、水果刀I9、西紅柿、排骨、鞋子、土豆、香蕉、蘋果將其轉換為布爾數(shù)據(jù)集,其中數(shù)據(jù)集用數(shù)據(jù)框Data來表示,數(shù)據(jù)框中的字段名稱即為商品名稱,如果商品在某個購買記錄中出現(xiàn)用1來表示,否則為0。2.基于布爾數(shù)據(jù)集的一對一和多對一關聯(lián)規(guī)則挖掘針對以下布爾數(shù)據(jù)集(已用一個“test12.xlsx”表格來存取,直接讀取即可,字段名稱為A、B、C):A B C1 1 00 1 11 0 01 1 11 1 11 0 01 1 10 1 11 0 01 1 11 1 01 1 11 1 0請編程計算規(guī)則“A->B”和“A,B->C”的支持度和置信度,分別用sp1和co1,sp2和co2來表示【教學方法】實驗法【教學時數(shù)】1實驗六:金融數(shù)據(jù)基礎(頭歌平臺配套的實驗課程第6章實驗)【實驗目的和要求】掌握股票高頻數(shù)據(jù)的加工及分時計算?!緦嶒瀮?nèi)容】今有基本行情(簡稱level-1)部分數(shù)據(jù),見配套數(shù)據(jù)表“SHL1_600000.xlsx”,字段依次為:證券代碼、交易日期、昨收盤價、當前時間、(開、高、低、最新)價、累計成交量、分筆期間成交量、累計成交額、分筆期間成交額、累計成交筆數(shù)、分筆期間成交筆數(shù)、賣方委托價格5-1,買方委托價格1-5,賣方委托量5-1,買方委托量1-5。根據(jù)該基本行情交易數(shù)據(jù)表,計算獲得1分時交易數(shù)據(jù)表,其基本字段及計算思路如下:靜態(tài)字段:證券代碼、交易日期時間字段:分時點成交字段:分時期間(開、高、低、收)價格、分時期間成交量、分時期間成交金額計算思路:1分時數(shù)據(jù)是由基本行情(level-1)數(shù)據(jù)統(tǒng)計計算獲得。分時計算主要有兩種計算方式:一種是時間前置,一種是時間后置。比如后置計算1分時0931這個時間點,其行情統(tǒng)計時間區(qū)間為[093000.000,093059.999];前置計算1分時0931這個時間點,其行情統(tǒng)計時間區(qū)間為[093100.000,093159.999]。計算的規(guī)則主要有4個方式:取區(qū)間頭、取區(qū)間未、取區(qū)間最大、取區(qū)間最小。比如計算600000,20130301,0931這個分時點的分時數(shù)據(jù),其對應的分筆數(shù)據(jù)區(qū)間范圍為093002-093052(需要按時間排序),則:開盤價為:樣本范圍內(nèi)的CP的第一個價格11.070最高價為:樣本范圍內(nèi)的CP的最大的價格11.080最低價為:樣本范圍內(nèi)的CP的最小的價格11.060收盤價為:樣本范圍內(nèi)的CP的最后的價格11.070分時期間成交量為:樣本范圍內(nèi)最后的TQ-上一個樣本范圍內(nèi)的最后的TQ=sum(樣本范圍內(nèi)的CQ)=10559900-4190571=6369329。分時期間成交額為:樣本范圍內(nèi)最后的TM-上一個樣本范圍內(nèi)的最后的TM=sum(樣本范圍內(nèi)的CM)=116929015-46389621=70539394?!窘虒W方法】實驗法【教學時數(shù)】1實驗七:金融基礎數(shù)據(jù)分析(教材配套的第7章練習)【實驗目的和要求】掌握基礎的金融數(shù)據(jù)分析及挖掘方法?!緦嶒瀮?nèi)容】今有2017-2018年每個季度的每股指標數(shù)據(jù),共22720條數(shù)據(jù)記錄,數(shù)據(jù)全部來源于國泰安CSMAR數(shù)據(jù)庫,部分數(shù)據(jù)記錄及表結構如表下所示:2017-2018每個季度的每股指標數(shù)據(jù)StkcdAccperF090301BF090601BF091001AF091301AF091501AF091801B0000012017-03-310.361911.57722812.098953.2885854.046768-6.69820000012017-06-300.7311593.0986612.315323.2885854.258008-7.465350000012017-09-301.1154924.58782812.703033.2885854.642341-9.201340000012017-12-311.3505536.10768812.932673.2885854.639546-6.917880000012018-03-310.38411.59330213.010543.2885854.6852072.4136280000012018-06-300.77883.2314513.287193.2885854.944030.4341880000012018-09-301.191384.56482213.700123.2885855.35661-0.658710000012018-12-311.4454286.18590613.980323.2885855.535061-3.338560000022017-03-310.0629951.68393614.673770.7570195.606924-0.86274…………其中Stkcd-股票代碼、Accper-截止日期、F090301B-歸屬于母公司每股收益、F090601B-每股營業(yè)收入、F091001A-每股凈資產(chǎn)、F091301A-每股資本公積、F091501A-每股未分配利潤、F091801B-每股經(jīng)營活動產(chǎn)生的現(xiàn)金流量凈額。問題如下:1.對每個股票代碼,計算每個季度每股收益同比增長率,并找出連續(xù)4個季度每股收益同比增長率大于20%的股票代碼。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論