




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
杭州電子科技大學(xué)
經(jīng)貿(mào)學(xué)院金融研究所金融軟件分析-基于Matlab的金融計(jì)算
課程體系框架數(shù)值計(jì)算基礎(chǔ)統(tǒng)計(jì)分析與建模金融資產(chǎn)估價(jià)資產(chǎn)組合計(jì)算金融時(shí)間序列金融理論模型知識Matlab程序設(shè)計(jì)基礎(chǔ)課程主要內(nèi)容1、MATLAB基礎(chǔ)知識2學(xué)時(shí)2、MATLAB數(shù)值計(jì)算初步6學(xué)時(shí)3、金融時(shí)間序列數(shù)據(jù)分析6學(xué)時(shí)4、統(tǒng)計(jì)分析與建模6學(xué)時(shí)5、金融資產(chǎn)估價(jià)計(jì)算6學(xué)時(shí)6、資產(chǎn)組合計(jì)算6學(xué)時(shí)7、復(fù)習(xí)2學(xué)時(shí)統(tǒng)計(jì)分析與建模
主要內(nèi)容統(tǒng)計(jì)數(shù)據(jù)的描述與作圖
假設(shè)檢驗(yàn)回歸分析統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)集中趨勢的描述
算術(shù)平均數(shù)mean原理:
調(diào)用方式:m=mean(x,dim)
例:x=[012;345;678]m=mean(x);m=mean(x,2)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)集中趨勢的描述
幾何平均數(shù)geomean原理:
調(diào)用方式:m=geomean(x)
例:x=[112;335;978]m=geomean(x)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)集中趨勢的描述
調(diào)和平均數(shù)harmmean原理:
調(diào)用方式:m=harmmean(x)
例:x=[123;456;489]m=harmmean(x)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)集中趨勢的描述
中位數(shù)median原理:奇數(shù)個(gè)樣本的中位數(shù)為中間一個(gè)數(shù)的值;偶數(shù)個(gè)樣本的中位數(shù)為中間兩個(gè)數(shù)的均值。
調(diào)用方式:m=median(x)
例:x=[123;456;489]m=median(x)x=[134;467;7910;101314];m=median(x)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)集中趨勢的描述
分位數(shù)prctile
調(diào)用方式:m=prctile(x,p)
原理:計(jì)算x中對應(yīng)p%的值。從小到大排序且樣本數(shù)為N的x每個(gè)值依次對應(yīng)p為100*(0.5/N),100*(1.5/N),..,100*((N-0.5)/N)的分位數(shù);分位數(shù)值的計(jì)算采用線性插值的方法;x中的最小值對應(yīng)p小于等于100*(0.5/N),而最大值對應(yīng)的p大于等于100*((N-0.5)/N)
。統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)集中趨勢的描述分位數(shù)prctile
調(diào)用方式:m=prctile(x,p)例:x=(1:5)'*(1:5)prctile(x,[1030507090])prctile(x,[20406080])prctile(x,[2575])prctile(x,[0595100])統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)集中趨勢的描述例:x=[ones(1,6)100]locate=[mean(x),geomean(x),harmmean(x),median(x),prctile(x,25)]
因此,算術(shù)平均值最易受奇異樣本的影響。幾何和調(diào)和平均數(shù)也較易受奇異樣本的影響。它們多用于來自對數(shù)分布或其他有偏分布樣本。中位數(shù)、分位數(shù)不受奇異樣本的影響。統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)分布的離散程度
極差range原理:極差=最大值-最小值
調(diào)用方式:y=range(x)
例:x=(1:5)'*(1:5);y=range(x)x=[712;485;369];y=range(x)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)分布的離散程度方差var原理:
調(diào)用方式:y=var(x)
例:x=[-1,1];y=var(x)x=[712;485;369];y=var(x);y=sym(var(x))統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)分布的離散程度標(biāo)準(zhǔn)差std原理:
調(diào)用方式:y=std(x)
例:x=[-1,1];y=std(x)x=[712;485;369];y=std(x);y=sym(std(x))統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)分布的離散程度
平均差mad原理:計(jì)算樣本均值間的絕對偏差的平均值。
調(diào)用方式:y=mad(x)
例:x=[-11];y=mad(x)x=[712;485;369];y=mad(x)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)分布的離散程度
四分位差iqr原理:計(jì)算樣本的75%和25%的分位數(shù)之差。iqr是數(shù)據(jù)散度的魯棒估計(jì),因?yàn)?5%-75%外的數(shù)據(jù)變化對iqr沒有影響。
調(diào)用方式:y=iqr(x)
例:x=(1:5)'*(1:5);y1=iqr(x)y2=prctile(x,75)-prctile(x,25)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖數(shù)據(jù)分布的離散程度例:x=[ones(1,6)100]stats=[range(x),var(x),std(x),mad(x),iqr(x)]
因此,極差最易受奇異樣本的影響。方差和標(biāo)準(zhǔn)差也極易受奇異樣本的影響。平均差也較易受奇異樣本的影響。四分位差不受奇異樣本的影響。統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖金融時(shí)間序列數(shù)據(jù)的厚尾特征峰度kurtosis原理:
調(diào)用方式:y=kurtosis(x)
例:x=randn(5,4);y=kurtosis(x)x=randn(1,1000);y=kurtosis(x)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖金融時(shí)間序列數(shù)據(jù)的厚尾特征偏度skewness原理:
調(diào)用方式:y=skewness(x)
例:x=randn(5,4);y=skewness(x)x=randn(1,1000);y=skewness(x)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖金融時(shí)間序列數(shù)據(jù)的厚尾特征如考慮某一股票的收益率,并將其觀察數(shù)據(jù)的分布與正態(tài)分布比較,不難發(fā)現(xiàn)前者往往有較厚的尾部結(jié)構(gòu)。這表明此股票收益(厚尾分布)出現(xiàn)過低或過高值的概率(頻率或次數(shù))比正態(tài)分布時(shí)的要大。在這種情況下,通常稱此時(shí)間序列有過度的峰度(ExcessKurtosis)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖金融時(shí)間序列數(shù)據(jù)的厚尾特征如時(shí)間序列{yt}服從正態(tài)分布,則其峰度κ=3;如{yt}的峰度大于3,則稱此序列有過度的峰度。研究表明,金融時(shí)間序列的一個(gè)普遍特征是具有過度的峰度。
loaddisney.mat
rdis_close=price2ret(fts2mat(dis.CLOSE));
y1=skewness(rdis_close)
y2=kurtosis(rdis_close)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖金融時(shí)間序列數(shù)據(jù)的厚尾特征loadSH_STOCKSINDEX2.txt
rshstockindex_close=...price2ret(SH_STOCKSINDEX2(:,5));
y1=skewness(rshstockindex_close)
y2=kurtosis(rshstockindex_close)上證指數(shù)收益率分布和正態(tài)分布的比較
統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖統(tǒng)計(jì)數(shù)據(jù)作圖
線圖plot
x=[2000:2007];y=[600555450523670367456545];[x'y']plot(x,y,'k-*')xlabel('年份');ylabel('銷售額');
title('某公司歷年銷售額')統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖統(tǒng)計(jì)數(shù)據(jù)作圖
條形圖bar,bar3
x=[2000:2007];y=[600555450523670367456545];bar(x,y)bar3(x,y)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖統(tǒng)計(jì)數(shù)據(jù)作圖
餅圖pie,pie3
s=[124892125536];pie(s)legend({‘華北地區(qū)’,‘東北地區(qū)’,‘華中地區(qū)’,‘華南地區(qū)’,‘西北地區(qū)’})pie3(s)統(tǒng)計(jì)分析與建模
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖統(tǒng)計(jì)數(shù)據(jù)作圖
散點(diǎn)圖scatter,scatter3x=randn(100,1);y=randn(100,1);scatter(x,y);scatter(x,y,30);s=[1:501:50]';scatter(x,y,s);scatter(x,y,s,'filled');小結(jié)掌握描述數(shù)據(jù)分布特征的各種指標(biāo)。掌握針對各種指標(biāo)的調(diào)用。掌握基本的統(tǒng)計(jì)作圖方法。統(tǒng)計(jì)分析與建模
主要內(nèi)容
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖
假設(shè)檢驗(yàn)回歸分析統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本任務(wù)根據(jù)樣本提供的信息,對未知總體分布的某些方面的假設(shè)作出合理的判斷。例如:
總體均值假設(shè)總體方差假設(shè)總體分布假設(shè)統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)舉例說明假設(shè)檢驗(yàn)的基本思想和主要步驟例1:某班開設(shè)金融學(xué)課程,該課程成績期望值為a0=80。目前為提高學(xué)習(xí)成績,引入一種新的學(xué)習(xí)方法。現(xiàn)從采用新學(xué)習(xí)方法的學(xué)生中抽取100名,經(jīng)過考試計(jì)算該100名學(xué)生的平均值m=81。
問:m和a0之間的差異,純粹是考試發(fā)揮的誤差造成的,還是反映了新學(xué)習(xí)方法的引入使得金融學(xué)成績發(fā)生了顯著性的變化。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)(1)假設(shè)檢驗(yàn)的基本思想
用a0表示原學(xué)生金融學(xué)成績總體ξ的E(ξ)。
假設(shè)“新學(xué)習(xí)方法對成績沒有影響”,則從采用新學(xué)習(xí)方法的學(xué)生中抽取的子樣,可認(rèn)為是從原學(xué)生總體(為引入新學(xué)習(xí)方法)ξ中抽取的。
假設(shè)總體ξ服從正態(tài)分布N(a0,
0),
0已知。則統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)(1)假設(shè)檢驗(yàn)的基本思想由于所以,若“假設(shè)”正確,則從采用新學(xué)習(xí)方法的學(xué)生總體中抽取容量為n的子樣ξ1,ξ2,…,ξn,其平均的觀察值m落在該區(qū)間之外的概率為0.05。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)(1)假設(shè)檢驗(yàn)的基本思想解釋:抽取子樣的20次中,大約只有一次m的觀察值落在這個(gè)區(qū)間之外。
若在一次實(shí)際抽取的子樣(容量為n)的平均值m落在該區(qū)間外邊,則說從采用新學(xué)習(xí)方法的學(xué)生總體中抽取的子樣不能“認(rèn)為”來自原學(xué)生總體ξ。即認(rèn)為假設(shè)是不正確的,該假設(shè)應(yīng)該被否定或者說被拒絕。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)(2)判斷“假設(shè)”的依據(jù)
小概率事件原理:小概率事件在一次試驗(yàn)或觀察中是幾乎不可能發(fā)生的。解釋:設(shè)有某假設(shè)H0需要檢驗(yàn),先假設(shè)H0是正確的。在此假設(shè)下,構(gòu)造某一個(gè)事件A,它在H0為正確的條件下的概率很小,如P{A|H0為真}=0.05,現(xiàn)進(jìn)行一次試驗(yàn),如果事件A發(fā)生了,即一個(gè)小概率事件居然發(fā)生了,這與小概率事件相矛盾,這就會懷疑H0的正確性,因而很可能拒絕H0。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)(3)第一類錯(cuò)誤按小概率事件原理來拒絕H0,不免要犯錯(cuò)誤。當(dāng)H0正確時(shí),小概率事件A也有可能發(fā)生。當(dāng)H0本來正確,而在我們的樣本中A卻發(fā)生了,這就會錯(cuò)誤地拒絕H0,這種“棄真”錯(cuò)誤,稱為犯第一類錯(cuò)誤。犯第一類錯(cuò)誤的概率為P{A|H0為真}=α。
例1中犯第一類錯(cuò)誤的概率為P{A|H0為真}=α=0.05。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)(4)顯著性檢驗(yàn)對原假設(shè)H0作出拒絕或不拒絕的判斷,通常稱為對H0顯著性檢驗(yàn)。利用樣本結(jié)果來證實(shí)H0真?zhèn)蔚囊环N檢驗(yàn)程序。對應(yīng)P{A|H0為真}=α,稱α為顯著性水平,而1-α為置信水平。
術(shù)語:“在顯著性水平α下對H0作顯著性檢驗(yàn)”。顯著性檢驗(yàn)一般冒著犯第一類錯(cuò)誤的風(fēng)險(xiǎn)。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)參數(shù)假設(shè)檢驗(yàn)若總體分布函數(shù)F(x;θ1,…,θk)或概率函數(shù)p(x;θ1,…,θk)的數(shù)學(xué)表達(dá)式為已知,只是分布中的參數(shù)有些為未知,假設(shè)H0針對未知參數(shù)而提出并要求檢驗(yàn),稱為參數(shù)假設(shè)檢驗(yàn)。如:H0:p(次品率)=0.01;H0:μ=μ0,或H0:σ2=σ02;統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)非參數(shù)假設(shè)檢驗(yàn)若總體的分布函數(shù)或概率函數(shù)為未知,假設(shè)H0針對總體的分布、分布的特性或總體的數(shù)字特征而提出,并進(jìn)行檢驗(yàn),這類問題的檢驗(yàn)不依賴于總體的分布,稱為非參數(shù)假設(shè)檢驗(yàn)。如:H0:ξ服從正態(tài)分布。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)
H0與H1
H0表示原來的假設(shè),稱為原假設(shè)或零假設(shè)。這是進(jìn)行檢驗(yàn)的對象。又稱虛擬假設(shè)或維持假設(shè)。通常等號只出現(xiàn)在H0中。
H1表示所考察問題的反面稱為備擇假設(shè)或?qū)α⒓僭O(shè)。H1反映一種改變或樣本觀察值顯示出所支持的結(jié)論,應(yīng)該作為備擇假設(shè)。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)
H0與H1
H0:p(次品率)=0.01;H1:p(次品率)
0.01
H0:μ=μ0;H1:μ<μ0
H0:ξ~N(μ,σ2)
;H1:ξ不服從正態(tài)分布統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)
單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)
雙側(cè)檢驗(yàn):原假設(shè)是一個(gè)簡單假設(shè),而備擇假設(shè)是一個(gè)復(fù)合假設(shè)。通常反映對應(yīng)備擇假設(shè)偏離原假設(shè)的方向沒有一個(gè)強(qiáng)有利的先驗(yàn)性預(yù)期或理論性預(yù)期。如:H0:μ=μ0;H1:μ
μ0
單側(cè)檢驗(yàn):有時(shí)因有一種強(qiáng)的先驗(yàn)性或理論性預(yù)期而把備擇假設(shè)取為單側(cè)的或單向的。如:H0:μ=μ0;H1:μ<μ0(左單邊檢驗(yàn))H0:μ=μ0;H1:μ>μ0(右單邊檢驗(yàn))統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)正態(tài)分布假設(shè)檢驗(yàn)對于樣本容量較小(n<30),而F0(x)又含有未知參數(shù)的情形,近年來對F0(x)為正態(tài)分布或指數(shù)分布的情形,Lilliefors提出了比較滿意的檢驗(yàn)方法。在顯著性水平α下,檢驗(yàn)假設(shè):H0:F(x)=F0(x)
;H1:F(x)
F0(x)F(x)-未知的總體分布函數(shù)F0(x)-原假設(shè)的分布函數(shù),如正態(tài)分布函數(shù)。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)正態(tài)分布假設(shè)檢驗(yàn)S(x)為經(jīng)驗(yàn)累積分布函數(shù),根據(jù)樣本估計(jì)。F(x)是總體真實(shí)累積分布函數(shù)。CDF是基于樣本均值和標(biāo)準(zhǔn)差的正態(tài)累積分布函數(shù)。Lilliefors假設(shè)和測試統(tǒng)計(jì)量分別為:
原假設(shè):F(x)服從正態(tài)分布。
備擇假設(shè):F(x)不服從正態(tài)分布。
測試統(tǒng)計(jì)量:T=max|S(x)-CDF|。當(dāng)T超過臨界值時(shí),拒絕原假設(shè)。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)正態(tài)分布假設(shè)檢驗(yàn)命令調(diào)用:H=lillietest(x,ALPHA)X-待檢驗(yàn)的樣本數(shù)據(jù)
ALPHA-顯著性水平,默認(rèn)0.05
H-邏輯變量。H=0表示在ALPHA下不能拒絕零(正態(tài)分布)假設(shè);H=1在ALPHA下拒絕零假設(shè)。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)正態(tài)分布假設(shè)檢驗(yàn)命令調(diào)用:H=lillietest(x,ALPHA)
例:loadgasH=lillietest(price1)H=lillietest(price2,0.05)%price1:1月份油價(jià);price2:2月份油價(jià)。返回值為0,表明在0.05顯著性水平下不能拒絕零假設(shè),即接受兩個(gè)總體為正態(tài)分布的假設(shè)。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)方差已知時(shí)均值的假設(shè)檢驗(yàn)總體為正態(tài)分布時(shí),若已知總體標(biāo)準(zhǔn)差,ztest函數(shù)可檢驗(yàn)總體均值是否為一個(gè)確定的量。
[H,P,CI,ZVAL]=ztest(X,M,SIGMA,ALPHA,TAIL)X-待檢驗(yàn)的樣本數(shù)據(jù),可以是矩陣按列返回。M-某個(gè)正態(tài)分布的均值;
SIGMA-該正態(tài)分布的標(biāo)準(zhǔn)差;
ALPHA-顯著性水平,默認(rèn)0.05;統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)方差已知時(shí)均值的假設(shè)檢驗(yàn)
[H,P,CI,ZVAL]=ztest(X,M,SIGMA,ALPHA,TAIL)TAIL-用來規(guī)定Z檢驗(yàn)的類型:
both-雙尾檢驗(yàn),即備擇假設(shè)“均值不是M”(默認(rèn))
right-右單邊檢驗(yàn),即備擇假設(shè)“均值大于M”;left-左單邊檢驗(yàn),即即備擇假設(shè)“均值小于M”。
H-邏輯變量。H=0表示在ALPHA下不能拒絕零(均值為M)假設(shè);H=1在ALPHA下拒絕零假設(shè)。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)方差已知時(shí)均值的假設(shè)檢驗(yàn)
[H,P,CI,ZVAL]=ztest(X,M,SIGMA,ALPHA,TAIL)P-p值。CI-對應(yīng)于給定顯著性水平的置信區(qū)間;
ZVAL-返回Z統(tǒng)計(jì)量。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)方差已知時(shí)均值的假設(shè)檢驗(yàn)
[H,P,CI,ZVAL]=ztest(X,M,SIGMA,ALPHA,TAIL)
[h,p,ci,z1]=ztest(price1/100,1.15,0.04)
[h,p,ci,z2]=ztest(price2/100,1.15,0.04)注:油價(jià)的標(biāo)準(zhǔn)差已知為0.04美元/加侖,而將價(jià)格及其均值除以100得到每加侖的油價(jià)。默認(rèn)alpha=5%,進(jìn)行雙尾檢驗(yàn)。統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)方差未知時(shí)均值的假設(shè)檢驗(yàn)
[H,P,CI,STATS]=ttest(X,M,ALPHA,TAIL)X-待檢驗(yàn)的樣本數(shù)據(jù),可以是矩陣按列返回。M-某個(gè)方差未知的正態(tài)分布的均值(默認(rèn)0);
STATS是一個(gè)結(jié)構(gòu)變量,包含如下的域:
tstat-t統(tǒng)計(jì)量
df-自由度
sd-估計(jì)總體標(biāo)準(zhǔn)差。[h,p,ci,stats]=ttest(price2/100,1.15)統(tǒng)計(jì)分析與建模
假設(shè)檢驗(yàn)方差未知時(shí)均值的假設(shè)檢驗(yàn)
[H,P,CI,STATS]=ttest(X,Y,ALPHA,TAIL)
檢驗(yàn)同維向量X,Y具有相同的均值。此處仍然假設(shè)X-Y服從方差未知的正態(tài)分布。[h,p,ci,stats]=ttest(price1,price2)小結(jié)掌握假設(shè)檢驗(yàn)的基本原理和步驟。掌握小概率事件原則。掌握幾個(gè)假設(shè)檢驗(yàn)方法。統(tǒng)計(jì)分析與建模
主要內(nèi)容
統(tǒng)計(jì)數(shù)據(jù)的描述與作圖
假設(shè)檢驗(yàn)回歸分析統(tǒng)計(jì)分析與建模
回歸分析
線性回歸回歸分析統(tǒng)計(jì)量計(jì)算模型改進(jìn)統(tǒng)計(jì)分析與建模
回歸分析線性回歸根據(jù)樣本數(shù)據(jù)以某種規(guī)則算出樣本回歸函數(shù)中的參數(shù),從而對總體回歸作出估計(jì)??煞譃椋?/p>
線性回歸非線性回歸
統(tǒng)計(jì)分析與建模
回歸分析
線性回歸的最小二乘估計(jì)OLS
估計(jì)模型:
殘差最?。航y(tǒng)計(jì)分析與建模
回歸分析線性回歸的最小二乘估計(jì)OLS
統(tǒng)計(jì)分析與建模
回歸分析
判定系數(shù)R2-擬合優(yōu)度的度量
總平方和TSS:回歸解釋的平方和RSS:殘差平方和ESS:TSS=ESS+RSSR2=RSS/TSS,
修正R2=1-[ESS/(n-k-1)]/[TSS/(n-1)]統(tǒng)計(jì)分析與建模
回歸分析0YX統(tǒng)計(jì)分析與建模
回歸分析回歸系數(shù)的顯著性檢驗(yàn)和置信區(qū)間
t統(tǒng)計(jì)量:(1-α)置信區(qū)間:顯著性檢驗(yàn):H0:bi=0統(tǒng)計(jì)分析與建模
回歸分析多元線性回歸的F檢驗(yàn)
F統(tǒng)計(jì)量:顯著性檢驗(yàn):H0:b1=b2=…=bk=0
給定的顯著性水平,查表得到相應(yīng)的臨界值Fα或Fα/2。如果F>=Fα或Fα/2,則否定假設(shè)H0。統(tǒng)計(jì)分析與建模
回歸分析線性回歸
矩陣形式:統(tǒng)計(jì)分析與建模
回歸分析線性回歸函數(shù)調(diào)用:[b,bint,r,rint,stats]=regress(Y,X,ALPHA)
Y-因變量觀察值,n×1的向量。
X-自變量觀察值,n×k矩陣;若回歸方程含常數(shù)項(xiàng),則第1列全為1,后面依次為自變量觀察值,n×(k+1)矩陣。
ALPHA-給定的顯著性水平,默認(rèn)為0.05。
b-回歸系數(shù)向量;如果含有常數(shù)項(xiàng),則第一個(gè)分量為常數(shù)項(xiàng)估計(jì)值。統(tǒng)計(jì)分析與建模
回歸分析線性回歸函數(shù)調(diào)用:[b,bint,r,rint,stats]=regress(Y,X,ALPHA)
bint-b對應(yīng)的1-ALPHA置信區(qū)間;第一個(gè)為常數(shù)項(xiàng)。
r-殘差向量,觀察值與回歸模型決定的值之差;
rint-對應(yīng)于每個(gè)r的區(qū)間構(gòu)成的矩陣。
stats-回歸信息。第一個(gè)是可決系數(shù)R2,然后是F統(tǒng)計(jì)量,其后為對應(yīng)的p值,最后是誤差項(xiàng)方差的估計(jì)。統(tǒng)計(jì)分析與建模
回歸分析線性回歸
[b,bint,r,rint,stats]=regress(Y,X,ALPHA)
Exam1:消費(fèi)C與收入Y的關(guān)系繪制散點(diǎn)圖,并在散點(diǎn)圖繪出回歸直線;解釋回歸直線的斜率和截距,以及R2;如果收入Y=300,消費(fèi)C=?
…\work\zzzzexam\ComsumC_IncomeY.mat統(tǒng)計(jì)分析與建模
回歸分析線性回歸
繪制散點(diǎn)圖,并在散點(diǎn)圖繪出回歸直線
loadComsumC_IncomeY.matY1=[ones(length(Y),1)Y][b,bint,r,rint,stats]=regress(C,Y1)
YY=80:1:260;CC=b(1)+b(2)*YY;
plot(YY,CC,'-b',Y,C,'or')
plot(YY,CC,'-b',Y,C,'or',[80260],[mean(C),mean(C)],'-k')統(tǒng)計(jì)分析與建模
回歸分析線性回歸
Exam1:消費(fèi)C與收入Y的關(guān)系
回歸結(jié)果:
回歸結(jié)果表明,一般來說(其他條件保持不變的條件下),收入越高,消費(fèi)越多。實(shí)證結(jié)果與經(jīng)濟(jì)理論一致。斜率:表示邊際消費(fèi)傾向。截距:表示收入為零時(shí)的消費(fèi)支出。如果收入Y=300,消費(fèi)189.9879統(tǒng)計(jì)分析與建模
回歸分析線性回歸Exam1:消費(fèi)C與收入Y的關(guān)系
回歸結(jié)果:
回歸系數(shù)b1的置信區(qū)間不含0,說明其是顯著不為0的。R2-表明整個(gè)模型具有91%的解釋力;
F,p-F值很大及p近似為零,表明應(yīng)拒絕H0:所有的回歸系數(shù)全為零,即整個(gè)回歸方程是顯著的。統(tǒng)計(jì)分析與建模
回歸分析線性回歸
Exam1:消費(fèi)C與收入Y的關(guān)系
回歸殘差(r):
回歸殘差置信區(qū)間rint:如果樣本對應(yīng)的殘差置信區(qū)間含0,表明該樣本觀察值是正常的非奇異樣本;否則表明該樣本是非正常的奇異樣本。函數(shù)rcoplot(r,rint)可將所以的殘差和置信區(qū)間畫在一個(gè)圖上,通過該圖可很直觀地確定出哪個(gè)值是奇異樣本。統(tǒng)計(jì)分析與建模
回歸分析線性回歸
例:多元回歸
對Matlab自帶數(shù)據(jù)做回歸,第六列為因變量Y,第一列到第五列為自變量?;貧w方程可表示為:
clcclearloadmoore
y=moore(:,6);x=[ones(length(moore(:,1)),1)moore(:,1:5)];[bbintrrintstats]=regress(y,x)用rcoplot(r,rint)檢查發(fā)現(xiàn),第1個(gè)樣本為奇異樣本。統(tǒng)計(jì)分析與建模
回歸分析線性回歸
多元回歸結(jié)果:
R2-表明整個(gè)模型具有81%的解釋力;
F,p-F值很大及p近似為零,表明應(yīng)拒絕H0:所有的回歸系數(shù)全為零,即整個(gè)回歸方程是顯著的。統(tǒng)計(jì)分析與建模
回歸分析線性回歸
從上述多元回歸結(jié)果可知,雖然整個(gè)回歸方程是顯著的,但回歸系數(shù)全部不顯著,因?yàn)樗谢貧w系數(shù)置信區(qū)間均含0。
F和p只能表明整個(gè)回歸方程是否顯著;每個(gè)回歸系數(shù)的顯著性,需根據(jù)其對應(yīng)的t統(tǒng)計(jì)量判斷。
F和p-H0:b1=b2=…=bk=0t統(tǒng)計(jì)量-H0:bj=0,j=1,2,…,k統(tǒng)計(jì)分析與建模
回歸分析回歸分析統(tǒng)計(jì)量計(jì)算
函數(shù)regstats可以計(jì)算多元線性回歸模型中所涉及的包括t統(tǒng)計(jì)量在內(nèi)的所有常用統(tǒng)計(jì)量。調(diào)用方式:regstats(Y,X)與regress函數(shù)不同,自變量X中無需再加入一個(gè)全為1的列用來表示常數(shù)項(xiàng)的存在。Regstats函數(shù)已經(jīng)默認(rèn)含有常數(shù)項(xiàng)。統(tǒng)計(jì)分析與建模
回歸分析回歸分析統(tǒng)計(jì)量計(jì)算調(diào)用方式:regstats(Y,X)調(diào)用時(shí)如果沒有返回值,則會彈出圖形窗口。只需選定需要輸出的統(tǒng)計(jì)量,它們即可在workspace中顯示。
clcclearloadmoore
y=moore(:,6);x=[moore(:,1:5)];regstats(y,x)[tstat.beta';tstat.se';tstat.t';tstat.pval']統(tǒng)計(jì)分析與建模
回歸分析回歸分析統(tǒng)計(jì)量計(jì)算
回歸結(jié)果及統(tǒng)計(jì)量
可見所有t值都很小,而p值都很大(大于0.05),因此,在5%的顯著性水平下,所有回歸系數(shù)都不顯著。
統(tǒng)計(jì)分析與建模
回歸分析模型改進(jìn):ROBUST回歸
回歸分析假設(shè)誤差項(xiàng)必須符合正態(tài)分布。當(dāng)存在嚴(yán)重的奇異樣本時(shí),正態(tài)分布假設(shè)被違反。
robustfit函數(shù)對于解決奇異樣本問題非常有用,它將奇異樣本的影響降到最低程度。
基本思想:對不同的觀察值給予不同的權(quán)重,奇異樣本的權(quán)重最低,從而降低了奇異樣本的影響,即降低了回歸結(jié)果對奇異樣本的敏感性。統(tǒng)計(jì)分析與建模
回歸分析模型改進(jìn):ROBUST回歸
原理:函數(shù)通過迭代自動給出權(quán)重。1、函數(shù)為每個(gè)觀察值賦予相等的權(quán)重,運(yùn)行一次OLS回歸。2、函數(shù)按照每個(gè)觀測值與預(yù)測值之間的距離大小重新賦予權(quán)重,距離近的權(quán)重大,距離遠(yuǎn)的權(quán)重小。根據(jù)新的權(quán)重,函數(shù)重新進(jìn)行回歸。重復(fù)2,直至它滿足某種收斂條件。統(tǒng)計(jì)分析與建模
回歸分析模型改進(jìn):ROBUST回歸調(diào)用方式:[bstats]=robustfit(X,Y)X-自變量樣本矩陣,無需添加全1列。
Y-因變量樣本向量,注意X,Y的先后順序。b-回歸方程的系數(shù)。
stats-結(jié)構(gòu)型數(shù)據(jù),主要包括:
stats.ols_s:OLS回歸模型殘差均方差;
stats.robust_s:Robust回歸模型殘差均方差;統(tǒng)計(jì)分析與建模
回歸分析模型改進(jìn):ROBUST回歸調(diào)用方式:[bstats]=robustfit(X,Y)stats.mad_s:殘差的平均差估計(jì);
stats.s:最終的殘差估計(jì);
stats.se:回歸系數(shù)的標(biāo)準(zhǔn)差;
stats.t:回歸系數(shù)對應(yīng)的t值;
stats.p:回歸系數(shù)對應(yīng)的p值;
stats.coeffcorr:回歸系數(shù)的相關(guān)系數(shù)估計(jì);
stats.w:最終的權(quán)重向量。統(tǒng)計(jì)分析與建模
回歸分析模型改進(jìn):ROBUST回歸調(diào)用方式:[bstats]=robustfit(X,Y)
例:采用moore數(shù)據(jù),已知第1個(gè)樣本為奇異樣本。
clcclearloadmoorex=[moore(:,1:5)];
y=moore(:,6);[brStats]=robustfit(x,y)
Stats.w%每個(gè)樣本的權(quán)重均不同;第1個(gè)權(quán)重最小,這%與第1個(gè)樣本奇異對應(yīng)。統(tǒng)計(jì)分析與建模
回歸分析模型改進(jìn):逐步線性回歸在多元線性回歸模型中,變量在是否顯著及顯著性強(qiáng)弱方面存在差異。建模時(shí),需要對變量進(jìn)行篩選,保留具有顯著影響的變量,剔除統(tǒng)計(jì)上不顯著的變量,以簡化模型。
逐步回歸就是一種在多元回歸模型中篩選變量的技術(shù),分為向前、向后和雙向逐步回歸。統(tǒng)計(jì)分析與建模
回歸分析模型改進(jìn):逐步線性回歸
前向回歸:開始于無變量模型,然后逐步將統(tǒng)計(jì)上最顯著的變量加到模型中,直到無統(tǒng)計(jì)上顯著的變量或者無變量可加時(shí)為止。
后向回歸:開始于包含所有變量的模型,然后逐步從模型中剔除統(tǒng)計(jì)上不顯著的變量,直到留下的所有變量都是統(tǒng)計(jì)上顯著的。
雙向逐步回歸:開始于所有變量的一個(gè)子集,然后加入統(tǒng)計(jì)上顯著的并刪除統(tǒng)計(jì)上不顯著的變量,直到在模型中的變量都是統(tǒng)計(jì)顯著的,而其余變量都是不顯著的。統(tǒng)計(jì)分析與建模
回歸分析逐步線性回歸stepwise交互式圖形工具:通過交互方式直
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 保溫棉合同范例
- 2024高中化學(xué)第三章重要的有機(jī)化合物第四節(jié)塑料橡膠纖維教案魯科版必修2
- 農(nóng)藥 化肥供貨合同范例
- 中介租房屬于合同范例
- 寫字樓房屋施工合同范例
- 保險(xiǎn)投資經(jīng)紀(jì)合同范例
- 公司三方合伙人合同范例
- 出售模型小屋合同范本
- 加工鐵筐合同范例
- 四川省群眾性滑雪產(chǎn)品需求特征及供給優(yōu)化研究
- 2025年四川成都農(nóng)業(yè)科技中心管理人員招聘1人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025上海大學(xué)行政管理崗位及部分教育輔助崗位公開招聘19人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 巨量千川(中級)營銷師認(rèn)證考試題庫(附答案)
- 地震應(yīng)急預(yù)案桌面演練
- 安防監(jiān)控基礎(chǔ)知識培訓(xùn)
- 擺攤合伙經(jīng)營合同范例
- TCABEE 063-2024 建筑光儲直柔系統(tǒng)變換器 通 用技術(shù)要求
- 【核心素養(yǎng)目標(biāo)】浙教版勞動七下項(xiàng)目一任務(wù)一《學(xué)做小籠包》課件
- 雅禮中學(xué)2024-2025學(xué)年初三創(chuàng)新人才選拔數(shù)學(xué)試題及答案
- 人教版2024小學(xué)一年級下冊音樂教學(xué)計(jì)劃
- Unit1GreetingsLesson1(課件)人教精通版級英語上冊
評論
0/150
提交評論