數(shù)學建模 統(tǒng)計分析_第1頁
數(shù)學建模 統(tǒng)計分析_第2頁
數(shù)學建模 統(tǒng)計分析_第3頁
數(shù)學建模 統(tǒng)計分析_第4頁
數(shù)學建模 統(tǒng)計分析_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、outline,一、描述性統(tǒng)計 二、隨機數(shù)的生成 三、參數(shù)假設檢驗 四、正態(tài)性檢驗* 五、方差分析 六、回歸分析,一、描述性統(tǒng)計,直方圖 均值 標準差 偏度 峰度,1. 直方圖 (histogram),hist(x),hist(x, m),histfit(x, m) % 帶正態(tài)擬合的直方圖,2. 描述性統(tǒng)計量,mean(x) % 均值,std(x) % 標準差,median(x) % 中位數(shù),sort(x) % 順序統(tǒng)計量,sum(x) % 和,var(x) % 方差,kurtosis(x) % 峰度,正態(tài)是3,skewness(x) % 偏度,正態(tài)是0,二、隨機數(shù) (random numbe

2、r),均勻分布隨機數(shù) 正態(tài)分布隨機數(shù) 指數(shù)分布隨機數(shù) 卡方分布隨機數(shù) t分布隨機數(shù) f分布隨機數(shù) 離散分布隨機數(shù),1. 均勻分布的隨機數(shù),rand(n) % 0, 1區(qū)間上,rand(m, n) % 0, 1區(qū)間上,unifrnd(a, b, m, n) % a, b區(qū)間上,2. 正態(tài)分布的隨機數(shù),randn(n) % n(0, 1),randn(m, n) % n(0, 1),normrnd(a, b, m, n) % n(a, b2),或等價地, x=randn(m, n); x=a+b*x,3. 指數(shù)分布的隨機數(shù),exprnd (lambda) % 1個隨機數(shù),exprnd (lambd

3、a, m, n),4. 卡方分布的隨機數(shù),chi2rnd (df),chi2rnd (df, m, n),5. t分布的隨機數(shù),trnd (df),trnd (df, m, n),6. f分布的隨機數(shù),frnd (df1, df2),frnd (df1, df2, m, n),7. 二項分布的隨機數(shù),binornd (n, p),binornd (n, p, m, n),8. poisson分布的隨機數(shù),poissrnd (lambda),poissrnd (lambda, m, n),9. 離散型分布的隨機數(shù),以標準的均勻分布u作為模擬變量,若 u 0.20, 則x值x1 ; 若0.20u

4、0.35, 則x值x2 ; 若0.35u 0.60, 則x值x3 ; 若0.60u 1, 則x值x4 .,clear n=5000; for i=1:n u=rand(1); if u=0.2 x(i)=1; elseif u=0.35 x(i)=2; elseif u=0.6 x(i)=3; else x(i)=4; end end % sum(x=1)/n,三、單樣本與兩樣本的t檢驗,單樣本的t檢驗 兩樣本的t檢驗 檢驗的水平 檢驗的功效(勢),1. 單樣本的t檢驗,設總體的分布為 ,從總體中抽取 容量為n的樣本,要檢驗的問題是,設總體的方差未知,則使用的是單樣本t檢驗:,取檢驗的水平為

5、,則檢驗的拒絕域為:,clear n=20; mu0=0; x=randn(1, n); % 樣本觀測值 xbar=mean(x); s=std(x); t=sqrt(n)*(xbar-mu0)/s; if abs(t)2.093 % 2.093是臨界值 c=1; else c=0; end c,例:,h=ttest(x, mu0) % x是樣本; % muo缺省時為0 ; % h輸出值0和1,分別表示接受和拒絕h0 .,單樣本t檢驗的matlab實現(xiàn):,h, sig, ci, stats=ttest(x, mu0, alpha, tail) % alpha: 顯著性水平, 缺省時為0.05.

6、 % tail: 取0表示雙側檢驗(可缺省); 取-1或1表示單側檢 驗, 其中-1對應h1: mumu0. % h輸出值0和1, 分別表示接受和拒絕h0 . % sig: 檢驗的p-值, sig0.05等價于h=1. % ci輸出置信區(qū)間, stats輸出統(tǒng)計量的值和自由度.,單樣本t檢驗的matlab實現(xiàn):,2. 兩樣本的t檢驗,設有兩個總體 和 , 分別從這兩個總體中抽取容量為n1和 n2的樣本,要檢驗的問題是,設總體的方差未知,則使用的是兩樣本t檢驗:,取檢驗的水平為 ,則檢驗的拒絕域為:,h=ttest2(x, y) % x,y是樣本; % h輸出值0和1,分別表示接受和拒絕h0 .

7、,兩樣本t檢驗的matlab實現(xiàn):,h, sig, ci, stats=ttest2(x, y, alpha, tail) % alpha: 顯著性水平, 缺省時為0.05. % tail: 取0表示雙側檢驗(可缺省); 取-1或1表示單側檢驗, 其中-1對應h1: mu1mu2. % h輸出值0和1, 分別表示接受和拒絕h0 . % sig: 檢驗的p-值, sig0.05等價于h=1. % ci輸出置信區(qū)間, stats輸出統(tǒng)計量的值和自由度.,兩樣本t檢驗的matlab實現(xiàn):,3. 檢驗的水平*,在零假設成立下,重復執(zhí)行檢驗過程,考察零假設被拒絕的概率,這就是犯第一類錯誤的概率,即檢驗的

8、實際水平。,clear n=20; n=10000; mu0=0; for i=1:n x=randn(1, n); a(i)=ttest(x,mu0); end sum(a)/n % t檢驗的實際水平,4. 檢驗的功效* (勢, power),在備擇假設成立下,重復執(zhí)行檢驗過程,考察零假設被拒絕的概率,這就是不犯第二類錯誤的概率,即檢驗的功效。 檢驗的功效越高,檢驗就越好。,clear n=20; n=10000; mu0=0.5; for i=1:n x=randn(1, n); a(i)=ttest(x,mu0); end sum(a)/n % 功效,四、正態(tài)性檢驗*,q-q圖 kolm

9、ogorov-smirov檢驗 lilliefors檢驗,1. q-q圖 (quantile-quantile),clear n=40; x=randn(1,n); qqplot(x),q-q圖: 第i個點的縱坐標是排序的樣本觀測值 ,橫坐標是,理論直線的方程為:,2. kolmogorov-smirov檢驗,檢驗的統(tǒng)計量是:,其中 是待檢驗的分布函數(shù)。,matlab中的命令: h, p=kstest(x, , alpha, tail),檢驗樣本是否服從標準的正態(tài)分布,其中 alpha: 檢驗的水平 tail: 檢驗的類型,0表示雙側檢驗,-1和1是單側檢驗 h: 取值0和1,分別表示接受和拒

10、絕零假設 p: 檢驗的p-值 簡單用法:h=kstest(x),clear n=30; n=5000; for i=1:n x=randn(1, n); h=kstest(x); if h=1 a(i)=1; else a(i)=0; end end sum(a)/n % 結果是什么?,clear n=80; n=5000; for i=1:n x=trnd(1, 1, n); %樣本來自于t(1) a(i)= kstest(x); end sum(a)/n %結果是什么?,3. lilliefors檢驗,matlab中的命令: h=lillietest(x) h,p=lillietest(x

11、, , alpha, tail),用來檢驗數(shù)據(jù)是否具有與樣本相同均值和方差的 正態(tài)分布。,clear n=30; n=5000; for i=1:n x=randn(1, n)+2; a(i)= lillietest(x); end sum(a)/n % ?,五、方差分析(analysis of variance),例1:在實驗室內(nèi)有多種方法可以測定生物樣品中的磷含量,現(xiàn)選取4種測定方法,測定同一干草樣品的磷含量,結果見下表,試分析這4種方法之間差異是否顯著。,不同方法測定的干草磷含量,例2:隨機選取三種千足蟲,測定了不同性別個體血淋巴中的丙氨酸含量(mg/l),試檢驗性別和物種對丙氨酸含量的

12、影響有無顯著性差異。,p=anova1(x) % x是樣本觀測值構成的矩陣,每一列為 一個水平 % p是檢驗的p-值. % 輸出結果除p-值外,還有方差分析表以 及箱形圖。,1. 單因素方差分析的matlab實現(xiàn):,例1的求解:,clear x=34 37 34 36 36 36 37 34 34 35 35 37 35 37 37 34 34 37 36 35; p=anova1(x) % 1是數(shù)字,單因素方差分析表:,p=anova2(x, 1) % 括號中的1表示每個水平組合下只有一次觀測,此時不考慮交互效應。 p=anova2(x, m) % 括號中的m表示每個水平組合下有m次重復觀測

13、。 the number of rows must be a multiple of reps.,2. 兩因素方差分析的matlab實現(xiàn):,例2的求解:,clear x= 215 145 160 196 174 203 209 150 185 228 178 193 148 121 144 156 114 147 135 127 138 164 145 120 ; p=anova2(x,4),兩因素方差分析表:,columns: 列因素 rows: 行因素 interaction: 交互作用,六、回歸分析,一元線性回歸 多元線性回歸,1. 一元線性回歸分析,設x為自變量,y為因變量,考慮y對x

14、的線性回歸。 采用最小二乘估計法。,b=polyfit(x, y, 1) % x是自變量的樣本觀測值 % y是因變量的樣本觀測值,一元線性回歸分析的matlab實現(xiàn):,x=0.7608 -0.9291 -0.4007 -0.1267 -0.4829 -0.6075 -0.7594 -1.3627 0.4069 0.4236; y=1.7159 -1.2786 -0.3744 0.5986 -0.6290 -1.0179 -1.0921 -2.6222 1.6396 1.8324; plot(x,y,*) % 散點圖 a=polyfit(x,y,1) % a(1)是一次項系數(shù), a(2)是截距項

15、 yy=polyval(a,x); hold on plot(x,yy),例:,2. 多元線性回歸分析,設x1, x2, , xk為自變量,y為因變量,考慮y對x1, x2, , xk的線性回歸: 假設進行了n次觀測.,b=regress(y, x) 或 b, bint, r, rint, stats=regress(y, x),多元線性回歸分析的matlab實現(xiàn):,y: 因變量的觀測值所構成的列向量. x:自變量的取值構成的矩陣, x各列(除第1列外)就是自變量的n次取值。,b: 最小二乘估計法得到的回歸系數(shù) bint:各回歸系數(shù)的置信區(qū)間 r: 殘差 rint:各殘差的置信區(qū)間 stats: 輸出擬合優(yōu)度r2 、f值和p值,x=0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論