![第三章多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第1頁](http://file4.renrendoc.com/view/3adbe0f7a2fa3c3f4902c20878eb2f32/3adbe0f7a2fa3c3f4902c20878eb2f321.gif)
![第三章多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第2頁](http://file4.renrendoc.com/view/3adbe0f7a2fa3c3f4902c20878eb2f32/3adbe0f7a2fa3c3f4902c20878eb2f322.gif)
![第三章多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第3頁](http://file4.renrendoc.com/view/3adbe0f7a2fa3c3f4902c20878eb2f32/3adbe0f7a2fa3c3f4902c20878eb2f323.gif)
![第三章多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第4頁](http://file4.renrendoc.com/view/3adbe0f7a2fa3c3f4902c20878eb2f32/3adbe0f7a2fa3c3f4902c20878eb2f324.gif)
![第三章多元正態(tài)均值向量和協(xié)方差矩陣的檢驗_第5頁](http://file4.renrendoc.com/view/3adbe0f7a2fa3c3f4902c20878eb2f32/3adbe0f7a2fa3c3f4902c20878eb2f325.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2023/2/61第三章多元正態(tài)均值向量和協(xié)方差矩陣的檢驗內(nèi)容第一節(jié)
單個總體均值向量的推斷第二節(jié)
單個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗第三節(jié)
兩個總體均值的檢驗第四節(jié)
兩個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗第五節(jié)
多個總體均值的比較檢驗(多元方差分析)第六節(jié)
正態(tài)總體協(xié)方差矩陣的檢驗第七節(jié)
在SAS多元假設(shè)檢驗過程2023/2/622023/2/63一、均值向量的檢驗
設(shè)是取自多元正態(tài)總體的一個樣本,,現(xiàn)欲檢驗
由于總體的協(xié)方差矩陣可能未知或已知,所以在檢驗時必須采用有不同的的統(tǒng)計量,所以我們分成兩種情況來討論。第一節(jié)單個總體均值向量的推斷2023/2/64
由于是來自多元正態(tài)總體的簡單隨機(jī)樣本1、總體協(xié)方差矩陣已知時2023/2/652023/2/66
由于樣本均值,所以有
服從自由度為p的卡方分布。當(dāng)原假設(shè)為真時,服從自由度為p的中心卡方分布。所以,我們用作為檢驗的統(tǒng)計量,對顯著性水平,檢驗的規(guī)則為:2023/2/672023/2/682、總體協(xié)方差矩陣未知時
總體的協(xié)方差矩陣未知,用樣本的協(xié)方差矩陣
替代中的總體協(xié)方差,得霍特林(Hotelling)統(tǒng)計量2023/2/69
在原假設(shè)為真時對顯著性水平,檢驗的規(guī)則為:當(dāng),拒絕原假設(shè);當(dāng),接受原假設(shè)?!纠咳说某龊苟嗌倥c人體內(nèi)的鈉和鉀的含量有一定的關(guān)系,今測量了20位成年女性的出汗量、鈉含量和鉀含量。試檢驗:2023/2/6102023/2/611
例在企業(yè)市場結(jié)構(gòu)研究中,起決定作用的指標(biāo)有市場份額X1,企業(yè)規(guī)模(資產(chǎn)凈值總額的自然對數(shù))X2,資本收益率X3和總收益增長率X4。為了研究美國市場的變動,夏菲爾德抽取了美國231個大型企業(yè),調(diào)查這些企業(yè)某十年的資料。假設(shè)以前企業(yè)市場結(jié)構(gòu)的均值向量為(20,7.5,10,2)’,該調(diào)查所得的樣本均值向量和樣本協(xié)方差矩陣如下。2023/2/612
試問企業(yè)的市場結(jié)構(gòu)是否發(fā)生了變化?注:似然比統(tǒng)計量
在數(shù)理統(tǒng)計中關(guān)于總體參數(shù)的假設(shè)檢驗,通常還可以利用最大似然原理導(dǎo)出似然比統(tǒng)計量進(jìn)行檢驗。
設(shè)p維總體的密度函數(shù)為2023/2/613其中是未知參數(shù),參數(shù)空間。有如下假設(shè):2023/2/614現(xiàn)在從總體中抽出容量為n的樣本樣本的聯(lián)合密度函數(shù)為引入似然比統(tǒng)計量2023/2/615由于,所以統(tǒng)計量取值在0到1之間。
由極大似然比原理,如果取值太小,說明H0為真的時觀測到此樣本的概率要小得多,故有理由認(rèn)為假設(shè)H0不成立。
可以證明當(dāng)樣本容量很大時2023/2/616
近似服從自由度為f的卡方分布,其中自由度為的維數(shù)減0的維數(shù)。
下面我們討論2023/2/617
的似然比檢驗。
其中原假設(shè)成立時,有2023/2/618
其中我們來討論一下,似然比檢驗的統(tǒng)計量和霍特林的T平方統(tǒng)計量的關(guān)系。2023/2/619有2023/2/620三個統(tǒng)計量是等價的,有2023/2/6212023/2/622
例設(shè)x1,x2,
…,xn取自該總體Np(,)的樣本,=(1,2,…p),檢驗H0:1=2=…=p=
H1:至少存在一對i和j,使i
j第二節(jié)單個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗
2023/2/623
則與上面的原假設(shè)等價的假設(shè)為
例假定人類的體形有這樣的一般規(guī)律:身高、胸圍和上臂圍平均尺寸比例為6:4:1。檢驗身高、胸圍和上臂圍平均尺寸比例是否符合這一規(guī)律。2023/2/624則上面的假設(shè)可以表達(dá)為
2023/2/625
設(shè)取自多元正態(tài)總體的一個樣本。前面,我們已經(jīng)利用樣本,檢驗均值向量是否等于一個指定的向量。在實際問題中,我們也需要檢驗均值向量的分量之間是否存在某一指定的結(jié)構(gòu)關(guān)系,即檢驗
其中C為一已知的kp階矩陣,k<p,rank(C)=k,為已知的k維向量。根據(jù)多元正態(tài)分布的性質(zhì)可知2023/2/6262023/2/627
為了檢驗H0:C=
,可以用統(tǒng)計量
當(dāng)為真時H0:C=
時對給定的顯著性水平,檢驗的規(guī)則當(dāng)時,拒絕原假設(shè);當(dāng)時,接受原假設(shè)。2023/2/628
特別當(dāng)=0
,即檢驗H0:C=0
,H1:C0,則2023/2/629
在例中,假定人類的體形有這樣一個一般規(guī)律的身高、胸圍和上臂圍平均尺寸比例為6:4:1。檢驗比例是否符合這一規(guī)律。檢驗:
2023/2/630某地區(qū)農(nóng)村男嬰的體格測量數(shù)據(jù)如下編號身高(cm)胸圍(cm)上半臂長(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0檢驗三個指標(biāo)的均值是否有關(guān)系2023/2/6312023/2/632第三節(jié)兩個總體均值的檢驗
一、兩個獨立樣本的情形
與一元隨機(jī)變量的情形相同,常常我們需要檢驗兩個總體的均值是否相等。
設(shè)從總體和中各自獨立地抽取樣本
考慮假設(shè)2023/2/633根據(jù)兩個樣本可得1和2的無偏估計量為2023/2/634
因為兩個總體的協(xié)方差矩陣相等,所以我們可以用樣本的聯(lián)合協(xié)方差矩陣來估計2023/2/635霍特林(Hotelling)統(tǒng)計量為:當(dāng)原假設(shè)為真的條件下,統(tǒng)計量
檢驗的規(guī)則為:當(dāng)時,拒絕原假設(shè);當(dāng)時,接受原假設(shè)。2023/2/636
二、成對試驗的統(tǒng)計量
前面我們討論的是兩個獨立樣本的檢驗問題,但是不少的實際問題中,兩個樣本的數(shù)據(jù)是成對出現(xiàn)的。例如檢驗?zāi)信毠さ墓べY收入是否存在差異;一種新藥的療效等。
設(shè)(xi,yi),i=1,2,3,…,n(n>p),是成對的試驗數(shù)據(jù),總體X和y均服從p維正態(tài)分布,且協(xié)方差相等。令di=xi-yi,則di=xi-yi服從正態(tài)分布,。
檢驗假設(shè)2023/2/637
其中
當(dāng)原假設(shè)為真時,統(tǒng)計量服從自由度為和的分布。
檢驗規(guī)則為:
當(dāng)時,拒絕原假設(shè),否則接受原假設(shè)。
2023/2/638
中小企業(yè)的破產(chǎn)模型為了研究中小企業(yè)的破產(chǎn)模型,首先選定了X1總負(fù)債率(現(xiàn)金收益/總負(fù)債),X2收益性指標(biāo)(純收入/總財產(chǎn)),X3短期支付能力(流動資產(chǎn)/流動負(fù)債)和X4生產(chǎn)效率性指標(biāo)(流動資產(chǎn)/純銷售額)4個經(jīng)濟(jì)指標(biāo),對17個破產(chǎn)企業(yè)為“1”和正常運行企業(yè)“2”進(jìn)行了調(diào)查,得資料如下。如果這些指標(biāo)是用來做判別分析和聚類分析的變量,他們之間沒有顯著性差異是不恰當(dāng)?shù)?,所以檢驗所選擇的指標(biāo)在不同類型企業(yè)之間是否有顯著的差異。
2023/2/639x1,x2,x3,x4均為判別變量2023/2/640x1,x3為判別變量2023/2/641DependentVariable:x1(對X1進(jìn)行的檢驗)
SumofSourceDFSquaresMeanSquareFValuePr>F
Model10.874667910.8746679116.900.0002
Error361.863008400.05175023
CorrectedTotal372.73767632
X1在類間有顯著性差異。DependentVariable:x2(對X2進(jìn)行的檢驗)
SumofSourceDFSquaresMeanSquareFValuePr>F
Model10.083120770.083120771.950.1710
Error361.533700280.04260279
CorrectedTotal371.61682105X2在類間沒有顯著性差異。2023/2/642DependentVariable:x3(對X3進(jìn)行的檢驗)
SumofSourceDFSquaresMeanSquareFValuePr>F
Model116.4695844316.4695844321.45<.0001
Error3627.640805040.76780014
CorrectedTotal3744.11038947X3在類間有顯著性差異。DependentVariable:x4(對X4進(jìn)行的檢驗)
SumofSourceDFSquaresMeanSquareFValuePr>F
Model10.001126940.001126940.030.8643
Error361.369780950.03804947
CorrectedTotal371.37090789X4在類間沒有顯著性差異。2023/2/643
多元假設(shè)檢驗
StatisticValueFValueNumDFDenDFPr>F
Wilks'Lambda0.545616206.874330.0004Pillai'sTrace0.454383806.874330.0004Hotelling-LawleyTrace0.832790156.874330.0004Roy'sGreatestRoot0.832790156.874330.0004
從SAS的輸出可以看出應(yīng)該拒絕原假設(shè),即類間的有顯著性差異。2023/2/644第四節(jié)兩個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗
一、問題提出
設(shè)從總體,中各自獨立地抽取樣本和,。他們的均值向量差為:2023/2/645
例在愛情和婚姻的調(diào)查中,對一個由若干名丈夫和妻子組成的樣本進(jìn)行了問卷調(diào)查,請他們回答以下幾個問題:(1)你對伴侶的愛情的“熱度”感覺如何?(2)伴侶對你的愛情的“熱度”感覺如何?(3)你對伴侶的愛情的“可結(jié)伴”水平感覺如何?(4)伴侶對你的愛情的“可結(jié)伴”水平感覺如何?回答采用沒有、很小、有些、很大和非常大5個等級,得到結(jié)果如表。
2023/2/646丈夫?qū)ζ拮悠拮訉φ煞騒1X2X3X4X1X2X3X42355445555444555455544554344455533554455334533443444435444553455455544544433344444554555554455552023/2/647
現(xiàn)在我們關(guān)心均值分量間的差異是否滿足某種結(jié)構(gòu)關(guān)系。比如每個指標(biāo)均值間的差異是否相等。
1、丈夫?qū)ζ拮右约捌拮訉φ煞虻幕卮鹪讦粒?.05顯著水平上沒有差異。
2、在四個指標(biāo)上他們是否會有相同的分?jǐn)?shù)。即檢驗四個分?jǐn)?shù)的平均值是否相等。
2023/2/648二、統(tǒng)計量與檢驗
檢驗
在原假設(shè)為真的條件下,檢驗的統(tǒng)計量為:2023/2/649dataa;inputx1x2x3x4class;cards;數(shù)據(jù)行省略;run;proc
anova;classclass;modelx1-x4=class;manovah=classm=(1-1
0
0,
1
0-1
0,
1
0
0-1);run;2023/2/650H=AnovaSSCPMatrixforclassE=ErrorSSCPMatrixS=1M=0.5N=27StatisticValueFValueNumDFDenDFPr>FWilks'Lambda0.878572612.583560.0626Pillai'sTrace0.121427392.583560.0626Hotelling-LawleyTrace0.138209852.583560.0626Roy'sGreatestRoot0.138209852.583560.06262023/2/651
例某種產(chǎn)品有甲乙兩個品牌,其質(zhì)量指標(biāo)有5個,從兩種品牌的產(chǎn)品中分別抽出5個,有如下的數(shù)據(jù),
序號X1X2X3X4X51111815181523327312117320282723194182618189522232216102023/2/652序號X1X2X3X4X51181720181823124312620314161720174252431261853628242629檢驗兩種品牌的質(zhì)量指標(biāo)差異有顯著不同。2023/2/653s1={63.7021.3546.407.558.00,21.3516.3019.957.154.25,46.4019.9542.3012.1016.25,7.557.1512.107.7010.50,8.004.2516.2510.5019.00};s2={81.7044.7036.9029.8036.60,44.7026.2022.6518.3019.60,36.9022.6540.3020.603.45,29.8018.3020.6015.209.90,36.6019.603.459.9024.30};2023/2/654mu1={20.80,24.40,22.60,19.20,14.00};mu2={24.80,21.80,24.60,23.20,20.40};2023/2/655sp=(4#s1+4#s2)/8;C={1-1000,01-100,001-10,0001-1};T=5#(t(mu1-mu2)*t(C)*inv(C*sp*t(c))*C*(mu1-mu2))/2;
T=35.645395
2023/2/6562023/2/657dataa1;inputx1-x5class$@@;cards;1118151815133273121171202827231911826181891222322161011817201818231243126202141617201722524312618236282426292;procanova;classclass;modelx1-x5=class;manovah=classm=(-11000,01-100,001-10,000-11);run;2023/2/658第五節(jié)多個總體均值的比較檢驗(多元方差分析)
前面我們已經(jīng)對單個總體和兩個總體的均值向量進(jìn)行了檢驗。但常常還需要檢驗三個或三個以上總體的均值向量是否相等。
一、方差分析的回顧
某工廠實行早、中、晚三班工作制。工廠管理部門想了解不同班次工人勞動效率是否存在明顯的差異。每個班次隨機(jī)抽出了7個工人,得工人的勞動效率(件/班)資料如表。分析不同班次工人的勞動效率是否有顯著性差異。=0.05,0.01。2023/2/659早班中班晚班3449393747403551423348393350413551423651402023/2/660
為什么各值會有差異?可能的原因有兩個。
一是,各個班次工人的勞動效率可能有差異,從而導(dǎo)致了不同水平下的觀察值之間差異,即存在條件誤差。
二是,隨機(jī)誤差的存在。
如何衡量兩種原因所引起的觀察值的差異?總平均勞動效率為:2023/2/661三個班次工人的平均勞動效率分別為:總離差平方和ss組間離差平方和(條件誤差)ssA2023/2/662組內(nèi)離差平方和(隨機(jī)誤差)sse
統(tǒng)計量F2023/2/663查F分布表得臨界值因為故應(yīng)拒絕原假設(shè),即不同班次工人的勞動效率有顯著的差異。
方差分析:比較3個或3個以上的總體均值是否有顯著性差異。用組間的方差與組內(nèi)方差相比,據(jù)以判別誤差主要源于組間的方差(不同組工人的產(chǎn)量,條件誤差),還是源于組內(nèi)方差(隨機(jī)誤差)。2023/2/664
方差分析的任務(wù)是:尋找適當(dāng)?shù)慕y(tǒng)計量,檢驗諸效應(yīng)是否相等。亦即檢驗
原假設(shè)Ho:a1=a2=…=ak,即諸效應(yīng)均為零;備擇假設(shè)H0:諸ai不全相等.總離差平方和反映了全部觀察值相對于總平均數(shù)的離散程度。隨機(jī)波動所引起的離差平方和反映了各相同水平下觀察值之間的分散程度,稱為誤差平方和或組內(nèi)平方和。2023/2/665由各水平的效應(yīng)不同引起的離差平方和
可以證明
在原假設(shè)成立的條件下,統(tǒng)計量F服從第一自由度為k-1,第二自由度為n-k的F分布,對于給定的顯著性水平,可以查表確定臨界值滿足P{F>F(k-1,n-k)}=。2023/2/666把計算的F值與臨界值比較,當(dāng)FF時,拒絕原假設(shè),不同水平下的效應(yīng)有顯著性差異;當(dāng)F<F時,接受原假設(shè)。方差來源離差平方和自由度方差F值
組間A
組內(nèi)E
—
總和
——NEXT2023/2/667
二、多元方差分析中的假設(shè)
設(shè)有個總體,他們的分布分別今從這個總體中抽出樣本,,為第個總體的樣本容量,樣本容量為。
三、多元方差分析的叉積矩陣的分解2023/2/668交叉乘積項2023/2/669SSE為組內(nèi)叉積矩陣,反映隨機(jī)因素引起的誤差;SS(TR)為組間叉積矩陣,反映系統(tǒng)因素引起的誤差。
SSE和SS(TR)之和等于總叉積矩陣SST。當(dāng)SSE在SST中占有較大的份額時,可以認(rèn)為隨機(jī)因素影響過大,反之SSE所占份額小,SS(RT)所占份額就大,不同試驗間的觀測值會有顯著性差異。2023/2/670
四、構(gòu)造統(tǒng)計量2023/2/671
從前面的分析,可以看出統(tǒng)計量實際上是組內(nèi)離差平方和與總離差平方和的比值,反映了組內(nèi)離差平方和在總離差平方和中所占比重。
越小,則不同試驗間的觀測值之間的差異就越大,則支持備擇假設(shè)不完全相同;
越大,則不同試驗間的觀測值之間的差異就越小,則支持原假設(shè)?!纠繛榱搜芯磕撤N疾病,對一批人同時測量了4個指標(biāo),脂蛋白、甘油三酯、脂蛋白和前脂蛋白。按這批人的不同年齡、不同性別分為三組(20至35歲的女性、20至25歲的男性和35至50歲的男性)。討論三組人的4項指標(biāo)是否存在顯著性差異。=0.05。2023/2/6722023/2/673dataa;inputg$x1-x4@@;cards;126075401812007234171240874518117065391712701103924120513034231190692715120046461512501172120120010728201225130361112101252617117064311412707633131190603416……;proc
anova;classg;modelx1-x4=g;manovah=g;run;2023/2/674StatisticValueFValueNumDFDenDFPr>FWilks'Lambda0.66413.0781080.0038Pillai'sTrace0.36273.0581100.0039Hotelling-LawleyTrace0.46543.11874.8560.0044Roy'sGreatestRoot0.34994.814550.0021從SAS的輸出可以看出應(yīng)該拒絕原假設(shè),即類間的有顯著性差異。2023/2/675第三節(jié)協(xié)差陣檢驗
如同一元隨機(jī)變量檢驗方差情形,多元隨機(jī)向量通常也要對協(xié)方差矩陣進(jìn)行檢驗,檢驗的方法是似然比檢驗。似然比檢驗的思路是原假設(shè)成立的似然函數(shù)與原空間的似然函數(shù)(極大似然估計的似然函數(shù))相比的比值。即
該比如越大越接受原假設(shè),反之比如越小越不能接受原假設(shè)。2023/2/676
在原假設(shè)成立的條件下,統(tǒng)計量
漸近到自由度為p(p+1)/2的卡方分布。2023/2/677為樣本聯(lián)合密度函數(shù)。2023/2/678
原假設(shè)成立的條件下,似然函數(shù)為
全空間似然函數(shù)為2023/2/679
將兩個似然函數(shù)相比,有2023/2/680
注:統(tǒng)計量是原假設(shè)成立的似然函數(shù)除以全空間的似然函數(shù)(極大似然估計的似然函數(shù))。該統(tǒng)計量的值大于零小于等于1。越
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年班車母嬰用品合同
- 珠寶玉石合作居間服務(wù)合同
- 2025年度辦公用品配送服務(wù)與綠色辦公培訓(xùn)合作合同
- 保健服務(wù)居間合同
- 2025年分期付款酒店合同
- 2024中國地質(zhì)勘查業(yè)行業(yè)分析報告
- 2025-2030年中國降壓芯片行業(yè)深度研究分析報告
- 2025-2030年中國數(shù)字視頻新媒體行業(yè)市場研究分析及投資前景研判報告
- 2025年中國鹽酸地爾硫卓片行業(yè)發(fā)展趨勢及投資前景預(yù)測報告
- 2025年中國飼料用魚粉行業(yè)市場全景評估及發(fā)展戰(zhàn)略規(guī)劃報告
- 國際尿失禁咨詢委員會尿失禁問卷表
- 國開行政管理論文行政組織的變革及其現(xiàn)實性研究
- 運動技能學(xué)習(xí)中的追加反饋
- 《淄博張店區(qū)停車問題治理現(xiàn)狀及優(yōu)化對策分析【開題報告+正文】15000字 》
- 常用電子元器件基礎(chǔ)知識演示
- GB/T 32918.4-2016信息安全技術(shù)SM2橢圓曲線公鑰密碼算法第4部分:公鑰加密算法
- 2023年藥事法規(guī)教學(xué)案例庫及案例分析
- 北京市水務(wù)安全生產(chǎn)風(fēng)險評估指南
- 吸引器教學(xué)講解課件
- 醫(yī)學(xué)心理學(xué)人衛(wèi)八版66張課件
- 仿古建筑施工常見質(zhì)量通病及防治措施
評論
0/150
提交評論