統(tǒng)計(jì)學(xué) 全程試題解析_第1頁
統(tǒng)計(jì)學(xué) 全程試題解析_第2頁
統(tǒng)計(jì)學(xué) 全程試題解析_第3頁
統(tǒng)計(jì)學(xué) 全程試題解析_第4頁
統(tǒng)計(jì)學(xué) 全程試題解析_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1. 單樣本t檢驗(yàn)表,第一行注明了用于比較的已知總體均數(shù)為1,下面從左到右依次為t值(t)、自由度(df)、P值(Sig.2-tailed)、兩均數(shù)的差值(Mean Difference)、差值的95%可信區(qū)間。由上表可知:t=2.975,P=0.007。因此可以認(rèn)為血磷值的總體均數(shù)不等于1。2Independent-Samples T Test過程兩組需檢驗(yàn)變量的基本情況描述。第一部分為Levene's方差齊性檢驗(yàn),用于判斷兩總體方差是否齊,這里的戒嚴(yán)結(jié)果為F = 0.032,P = 0.860,可見在本例中方差是齊的;第二部分則分別給出兩組所在總體方差齊和方差不齊時(shí)的t檢驗(yàn)結(jié)果,由

2、于前面的方差齊性檢驗(yàn)結(jié)果為方差齊,第二部分就應(yīng)選用方差齊時(shí)的t檢驗(yàn)結(jié)果,即上面一行列出的t= 2.524,=22,P=0.019。從而最終的統(tǒng)計(jì)結(jié)論為按=0.05水準(zhǔn),拒絕H0,認(rèn)為克山病患者與健康人的血磷值不同,從樣本均數(shù)來看,可認(rèn)為克山病患者的血磷值較高。最后面還附有一些其他指標(biāo),如兩組均數(shù)的可信區(qū)間等,以對差異情況有更直觀的了解。上表的標(biāo)題內(nèi)容翻譯如下:Levene方差齊性檢驗(yàn)兩均數(shù)是否相等的t檢驗(yàn)  F值P值t值自由度P值(雙側(cè))均數(shù)差值差值的標(biāo)準(zhǔn)誤差值的95%可信區(qū)間下限上限血磷值假設(shè)方差齊.032.8602.52422.019.4363.17297.777E-0

3、2.7948假設(shè)方差不齊 2.52421.353.020.4363.17297.716E-02.79543.配對t檢驗(yàn):Paired-Samples T Test過程對子間的差異 差值均數(shù)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤均數(shù)的95%可信區(qū)間t值自由度P值(雙側(cè))下限上限第一對G1 - G2812.5000546.2535193.1298355.82071269.17934.2077.0044. 成組設(shè)計(jì)的方差分析:One-Way ANOVA過程用于進(jìn)行兩組及多組樣本均數(shù)的比較,即面實(shí)際上是一個(gè)典型的方差分析表。給出了單因素方差分析的結(jié)果,可見F=84.544,P<0.001。因此可認(rèn)為三

4、組礦工用力肺活量不同。上表的標(biāo)題內(nèi)容翻譯如下: 離均差平方和SS自由度均方MSF值P值組間變異9.26624.63384.544.000組內(nèi)變異1.534285.480E-02  總變異10.80030   上表是用S-N-K法進(jìn)行兩兩比較的結(jié)果,簡單的說,在表格的縱向上各組均數(shù)按大小排序,然后在表格的橫向上被分成了若干個(gè)亞組,不同亞組間的P值小于0.05,而同一亞組內(nèi)的各組均數(shù)比較的P值則大于0.05。從上表可見,石棉肺患者、可疑患者和非患者被分在了三個(gè)不同的亞組中,因此三組間兩兩比較均有差異;由于各個(gè)亞組均只有1個(gè)組別進(jìn)入,因此最

5、下方的組內(nèi)兩兩比較P值均為1.000(自己和自己比較,當(dāng)然絕對不會(huì)有差異了)。5.兩因素方差分析現(xiàn)在大家看到的是一個(gè)典型的方差分析表,只不過是兩因素的而已,我來解釋一下:首先是所用方差分析模型的檢驗(yàn),F(xiàn)值為00.517,P小于0.05,因此所用的模型有統(tǒng)計(jì)學(xué)意義,可以用它來判斷模型中系數(shù)有無統(tǒng)計(jì)學(xué)意義;第二行是截距,它在我們的分析中沒有實(shí)際意義,忽略即可;第三行是變量GROUP,可見它也有統(tǒng)計(jì)學(xué)意義,不過我們關(guān)心的也不是他;第四行是我們真正要分析的FOOD,非常遺憾,它的P值為0.084,還沒有統(tǒng)計(jì)學(xué)意義。盡管不太愿意,我們的結(jié)論也只能是:尚不能認(rèn)為三種營養(yǎng)素喂養(yǎng)的小白鼠體重增量有差別。上表的

6、標(biāo)題內(nèi)容翻譯如下:變異來源III型方差SS自由度均方MS統(tǒng)計(jì)量FP值校正的模型2521.2949280.14411.517.000截距74359.534174359.5343056.985.000GROUP2376.3767339.48213.956.000FOOD144.917272.4592.979.084誤差340.5431424.324合計(jì)77221.37024校正的合計(jì)2861.83623現(xiàn)在是兩兩比較的結(jié)果,方法為SNK法,由于前面總的比較無差異,所以這里三種食物均在一個(gè)亞組內(nèi),檢驗(yàn)無差異,P值為0.121。好了,上面是正確的結(jié)果,如果model選擇是采用Full factor又如

7、何呢?會(huì)得出方差分析表如下:看到了嗎?由于所謂的交互作用將自由度給全部“吃”掉了,沒有誤差可用于統(tǒng)計(jì)分析,什么結(jié)果也做不出來6. 協(xié)方差分析上表顯示交互作用無統(tǒng)計(jì)學(xué)意義,而且P值非常大,因此交換group和age多半交互作用也無統(tǒng)計(jì)學(xué)意義,因此可以不繼續(xù)作預(yù)分析了,當(dāng)然,嚴(yán)格的步驟應(yīng)當(dāng)交換兩者的順序繼續(xù)進(jìn)行預(yù)分析。Estimated Marginal Means這是兩組的修正均數(shù)及相應(yīng)的可信區(qū)間,顯然超重組的膽固醇均值較高。下方的提示表明該修正均數(shù)是按年齡為50.2308歲的情形計(jì)算的。7.多元方差分析所謂的多元方差分析,就是說存在著不止一個(gè)應(yīng)變量,而是兩個(gè)以上的應(yīng)變量共同反映了自變量的影響程

8、度。比如要研究某些因素對兒童生長的影響程度,則身高、體重等都可以作為生長程度的測量因子,即都應(yīng)作為應(yīng)變量。這是引入模型的自變量的取值情況列表上表是針對模型中的自變量間及其交互作用所做的檢驗(yàn),采用的是四種多元檢驗(yàn)方法。一般他們的結(jié)果都是相同的,如果不同,一般以Hotelling's Trace方法的結(jié)果為準(zhǔn)??梢娫谒玫哪P椭?,extrusn和additive對結(jié)果變量是有統(tǒng)計(jì)學(xué)意義的,但交互作用無統(tǒng)計(jì)學(xué)意義。上表實(shí)際上是四個(gè)一元方差分析表的合并,即分別考慮四個(gè)應(yīng)變量時(shí)的方差分析結(jié)果。上面的多元方差分析已經(jīng)得知兩自變量對應(yīng)變量有影響,從現(xiàn)在的分析表就可以更清楚的知道是對那些自變量影響較大

9、。對照可知,extrusn和additive對tear resistance和gloss都有較大影響,而他們的交互作用對gloss有影響,他們(及交互作用)對Opacity都沒有影響。8.重復(fù)測量的方差分析重復(fù)測量的方差分析指的是一個(gè)應(yīng)變量被重復(fù)測量好幾次,從而同一個(gè)個(gè)體的幾次觀察結(jié)果間存在相關(guān),這樣就不滿足普通分析的要求,需要用重復(fù)測量的方差分析模型來解決General Linear Model上表給出了所定義的4次測量的變量名,在模型中它們都代表一個(gè)應(yīng)變量trial,只是測量的次數(shù)不同而已。這是引入模型的其它自變量的情況列表。上表是針對所檢驗(yàn)的結(jié)果變量trial,以及他和另兩個(gè)引入模型的自

10、變量間的交互作用是否存在統(tǒng)計(jì)學(xué)意義,采用的是四種多元檢驗(yàn)方法。一般他們的結(jié)果都是相同的,如果不同,我一般以Hotelling's Trace方法的結(jié)果為準(zhǔn)??梢娫谒玫哪P椭?,trial的四次測量間的確是存在著統(tǒng)計(jì)學(xué)差異的,但它和另兩個(gè)變量間的交互作用無統(tǒng)計(jì)學(xué)意義。上表是球形檢驗(yàn),因?yàn)橹貜?fù)測量的方差分析模型要求所檢驗(yàn)的應(yīng)變量服從一種叫做球形分布的東東。上面可能有些內(nèi)容不好懂,不過沒關(guān)系,只要看到近似卡方為9.383,自由度為5,P值為0.097就可以了。因此trial是勉強(qiáng)服從球形分布的,可以進(jìn)行重復(fù)測量的方差分析。上面又用方差分析的方法對組內(nèi)因素進(jìn)行了檢驗(yàn),注意第一種為球形分布假設(shè)成

11、立時(shí)的結(jié)果,就是我們所要看的。如果該假設(shè)不成立,則根據(jù)不同的情況可能看下面三種檢驗(yàn)結(jié)果之一,或放棄該檢驗(yàn)方法。上表是非常重要的一部分:各次重復(fù)測量間變化趨勢的模型分析,這里要求檢驗(yàn)沒有統(tǒng)計(jì)學(xué)意義,否則說明變化趨勢不服從該曲線。以trial為例,對Linear的檢驗(yàn)P值小于千分之一,Quadratic的P值略大于0.05。只有Cubic的P值在0.5附近,因此最佳的擬合曲線應(yīng)為Cubic(三次方曲線);但由于一共才四次測量,三次方曲線顯然太奢侈了,因此如果沒有任何其它提示或?qū)I(yè)上的知識,最終的擬和曲線應(yīng)為Quadratic(二次方曲線)。上表為最后一張,為組間效應(yīng)的方差分析結(jié)果,可見anxiet

12、y和tension均無統(tǒng)計(jì)學(xué)意義。最后,為了再確認(rèn)一下幾次測量間的變化趨勢,我們另外用plots子菜單作出模型估計(jì)的四次測量均數(shù)值如下圖:可見四次測量均數(shù)實(shí)際上還是近似于直線趨勢的,因此前面的模型應(yīng)為線性最佳。9.多元線性回歸Regression這里的表格是擬合過程中變量進(jìn)入/退出模型的情況記錄,由于我們只引入了一個(gè)自變量,所以只出現(xiàn)了一個(gè)模型1(在多元回歸中就會(huì)依次出現(xiàn)多個(gè)回歸模型),該模型中fat為進(jìn)入的變量,沒有移出的變量,具體的進(jìn)入/退出方法為enter。上表為所擬合模型的情況簡報(bào),顯示在模型1中相關(guān)系數(shù)R為0.578,而決定系數(shù)R2為0.334,校正的決定系數(shù)為0.307。這是所用模

13、型的檢驗(yàn)結(jié)果,可以看到這就是一個(gè)標(biāo)準(zhǔn)的方差分析表!有興趣的讀者可以自己用方差分析模型做一下,就會(huì)發(fā)現(xiàn)出了最左側(cè)的一列名字不太一樣外,其他的各個(gè)參數(shù)值都是相同的。從上表可見所用的回歸模型F值為12.059,P值為0.002,因此我們用的這個(gè)回歸模型是有統(tǒng)計(jì)學(xué)意義的,可以繼續(xù)看下面系數(shù)分別檢驗(yàn)的結(jié)果。由于這里我們所用的回歸模型只有一個(gè)自變量,因此模型的檢驗(yàn)就等價(jià)與系數(shù)的檢驗(yàn),在多元回歸中這兩者是不同的。上表給出了包括常數(shù)項(xiàng)在內(nèi)的所有系數(shù)的檢驗(yàn)結(jié)果,用的是t檢驗(yàn),同時(shí)還會(huì)給出標(biāo)化/未標(biāo)化系數(shù)。可見常數(shù)項(xiàng)和fat都是有統(tǒng)計(jì)學(xué)意義的,上表的內(nèi)容如果翻譯成中文則如下所示:未標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)化系數(shù)模型系數(shù)b系

14、數(shù)標(biāo)準(zhǔn)誤系數(shù)t值P值1常數(shù)5.0970.42711.9230.000fat0.7000.2020.5783.4730.002最終的結(jié)果如下:Regression上面的表格依次列出了模型的篩選過程,模型1用進(jìn)入法引入了extrusn,然后模型2用stepwise法引入了additive,另兩個(gè)變量因沒有達(dá)到進(jìn)入標(biāo)準(zhǔn),最終沒有進(jìn)入。上面的表格翻譯出來如下:模型進(jìn)入的變量移出的變量變量篩選方法1extrusn進(jìn)入法2additivestepwise法(標(biāo)準(zhǔn):進(jìn)入概率小于0.05,移出概率大于0.1)上表是兩個(gè)模型變異系數(shù)的改變情況,從調(diào)整的R2可見,從上到下隨著新變量的引入,模型可解釋的變異占總變異

15、的比例越來越大。上表是所用兩個(gè)模型的檢驗(yàn)結(jié)果,用的方法是方差分析,可見二個(gè)模型都有統(tǒng)計(jì)學(xué)意義。上表仍然為三個(gè)模型中各個(gè)系數(shù)的檢驗(yàn)結(jié)果,用的是t檢驗(yàn),可見在模型2中所有的系數(shù)都有統(tǒng)計(jì)學(xué)意義,上表的內(nèi)容翻譯如下:  未標(biāo)化的系數(shù)標(biāo)化的系數(shù)  模型 B標(biāo)準(zhǔn)誤Betat值P值1(常數(shù))5.900.265  22.278.000 extrusion.590.167.6393.522.0002(常數(shù))5.315.314 16.926.000 extrusion.590.144.6394.905.000

16、60;additive.390.144.4222.707.000這是新出現(xiàn)的一個(gè)表格,反映的是沒有進(jìn)入模型的各個(gè)變量的檢驗(yàn)結(jié)果,可見在模型1中,未引入模型的候選變量additive還有統(tǒng)計(jì)學(xué)意義,可能需要引入,而模型2中沒有引入的兩個(gè)變量其P值均大于0.05,無需再進(jìn)行分析了。10. Logistic回歸模型結(jié)果解釋Logistic Regression上表為記錄處理情況匯總,即有多少例記錄被納入了下面的分析,可見此處因不存在缺失值,26條記錄均納入了分析。上表為應(yīng)變量分類情況列表,沒什么好解釋的。Block 0: Beginning Block此處已經(jīng)開始了擬合,Block 0擬合的是只有常

17、數(shù)的無效模型,上表為分類預(yù)測表,可見在17例觀察值為0的記錄中,共有17例被預(yù)測為0,9例1也都被預(yù)測為0,總預(yù)測準(zhǔn)確率為65.4%,這是不納入任何解釋變量時(shí)的預(yù)測準(zhǔn)確率,相當(dāng)于比較基線。上表為Block 0時(shí)的變量系數(shù),可見常數(shù)的系數(shù)值為-0.636。上表為在Block 0處尚未納入分析方程的侯選變量,所作的檢驗(yàn)表示如果分別將他們納入方程,則方程的改變是否會(huì)有顯著意義(根據(jù)所用統(tǒng)計(jì)量的不同,可能是擬合優(yōu)度,Deviance值等)。可見如果將X2系列的啞變量納入方程,則方程的改變是有顯著意義的,X4和X5也是如此,由于Stepwise方法是一個(gè)一個(gè)的進(jìn)入變量,下一步將會(huì)先納入P值最小的變量X2

18、,然后再重新計(jì)算該表,再做選擇。Block 1: Method = Forward Stepwise (Conditional)此處開始了Block 1的擬合,根據(jù)我們的設(shè)定,采用的方法為Forward(我們只設(shè)定了一個(gè)Block,所以后面不會(huì)再有Block 2了)。上表為全局檢驗(yàn),對每一步都作了Step、Block和Model的檢驗(yàn),可見6個(gè)檢驗(yàn)都是有意義的。此處為模型概況匯總,可見從STEP1到STEP2,DEVINCE從18降到11,兩種決定系數(shù)也都有上升。此處為每一步的預(yù)測情況匯總,可見準(zhǔn)確率由Block 0的65%上升到了84%,最后達(dá)到96%,效果不錯(cuò),最終只出現(xiàn)了一例錯(cuò)判。上表為

19、方程中變量檢驗(yàn)情況列表,分別給出了Step 1和Step 2的擬合情況。注意X4的P值略大于0.05,但仍然是可以接受的,因?yàn)檫@里用到的是排除標(biāo)準(zhǔn)(默認(rèn)為0.1),該變量可以留在方程中。以Step 2中的X2為例,可見其系數(shù)為2.413,OR值為11。上表為假設(shè)將這些變量單獨(dú)移出方程,則方程的改變有無統(tǒng)計(jì)學(xué)意義,可見都是有統(tǒng)計(jì)學(xué)意義的,因此他們應(yīng)當(dāng)保留在方程中。最后這個(gè)表格說明的是在每一步中,尚未進(jìn)入方程的變量如果再進(jìn)入現(xiàn)有方程,則方程的改變有無統(tǒng)計(jì)學(xué)意義??梢娫赟tep 1時(shí),X4還應(yīng)該引入,而在Step 2時(shí),其它變量是否引入都無關(guān)了。Chi-square test:用卡方檢驗(yàn)來檢驗(yàn)變量的幾個(gè)取值所占百分比是否和我們期望的比例沒有統(tǒng)計(jì)學(xué)差異Binomial Test:用于檢測所給的變量是否符合二項(xiàng)分布,變量可以是兩分類的,也可以使連續(xù)性變量,然后按你給出的分界點(diǎn)一刀兩斷· One-Sample Kolmogorov-Smirnov Test:采用柯爾莫諾夫-斯米爾諾夫檢驗(yàn)來分析變量是否符合某種分布,可以檢驗(yàn)的分布有正態(tài)分布、均勻分布、Poission分布和指數(shù)分布。 · Two-Independent-Samples Tests:即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論