




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第四章第四章統(tǒng)計描述統(tǒng)計描述第一節(jié)第一節(jié)頻數(shù)分布頻數(shù)分布一、計量資料的頻數(shù)分布表一、計量資料的頻數(shù)分布表 例例1 某年某市某年某市120名名12歲健康男孩身高測量資料歲健康男孩身高測量資料142.3134.5145.2151.1141.2143.5134.7150.8125.9160.9134.7129.4156.6148.8141.8144.0141.5139.2147.3144.5132.7154.2138.5142.5142.7134.4146.8145.4148.8144.7138.1137.1152.9137.9138.9141.2145.7148.8135.1146.2140.11
2、39.3140.2147.1147.9139.9137.7148.9138.2137.9150.3143.3150.6141.9137.4142.9141.8149.7138.5154.0141.6151.3133.1156.3139.5147.8145.1134.9141.4147.5139.6147.7142.5140.8142.7141.9146.4140.5145.8143.6140.9136.9143.5152.3130.5149.8143.9140.7143.8138.9147.9142.3141.4148.1142.9146.6132.1143.6142.4145.9150.01
3、48.9146.7143.3146.7144.0146.5139.2135.5149.0139.6144.4142.1142.4143.4140.2138.7134.4145.4139.9找出全距找出全距 即最大值與最小值之差。即最大值與最小值之差。 全距全距(R)= 160.9125.9 = 35確定組距確定組距 為相鄰兩組段最小值之差。通常以為相鄰兩組段最小值之差。通常以R的的1/10進(jìn)行估計。進(jìn)行估計。 組距(組距(i)= 全距(全距(R)/10 = 35/10 = 3.5 可取可取i =4。劃分組段劃分組段每個組段應(yīng)有一個起始值作為組下限和一個終止值作為組上限;每個組段應(yīng)有一個起始值作
4、為組下限和一個終止值作為組上限;第一個組段應(yīng)包括最小值,最后一個組段應(yīng)包括最大值;第一個組段應(yīng)包括最小值,最后一個組段應(yīng)包括最大值;組段數(shù)一般取組段數(shù)一般取815個;個;為避免相鄰兩組段界限互相包含,除最末一個組段外,其余組為避免相鄰兩組段界限互相包含,除最末一個組段外,其余組段只寫下限。段只寫下限。 整理頻數(shù)分布整理頻數(shù)分布 計算各組段頻數(shù)、累計頻數(shù)和累計頻率。計算各組段頻數(shù)、累計頻數(shù)和累計頻率。組組 段段劃劃 記記頻頻 數(shù)數(shù)125 112941339137 正正正正正正正正2814135145271491115341571611合合 計計120 表表1 120名名12歲健康男孩身高的頻數(shù)分
5、布表歲健康男孩身高的頻數(shù)分布表149283527114105101520253035125129133137141145149153157161二、計數(shù)資料和等級資料的頻數(shù)分布表二、計數(shù)資料和等級資料的頻數(shù)分布表 1、計數(shù)資料的頻數(shù)分布表、計數(shù)資料的頻數(shù)分布表 表表2 100名大學(xué)生性別的頻數(shù)分布表名大學(xué)生性別的頻數(shù)分布表性別性別頻數(shù)頻數(shù)頻率(頻率(%)累計累計頻數(shù)頻數(shù)累計累計頻率(頻率(%)男男4040.04040.0女女6060.0100100.0合計合計100100.02、等級資料的頻數(shù)分布表、等級資料的頻數(shù)分布表 表表3 100名大學(xué)生性別的頻數(shù)分布表名大學(xué)生性別的頻數(shù)分布表視力等級視
6、力等級頻數(shù)頻數(shù)頻率(頻率(%)累計累計頻數(shù)頻數(shù)累計累計頻率(頻率(%)差差826.67826.67中中1240.002066.67良良1033.3330100.00合計合計30100.00三、頻數(shù)分布表的作用三、頻數(shù)分布表的作用1、揭示資料的頻數(shù)分布特征與類型、揭示資料的頻數(shù)分布特征與類型(1)頻數(shù)分布的特征)頻數(shù)分布的特征 集中趨勢集中趨勢 反映變量值平均的數(shù)量水平。反映變量值平均的數(shù)量水平。 離散趨勢離散趨勢 反映變量值相互之間變異的程度。反映變量值相互之間變異的程度。(2)頻數(shù)分布的類型)頻數(shù)分布的類型 對稱分布對稱分布 集中位置居中,左右兩側(cè)的頻數(shù)基本一致。集中位置居中,左右兩側(cè)的頻數(shù)
7、基本一致。 非對稱分布非對稱分布 集中位置偏向一側(cè),左右兩側(cè)頻數(shù)不一致。集中位置偏向一側(cè),左右兩側(cè)頻數(shù)不一致。2、觀察離群值、觀察離群值 便于發(fā)現(xiàn)一些特大、特小的可疑值。便于發(fā)現(xiàn)一些特大、特小的可疑值。 第二節(jié)第二節(jié)計量資料的統(tǒng)計描述計量資料的統(tǒng)計描述一、集中趨勢的描述一、集中趨勢的描述含義含義 集中趨勢是指計量資料中,所有觀察值的中集中趨勢是指計量資料中,所有觀察值的中心位置。反映一組同質(zhì)變量值的平均數(shù)量水平。心位置。反映一組同質(zhì)變量值的平均數(shù)量水平。常用指標(biāo)常用指標(biāo) 算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)1、算術(shù)均數(shù)(、算術(shù)均數(shù)(arithmetic mean) 簡稱
8、均數(shù)(簡稱均數(shù)(mean),用),用x及及表示。表示。適用范圍適用范圍 變量值呈對稱分布,尤其是正態(tài)分布的計量資料變量值呈對稱分布,尤其是正態(tài)分布的計量資料計算方法計算方法直接法直接法 變量值個數(shù)不多,直接相加除以變量值個數(shù)。變量值個數(shù)不多,直接相加除以變量值個數(shù)。加權(quán)法加權(quán)法 變量值較多或頻數(shù)表資料。變量值較多或頻數(shù)表資料。組組 段段組中值(組中值(X X0 0)頻數(shù)(頻數(shù)(f f)fxfx125 12711271291314524133135912151371392838921411433550051451472739691491511116611531554620157161159115
9、9合合 計計12017172 表表1 120名名12歲健康男孩身高的頻數(shù)分布表歲健康男孩身高的頻數(shù)分布表2、幾何均數(shù)(、幾何均數(shù)(geometric mean, G)適用范圍適用范圍 變量值呈對數(shù)對稱分布變量值呈對數(shù)對稱分布等比級數(shù)資料等比級數(shù)資料計算方法計算方法直接法直接法 變量值個數(shù)不多,直接將其乘積開變量值個數(shù)不多,直接將其乘積開n次方。次方。加權(quán)法加權(quán)法 變量值較多或頻數(shù)表資料。變量值較多或頻數(shù)表資料??贵w滴度抗體滴度人數(shù)(人數(shù)(f f)滴度倒數(shù)(滴度倒數(shù)(x x)lgxlgxflgxflgx1 2220.30100.602014 41140.60216.623118 81880.90
10、3116.25581161636161.204143.34761323222321.505133.1122164648641.806214.4496112812831282.10726.3216合合 計計100120.7119 表表4 100名患者抗體滴度的頻數(shù)分布表名患者抗體滴度的頻數(shù)分布表3、中位數(shù)(、中位數(shù)(median, M) 一組按大小順序排列的變量值,位次居中的數(shù)值即中位數(shù)。一組按大小順序排列的變量值,位次居中的數(shù)值即中位數(shù)。適用范圍適用范圍 變量值呈偏態(tài)分布變量值呈偏態(tài)分布分布類型不清分布類型不清變量值的一端(或兩端)無確定數(shù)值變量值的一端(或兩端)無確定數(shù)值開口型資料開口型資料
11、計算方法計算方法直接法直接法 變量值個數(shù)不多。變量值個數(shù)不多。頻數(shù)表法頻數(shù)表法 變量值個數(shù)較多,先整理頻數(shù)表。變量值個數(shù)較多,先整理頻數(shù)表。二、離散趨勢的描述二、離散趨勢的描述含義含義 離散趨勢是指計量資料所有觀察值偏離中離散趨勢是指計量資料所有觀察值偏離中心位置的程度,反映一組同質(zhì)變量值相互之間參心位置的程度,反映一組同質(zhì)變量值相互之間參差不齊的程度,即離散度或變異度。差不齊的程度,即離散度或變異度。常用指標(biāo)常用指標(biāo) 全距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。全距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。 1、全距(、全距(range, R) 又稱極差,是一組變量值中最大值與最小值的差。又稱極差,是一組變量值中最大值與
12、最小值的差。優(yōu)點優(yōu)點 計算簡單計算簡單缺點缺點 僅考慮了資料的最大值和最小值,不能反映僅考慮了資料的最大值和最小值,不能反映組內(nèi)其它數(shù)據(jù)的變異程度。組內(nèi)其它數(shù)據(jù)的變異程度。 2、百分位數(shù)(、百分位數(shù)(percentile)含義含義 又是一個位置指標(biāo),用又是一個位置指標(biāo),用Xp%。它表示在按照升序排列。它表示在按照升序排列的數(shù)列中,其左側(cè)(即小于的數(shù)列中,其左側(cè)(即小于Xp%側(cè))的觀察值個數(shù)在整個樣側(cè))的觀察值個數(shù)在整個樣本中所占百分比為本中所占百分比為p%,其右側(cè)(即大于,其右側(cè)(即大于Xp%側(cè))的觀察值個側(cè))的觀察值個數(shù)在整個樣本中所占百分比為(數(shù)在整個樣本中所占百分比為(100-p)%計算
13、計算 式中:是百分位數(shù),式中:是百分位數(shù),L是所在組段的下限,是所在組段的下限,i是該組是該組段的組距,段的組距,fp是該組段的頻數(shù),是該組段的頻數(shù),n是總頻數(shù),是總頻數(shù),fl是該是該組段以前的各組段的累計頻數(shù)。組段以前的各組段的累計頻數(shù)。)%(%LppfnpfiLX 四四分位數(shù)(分位數(shù)(quartile) 四分位間距(四分位間距(quartile range, Q) 含義含義 統(tǒng)計學(xué)將統(tǒng)計學(xué)將3個特殊的分位數(shù)個特殊的分位數(shù)X25%、 X50%、 X75%統(tǒng)稱統(tǒng)稱為四分位數(shù)。為四分位數(shù)。X25%:記為:記為Q1,稱作第一四分位數(shù);,稱作第一四分位數(shù);X50% :記為:記為Q2,稱作第二四分位數(shù)
14、;,稱作第二四分位數(shù); X75% :記為:記為Q3,稱作第三四分位數(shù);,稱作第三四分位數(shù); 并且將與差值稱為四分位間距(并且將與差值稱為四分位間距(quartile range, Q) 計算計算 Q= Q3 Q1 3、方差(、方差(variance) 用用2 2和和s s2 2表示。表示。 離均差的和離均差的和 離均差的平方和離均差的平方和 方差方差 方差反映變量值變異程度的大小,方差越大,說方差反映變量值變異程度的大小,方差越大,說明變量值的變異程度越大;方差越小,說明變異程度明變量值的變異程度越大;方差越小,說明變異程度越小。越小。優(yōu)點優(yōu)點 全面考慮了一組變量值中的每一個數(shù)據(jù)。全面考慮了一
15、組變量值中的每一個數(shù)據(jù)。缺點缺點 將變量值的單位進(jìn)行了平方。將變量值的單位進(jìn)行了平方。4、標(biāo)準(zhǔn)差(、標(biāo)準(zhǔn)差(standard deviation, SD) 用用和和s s表示。表示。 計算方法計算方法 直接法直接法 加權(quán)法加權(quán)法 標(biāo)準(zhǔn)差反映變量值變異程度的大小,。標(biāo)準(zhǔn)差反映變量值變異程度的大小,。 標(biāo)準(zhǔn)差的應(yīng)用標(biāo)準(zhǔn)差的應(yīng)用 表示一組變量值變異程度表示一組變量值變異程度 標(biāo)準(zhǔn)差越大,說明變量值的變標(biāo)準(zhǔn)差越大,說明變量值的變異程度越大,即變量值圍繞均數(shù)的分布較離散,均數(shù)的代異程度越大,即變量值圍繞均數(shù)的分布較離散,均數(shù)的代表性較差;標(biāo)準(zhǔn)差越小,表示變量值的變異程度越小,即表性較差;標(biāo)準(zhǔn)差越小,表示
16、變量值的變異程度越小,即變量值圍繞均數(shù)的分布較密集,均數(shù)的代表性較好。變量值圍繞均數(shù)的分布較密集,均數(shù)的代表性較好。計算變異系數(shù)計算變異系數(shù) 當(dāng)兩組變量值單位不同,或兩均數(shù)相差較大時,不能當(dāng)兩組變量值單位不同,或兩均數(shù)相差較大時,不能直接用標(biāo)準(zhǔn)差比較其變異程度,需要用變異系數(shù)做比較。直接用標(biāo)準(zhǔn)差比較其變異程度,需要用變異系數(shù)做比較。估計變量值的頻數(shù)分布估計變量值的頻數(shù)分布 計算標(biāo)準(zhǔn)誤計算標(biāo)準(zhǔn)誤5、變異系數(shù)(、變異系數(shù)(coefficient of variation, CV) 含義含義 是一個度量相對離散程度的指標(biāo)。是一個度量相對離散程度的指標(biāo)。計算計算 例例1 1:某地某地2020歲男子身高
17、均數(shù)為歲男子身高均數(shù)為166.06cm166.06cm,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為4.95cm4.95cm,體重均數(shù)為,體重均數(shù)為53.72kg53.72kg,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為4.96kg4.96kg,試比較身,試比較身高與體重的變異程度。高與體重的變異程度。 例例2 2:該地新生男嬰的平均身高為該地新生男嬰的平均身高為50cm50cm,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為3.0cm3.0cm,試比較該地,試比較該地2020歲男子與新生男嬰的變異程度。歲男子與新生男嬰的變異程度。%100XSCV例例1 1: 身高身高 CV = 4.95/166.06 CV = 4.95/166.06 100% = 2.98% 100
18、% = 2.98% 體重體重 CV = 4.96/53.72 CV = 4.96/53.72 100% = 9.23% 100% = 9.23%例例2 2:新生兒新生兒 CV = 3/50 CV = 3/50 100%= 6% 100%= 6% 第六章第六章參數(shù)估計參數(shù)估計幾種重要的連續(xù)性隨機變量分布:幾種重要的連續(xù)性隨機變量分布: 正態(tài)分布正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布 t分布分布見見P72第五章第四、五節(jié)第五章第四、五節(jié)正態(tài)分布正態(tài)分布(normal distribution) 一、正態(tài)分布的概念一、正態(tài)分布的概念 正態(tài)分布是一種連續(xù)性隨機變量常見而重要的分布。正態(tài)分布是一種連續(xù)性隨機
19、變量常見而重要的分布。 二、正態(tài)分布的特征二、正態(tài)分布的特征 1、在直角坐標(biāo)的橫軸(、在直角坐標(biāo)的橫軸(X軸)上方呈鐘型曲線,以軸)上方呈鐘型曲線,以X=為為對稱軸左右完全對稱,但與對稱軸左右完全對稱,但與X軸永不相交;軸永不相交; 2、在、在X=處有最大值;處有最大值;X越遠(yuǎn)離越遠(yuǎn)離,曲線位置越低,曲線位置越低 ; 3、取決于兩個重要參數(shù)、取決于兩個重要參數(shù)表示方式:表示方式: :位置參數(shù);:位置參數(shù); :形狀參數(shù):形狀參數(shù)表示方式:(表示方式:( , 2) 三、正態(tài)分布的面積規(guī)律三、正態(tài)分布的面積規(guī)律 正態(tài)分布曲線下面積分布規(guī)律正態(tài)分布曲線下面積分布規(guī)律 范圍內(nèi)的面積占正態(tài)分布曲線下總面積
20、的范圍內(nèi)的面積占正態(tài)分布曲線下總面積的 68.27% 68.27%,即有,即有68.27%68.27%的變量值分布在此范圍內(nèi);的變量值分布在此范圍內(nèi); 1.96范圍內(nèi)的面積占正態(tài)分布曲線下總面積的范圍內(nèi)的面積占正態(tài)分布曲線下總面積的 95.00% 95.00% ,即有,即有95.00%95.00%的變量值分布在此范圍內(nèi);的變量值分布在此范圍內(nèi); 2.58 范圍內(nèi)的面積占正態(tài)分布曲線下總面積的范圍內(nèi)的面積占正態(tài)分布曲線下總面積的9 9 9.00% 9.00%,即有,即有99.00%99.00%的變量值分布在此范圍內(nèi);的變量值分布在此范圍內(nèi); 四、正態(tài)分布的應(yīng)用四、正態(tài)分布的應(yīng)用 估計醫(yī)學(xué)正常值范
21、圍;估計醫(yī)學(xué)正常值范圍; 正常值范圍的含義正常值范圍的含義 正常值范圍的計算公式正常值范圍的計算公式 x us 質(zhì)量控制質(zhì)量控制 x 2s 上、下警戒值上、下警戒值 x 3s 上、下控制值上、下控制值 表表5 常用的常用的u界值表界值表是其它許多統(tǒng)計方法的理論基礎(chǔ)是其它許多統(tǒng)計方法的理論基礎(chǔ)正常值范圍(正常值范圍(%)單單 側(cè)側(cè)雙雙 側(cè)側(cè)800.8421.282901.2821.645951.6451.96992.3262.576標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution) 正態(tài)分布是一個分布簇,對應(yīng)于不同參數(shù)其位置和形狀均正態(tài)分布是一個分布簇,對應(yīng)于不
22、同參數(shù)其位置和形狀均不相同,為應(yīng)用方便,可進(jìn)行變量轉(zhuǎn)換:不相同,為應(yīng)用方便,可進(jìn)行變量轉(zhuǎn)換: 式中的式中的u值稱為標(biāo)準(zhǔn)正態(tài)變量,其頻數(shù)曲線圖即為標(biāo)準(zhǔn)正值稱為標(biāo)準(zhǔn)正態(tài)變量,其頻數(shù)曲線圖即為標(biāo)準(zhǔn)正態(tài)分布(態(tài)分布( u分布),一般的正態(tài)分布分布),一般的正態(tài)分布N(,2)即轉(zhuǎn)化為即轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)標(biāo)準(zhǔn)正態(tài)分布分布N(0,1)。其面積分布可直接查表。其面積分布可直接查表。Xut 分布分布(t- distribution) 一、一、t 分布的概念分布的概念 由于樣本均數(shù)由于樣本均數(shù) 服從總體均數(shù)為服從總體均數(shù)為、總體標(biāo)準(zhǔn)差、總體標(biāo)準(zhǔn)差為的正為的正態(tài)分布態(tài)分布N(,2) ,因此可同樣進(jìn)行,因此可同樣進(jìn)行u變
23、換(變換( ),將其轉(zhuǎn)換),將其轉(zhuǎn)換為為u分布分布N(0,12) 。 實際工作中,由于實際工作中,由于 未知,用未知,用 替代,則(替代,則( ) 不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t分布。分布。XXXXXSXSX1,/nnSXSXtXt 分布分布(t- distribution) 二、二、t分布的圖形與特征分布的圖形與特征 1、t 分布是一簇對稱的、均數(shù)為分布是一簇對稱的、均數(shù)為 0 的單峰分布曲線的單峰分布曲線; 2、當(dāng)自由度、當(dāng)自由度 不同時,曲線的形狀不同;不同時,曲線的形狀不同; 3、 越小,則越小,則t值越分散,值越分散, t 分布的峰部越矮而尾部翹得分布的峰
24、部越矮而尾部翹得越高;隨著越高;隨著 增大,增大,t 分布曲線越來越接近于標(biāo)準(zhǔn)正態(tài)分布曲分布曲線越來越接近于標(biāo)準(zhǔn)正態(tài)分布曲線,線,當(dāng)當(dāng) 時,時, t 分布逼近標(biāo)準(zhǔn)正態(tài)分布。分布逼近標(biāo)準(zhǔn)正態(tài)分布。 三、三、 t分布的界值分布的界值第一節(jié)第一節(jié)抽樣分布與抽樣誤差抽樣分布與抽樣誤差一、樣本均數(shù)的抽樣分布與抽樣誤差一、樣本均數(shù)的抽樣分布與抽樣誤差 抽樣誤差的概念抽樣誤差的概念由抽樣而引起的樣本均數(shù)與總體均數(shù)之間的差別。由抽樣而引起的樣本均數(shù)與總體均數(shù)之間的差別。(抽樣研究中不可避免,有兩種表現(xiàn)形式)(抽樣研究中不可避免,有兩種表現(xiàn)形式)樣本均數(shù)的抽樣分布樣本均數(shù)的抽樣分布 從一個正態(tài)的總體中進(jìn)行隨機抽
25、樣:從一個正態(tài)的總體中進(jìn)行隨機抽樣:n各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)未必等于總體均數(shù);n各樣本均數(shù)間存在差異;各樣本均數(shù)間存在差異;n樣本均數(shù)的頻數(shù)分布仍是以總體均數(shù)為中心的正態(tài)分布;樣本均數(shù)的頻數(shù)分布仍是以總體均數(shù)為中心的正態(tài)分布;n樣本均數(shù)的變異范圍較原變量的變異范圍??;樣本均數(shù)的變異范圍較原變量的變異范圍??;n隨著樣本量的增大隨著樣本量的增大 ,樣本均數(shù)的變異范圍逐漸縮小。,樣本均數(shù)的變異范圍逐漸縮小。 標(biāo)準(zhǔn)誤的意義及其計算標(biāo)準(zhǔn)誤的意義及其計算含義含義 樣本均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤。它表示樣本均數(shù)間的樣本均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤。它表示樣本均數(shù)間的 離散程度,標(biāo)準(zhǔn)誤越小,說明抽樣誤差越小
26、,表示離散程度,標(biāo)準(zhǔn)誤越小,說明抽樣誤差越小,表示 樣本均數(shù)與總體均數(shù)較接近。反之,標(biāo)準(zhǔn)誤越大,樣本均數(shù)與總體均數(shù)較接近。反之,標(biāo)準(zhǔn)誤越大, 說明抽樣誤差大,表示樣本均數(shù)距總體均數(shù)較遠(yuǎn)。說明抽樣誤差大,表示樣本均數(shù)距總體均數(shù)較遠(yuǎn)。n影響抽樣誤差的因素影響抽樣誤差的因素 樣本含量樣本含量 總體內(nèi)各個體間的離散程度即變異程度總體內(nèi)各個體間的離散程度即變異程度n 計算公式計算公式nXnsSX 以上表明:以上表明: 1 1、從正態(tài)分布、從正態(tài)分布N(N(,2 2) )的總體中隨機抽取樣本量為的總體中隨機抽取樣本量為n n的的樣本,其樣本均數(shù)因樣本而異,但服從樣本,其樣本均數(shù)因樣本而異,但服從正態(tài)分布正
27、態(tài)分布N N (,2/n)。 即樣本均數(shù)的總體均數(shù)與觀察值即樣本均數(shù)的總體均數(shù)與觀察值X X的總體均數(shù)相同,樣本的總體均數(shù)相同,樣本均數(shù)的標(biāo)準(zhǔn)差是觀察值均數(shù)的標(biāo)準(zhǔn)差是觀察值X X的標(biāo)準(zhǔn)差的的標(biāo)準(zhǔn)差的 。 2 2、在非正態(tài)分布總體中進(jìn)行類似抽樣,如樣本量較大時、在非正態(tài)分布總體中進(jìn)行類似抽樣,如樣本量較大時 (如(如n30n30),樣本均數(shù)的分布接近正態(tài)分布,標(biāo)準(zhǔn)誤仍然是),樣本均數(shù)的分布接近正態(tài)分布,標(biāo)準(zhǔn)誤仍然是X X的標(biāo)準(zhǔn)差的倍的標(biāo)準(zhǔn)差的倍 。n/ 1n/ 1 標(biāo)準(zhǔn)誤的應(yīng)用標(biāo)準(zhǔn)誤的應(yīng)用表示抽樣誤差的大小,說明樣本均數(shù)的可靠性表示抽樣誤差的大小,說明樣本均數(shù)的可靠性用以估計總體均數(shù)的可信區(qū)間用
28、以估計總體均數(shù)的可信區(qū)間應(yīng)用標(biāo)準(zhǔn)誤進(jìn)行均數(shù)的假設(shè)檢驗應(yīng)用標(biāo)準(zhǔn)誤進(jìn)行均數(shù)的假設(shè)檢驗第二節(jié)第二節(jié)總體均數(shù)的估計總體均數(shù)的估計樣本均數(shù)推論總體均數(shù)的方法樣本均數(shù)推論總體均數(shù)的方法兩種方法:點值估計與區(qū)間估計兩種方法:點值估計與區(qū)間估計一、點值估計一、點值估計1 1、含義、含義 2 2、優(yōu)缺點、優(yōu)缺點二、區(qū)間估計二、區(qū)間估計1 1、可信區(qū)間的含義、可信區(qū)間的含義2 2、可信區(qū)間的計算、可信區(qū)間的計算 樣本含量較大:樣本含量較大: 樣本含量較小樣本含量較小),(2/2/XXSuXSuX),(, 2/, 2/XXStXStX第七章第七章假設(shè)檢驗假設(shè)檢驗第一節(jié)第一節(jié) 假設(shè)檢驗的概念假設(shè)檢驗的概念 假設(shè)檢驗(
29、假設(shè)檢驗(hypothesis testing)的概念)的概念 也稱顯著性檢驗(也稱顯著性檢驗(significance test),是判斷樣本均數(shù)與),是判斷樣本均數(shù)與總體均數(shù)之間或樣本總體均數(shù)之間或樣本 均數(shù)之間的差別有無意義的一種統(tǒng)均數(shù)之間的差別有無意義的一種統(tǒng)計分析方法。計分析方法。 假設(shè)檢驗的引入假設(shè)檢驗的引入例:某年某地隨機抽樣調(diào)查了例:某年某地隨機抽樣調(diào)查了17歲男、女青年坐高,得資歲男、女青年坐高,得資料如下表,問該地料如下表,問該地17歲男、女青年坐高是否有差別?歲男、女青年坐高是否有差別?性別性別人數(shù)人數(shù)均值均值標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差男4483.13.52女7680.22.33第二節(jié)
30、第二節(jié) 假設(shè)檢驗的基本步驟假設(shè)檢驗的基本步驟 建立假設(shè)建立假設(shè) H0:無效假設(shè),零假設(shè)。是假設(shè)樣本指標(biāo)之間的差別是由單:無效假設(shè),零假設(shè)。是假設(shè)樣本指標(biāo)之間的差別是由單純抽樣的隨機性所致即抽樣誤差,而不是真正兩總體的差別。純抽樣的隨機性所致即抽樣誤差,而不是真正兩總體的差別。 H1:備擇假設(shè)。是假設(shè)樣本指標(biāo)之間的差別不是單純由于:備擇假設(shè)。是假設(shè)樣本指標(biāo)之間的差別不是單純由于抽樣誤差所致,而是兩總體均數(shù)存在本質(zhì)差別。抽樣誤差所致,而是兩總體均數(shù)存在本質(zhì)差別。 確定檢驗水準(zhǔn)確定檢驗水準(zhǔn) 即顯著性水準(zhǔn),用即顯著性水準(zhǔn),用表示。它是判斷差別有無意義的概率水表示。它是判斷差別有無意義的概率水準(zhǔn)(拒絕準(zhǔn)
31、(拒絕H1所允許犯錯誤的概率)。所允許犯錯誤的概率)。 其大小應(yīng)根據(jù)分析要求確定。通常取其大小應(yīng)根據(jù)分析要求確定。通常取=0.05=0.05或或=0.01=0.01。 檢驗水準(zhǔn)取雙側(cè)概率時記為檢驗水準(zhǔn)取雙側(cè)概率時記為 /2/2。 選定檢驗方法和計算檢驗統(tǒng)計量選定檢驗方法和計算檢驗統(tǒng)計量 根據(jù)研究設(shè)計的類型和統(tǒng)計推斷的目的要求選用不同的檢根據(jù)研究設(shè)計的類型和統(tǒng)計推斷的目的要求選用不同的檢驗方法。驗方法。 確定概率確定概率P值值 P值是指在值是指在H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或小于)現(xiàn)有統(tǒng)計量的概率。(或小于)現(xiàn)有統(tǒng)計量的概率。 當(dāng)求得統(tǒng)計
32、量后,一般可根據(jù)有關(guān)統(tǒng)計用表查得當(dāng)求得統(tǒng)計量后,一般可根據(jù)有關(guān)統(tǒng)計用表查得P值。值。 在在=0.05的檢驗水準(zhǔn)上:的檢驗水準(zhǔn)上: t0.05,差別無統(tǒng)計學(xué)意義(差別無顯著性),差別無統(tǒng)計學(xué)意義(差別無顯著性) t t0.05()時,則時,則P 0 .05,差別有統(tǒng)計學(xué)意義(差別有顯著,差別有統(tǒng)計學(xué)意義(差別有顯著性)性) 作出推斷結(jié)論作出推斷結(jié)論 若若P0.05,則接受,則接受H0 ,拒絕,拒絕H1 ,認(rèn)為兩樣本指標(biāo)所代,認(rèn)為兩樣本指標(biāo)所代表的兩總體指標(biāo)間的差別無統(tǒng)計學(xué)意義,是由抽樣誤差所表的兩總體指標(biāo)間的差別無統(tǒng)計學(xué)意義,是由抽樣誤差所引起。引起。 若若P 0 .05,則接受,則接受H1 ,
33、拒絕,拒絕H0 ,認(rèn)為兩樣本指標(biāo)所,認(rèn)為兩樣本指標(biāo)所代表的兩總體指標(biāo)間的差別有統(tǒng)計學(xué)意義,不可能由抽樣代表的兩總體指標(biāo)間的差別有統(tǒng)計學(xué)意義,不可能由抽樣誤差所造成。誤差所造成。 假設(shè)檢驗的基本思想:假設(shè)檢驗的基本思想: 1 1、反證法的思想:、反證法的思想: 事先對總體分布(通常是該分布的某個參數(shù))事先對總體分布(通常是該分布的某個參數(shù))作出某種假設(shè),如果樣本信息不支持該假設(shè),則認(rèn)作出某種假設(shè),如果樣本信息不支持該假設(shè),則認(rèn)為原假設(shè)不成立。為原假設(shè)不成立。 2 2、根據(jù)、根據(jù)“小概率事件小概率事件”原理原理 即小概率事件在一次試驗中一般不會發(fā)生,用即小概率事件在一次試驗中一般不會發(fā)生,用概率的
34、思想決定是否拒絕原假設(shè)。概率的思想決定是否拒絕原假設(shè)。第三節(jié)第三節(jié) u (z)檢驗檢驗 一、大樣本均數(shù)比較的一、大樣本均數(shù)比較的u u 檢驗檢驗 兩個基本條件:兩個基本條件:樣本數(shù)據(jù)服從正態(tài)分布樣本數(shù)據(jù)服從正態(tài)分布已知總體方差已知總體方差(但如(但如n60,可用樣本樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差,可用樣本樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計值的估計值主要適用于總體方差未知的大樣本數(shù)據(jù))主要適用于總體方差未知的大樣本數(shù)據(jù)) 1、樣本均數(shù)與總體均數(shù)比較的、樣本均數(shù)與總體均數(shù)比較的u u 檢驗檢驗 舉例:舉例:P106 例例7-17-1:根據(jù):根據(jù)19831983年大量調(diào)查結(jié)果,已知某地成年大量調(diào)查結(jié)果,已知某
35、地成年男子的脈搏均數(shù)為年男子的脈搏均數(shù)為7272次次/ /分鐘。某醫(yī)生于分鐘。某醫(yī)生于20032003年在年在該地隨機調(diào)查了該地隨機調(diào)查了7575名成年男子,求得其脈搏均數(shù)為名成年男子,求得其脈搏均數(shù)為74.274.2次次/ /分鐘,標(biāo)準(zhǔn)差為分鐘,標(biāo)準(zhǔn)差為6.56.5次次/ /分鐘,能否據(jù)此認(rèn)為分鐘,能否據(jù)此認(rèn)為該地成年男子的脈搏數(shù)不同于該地成年男子的脈搏數(shù)不同于19831983年?年?H H0 0: :0 0,即該地成年男子的平均脈搏沒有變化,即該地成年男子的平均脈搏沒有變化H H1 1: :0 0,即該地成年男子的平均脈搏與即該地成年男子的平均脈搏與19831983年不同年不同0.05檢驗
36、界值檢驗界值u0.05/2=1.96, u0.01/2=2.58,uu0.01/2,得,得P0.01。按按0.05的檢驗水準(zhǔn),拒絕的檢驗水準(zhǔn),拒絕H H0 0,接受接受H H1 1,差別有統(tǒng)計學(xué)意,差別有統(tǒng)計學(xué)意義,可認(rèn)為該地成年男子的脈搏與義,可認(rèn)為該地成年男子的脈搏與19831983年不同。年不同。93. 275/5 . 6722 .74/00nXXuX 2、兩樣本均數(shù)比較的、兩樣本均數(shù)比較的u u 檢驗檢驗 舉例:舉例:P107 例例7-27-2:為研究孕婦補鋅對胎兒生長發(fā)育的影響,:為研究孕婦補鋅對胎兒生長發(fā)育的影響,將將9696名孕婦隨機分為試驗組和對照組,一組在孕期不名孕婦隨機分為
37、試驗組和對照組,一組在孕期不同時間按要求補鋅,另一組為對照組,觀察兩組孕婦同時間按要求補鋅,另一組為對照組,觀察兩組孕婦新生兒出生體重有無不同,兩組的例數(shù)、均數(shù)、標(biāo)準(zhǔn)新生兒出生體重有無不同,兩組的例數(shù)、均數(shù)、標(biāo)準(zhǔn)差分別為:差分別為: 補鋅組:補鋅組:n n1 1=48=48, =3427.8g =3427.8g,S S1 1=448.1g;=448.1g; 對照組:對照組:n n2 2=48=48, =3361.9g =3361.9g,S S2 2=400.1g;=400.1g; 問補鋅對新生兒出生體重有無影響?問補鋅對新生兒出生體重有無影響?1X2XH H0 0: :1 1 2 2,即兩組總
38、體均數(shù)相等,補鋅無影響,即兩組總體均數(shù)相等,補鋅無影響H H1 1: :1 1 2 2,即即兩組總體均數(shù)不相等,補鋅有影響兩組總體均數(shù)不相等,補鋅有影響0.05經(jīng)計算:經(jīng)計算:u=(3427.8-3361.9)/86.71=0.76檢驗界值檢驗界值u0.05/2=1.96, u u0.05/2,得,得P0.05。按按0.05的檢驗水準(zhǔn),接受的檢驗水準(zhǔn),接受H H0 0,拒絕拒絕H H1 1,差別無統(tǒng)計學(xué)意義,差別無統(tǒng)計學(xué)意義,尚不能推斷補鋅對新生兒出生體重有影響。尚不能推斷補鋅對新生兒出生體重有影響。2222)()(2121212121XXXXXXXXSSXXu第四節(jié)第四節(jié) 假設(shè)檢驗的兩類錯誤
39、假設(shè)檢驗的兩類錯誤類錯誤(類錯誤(type error) 原假設(shè)為真而被拒絕的錯誤稱為第一類錯誤,也稱假陽性原假設(shè)為真而被拒絕的錯誤稱為第一類錯誤,也稱假陽性錯誤或棄真錯誤。記作錯誤或棄真錯誤。記作,即檢驗水準(zhǔn)。它是在研究設(shè)計時規(guī),即檢驗水準(zhǔn)。它是在研究設(shè)計時規(guī)定的允許犯定的允許犯類錯誤概率的最大值。類錯誤概率的最大值。類錯誤(類錯誤(type error) 原假設(shè)原假設(shè)H0不真而被接受的錯誤稱為第二類錯誤,也稱假陰性不真而被接受的錯誤稱為第二類錯誤,也稱假陰性錯誤或存?zhèn)五e誤。記為錯誤或存?zhèn)五e誤。記為。 (由于不知道(由于不知道的確切概率,結(jié)論中不說的確切概率,結(jié)論中不說“沒有差別沒有差別”或
40、或“兩總體均數(shù)相兩總體均數(shù)相等等”,只說,只說“未見有差別未見有差別”或或“尚不能認(rèn)為兩總體均數(shù)不相同尚不能認(rèn)為兩總體均數(shù)不相同”。如果。如果P ,可以明確地下可以明確地下“有差別有差別” 或或“兩總體均數(shù)不相同兩總體均數(shù)不相同”的結(jié)論。)的結(jié)論。)假設(shè)檢驗結(jié)論假設(shè)檢驗結(jié)論拒絕拒絕H0不拒絕不拒絕H0H0為真為真類錯誤(類錯誤( )推斷正確(推斷正確(1- )H0不真不真推斷正確(推斷正確(1- )類錯誤(類錯誤( ) 第八章第八章 t 檢驗檢驗第一節(jié)第一節(jié) 單樣本均數(shù)比較的單樣本均數(shù)比較的t 檢驗檢驗 應(yīng)用條件應(yīng)用條件 樣本數(shù)據(jù)服從正態(tài)分布樣本數(shù)據(jù)服從正態(tài)分布適用范圍適用范圍 樣本均數(shù)與某已
41、知總體均數(shù)的比較樣本均數(shù)與某已知總體均數(shù)的比較檢驗?zāi)康臋z驗?zāi)康?檢驗樣本均數(shù)所代表的未知總體均數(shù)是否與已知的檢驗樣本均數(shù)所代表的未知總體均數(shù)是否與已知的總體均數(shù)有差別。(已知的總體均數(shù)一般指理論值、總體均數(shù)有差別。(已知的總體均數(shù)一般指理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值)標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值)當(dāng)樣本含量較大時,可采用當(dāng)樣本含量較大時,可采用u u檢驗檢驗 例例8-1: 8-1: 通過以往大量資料得知某地通過以往大量資料得知某地2020歲男子平均身高歲男子平均身高168cm168cm, 今隨機測量當(dāng)?shù)亟耠S機測量當(dāng)?shù)?616名名2020歲男子歲男子, ,得其平均身高為得其平均身高
42、為172cm172cm,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為14cm14cm。問當(dāng)?shù)噩F(xiàn)在。問當(dāng)?shù)噩F(xiàn)在2020歲男子的平均身高是否比以往高?歲男子的平均身高是否比以往高?H H0 0: :0 0H H1 1: :0 00.05(單側(cè))(單側(cè))檢驗界值檢驗界值t0.05,15=1.753,得,得P0.05。按按0.05的檢驗水準(zhǔn),不拒絕的檢驗水準(zhǔn),不拒絕H H0 0,差別無統(tǒng)計學(xué)意義,可差別無統(tǒng)計學(xué)意義,可還不能認(rèn)為該地還不能認(rèn)為該地2020歲男子的平均身高比以往要高。歲男子的平均身高比以往要高。143. 116/14168172/0nSXnSXSXtX第二節(jié)第二節(jié) 配對樣本均數(shù)的配對樣本均數(shù)的t t檢驗檢驗 應(yīng)用
43、條件應(yīng)用條件 差值差值d d變量服從正態(tài)分布。變量服從正態(tài)分布。適用范圍適用范圍 適用于配對設(shè)計的計量資料均數(shù)的比較。適用于配對設(shè)計的計量資料均數(shù)的比較。 有兩種情況:同源配對:同一受試對象分別接受兩種有兩種情況:同源配對:同一受試對象分別接受兩種不同處理;異源配對:將實驗對象按某些重要特征如性不同處理;異源配對:將實驗對象按某些重要特征如性別、年齡等相近的原則配對,并分別實施兩種處理。別、年齡等相近的原則配對,并分別實施兩種處理。檢驗?zāi)康臋z驗?zāi)康?檢驗兩相關(guān)樣本均數(shù)所代表的未知總體均數(shù)是否有差別。檢驗兩相關(guān)樣本均數(shù)所代表的未知總體均數(shù)是否有差別。 例例8-2: 8-2: 某醫(yī)院用某醫(yī)院用A
44、A、B B兩種血紅蛋白測定儀器檢測了兩種血紅蛋白測定儀器檢測了1616名健康名健康男青年的血紅蛋白含量(男青年的血紅蛋白含量(g/Lg/L), ,檢測結(jié)果見表檢測結(jié)果見表8-18-1第第(1)-(3)(1)-(3)欄。欄。問兩種血紅蛋白測定儀器的檢測結(jié)果是否有差別。問兩種血紅蛋白測定儀器的檢測結(jié)果是否有差別。H H0 0: :d d0 0 H H1 1: :d d 0 0 0.05檢驗界值檢驗界值t0.05/2,15=2.131,得,得P0.05。按按0.05的檢驗水準(zhǔn),拒絕的檢驗水準(zhǔn),拒絕H H0 0,接受,接受H H1 1 ,差別有統(tǒng)計學(xué)意差別有統(tǒng)計學(xué)意義,可認(rèn)為兩種測定儀器效果不同。義,
45、可認(rèn)為兩種測定儀器效果不同。366. 216/735.13125. 8/0nSdnSdSXtddXd735.1311616)130(886. 31)(222nnddSd第三節(jié)第三節(jié) 兩獨立樣本均數(shù)的兩獨立樣本均數(shù)的t t檢驗(成組檢驗(成組t t檢驗)檢驗) 應(yīng)用條件應(yīng)用條件 兩組數(shù)據(jù)均服從正態(tài)分布,且兩樣本的總體方差齊性。兩組數(shù)據(jù)均服從正態(tài)分布,且兩樣本的總體方差齊性。適用范圍適用范圍 完全隨機設(shè)計兩獨立樣本均數(shù)的比較。完全隨機設(shè)計兩獨立樣本均數(shù)的比較。檢驗?zāi)康臋z驗?zāi)康?檢驗兩獨立樣本均數(shù)所代表的未知總體均數(shù)是否有差別。檢驗兩獨立樣本均數(shù)所代表的未知總體均數(shù)是否有差別。 例例8-4: 8-4: 為了解內(nèi)毒素對肌酐的影響,將為了解內(nèi)毒素對肌酐的影響,將2020只雌性中年大鼠隨只雌性中年大鼠隨機分為甲組和乙組。甲組中的每只大鼠不給予內(nèi)毒素,乙組中的機分為甲組和乙組。甲組中的每只大鼠不給予內(nèi)毒素,乙組中的每只大鼠則給予每只大鼠則給予3mg/kg3mg/kg的內(nèi)毒素。分別測得兩組大鼠的肌酐見表的內(nèi)毒素。分別測得兩組大鼠的肌酐見表8-38-3。問:內(nèi)毒素是否對肌酐有影響?。問:內(nèi)毒素是否對肌酐有影響?表表8-3 8-3 兩組大鼠的肌酐(兩組大鼠的肌酐(mg/Lmg/L)結(jié)果)結(jié)果甲組甲組乙組乙組甲組甲組乙組乙組6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- TY/T 2103-2024綠色體育場館運營評價
- NB/T 11548-2024立井井筒鉆注平行作業(yè)技術(shù)規(guī)范
- 乒乓球課題申報書
- 名師支部建設(shè)課題申報書
- 振興鄉(xiāng)村教育課題申報書
- 教學(xué)課題立項申報書模板
- 思政教研課題申報書模板
- 家庭研究專題課題申報書
- 課題項目申報書模版
- 個人購平房合同范本
- 2025年蘇州健雄職業(yè)技術(shù)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 光伏電站設(shè)備故障預(yù)防措施
- 2025天津高考英語作文題目及范文
- 2023年網(wǎng)絡(luò)規(guī)劃設(shè)計師(軟考)通關(guān)必做300題及詳解
- 2025年八省聯(lián)考高考語文試題真題解讀及答案詳解課件
- 建筑施工安全教育培訓(xùn)制度(4篇)
- 關(guān)于造瘺口的術(shù)后護(hù)理
- 人工肩關(guān)節(jié)置換術(shù)護(hù)理
- 《電力系統(tǒng)綜合實踐》課程教學(xué)大綱
- 施工安全生產(chǎn)風(fēng)險分級管控和隱患排查治理雙重預(yù)防機制建設(shè)實施方案
- 酒店安全緊急疏散預(yù)案
評論
0/150
提交評論