




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章,定量數(shù)據(jù)的統(tǒng)計(jì)描述,第一節(jié),頻率和頻率分布,頻率分布表,又稱頻率表,是統(tǒng)計(jì)描述大樣本數(shù)據(jù)的常用方法。頻率表可以顯示數(shù)據(jù)分布的范圍和形式。在某一地點(diǎn)隨機(jī)抽樣檢查了140名成年男子的紅細(xì)胞計(jì)數(shù)。1.連續(xù)定量變量的頻率分布,頻率表的編制:求范圍:rmax-min=5.95-3.82=2.13,確定組數(shù),組與組之間的距離1。確定組數(shù)(k):通常為11 2。確定組距離(I):兩個(gè)相鄰組的最小值(下限)之間的差值,通常等距。I=R /k,通常是一個(gè)偶數(shù)。3.確定分組界限:界限清楚,每個(gè)分組的起點(diǎn)稱為下限,終點(diǎn)稱為上限。最后一行應(yīng)該寫(xiě)下下限和上限。4.列表標(biāo)記:獲取每組觀察單元的數(shù)量。在某處140名
2、正常男性中使用紅細(xì)胞數(shù)頻率表、直方圖和頻率表可以代替繁瑣的原始數(shù)據(jù),便于進(jìn)一步分析;便于觀察數(shù)據(jù)的分布類型;方便在遠(yuǎn)離群體的地方發(fā)現(xiàn)一些超大或超小的可疑值;當(dāng)樣本量較大時(shí),每個(gè)片段的頻率可以作為概率的估計(jì)值。頻率分布的類型是對(duì)稱的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的。表2-1 1998年某地區(qū)96名婦女產(chǎn)前檢查頻率分布(頻率)累計(jì)數(shù)累計(jì)頻率0 44.24 4.21 7.3 11.5 2 11 11.5 22 22.9 3 13 13.5 3
3、5 36.5 426 27.1 61 63.5 523 24.0 84 87.5 12 12.5 96 100.0合計(jì)96 100、第2節(jié)集中趨勢(shì)指標(biāo)常用的平均值有算術(shù)平均值、幾何平均值和中位數(shù)。1,算術(shù)平均值(mean),算術(shù)平均值是指平均值或平均值。x代表變量x的樣本平均值,(希臘字母)代表總平均值。均值適用于對(duì)稱分布數(shù)據(jù)、正態(tài)分布數(shù)據(jù)或近似正態(tài)分布數(shù)據(jù)。計(jì)算方法直接法這種方法可以在樣品含量很小時(shí)使用。有n個(gè)觀測(cè)值,分別是X1、X2和Xn。平均值的計(jì)算公式是:例1。12歲男孩的身高(厘米)分別為125.5、126.0、127.0、128.5、147.0、131.0、132.0、141.5.
4、122.5、140.0。求平均值。加權(quán)法:當(dāng)樣本含量n較大時(shí),一般將觀測(cè)值分組,列出頻率表,然后用加權(quán)法計(jì)算平均值。公式為:其中f為各組的頻率,x為各組的組中值。1.編制頻率表(1)計(jì)算總距離:R183.5162.920.6(cm) (2)計(jì)算群段和群距離:20.6 102.06,取整數(shù)2.0cm作為群距離;第一組的下限是162 (3)。列出頻率表:表7-1的第三列是組中值X,計(jì)算方法是將該組的下限和下一組的下限相加,除以2,如第一組X1=(162 164)/2=163,等等。第四列fX是頻率f與組中值x的乘積。根據(jù)公式,110名20歲健康男大學(xué)生的平均身高為172.73厘米。第二,幾何平均數(shù)
5、(g),用g表示.適用于對(duì)數(shù)正態(tài)分布數(shù)據(jù)或等比數(shù)據(jù),如抗體的平均滴度和平均滴度。計(jì)算方法:直接法:當(dāng)樣本含量n較小時(shí),選擇該方法。有n個(gè)觀測(cè)值X1,X2,Xn,幾何平均值的計(jì)算公式為:以上公式需要連續(xù)相乘,需要開(kāi)n次方,比較麻煩,所以一般以對(duì)數(shù)形式計(jì)算。6份血清樣本的抗體滴度分別為:1:2、1:4、1:8、1:8、1:16、13:32。幾何平均滴度為1:8,血清抗體平均滴度為0計(jì)算方法直接法:當(dāng)樣本含量n較小時(shí),可按以下公式計(jì)算:當(dāng)n為奇數(shù)或偶數(shù)時(shí),某一疾病5例患者的潛伏期分別為2、4、6、7和20,并得出中位數(shù)。在這種情況下,n=5是奇數(shù)天。如果在前一個(gè)病例中在第25天發(fā)現(xiàn)另一個(gè)患者,患者人
6、數(shù)將增加到6人。頻率表法:當(dāng)樣本含量n較大時(shí),可以計(jì)算出中位數(shù)。將觀測(cè)數(shù)據(jù)匯總到頻率表中,計(jì)算累計(jì)頻率,并根據(jù)以下公式計(jì)算。l是這個(gè)組(中間組)的下限,I是組距離,F(xiàn)是這個(gè)組的頻率,f1是最后一個(gè)組的累積頻率。這個(gè)組的位置可以根據(jù)累計(jì)頻率值來(lái)判斷。當(dāng)某一組的累計(jì)頻率首次超過(guò)n/2或累計(jì)頻率首次超過(guò)50%時(shí),定義為該組。107名正常人尿鉛含量分布,以百分位數(shù)(PX)表示,PX是一個(gè)位置指數(shù),用PX表示??偟膩?lái)說(shuō),這意味著在整個(gè)人口中其值小于PX的個(gè)體只有x;對(duì)于樣本,這意味著在按升序排列的序列中,小于PX的個(gè)體只占據(jù)x百分位,這是有序序列的除數(shù)值。第50百分位(P50)是中間值,中間值是特定的百
7、分位。計(jì)算公式:對(duì)上例數(shù)據(jù)計(jì)算P25和P75。如果計(jì)算P25,從第4列可以看出,組2的累積頻率超過(guò)25,這是P25所在的組。找到P75,同樣,P75在第四組,而在第三組,離散趨勢(shì)指標(biāo),兩組的測(cè)量數(shù)據(jù)如下,并分析其分布特征。甲組:98,99,100,101,102乙組:80,90,100,110,120。兩組的平均數(shù)據(jù)為100,表明濃度趨勢(shì)是相同的。然而,兩組數(shù)據(jù)的分布特征不同,五組數(shù)據(jù)之間的不均勻程度也不同。A組數(shù)據(jù)的變異范圍較小,而B(niǎo)組數(shù)據(jù)的變異范圍較大,即兩組數(shù)據(jù)的離散度不同,離散度是一個(gè)非常重要的統(tǒng)計(jì)指標(biāo)。1.范圍(R),也稱為極端范圍,是一組觀測(cè)值中最大值和最小值之間的差值,反映了個(gè)體
8、差異的范圍。總距離大表示可變性大;相反,變化很小。在上例中,A組的總距離為4,B組的總距離為40,表明B組的變化程度較大。然而,總距離不能反映該組中除最大值和最小值之外的其他數(shù)據(jù)的可變性;它易受單個(gè)數(shù)據(jù)的影響,穩(wěn)定性差,采樣誤差大,還受N的大小影響。平均來(lái)說(shuō),N越大,總距離越大。四分位數(shù)范圍(Q)是兩個(gè)特定百分位數(shù)之間的差值,適用于測(cè)量任何分布的數(shù)據(jù),尤其是偏斜分布的數(shù)據(jù)(離差不應(yīng)用標(biāo)準(zhǔn)差表示)。四分位數(shù)范圍比整個(gè)范圍更穩(wěn)定,但仍未考慮每個(gè)觀測(cè)值的變化。方差和標(biāo)準(zhǔn)差,為了克服全距離的缺點(diǎn),應(yīng)充分考慮組內(nèi)各觀測(cè)值的離散性??梢哉J(rèn)為,總體中每個(gè)變量值X與總體平均值之間的差異稱為偏離平均值X。由于平
9、均值有正負(fù)偏差,且其和為0,因此仍不能反映變異程度。因此,與平均值的偏差被平方,然后相加,這被稱為與平均值平方和的偏差。為了消除觀測(cè)值總數(shù)n的影響,與平均平方和的偏差除以n,即總體方差,用2表示。方差單位是原始測(cè)量單位(如kg)的平方,總體方差是平方,即總體標(biāo)準(zhǔn)差。測(cè)量單位與原始觀測(cè)值一致,即方差和標(biāo)準(zhǔn)差。在實(shí)際工作中,經(jīng)常會(huì)得到樣本數(shù)據(jù),而總體均值是未知的,因此只能使用樣本均值X來(lái)代替。這樣,使用樣本含量n而不是n,結(jié)果比率更小。英國(guó)統(tǒng)計(jì)學(xué)家W.S .戈塞特提出用n-1代替N,樣本的標(biāo)準(zhǔn)差更接近于總體標(biāo)準(zhǔn)差。年代給定f110和fX19000,有必要將fx2列添加到表中,將其乘以列(3)和(4
10、),將該列中的數(shù)據(jù)相加,并將fX23283646代入公式。4.變異系數(shù)。應(yīng)用: (1)比較具有不同測(cè)量單位的多組數(shù)據(jù)的可變性(2)計(jì)算平均值差異較大的多組數(shù)據(jù)的可變性:例如,某個(gè)地方的100名20歲男性,其平均身高為166.06厘米,標(biāo)準(zhǔn)偏差為4.95厘米,其平均體重為53.72千克,標(biāo)準(zhǔn)偏差為4.96千克。請(qǐng)比較哪一個(gè)具有更大的可變性。由于它們的測(cè)量單位不同,標(biāo)準(zhǔn)偏差不能直接比較,但變異系數(shù)應(yīng)該比較。身高、體重、使用離散指標(biāo)的注意事項(xiàng):1離散指標(biāo)代表變量值的變化,常與集中指標(biāo)(如均值)相結(jié)合。雖然離散指標(biāo)的種類很多,但一般來(lái)說(shuō),它們的大值意味著大的變化和分散的值;小的值意味著變化小并且值集中
11、。為了比較兩個(gè)或幾個(gè)相似事物的變異,我們應(yīng)該使用相同的變異指數(shù)。3正態(tài)分布數(shù)據(jù)應(yīng)以平均值和標(biāo)準(zhǔn)偏差(有時(shí)是方差)為特征,并記錄為XS。有時(shí),為了便于計(jì)算,正態(tài)分布數(shù)據(jù)也可以用中位數(shù)、百分位數(shù)和四分位數(shù)來(lái)描述,其結(jié)果與均值和標(biāo)準(zhǔn)差相似。使用離散指標(biāo)時(shí)的注意事項(xiàng):4 .偏斜分布數(shù)據(jù)應(yīng)該用幾何平均值、中位數(shù)和四分位間距來(lái)描述。特別是當(dāng)數(shù)據(jù)分布明顯偏斜時(shí),隨著病例數(shù)的增加,中位數(shù)和四分位數(shù)間距的代表性和穩(wěn)定性明顯優(yōu)于均值、標(biāo)準(zhǔn)差和方差。5.比較幾組數(shù)據(jù)的變異程度,如果每組數(shù)據(jù)的單位不完全相同,或者平均值相差很大,則使用變異系數(shù)。6要判斷幾個(gè)方差或變異系數(shù)之間是否存在顯著差異,需要進(jìn)行假設(shè)檢驗(yàn),而不僅僅是表面值。方框圖,一般選擇五個(gè)描述性統(tǒng)計(jì)(最小值,P25,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高端制造車間租賃及技術(shù)研發(fā)合同
- 老妖消防課件
- 美術(shù)說(shuō)課課件詳細(xì)
- 美術(shù)大師課件介紹
- 關(guān)于生產(chǎn)安全事故應(yīng)急預(yù)案的說(shuō)法正確的有
- 涉爆粉塵企業(yè)安全檢查表
- 工程項(xiàng)目管理論文安全
- 企業(yè)安全生產(chǎn)的八大主體責(zé)任
- 安全生產(chǎn)百日攻堅(jiān)戰(zhàn)
- 小店運(yùn)營(yíng)教程培訓(xùn)課件
- 反流食管炎臨床路徑(2009年版)
- 鄉(xiāng)土文學(xué)與地域文化
- 上海電氣SEC-W02-1250風(fēng)機(jī)運(yùn)行規(guī)程
- 對(duì)外漢語(yǔ)教學(xué)導(dǎo)論復(fù)習(xí)
- 工程材料智慧樹(shù)知到課后章節(jié)答案2023年下蘭州石化職業(yè)技術(shù)大學(xué)
- 裝修工程合理化建議
- 星期一逃跑了 朗誦
- 《大學(xué)生軍事理論教程》第五章
- 數(shù)據(jù)安全風(fēng)險(xiǎn)評(píng)估
- 蟲(chóng)子入耳怎么辦?(課件)-小學(xué)生主題班會(huì)通用版
- 拳擊入門(mén)-北京理工大學(xué)中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
評(píng)論
0/150
提交評(píng)論