統(tǒng)計(jì)學(xué)第三章平均數(shù)與標(biāo)準(zhǔn)差_第1頁(yè)
統(tǒng)計(jì)學(xué)第三章平均數(shù)與標(biāo)準(zhǔn)差_第2頁(yè)
統(tǒng)計(jì)學(xué)第三章平均數(shù)與標(biāo)準(zhǔn)差_第3頁(yè)
統(tǒng)計(jì)學(xué)第三章平均數(shù)與標(biāo)準(zhǔn)差_第4頁(yè)
統(tǒng)計(jì)學(xué)第三章平均數(shù)與標(biāo)準(zhǔn)差_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)第三章平均數(shù)與標(biāo)準(zhǔn)差第1頁(yè),共25頁(yè),2023年,2月20日,星期六第一節(jié)算術(shù)均數(shù)和幾何均數(shù)數(shù)值變量資料的統(tǒng)計(jì)描述:集中趨勢(shì)centraltendency和離散趨勢(shì)tendencyofdispersion平均數(shù)average:說(shuō)明一組觀察值(變量值)的集中趨勢(shì)、中心位置或平均水平。(ameasureoflocation,ameasureofcentraltendency,ameanoranaverage)平均數(shù)種類(lèi):算術(shù)均數(shù)arithmeticmean、幾何均數(shù)geometricmean、中位數(shù)median、眾數(shù)mode、調(diào)和均數(shù)harmonicmean,H第2頁(yè),共25頁(yè),2023年,2月20日,星期六一、算術(shù)均數(shù),簡(jiǎn)稱(chēng)均數(shù)mean。統(tǒng)計(jì)表示:總體的參數(shù)用希臘字母表示,樣本的統(tǒng)計(jì)量用拉丁字母表示用μ表示總體均數(shù),用表示樣本均數(shù)(一)不分組資料均數(shù)的計(jì)算法:直接計(jì)算為避免過(guò)于復(fù)雜,在求和的范圍可看清時(shí)對(duì)sigma不記上下標(biāo)(dummysuffix),對(duì)x也不加下標(biāo)Themeanisthesumoftheobservationsdividedbythenumberofobservations.第3頁(yè),共25頁(yè),2023年,2月20日,星期六(二)分組資料的均數(shù)計(jì)算法:頻數(shù)表法P20例3-2,步驟:1、分組和編制頻數(shù)分布表frequencydistributiontable1)找出觀察值中最大值、最小值和極差range2)按極差大小決定組段數(shù)、組段和組距classinterval:8~15組,常用極差的1/10取整作組距,組段下限和上限lowlimitandupperlimit應(yīng)界限分明,無(wú)交叉,從下限開(kāi)始不包括上限,第一組段包括最小,最后組段包括最大觀察值3)列表劃記tallying:見(jiàn)P20表3-2。頻數(shù)表可繪成直方圖histogram第4頁(yè),共25頁(yè),2023年,2月20日,星期六2、加權(quán)法weightingmethodx為組中值classmid-value(midpoint)=本組下限與相鄰較大組段的下限相加除以2k為組數(shù)f為各組的頻數(shù),又稱(chēng)權(quán)數(shù)weight∑f各組頻數(shù)之總和∑fx為各組組中值與頻數(shù)乘積之和計(jì)算實(shí)例見(jiàn)P21第5頁(yè),共25頁(yè),2023年,2月20日,星期六3、簡(jiǎn)捷法short-cutmethod1)在頻數(shù)表的基礎(chǔ)上,以與最大頻數(shù)相對(duì)應(yīng)的組中值為假定均數(shù)x0,assumedorigin2)列出簡(jiǎn)捷法計(jì)算均數(shù)用表,d為各組組中值減去假定均數(shù)后除以組距i,假定均數(shù)對(duì)應(yīng)d為0,向上依次為-1,-2,…向下依次為1,2,…3)將各行f值與d值相乘得df,再求∑df4)求均數(shù)*:可以任何一組組中值為假定均數(shù),結(jié)果一致,但設(shè)在頻數(shù)最大組或其附近時(shí),計(jì)算較簡(jiǎn)便。計(jì)算機(jī)更方便第6頁(yè),共25頁(yè),2023年,2月20日,星期六二、幾何均數(shù)geometricmean,簡(jiǎn)記為G1)資料偏態(tài)分布,少數(shù)數(shù)據(jù)過(guò)分偏大,(各觀察值間呈等比關(guān)系),原始數(shù)據(jù)進(jìn)行對(duì)數(shù)變換后為對(duì)稱(chēng)分布,如平均潛伏期、平均抗體滴度等資料2)公式P22例3-3,計(jì)算抗體滴度的幾何均數(shù);該方法計(jì)算出的G通常偏小,可在計(jì)算反對(duì)數(shù)前+(lgd)/2第7頁(yè),共25頁(yè),2023年,2月20日,星期六3)幾何均數(shù)的應(yīng)用幾何均數(shù)常用于等比資料觀察值不能有0觀察值不能同時(shí)有正值和負(fù)值,若全為負(fù)先把負(fù)號(hào)除掉,最后結(jié)果前加負(fù)號(hào)第8頁(yè),共25頁(yè),2023年,2月20日,星期六第二節(jié)中位數(shù)和百分位數(shù)一、median用M表示:把變量值按大小順序排列,居于中間位置的那個(gè)數(shù)值就是M適用于:偏態(tài)或分布不明的資料對(duì)稱(chēng)分布時(shí)接近均數(shù),偏態(tài)分布時(shí)更合理(一)未分組資料:P23例3-4,例3-5第9頁(yè),共25頁(yè),2023年,2月20日,星期六(二)分組資料:按頻數(shù)表計(jì)算M公式:L中位數(shù)所在組的下限W中位數(shù)所在組的寬度f(wàn)中位數(shù)所在組的頻數(shù)(例數(shù))n總頻數(shù)C中位數(shù)所在組的前一組的累計(jì)頻數(shù)cumulativefrequency第10頁(yè),共25頁(yè),2023年,2月20日,星期六用累計(jì)頻數(shù)〔百分?jǐn)?shù)〕法尋找中位數(shù)所在的組段:累計(jì)頻數(shù)剛大于n/2的組段用內(nèi)插法linearinterpolation求中位數(shù)將W等分為f份,從C至n/2的數(shù)值長(zhǎng)為(W/f)*(n/2–C)L值累計(jì)頻數(shù)Cn/2第11頁(yè),共25頁(yè),2023年,2月20日,星期六二、百分位數(shù)percentile:指將n個(gè)觀察值從小到大依次排列,再把它分成100等份,對(duì)應(yīng)于r%位的數(shù)值即為第r百分位數(shù)。通常用Pr表示。中位數(shù)即第50百分位數(shù)(一)不分組資料的計(jì)算方法Pr=xr%(n+1)

當(dāng)n為150時(shí)計(jì)算第5百分位數(shù)5%(150+1)=7.55個(gè)變量值,如第7個(gè)變量為15,第8個(gè)變量為17,用內(nèi)插法求x7.55=15+0.55(17-15)=16.1,P5為16.1第12頁(yè),共25頁(yè),2023年,2月20日,星期六(二)分組資料的計(jì)算方法percentileisestimatedbylinearinterpolationas(三)要計(jì)算多個(gè)百分位數(shù)時(shí)亦用圖解法:yaxisiscumulativerelativefrequency,xaxisisobservation(incubationperiod).seeFigure3-2,P25第13頁(yè),共25頁(yè),2023年,2月20日,星期六中位數(shù)和百分位數(shù)的應(yīng)用1)中位數(shù)常用于描述偏態(tài)分布資料的集中位置,反映位次居中的觀察值的水平,只受居中變量值波動(dòng)的影響,對(duì)稱(chēng)分布時(shí)與均數(shù)相同2)百分位數(shù)用于描述觀察值在某百分位位置時(shí)的水平,多個(gè)百分位數(shù)結(jié)合應(yīng)用可更全面描述分布特征3)百分位數(shù)常用于確定醫(yī)學(xué)參考值范圍(referenceranges,正常值范圍)4)分布中部的百分位數(shù)相當(dāng)穩(wěn)定,具有較好的代表性,但靠近兩端的百分位數(shù)只有在樣本數(shù)足夠大時(shí)才較穩(wěn)定。第14頁(yè),共25頁(yè),2023年,2月20日,星期六第三節(jié)標(biāo)準(zhǔn)差

standarddeviation一、標(biāo)準(zhǔn)差的意義:SD是表示一套變量值離散程度的指標(biāo),均數(shù)與標(biāo)準(zhǔn)差結(jié)合,能全面反映一套變量值的分布情況。SDisameasureofvariation,scatter,spreadordispersion.離散程度離均差x-x考慮正負(fù)值變?yōu)殡x均差的平方考慮觀察值的個(gè)數(shù)則除以n,為方差variance,考慮到V是觀察單位的平方,故開(kāi)方得SD第15頁(yè),共25頁(yè),2023年,2月20日,星期六第16頁(yè),共25頁(yè),2023年,2月20日,星期六由公式可見(jiàn),當(dāng)各變量值愈接近均數(shù)時(shí),標(biāo)準(zhǔn)差越小,當(dāng)各觀察值遠(yuǎn)離均數(shù)時(shí),標(biāo)準(zhǔn)差越大,所以標(biāo)準(zhǔn)差能說(shuō)明變量值的離散程度。二、不分組資料的標(biāo)準(zhǔn)差的計(jì)算用代數(shù)的方法將上述公式簡(jiǎn)化為P27表3-8計(jì)算實(shí)例第17頁(yè),共25頁(yè),2023年,2月20日,星期六三、離均差平方和的簡(jiǎn)化計(jì)算離均差平方和sumofsquaresaboutthemean簡(jiǎn)記為lxx,即離均差平方和或離均差積和sumofproducts計(jì)算時(shí),當(dāng)原始數(shù)據(jù)比較大時(shí),計(jì)算可以減一個(gè)數(shù)可除一個(gè)數(shù),進(jìn)行簡(jiǎn)化。第18頁(yè),共25頁(yè),2023年,2月20日,星期六三條規(guī)則:1、原始數(shù)據(jù)減一個(gè)數(shù)或加一個(gè)數(shù)時(shí),離均差平方和或積和數(shù)值不變2、原始數(shù)據(jù)除以一個(gè)數(shù)a,則簡(jiǎn)化值算出的離均差平方和要乘上一個(gè)a2才是原有的離均差平方和3、離均差積和在計(jì)算時(shí)如將兩變量之一(如x),除以一個(gè)數(shù)a時(shí),則求得之離均差積和要乘以一個(gè)a,才是原始數(shù)據(jù)的離均差積和;如y也同時(shí)除以一個(gè)數(shù)字b,則求得的離均差積和要同時(shí)乘以ab第19頁(yè),共25頁(yè),2023年,2月20日,星期六四、分組資料的標(biāo)準(zhǔn)差計(jì)算公式:計(jì)算實(shí)例見(jiàn)P29表3-11五、標(biāo)準(zhǔn)差的應(yīng)用1、表示變量值的離散程度2、概括地估計(jì)變量值的頻數(shù)分布3、應(yīng)用于求正常值范圍normalrange4、計(jì)算標(biāo)準(zhǔn)誤5、質(zhì)量控制第20頁(yè),共25頁(yè),2023年,2月20日,星期六1、表示變量值的離散程度均數(shù)相近,單位相同時(shí),標(biāo)準(zhǔn)差大表示變量值分布較分散,反之亦然。比較度量衡單位不同或均數(shù)相差懸殊的多組資料的變異度時(shí),需改用變異系數(shù)coefficientofvariation,CV表示標(biāo)準(zhǔn)差與均數(shù)之比P29-30例3-7,8第21頁(yè),共25頁(yè),2023年,2月20日,星期六2、正態(tài)分布normal(Gaussian)distribution直方圖histogram:橫軸表示變量值的大小,以各長(zhǎng)方塊面積代表頻數(shù),P30圖3-3,當(dāng)觀察例數(shù)逐漸增多,組距細(xì)分時(shí)變一條光滑的曲線,形狀近似正態(tài)曲線正態(tài)曲線:呈對(duì)稱(chēng)的鐘型,在均數(shù)處最高,兩側(cè)逐漸低下,兩端在無(wú)窮遠(yuǎn)處與底線相靠正態(tài)分布的兩個(gè)參數(shù):正態(tài)總體的均數(shù)和標(biāo)準(zhǔn)差(μ和σ)。通常用N(μ,σ)表示第22頁(yè),共25頁(yè),2023年,2月20日,星期六正態(tài)曲線的函數(shù)式densityfunction:正態(tài)曲線下面積分布規(guī)律:μ±σ:占全部曲線下面積的68.27%μ±1.64σ:占全部曲線下面積的90.90%μ±1.96σ:占全部曲線下面積的95.00%μ±2.58σ:占全部曲線下面積的99.00%第23頁(yè),共25頁(yè),2023年,2月20日,星期六3、正常值(參考值referencevalue)范圍:醫(yī)學(xué)上常把絕大多數(shù)(90%,95%,99%)正常人的某指標(biāo)值范圍稱(chēng)為該指標(biāo)的正常值范圍。資料近似正態(tài)或經(jīng)變量變換后符合正態(tài)分布時(shí)可用上述面積規(guī)律來(lái)估計(jì)95%正常值范圍,偏態(tài)資料可用百分位數(shù)法。正常人并非完全健康的人,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。按實(shí)際需要確定上下限或僅上限或僅下限。雙側(cè):1.64,1.96,2.58;單側(cè):1.28,1.64,2.33第24頁(yè),共25頁(yè),2023年,2月20日,星期六4、質(zhì)量控制:為了控

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論