![中醫(yī)藥統(tǒng)計(jì)學(xué)與軟件應(yīng)用筆記重點(diǎn)_第1頁](http://file4.renrendoc.com/view/822ccdc29f19b5898eff5976df46328d/822ccdc29f19b5898eff5976df46328d1.gif)
![中醫(yī)藥統(tǒng)計(jì)學(xué)與軟件應(yīng)用筆記重點(diǎn)_第2頁](http://file4.renrendoc.com/view/822ccdc29f19b5898eff5976df46328d/822ccdc29f19b5898eff5976df46328d2.gif)
![中醫(yī)藥統(tǒng)計(jì)學(xué)與軟件應(yīng)用筆記重點(diǎn)_第3頁](http://file4.renrendoc.com/view/822ccdc29f19b5898eff5976df46328d/822ccdc29f19b5898eff5976df46328d3.gif)
![中醫(yī)藥統(tǒng)計(jì)學(xué)與軟件應(yīng)用筆記重點(diǎn)_第4頁](http://file4.renrendoc.com/view/822ccdc29f19b5898eff5976df46328d/822ccdc29f19b5898eff5976df46328d4.gif)
![中醫(yī)藥統(tǒng)計(jì)學(xué)與軟件應(yīng)用筆記重點(diǎn)_第5頁](http://file4.renrendoc.com/view/822ccdc29f19b5898eff5976df46328d/822ccdc29f19b5898eff5976df46328d5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
中醫(yī)藥統(tǒng)計(jì)學(xué)與軟件應(yīng)用筆記重點(diǎn)緒論統(tǒng)計(jì)學(xué)家C.R.勞先生在《統(tǒng)計(jì)與真理——怎樣運(yùn)用偶然性》中指出:在終極的分析中,一切知識(shí)都是歷史;在抽象的意義下,一切科學(xué)都是數(shù)學(xué);在理性的基礎(chǔ)上,所有的判斷都是統(tǒng)計(jì)學(xué)。一、統(tǒng)計(jì)學(xué)的概念、發(fā)展簡史及主要內(nèi)容1.統(tǒng)計(jì)學(xué):是以概率論和數(shù)理統(tǒng)計(jì)為基礎(chǔ),對研究對象的數(shù)據(jù)進(jìn)行搜集、整理和分析,揭示事物總體特征和規(guī)律的方法論科學(xué)。2.中醫(yī)統(tǒng)計(jì)學(xué):是以概率論和數(shù)理統(tǒng)計(jì)的原理和方法為基礎(chǔ),以中醫(yī)理論與實(shí)踐為主體,通過對數(shù)據(jù)的搜集、整理和分析,達(dá)到探討中醫(yī)理論與方法內(nèi)在規(guī)律的目的。3.統(tǒng)計(jì)學(xué)的發(fā)展趨勢:①依賴數(shù)學(xué)。②與計(jì)算機(jī)技術(shù)結(jié)合。③與實(shí)質(zhì)性學(xué)科、統(tǒng)計(jì)軟件、現(xiàn)代信息相結(jié)合,所發(fā)揮的功效日益增強(qiáng)。④從描述事物現(xiàn)狀、反映事物規(guī)律,向抽樣推斷、預(yù)測未來變化方向發(fā)展。4.統(tǒng)計(jì)學(xué)的主要內(nèi)容⑴研究設(shè)計(jì):專業(yè)設(shè)計(jì)、統(tǒng)計(jì)學(xué)設(shè)計(jì)⑶統(tǒng)計(jì)描述:統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖表
⑵統(tǒng)計(jì)學(xué)的基本概念、原理和思維方法⑷統(tǒng)計(jì)推斷:參數(shù)估計(jì)、假設(shè)檢驗(yàn)二、統(tǒng)計(jì)工作的基本步驟和特點(diǎn)1.統(tǒng)計(jì)工作的基本步驟(1)統(tǒng)計(jì)學(xué)設(shè)計(jì)(2)搜集資料:①常規(guī)保存的記錄;②現(xiàn)場調(diào)查記錄;③實(shí)驗(yàn)/試驗(yàn)記錄;④醫(yī)學(xué)文獻(xiàn)/網(wǎng)絡(luò)信息。3)整理資料:①檢查;②審核;③計(jì)算機(jī)檢查;④分組。4)分析資料2.統(tǒng)計(jì)學(xué)認(rèn)識(shí)現(xiàn)象的特點(diǎn)1)數(shù)量性:(2)群體性:(3)具體性:(4)概率性:三、統(tǒng)計(jì)學(xué)中常用的概念1.總體(population):是根據(jù)研究目的確定的同質(zhì)觀察單位的集合。例①河北?、酆颖笔?/p>
18歲男性的身高和體重分布 ②某性紅地18歲身高在 170-175cm男性的體重分布
2005年健康成年男細(xì)胞數(shù)⑴有限總體:指總體限定于特定的空間、時(shí)間范圍內(nèi)有限個(gè)觀察單位。⑵無限總體:指沒有空間和時(shí)間范圍限制的總體 。2.樣本(sample):從總體中隨機(jī)抽取的有代表性的一部分觀察單位的集合。樣本的可靠性:指總體確定后,樣本中的每一個(gè)觀察單位確屬預(yù)先規(guī)定的同質(zhì)總體。樣本的代表性:即樣本能夠充分反映總體的真實(shí)情況。3.隨機(jī)(random):即在抽樣、分組、安排試驗(yàn)順序時(shí),讓總體中每個(gè)受試者或觀察單位都有同等的機(jī)會(huì)被抽中、 被分配或被安排,而不受研究者的主觀意愿驅(qū)使。不能將隨機(jī)理解為隨便。4.事件(event):指事物發(fā)生某種情況或在調(diào)查、觀察和實(shí)驗(yàn)中獲得的某種結(jié)果。⑴確定性事件是可預(yù)言在一定條件下必然發(fā)生的事件,發(fā)生的概率為1。0~1⑵隨機(jī)事件:指一定條件下可能發(fā)生也可能不發(fā)生的不確定性事件,發(fā)生的概率介于之間。⑶模糊事件:事物本身的含義不確定的現(xiàn)象。5.頻率(frequency):對于隨機(jī)事件A,在相同的條件下進(jìn)行了n次實(shí)驗(yàn),事件A發(fā)生的次數(shù)為m,比值m/n為頻率,記為fn(A);概率(probability):描述某隨機(jī)事件A發(fā)生的可能性大小,統(tǒng)計(jì)符號(hào)為P,0≤P≤1,記為P(A)。當(dāng)n→∝時(shí),頻率fn(A)→概率P(A)。P≤0.05或P≤0.01小概率事件:表示某事件發(fā)生的可能性很小,在醫(yī)學(xué)研究中,習(xí)慣上把的事件稱為小概率事件。6.變異(variation):總體中各個(gè)體之間的差異性。同質(zhì)是相對的,研究對象只是在某一方面是性質(zhì)相同的, 同類的觀察對象之間往往也存在著變異。 變異是絕對的、客觀存在的。7.誤差(error):指測量值與真值之差。⑴過失誤差:也叫粗差。觀測者粗心大意造成的誤差。⑵系統(tǒng)誤差:由于儀器未校準(zhǔn)、試劑未標(biāo)定、觀測標(biāo)準(zhǔn)未統(tǒng)一等固定原因造成的誤差。⑶測量誤差:由事先難于預(yù)料的實(shí)驗(yàn)或觀察條件的隨機(jī)波動(dòng)造成的誤差。⑷抽樣誤差:由抽樣引起的樣本指標(biāo)(統(tǒng)計(jì)量)與總體指標(biāo)(參數(shù))的差別。8.統(tǒng)計(jì)量(statistical):是反映樣本特征的統(tǒng)計(jì)指標(biāo)。統(tǒng)計(jì)符號(hào)為小寫的英文字母。 如樣本均數(shù) x、樣本標(biāo)準(zhǔn)差 s、樣本率 p等。9.參數(shù)(parameter):是描述總體特征的統(tǒng)計(jì)指標(biāo)。統(tǒng)計(jì)符號(hào)為小寫的希臘字母。 如總體均數(shù)μ、總體標(biāo)準(zhǔn)差σ、總體率π等。10.統(tǒng)計(jì)資料的類型根據(jù)研究目的,對研究對象的某些特征進(jìn)行觀測,將這些觀測指標(biāo)或項(xiàng)目稱為變量的具體數(shù)值 (變量值)構(gòu)成了統(tǒng)計(jì)數(shù)據(jù)或 統(tǒng)計(jì)資料。
變量。統(tǒng)計(jì)資料分為兩類:⑴ 值變量(numericalvariable):亦稱定量資料。是指對每個(gè)觀察單位用計(jì)量方法測得某項(xiàng)數(shù)值大小所獲得的資料。特點(diǎn)為其變量值大多有度量衡單位,其具體取值通常是正實(shí)數(shù) (零、正整數(shù)和小數(shù) )。如身高1.75m、體重68kg、血壓9.6kPa、血糖6.8mmol/L。⑵分類變量(categorical variable):又稱定性資料。指對每個(gè)觀察單位按某一方面的特征、性質(zhì)或等級(jí)分組計(jì)數(shù)而得到的資料。特點(diǎn)是變量值表現(xiàn)為互不相容的屬性或類別,無度量衡單位。分類變量又可分為兩類:① 序分類變量:又稱為名義資料。具體取值通常是具有某種屬性或特征的個(gè)數(shù)。特點(diǎn)是可在非數(shù)字中取值,各類之間具有性質(zhì)上的差異??煞譃槎肿兞亢投喾肿兞?。二分變量是按互不相容的屬性分成兩類的資料。多分變量是按某種屬性或特征分成兩類以上的資料。② 序分類變量:亦稱等級(jí)資料或半定量資料。具體取值也是具有某種屬性或特征的個(gè)數(shù),但不同取值之間有半定量的關(guān)系。特點(diǎn)是其各類別間有等級(jí)、 程度或量的差異,即可按數(shù)量的相對大小或程度的高低排出順序。四、學(xué)習(xí)中醫(yī)統(tǒng)計(jì)學(xué)的目的1.順應(yīng)中醫(yī)藥學(xué)的發(fā)展趨勢。 2.強(qiáng)化中醫(yī)科研的計(jì)劃性和科學(xué)性。3.拓寬研究思路。 4.學(xué)會(huì)正確地運(yùn)用統(tǒng)計(jì)方法和合理地解釋統(tǒng)計(jì)結(jié)果。五、學(xué)習(xí)中醫(yī)統(tǒng)計(jì)學(xué)的注意事項(xiàng)1.理解和領(lǐng)會(huì)基本概念和原理,切忌死記硬背。 2.不追究公式的來源和推導(dǎo),但要掌握其應(yīng)用條件。3.重視分析問題和解決問題能力的培養(yǎng)。 4.學(xué)會(huì)使用統(tǒng)計(jì)軟件。數(shù)值變量資料的統(tǒng)計(jì)描述統(tǒng)計(jì)描述—— 概念:即利用原始數(shù)據(jù),選擇適宜的統(tǒng)計(jì)指標(biāo)及統(tǒng)計(jì)圖表,簡明準(zhǔn)確地探察數(shù)據(jù)的分布類型和數(shù)量特征的基本統(tǒng)計(jì)方法。目的:是根據(jù)樣本中所包含的信息,客觀、正確地推論出其總體規(guī)律。第一節(jié) 頻數(shù)分布頻數(shù):相同觀察值或觀察結(jié)果出現(xiàn)的次數(shù)。分布:指隨著隨機(jī)變量取值的變化,其相應(yīng)的概率變化的規(guī)律性。頻數(shù)分布:觀察值(變量值)按大小分組,各個(gè)組段內(nèi)觀察值個(gè)數(shù) (頻數(shù))的分布,是了解數(shù)據(jù)分布形態(tài)特征與規(guī)律的基礎(chǔ)。一、頻數(shù)分布的特征1.集中趨勢:指一組變量值的集中傾向或中心位置。2.離散趨勢:即一組變量值的離散傾向。二、頻數(shù)分布的類型1.對稱分布:指集中位置居中、左右兩側(cè)的頻數(shù)分布基本對稱的頻數(shù)分布。
2.非對稱分布: 亦稱偏態(tài)分布,是集中位置偏倚、兩側(cè)頻數(shù)的分布不對分為正態(tài)分布和非正態(tài)分布兩
稱的頻 數(shù)分布,可分為正種類型。
偏態(tài)和負(fù)偏態(tài)分布。三、頻數(shù)分布表 /圖的作用1.直觀地揭示數(shù)據(jù)的分布類型和特征。2.便于發(fā)現(xiàn)資料中某些遠(yuǎn)離群體的特大或特小的可疑值。3.描述頻數(shù)分布的集中趨勢與離散趨勢。4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)。四、頻數(shù)表概念:頻數(shù)分布表的簡稱。指觀察值或某些類別及其相應(yīng)的頻數(shù)按一定順序排列的表格。例題:隨機(jī)抽取某地120例正常人,測得血清銅的含量(μmol/L)如下表,試編制頻數(shù)表。13.8412.5313.7014.8917.5313.1918.8214.7317.4413.9914.1012.2912.6114.7814.5914.7118.6219.0410.9513.8110.5313.5611.4813.0716.8817.0417.9812.6711.039.2315.0414.0915.9011.4814.6413.6414.3915.7413.9911.3117.6116.2613.5311.6813.2511.8814.2115.2115.2913.7014.4511.2319.8413.1115.1511.70頻數(shù)表的編制方法:1.找極值:Xmax=19.84,Xmin=9.232.求全距:R=Xmax-Xmin,R=19.84-9.23=10.613.定組數(shù):K=8~15。4.求組距:i=R/(K–1)(i為組距,k為組段數(shù),R為全距)i=10.61/(11-1)=1.061≈15.確定各組段的上下限:6.歸納計(jì)數(shù):某地120名正常成年人血清銅含量頻數(shù)表組段頻數(shù)f頻率P(%)fCPC(%)9.00~32.532.510.00~43.375.811.00~1210.01915.812.00~1310.83226.613.00~1714.24940.814.00~2218.37159.115.00~1815.08974.116.00~1310.810284.917.00~119.211394.118.00~54.211898.319.00~21.7120100.0合計(jì)120100.0五、頻數(shù)圖概念:亦稱直方圖,是以直方的寬度代表組距,以直方的面積大小表示頻數(shù)的多少、以直方面積在總面積中的比例表示頻率大小的圖形。等距分組——以橫軸表示變量,以縱軸表示頻數(shù)。不等距分組——以橫軸表示變量,但縱軸是頻數(shù)除以組距。第二節(jié) 數(shù)值變量資料集中趨勢的描述集中趨勢:是度量變量值集中位置和平均水平的數(shù)量指標(biāo),其代表值為平均數(shù)。平均數(shù):是描述一組觀測值平均水平的指標(biāo), 是對同質(zhì)基礎(chǔ)上的樣本或總體一般特征的表達(dá)指標(biāo)。算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)一、算術(shù)平均數(shù)1.定義:算術(shù)平均數(shù)簡稱均數(shù)。是一組觀察值的和與觀察值個(gè)數(shù)之商。是數(shù)量上的平均。用于說明一組觀測值的趨中位置或平均水平。 表示樣本均數(shù), 表示總體均數(shù)。2.適用條件:正態(tài)或近似正態(tài)分布的資料。如生理指標(biāo)。3.計(jì)算方法:⑴直接法:有 n個(gè)觀察值,分別為 X1,X2,,, Xn,式中Σ是求和的符號(hào) 。例題:10名12歲男孩身高(cm)分別為125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5,122.5,140.0。求平均數(shù)。⑵加權(quán)法:用于觀察值中相同數(shù)據(jù)較多或頻數(shù)表資料。=1737.00/120=14.48(μmol/L)二、幾何均數(shù)1.定義:n個(gè)數(shù)值連乘積的n次方根。是比例或倍數(shù)上的平均。統(tǒng)計(jì)符號(hào)G。2.應(yīng)用條件:等比數(shù)列資料。如抗體滴度。3.計(jì)算方法:例題:
6份血清抗體滴度為
1:2,1:4,1:8,1:8,1:16,1:32,求平均數(shù)。平均滴度為
1:8。三、中位數(shù)1.定義:將一組觀察值按由小到大的順序排列, 位次居中的數(shù)值即中位數(shù)。 是位次上的平均。統(tǒng)計(jì)符號(hào)M。2.應(yīng)用條件:不拘分布、分布類型不明或一端無界的資料。 如潛伏期、治愈時(shí)間和發(fā)病年齡。3.計(jì)算方法:n為奇數(shù)時(shí)
n為偶數(shù)時(shí)式中 、 及 均為下標(biāo),表示有序數(shù)列中觀察值的位次。例題:某醫(yī)院用大黃粉治療胃熱血瘀型血證病人 9例,其大便轉(zhuǎn)陰天數(shù)分別為3、4、5、7、10,求其中位數(shù)。本例n=9,M=X5=3(天)。
1、1、2、2、如果本例 n=10,第10個(gè)數(shù)值為 16天,則 M=(3+4)/2=3.5(天)。⑵ 數(shù)表法用于觀察值例數(shù)較多或頻數(shù)表資料。L為M所在組段的下限; i為該組段的組距;f m為該組段的f; n為總例數(shù);ΣfL為小于L的各組段的fC。例題:905例男性銀屑病病人的發(fā)病年齡年齡頻數(shù)f累計(jì)頻數(shù)fC累計(jì)頻率pC(%)<1054545.9710~252306(ΣfL)33.8120~346(fM)65272.0430~12878086.1940~8486495.4750~2989398.6760~589899.23≥707905(n)100.00M=20+(10/346)(905/2-306)=24.23(歲)第三節(jié) 數(shù)值變量資料的離散趨勢描述離散趨勢:亦稱變異性,是描述一組同質(zhì)觀察值的變異程度大小的指標(biāo)。 不但反映研究指標(biāo)數(shù)值的穩(wěn)定性和均勻性,而且反映集中性指標(biāo)的代表性。極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。變異指標(biāo)示意 (兩個(gè)學(xué)生五門成績分布學(xué)生 科 目
)
變異指標(biāo)1 2 3
4
5
R
S2
S
CVA
78 79
80 81
82 80
4
2.5 1.58
1.98B 60 70 80 90 100 80 40 250 15.81 19.76A、B兩個(gè)學(xué)生五門課程成績的均數(shù)都是 80,但各科成績分布情況卻不相同。A較集中,變異較??;B較分散,變異較大。一、全距(R)概念:亦稱極差,是一組觀察值中最小值與最大值之差,反映個(gè)體差異的范圍。R=xmax-xmin優(yōu)點(diǎn):1.意義明確、計(jì)算簡便。 2.穩(wěn)定性較差。3.受n大小的影響。4.可應(yīng)用于任何分布。二、百分位數(shù)和四分位間距1.百分位數(shù):是把一組觀察值從小到大排列,分為 100等份,與x%位次所對的數(shù)值即為第百分之x位數(shù)。以P x表示。一個(gè)Px將全部觀察值分為兩部分, 理論上有x%的觀察值比它小, 有(100-x)%的觀察值比它大。是一種位置指標(biāo)。 M 即P50。2.四分位數(shù)間距: 是上四分位數(shù) QU(P75)與下四分位數(shù) QL(P25)之差,符號(hào)為 QR。是中間50%觀察值的極差。QR=QU-QL=P75-P25用途:⑴常用來描述偏態(tài)分布資料分布以及分布的一端或兩端無確切數(shù)值資料的離散程度。⑶ 表示參考值范圍 百分位數(shù)的另一個(gè)重要用途是表示偏態(tài)分布資料的參考值范圍。例題:905例男性銀屑病病人的發(fā)病年齡(同前)計(jì)算方法:P25= 10+(10/252)×(905×0.25-54)=16.84(歲)P75=30+(10/128)×(905×0.75-652)=32.09(歲)QR=P75-P25= 32.09-16.84=15.25(歲)三、方差概念:方差即離均差平方和的均值??傮w方差的符號(hào)為 σ2,樣本方差符號(hào)為s 2。優(yōu)點(diǎn):由于s2利用了每個(gè)觀察值的信息,反映一批數(shù)據(jù)變異程度的穩(wěn)定性和精確性好。缺點(diǎn):但在運(yùn)算時(shí)需將各個(gè)離均差平方,使原度量單位變成平方單位,不便于進(jìn)行比較。應(yīng)用條件:要求資料服從正態(tài)或近似正態(tài)分布。四、標(biāo)準(zhǔn)差概念:方差的平方根。 除了具有方差的優(yōu)點(diǎn)外,還克服了度量單位被平方的不足, 運(yùn)用較方便。總體標(biāo)準(zhǔn)差的符號(hào)為 σ,樣本標(biāo)準(zhǔn)差的符號(hào)為s;英文縮寫為 SD。例題:學(xué)生:n=5,ΣX=78+79+80+81+82=400;ΣX2=782+792+802+812+822=32010學(xué)生:n=5,ΣX==400;ΣX2==33000用途:⑴表示正態(tài)或近似正態(tài)分布的離散程度。 ⑵描述數(shù)值變量的頻數(shù)分布特征 ( ±s)。⑶制定醫(yī)學(xué)參考值范圍。⑷與均數(shù)結(jié)合計(jì)算變異系數(shù)。⑸與樣本含量結(jié)合計(jì)算標(biāo)準(zhǔn)誤。五、變異系數(shù)概念:一組觀察值的標(biāo)準(zhǔn)差與均數(shù)的百分比。是相對離散量,無單位。統(tǒng)計(jì)符號(hào) CV用途:⑴比較度量單位不同或均數(shù)相差懸殊時(shí)幾組樣本資料的離散性。⑵比較實(shí)驗(yàn)指標(biāo)的穩(wěn)定性及測定方法的精密度。例題:(1)某單位測得28例成年脾虛病人的紅細(xì)胞數(shù)為3.10土0.86×1012/L;血紅蛋白值為87.2土33.3g/L,試比較該兩項(xiàng)指標(biāo)的變異程度。CVRBC=(0.86/3.10)×100%=27.74%;CVHb=(33.3/87.2)×100%=38.19%可認(rèn)為Hb的變異程度比RBC大。2)某單位測得大鼠的血清谷丙轉(zhuǎn)氨酶(ALT)為29.4土1.4,家兔的ALT為52.8土1.5,試比較兩種實(shí)驗(yàn)動(dòng)物ALT指標(biāo)的實(shí)驗(yàn)穩(wěn)定性。CV大鼠=(1.4/29.4)×100%=4.76%;CV家兔=(1.5/52.8)×100%=2.84%可認(rèn)為家兔ALT的實(shí)驗(yàn)穩(wěn)定性較好,應(yīng)優(yōu)先考慮以家兔為實(shí)驗(yàn)對象進(jìn)行 ALT的有關(guān)研究。由該例可知,CV對于改進(jìn)實(shí)驗(yàn)方法, 選擇最佳實(shí)驗(yàn)對象、 指標(biāo)等,都具有一定的實(shí)際意義。變異指標(biāo):1.極差較粗,適用于任何分布;2.標(biāo)準(zhǔn)差與均數(shù)單位相同,最常用,適用于正態(tài)及近似正態(tài)分布的統(tǒng)計(jì)描述;3.集中指標(biāo)和離散指標(biāo)分別反映資料的特征,常配套使用:正態(tài)分布:算術(shù)平均數(shù)標(biāo)準(zhǔn)差偏態(tài)分布:中位數(shù)四分位數(shù)間距等比資料:G正態(tài)分布及其應(yīng)用第一節(jié)
正態(tài)分布某地120例正常人血清銅含量的直方圖。設(shè)想觀察人數(shù)逐漸增多組、距不斷細(xì)分,作直方圖。將各直方頂端的中點(diǎn)連接,形成一條光滑的曲線,該曲線即頻數(shù)曲線或頻率曲線,近似于數(shù)學(xué)上的正態(tài)分布曲線。一、正態(tài)分布:又稱Gauss分布或常態(tài)分布,是一種最重要的連續(xù)型分布。正態(tài)分布曲線:是高峰位于中央,兩側(cè)逐漸下降,左右對稱,永遠(yuǎn)不與橫軸相交的曲線。二、正態(tài)分布的密度函數(shù)(–∞<x<∞)f(x)為與x對應(yīng)的正態(tài)曲線的縱坐標(biāo)高度; μ為總體均數(shù);σ為總體標(biāo)準(zhǔn)差;π為圓周率,即3.14159;e為自然對數(shù)的底,即 2.71828。三、正態(tài)分布的特征1.在X軸上方,均數(shù)所在處最高。2.集中性、對稱性和均勻變動(dòng)性。3.正態(tài)分布有兩個(gè)參數(shù) μ和σ。四、標(biāo)準(zhǔn)正態(tài)分布x落在某個(gè)區(qū)間內(nèi)的概率顯得由于不同的正態(tài)分布有不同的μ和σ,用公式計(jì)算的隨機(jī)變量非常麻煩。為尋求一個(gè)通用的方法,進(jìn)行標(biāo)準(zhǔn)正態(tài)變換(即u變換):u=(x-μ)/σ。此變換實(shí)質(zhì)上是作了一個(gè)坐標(biāo)軸的平移和尺度變換,使原來的正態(tài)分布變換為μ=0、σ=1的標(biāo)準(zhǔn)正態(tài)分布 (亦稱u分布),記為N(0,1)。五、標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)(–∞<u<∞)式中(u)為標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù),即縱坐標(biāo)高度。六、正態(tài)曲線下面積分布的規(guī)律:七、正態(tài)分布的應(yīng)用1.統(tǒng)計(jì)分析方法的基礎(chǔ): 很多抽樣分布,如卡方分布、t分布都是建立在正態(tài)分布的基礎(chǔ)上。2.質(zhì)量控制:為了控制檢測誤差,常以 ±2s作為上下警戒線;3.估計(jì)醫(yī)學(xué)參考值范圍。 4.進(jìn)行參數(shù)估計(jì)和假設(shè)檢驗(yàn)。
±3s作為上下控制。第二節(jié)正態(tài)分布的應(yīng)用一、 可根據(jù)正態(tài)分布的規(guī)律估計(jì)觀察值的頻數(shù)分布范圍。例題 已知某地 120名正常人血漿銅含量 (μmol/L)的均數(shù)=14.48、s=120名正常人血漿銅含量在 14.20~15.60(μmol/L)范圍內(nèi)的人數(shù)。1.計(jì)算u值 當(dāng)μ和σ未知時(shí),u=(x- )/s。x1=14.20,u1=(14.20-14.48)/2.27=-0.12x2=15.60,u2=(15.60-14.48)/2.27=0.49
2.27,估計(jì)該地2.查表
-0.12左側(cè)的面積就是 0.12右側(cè)的面積。當(dāng)u=0.12時(shí),在表的左側(cè)找到 0.1,在表的上方找到Ф(-0.12)=1-0.5478=0.4522,即標(biāo)準(zhǔn)正態(tài)變量 u值小于當(dāng)u=0.49時(shí),Ф(0.49)=0.6879,即u值小于0.49
0.02,二者相交處為0.5478,-0.12的概率為0.4522;的概率為0.6879。3.確定概率u值在-0.12~0.49范圍內(nèi)的面積為:Ф(0.49)-Ф(-0.12)=0.6879-0.4522=0.2357,即血漿銅含量在14.20~15.60(μmol/L)范圍內(nèi)的概率為23.57%。4.估計(jì)區(qū)間內(nèi)人數(shù)120名正常人血清銅含量在 14.20~15.60(μmol/L)范圍的人數(shù)為 120×23.57%=28人二、制定醫(yī)學(xué)參考值范圍1、醫(yī)學(xué)參考值的意義○1醫(yī)學(xué)參考值:是指包括絕大多數(shù)正常人的解剖、生理、生化、免疫、組織或排泄物中成分的測量值。○2醫(yī)學(xué)參考值范圍慮到變異的影響, 提高參考值作為判定正?;虍惓5目煽啃运_定的絕大多數(shù)正常人醫(yī)學(xué)參考值的波動(dòng)范圍?!?使用“參考值范圍” 的目的:個(gè)體—臨床上劃分正常人與異常人的參考。人群—制訂不同性別、年齡兒童某項(xiàng)發(fā)育指標(biāo)的等級(jí)標(biāo)準(zhǔn),用來評(píng)價(jià)兒童的發(fā)育水平等。2、制定參考值范圍的步驟○1選定健康人作為調(diào)查對象?!?2控制測量誤差。○3.確定樣本含量。○4根據(jù)實(shí)際意義分組?!?.決定取單側(cè)還是雙側(cè)界限。 ○6選定適當(dāng)?shù)陌俜纸缦蕖?常用95%、80 %、90%、99%等。○7制定醫(yī)學(xué)參考值范圍。3、制定參考值范圍的常用方法○1正態(tài)分布法 適用于正態(tài)或近似正態(tài)分布的資料。 表達(dá)式為 ,α為正態(tài)曲線下單側(cè)或雙側(cè)尾部的面積, uα為α相應(yīng)的標(biāo)準(zhǔn)正態(tài)離差。雙側(cè)95%的界限值為:單側(cè)95%的上限值為:單側(cè)95%的下限值為:例題:某地調(diào)查正常成年男子 144人的紅細(xì)胞數(shù),得均數(shù)5.38(1012/L),標(biāo)準(zhǔn)差0.44(1012/L),試估計(jì)該地成年男子紅細(xì)胞數(shù)的 95%參考值范圍。因紅細(xì)胞數(shù)過多或過少均為異常,用雙側(cè)界值。下限: -1.96s=5.38-1.96×0.44=4.52上限: +1.96s=5.38+1.96×0.44=6.24該地成年男子紅細(xì)胞數(shù)的 95%參考值范圍( 4.52—6.24)1012/L?!?百分位數(shù)法: 是利用兩個(gè)百分位數(shù)作為雙側(cè)參考值范圍的上、下限,或者用一個(gè)百分位數(shù)作為參考值的上限或下限。適用于非正態(tài)分布或分布未知的資料。1)雙側(cè)95%參考值范圍: P2.5~P97.5 2)單側(cè)95%參考值范圍上限值: P953)單側(cè)95%參考值范圍下限值: P5總體均數(shù)的估計(jì)參數(shù)估計(jì):是通過樣本信息估計(jì)其總體相應(yīng)指標(biāo)的數(shù)值及數(shù)值范圍的統(tǒng)計(jì)分析方法, 即用統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法,是統(tǒng)計(jì)推斷的一個(gè)重要方面。第一節(jié) 抽樣分布與抽樣誤差◆醫(yī)學(xué)科研的常用方法是 抽樣研究?!粲捎趥€(gè)體差異的存在, 測算的樣本指標(biāo)值很難恰好等于總體指標(biāo)值。 這種由個(gè)體差異和抽樣造成的樣本與總體、樣本與樣本相應(yīng)統(tǒng)計(jì)指標(biāo)之間的差異即 抽樣誤差。一、樣本均數(shù)的抽樣分布與標(biāo)準(zhǔn)誤1.樣本均數(shù)的抽樣分布 :指某種統(tǒng)計(jì)量的頻數(shù)分布。 用樣本統(tǒng)計(jì)量作為該樣本的代表值 ,這些個(gè)樣本代表值的大小就形成了一個(gè)抽樣分布。2.抽樣分布的特點(diǎn):(1)各統(tǒng)計(jì)量間存在差異,統(tǒng)計(jì)量不一定等于參數(shù)。2)統(tǒng)計(jì)量的變異范圍比原變量的變異范圍大大縮小。3)隨著n增加,樣本均數(shù)的變異程度減小。4)如果原始變量服從正態(tài)分布,則統(tǒng)計(jì)量也服從正態(tài)分布。如果原始變量不服從正態(tài)分布,若n較大,則統(tǒng)計(jì)量服從正態(tài)分布;若n較小,則統(tǒng)計(jì)量為非正態(tài)分布。3.抽樣誤差: 是因抽樣產(chǎn)生的樣本與樣本、樣本與總體相應(yīng)統(tǒng)計(jì)指標(biāo)之間的差異。◆由于存在個(gè)體差異,且樣本又未包含總體的全部信息,因此抽樣誤差是無法避免的?!舫闃诱`差的大小主要取決于樣本含量的多少和研究指標(biāo)的變異程度。4.標(biāo)準(zhǔn)誤:◆表示樣本指標(biāo)值在抽樣分布中的變異情況?!鬝E越小,說明抽樣誤差越小, 用統(tǒng)計(jì)量來估計(jì)參數(shù)時(shí)的可靠程度越大; 反之,SE越大,說明抽樣誤差越大,用統(tǒng)計(jì)量來估計(jì)參數(shù)時(shí)越不可靠。均數(shù)的標(biāo)準(zhǔn)誤:◆ 樣本均數(shù)的標(biāo)準(zhǔn)差也稱均數(shù)的標(biāo)準(zhǔn)誤。◆反映樣本均數(shù)間的離散程度,反映樣本均數(shù)與相應(yīng)總體均數(shù)間的差異,說明均數(shù)抽樣誤差的大小。估計(jì)標(biāo)準(zhǔn)誤:◆由于σ往往未知,常以S替代,算得的標(biāo)準(zhǔn)誤稱估計(jì)標(biāo)準(zhǔn)誤。 其統(tǒng)計(jì)符號(hào)?!粲捎跇?biāo)準(zhǔn)誤與抽樣誤差成正比,與樣本均數(shù)的代表性成反比,故在實(shí)際工作中可將標(biāo)準(zhǔn)誤作為描述統(tǒng)計(jì)指標(biāo)可靠性的依據(jù)。5.標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的比較標(biāo)準(zhǔn)差均屬標(biāo)準(zhǔn)誤意義描述個(gè)體觀察值之間的離散性(變異程描述同一總體中隨機(jī)抽出樣本含量相度)同的多個(gè)樣本均數(shù)間的離散性公式與n的關(guān)系隨著n的增大逐漸趨于穩(wěn)定隨著n的增大逐漸減小,與n的平方根成反比。用途表示觀察值得變異大小;結(jié)合樣本均數(shù)描述表示樣本均數(shù)抽樣誤差的大小;描述樣本均正態(tài)分布的特征;在正態(tài)分布時(shí)做參考值范數(shù)的可靠性;結(jié)合樣本均數(shù)估計(jì)總體均數(shù)的圍的估計(jì);計(jì)算變異系數(shù)和均數(shù)的標(biāo)準(zhǔn)誤CI;進(jìn)行均數(shù)間差別的假設(shè)檢驗(yàn)例題:已知某樣本資料的s=2.27(μmol/L),n=120,求其標(biāo)準(zhǔn)誤。代入公式得:二、t分布及其應(yīng)用1.t分布:若對正態(tài)分布總體多次重復(fù)抽取若干樣本含量相同的樣本,樣本均數(shù)圍繞總體均數(shù)μ呈現(xiàn)正態(tài)分布。若將所有樣本均數(shù)按公式進(jìn)行數(shù)學(xué)變換,可得u圍繞0的標(biāo)準(zhǔn)正態(tài)分布。由于總體標(biāo)準(zhǔn)差未知,只能求出標(biāo)準(zhǔn)誤的估計(jì)值,變換公式求 t值,可得到若干 t值。將這些 t值繪成直方圖,若樣本無限多,可繪成一條光滑的曲線—— t分布曲線,此時(shí)所得的t值圍繞0呈現(xiàn)的就是 t分布。2.t分布的特征:(1)是一簇單峰分布曲線,以 0為中心,左右對稱。(2)其形態(tài)變化與自由度 ν的大小有關(guān)—— ν越小,則t值越分散,t分布曲線越低平, t分布的峰部越矮而尾部翹得越高; ν越大,t分布越逼近正態(tài)分布。(3)t分布的單側(cè)概率和雙側(cè)概率在t界值表中,橫標(biāo)目為自由度 ν,縱標(biāo)目為概率 (P或α)。一側(cè)尾部面積稱為單側(cè)概率或單尾概率 ;兩側(cè)尾部面積之和稱為雙側(cè)概率或雙尾概率。表中數(shù)字表示當(dāng) ν和α確定時(shí),對應(yīng)的 t的界值,其中與單尾概率相對應(yīng)的 t界值用 表示,與雙尾概率相對應(yīng)的 t界值用表示。查t界值表注意:由于t分布是以 0為中心的對稱分布,故附表 2只列出正值,查表時(shí),不管t值正負(fù),均可用其絕對值︱ t︱查表得概率P值?!?相同自由度時(shí),︱ t︱值增大,概率P減小;○2在相同︱ t︱值時(shí),雙尾概率P是單尾概率P的兩倍。如雙尾 =單尾 =1.8123.t分布的用途: 總體均數(shù)的區(qū)間估計(jì); t檢驗(yàn)。第二節(jié) 總體均數(shù)的估計(jì)是根據(jù)樣本分布的特點(diǎn),由樣本均數(shù)推測總體均數(shù)的大小及其范圍??傮w均數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。一、總體均數(shù)的點(diǎn)估計(jì)點(diǎn)估計(jì) 概念:用樣本確定的統(tǒng)計(jì)量的值來直接估計(jì)總體參數(shù)的數(shù)值。方法:以樣本統(tǒng)計(jì)量及其標(biāo)準(zhǔn)誤作為被估計(jì)參數(shù)的點(diǎn)估計(jì)值,一般是以統(tǒng)計(jì)量加減標(biāo)準(zhǔn)誤的方式給出參數(shù)的點(diǎn)估計(jì)值。優(yōu)點(diǎn):方法簡單。 缺點(diǎn):未考慮抽樣誤差的影響。二、區(qū)間估計(jì)—— 根據(jù)抽樣分布原理, 按預(yù)先給定的概率水準(zhǔn), 給出被估計(jì)參數(shù)可能的數(shù)值范圍。統(tǒng)計(jì)學(xué)稱這一范圍為被估計(jì)參數(shù)的可信區(qū)間 (CI)。稱預(yù)先給定的概率水準(zhǔn)為可信度或可信系數(shù),符號(hào)為 1-α,常取95%或99%。稱按95%或99%水準(zhǔn)確定的 CI為95%CI或99%CI。1.大樣本資料均數(shù)的可信區(qū)間樣本例數(shù)n足夠大 (n≥100)時(shí),可按正態(tài)分布原理,用以下公式估計(jì)總體均數(shù) μ的CI。95%CI=
99%CI=例題:測得某地 296例成年男性發(fā)鋅的均數(shù)為
200.0ppm,標(biāo)準(zhǔn)差為
21.8ppm。試估計(jì)該地成年男性發(fā)鋅總體均數(shù)的 95%CI。本例n=
296,
=200,s=21.8,
=
=1.27。95%CI=200.0±1.96×1.27=(197.51,202.49)該地成年男性發(fā)鋅總體均數(shù)的 95%CI為197.51~202.4ppm。2.小樣本資料均數(shù)的可信區(qū)間當(dāng)n較小(n<100)時(shí),一般按
t分布原理,用以下公式估計(jì)總體均數(shù)
μ的
CI。95%CI=式中t0.05/2,ν與t0.01/2,ν為
t0.05
與
99%CI=t0.01的雙側(cè)界值。例題:測得某地 12例腎虛失鈉型哮喘病人甲皺微循環(huán)管袢長度的均數(shù)為 208.33μm,標(biāo)準(zhǔn)差為67.07μm。試估計(jì)該地腎虛失鈉型哮喘病人甲皺微循環(huán)管袢長度總體均數(shù)的 95%CI。本例n=
12,
=208.33,s=67.07,= =19.36ν=n-1=12-1=11。查t界值表得t0.05/2,11=2.201,按公式求得:95%CI=208.33±2.201×19.36=(165.72,250.94)該地腎虛失鈉型哮喘病人甲皺微循環(huán)管袢長度總體均數(shù)的 95%CI為165.72~250.94μm3.可信區(qū)間的要素(1)準(zhǔn)確度:是CI包含總體參數(shù)的概率大小, 用可信度的大小 1-α表示。可信度越接近 1,可信程度越高,準(zhǔn)確度越高。如可信度 99%比95%可信程度高。(2)精密度:是對總體參數(shù)的估計(jì)范圍或長度的度量,反映在 CI即長度愈小愈精密。每一次估計(jì)間的差異越小, CI愈小,即CI的長度越小,其估計(jì)的精密度越高。4.可信區(qū)間的特點(diǎn)1)當(dāng)n確定后,CI范圍的大小與可信度1-α的高低呈正比,與估計(jì)結(jié)果的精密度呈反比。2)當(dāng)可信度1-α確定后,n的大小與CI范圍的大小呈反比;與估計(jì)結(jié)果的精密度呈正比。因?yàn)樵黾訕颖纠龜?shù)會(huì)減小標(biāo)準(zhǔn)誤,使CI的范圍縮小。CI的范圍越小,真實(shí)值靠近點(diǎn)估計(jì)值的可能性越大,靠近CI邊緣的可能性越小,估計(jì)的精確度也隨之提高,其統(tǒng)計(jì)效力就越大。5.可信區(qū)間與可信限的關(guān)系CI為某一整體內(nèi)的一個(gè)分段,是以上、下可信限為界的開區(qū)間 (不包含界值在內(nèi) )。CUCL是CI的上下兩個(gè)界值。如95%CI為(165.6,251.0)μm。165.6μm是CI的下限(L),251.0μm為CI的上限(U)。6.CI與參考值范圍的比較1)可信區(qū)間:是參數(shù)的估計(jì)范圍,需用標(biāo)準(zhǔn)誤(SE)計(jì)算,表示總體指標(biāo)的可能范圍。2)參考值范圍:表示大多數(shù)正常人的解剖、生理、生化某項(xiàng)指標(biāo)的波動(dòng)范圍,需用標(biāo)準(zhǔn)差計(jì)算,用于判斷觀察對象的某項(xiàng)指標(biāo)正常與否。假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的概念與分類(統(tǒng)計(jì)概念:亦稱顯著性檢驗(yàn),是利用樣本信息,根據(jù)一定的概率水準(zhǔn),推斷樣本指標(biāo))與總體指標(biāo)(參數(shù))、不同樣本指標(biāo)間的差別有無意義的統(tǒng)計(jì)分析方法。(一)參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)1.參數(shù)檢驗(yàn)概念:依賴總體分布的具體形式的統(tǒng)計(jì)方法, 簡稱參數(shù)法。常用的參數(shù)法有 χ2檢驗(yàn)、t檢驗(yàn)、F檢驗(yàn)等。使用條件是抽樣總體的分布已知。優(yōu)點(diǎn):能充分利用樣本信息; 檢驗(yàn)效率較高。 缺點(diǎn):應(yīng)用條件限制較多。2.非參數(shù)檢驗(yàn) 概念:一類不依賴總體分布的具體形式的統(tǒng)計(jì)方法。如 Ridit分析、秩和檢驗(yàn)、符號(hào)檢驗(yàn)、中位數(shù)檢驗(yàn)、序貫試驗(yàn)、等級(jí)相關(guān)分析等。優(yōu)點(diǎn):①對總體的分布形式不要求;②可用于不能精確測量的資料;③易于理解和掌握;④計(jì)算簡便。缺點(diǎn):不能充分利用資料所提供的信息,使檢驗(yàn)效率降低。(二)單因素分析與多因素分析1.單因素分析——亦稱一元分析,是在主要的非處理因素相同的條件下,不管影響結(jié)果的處理因素(如病人年齡、病情、辯證分型、病理類型、藥物劑型、用藥途徑、療程等)有多少,每次僅分析一個(gè)處理因素與效應(yīng)之間關(guān)系的統(tǒng)計(jì)方法。2.多因素分析—— 亦稱多變量分析或多元分析, 是研究多因素和多指標(biāo)之間的關(guān)系以及具有這些因素的個(gè)體之間關(guān)系的一種統(tǒng)計(jì)分析方法。二、 假設(shè)檢驗(yàn)的基本思想先假設(shè)差別由抽樣造成,即總體間本無差異,在此假設(shè)成立的前提下做抽樣研究,如果該次抽樣屬小概率事件,則樣本信息不支持原假設(shè)的成立,拒絕它。三、假設(shè)檢驗(yàn)的基本步驟例題:根據(jù)大量調(diào)查,已知健康成年男子的脈搏均數(shù)為 72次/分。某醫(yī)生在某醫(yī)院隨機(jī)調(diào)查30名脾虛男子,求得脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為7.5次/分。脾虛病人的脈搏是正態(tài)分布,問脾虛男子的脈搏均數(shù)與一般成年男子的脈搏均數(shù)是否相等?分析:把一般成年男子的脈搏均數(shù)看作一個(gè)總體均數(shù),脾虛男子的脈搏均數(shù)為樣本均數(shù)。0=72,n=30,X=74.2,s=7.5。0≠的原因:①抽樣誤差所致。②脾虛致兩個(gè)均數(shù)間有本質(zhì)性差異。1.建立假設(shè)、確定檢驗(yàn)水準(zhǔn)⑴無效假設(shè):記為H0,即樣本均數(shù)所代表的總體均數(shù)μ與已知的總體均數(shù)μ0相等。樣本均數(shù)與μ0的差異是由抽樣誤差引起,無統(tǒng)計(jì)學(xué)意義。⑵備擇假設(shè):記為H1,即樣本均數(shù)所代表的總體均數(shù)μ與μ0不相等,樣本均數(shù)與μ0的差異是本質(zhì)性差異,有統(tǒng)計(jì)學(xué)意義。假設(shè)檢驗(yàn)有雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)H0:μ=μ0,H1:μ≠μ0若目的是推斷兩總體均數(shù)是否不等,應(yīng)選用雙側(cè)檢驗(yàn)。若從專業(yè)知識(shí)已知不會(huì)出現(xiàn)μ<μ0(或μ>μ0)的情況,則選用單側(cè)檢驗(yàn)。H0:μ=μ0,H1:μ<μ0(或μ>μ0)確定檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)亦稱顯著性水準(zhǔn),符號(hào)為α,是事先規(guī)定的對假設(shè)成立有否作出判斷的根據(jù)。α常取0.05或0.01。2.選擇檢驗(yàn)方法、計(jì)算統(tǒng)計(jì)量根據(jù):①研究目的,②資料的類型和分布,③設(shè)計(jì)方案,④統(tǒng)計(jì)方法的應(yīng)用條件,⑤樣本含量大小等;選擇適宜的統(tǒng)計(jì)方法并計(jì)算出相應(yīng)的統(tǒng)計(jì)量。3.確定P值、做出推論獲得等于及大于(和/或假設(shè)檢驗(yàn)中的P值是指在由無效假設(shè)所規(guī)定的總體作隨機(jī)抽樣,等于及小于)現(xiàn)有統(tǒng)計(jì)量的概率。即各樣本統(tǒng)計(jì)量的差異來自抽樣誤差的概率,它是判斷H0成立與否的依據(jù)。確定P值的方法主要有兩種⑴查表法根據(jù)檢驗(yàn)水準(zhǔn)、樣本自由度直接查相應(yīng)的界值表求出P值。⑵計(jì)算法用特定的公式直接求出P值。推論:若P>α,就沒有理由懷疑H0的真實(shí)性,則結(jié)論為不拒絕H0,做出不否定此樣本是來自于該總體的結(jié)論,也即差別無顯著性意義;若P≤α,則拒絕 H0,接受H1,也就是說這些統(tǒng)計(jì)量來自不同的總體,其差別不能由抽樣誤差來解釋,下結(jié)論為差別有顯著性意義。t檢驗(yàn)以t分布為理論基礎(chǔ), 對一個(gè)或兩個(gè)樣本的數(shù)值變量資料進(jìn)行假設(shè)檢驗(yàn)常用的方法, 屬于參數(shù)檢驗(yàn)。第二節(jié) 單樣本 t檢驗(yàn)概念: 亦稱樣本均數(shù)與總體均數(shù)比較的 t檢驗(yàn)。用于從正態(tài)總體中獲得含量為 n的樣本,算得均數(shù)和標(biāo)準(zhǔn)差,判斷其總體均數(shù) μ是否與某個(gè)已知總體均數(shù) μ0相同。已知總體均數(shù)一般為標(biāo)準(zhǔn)值、理論值或經(jīng)大量觀察得到的較穩(wěn)定的指標(biāo)值。一、適用條件: 1.對正態(tài)分布的數(shù)值變量資料,需用t檢驗(yàn)。2.對于非正態(tài)分布的資料, 若經(jīng)過變量變換使成正態(tài)分布, 可按t檢驗(yàn)處理;否則,用非參數(shù)檢驗(yàn)的方法。二、正態(tài)性檢驗(yàn)的方法檢驗(yàn)假設(shè)H0為總體分布是正態(tài)分布,當(dāng)P>α?xí)r,不拒絕H0,認(rèn)為樣本所來自的總體服從正態(tài)分布;而P≤α?xí)r,拒絕H0,認(rèn)為樣本所來自的總體不服從正態(tài)分布。1.W檢驗(yàn) Shapiro-Wilk檢驗(yàn)是基于次序統(tǒng)計(jì)量對它們期望值的回歸而構(gòu)成的。所用檢驗(yàn)統(tǒng)計(jì)量為W,又稱為W檢驗(yàn)。在樣本量3≤n≤50時(shí)使用。2.D檢驗(yàn) Kolmogorov-Smirnov檢驗(yàn)的統(tǒng)計(jì)量為 D,所以也稱 D檢驗(yàn),在樣本量 50≤n≤1000時(shí)使用。三、計(jì)算公式, ,ν=n-1式中 為樣本均數(shù),μ為總體均數(shù),n為樣本含量,s為樣本標(biāo)準(zhǔn)差, ν為自由度。四、檢驗(yàn)步驟1.建立假設(shè)、確定檢驗(yàn)水準(zhǔn) H0:μ=μ0,H1:μ≠μ0 ,α=0.052.選擇檢驗(yàn)方法、計(jì)算統(tǒng)計(jì)量3.確定P值、做出推論=30-1=29,查t值表,t0.05/2,29=2.045,t=1.607<t0.05/2,29,P>0.05。按α=0.05水準(zhǔn),不拒絕 H0,根據(jù)現(xiàn)有樣本信息,不能認(rèn)為脾虛男子脈搏數(shù)與健康人不同第三節(jié) 配對設(shè)計(jì)資料均數(shù)的 t檢驗(yàn)配對設(shè)計(jì)——將觀察單位按照某些特征(如性別、年齡、病情等可疑混雜因素)配成條件相同或相似的對子,每對中的兩個(gè)觀察單位隨機(jī)分配到兩個(gè)組,給予不同的處理,觀察指標(biāo)的變化。①同一觀察單位實(shí)驗(yàn) (或治療)前后的比較;② 同一樣品用兩種方法檢驗(yàn)結(jié)果的比較;③配對的兩個(gè)觀察單位分別接受兩種處理后的數(shù)據(jù)比較。配對t檢驗(yàn)配對t檢驗(yàn)——又稱成對t檢驗(yàn), 是將對子差數(shù) d看做變量,先假設(shè)兩種處理的效應(yīng)相同,1—μ2=0,無顯著性,推斷兩種處理因素的效果有無差別或某處理因素有無作用。由于此種設(shè)計(jì)使影響結(jié)果的非被試因素相似或相同,因而提高了研究效率。一、適用條件: 1.設(shè)計(jì)類型是配對設(shè)計(jì)。 2.數(shù)值變量的對子差值是正態(tài)分布。二、計(jì)算公式ν=n-1,式中d為各個(gè)對子數(shù)值的差數(shù), 為差數(shù)的平均數(shù) , 為差數(shù)的標(biāo)準(zhǔn)差,為差數(shù)的標(biāo)準(zhǔn)誤,n為對子數(shù)。三、檢驗(yàn)步驟例題:對10名患者分別用濕式熱消化-雙硫腙法和硝酸-高錳酸鉀冷消化法測定尿鉛,問兩法測得結(jié)果有無差別。用兩種方法測定尿鉛結(jié)果(μmol/L)患者號(hào)冷消化法熱消化法差值dd212.412.80-0.390.1521212.0711.240.830.688932.903.04-0.140.019641.641.83-0.190.036152.751.880.870.756961.061.45-0.390.152173.233.43-0.200.0480.770.92-0.150.022593.673.81-0.140.0196104.494.010.480.2304合計(jì)0.582.1181.建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ=μ0,H1:μ≠μ0,α=0.05計(jì)算統(tǒng)計(jì)量t值先計(jì)算差值 d及d2(如表),得 ∑d=0.58, ∑d2=2.1182計(jì)算差值的標(biāo)準(zhǔn)誤3.確定P值、做出推論ν=n-1=10-1=9,查t界值表,得雙側(cè) t0.05/2,9=2.262,本例 t<t0.05/2,9,P>0.05。按α=0.05水準(zhǔn),不拒絕 H0,不能認(rèn)為兩法測定尿鉛結(jié)果有差別。第四節(jié)獨(dú)立樣本 t檢驗(yàn)與t′檢驗(yàn)獨(dú)立樣本資料——是在兩個(gè)總體里分別隨機(jī)抽樣,或?qū)⑼豢傮w里抽取的觀察對象隨機(jī)分為兩組,采取不同的處理得到的資料。獨(dú)立樣本t檢驗(yàn)——亦稱兩樣本t檢驗(yàn)或成組t檢驗(yàn)。與t′檢驗(yàn)均適用于完全隨機(jī)化設(shè)計(jì)兩獨(dú)立樣本的比較,目的是推斷兩獨(dú)立樣本均數(shù)所代表的未知總體均數(shù)μ1與μ2是否有差別。一、獨(dú)立樣本的方差齊性檢驗(yàn)方差齊性——兩個(gè)樣本均數(shù)的假設(shè)檢驗(yàn),除了要求樣本資料來自正態(tài)分布或近似正態(tài)分布,還要求兩個(gè)樣本的總體方差相等。(一)應(yīng)用條件:兩個(gè)樣本均來自正態(tài)分布的總體。(二)計(jì)算公式:統(tǒng)計(jì)量F為較大的方差與較小的方差的比值。F=s12/s22,ν1=n1-1,ν2=n2-1(三)檢驗(yàn)步驟20例例題:某醫(yī)師要觀察自擬中藥方“降脂膠囊”對高血脂癥的療效,將診斷為高血脂的病人隨機(jī)分為兩組,一組用上述中藥治療,另一組用西藥治療,3個(gè)月后測量血清膽固醇含量(mmol/L如下,已知兩組血清膽固醇含量均服從正態(tài)分布,試比較兩藥降低膽固醇的效果有無差別。1.建立檢驗(yàn)假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:兩總體方差相等H1:兩總體方差不相等α=0.10(α較大以減少 II類錯(cuò)誤)2.選擇檢驗(yàn)方法、計(jì)算統(tǒng)計(jì)量2 2中藥組S=0.580;西藥組S=0.4662 2F=s1/s2=0.580/0.466=1.2453.確定P值、做出推論ν1=n1-1=10-1=9,ν2=n2-1=10-1=9,查F界值表(方差齊性檢驗(yàn)用),得F0.05(9,9)=4.03,F(xiàn)<F0.05(9,9),P>0.05。在=0.05水準(zhǔn)下不拒絕 H0,認(rèn)為中藥組與西藥組的血清膽固醇總體方差齊。二、獨(dú)立樣本 t檢驗(yàn)(一)應(yīng)用條件: 1.樣本個(gè)體測量值相互獨(dú)立,即
獨(dú)立性。2.兩個(gè)樣本所代表的總體均數(shù)服從正態(tài)分布,即3.總體方差相等,即 方差齊性。
正態(tài)性。(二)計(jì)算公式先求出合并方差
,再求出兩均數(shù)之差的標(biāo)準(zhǔn)誤,最后算出統(tǒng)計(jì)量
t值。(三)檢驗(yàn)步驟1.建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ1=μ2 H1:μ1≠μ2α=0.052.選擇檢驗(yàn)方法、計(jì)算統(tǒng)計(jì)量本例n1=10, =5.247,s1=0.762;n2=10, =5.537,s2=0.683 =0.5243.確定P值、做出推論ν=10+10-2=18,查t界值表 ,得t0.05,18=2.101,t<t0.05,18,P>0.05。按α=0.05水準(zhǔn),不拒絕H 0。兩藥降低膽固醇效果的差別無統(tǒng)計(jì)學(xué)意義。三、t′檢驗(yàn)成組樣本均數(shù)的比較,若方差不齊,可以采取 3種方式處理:①經(jīng)過數(shù)據(jù)變換使方差齊,然后進(jìn)行 t檢驗(yàn);②采用近似 t檢驗(yàn)——t′檢驗(yàn);③基于秩次的非參數(shù)檢驗(yàn)方法。例題:由X光片上測得兩組病人肺門橫徑右側(cè)距 R1值(cm),結(jié)果如下,請先檢驗(yàn)兩組的總體方差是否相等,然后進(jìn)行假設(shè)檢驗(yàn)。肺癌病人 矽肺0期病人(一)方差齊性檢驗(yàn)1.建立假設(shè)、確定檢驗(yàn)水準(zhǔn)。H0:兩總體方差相等 H1:兩總體方差不相等α=0.102.計(jì)算統(tǒng)計(jì)量 F值2222=10.27F=s1(較大)/s2(較?。?1.79/0.563.確定P值,作出統(tǒng)計(jì)推論F界值表,ν1=n1—1=9,ν2=n2—1=49,F(xiàn)0.1(9,50)=2.07。今F=10.217>F0.1(9,50),故P<0.1。按α=0.10水準(zhǔn),拒絕H0,接受H1,可認(rèn)為兩總體方差不齊。(二)t′檢驗(yàn)的公式ν1
=n1-1
ν2
=n2-1(三)t′檢驗(yàn)的步驟1.建立假設(shè)、確定檢驗(yàn)水準(zhǔn)。H0:兩總體R1值相等
H1:兩總體
R1值不相等α=
0.052.計(jì)算統(tǒng)計(jì)量查t值表得:t0.05/2,9=2.262 t0.05/2,49=2.0093.確定P值,作出統(tǒng)計(jì)推論t′=3.272>t′0.05=2.257,P按α=0.05水準(zhǔn),拒絕H0,接受
<0.05。H1,可認(rèn)為兩組病人的
R1值不等。假設(shè)檢驗(yàn)的兩類錯(cuò)誤和注意事項(xiàng)Ⅰ型錯(cuò)誤——指拒絕了實(shí)際上成立的 H0,即“棄真”的錯(cuò)誤。H0成立的前提下,由于抽樣誤差,得到的t>t0.05(ν),按α=0.05水準(zhǔn)拒絕H0,則犯了Ⅰ型錯(cuò)誤。確定以tα為臨界值時(shí),犯Ⅰ型錯(cuò)誤的概率就是α。Ⅱ型錯(cuò)誤——指接受了實(shí)際上不成立的H0,即“存?zhèn)巍钡腻e(cuò)誤。在實(shí)際上H1成立的前提下,由于抽樣的偶然性得到了較小的t值,若t<t0.05(ν),則按α=0.05的水準(zhǔn)接受H0,這就犯了Ⅱ型錯(cuò)誤,Ⅱ型錯(cuò)誤的概率用β表示。四、應(yīng)用假設(shè)檢驗(yàn)的注意事項(xiàng)1.事先進(jìn)行嚴(yán)密的研究設(shè)計(jì)。2.預(yù)先確定單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)。3.靈活確定α水準(zhǔn)。4.選擇正確的統(tǒng)計(jì)方法。5.正確理解推斷結(jié)論的意義。6.結(jié)論的描述應(yīng)完整,不能絕對化。 7.結(jié)合專業(yè)知識(shí)做出推論。方差分析方差分析——又稱 F檢驗(yàn) 或變異數(shù)分析。是在不增加第一類錯(cuò)誤概率的情況下,用于檢驗(yàn)多組樣本均數(shù)差異有無顯著性的統(tǒng)計(jì)分析方法。方差分析的應(yīng)用:完全隨機(jī)設(shè)計(jì)資料的單因素 F檢驗(yàn);隨機(jī)區(qū)組設(shè)計(jì)資料的兩因素 F檢驗(yàn);析因設(shè)計(jì)、拉丁方設(shè)計(jì)、嵌套設(shè)計(jì)、裂區(qū)設(shè)計(jì)、交叉設(shè)計(jì)資料的多因素方差分析;單因素重復(fù)測量、 雙因素重復(fù)測量資料的 F檢驗(yàn);ANOVA與回歸分析相結(jié)合的協(xié)方差分析。第一節(jié)F檢驗(yàn)概述一、因素與水平因素——也稱為處理因素。即對試驗(yàn)指標(biāo)有影響的名義分類變量,在研究中加以考慮(控制)的試驗(yàn)條件。水平——也稱“處理組”。是每個(gè)因素的不同狀態(tài),也就是質(zhì)量上的或數(shù)量上的差別。因素是一個(gè)抽象的概念,而水平則是一個(gè)較為具體的概念。二、對多樣本均數(shù)重復(fù)進(jìn)行t檢驗(yàn)的風(fēng)險(xiǎn)性當(dāng)有多個(gè)均數(shù)比較時(shí),例如有k組均數(shù),采用多重t檢驗(yàn),會(huì)導(dǎo)致犯I類錯(cuò)誤的機(jī)率增大。若要進(jìn)行k個(gè)均數(shù)間差異的比較,將會(huì)使用m=k(k-1)/2次t檢驗(yàn)。假定其檢驗(yàn)的顯著性概率水平為α’,則其實(shí)際上所執(zhí)行的顯著性概率水平為α=1-(1-α’)m例題:4個(gè)均數(shù)(k=4),完成所有4個(gè)均數(shù)間差異的顯著性檢驗(yàn)要進(jìn)行m=(4)(4-1)/2=6次t檢驗(yàn)。若在α’=0.05的顯著性水平上進(jìn)行檢驗(yàn),其實(shí)際上犯I類錯(cuò)誤的概率α不是0.05,而是α=1-(1-0.05)6=0.2649。三、F檢驗(yàn)的應(yīng)用條件:1.各樣本是相互獨(dú)立的隨機(jī)樣本。2.各樣本所來自的總體均服從正態(tài)分布。3.各樣本所來自的總體方差相等,即方差齊。此外,樣本均數(shù)比較的F檢驗(yàn)方法與實(shí)驗(yàn)設(shè)計(jì)類型密切相關(guān)。四、F檢驗(yàn)的基本思想——分析變異,即將所有測量值間的總變異按照其變異的來源分解為多個(gè)部分,通過比較不同來源的變異推斷各處理組間的差異有無統(tǒng)計(jì)學(xué)意義。實(shí)質(zhì)上是關(guān)于觀測值變異原因的數(shù)量分析。例題:將40只接種腫瘤的小白鼠隨機(jī)分為4組,給予不同劑量的三菱莪術(shù)注射液,半月后稱量瘤重,其數(shù)據(jù)見下表。表中1組為接種后不加任何處理,2、3、4組分別為接種后注射0.5ml、1.0ml和1.5ml三菱莪術(shù)液。試比較各組瘤重間有無差別?三菱莪術(shù)液抑癌實(shí)驗(yàn)的小鼠瘤重(g)實(shí)驗(yàn)號(hào)1組2組3組4組13.63.00.43.324.52.31.71.295.02.62.11.2104.51.32.52.1Σxi46.62524.618.7114.9(Σx)2226.3270.373.1447.032Σxi416.79(Σx)ni1010101040(N)4.662.502.461.872.87()Si1.010.931.181.161.總變異——將4組綜合起來看,40只小鼠的瘤重有差異,稱為總變異,用總的離均差平方和表示。2.組間變異從表中可見,4組小鼠瘤重的均數(shù)有差別,稱為 組間變異,用離均差平方和 (SS組間)表示。造成組間變異的原因是: ①處理差異:即藥物及其不同劑量對瘤重有影響造成了各組均數(shù)不同。 ②個(gè)體差異:即小鼠的個(gè)體因素造成各組均數(shù)不同。式中i表示組別。3.組內(nèi)變異從各組內(nèi)部看,同一種處理的 10只小鼠的瘤重仍有差異,稱為 組內(nèi)變異,用組內(nèi)離均差平方和(SS組內(nèi))表示。造成組內(nèi)變異的原因只是個(gè)體因素。三種變異的關(guān)系:4.均方(MS)——由于離均差平方和并不能真正體現(xiàn)變異度,還應(yīng)考慮其自由度,故可用 SS與自由度之比值,即均方 (MS)表示組間變異和組內(nèi)變異。5.F值——檢驗(yàn)均數(shù)是否存在處理差異時(shí),可用 MS組間與MS組內(nèi)比值—F值判斷。如無處理差異存在,造成組間變異和組內(nèi)變異的原因均為個(gè)體差異,則理論上 F=1。由于兩者的計(jì)算途徑不同, F值實(shí)際上不一定等于 1,但不應(yīng)過大。如果 F值過大,大于F值的理論分布界值,即可認(rèn)為存在處理差異。F檢驗(yàn)的基本思想: 把全部觀察值之間的總變異,根據(jù)不同的設(shè)計(jì)分解成兩個(gè)或多個(gè)部分,例如完全隨機(jī)設(shè)計(jì)分解成組間和組內(nèi)兩部分, 隨機(jī)區(qū)組設(shè)計(jì)分解成處理組間、區(qū)組間和誤差 (相當(dāng)于組內(nèi))三部分,求出反映各部分變異的指標(biāo) MS及F值,然后根據(jù) F值與理論界值比較,在 α水準(zhǔn)上作出相應(yīng)的統(tǒng)計(jì)學(xué)判斷。第二節(jié) 完全隨機(jī)設(shè)計(jì)資料的 F檢驗(yàn)(單因素方差分析)完全隨機(jī)設(shè)計(jì) ——將全體觀察對象按隨機(jī)化方法分配到兩組或多組中, 每個(gè)觀察單位接受每種處理的機(jī)會(huì)均等。本設(shè)計(jì)是一種單因素兩水平或多水平的設(shè)計(jì)類型。因素可視為分組因素,水平可視為組數(shù)。單因素方差的計(jì)算公式變異 離均差平方和 SS 自由度df 均方MS FN-1K-1N-k1.建立假設(shè)檢驗(yàn) 2.計(jì)算統(tǒng)計(jì)量3.確定P值及統(tǒng)計(jì)推斷F=12.99>F0.05(3,36)=2.86,P<0.05在α=0.05水平上拒絕H0,接受H1??梢哉J(rèn)為4個(gè)劑量組小鼠的瘤重不同或不全相同。例題:三種不同給藥方式測得食管癌患者腫物處放射性活度比較靜脈點(diǎn)滴PYM食管腫物處注入PYM食管腫物處注入PYM-CH合計(jì)0.191.345.360.211.044.980.661.055.080.441.044.780.371.275.450.581.144.880.340.935.100.241.294.980.271.464.880.291.495.010.551.124.850.181.524.95N12121236∑X4.3214.4960.3079.11∑X21.847817.9433303.4516323.24271.建立假設(shè)檢驗(yàn)2.計(jì)算統(tǒng)計(jì)量3.查表及統(tǒng)計(jì)推斷F=2064.2786>F0.05(2,33)=3.285,P<0.05在α=0.05水平上拒絕 H0,接受H1。可認(rèn)為不同給藥方式患者腫物處放射性活度不同。第三節(jié) 隨機(jī)區(qū)組設(shè)計(jì)資料的 F檢驗(yàn)(兩因素方差分析)隨機(jī)區(qū)組設(shè)計(jì) ——在醫(yī)學(xué)科研中較為常見, 是通過分層將全部受試對象按某種或某些特征分為若干個(gè)區(qū)組,每個(gè)區(qū)組內(nèi)研究對象的特征盡可能相近,每個(gè)區(qū)組內(nèi)的觀察對象與處理因素的水平數(shù)相等,分別使每個(gè)區(qū)組內(nèi)的觀察對象隨機(jī)地接受處理因素某一水平的處理。隨機(jī)區(qū)組設(shè)計(jì)包括:1)對同一觀察單位進(jìn)行多次觀察,同一觀察單位的多次數(shù)據(jù)就成為一個(gè)配伍組。2)同一樣本給予不同處理的比較。3)將條件相近的多個(gè)觀察單位配成一組(配伍組),然后將每一配伍組的對象隨機(jī)地分配到各處理組中。隨機(jī)區(qū)組設(shè)計(jì)是雙因素多水平的設(shè)計(jì),它除了推斷k個(gè)樣本所代表的總體均數(shù)1,2,3,,是否相等外,還要推斷b個(gè)區(qū)組所代表的總體均數(shù)是否相等。由于從總變異中分離出配伍組變異,考慮了個(gè)體變異對處理的影響,使誤差更能反映隨機(jī)誤差的大小,提高了研究效率。變異來源νMSSSF總N-1處理間k-1配伍間b-1誤差ν總-ν處-ν配例題:將36只雌性大白鼠按月齡相同、體重接近分為12個(gè)配伍組。并將每組三只大白鼠隨機(jī)分到三個(gè)不同雌激素劑量組,經(jīng)一段時(shí)間注射后的子宮質(zhì)量如下表。問(1)接受不同劑量注射的大白鼠子宮質(zhì)量是否相同?(2)不同配伍組間的大白鼠子宮質(zhì)量是否相同?區(qū)組劑量(mg/100g)合計(jì)0.20.40.81831001092922647811125336979149297454781382705879512831065985154298770701172578649611727795911012329210651111283041158841492911262106114282合計(jì)7941092153734231.建立假設(shè)、確定檢驗(yàn)水準(zhǔn)2.計(jì)算統(tǒng)計(jì)量ν誤差=ν總-ν處-ν配=35-2-11=223.確定P值、統(tǒng)計(jì)推斷F處理=53.48>F(2,22)=3.44,P<0.05,在α=0.05水平上拒絕H0,接受H1,可以認(rèn)為注射不同劑量雌激素后大鼠子宮質(zhì)量不同或不全相同。(2)F配伍=0.49<F(11,22)=2.26,P>0.05,在α=0.05水平上不拒絕鼠子宮質(zhì)量不同。
H0,尚不能認(rèn)為不同區(qū)組的大第四節(jié) 多個(gè)樣本均數(shù)間的多重比較F檢驗(yàn)結(jié)果若為拒絕H0,接受H1,則可認(rèn)為所比較的各組總體均數(shù)不等或不全相等,但不能認(rèn)為每兩個(gè)總體均數(shù)之間都不相等。如需進(jìn)一步了解哪兩個(gè)總體均數(shù)不等,哪兩個(gè)總體均數(shù)相等,可進(jìn)一步作多個(gè)樣本均數(shù)間的兩兩比較,又稱多重比較。多重比較分為兩種情況:一種是每兩組之間均需比較;另一種是多個(gè)實(shí)驗(yàn)組與一個(gè)對照組比較,實(shí)驗(yàn)組間無須比較。多組均數(shù)間的兩兩比較的方法較多,本節(jié)介紹每兩組之間均需比較的方法--q檢驗(yàn),又稱SNK法。Q檢驗(yàn)的計(jì)算公式分子為比較的兩個(gè)均數(shù)的差,MS組內(nèi)為F檢驗(yàn)中的組內(nèi)均方,如為隨機(jī)區(qū)組設(shè)計(jì)資料,則用MS誤差。nA與nB為比較的兩個(gè)樣本的觀察例數(shù)。例題:1.建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μA=μBH1:μA≠μBα=0.052.將樣本均數(shù)從大到小重新排列組次1234均數(shù)4.662.502.461.87組別12343.計(jì)算q值分母(兩均數(shù)之差標(biāo)準(zhǔn)誤)本例ni相等,故可先求出。前已求得MS組內(nèi)=1.157,代入公式求q值分母,得=0.344.列出計(jì)算表列出對比組(A與B),求出兩均數(shù)之差、組數(shù)(a)及q值,并將q界值和p值一并列表。在確定臨界值時(shí),將被比較的兩個(gè)均數(shù)在 k個(gè)均數(shù)間的跨距作為一個(gè)參數(shù)記為 a(組數(shù))。確定不同跨距情況下均數(shù)間差異比較的臨界值。q檢驗(yàn)中用所要的臨界值不是惟一值, 而是多個(gè)值,在整體原假設(shè)基礎(chǔ)上對 I型錯(cuò)誤α實(shí)施了控制。結(jié)果:經(jīng)q檢驗(yàn)顯示,3個(gè)藥物組與對照組的瘤重均數(shù)比較,P< 0.05,差別均有顯著性; 3個(gè)藥物組之間的瘤重比較,P> 0.05,差別無顯著性。藥物有抑制腫瘤生長的作用; 而3個(gè)劑量組之間瘤重均數(shù)差別則無顯著性。第五節(jié)重復(fù)測量資料的F檢驗(yàn)重復(fù)測量資料——同一受試對象的同一觀察指標(biāo)在不同時(shí)間點(diǎn)上進(jìn)行多次測量所得的資料,常用來分析該觀察指標(biāo)在不同時(shí)間點(diǎn)上的變化特點(diǎn)。(或部位)越由于同一受試對象不同時(shí)間的數(shù)據(jù)間往往有一定的相關(guān)關(guān)系,而且時(shí)間間隔接近,相關(guān)關(guān)系越密切。因此重復(fù)測量資料的F檢驗(yàn)與隨機(jī)區(qū)組設(shè)計(jì)的F檢驗(yàn)不同。例題:為了對比某種藥物的膠囊型(k=1)和片劑型(k=2)在體內(nèi)的代謝速度,將16名受試對象隨機(jī)等分成兩組,每組8人。一組給予膠囊,另一組給予片劑,分別在服藥后1、2、4、6及8h測定血中的藥物濃度。重復(fù)測量資料和隨機(jī)區(qū)組設(shè)計(jì)資料的區(qū)別:⑴重復(fù)測量資料中同一受試對象 (看成區(qū)組)的數(shù)據(jù)高度相關(guān),無論哪位受試對象服用片劑或是膠囊,其服藥后 1h、2h、4h、6h和8h的血藥濃度均和前面時(shí)間點(diǎn)的血藥濃度相關(guān)。⑵重復(fù)測量資料中的處理因素在受試對象間為隨機(jī)分配, 但受試對象內(nèi)的各時(shí)間點(diǎn)往往是固定的,不能隨機(jī)分配;隨機(jī)區(qū)組設(shè)計(jì)資料中每個(gè)區(qū)組內(nèi)的受試對象彼此獨(dú)立, 處理只在區(qū)組內(nèi)隨機(jī)分配,同一區(qū)組內(nèi)的受試對象接受的處理各不相同。一、離均差平方和與自由度的分解兩因素重復(fù)測量資料 (1)橫向分組的受試對象間的變異。分為處理因素 K(在此為劑型的變的總變異包括: 異和個(gè)體間誤差的變異兩部分(2)縱向分組的受試對象內(nèi)的變異。分為時(shí)間因素 I的變異、處理K和時(shí)間I的交互作用(KI)以及個(gè)體內(nèi)誤差的變異三部分。
)計(jì)算公式:SS總=SS受試對象間+SS受試對象內(nèi) =(SS處理+SS個(gè)體間誤差)+(SS時(shí)間+SS處理與時(shí)間交互+SS個(gè)體內(nèi)誤差)ν總=ν受試對象間+ν受試對象內(nèi)=(ν處理+ν個(gè)體間)+(ν時(shí)間+ν處理與時(shí)間交互+ν個(gè)體內(nèi))1.建立檢驗(yàn)假設(shè)、確定檢驗(yàn)水準(zhǔn)處理因素KH0:不同劑型(片劑和膠囊)的血藥濃度相同H1:不同劑型(片劑和膠囊)的血藥濃度不同α=0.05。時(shí)間因素 IH0:服藥后不同時(shí)間血藥濃度的總體均數(shù)全相等H1:服藥后不同時(shí)間血藥濃度的總體均數(shù)不全相α=0.05。交互作用KIH0:藥物劑型 K和時(shí)間I無交互效應(yīng)H1:藥物劑型 K和時(shí)間I有交互效應(yīng)α=0.05。2.選擇檢驗(yàn)方法、計(jì)算統(tǒng)計(jì)量3.確定P值、做出推論以求F值時(shí)的分子自由度νl、分母自由度ν2查附表5的F界值表得相應(yīng)P值,或直接由計(jì)算機(jī)所給P值做出推斷結(jié)論。本例按0.05水準(zhǔn),藥物劑型 K,劑型K與時(shí)間I的交互效應(yīng) KI均不拒絕 H0,無統(tǒng)計(jì)學(xué)意義,還不能認(rèn)為藥物不同劑型的血藥濃度不同,也還不能認(rèn)為劑型K與時(shí)間I間有交互效應(yīng)。而時(shí)間因素I拒絕H0,接受H1,差異有顯著的統(tǒng)計(jì)學(xué)意義,可認(rèn)為服用藥物后不同時(shí)間(1h、2h、4h、6h和8h)的血藥濃度不同或不全相同。分類變量資料的統(tǒng)計(jì)描述分類變量資料—— 是按研究對象的性質(zhì)、 類別或等級(jí)分組,清點(diǎn)各組觀察單位的數(shù)目得到的資料。絕對數(shù)——又稱總量指標(biāo)。 是指某現(xiàn)象實(shí)際發(fā)生的絕對水平, 表示被描述對象的規(guī)模。 是制定工作計(jì)劃、總結(jié)工作和進(jìn)行科學(xué)研究時(shí)不可缺少的基本數(shù)據(jù)。 如某病的病人數(shù)、治愈人數(shù)、死亡人數(shù)等。相對數(shù)——表示兩個(gè)有聯(lián)系的指標(biāo)之比。 從數(shù)量上反映兩個(gè)相互關(guān)聯(lián)現(xiàn)象之間的對比關(guān)系或聯(lián)系強(qiáng)度,有助于分析和闡明研究現(xiàn)象的規(guī)律性。 示事物出現(xiàn)的程度; 將絕對數(shù)指標(biāo)轉(zhuǎn)換成基數(shù)相同的相對數(shù)指標(biāo) (如每千人發(fā)病人數(shù)、每百例患者病死人數(shù)等 ),便于相互比較。第一節(jié) 相對數(shù)的種類常用的相對數(shù)有:率、構(gòu)成比、相對比一、率(rate)概念:也稱強(qiáng)度相對數(shù),是指某種現(xiàn)象在一定條件下,實(shí)際發(fā)生的觀察單位數(shù)與可能發(fā)生該現(xiàn)象的總觀察單位數(shù)之比。用以說明某種現(xiàn)象發(fā)生的頻率、強(qiáng)度和普遍程度。計(jì)算公式:醫(yī)學(xué)上常用的率: 發(fā)病率、患病率、感染率、死亡率、病死率、治愈率、有效率、生存率等。1.發(fā)病率——表示在一定期間內(nèi)一定人群中發(fā)生某病新病例的頻率。1)發(fā)病時(shí)間:出現(xiàn)客觀指標(biāo)或確診的日期。2)分子為病例數(shù)。3)時(shí)間單位一般為一年。4)分母是指可能發(fā)生該病的人群,但實(shí)際工作中常以平均人口數(shù)代之。2.患病率—— 也叫現(xiàn)患率。指某特定時(shí)間內(nèi)現(xiàn)有某病病例數(shù)與同期人口數(shù)之比。按觀察時(shí)間的不同分為時(shí)點(diǎn)患病率和期間患病率,以前者常用。1)期間患病率等于某期間開始時(shí)的患病率加上該期間的發(fā)病率。2)在人口相對穩(wěn)定時(shí),某病的發(fā)病率升高,則患病率也升高;病程延長,患病率也升高;疾病恢復(fù)快或死亡快,則患病率降低。3)患病率常用于表示病程較長的慢性病的發(fā)生或流行情況。如糖尿病、肺結(jié)核等。例題:某醫(yī)院03年在某城區(qū)隨機(jī)調(diào)查60歲以上老年人858例,發(fā)現(xiàn)高血壓病人282例。該城區(qū)60歲以上老年人高血壓患病率為:(282/858)×100%=32.87%3.死亡率——表示在一定期間(一般為一年)的一定人群中,死亡的頻率。1)分子為死亡總數(shù)算出的率叫粗死亡率;分子為因某病死亡的總數(shù)算出的率稱某病死亡率。2)常以年為時(shí)間單位,分母可用年中人口數(shù)或年初與年終人口數(shù)的平均值。3)用于衡量某一時(shí)期一個(gè)地區(qū)人群的死亡危險(xiǎn)性大小。動(dòng)態(tài)觀察可反映某地不同時(shí)期人群健康狀況和衛(wèi)生保健水平。4.病死率——表示一定時(shí)期內(nèi)(通常為一年) ,患某病的全部病人中因該病而死亡的頻率。受疾病嚴(yán)重程度、早期診斷水平和醫(yī)院治療水平的影響。1)反映疾病的嚴(yán)重程度和醫(yī)療水平。2)多用于急性傳染病。5.生存率——指在患某病的人或接受某種治療的病人中, 隨訪滿n年(通常為1、3、5年)仍存活的病人數(shù)所占的比例 。(1)反映疾病的嚴(yán)重程度。(2)常用于評(píng)價(jià)腫瘤,心血管病等慢性病的遠(yuǎn)程療效。二、構(gòu)成比(constituentratio)概念:也叫構(gòu)成指標(biāo),是指事物內(nèi)部某一組成部分的觀察單位數(shù)與該事物各組成部分的觀察單位總和之比。用以說明某一事物內(nèi)部各組成部分所占的比重或分布;也可以比較個(gè)以上相同性質(zhì)的事物各自比重的變化情況。計(jì)算公式:構(gòu)成比=特點(diǎn):1.各組成部分的構(gòu)成比之和為100%。2.某一部分比重增大,則其它部分相應(yīng)減少。例題:133例崩漏患者中醫(yī)辯證分型情況某中醫(yī)院2002年與2003年各科病床構(gòu)成比證型例數(shù)百分比(%)科別2002年2003年腎虛型4130.83病床數(shù)(%)病床數(shù)(%)肝虛型129.02內(nèi)科10033.3320050.00肝郁型3123.31外科10033.3310025.00血虛型4936.84傳染科10033.3410025.00合計(jì)133100.00合計(jì)300100.00400100.00三、相對比(relativeratio)概念:也稱比例相對數(shù)。是指兩個(gè)有聯(lián)系的指標(biāo)之比。說明兩指標(biāo)的比例關(guān)系,以倍數(shù)或百分?jǐn)?shù)表示。計(jì)算公式:相對比=A/B(或×100%)A、B可以相同,也可以不同,可以是絕式中A、B分別表示兩個(gè)總量指標(biāo)。對數(shù)、相對數(shù),也可以是平均數(shù)。例題:某市1990年12歲以下兒童乙肝病毒攜帶率為2.72%,2000年乙肝病毒攜帶率為0.52%,計(jì)算相對比。相對比=2.72%/0.52%=5.23或相對比=(0.52%/2.72%)×100%=19.12%提示該市1990年12歲以下兒童乙肝病毒攜帶率為2000年的5.23倍,或2000年12歲以下兒童乙肝病毒攜帶率為1990年的19.12%。第二節(jié) 應(yīng)用相對數(shù)的注意事項(xiàng)1.正確區(qū)分率和構(gòu)成比:構(gòu)成比是對已有的觀察結(jié)果分類。率則是在未知觀察結(jié)果的情況下先確定觀察對象的范圍,再將觀察對象按某種性質(zhì)或特征分組,統(tǒng)計(jì)各組的陽性數(shù),然后計(jì)算出各組的頻率。例:某年某地白內(nèi)障患者患病情況年齡人數(shù)病例比(%)率(%)40~5606815.1812.1450~44112928.7929.2560~29613530.1345.6170~1499721.6565.1080~22194.2586.36合計(jì)1468448100.0030.52例題:在進(jìn)行某遺傳病的研究中,一研究人員發(fā)現(xiàn),在該病患者中,90%是第一個(gè)孩子,由此可見該病的遺傳與出生順序有關(guān),更容易遺傳給第一個(gè)孩子。這個(gè)結(jié)論是否正確,為什么?2.計(jì)算相對數(shù)時(shí)分母不能太小10例,會(huì)使相一般地說,樣本含量較大,計(jì)算的相對數(shù)可靠性也較高。當(dāng)觀察例數(shù)<對數(shù)波動(dòng)較大,最好用絕對數(shù)表示。在進(jìn)行動(dòng)物實(shí)驗(yàn)時(shí),由于通過周密設(shè)計(jì)可以嚴(yán)格控制實(shí)驗(yàn)條件,每組用10只動(dòng)物得出的結(jié)果也能計(jì)算相對數(shù)。3.正確計(jì)算合計(jì)率對分組資料計(jì)算合計(jì)率(或稱平均率)時(shí),不能簡單地由各組率相加或平均求得,而應(yīng)用合計(jì)的實(shí)際數(shù)字進(jìn)行計(jì)算。P1=x1/n1,P2=x2/n2,P3=x3/n3。P=(x1+x2+x3)/(n1+n2+n3)(正確)。P=(P1+P2+P3)/3 (錯(cuò)誤)例題:用某療法治療肝炎,甲醫(yī)院治療 150例,治愈 30例,治愈率為 20%;乙醫(yī)院治療100例,治愈 30例,治愈率為 30%。兩個(gè)醫(yī)院合計(jì)治愈率應(yīng)該是 [(30+30)/(150+100)]×100%=24%。若計(jì)算為 20%+30%=50%或(20%+30%)/2=25%,則是錯(cuò)的。4.注意資料的可比性在比較相對數(shù)時(shí),除了要對比的因素(如不同的藥物)外,其余的影響因素應(yīng)盡可能相同或相近。如研究方法相同、研究對象同質(zhì)、觀察時(shí)間相等;若分組遵循隨機(jī)的原則;不同地區(qū)比較時(shí),民族、年齡、性別構(gòu)成相等,周圍環(huán)境、風(fēng)俗習(xí)慣和經(jīng)濟(jì)條件一致或相近;對比不同時(shí)期資料應(yīng)注意診斷標(biāo)準(zhǔn)一致、醫(yī)療條件相同。若要比較的兩組以上資料內(nèi)部構(gòu)成不同,需要采用率的標(biāo)準(zhǔn)化法。5.樣本率(或構(gòu)成比)的比較應(yīng)進(jìn)行差別的假設(shè)檢驗(yàn)由于抽樣誤差的存在,不能僅憑樣本率(或構(gòu)成比)數(shù)字表面相差大小下結(jié)論,應(yīng)進(jìn)行差別的顯著性檢驗(yàn)。第三節(jié) 率的標(biāo)準(zhǔn)化率的標(biāo)準(zhǔn)化——采用統(tǒng)一標(biāo)準(zhǔn)計(jì)算各率的標(biāo)準(zhǔn)化率, 使各率具有可比性, 目的是在比較總率時(shí)消除混雜因素 (即內(nèi)部構(gòu)成不同 )的影響。1.選取標(biāo)準(zhǔn)選擇具有代表性的、較穩(wěn)定的數(shù)量較大的資料為標(biāo)準(zhǔn)。如全世界、全國或本地區(qū)范圍較大人群作為標(biāo)準(zhǔn)最好。實(shí)踐中常用標(biāo)化組的合計(jì)作為標(biāo)準(zhǔn)。2.根據(jù)現(xiàn)有數(shù)據(jù)計(jì)算標(biāo)準(zhǔn)化率結(jié)果:西醫(yī)療法組標(biāo)化治愈率:P=(109/320) ×100%=34.1%中西醫(yī)結(jié)合療法組標(biāo)化治愈率:P=(121/320) ×100%=37.8%標(biāo)化后,顯示西醫(yī)療法的治愈率比中西醫(yī)結(jié)合療法低。第七章總體率的估計(jì)一、率的標(biāo)準(zhǔn)誤——即樣本率的標(biāo)準(zhǔn)差,它不但反映樣本率間的離散程度,也反映樣本率與相應(yīng)總體率間的差異,因而說明了率的抽樣誤差大小。其統(tǒng)計(jì)符號(hào)為: 式中π為總體陽性率 (總體中某現(xiàn)象的發(fā)生率 ),1-π為總體陰性率,n為樣本例數(shù)。估計(jì)標(biāo)準(zhǔn)誤—— 實(shí)際工作中, π往往未知,常以p代替,得出的標(biāo)準(zhǔn)誤稱估計(jì)標(biāo)準(zhǔn)誤。式中p為樣本陽性率,1-p為樣本陰性率,n為樣本例數(shù)。例題:1.用某方藥治療慢性肝炎160例,有效率為86.25%,求其標(biāo)準(zhǔn)誤。本例n=160,p=0.8625,1-p=1-0.8625=0.1375,2.某市隨機(jī)調(diào)查了50歲以上的中老年婦女776人,其中患有骨質(zhì)疏松者322人,患病率為41.5%,試估計(jì)該樣本頻率的抽樣誤差。本例n=776,p=0.415,1-p=1-0.415=0.585,二、總體率的估計(jì)點(diǎn)估
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版數(shù)學(xué)八年級(jí)上冊《實(shí)驗(yàn)與探究三角形中邊與角之間的不等關(guān)系》聽評(píng)課記錄
- 魯教版歷史六年級(jí)上冊第5課《夏、商、西周的興亡》聽課評(píng)課記錄
- 魯人版道德與法治九年級(jí)下冊13.1《綠水青山就是金山銀山》聽課評(píng)課記錄1
- 部審人教版八年級(jí)數(shù)學(xué)下冊聽評(píng)課記錄18.2.1 第1課時(shí)《矩形的性質(zhì)》
- 七年級(jí)上冊道德與法治第十課綻放生命之花聽課評(píng)課記錄(2課時(shí))
- 星球版地理八年級(jí)下冊《第二節(jié) 生態(tài)環(huán)境保護(hù)與資源開發(fā)》聽課評(píng)課記錄1
- 人教版歷史八年級(jí)上冊第22課《抗日戰(zhàn)爭的勝利》聽課評(píng)課記錄
- 小學(xué)五年級(jí)聽評(píng)課記錄
- 魯教版數(shù)學(xué)七年級(jí)上冊1.1《認(rèn)識(shí)三角形》聽評(píng)課記錄5
- 蘇科版數(shù)學(xué)七年級(jí)下冊聽評(píng)課記錄7.3圖形的平移1
- 四年級(jí)計(jì)算題大全(列豎式計(jì)算,可打印)
- 科技計(jì)劃項(xiàng)目申報(bào)培訓(xùn)
- 591食堂不合格食品處置制度
- 產(chǎn)業(yè)鏈鏈長分工表
- 國際金融課件(完整版)
- 導(dǎo)向標(biāo)識(shí)系統(tǒng)設(shè)計(jì)(一)課件
- 220t鍋爐課程設(shè)計(jì) 李學(xué)玉
- 全英文劇本 《劇院魅影》
- 北京城的中軸線PPT通用課件
- 黑布林繪本 Dad-for-Sale 出售爸爸課件
- 京東方頂崗實(shí)習(xí)報(bào)告1
評(píng)論
0/150
提交評(píng)論