醫(yī)學統(tǒng)計學基本概念資料_第1頁
醫(yī)學統(tǒng)計學基本概念資料_第2頁
醫(yī)學統(tǒng)計學基本概念資料_第3頁
醫(yī)學統(tǒng)計學基本概念資料_第4頁
醫(yī)學統(tǒng)計學基本概念資料_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

均數的可信區(qū)間和參考值范圍的區(qū)別區(qū)別可信區(qū)間參考值范圍意義未知參數的可能范圍正常值的波動范圍公式已知或未知,但n足夠大(x±u/2,sx)或(x±u/2,x)(x±u/2,sx)未知(x±t,sx)用途估計總體均數判斷正異常小結:均數的可信區(qū)間:均數界值×標準誤個體的容許區(qū)間(參考值范圍):均數界值×標準差可信區(qū)間與容許區(qū)間的區(qū)別:見P44假設檢驗的基本思想:提出一個假設(H0);驗證這個假設。如果假設成立,會得到現在的結果嗎?兩種可能的情況:(1)得到現在的結果可能性很小(小概率)→拒絕H0(2)有可能得到現在的結果(不是小概率)→沒有理由拒絕H0假設檢驗的步驟:(1)建立檢驗假設;(2)確定檢驗水準α;(3)計算檢驗統(tǒng)計量并求P值;(5)界定P值并作結論。I型錯誤和II型錯誤實際情況實際情況假設檢驗的結果拒絕H0不拒絕H0H0成立I型錯誤()H0不成立把握度(1-)II型錯誤()差異檢驗和優(yōu)度檢驗:差異檢驗之意義在于是否能夠確認H1成立,故希望所得P值很小,因為P值越小,表示手頭樣本從H0總體隨機獲得之概率越小,即否定H0而確認H1成立的把握越大。優(yōu)度檢驗之意義在于是否能夠確認H0成立,故希望所得P值較大,因為P值越大,表示手頭樣本從H0總體隨機獲得之概率越大??尚艆^(qū)間與假設檢驗區(qū)別和聯(lián)系:可信區(qū)間說明量的大小即推斷總體均數范圍,假設檢驗推斷質的不同即判斷兩總體均數是否不等;可信區(qū)間可回答假設檢驗問題,可信區(qū)間若包含了H0,按水準,不拒絕H0;若不包含H0,按水準,拒絕H0,接受H1;可信區(qū)間不但能回答差別有無統(tǒng)計學意義,還能提示差別有無實際專業(yè)意義;可信區(qū)間不能夠完全代替假設檢驗??尚艆^(qū)間只能在預先規(guī)定概率的前提下進行計算,假設檢驗能獲得一較為確切的P值。下列說法正確嗎?P是H0成立的概率。(錯)P是I型誤差的概率。(錯)P是H0成立時,獲得現有差別的概率。(錯)P是H0成立時,獲得現有差別以及更大的差別的概率。(對)統(tǒng)計推斷時的風險。(錯)拒絕H0時所冒的風險。(對)16.t檢驗的應用條件:(1)獨立性:各觀察個體間是相互獨立的,不能互相影響,亦不能一方影響另一方;(2)正態(tài)性:兩組均數比較時,要求兩組數據服從正態(tài)分布;配對設計時,要求差值服從正態(tài)分布。(3)方差齊性:兩樣本所對應的正態(tài)總體之方差相等??傮w方差不相等的t檢驗:(1)數據變換后進行t檢驗;(2)秩轉換的非參數檢驗;(3)近似t檢驗t'檢驗。兩樣本均數比較方法的選擇方差齊方差不齊小樣本t檢驗t‘檢驗大樣本 u檢驗 u檢驗19.方差分析的基本思想:方差分析(analysisofvariance)又稱為變異數分析,采用F檢驗統(tǒng)計量,也稱F檢驗。這種方法的基本思想是對變異進行分解和分析,把全部觀察值之間的變異—總變異,按照設計和需要分為兩個或多個組成部分,再作分析,從而達到統(tǒng)計推斷之目的??傋儺?組內變異+組間變異;組內變異:抽樣(隨機)誤差(個體差異和測量誤差);組間變異:組間本質差別+抽樣(隨機)誤差;如果組間無本質差別,則組間變異=組內變異MS 或F= Between1MS Within20.方差分析的優(yōu)點:(1)不受比較組數的限制;(2)可同時分析多個因素的作用;(3)可分析因素間的交互作用。方差分析的意義:是按照實驗設計把總變異分成若干部分,劃分得越細,各部分的涵義越明確,對結論亦較易解釋;同時,殘余的變異即誤差部分越小,因而能夠提高檢驗的靈敏度和結論的準確性。F分布是方差比的分布,常用于方差齊性檢驗,方差分析等。F分布特征:(1)F分布為一簇單峰正偏態(tài)分布曲線,與兩個自由度有關。(2)若F服從自由度為(1,2)的F分布,則其倒數1/F服從自由度為(2,1)的F分布。自由度為(1,2)的F分布,其均數為2/(2-2),與第一自由度無關。第一自由度1=1時,F分布實際上是t分布之平方;第二自由度2=∞時,F分布實際上等于2分布。每一對自由度下的F分布曲線下的面積分布規(guī)律,見方差分析用F界值表,表中橫標目為第一自由度,縱標目為第二自由度,表中分別給出了右側尾部概率為0.05和0.01時的F界值。23.方差分析表變異來源變異來源SSvMSFP組間SS組間k-1SS組間/v組間MS組間/MS組內組內SS組內N-kSS組內/v組內總SS總N-124.方差分析與t檢驗的關系當比較兩個均數時,從同一資料算得之F值與t值有如下關系:F=t2可見在兩組均數比較時,方差分析與t檢驗的效果是完全一樣的。25.方差分析后的兩兩比較(多重比較)的幾種方法:一、SNK-q檢驗(多個均數間全面比較)二、LSD-t檢驗(有專業(yè)意義的均數間比較)三、Dunnett檢驗(多個實驗組與對照組比較)還有TUKEY、DUNCAN、SCHEFFE、WALLER、BON等比較方法各組間的比較用SNK法;各試驗組與某一對照組間的比較用Dunnet法。方差分析應用條件:①各樣本是相互獨立的隨機樣本;②各樣本來自正態(tài)總體;③各組總體方差相等,即方差齊。方差分析和t檢驗要求:獨立性、正態(tài)性、方差齊性??偨Y:均數、方差的比較:樣本均數與總體均數的比較(t檢驗)配對設計樣本均數的比較(配對t檢驗)兩樣本均數的比較(t檢驗,u檢驗,F檢驗,SNK,Duncan)多樣本均數的比較(F檢驗,ANOVA)?各組間的比較(SNK法);各試驗組與某一對照組間的比較用(Duncan法)兩個方差的比較(F檢驗)多個方差的比較(Bartlett檢驗二項分布應用條件:醫(yī)學領域有許多二分類記數資料都符合二項分布(傳染病和遺傳病除外),但應用時仍應注意考察是否滿足以下應用條件:每次實驗只有兩類對立的結果;如陽性或陰性、生存或死亡,不允許考慮“可疑”等模糊結果,屬于二項分類的資料。n次事件相互獨立;即每個觀察單位的觀察結果不會影響到其它觀察單位的結果。如要求疾病無傳染性、無家族聚集性等。每次實驗某類結果的發(fā)生的概率是一個常數。已知發(fā)生某一結果(如陽性)的概率為π,其對應的概率必然是(1-π),我們知道總體率π一般是未知的,在實際工作中要求π是從大量觀察中獲得的比較穩(wěn)定的數值。29.二項分布的應用:(1)樣本率與總體率的比較;(2)兩樣本率的比較。Poisson分布特征:①非對稱,但μ增大時趨于對稱;②均數與方差均為μ;③分布的可加性,n個獨立的Poisson分布相加仍符合Poisson分布,可使μ>20,使得可用正態(tài)近似。Poisson分布應用條件:(1)平穩(wěn)性:X的取值與觀察單位的位置無關;(2)獨立增量性:在某個觀察單位X的取值與前面各觀察單位上X的取值獨立.;(3)普通性:在充分小的觀察單位上X的取值最多為1。Possion分布的應用:(1)總體均數估計;(2)樣本均數與總體均數的比較;(3)兩樣本均數的比較。33.χ2檢驗的用途:(1)推斷多個總體率之間有無差別(2)推斷幾組總體構成比之間有無差別(3)兩個變量之間有無關聯(lián)性(4)頻數分布的擬合優(yōu)度檢驗。χ2檢驗的基本思想:χ2=TA2T如果H0假設成立,那么實際頻數與理論頻數應該比較接近。如果實際頻數與理論頻數相差很大,超出了抽樣誤差所能解釋的范圍,則可認為H0假設不成立,即兩樣本對應的總體率不等。χ2值反映了實際頻數與理論頻數吻合的程度。如果兩總體率相同的假設成立,則實際頻數與理論頻數之差異純系抽樣誤差所致,故一般不會很大,χ2值也就不會很大;在一次隨機試驗中,出現大的χ2值的概率P是很小的。因此,若根據實際樣本資料求得一個很小的P,且P≤α(檢驗水準),根據小概率原理,就有理由懷疑H0假設的真實性,因而拒絕它;若P>α,則沒有理由拒絕H0。χ2值的大小除取決于︱A-T︱的差值外,還與基本數據的格子數有關,嚴格地說是與自由度有關。在x2檢驗中,自由度指在表中周邊合計不變的前提下,基本數據可以自由變動的格子數。x2檢驗的精髓:檢驗實際頻數和理論頻數的吻合程度。如果實際頻數和理論頻數越吻合,說明H0假設成立的可能性就越大,反之,如果實際頻數和理論頻數相差越遠,說明H0越不可能成立。36.普通四個表資料卡方檢驗公式的選用條件:n≥40,且T≥5時,用未校正的值2 (adbc)2n(ab)(cd)(ac)(bd)1≤T<5,且An≥T40時,宜用校正χ0.52值adbcn/2 2 2n 2 T abcdacbd3)T<1或n<40時,宜用確切概率計算法 (ab)!(cd)!(ac)!(vd)!Pa!b!c!d!n!37.行×列表的χ2值計算專用公式: A2 2= nnn1 R C38.行×列表資料采用χ2檢驗時,注意事項:注意理論數的大小。行×列表資料采用χ2檢驗時,對理論數的要求與四格表資料相同,不能有T<1,T<5的個數不能超過所有理論數個數的1/5(四格表中有一個T<5即超過1/5),如出現上述情況,可用以下辦法解決:增加觀察例數可使實際頻數增加,從而使T增大。合并相鄰行或列的實際數,從而使T增大。合并時應注意合理性,一般有序分類可合并,無序分類則不可合并。采用精確概率檢驗法或似然比χ2檢驗法,最小理論數求法。上述χ2檢驗時,采用專用公式計算χ2值無須理論數,但也必須求出最小理論數,觀察其大小是否滿足上述各項條件。最小理論數位于最小行列合計數相對應的位置上,因此可用行、列合計數中小者相乘除以總例數即得到最小理論數。多組資料比較經χ2檢驗拒絕H0時只能認為多組間總的看差別有統(tǒng)計學意義,并不說明兩兩之間差別均有統(tǒng)計學意義。若需分析兩兩之間構成差別有無統(tǒng)計學意義,可采用χ2分割法或改變檢驗水準法進行分析等。配對四格表資料的2檢驗步驟:(H0、H1寫法特殊)一.H0:兩法檢出陽性率相同,總體B=C;H1:兩法檢出陽性率不同,總體B≠C。 =0.05。二.計算統(tǒng)計量:2。三.查2界值表,判斷P與α大小四.按=0.05水準,拒絕H0或接受H1。得出結論。列聯(lián)表:將單一樣本的每個觀察單位,同時按兩種因素,進行分組,分組以后就得到R×C表。然后對這個表進行x2檢驗,以判斷兩個因素的關聯(lián)性。而這種配對設計而形成的雙向交叉排列的統(tǒng)計表,用以描述行變量和列變量之間的關系,特稱為列聯(lián)表。關于列聯(lián)表內兩個分類變量是否有關聯(lián)性的統(tǒng)計推斷,仍然是用x2檢驗,但是它的檢驗假設有所不同。一.列聯(lián)表關聯(lián)性分析的2檢驗步驟:(結合課件看)H0:不同矽肺期次的患者肺門密度分布相同;H1:不同矽肺期次的患者肺門密度分布不同或不全相同。=0.05。二.計算統(tǒng)計量:2,v。三.P=?四.按=0.05水準,拒絕H0,接受H1。認為肺門密度與矽肺期次有關。結合本資料,肺門密度有隨矽肺期次增高而增加的趨勢。R×C表資料中的行一般為研究因素的不同水平分組,列一般為研究結果(效應指標)的分類。根據行和列的分組或分類情況,可將R×C表資料分為以下幾種情況:雙向無序R×C表行和列的分組或分類均為無序。此時可采用χ2檢驗處理。單向有序R×C表若行的分組為有序(如藥物劑量、患者年齡、病情輕重等),但率的效應為無序分類(如染色體損傷的類型、疾病的證型等),此時仍可按雙向無序處理,采用χ2檢驗;若行的分組為無序(如三種藥物處理),而列的效應為有序(如痊愈、顯效、好轉、無效),此時應采用秩和檢驗或Ridit檢驗方可判斷療效上的優(yōu)劣。因為χ2檢驗不考慮有序分類變量的順序。如果固定有序分類變量的順序,將列的頻數互換后,檢驗的結論相同,顯然不合理。雙向有序R×C表若行的分組為有序(如年齡),效應分類也為有序(如療效等級),可按單向有序R×C表中,列為有序分類時的處理方法,采用秩和檢驗或Ridit檢驗。若行和列均為同一觀察對象的兩個有序變量,如矽肺的期次和肺門密度的級別,病程與療效等,此時為配對設計,可先采用χ2檢驗。資料的分類數值變量資料二分類分類資料無序多分類多分類有序多分類(等級資料)參數統(tǒng)計和非參數統(tǒng)計參數統(tǒng)計非參數統(tǒng)計(parametricstatistics)(nonparametricstatistics)↓↓已知總體分布類型,對未知參數進行統(tǒng)計推斷對總體的分布類型不作任何要求↓↓不受總體參數的影響,比較分布或分布位置依賴于特定分布類型,比較的是參數↓適用范圍廣;可用于任何類型資料(等級資料,或“>50mg”)非參數檢驗適用情況:①總體分布形式未知或分布類型不明;②偏態(tài)分布的資料:③等級資料:不能精確測定,只能以嚴重程度、優(yōu)劣等級、次序先后等表示;④不滿足參數檢驗條件的資料:各組方差明顯不齊。⑤數據的一端或兩端是不確定數值,如“>50mg”等。45.秩和檢驗的適用范圍:(1)等級資料;(2)定量資料,但數據的某一端或兩端無確定數值(開口資料);(3)定量資料,但數值的分布是極度偏態(tài)的,如L形分布,或個別數值偏離過大而不屬于“過失誤差”者;(4)定量資料,但各組離散程度相差懸殊,即使經變量變換,也難以達到方差齊性;(5)定量資料,但分布型尚未確知,此時可先用秩和檢驗法進行分析;(6)兼有等級和定量性質的資料。46.秩和檢驗的優(yōu)缺點:優(yōu)點:⑴不論樣本所來自的總體分布的形式如何,甚至是未知的,都能適用。⑵某些非參數方法計算簡便。因此在急需獲得初步結果時可采用。⑶易于理解和掌握。⑷可用于不能或未加精確測量的資料,如等級資料或某些記數資料。缺點:⑴對適宜用參數方法的資料,若用非參數法處理,常損失部分信息,降低效率。⑵雖然許多非參數法計算簡單,但不少問題的計算仍嫌繁冗。47.樣本的相關系數r的特征:(1)-1≤r≤1,沒有單位;(2)r的絕對值大小表示相關關系的密切程度;(3)r的符號表示相關的方向:r>0為正相關;r<0為負相關;r=0為零相關或無相關48.回歸系數和回歸方程的意義及性質: Y?abX(1)b的意義:回歸系數b稱為斜率,表示自變量增加一個單位時,應變量的平均改變量。(2)a的意義:a為截距或常數項,a的值表示當X=0時,應變量Y的估計值。從坐標軸上看,a對應回歸直線延伸至X=0時與Y軸的交點,故稱為截距。(3)^Y(Y-hat)的意義:^Y表示給定X時Y的平均值的估計。^Y的涵義是均數—不同X時Y均數的估計值,與一般的均數的計算方法不同,這里的均數是給定X的條件下,由回歸方程估計得到的,故又稱為條件均數。(4)Y-^Y的意義:Y-^Y稱為剩余,又稱殘差,是Y的觀察值與對應的估計值之差,在回歸圖中表示各散點到回歸直線的縱向距離。(5)(Y?Y的)2意義:稱為殘差平方和(residualsumofsquares或剩余平) 方和,是所有剩余之平方和,綜合表示點距直線的距離。在所有的直線中,回歸直線的殘差平方和是最小的。(最小二乘)49.回歸直線的有關性質:直線通過均點 (X,Y)直線上方各點到直線的縱向距離之和=直線下方各點到直線的縱向距離之和即:(YY?)0各點到該回歸線縱向距離平方和較到其它任何直線者為小。YY?Y?Y2YYY?Y2YY?2YY應變量Y的總變異分解:SSSSSS總 回剩 SS 決定系數r2回歸總 回 剩 SS 總v總=v回+v剩,v回=1,v剩=n-2。直線回歸中三種假設檢驗間的關系:在直線回歸中,相關系數的假設檢驗,回歸系數的假設檢驗,以及回歸方程的方差分析結果等價。 ttF的可信區(qū)間與Y的容許區(qū)間: r bY?可信區(qū)間是針對條件均數的,而容許區(qū)間是針對Y的取值范圍的。的容許區(qū)間估計:給定X時Y的估計值是Y的均數的一個估計。Y?給定X時Y值的容許區(qū)間是Y值的可能范圍?;貧w方程的應用:(1)描述兩個變量間的依存關系。(2)利用回歸方程進行預測。(3)利用回歸方程進行估計。(4)利用回歸方程獲得更高精度的參考值。(5)利用回歸方程進行控制。應用直線回歸的注意點:.回歸分析要有實際意義:要有實際意義;充分利用散點圖,判斷:(1)線性趨勢(2)離群值當樣本含量較大時,統(tǒng)計學檢驗的作用減弱;回歸關系可以內插,不宜外延;自變量的選擇:原因容易測量的變異小的年齡、身高、體重、體表面積在作回歸前應先作散點圖(3)內插和外延55.回歸分析的正確應用:.回歸系數是有單位的,不能根據b的大小判斷回歸關系的密切程度。.應用條件(LINE):(1)線性(linear)(2)獨立(independent)(3)給定X時,Y正態(tài)分布(normal)(4)等方差(equalvariance。)56.直線回歸分析和相關分析的區(qū)別與聯(lián)系:區(qū)別:在資料要求上:回歸要求因變量Y服從正態(tài)分布,X是可以精確測量和嚴格控制的變量,一般稱為I型回歸;相關要求X和Y均服從雙變量正態(tài)分布,稱為II型回歸。在應用上:說明兩變量的依存變化的數量關系用回歸,說明變量間相關關系用相關。聯(lián)系:1)對一組數據同時計算r和b,它們的正負號一致,r為+說明兩變量間相互關系是同向的,b為+說明X增一個單位,Y平均增b個單位。2)r和b的假設檢驗是等價的。57.研究設計的定義:在進行科學研究時,對研究方案作合理的安排,以減少隨機誤差的影響。采用適當的研究試驗次數,減少試驗的成本并能對數據進行有效的分析,提高研究試驗的可靠信,從而實現研究目的。研究設計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論