統(tǒng)計學(xué)考試復(fù)習(xí)112總結(jié)_第1頁
統(tǒng)計學(xué)考試復(fù)習(xí)112總結(jié)_第2頁
統(tǒng)計學(xué)考試復(fù)習(xí)112總結(jié)_第3頁
統(tǒng)計學(xué)考試復(fù)習(xí)112總結(jié)_第4頁
統(tǒng)計學(xué)考試復(fù)習(xí)112總結(jié)_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

(population(1)有限總體(finitepopulation(2)無限總體(infinitepopulation):很多為無限總體。(sample變異(variation,variablility)過差(mistakenerror):過失所致的誤差(不認(rèn)真,錯誤判斷,記錄等原因系統(tǒng)誤差(systematicerror):儀器未校準(zhǔn)所致的誤差(統(tǒng)一偏高,或偏低隨機(jī)測量誤差(randommeasurementerror):不同觀察者或同一觀察者多次觀察值的抽樣誤差(samplingerror):總體中存在變異,抽樣研究中所抽取的樣本,只包小概率定理測量的結(jié)果稱為變量值(valueofvariable)或觀察值(observedvalue,隨機(jī)化單純隨機(jī)抽樣(simplerandomsampling):總體全部觀察單位編號,再用隨機(jī)數(shù)字法或systematicsamplingnkstratifiedsampling:先按某種特征將總體分為若干組別、類型、區(qū)域,再第二章統(tǒng)計資料的收集和整理計量資料(measurement常用:平均數(shù),標(biāo)準(zhǔn)差,t計數(shù)資料(enumeration(ranked實驗設(shè)計(experimentdesign)、隨機(jī)、重復(fù)(即樣本例數(shù))的原則。頻數(shù)分布表(frequencydistributiontable)集中趨勢(centraltendency):離散趨勢(tendencyofdispersion):數(shù)值之間參差不齊;逐漸變大(或變小)的central1、算術(shù)平均數(shù)(arithmeticμxXa(a2geometricmean將n個觀察值的乘積再開n次方的(或各觀察值對數(shù)值均值的數(shù)。3、中位數(shù)(median,M)(2)(3)5、百分位數(shù)(percentile,P數(shù)值,就是百分位數(shù),Pr表示。百分位數(shù)將總體或樣本的全部觀察值分為兩部分,理論上有rtendencyof2、四分位數(shù)間距(quartile P75P25意義:QQ3、方差(variance)和標(biāo)準(zhǔn)差(standarddeviation1.961.645(95%)正態(tài)分布(normaldistribution)N(μσ)表示,其位置與均數(shù)有關(guān),形狀與標(biāo)準(zhǔn)差有關(guān)。u變換后,μ=0,σ=1,使原來的正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)uxxx=μ正態(tài)分布有兩個參數(shù):均數(shù),標(biāo)準(zhǔn)差;標(biāo)準(zhǔn)正態(tài)的參數(shù)分別為:0,1步驟:1234、選定合適的百分界限5、資料正態(tài)性檢驗6、進(jìn)行參考值估計tsamplingerrorof用樣本均數(shù)的標(biāo)準(zhǔn)差來估計,稱標(biāo)準(zhǔn)誤(standarderror)。即總體標(biāo)準(zhǔn)差和樣本例數(shù) 是方差的平說明一組數(shù)據(jù)在其X周圍的分散X

S反映用樣本均數(shù)代表總體均數(shù)的可靠2t二、t分布(t-distribution)t5%tt0.05/2(υ),把兩側(cè)1%tt0.01/2(υ)。95%tt0.05/2(υ99%tt0.01/2(υt0.01/2(υ)。tPtPt窮大時,tuut點估計(pointestimation):用樣本統(tǒng)計量作為對總體參數(shù)的估計值(μ)。比如μ<b)a,b(可信限。置信度(confidencelevel):α1-α,即為置信度.常用:95%,99%.置信區(qū)間(confidenceinterval,CI)t595%正常值范圍一般是指同質(zhì)總體內(nèi)包括95%值的估計范圍,X1.96S95%95%置信度估計的總體參數(shù)的可能范圍,X1.96SX。ut-檢驗備擇假設(shè)(alternativehypothesis),H1H1H0確定檢驗水準(zhǔn)(sizeofatest):level:是H0的區(qū)間。μμ0,稱雙側(cè)檢驗;若認(rèn)為μ大于、等于不可能小于μ0(或相反,為單側(cè)檢驗。必須事先根據(jù)專業(yè)知識予以確定,不能等到計算完t值以后再選定雙側(cè)檢驗是正確errorerror,用即無效假設(shè)(H0:u=u0)是正確的,但被,誤為有差別(棄真錯誤統(tǒng)計學(xué)上定P≤0.055%假錯誤(falsenegativeerror),統(tǒng)計學(xué)上稱為第二類錯誤(typeIIerror)。即無效假設(shè)(H0:u=u0)H1:u≠u0,tt0.05(取偽錯誤類錯誤:雖然無效假設(shè)為假,但由于抽到了較?。z驗統(tǒng)計量)PP值越小說明無效假設(shè)越不可靠?;蛘哒f,P值越小就越有理由無效假設(shè)。P來判斷的。ut第六章方差分析(一 2、分離各有關(guān)因素并估計其對總變異的作用3、分析因素間稱為均方差,簡稱均方(meansquare,MS)。MSlvariation組間變異(betweengroupvariation:各組的均數(shù)Xi與總均數(shù)間的差異 n(xi-x)2,v=k-1xi)2,v=k(n-1) FF0.05(1,2),H0MSMS小,F(xiàn)1。Dunnett-tBartlett此外,Levene平轉(zhuǎn)x′= x10x′=x1x′=x平反正弦轉(zhuǎn)x′=arcsinx′=lgxx′=lg(x+1)(x0)一、22(factorialexperiment)設(shè)計第七章直線回歸與相關(guān)依存關(guān)系:應(yīng)變量(dependentvariable)Y隨自變量(independentvariable)X變化而變化。——回歸分析互依關(guān)系:應(yīng)變量Y與自變量X間的彼此關(guān)系 ———相關(guān)分析第一節(jié)直線回歸(linearregression線性回歸)的直線方程稱為直線回歸方程(linearregressionequation)。自變量x:正態(tài)總體中的隨量或指定變量 因變量y:服從正態(tài)分布的隨機(jī)各實際值Y與估計值 abyY軸交點的縱坐標(biāo)(X=0)x(減)一個單位,y平均變動b個單位b>0,YX的增大而增大()b<0,YX的增大而減?。ǎ?——水平最小二乘法原則(leastsquaremethod):使各實際散點(Y)到直線(Y?)總情況(總情況(YY(YY

?) F =MS;=1,=n SS MSSS總=(YY)2Y的離均差平方和(totalsumofX與Y的回歸關(guān)系時Y

nX對Y的線性影響之外的一切因素對YX解釋的部分。SS剩

nX與Y的直線關(guān)系而使Y變異減小的部分,即總變異中,X解釋的部分。SS回

|b-0 t=————=—— =n-S SSSb=——— SbSyxtb與trb

S(x-x)Y Yb(xx)Yi值的范圍預(yù)測linearcorrelation簡單相關(guān)(simplecorrelationx、y都是正態(tài)分布資料的隨量(correlationcoefficientr 表示方法:-1 r直線回歸:自變量是正態(tài)總體的隨量或指定變量,y一定是正態(tài)總體的隨量;rbrbtrtb Spearman秩相關(guān)適用資料:⑴從雙變量正態(tài)分一、常用相對數(shù)(relativenumber)1、比(ratio)(rate121/萬、1/10自然增長率=粗出生率-粗粗率(總率)mortality(incidencerate)患病率(prevalencerate)某病患病率=(檢查時發(fā)現(xiàn)的某病現(xiàn)患病例數(shù)/該時點受檢人口數(shù))K某病率=(觀察期間內(nèi)因某病人數(shù)/同期某病總數(shù))(1(1p pp(1pnup p up p sp(1pn總體率的假設(shè)檢驗(u當(dāng)比較兩個總率時,如果兩組內(nèi)部某種能影響指標(biāo)水平的重要特征的構(gòu)成上有差別,往往造成總率的升高或下降,影響兩個總率的對比;因此要設(shè)法消除其內(nèi)部構(gòu)成的差異,使之能合理地進(jìn)行比較,所用的方法稱為標(biāo)準(zhǔn)化法。標(biāo)準(zhǔn)化法即在一個指1、直接法:以標(biāo)準(zhǔn)人口構(gòu)成與實際的組別率求得一個調(diào)整率第九章卡方檢驗(一)2(AT)T:

=(R-1)(C-2(adbc)2(ab)(cd)(ac)(bd(21)(2連續(xù)性較正22(AT0.5)T( bcn/2)2.(ab)(cd)(ac)(bd2b b(whenbc2(bc)2(whenbcb22(adbc)2(ab)(cd)(ac)(bd(21)(2rn<40,T<1pp(ab)!(cd)!(ac)!(bda!b!c!dx2檢驗R>2or計算:2n(A2nRn(R1)(Crr R*C4/5>5;1/5x2檢驗的結(jié)果接受H1比較的次數(shù)比較的次數(shù)(1' ' k(k-1)/22實驗組與'PearsonKappa或等級相關(guān)分析(spearman)Pearson-Man-Haenszel分層分析,按資料多來源(多中心,多地區(qū),,等分層校正2r:2r2r第十章二項分布與普哇松分布2、各是相互排斥的,適于非遺傳,非傳染性疾病testπ2n<50npn(1-p)均<53、研究性各戶居民家屬中實際病例數(shù)X的分布與按二項分布求得的理當(dāng)總體比例πn(n>100,每次出現(xiàn)概率<0.01)Poissionπ不接近0和n>100,butπ不接近0和n>100,butPoission4PoissionPoission4002x≥50(1.96,2.58)1、(1)μ較小時,Poission;2、兩樣本計數(shù)(不同情況采用不同第十一章非參數(shù)檢驗收料方便:可使用“等級“符號”等評定結(jié)H-(1(2)H適用:等級資料(兩組或多組H-test(1)(2)用秩次代替原變量進(jìn)行參數(shù)檢驗(LSD)RiditR-.單向有序數(shù)據(jù):單向有序數(shù)據(jù):適宜秩和檢驗Ridit優(yōu)點:RiditX2-test標(biāo)準(zhǔn)組的平均R值總是等于0.5,對比組R 0—1之間。95%可信區(qū)間—不含()0.5,差異有意—含 )0.5,差異無意R0.5,表示其療效差于標(biāo)準(zhǔn)組。近似實際情況得出的"差異無意義"的結(jié)論因此當(dāng)可信區(qū)間剛好觸及RiditRidit(取合并組作標(biāo)準(zhǔn)組)適用條件:相互比較的各組樣本中無例數(shù)較多者(即無標(biāo)準(zhǔn)組)。(近似法-RR(u-R(x^2-test5-104 VariablesEntered/Removed(b)進(jìn)入模型的變量及方法ModelSummary模型的 :決定系數(shù)R2 R—multiplecorrelationyx(多因素)間的總相關(guān)程度。RANOVA(b)Coefficients(a)R2最大的為最優(yōu)方程。R2--R2。Coefficient CollinearityDiagnostics(a) 共線性診斷(Eigenvalue、ConditionIndex) *度 *條件指數(shù)ConditionIndexHistogram:殘差應(yīng)正態(tài):基本呈高兩頭低P-PSR 流行病學(xué)研究方法studystudy:①病例對照研究--回顧性(retrospective)研究:從疾?。ü┤ふ以颍ú、陉犃校ǘㄈ海┭芯?-前瞻性(prospective)研究:從有無可疑原因(病因study它是將特定人群按照是否于某因素或程度分成組與非(,實驗流行病學(xué)(experimentalepidemiology)--主要在人群現(xiàn)場進(jìn)行。分為:臨床試驗(clinicaltrial)和人群現(xiàn)場試驗(communityfieldtrial理論流行病學(xué)(theoreticalepidemiology)--數(shù)理流行病學(xué)(mathematical分別從病例及對照者中獲得一個隨機(jī)樣本,并分這兩組人于可疑病因的情況病例對照研究的四大要素:人群、對照、病例和傳統(tǒng)四格表 :((aE(a)2 M-H

V2傳統(tǒng)

比數(shù)比OR(oddsratio)--相對度RR的估計值,指病例組人數(shù)與非人數(shù)的 人數(shù)的比值。OR= OR的95%可信范圍包含1: 1:1OR=c/b(一)累積(cumulative 累積的作用表示的累積影響累積的適用條件:樣本量大。人口穩(wěn)定,資料比較整齊。發(fā)病密度(incidence適用條件樣本量小,或率低標(biāo)化比最常用的指標(biāo)為標(biāo)化比(standardized相 度或率定義相對度(relativerisk,RR)或率比(rateratio)是指計算RR=1--表明與疾病無聯(lián)系 歸因度(attributablerisk,AR)或率差(ratedifference)是指組與非暴 AR=Ie-Io=a

c

AR的意義AR表示可使人群比未時增加的超額發(fā)病的數(shù)量,如果去除,則可使減少多少(AR的值),因此AR在疾病預(yù)防中很有意義。AR%>75%時,即可認(rèn)為找到了主要病因。PAR表示在全人群中由于而導(dǎo)致的增加 It:全人病PAR%表示全人群中 It

It

分析方法:包括表(Lifetable)——用于描述

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論