統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)_第1頁
統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)_第2頁
統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)_第3頁
統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)_第4頁
統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

752.597010752.597010基本統(tǒng)計(jì)法第一章

概論??傮wPopulation):據(jù)研究目的確定的同質(zhì)對(duì)象的全集合樣(Sample從總體中隨機(jī)抽取的部分具有代表性的研究對(duì)象。。參(Parameter)反映總體特征的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差等,希臘字母表示是固定的常數(shù);統(tǒng)量Statistic)反樣本特征的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差等,采用拉丁字字母表示,是在參數(shù)附近波動(dòng)的隨機(jī)變量。統(tǒng)資料分類:定量(計(jì)量資料、定性(計(jì)資料、等級(jí)資料。第二章

計(jì)量資統(tǒng)計(jì)描述集趨勢(shì):均數(shù)(算術(shù)、幾何位數(shù)、眾數(shù)。離散勢(shì):差、四分位間距QRP—P)、標(biāo)準(zhǔn)差(或方)、變異系數(shù)()正分布特:①X軸方關(guān)于=的鐘形曲線;取最大值;③有兩個(gè)參數(shù),位置參數(shù)態(tài)數(shù)曲線下面積為1,區(qū)間為。27,區(qū)間

積95.00%,區(qū)間。積99.00%。醫(yī)參考值范圍的制定方法:正態(tài)近似:S

;百分位數(shù)法:P—P第三章

總體均估計(jì)和假設(shè)驗(yàn)。抽樣差SamplingError)由個(gè)體變異產(chǎn)生、隨機(jī)抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異。抽樣誤差不可避免,生的根本原因是生物個(gè)體的變異均數(shù)標(biāo)誤(Standarderror,:樣本均數(shù)的標(biāo)準(zhǔn)差,計(jì)算公式:nX

。反映樣本均數(shù)間的離散程度,說明抽樣誤差的大小。。降低樣誤差的途徑有:①通過增加樣本含量n②通過設(shè)計(jì)減少。t分布特征:①單峰分布,以0為中心左對(duì)稱;②形態(tài)取決于自由度值分散,t分的峰部越矮而尾部翹得越高;③當(dāng)∞,

X

逼近

X

t分逼近分,故標(biāo)準(zhǔn)正態(tài)分布是分的特例.。置區(qū)(Interval,按先給定的概(定包含總體參數(shù)的一個(gè)范圍計(jì)公式:

/2,

或SX/2,

X

%CI含義:從固定樣本含量的已知總體中進(jìn)行重復(fù)抽樣試驗(yàn),根據(jù)每個(gè)樣本可得到一個(gè)置信區(qū)間,則平均有%的置信區(qū)間包含了總體參數(shù)。。假檢的本理小概反法思。①反證法:從問題的對(duì)立()發(fā)間接判斷要解決的問(H)否成立。②小概率事件在H成的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量據(jù)率分布確定檢驗(yàn)P

01000000100000值大小判斷是否為小概率事件(通常P≤小概率事件取接受H;則尚不能拒絕H。。假設(shè)驗(yàn)一般步:建立假反證法H和H定驗(yàn)水②算統(tǒng)計(jì)量:,F;確定概率值,出推斷結(jié)論檢需滿足的條件:比較的兩個(gè)樣本相獨(dú)、服正態(tài)布.的含義是從H規(guī)的總體隨機(jī)抽,得等于及大于(或和等于及小于)現(xiàn)有樣本得的檢驗(yàn)統(tǒng)計(jì)量(如tu等值的概率。。Ⅰ型錯(cuò)(Typeerror拒了實(shí)際上成立的,類“棄真”的錯(cuò)誤稱為Ⅰ型錯(cuò)誤Ⅰ錯(cuò)誤的大小為檢驗(yàn)水Ⅱ型誤(TypeⅡerror:接受了實(shí)際上不成立H,這類“存?zhèn)巍钡腻e(cuò)誤稱為Ⅱ型錯(cuò)誤,Ⅱ型錯(cuò)誤的大小示1-示檢驗(yàn)效能越,大,增大樣本量可以同時(shí)降和11.置區(qū)和假設(shè)檢驗(yàn)的區(qū)別和聯(lián)系:①可以通過判斷置信區(qū)間是否包含零假設(shè),判斷單樣本均數(shù)是否來自已知的總體置區(qū)間不但能回答差別有無統(tǒng)計(jì)學(xué)意義可示差別有無實(shí)際意義。③假設(shè)檢驗(yàn)可提供置信區(qū)間不能提供的信息,如P值和檢驗(yàn)效能等第四章

方差分方差析基思:根據(jù)研究目的和設(shè)計(jì)類型,把所有測(cè)量值的變異按處理素水等分解成兩部分組內(nèi)變異和組間變異)或更多部分,同時(shí)把對(duì)自由度相應(yīng)進(jìn)行分,再進(jìn)行比較,評(píng)價(jià)由處理因素引起的變異是否具有統(tǒng)計(jì)學(xué)意義。。方分析的應(yīng)用條件各樣本是相互獨(dú)立的機(jī)樣本,均來自正態(tài)分布的總體,各樣本的總體方差相等(具方差性。方差析表:變來組變組變

a

νN-g

MSa/—)b/Ng)

FMS

P總異N-1g=2時(shí)隨機(jī)區(qū)組設(shè)計(jì)的方差分析與配對(duì)設(shè)計(jì)資料t檢等,

t

F

。多樣本均數(shù)間的多重比較:—檢驗(yàn)即最小顯著差異t檢驗(yàn),適用于一對(duì)或幾對(duì)在專業(yè)上有特殊意義的樣本均數(shù)間的比較;—t檢驗(yàn)適用于g—1實(shí)驗(yàn)組與一個(gè)對(duì)照組均數(shù)差別的多重比較;檢驗(yàn)適用于多個(gè)樣本均數(shù)兩兩之間的全面比較。第五章

計(jì)數(shù)資的統(tǒng)計(jì)描述相數(shù)的類型:強(qiáng)度相對(duì)數(shù)率,如死亡率、發(fā)病率等構(gòu)對(duì)數(shù)(構(gòu)成比)相對(duì)比(如性別比等)應(yīng)相對(duì)數(shù)的注意事項(xiàng):①結(jié)構(gòu)相對(duì)數(shù)不能代替強(qiáng)度相對(duì)數(shù);②計(jì)算相對(duì)數(shù)應(yīng)有足夠的數(shù)量;③正確計(jì)算合計(jì)率;④注意資料的可比性;⑤對(duì)比不同時(shí)期資應(yīng)注意客觀條件是否相同;⑥樣本率(或構(gòu)成)抽樣誤。標(biāo)化(rate):采用標(biāo)準(zhǔn)化進(jìn)行計(jì)算,消除數(shù)據(jù)內(nèi)部構(gòu)成的差異,使標(biāo)化后的合計(jì)率具有可比性,這種經(jīng)過標(biāo)化后的合計(jì)率稱為標(biāo)準(zhǔn)化率。。標(biāo)化率的注意事項(xiàng):只適用于內(nèi)部構(gòu)成不同,影響總率的可比性的問②選擇的標(biāo)

準(zhǔn)不同,計(jì)算得到的標(biāo)準(zhǔn)化率也不同,多個(gè)標(biāo)準(zhǔn)化率比較時(shí)同標(biāo)準(zhǔn);③標(biāo)準(zhǔn)化率已經(jīng)不再反映當(dāng)?shù)氐膶?shí)際水平;④樣本標(biāo)準(zhǔn)化率是樣本值,在抽樣誤差。比較兩樣本標(biāo)準(zhǔn)化率,當(dāng)樣本量較小時(shí),需做假設(shè)檢驗(yàn)。第六章

幾種離型變量的分及應(yīng)用二分布~(n,適條件:①每次試驗(yàn)只生兩種對(duì)立的可能結(jié)果之一;②每次試驗(yàn)產(chǎn)生某結(jié)果的概率變;③重復(fù)試驗(yàn)是相互獨(dú)立的。二分布的性:陽性次數(shù)的體均數(shù)(

準(zhǔn)差(

);②樣本率p的數(shù)(

)、標(biāo)準(zhǔn)差(

S

p)

即率標(biāo)誤③二項(xiàng)分布的正近似條件np和(1—)大5.。泊分~()性:①總體均數(shù)體相;②當(dāng)n很,且np=常數(shù)二項(xiàng)分布近似泊松分;時(shí)泊松分布近似正態(tài)分布;④泊松分布具備可加性。。

檢的本想根

第七章檢驗(yàn)分布特征,通過比較實(shí)際頻數(shù)與理論頻數(shù)的差異,確定在成的條件下該差異由抽樣誤差造成是否為小概率事件,進(jìn)而判斷差異是否具有統(tǒng)計(jì)學(xué)意義實(shí)頻數(shù)與理論數(shù)的吻合程度。。R×C聯(lián)表中的各格子T≥1,并且1≤T<5的子數(shù)不宜超過格子,否則可能產(chǎn)生偏差處方法有三種:增加樣本量,使理論頻數(shù)增大;②根據(jù)業(yè)知識(shí),刪除或合并行列③采用切概率法分析。。有序組資料表線性趨勢(shì)檢驗(yàn):①雙無的RC列聯(lián):個(gè)樣本率的比較采用R×C列聯(lián)表的驗(yàn)兩個(gè)分類變量的關(guān)聯(lián)性分析則采用R×C列表的驗(yàn)和列系數(shù)進(jìn)行分析。②單有的RC列聯(lián)行有序而列無序R×C列表驗(yàn);行無序而列有采用Wilcoxon秩檢驗(yàn)。③雙有屬相的×C列聯(lián):對(duì)四格表的擴(kuò)展,采用一致性檢驗(yàn)Kappa檢驗(yàn)④雙有屬不的×C列聯(lián)樣率的比較采用秩檢;關(guān)性分析采用Spearman相分析;線性變化趨勢(shì)分析采用有序分組資料的線性趨勢(shì)檢驗(yàn)或CMH驗(yàn)等.

檢第八章

非參數(shù)驗(yàn)。和檢驗(yàn)的適用范圍:①總體分布偏態(tài)的計(jì)量資料據(jù)兩端有不確定值③等級(jí)資料④各組離散程度相差懸殊,總體方差不齊的資料。。非數(shù)檢驗(yàn)對(duì)總體分布的形狀差別不敏感,只對(duì)總體分布位置差別敏感非數(shù)檢驗(yàn)沒有充分利用資料信息,較參數(shù)檢驗(yàn)的檢驗(yàn)效低。故能用參檢盡采參檢,滿足數(shù)驗(yàn)件使非數(shù)驗(yàn)。不數(shù)類的計(jì)析路:(1)樣本均數(shù)與總體均數(shù)的比較:態(tài),樣本均數(shù)與總體均數(shù)的t檢;非正態(tài),Wilcoxon

符號(hào)秩檢驗(yàn).(2本均數(shù)比較立態(tài)立樣本t檢;②獨(dú)立非正態(tài)兩獨(dú)立樣本的Wilcoxon秩和檢驗(yàn)③配對(duì)設(shè)計(jì)差值正態(tài)對(duì)t驗(yàn);配對(duì)設(shè)計(jì)差值非正態(tài),Wilcoxon符號(hào)秩檢驗(yàn)。)多本均數(shù)比較:①獨(dú)立正態(tài)(方差齊),方差分析;②獨(dú)立非正Kruskal—WailsH檢驗(yàn);③非獨(dú)立正態(tài),重復(fù)測(cè)量資料的方差分析;④非獨(dú)立非正態(tài)M檢第九章

雙變量歸和相關(guān)直線歸滿的件自變量與因變量呈線性關(guān)系、觀察值之間相互立、因變量Y隨機(jī)正態(tài)、對(duì)任何X因變量Y的準(zhǔn)相等。直回歸程一般形式為:

Y為截距

為回歸系數(shù),歸系數(shù)的估計(jì)采最二法殘差平方和最?。┻M(jìn)行估計(jì).。決定數(shù)coefficientdetermination回歸平方和與總平方和的比,2?;乜?cè) ?之無單其數(shù)值大小反映回歸貢獻(xiàn)的相對(duì)程度總變異中回歸模型能夠解釋的百分比。秩關(guān)的應(yīng)用適用范圍不服從雙變量正態(tài)分布而不宜作Pearson相關(guān)分析)總體分布型未知;)等級(jí)資料的相關(guān)分析。。相與歸區(qū)與系區(qū)()別①資:回歸分析資料要求Y為正態(tài)隨機(jī)變量為定變量;相關(guān)分析資料、服雙變量正態(tài)分布。②應(yīng):回歸分析是由一個(gè)變量值推算另一個(gè)變量值(依存關(guān)系相分析只反映兩個(gè)變量間的相互關(guān)系。③回系數(shù)b原度量單位有關(guān),相關(guān)系數(shù)r關(guān)絕對(duì)值越,回歸直線越陡,即X變化1個(gè)位時(shí)Y的均變化越大r的對(duì)值越大有點(diǎn)越趨近于一條直線,變量的關(guān)系越密切,相關(guān)度越高。()系①r與b值可相互換算,

rl

XX

l

;②r與b正負(fù)號(hào)一致;③r與b的假設(shè)檢驗(yàn)等價(jià)對(duì)于同一資料

tb

r

,檢驗(yàn)完全等價(jià);④回可解釋相關(guān)相系數(shù)的平方r2決定系數(shù)是回歸平方和與總的離均差平方和之比()回總應(yīng)直線回歸時(shí)的注意事項(xiàng)(1作回歸分析要有實(shí)際意不能把毫無關(guān)聯(lián)的兩種現(xiàn)作回歸分析,必須對(duì)兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認(rèn)識(shí)。(2)在進(jìn)行直線回歸分析之前,應(yīng)繪制散點(diǎn)圖,當(dāng)觀察點(diǎn)的分布有直線趨勢(shì)時(shí),才適宜作直線回歸分析,散點(diǎn)圖還能提示資料有無異常點(diǎn)。異常點(diǎn)的存在往往對(duì)方程中的系數(shù)(a、b)的估計(jì)產(chǎn)生較大影響.因此,需對(duì)異常點(diǎn)進(jìn)行復(fù).(3建立直線回歸方程后,要對(duì)系數(shù)進(jìn)行假設(shè)檢,確定回歸方程有無意義。(4)直線回歸方程的適用范圍一般自變量的取值范圍為限免外延獲得自變量值的手段也應(yīng)與建立方程時(shí)相同。否則會(huì)產(chǎn)生較大偏差。

jjjjjj第十章

統(tǒng)計(jì)表統(tǒng)計(jì)圖統(tǒng)計(jì)的本求()題概括表的主要內(nèi)容時(shí)間、地點(diǎn)、研究內(nèi)容等在的上方。表編號(hào)與標(biāo)題間間隔一個(gè)漢字距離;如整個(gè)表指標(biāo)統(tǒng)一,還應(yīng)將指標(biāo)的單位標(biāo)在標(biāo)題后面。()目分別用標(biāo)目和縱標(biāo)目說明每行和每列內(nèi)容或數(shù)字的意義,標(biāo)明指標(biāo)的單位。通常描述的對(duì)象為橫標(biāo)目,內(nèi)容(指標(biāo))為縱標(biāo)目,從左向右讀可以構(gòu)成完整的一句話。(3)條至少用條線:頂線、底線和縱標(biāo)線。頂線和底線將表格與文章其他部分分隔開,縱標(biāo)目線將標(biāo)目的文字區(qū)與表格的數(shù)字區(qū)隔開,可用橫線將合計(jì)和兩重縱標(biāo)目隔開,其他豎線和斜線一概省去。頂線和底線線條粗細(xì)一般為1.5,其他線條一般為0.5磅()字用阿拉伯?dāng)?shù)字表.無數(shù)字用-”表示,缺失數(shù)字用…”表示,數(shù)值為0者記為“0留空項(xiàng)數(shù)字按小數(shù)點(diǎn)位數(shù)對(duì)齊,同一指標(biāo)最好保留相同位數(shù)的小數(shù)位數(shù)。()注表中數(shù)字區(qū)不要插入文字。必須說明者表*表下方以備注的形式說明。高級(jí)統(tǒng)計(jì)法第十二

重復(fù)測(cè)資料的方差析重測(cè)量設(shè)計(jì)與隨機(jī)區(qū)組設(shè)計(jì)的區(qū)別重測(cè)量設(shè)計(jì)中“處理”是在區(qū)組(受試者)間隨機(jī)分配,區(qū)組內(nèi)的各時(shí)間點(diǎn)是固定的,不能隨機(jī)分(2重復(fù)測(cè)量設(shè)計(jì)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此不獨(dú)立;。球稱(所有兩兩時(shí)間點(diǎn)變量間差值對(duì)應(yīng)的方差相等,即重復(fù)測(cè)量的誤差的協(xié)方差經(jīng)正交對(duì)比變換后與單位矩陣成比例。。重復(fù)量資料方差分析的資料條:)正性:處因素的各水平樣本個(gè)體間是相互獨(dú)立的隨樣本,其總體均數(shù)服從正態(tài)分布(個(gè)體間獨(dú)立,個(gè)體內(nèi)不獨(dú);(2方差齊性:相互比較的各處理水平的總體方差相,具有方差齊同;(3各時(shí)間點(diǎn)組成的協(xié)方差陣具有球形性特.第十五

多元線回歸分析偏回系多元線性回歸模型中自變量X的數(shù)表示在其他自變量保持不變時(shí)增或減少一個(gè)單位是平均變化量。復(fù)相系(multiplecoefficient):

R

R

,表示因變量Y與個(gè)自變量的線性相關(guān)程度,也是觀察值Y與估計(jì)值Y之間的相關(guān)程度。若只有一個(gè)自變量,r。標(biāo)準(zhǔn)回系:數(shù)據(jù)標(biāo)準(zhǔn)化后得到的標(biāo)準(zhǔn)化回歸方程的回歸系數(shù)即為標(biāo)準(zhǔn)化回歸系數(shù)bj

j

jY

用比較各個(gè)自變量

X

j

對(duì)Y的影響強(qiáng)在有統(tǒng)計(jì)學(xué)意義的前提下標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值越大說明相應(yīng)自變量對(duì)Y的用越大。

?12mi?12mi?。多元線性回歸模

Y22

mm

)應(yīng)足條:與X,…之具有線性關(guān)系;②各觀察值Y相獨(dú)立;③殘服從正態(tài)分布。啞變(dummy):多元線性回歸模型中,當(dāng)自變量為多分類變個(gè)水平)時(shí),需要將原來的多分類變量轉(zhuǎn)化為(g-1)個(gè)啞變量并進(jìn)行編碼,每啞變量只代表兩個(gè)級(jí)別或多個(gè)級(jí)別間的差異應(yīng)用變時(shí)注:①啞變量同時(shí)存,其統(tǒng)計(jì)學(xué)意義是相對(duì)而言的不能采用常規(guī)的逐步回歸進(jìn)行變量選擇可用加與不加入啞變量的偏回歸平方和F檢確定啞變量有無意.。多重線(某些自變量間存在較強(qiáng)的線性關(guān)系,使得個(gè)或幾個(gè)自變量可以由另外的自變量的線性關(guān)系表示該量與另外的自變量間存在多重共線性重共線性可能導(dǎo)致回歸方程不穩(wěn)定、參數(shù)估計(jì)值標(biāo)準(zhǔn)誤變得很大t驗(yàn)不準(zhǔn)確、估計(jì)值的正負(fù)符號(hào)與實(shí)際不符等。。互用當(dāng)某一自變量對(duì)因變量的作用大小與一自變量的取值有關(guān)這兩個(gè)自變量有交互作用否考慮交互作用主要靠專業(yè)知識(shí)判斷了驗(yàn)兩個(gè)自變量是否具有交互作用,普遍的做法是在模型中加入它們的乘積項(xiàng)(作為交互)。線回歸分析的結(jié)解釋:(1)線性回歸方程:

Y0.99733x

;(2)該線性回歸模型的統(tǒng)計(jì)學(xué)檢驗(yàn):模型的方差分析統(tǒng)計(jì)量F,P<0。,說明該線性回歸模型具有統(tǒng)計(jì)學(xué)意(3)的義:該線性回歸模型可以解釋因變量Y總變異的%;(4回歸系數(shù)估計(jì)值b的義:表示對(duì)影的大小每改變一個(gè)單位改變個(gè)位假設(shè)檢驗(yàn)結(jié)果合方差分析結(jié)果的聯(lián)系差析結(jié)果說明X與之間存在的線性關(guān)系,t檢結(jié)果說明計(jì)算得到的回歸系數(shù)b有計(jì)學(xué)意義,在此問題中,二者是等價(jià)的,說明該回歸模型具有統(tǒng)計(jì)學(xué)意義。(5相關(guān)系數(shù)及其檢驗(yàn)結(jié)果并解釋該結(jié)果r=0。,對(duì)r進(jìn)t檢得到。<0.05,則該相系數(shù)具有統(tǒng)計(jì)學(xué)意義,說明X與之間具有中等強(qiáng)度的正相關(guān)關(guān)系。

PjjjjjjjjjPjjjjjjjjj第十六

Logistic歸分析。logistic回模型一般形式:

P

logit(

011

Xmm

。將某事件的陽性與陰性結(jié)果概率之比去自然對(duì)數(shù)稱為logit變換,記logit(回系數(shù)

j

采用最似估(maximumestimate,MLE,在次抽樣中獲得現(xiàn)有樣本的概率最大)得到表示自變量改一單位時(shí)logitP的變量。多變量調(diào)整后的優(yōu)勢(shì)比ORexp(),示扣除其他自變量的影響后危險(xiǎn)因素的作用。=1,jj明X對(duì)疾病發(fā)生不起作用>說是一個(gè)危險(xiǎn)因素<1說X是個(gè)保護(hù)因素的信間:

bj

)

。logistic回模型假設(shè)檢驗(yàn)的方:似比(2(lnLlnL)適合單個(gè)和多個(gè)自變0量的假設(shè)檢)Wald檢驗(yàn)

jS

j

jSb

j

2

適合單個(gè)自變量的假設(shè)檢)計(jì)分檢驗(yàn)適合樣本量較小的情況量選的方法:前進(jìn)法、后退、逐步法。。條logistic回歸適用于M配設(shè)計(jì)資料條件似然函數(shù)估計(jì)的是在M+1個(gè)觀察對(duì)象中恰好第一個(gè)觀察對(duì)象屬于病例組的條件概率,它只估計(jì)了表示危險(xiǎn)因素作用的,j示匹配組效應(yīng)的常數(shù)項(xiàng)被消去。0。有l(wèi)ogistic回基于累積概率構(gòu)建回歸模型g個(gè)別的因變量Y的序logistic歸包括個(gè)程,這些方程的回歸系數(shù)均相同,差別主要體現(xiàn)在各方程的常數(shù)項(xiàng)

0

不同。在對(duì)因變量Y賦時(shí),應(yīng)將專業(yè)上最不利的等級(jí)賦最小最有利的等級(jí)賦最大值。多類logistic回歸是二分類logistic回歸的擴(kuò)展,即選擇一個(gè)參照類別,擬合剩余各類別相對(duì)于參照類別的logistic回模型。第十七

生存分。生存析數(shù)特1同時(shí)考慮生存時(shí)間和生存結(jié)局;)通常含有刪失據(jù)(censoring,能的原因:①研究截止但終點(diǎn)件仍未出現(xiàn);②失去聯(lián)系或其他原因?qū)е率гL③死于其他“事件時(shí)的分布通常不服從正態(tài)分布。統(tǒng)計(jì)分方:于生存時(shí)間一般不呈正態(tài)分布,且需考慮是否為刪失值,所以生存分析有其獨(dú)特的統(tǒng)計(jì)方法。()參法①生率的估計(jì)采用KaplanMeier、壽命表法(頻數(shù)表資料②兩或多組生存率的比較,常用log-rank驗(yàn)時(shí)序法,權(quán)重

i

,對(duì)察期

差敏和檢(權(quán)重

ii

,i

為期初人數(shù),生存時(shí)間增大而逐漸減小,驗(yàn)給觀察早期差別更大權(quán),故觀早期別感).()參法多因素生存分析常采用Cox比例險(xiǎn)型前條:假定風(fēng)險(xiǎn)值(t)/h()固值即協(xié)變量對(duì)生存率的影響不隨時(shí)間的改變而改.驗(yàn)此前提的方法①分類協(xié)變量每組的K-M生曲線無交叉;②協(xié)變量與生存時(shí)間的交互項(xiàng)無統(tǒng)計(jì)學(xué)意義等。其參數(shù)估計(jì)方法為最似法(3參數(shù)法:指數(shù)分布法、分布法等回歸模型。多元性歸回和Cox回歸的同和同()同:①自量可為連續(xù)變量和多分類變量,多分類變量需啞變量化,啞變量在模型中是一個(gè)整體,必須同時(shí)“進(jìn)”同時(shí)“出;②自量間存在較強(qiáng)相關(guān)關(guān)系時(shí)可能導(dǎo)致多重共線性問題;③自量間可能存在交互作用,模型中通常采用自變量的乘積作為交互項(xiàng);④均采用逐步回歸篩選變;⑤均進(jìn)行影響因素分析、混雜因素校正、預(yù)測(cè)分析等。()同:第十八十九章

判別分和聚類分析。判分(discriminant:根據(jù)一批分類明確的樣本在若干指標(biāo)上的觀察值,建立一個(gè)關(guān)于指標(biāo)的判別數(shù)判別則根這個(gè)判別函數(shù)和判別準(zhǔn)則對(duì)新的樣本進(jìn)行分類,并且根據(jù)回代判別的準(zhǔn)確率評(píng)估它的實(shí)用性。判別則它得類間點(diǎn)的距離最大,而類內(nèi)點(diǎn)的距離最小,適合于兩類的判別分析Bayes判準(zhǔn):它使得每一類中的每個(gè)樣本都以最大的概率進(jìn)入該類,適合于多類的判別分析.

ijij。評(píng)估判別函數(shù)的判別效能原始數(shù)據(jù)的分類要可靠準(zhǔn)確標(biāo)變量對(duì)判別函數(shù)的作用要顯著;判別函數(shù)的回代錯(cuò)判率和事后概率錯(cuò)誤率要小。。聚分(Cluster:對(duì)于總體分類未知的一群事物依照“物以類聚”思,把性質(zhì)相近的事物歸入同一類,把性質(zhì)相差較大的事物歸入不同類的一種統(tǒng)計(jì)析方法。聚類析判分的別和系()別①聚分析可以對(duì)樣本進(jìn)行分類,也可以對(duì)指標(biāo)進(jìn)行分類;判別分析只能對(duì)樣本進(jìn)行分類;②聚分析事先不知道事物的類,也不知道應(yīng)分幾類判別分析必須事先知事物的類別也知道應(yīng)分幾;③聚分析不需要分類的歷史資料,能直接對(duì)樣本進(jìn)行分類;而判別分析需要分類歷史資料去建立判別函數(shù),然后才能對(duì)樣本進(jìn)行分類。()系:采用聚類分析獲得各個(gè)個(gè)體的類別();后采用判別分析建立判別函數(shù)對(duì)新個(gè)體進(jìn)行類型識(shí)別((identification)第二十

主成分析和因子分。主成的性質(zhì)(1)主成分互不相關(guān);(2主成分的貢獻(xiàn)率和累積貢獻(xiàn)率:貢獻(xiàn)率越大,表明主成分綜合原始指標(biāo)信息的能力越強(qiáng);累積貢獻(xiàn)率越高,說明前k個(gè)成分綜合原始資料信息的比例越高;)主成分個(gè)數(shù)的選?。孩僖杂?jì)貢獻(xiàn)率確定:累積貢獻(xiàn)率≥%為宜;②以特征根值大小確定特根值1.)因子荷載:因子荷載反主成分與原始指標(biāo)間密切程度與作用方向;(5樣品的主成分得分:根據(jù)主成分表達(dá)式計(jì)算樣品的主成分推斷和評(píng)價(jià)樣品的特性。因模型的性質(zhì):(1公共度:共性方差反全體原始指標(biāo)X對(duì)有公因子的依賴程度;(2)因子貢獻(xiàn)及因子貢獻(xiàn)率:的越大,則F對(duì)始指標(biāo)的影響越;因子荷載及因子荷載矩陣:因子荷載反映公因子與原始指標(biāo)間密切程度與作用方;。主分析因分的區(qū)和系()系①都根據(jù)變量之間內(nèi)部相關(guān)性來提取主要信息,獲得新的變量公因變量和主成分變量)達(dá)到減少變量個(gè)數(shù)降)的目的;②主分分析模型兩端同時(shí)乘以AXA

F

,即為無特殊因子的公因子模型;③因子分析的結(jié)果(主成分解)為主成分分析的結(jié)果,因子分析的主因子解也常常由主成分分析的結(jié)果作為的始值計(jì)。)別主成分分析是將m個(gè)變量提I(I)互相的成,準(zhǔn)確算主分的分其分析重點(diǎn)在通過主分合始量信;因子分析是提I(Im)個(gè)支原量共因和1個(gè)特因,各因子間以不關(guān)相,根據(jù)共性因子得分系數(shù)估計(jì)因得,分析重點(diǎn)是通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論