醫(yī)藥常用統(tǒng)計方法終-PPT幻燈片_第1頁
醫(yī)藥常用統(tǒng)計方法終-PPT幻燈片_第2頁
醫(yī)藥常用統(tǒng)計方法終-PPT幻燈片_第3頁
醫(yī)藥常用統(tǒng)計方法終-PPT幻燈片_第4頁
醫(yī)藥常用統(tǒng)計方法終-PPT幻燈片_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

主要內(nèi)容統(tǒng)計基本概念1假設(shè)檢驗2常用統(tǒng)計方法3統(tǒng)計圖表4一、統(tǒng)計基本概念醫(yī)學(xué)統(tǒng)計工作的內(nèi)容統(tǒng)計工作貫穿醫(yī)學(xué)研究中的全過程,醫(yī)學(xué)研究中的統(tǒng)計工作包括:研究設(shè)計數(shù)據(jù)搜集數(shù)據(jù)整理數(shù)據(jù)分析醫(yī)學(xué)統(tǒng)計工作的內(nèi)容研究設(shè)計設(shè)計一般包括專業(yè)設(shè)計和統(tǒng)計設(shè)計。專業(yè)設(shè)計即確定調(diào)查題目、內(nèi)容等。統(tǒng)計設(shè)計包括資料收集、整理與分析。實驗三要素:處理因素、受試對象、實驗效應(yīng)設(shè)計四原則:對照、隨機化、重復(fù)、盲法搜集資料:按照設(shè)計要求,原則是及時、準(zhǔn)確、完整地收集原始數(shù)據(jù)。

數(shù)據(jù)來源:病歷、日常醫(yī)療工作記錄、臨床檢查與化驗記錄、疾病監(jiān)測報表、專題研究數(shù)據(jù)整理:對數(shù)據(jù)進行清理、改錯、數(shù)量化數(shù)據(jù)分析:統(tǒng)計描述、統(tǒng)計推斷C.抽樣和抽樣誤差抽樣是指從總體選取樣本的過程,抽樣的目的是用樣本信息來推斷總體特征由于抽樣所造成的樣本指標(biāo)與總體指標(biāo)的差異稱為抽樣誤差

D.概率和小概率事件概率(probability)是反映某一事件發(fā)生的可能性的大小,常用符號P表示。其值在0和1之間。概率等于1的事件是必然事件,概率等于0的事件是不可能事件,隨機事件的概率小于1,而大于0。小概率事件習(xí)慣上是指P<=0.05的事件。E.變量類型定量變量也稱數(shù)值變量,根據(jù)變量的取值之間有無縫隙,將定量變量分為連續(xù)變量和離散變量定性變量也稱分類變量,根據(jù)變量類別之間是否有順序、等級、大小關(guān)系,將定性變量劃分成有序變量和名義變量二、假設(shè)檢驗在臨床研究中常常需要判斷兩種療效有無顯著差異,從而選擇臨床最優(yōu)治療方案,需用到假設(shè)檢驗,亦稱顯著性檢驗基本思想對所估計的總體先提出假設(shè)(原假設(shè)),再用適當(dāng)?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,若可能性小,則認為假設(shè)不成立,若可能性大,不能認為假設(shè)不成立小概率事件在一次試驗中基本不會發(fā)生統(tǒng)計檢驗(假設(shè)檢驗)步驟

:(1)建立假設(shè)檢驗,確定檢驗水平H0:(無效假設(shè))即假設(shè)兩個X所屬總體相同,表達為μ1=μ2

H1:(備擇假設(shè))即假設(shè)兩個X所屬總體不同,表達為μ1≠μ2

α:(檢驗水平)通常取5%,表達為α=0.05

(2)計算統(tǒng)計量t(當(dāng)樣本含量n<100時)

或U(當(dāng)樣本含量n≥100時)(3)確定概率值(P值)

通過t與t0.05(查表可得)比較,或U與1.96(U0.05)比較(4)根據(jù)統(tǒng)計推斷結(jié)果,結(jié)合相應(yīng)的專業(yè)知識,給出結(jié)論假設(shè)檢驗分類參數(shù)檢驗單樣本t檢驗兩獨立樣本t檢驗兩配對樣本t檢驗多樣本均值檢驗非參數(shù)檢驗符號檢驗秩和檢驗Pearson檢驗Kolmogorov-Smirnov檢驗以單樣本t檢驗為例例:正常人血清無機磷總體均數(shù)為4mg/dl,某地隨機抽取16個成人慢性腎炎患者,檢查得血清無機磷均數(shù)為5mg/dl,標(biāo)準(zhǔn)差為1.6mg/dl。問該地成人慢性腎炎患者的血清無機磷是否與正常人有區(qū)別?(即已知:μ=4X=5S=1.6n=16)臨床意義:證實慢性腎炎是否會導(dǎo)致血清無機磷含量的改變,即血清無機磷是否可以作為慢性腎炎的診斷指標(biāo)或療效觀察指標(biāo)。1)H0:μ=μ0(慢性腎炎患者血清無機磷與正常人相同)H1:μ≠μ0(慢性腎炎患者血清無機磷與正常人不同)

2)t=(X–μ)/SX=2.53)ν=n-1=16-1=15

查t值表,得t0.05(15)=2.131

∴t>t0.05(15)

∵P<0.054)可以認為慢性腎炎患者血清無機磷與正常人不同配對樣本t檢驗配對設(shè)計是將受試對象按一定條件配成對子,再隨機分配每隊中的兩個受試者到不同的處理組數(shù)據(jù)形式:在假設(shè)檢驗中,對差值d是否為0做檢驗,其余計算類似于單樣本t檢驗兩獨立樣本t檢驗用來比較兩樣本所來自的總體均數(shù)或總體分布是否相同當(dāng)兩樣本均來自正態(tài)總體且方差齊性時,用t檢驗,當(dāng)兩樣本來自正態(tài)總體但方差不齊時,用矯正的t檢驗,當(dāng)兩樣本來自非正態(tài)總體或分布未知時,用秩和檢驗數(shù)據(jù)形式:治療藥物血紅蛋白增加量新藥組常規(guī)藥組多樣本均值檢驗一般來說t檢驗僅適用于兩個樣本均值的檢驗,當(dāng)檢驗涉及到三個或三個以上樣本均值時,可利用方差分析要求數(shù)據(jù)正態(tài)、獨立、方差齊性基本思想:按實驗設(shè)計和分析目的把全部觀察值之間的總變異分為兩部分或更多部分,然后再作分析。Choosingatestforcomparingtheaveragesof2ormoresamplesofscoresofexperimentswithonetreatmentfactorDataBetweensubjects(independentsamples)Withinsubjects(relatedsamples)2samplesInterval

Independentt-testPairedt-testOrdinalWilcoxon-Mann-WhitneytestWilcoxonsignedrankstest,SigntestNominalChi-squaretestMcNemartest>2samplesInterval

OnewayANOVARepeatedmeasuredANOVAOrdinalKruskal-WallistestFriedmantestNominalChi-squaretestCochran’sQtest(dichotomousdataonly)三、常用統(tǒng)計方法生存分析Logistic回歸分析判別分析聚類分析Meta分析主成分分析1、生存分析醫(yī)學(xué)研究中,為了了解某種疾病的預(yù)后、評價治療方法的優(yōu)劣或觀察預(yù)防保健措施的效果等,常需對研究對象進行追蹤觀察,以獲得必要的數(shù)據(jù),這類資料都屬于隨訪資料。

其研究內(nèi)容主要包括3個方面:①

對生存狀況進行統(tǒng)計描述(生存概率、生存率、中位生存期等);②

尋找影響生存時間的“危險因素”和“保護因素”;③

估計生存率和生存時間長短,進行預(yù)后評價。傳統(tǒng)方法在分析隨訪資料時的困難1、時間和生存結(jié)局都成為了要關(guān)心的因如果將兩者均作為變量擬合多元模型,因為時間分布不明(一般不呈正態(tài)分布,在不同情況下的分布規(guī)律也不同),擬合多元模型極為困難2、存在大量失訪的資料,數(shù)據(jù)刪失失去聯(lián)系(病人搬走,電話號碼改變)無法觀察到結(jié)局(死于其他原因)研究截止關(guān)于截尾或刪失隨訪開始事件失訪失訪研究截止時仍存活研究截止時點患者進入期間刪失的模式圖1.非參數(shù)法:其特點是不論資料是什么樣的分布形式,只根據(jù)樣本提供的順序統(tǒng)計量對生存率進行估計,常用的方法有乘積極限法和壽命表法。2.參數(shù)法:參數(shù)法的特點是假定生存時間服從于特定的參數(shù)分布,根據(jù)已知分布的特點對影響生存的時間進行分析,常用的方法有指數(shù)分布法、Weibull分布法、對數(shù)正態(tài)回歸分析法和對數(shù)logistic回歸分析法等。3.半?yún)?shù)法:半?yún)?shù)法兼有非參數(shù)法和參數(shù)法的特點,主要用于分析影響生存時間和生存率的因素,屬多因素分析方法,典型方法為Cox模型分析法。生存分析的方法乘積極限法(product-limitmethod)非參數(shù)方法,是由Kaplan和Meier在1958年首先提出,故又稱Kaplan-Meier法(K-M法)。用于估計生存率主要適用于樣本含量較小的資料。圖16-2兩種療法治療后白血病患者的生存率曲線Cox比例風(fēng)險回歸模型在醫(yī)學(xué)中,對病人治療效果的考查.一方面要看治療結(jié)局的好壞,另一方面還要看生存時間的長短。生存時間的長短不僅與治療措施有關(guān),還可能與病人的體質(zhì),年齡,病情的輕重等多種因素有關(guān)。如何找出其中哪些因素與生存時間有關(guān)、哪些與它無關(guān)呢?由于失訪、試驗終止等原因造成某些時間的不完全,不能用多元線性回歸分析。

1972年英國統(tǒng)計學(xué)家CoxDR.提出一種比例危險模型方法,能處理多個因素對生存時間影響的問題。設(shè)含有p個變量x1,x2,…,xp及時間T和結(jié)局C的n個觀察對象.其數(shù)據(jù)結(jié)構(gòu)為:編號X1

X2….XPTC1x11

x21…x1py1

12x21x22…x2py2

0………………nxn1xn2…xnpyp.━━━━━━━━━━━━━COX模型:Cox模型的適用范圍Cox模型適用于生存資料的統(tǒng)計分析,屬半?yún)?shù)模型,對資料沒有特殊的要求,也可以估計各因素的參數(shù),并能做多因素的統(tǒng)計分析。該模型的主要優(yōu)點在于能從眾多的影響因素中排除混雜因素的影響,找出影響生存時間的因素,根據(jù)各因素的參數(shù)估計出個體的生存率。另外,Cox模型能分析具有截尾數(shù)值的生存時間。Cox模型在臨床流行病學(xué)分析中,使臨床觀察的定性指標(biāo)又加上定量指標(biāo)進行分析,提高了分析的效率。2、logistic回歸模型Logistic回歸模型概念:研究因變量y取某個值的概率變量p與自變量x的依存關(guān)系模型:由于概率只能取0到1之間的值,為了把因變量擴展到整個實數(shù)范圍,對p做logit變換回歸模型參數(shù)數(shù)學(xué)意義

0(常數(shù)項):所有影響因素均為0時(記作X=0),個體發(fā)生事件概率與不發(fā)生事件的概率之比的自然對數(shù)值。

j的含義:某因素Xj改變一個單位時,個體發(fā)生事件概率與不發(fā)生事件的概率之比的自然對數(shù)值。優(yōu)勢比(oddsratio,OR)或比數(shù)比優(yōu)勢(odds)是指某影響因素控制在某種水平時,事件發(fā)生率與事件不發(fā)生率的比值,即P/(1-P)。某影響因素的兩個不同水平的優(yōu)勢的比值稱為優(yōu)勢比,如某影響因素的一個水平為c1,另一個水平為c0,則這兩個水平的優(yōu)勢比為:優(yōu)勢比(oddsratio,OR)OR表示影響因素對事件發(fā)生的影響方向和影響能力大小。OR>1表示該因素取值越大,事件發(fā)生的概率越大,又稱危險因素。OR<1表示該因素取值越大,事件發(fā)生的概率越小,又稱保護因素。OR=1表示該因素與事件的發(fā)生無關(guān)。

OR與

的關(guān)系=0,OR=1,影響因素與事件的發(fā)生無關(guān)。

>0,OR>1,影響因素的取值越大,事件的發(fā)生的概率越大。

<0,OR<1,影響因素的取值越大,事件的發(fā)生的概率越小。優(yōu)勢比實例結(jié)果吸煙不吸煙合計食管癌患者309(a)126(b)435非食管癌患者208(c)243(d)451合計517(a+c)369(b+d)886吸煙與食管癌關(guān)系的病例對照調(diào)查結(jié)果3、判別分析在我們的日常生活和工作實踐中,常常會遇到判別分析問題,即根據(jù)歷史上劃分類別的有關(guān)資料和某種最優(yōu)準(zhǔn)則,確定一種判別方法,判定一個新的樣本歸屬哪一類。例如,某醫(yī)院有部分患有肺炎、肝炎、冠心病、糖尿病等病人的資料,記錄了每個患者若干項癥狀指標(biāo)數(shù)據(jù)。現(xiàn)在想利用現(xiàn)有的這些資料找出一種方法,使得對于一個新的病人,當(dāng)測得這些癥狀指標(biāo)數(shù)據(jù)時,能夠判定其患有哪種病。這些問題都可以應(yīng)用判別分析方法予以解決。對相似性的刻畫有不同的準(zhǔn)則:最小距離準(zhǔn)則、Fisher準(zhǔn)則、平均損失最小準(zhǔn)則、最小平方準(zhǔn)則、最大概率準(zhǔn)則等判別分析法距離判別法Fisher判別法逐步判別法Logistic回歸判別法Bayes判別法距離判別的思想和方法

例:兩個總體的距離判別問題設(shè)有兩個總體G1和G2,其均值分別是

1和

2,協(xié)方差矩陣為對于一個新的樣品X,要判斷它來自哪個總體一般的想法是計算新樣品X到兩個總體的距離D2(X,G1)和D2(X,G2),并按照如下判別規(guī)則進行判斷其中:對于多總體的判別,方法類似。都是從已知的數(shù)據(jù)出發(fā),建立判別函數(shù),由判別函數(shù)判斷新樣本所屬類別當(dāng)兩總體靠的很近,無論用何種辦法,判錯概率都很大,這時做判別分析是沒有意義的。因此只有當(dāng)兩個總體的均值有顯著差異時,做判別分析才有意義4、聚類分析概念:統(tǒng)計學(xué)家常常采用聚類分析來完成分類的工作。聚類分析是用“物以類聚”的方法將客觀世界中紛紜繁雜的事物加以分門別類,使之系統(tǒng)化和條理化的一種方法。聚類分析事先不知道客觀事物的分類,需要根據(jù)各個樣本或指標(biāo)的數(shù)量表現(xiàn)來進行聚類種類樣品聚類:基于樣品間的距離將樣本進行分類指標(biāo)聚類:基于指標(biāo)間的相關(guān),旨在在每類指標(biāo)中選擇一個代表性較好的指標(biāo),達到指標(biāo)精選的目的聚類方法系統(tǒng)聚類法:首先將n個樣品看成n類,然后將性質(zhì)相近的兩類合并為一個新類,得n-1類,再從n-1類中找出最接近的兩類合并成n-2類,以此類推,最后將所有樣品合并成一類分解法:系統(tǒng)聚類法的逆過程,首先將所有樣品看成一類,然后用某種最優(yōu)準(zhǔn)則將其分成兩類,再依次用相同的準(zhǔn)則進一步裂分,直到每類只有一個樣品為止加入法:假設(shè)已經(jīng)存在一個分類系統(tǒng),新樣品進入時只能加入到聚類圖中已存在的分類中,當(dāng)新樣本全部放入后,就得到新的聚類圖有序樣品聚類:將n個樣品按照某種準(zhǔn)則排序,在聚類的時候只有相鄰的樣品才能在一類中動態(tài)聚類法:開始將n個樣品粗略的分為若干類,然后用某種最優(yōu)準(zhǔn)則對類別進行調(diào)整,直至不能調(diào)整為止最優(yōu)準(zhǔn)則上述5種方法聚類時都需要某種最優(yōu)準(zhǔn)則,這些最優(yōu)準(zhǔn)則即為描述樣品間接近程度的指標(biāo),接近程度可用p維空間點的距離來度量常用的定義類與類距離的方法有最短距離法最長距離法中間距離法可變距離法重心法類平均法S1.S2.S3.S4..S5

.S6S1.S2.S3.S4..S5

.S6S1.S2.S3.S4..S5

.S6例:根據(jù)信息基礎(chǔ)設(shè)施的發(fā)展?fàn)顩r,對世界20個國家和地區(qū)進行分類。5、Meta分析Meta分析醫(yī)學(xué)研究中,針對同一問題,不同研究者得到不一樣的結(jié)論,例:阿司匹林是否能降低心肌梗死,為了對以往的研究結(jié)果綜合評價,得到更加接近真實情況的結(jié)果可使用meta分析是一種基于文獻資料的定量化綜合評價多個同類獨立研究結(jié)果的統(tǒng)計學(xué)方法,常用于臨床試驗、診斷試驗和流行病學(xué)研究等方面的綜合評價可以將針對同一問題的,多個獨立的研究結(jié)果進行定量分析。Meta分析應(yīng)用條件收集的資料要全面確定meta分析研究資料的入選標(biāo)準(zhǔn)及排除標(biāo)準(zhǔn)研究資料效應(yīng)指標(biāo)明確各研究的同質(zhì)性Meta分析步驟擬定研究計劃收集資料根據(jù)入選標(biāo)準(zhǔn)選擇合格的研究復(fù)習(xí)每個研究并進行質(zhì)量評估提取信息,填寫過錄表,建立數(shù)據(jù)庫計算各獨立研究的效應(yīng)大小異質(zhì)性檢驗總結(jié)報告計算各獨立研究的效應(yīng)大小通常兩組間比較時連續(xù)變量平均差值率差(ratedifference)二分變量比值比(OR)相對危險度(RR)異質(zhì)性檢驗(heterogeneity)重要性Meta分析重要的環(huán)節(jié)目的檢查各個獨立研究的結(jié)果是否具有可合并性產(chǎn)生異質(zhì)性的原因研究設(shè)計不同、試驗條件不同試驗所定義的暴露、結(jié)局及其測量方法不同協(xié)變量的存在注意資料的“可合并性”研究結(jié)果(線寬表示其95%CI)研究結(jié)果點估計值,其大小代表該研究在Meta分析中的權(quán)重?zé)o效應(yīng)線各個研究合并后的效應(yīng)估計))總結(jié)報告(森林圖)

6、主成分分析在實證問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為變量。因為每個變量都在不同程度上反映了所研究問題的某些信息,并且指標(biāo)之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復(fù)雜性,人們希望在進行定量分析的過程中,涉及的變量較少,得到的信息量較多。主成分分析正是適應(yīng)這一要求產(chǎn)生的,是解決這類題的理想工具。主成分分析和聚類分析都可以減少原有指標(biāo)(樣品)的個數(shù),但主成分分析是從原有指標(biāo)出發(fā),尋找?guī)讉€綜合指標(biāo)(或樣品)來減少指標(biāo)(或樣品)個數(shù);而聚類分析是先把原有指標(biāo)(或樣品)聚成幾類,再在某一類指標(biāo)(或樣品)中各挑選一個典型指標(biāo)(或樣品)來減少指標(biāo)(或樣品)個數(shù),兩者是不同的。由于兩者都可以減少指標(biāo)(或樣品)各數(shù),因此兩者都可以和其它統(tǒng)計分析方法(如判別分析、回歸分析法)結(jié)合使用。四、常用統(tǒng)計圖表

統(tǒng)計表(statisticaltable)和統(tǒng)計圖(statisticalchart)是統(tǒng)計描述的重要工具。醫(yī)學(xué)科學(xué)研究資料經(jīng)過整理和計算各種必要的統(tǒng)計指標(biāo)后,所得結(jié)果除了用適當(dāng)文字說明以外,常用統(tǒng)計表和統(tǒng)計圖表達分析結(jié)果。統(tǒng)計圖表可以對于數(shù)據(jù)進行概括、對比或做直觀的表達。統(tǒng)計表和統(tǒng)計圖不僅便于閱讀,而且便于分析比較。一、統(tǒng)計表1.概念:指在科技報告中,常將統(tǒng)計分析的事物及其指標(biāo)用表格列出,以反映事物的內(nèi)在規(guī)律性和關(guān)聯(lián)性。2.作用:1)避免繁雜的文字?jǐn)⑹?)便于計算3)便于事物間的比較分析3.統(tǒng)計表的結(jié)構(gòu)

從外形上看,統(tǒng)計表由標(biāo)題、標(biāo)目(包括橫標(biāo)目、縱標(biāo)目)、線條、數(shù)字及必要的文字說明和備注5部分構(gòu)成。其基本格式如表1:

4.統(tǒng)計表的種類

根據(jù)說明事物的主要標(biāo)志(主語)的復(fù)雜程度,統(tǒng)計表可以分成簡單表和復(fù)合表。

l)簡單表:只有一種主要標(biāo)志,即主語按一個標(biāo)志分組。

2)復(fù)合表:有兩種或兩種以上的標(biāo)志,即主語按多個標(biāo)志分組。在安排上可以將部分主語放在表的上方與謂語配合起來。611843合計321418甲硝唑29425替硝唑合計未愈治愈分組表2-1不同藥物治療急性冠周炎效果比較20010025751002575合計100501733501535B10050842501040A合計無效有效合計無效有效合計乙醫(yī)院甲醫(yī)院藥物表2-2A、B兩種藥物在甲、乙兩醫(yī)院的療效5.編制統(tǒng)計表的基本要求

1)重點突出,簡單明了。即一張表只包括一個中心內(nèi)容,表達一個主題。

2)主謂分明,層次清楚。即主謂語的位置準(zhǔn)確,標(biāo)目的安排及分組要層次清楚,符合專業(yè)邏輯。簡單表只有一個分組標(biāo)志,一般作為橫標(biāo)目,而縱標(biāo)目就是統(tǒng)計指標(biāo)名稱。復(fù)合表有兩個以上分組標(biāo)志,一般把其中主要的和分項較多的一個作為橫標(biāo)目,而其余的則安排在縱標(biāo)目上。

3)數(shù)據(jù)準(zhǔn)確、可靠。6.統(tǒng)計表的審查與修改統(tǒng)計表制作是否良好,可以從以下幾方面檢查:1)標(biāo)題是否正確。2)主謂語的排列是否合適,標(biāo)目是否組合重復(fù)。3)表線是否過多過密。

某醫(yī)院對麥牙根糖漿治療急性慢性肝炎161例的療效,資料如表,指出缺點并加以改進。32.95323.63843.57067.1108%例%例%例%例好轉(zhuǎn)近期痊愈小計無效有效

效果總例數(shù)缺點是:1)無標(biāo)題。

2)標(biāo)目組合重復(fù)。

3)主謂語排列不當(dāng)。

100.0161合計43.570近期痊愈23.638好轉(zhuǎn)32.953無效百分比(%)例數(shù)療效表12-8某年某醫(yī)院麥芽根糖漿治療急慢性肝炎的療效觀察二、統(tǒng)計圖1.概念:利用點的位置、線段的升降、直條的長短和面積的大小等各種幾何圖形來表達統(tǒng)計資料和指標(biāo).

2.作用:它將研究對象的特征、內(nèi)部構(gòu)成、相互關(guān)系、對比情況、頻數(shù)分布等情況形象而生動地表達出來,更直觀地反映出事物間的數(shù)量關(guān)系,更易于比較和理解。但對數(shù)量的表達較粗略,從圖中不能獲得確切數(shù)字。

常用統(tǒng)計圖條形圖barchart百分條圖(percentagebarchart)餅圖(piechart)線圖(linediagram)直方圖(histogram)散點圖(scatterdiagram)箱形圖boxplotQ-QplotKaplan-Meier生存曲線ROC曲線空間統(tǒng)計圖條形圖(barchart)

概念:用等寬直條的長短來表示各個相互獨立的指標(biāo)大小的圖形。適用資料:相互獨立的資料(資料有明確分組,不連續(xù))。分類:分為單式和復(fù)式兩種。單式適用于只有一組觀察資料(見圖1),復(fù)式適用于有若干組觀察資料應(yīng)用:相互獨立資料間的比較。百分條圖(percentagebarchart)概念:以長條面積為100%,用長條內(nèi)各段面積所占的百分比來表示各部分在全體中所占的比例適用資料:構(gòu)成比資料。應(yīng)用:描述各部分的百分構(gòu)成。餅圖(piechart)概念:以一個圓面積為100%,用圓內(nèi)各扇形面積所占的百分比來表示各部分所占的構(gòu)成比例適用資料:構(gòu)成比資料。應(yīng)用:描述各部分的百分構(gòu)成。線圖(linediagram)概念:以線段的上升或下降來表示事物在時間上的發(fā)展變化或一種現(xiàn)象隨另一種現(xiàn)象變遷的情況適用資料:連續(xù)性資料。應(yīng)用:反映事物的連續(xù)的動態(tài)變化規(guī)律。直方圖(histogram)概念:以各矩形的面積來代表各組頻數(shù)的多少。適用資料:連續(xù)變量的頻數(shù)分布。應(yīng)用:反應(yīng)某一連續(xù)性變量的分布情況散點圖(scatterdiagram)概念:以點的密集程度和趨勢來表示兩種現(xiàn)象的相關(guān)關(guān)系。適用資料:雙變量資料。應(yīng)用:反映兩事物間的相關(guān)關(guān)系,主要用于相關(guān)回歸分析。箱形圖boxplot概念:一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計圖。因形狀如箱子而得名。適用資料:連續(xù)性變量應(yīng)用:顯示出一組數(shù)據(jù)的最大值、最小值、中位數(shù)、下四分位數(shù)、上四分位數(shù)和異常值,識別數(shù)據(jù)異常值,判斷數(shù)據(jù)偏態(tài)。Q-QplotQQ圖是一種通過畫出分位數(shù)來比較兩個概率分布的圖形方法作用:用于直觀驗證一組數(shù)據(jù)是否來自某個分布,或者驗證某兩組數(shù)據(jù)是否來自同一(族)分布判斷標(biāo)準(zhǔn):散點落在參考直線附近則服從某一分布,如果被比較的兩個分布比較相似,則其QQ圖近似地位于y

=

x上。如果兩個分布線性相關(guān),則QQ圖上的點近似地落在一條直線上,但并不一定是y

=

x這條線。適用資料:連續(xù)性變量Kaplan-Meier生存曲線概念:以生存時間為橫坐標(biāo),生存率為縱坐標(biāo)繪制的階梯狀生存曲線描述:隨時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論