生物統(tǒng)計學(xué)-總結(jié)_第1頁
生物統(tǒng)計學(xué)-總結(jié)_第2頁
生物統(tǒng)計學(xué)-總結(jié)_第3頁
生物統(tǒng)計學(xué)-總結(jié)_第4頁
生物統(tǒng)計學(xué)-總結(jié)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

生物統(tǒng)計學(xué)總結(jié)緒論統(tǒng)計工作的四大步驟:設(shè)計、搜集、整理、分析統(tǒng)計資料的三大類型:計量資料:對每個觀察值單位用定量方法測得每項指標(biāo)量的大小所得的資料計數(shù)資料:將觀察單位按照某種屬性類別分組,所得的觀察單位數(shù)等級資料:將觀察單位按某種屬性的不同程度分組所得的資料同質(zhì)與變異同質(zhì):除研究因素外,其他因素相同或相近為同質(zhì)變異:觀測值的不齊性總體與樣本:總體:根據(jù)研究目的所確定的同質(zhì)觀察單位的全體=所有研究對象性質(zhì)相同的全體觀察單位某項變量值的集合總體含量:總體中所包含的觀察單位數(shù)有限總體:總體觀察單位數(shù)可數(shù)無限總體:總體觀察單位數(shù)不可數(shù)樣本:從總體中隨機(jī)抽取的部分觀察單位樣本含量:樣本中所包含的觀察單位數(shù)抽樣:從總體中獲得樣本的過程放回式抽樣不放回式抽樣抽樣誤差:因個體變異的存在,由抽樣而導(dǎo)致的樣本指標(biāo)與總體指標(biāo)之差統(tǒng)計量:有樣本所得指標(biāo)或數(shù)參數(shù):由總體所得指標(biāo),關(guān)于特征的表征頻數(shù):完全相同的觀察只出現(xiàn)的次數(shù)頻率:某一觀察值出現(xiàn)的次數(shù)與樣本含量的比值概率:描述某事物發(fā)生可能性大小的一個度量樣本空間:一次實驗所有可能的結(jié)果的集合基本事物:樣本空間每一個可能的結(jié)果小概率事件:P<=0。05或P〈=0。01的事件小概率原理:小概率事件在一次抽樣中不可能發(fā)生計量資料的統(tǒng)計描述集中趨勢的指標(biāo):平均數(shù)定義:描述一組同質(zhì)計量資料的集中趨勢,反映某一組觀察值的平均水平或某一分布的平均位置的指標(biāo)作用:作為一組資料的代表值,可用于組間的分析比較均數(shù)的兩個重要特征代表性離均差和等于0離均差平方最小小于常用平均數(shù)指標(biāo):1.算術(shù)均數(shù)(1)定義:全部觀察值相加之和除以觀察值個數(shù)所得的商總體均數(shù)樣本均數(shù)(2)算法:1)直接法:2)加權(quán)法:3)縮減法(3)注意事項:1)只有在合理分組的基礎(chǔ)上對同質(zhì)數(shù)據(jù)取均數(shù)才有意義2)均數(shù)用于近似正態(tài)分布的對稱分布,尤其是正態(tài)分布2.幾何均數(shù)G(不能用算術(shù)均數(shù)時)(1)定義:幾個觀察值相乘之積,開幾次方所得根(2)計算1)直接法2)(3)應(yīng)用注意:1)幾何均數(shù)適用于觀察值相差很大,甚至呈倍數(shù)關(guān)系(等比或幾何級數(shù)資料)或用于對數(shù)正態(tài)分布資料2)觀察值不能有零,不能同時有正負(fù),若都為負(fù),去符號最后加符號,觀察值比較小或有零,可加1,最后減去3)同一資料求得的幾何均數(shù)小于均數(shù)中位數(shù)M(1)定義:把一組觀察值按大小順序排列,位次居中的(2)計算:1)直接法2)頻數(shù)表法:(3)注意事項1)適用場合:偏態(tài),開口(一端或兩端無界限),分布不清的2)特性:只代表了居中觀察值的特性,敏感性低,不受特小特大值的影響3)對于正態(tài)分布資料,理論上,中位數(shù)=均數(shù)(數(shù)值上)百分位數(shù)(1)定義:將n個觀察值由小到大排列,編上秩次,將n個秩次100等分,與X%秩次相對應(yīng)的數(shù)值,即X的百分位數(shù),是一個位置指標(biāo),以Px表示(x代表百分秩次)Px將整個數(shù)列分為兩半,X%比Px小,1-X%比Px大(2)計算:(3)應(yīng)用注意1)百分位數(shù)常用于描述一組資料(樣本或總體)在某百分位數(shù)上的水平和分布特征,多個百分位數(shù)結(jié)合使用,可全面描述觀察值分布特征,包括位置的大小和變異度2)一般分布中部的百分位數(shù)相當(dāng)穩(wěn)定,代表性好,靠近兩端的百分位數(shù),只在樣本含量足夠大(>120個)才足夠穩(wěn)定,所以當(dāng)樣本含量不夠大時,不宜取兩端百分位數(shù)3)用百分位數(shù)確定正常值范圍,習(xí)慣上95%離散趨勢的描述1.極差R:樣本資料中最大值和最小值之差在一定程度上能說明樣本波動幅度的大小,但它只受樣本中兩個極端個體數(shù)值大小的影響,不能反映樣本中各個觀測值的變異程度,穩(wěn)定性差2。四分位數(shù)間距:是上四分位數(shù)與下四分位數(shù)之差,用四分位數(shù)間距可反映變異程度的大小。穩(wěn)定性好,靈敏度不夠3。標(biāo)準(zhǔn)差:定義:描述一組同質(zhì)計量資料離散程度大小的指標(biāo)反映了均數(shù)對一組觀察值的代表性說明了觀察值圍繞均數(shù)分布的離散程度,個體變異計算:應(yīng)用:表示變量分布的離散程度結(jié)合均數(shù)描述正態(tài)分布特征結(jié)合均數(shù)計算變異系數(shù)結(jié)合樣本含量計算標(biāo)準(zhǔn)誤注意:不同單位,相同標(biāo)準(zhǔn)差,不能比較大個體差異大,變異度大,小個體則變異度小4.變異系數(shù)CV定義:標(biāo)準(zhǔn)差與均數(shù)之比,用百分?jǐn)?shù)表示計算:應(yīng)用:單位不同的幾組資料變異度及均數(shù)相差懸殊的幾組資料的變異度的比較,不單獨(dú)使用自由度ν泛指可以自由取值的變量的個數(shù)正常值:正常動植物解剖生理生化等各種數(shù)據(jù)的波動范圍必要性區(qū)分正常和異常看不同種群在不同時間地域上某一指標(biāo)的差異選取極差中的一部分單側(cè)或雙側(cè)正常值之分,由指標(biāo)實際情況及實驗要求確定方式之一為正常值范圍的百分位數(shù),習(xí)慣上95%雙側(cè):確定P2.5或P97.5單側(cè):P5或P95,看實驗需要計量資料的統(tǒng)計推斷統(tǒng)計推斷用樣本信息推斷總體特征參數(shù)估計:由樣本結(jié)果對總體參數(shù)在一定概率水平下所做出的估計假設(shè)檢驗正態(tài)分布概念:一種連續(xù)型隨機(jī)變量的概率分布密度函數(shù):分布函數(shù):特征:在橫軸上均數(shù)處最高以均數(shù)為中心,左右對稱有兩個參數(shù)曲線下的面積分布有一定的規(guī)律F(x)應(yīng)用:以曲線下的面積反映頻率及概率分布估計正常值范圍或正常值范圍的正態(tài)分布法雙側(cè)正常值范圍質(zhì)量控制正態(tài)分布是很多種統(tǒng)計方法的理論基礎(chǔ)標(biāo)準(zhǔn)正態(tài)分布,u分布Uα與面積的關(guān)系對數(shù)正態(tài)分布原觀察值x呈偏態(tài)(正偏),取對數(shù)后,lgX呈正態(tài)分布x服從對數(shù)正態(tài)分布均數(shù)的抽樣誤差定義:平均數(shù)與總體均數(shù)之差均數(shù)抽樣誤差大小的度量標(biāo)準(zhǔn)誤定義:樣本均數(shù)的標(biāo)準(zhǔn)差意義:反映抽樣誤差的大小是樣本均數(shù)圍繞總體均數(shù)分布的離散程度,衡量了樣本均數(shù)的可靠程度計算:一般一次抽樣估計總體沒有標(biāo)準(zhǔn)誤,只針對樣本用途:計算可信區(qū)間(參數(shù)估計)用于統(tǒng)計推斷(假設(shè)檢驗)t分布t變換與t變量t分布的特征單峰,一0為中心,左右對稱曲線中間比正態(tài)分布低,兩端翹得比正態(tài)分布高有無數(shù)根,中間越低,兩端越翹t分布與自由度有關(guān),自由度越小,中間越低,兩端越翹當(dāng)自由度趨向無窮時,t分布趨向標(biāo)準(zhǔn)正態(tài)分布,tu概率密度函數(shù)與分布函數(shù)t介值與t介值表tα,ν:給定自由度為ν,兩側(cè)雙尾面積之和為α?xí)r,相應(yīng)t值.t分布原理:P(—tα,ν<=t<=tα,ν)=1—α方差分析方差分析又叫變量分析,俗稱F檢驗用途:兩個或多個均數(shù)的比較分離各有關(guān)因素,并分別估計其對變異的作用分析兩個或多個因素的交互作用方差齊性檢驗適用條件(用于多個均數(shù)比較時)個樣本是相互獨(dú)立的隨機(jī)樣本小樣本要求正態(tài)方差齊基本思想:把全部觀察值之間的變異,總變異,按設(shè)計需要,分為兩個或多個組成部分再作分析計算總體均數(shù)的估計總估計區(qū)間估計:定義:按一定的概率估計總體均數(shù)在什么范圍內(nèi)可信區(qū)間:按一定的概率估計總體均數(shù)的可能范圍方式:t分布法:按t分布的原理估計總體均數(shù)在什么范圍內(nèi)適用于總體標(biāo)準(zhǔn)差未知且n〈50的情形總體均數(shù)在可信區(qū)間的概率1-α可信度:1-α置信水平:α通常,我們?nèi)?5%或99%作可信區(qū)間正態(tài)分布法適用于總體標(biāo)準(zhǔn)差已知或n〉50總體標(biāo)準(zhǔn)差已知:n>50:假設(shè)檢驗為什么做假設(shè)檢驗檢驗差別是否由抽樣誤差造成的基本思想假定差別是由抽樣誤差引起的然后計算由抽樣誤差引起這么大,甚至比這更大的差別的概率P根據(jù)小概率原理,作出拒絕或者接受假設(shè)的判斷步驟建立假設(shè),確定檢驗水準(zhǔn)先確定是單側(cè)還是雙側(cè)的若考慮u,u0有誤差別雙側(cè)若不僅考慮差別,還關(guān)注u,u0大小單側(cè)一般認(rèn)為雙側(cè)無效假設(shè)H0:從反證法的基礎(chǔ)上提出的,無論何時,假設(shè)差別是由抽樣誤差造成的,但具體問題具體分析備擇假設(shè)H1:與H0相對立的假設(shè),是依H0而產(chǎn)生的,一旦H0不成立,只能接受H1,現(xiàn)在H0不成立非H0體現(xiàn)單雙側(cè)之分檢驗水準(zhǔn)α:界定小概率事件的一個標(biāo)準(zhǔn)(有單雙側(cè)之分)通常α=0.05選定檢驗方法,計算統(tǒng)計量確定P值,做出統(tǒng)計推斷P值:指由H0所規(guī)定的總體中做隨機(jī)抽樣,獲得等于大于或小于現(xiàn)有統(tǒng)計量的概率.若P〈=α,拒絕H0;若P〉α,接受H0第一類錯誤和第二類錯誤第一類:拒絕實際上成立的H0第二類:不拒絕實際上不成立的H0客觀實際拒絕H0不拒絕H0H0成立第一類錯誤(α)推斷正確(1-α)H0不成立推斷正確(1-β)第二類錯誤(β)可信度1—α把握度β:未知,只能估計,不能單獨(dú)存在,只有與H1結(jié)合才有意義檢驗效能1—β:計量總體卻有差別,按α水準(zhǔn),能夠發(fā)現(xiàn)他們有差別的能力注意樣本的代表性組間的均衡性資料的可比性選用的假設(shè)檢驗方法一定要符合其適用條件正確理解差別有無顯著性的含義(顯著、極顯著不意味著差別的大小)結(jié)論不能絕對化報告要規(guī)范化檢驗方法一、完全隨機(jī)設(shè)計(一)樣本均數(shù)與已知總體均數(shù)比較的假設(shè)檢驗小樣本,總體標(biāo)準(zhǔn)差σ未知t檢驗(要求x取自正態(tài)總體)大樣本,總體標(biāo)準(zhǔn)差σ未知:t檢驗(嚴(yán)格)法2無需來自正態(tài)總體u檢驗(ν∞,tu)法1大樣本,總體標(biāo)準(zhǔn)差σ已知u檢驗(二)兩個樣本均數(shù)比較的假設(shè)檢驗小樣本(有一個就算),總體標(biāo)準(zhǔn)差σ未知,正態(tài)方差齊t檢驗先求合并方差再求兩樣本均數(shù)差的標(biāo)準(zhǔn)誤計算t值小樣本(有一個就算),總體標(biāo)準(zhǔn)差σ未知,方差不齊(非正態(tài))采用適當(dāng)?shù)淖兞孔儞Q使達(dá)到方差齊性的要求采用不要求方差齊的方法比較非參數(shù)統(tǒng)計采用近似的t‘檢驗大樣本u檢驗(不考慮正態(tài)方差齊的情況下,仍可用t檢驗)(三)兩個樣本幾何均數(shù)比較的假設(shè)檢驗對x取反對數(shù),用t檢驗或者u檢驗(四)多個樣本均數(shù)的比較(單因素方差分析)條件:個樣本是相互獨(dú)立的隨機(jī)樣本小樣本要求正態(tài)方差齊*多個樣本均數(shù)間的兩兩比較q檢驗二、配對設(shè)計(一)配對設(shè)計的計量資料的比較小樣本,t檢驗t=三、配伍組設(shè)計(一)多個樣本均數(shù)的比較(兩因素方差分析)多個性質(zhì)相同的配伍,同一配伍組中的N個受試對象分別接受k種處理作用:1??筛纳铺幚斫M間的均衡性2??煞治雠湮橐蛩氐牡挠绊?.提高設(shè)計效率,分析兩個因素*多個樣本均數(shù)間的兩兩比較q檢驗正態(tài)性檢驗一、為什么做正態(tài)性檢驗特定統(tǒng)計方法要求的描述統(tǒng)計平均數(shù)、標(biāo)準(zhǔn)差正常值范圍的正態(tài)統(tǒng)計法統(tǒng)計推斷t檢驗F檢驗二、定義判定資料是否服從正態(tài)分布或樣本是否來自正態(tài)總體的一類檢驗方法三、何時用?為了說明資料是否服從正態(tài)分布一定要做為了滿足特定統(tǒng)計方法的需要可以不做四、怎么做?正態(tài)分布分布的特征:對稱性偏度(正偏、對稱、負(fù)偏)三階偏度系數(shù)g1態(tài)峰翹度(正態(tài)峰、尖峭峰、平闊峰)四階峰度系數(shù)g2方差齊性檢驗一、為什么?t檢驗F檢驗使用條件的要求方差的抽樣波動二、定義說明變量值的變異度有無差別,或者通過樣本信息來推斷總體方差是否相等的一類檢驗方法三、何時做?說明變量值的變異度有無差別時一定做為滿足t、F檢驗方差齊性要求的可不做四、如何做?多個方差的齊性檢驗——X2檢驗變量變換意義:通過改變觀察值的原初形式,使資料正太化,達(dá)到方差齊性的要求,以滿足t檢驗及方差分析的應(yīng)用條件依據(jù):只改變觀察值的分布形式,而不是其相對大小常用方法:對數(shù)變換:以觀察值x的對數(shù)值作為新的分析數(shù)據(jù)常用方式適用場合:使服從對數(shù)正態(tài)分布的資料正態(tài)化使方差達(dá)到方差齊性要求,特別是標(biāo)準(zhǔn)差與均數(shù)的比值接近時使指數(shù)曲線直線化,常用于曲線擬合平方根變換:以原觀察值x的平方根作為新的分析數(shù)據(jù)常用方式適用場合:使服從Poisson分布的計數(shù)資料或輕度偏態(tài)資料正態(tài)化使各樣本的方差與均數(shù)的正比例關(guān)系消除或削弱,達(dá)到方差齊性要求百分?jǐn)?shù)、平方根、正反弦變換以原觀察值用百分?jǐn)?shù)表示,平方根反正弦值作為新的分析數(shù)據(jù)適用場合:總體百分?jǐn)?shù)小于30%或大于70%的情形計數(shù)資料的統(tǒng)計描述和推斷相對數(shù)(一)為什么引入絕對數(shù)不能做進(jìn)一步分析(二)什么是相對數(shù)同一基礎(chǔ)上,兩個有聯(lián)系指標(biāo)之比*常用指標(biāo)率/頻率指標(biāo):用以說明某現(xiàn)象發(fā)生的頻率與強(qiáng)度計算比例基數(shù)—依習(xí)慣而用—使算的的率至少保留1-2位整數(shù)構(gòu)成比/構(gòu)成指標(biāo):用以說明某一事物內(nèi)部各組成部分所占的比重或分布→總和為100%計算*若總和不為100%:超減于大,低加在小相對比:兩個有關(guān)同類指標(biāo)之比,用以說明兩者的對比水平計算*指標(biāo)可為平均數(shù)、絕對數(shù)、相對數(shù)動態(tài)數(shù)列:一系列按時間順序排列起來的統(tǒng)計指標(biāo),用以說明事物延時間發(fā)展的變化與趨勢*指標(biāo)可為平均數(shù)、絕對數(shù)、相對數(shù)*動態(tài)分析:(1)絕對增量=統(tǒng)計期指標(biāo)-基期指標(biāo)說明事物在一定時期增加的絕對數(shù)量可分為逐年的、逐期的:后比前,內(nèi)部波動累計的:基期固定,總體結(jié)果發(fā)展速度、增長速度:反映事物在一定時期的速度變化,可分為定基與環(huán)基發(fā)展速度=統(tǒng)計期指標(biāo)/基期指標(biāo)增長速度=發(fā)展速度-1(三)應(yīng)用相對數(shù)應(yīng)注意的問題計算相對數(shù)的分母一般不宜過小,對于動物實驗,可減小分析時不能以比代率計算觀察單位不等的幾個率的平均值時,不能直接相加求平均資料的對比應(yīng)注意可比性率和構(gòu)成比也可有抽樣誤差→假設(shè)檢驗二項分布及其應(yīng)用(一)概念及其應(yīng)用條件對于某個性狀,常常可以把其資料分成兩個類型。即“非此即彼”兩種情況,彼此構(gòu)成對立事件,我們把這種“非此即彼”事件所構(gòu)成的總體,稱為二項總體,其概率分布稱為二項分布。二項分布的概率密度函數(shù):重復(fù)做①n次相互獨(dú)立的實驗,每次實驗②有相互獨(dú)立的結(jié)果,③P(A)=ΠP(A)=1—Π,則n次實驗中A恰好發(fā)生x次的概率實驗有①②③,則可用二項分布處理分布函數(shù)特征:Π=0.5對稱,正態(tài)0.3≤Π≤0.7近似對稱,近似正態(tài)Π〉0。7或Π〈0。3偏態(tài)嚴(yán)重,離0。5越遠(yuǎn),偏的越厲害二項分布近似正態(tài)分布的條件:Π,1-Π均大于0.01Π不接近0或1nΠ,n(1—Π)均大于5n足夠大二項分布的均數(shù)和標(biāo)準(zhǔn)差、(二)二項分布的應(yīng)用1.總體率的可信區(qū)間點(diǎn)估計區(qū)間估計查表法正態(tài)近似法(條件)樣本率與已知總體率比較的假設(shè)檢驗直接計算概率法利用二項分布的概率密度和分布函數(shù),求出p值,與所用的檢驗水準(zhǔn)α進(jìn)行比較,做出統(tǒng)計推斷適用條件:Π偏離0。5較遠(yuǎn),x較小正態(tài)近似法(條件)兩個樣本率比較的u檢驗(條件)Poisson分布及其應(yīng)用(一)概念及應(yīng)用條件是二項分布的一個特例,當(dāng)Π或1—Π很?。?lt;0。05)而n很大時,二項分布近似于Poisson分布常用于研究單位時間或單位面積或容積內(nèi),某罕見事件發(fā)生次數(shù)的分布概率密度函數(shù):應(yīng)用條件:同二項分布分布函數(shù)特點(diǎn):離散型分布,適用于計數(shù)資料二項分布的特例,應(yīng)用條件同二項分布方差等于均數(shù),σ=λλ≥20時,Poission分布近似正態(tài)分布Poisson分布具有可加性(二)應(yīng)用總體均數(shù)λ的估計(區(qū)間)查表法x≤50正態(tài)近似法樣本均數(shù)與總體均數(shù)的比較直接計算概率法正態(tài)近似法兩個樣本均數(shù)的比較u檢驗兩個樣本觀察單位數(shù)相等兩樣本單位不同時X2檢驗及其應(yīng)用—-同性質(zhì)、適合性、獨(dú)立性檢驗X2分布X2變量ν個標(biāo)準(zhǔn)正態(tài)變量平方和概率密度函數(shù)分布函數(shù)X2介值表X2分布與正態(tài)分布的關(guān)系隨著自由度的增加卡方分布近似于正態(tài)分布當(dāng)ν=1時,二、X2檢驗的基本思想在實際操作中,k個實際頻數(shù)ki與其相應(yīng)的理論頻數(shù)T的差值i=1k表示實際頻數(shù)與理論頻數(shù)的吻合程度*當(dāng)n>40,Ti〉5時,上式①近似X2*可以利用X2值檢驗實際頻數(shù)與按假設(shè)檢驗計算的理論頻數(shù)是否相等的問題*如果假設(shè)成立,那X2≈0;不應(yīng)出現(xiàn)大X2的概率P<α,如果出現(xiàn),則可以懷疑假設(shè)是否成立,進(jìn)而拒絕他,反之不拒絕X2的基本公式X2=TTTν四格表資料處理陽性數(shù)陰性數(shù)合計陽性率1aba+b2cdc+d合計a+cb+dnX2基本公式的專用公式X2=X2校正公式X2=A-T-0.5X2校正公式的專用公式X2=ad-bc四格表的確切概率法P=a+b!配對計數(shù)資料的X2檢驗甲處理乙處理合計+—+aba+b—cdc+d合計a+cb+dn兩種處理有誤差別X2=b-c-1兩種處理有無相關(guān)(雙向有序列聯(lián)表)XR×C列聯(lián)表X2檢驗基本數(shù)據(jù)中多于四格表用途:多個樣本率的比較樣本構(gòu)成比的比較(三個以上)計數(shù)資料的相關(guān)分析基本思想、基本公式、自由度的計算同前X應(yīng)用條件:1。n>402。1<T<5的格子數(shù)不能超過總格子數(shù)的1/53.不能有T<1的格子T過小的處理:增大樣本含量n合并相應(yīng)的行或列刪除相應(yīng)的行或列*多個樣本率/構(gòu)成比的比較,結(jié)論為拒絕H0時,認(rèn)為有差別,但不知其具體,應(yīng)兩兩比較*如果分組標(biāo)志是雙因素的,若其中一組分組標(biāo)志有序單向有序列聯(lián)表.若分析構(gòu)成比X2檢驗,否則用秩和檢驗(一)多個樣本率的比較(k×2表)(二)兩個樣本構(gòu)成比的比較(可推多個)(2×k表)(三)計數(shù)資料的相關(guān)分析(雙向有序列聯(lián)表)頻數(shù)分布擬合優(yōu)度的X2檢驗--判定樣本頻數(shù)分布是否符合某一理論P(yáng)ν非參數(shù)統(tǒng)計*不依賴于總體的分布形式,應(yīng)用時忽略分布類型是否已知*檢驗時比較分布而非參數(shù)*適用范圍廣,不受分布形式限制*可用于不能活未能精確測量的資料,尤其適用等級資料或適合于算中位數(shù)*前提為變量變換后仍不能達(dá)到正態(tài)缺點(diǎn):檢驗效能低=參數(shù)統(tǒng)計×30%適用場合:①等級資料②偏態(tài)分布(經(jīng)變換后不能正態(tài),近似L型)③開口資料④分布不清的⑤方差不齊(經(jīng)變換后仍不能達(dá)到齊性)常用方法:①符號檢驗②秩和檢驗③超越檢驗④游程檢驗⑤等級相關(guān)分析秩和檢驗配對比較的符號秩和檢驗兩個樣本比較的秩和檢驗多個樣本比較的秩和檢驗多個樣本兩兩比較的秩和檢驗t檢驗相關(guān)與回歸分析直線相關(guān)概念兩變量間的關(guān)系直線相關(guān)分析:找出一個適當(dāng)?shù)闹笜?biāo)來描述兩個變量間的直線相關(guān)關(guān)系、相關(guān)密切程度及方向是怎樣的適用條件:雙變量正態(tài)分布或正態(tài)雙變量相關(guān)系數(shù)(指標(biāo))定義:描述兩個變量間有無直線變量關(guān)系及密切程度樣本r總體ρ意義:通過取值描述不同的相關(guān)情形相關(guān)系數(shù)的計算r=0推出ρ=0r的假設(shè)檢驗t檢驗等級相關(guān)用等級數(shù)據(jù)做直線相關(guān)分析適用場合:1。不服從雙變量正態(tài)分布的2.總體分布型未知的3.原始數(shù)據(jù)使用等級表示的等級相關(guān)系數(shù):表明兩變量間的相關(guān)密切程度樣本rs總體ρrs的檢驗:1.查表法2。t檢驗直線回歸一、概念研究兩變量在數(shù)量上的依存關(guān)系直線回歸方程y=a+bx+ε*用容易測量的變量推算不易測得的變量*對資料的要求:1.正態(tài)雙變量:xy&yx的兩個方程(不同)2.至少有一個是正態(tài)變量,必須是y要求x是精確測定的二、直線回歸方程1。一般表達(dá)式*數(shù)學(xué)模型:Y=a+bx+ε*一般表達(dá)式:2。系數(shù)a、b的求法直線回歸方程的圖示回歸系數(shù)的假設(shè)檢驗方差分析(F檢驗)回歸系數(shù)b的t檢驗回歸方程的應(yīng)用描述兩變量間的依存關(guān)系以容易測得的變量去推測不易測得的變量利用回歸方程進(jìn)行預(yù)測預(yù)報(一個區(qū)間)把變量x帶入回歸方程中去估計Y利用直線回歸方程進(jìn)行控制應(yīng)用注意要有實際意義資料要符合要求自變量和因變量的選擇要符合實際直線回歸的范圍只限于取得原始資料的范圍直線回歸方程可以內(nèi)插,一般不能外延回歸方程必須經(jīng)過檢驗相關(guān)與回歸的區(qū)別與聯(lián)系區(qū)別相關(guān)回歸資料要求正態(tài)雙變量至少有一個為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論