




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第九章回歸分析和方差分析關鍵詞: 單因素試驗一元線性回歸回歸診斷
第九章回歸分析和方差分析關鍵詞:1方差分析(Analysisofvariance,簡稱:ANOVA),是由英國統(tǒng)計學家費歇爾(Fisher)在20世紀20年代提出的,可用于推斷兩個或兩個以上總體均值是否有差異的顯著性檢驗.方差分析(Analysisofvariance,簡稱:2§9.1單因素方差分析例:為了比較三種不同類型日光燈管的壽命(小時),現(xiàn)將從每種類型日光燈管中抽取8個,總共24個日光燈管進行老化試驗,根據(jù)下面經(jīng)老化試驗后測算得出的各個日光燈管的壽命(小時),試判斷三種不同類型日光燈管的壽命是不是有存在差異.§9.1單因素方差分析例:為了比較三種不同類型日光燈管的壽命3日光燈管的壽命(小時)類型壽命(小時)類型I52906210574050005930612060805310類型II58405500598062506470599054705840類型.III71306660634064707580656072906730引起日光燈管壽命不同的原因有二個方面:其一,由于日光燈類型不同,而引起壽命不同.其二,同一種類型日光燈管,由于其它隨機因素的影響,也使其壽命不同.日光燈管的壽命(小時)類型壽命(小時)類型I52906214在方差分析中,通常把研究對象的特征值,即所考察的試驗結果(例如日光燈管的壽命)稱為試驗指標.對試驗指標產生影響的原因稱為因素,“日光燈管類型”即為因素.因素中各個不同狀態(tài)稱為水平,如日光燈管三個不同的類型,即為三個水平.在方差分析中,通常把研究對象的特征值,即所考察的試驗結果5單因素方差分析僅考慮有一個因素A對試驗指標的影響.假如因素A有r個水平,分別在第i水平下進行了多次獨立觀測,所得到的試驗指標的數(shù)據(jù)單因素方差分析僅考慮有一個因素A對試驗指標的影響.假如因6每個總體相互獨立.因此,可寫成如下的數(shù)學模型:每個總體相互獨立.因此,可寫成如下的數(shù)學模型:7
方差分析的目的就是要比較因素A的r個水平下試驗指標理論均值的差異,問題可歸結為比較這r個總體的均值差異.方差分析的目的就是要比較因素A的r個水平下試驗指標理論8檢驗假設檢驗假設9假設等價于假設等價于10為給出上面的檢驗,主要采用的方法是平方和分解。假設數(shù)據(jù)總的差異用總離差平方和分解為二個部分:一部分是由于因素A引起的差異,即效應平方和另一部分則由隨機誤差所引起的差異,即誤差平方和。為給出上面的檢驗,主要采用的方法是平方和分解。11數(shù)理統(tǒng)計的基本概念課件12證明:
證明:13數(shù)理統(tǒng)計的基本概念課件14數(shù)理統(tǒng)計的基本概念課件15數(shù)理統(tǒng)計的基本概念課件16數(shù)理統(tǒng)計的基本概念課件17定理9.1.1定理9.1.118方差來源平方和自由度均方F比因素As-1誤差n-s總和n-1單因素試驗方差分析表方差來源平方和自由度均方F比因素As-1誤差n-s總和n-119數(shù)理統(tǒng)計的基本概念課件20
例1設有5種治療蕁麻疹的藥,要比較它們的療效。假設將30個病人分成5組,每組6人,令同組病人使用一種藥,并記錄病人從使用藥物開始到痊愈所需時間,得到下面的記錄:(=0.05)例1設有5種治療蕁麻疹的藥,要比較它們的療效。假設將3021藥物x治愈所需天數(shù)y15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6藥物x治愈所需天數(shù)y15,8,7,7,10,824,6,6,22這里藥物是因子,共有5個水平,這是一個單因素方差分析問題,要檢驗的假設是“所有藥物的效果都沒有差別”。
這里藥物是因子,共有5個水平,這是一個單因素方差分析問題,要23數(shù)理統(tǒng)計的基本概念課件24方差來源平方和自由度均方F比因素A36.46749.1173.90誤差58.500252.334總和94.96729方差來源平方和自由度均方F比因素A36.46749.11725未知參數(shù)的估計未知參數(shù)的估計26數(shù)理統(tǒng)計的基本概念課件27數(shù)理統(tǒng)計的基本概念課件28數(shù)理統(tǒng)計的基本概念課件29在Excel上實現(xiàn)方差分析先加載''數(shù)據(jù)分析"這個模塊,方法如下:在excel工作表中點擊主菜單中“工具”點擊下拉式菜單中“加載宏”就會出現(xiàn)一個“加載宏”的框.在“分析工具庫”前的框內打勾點擊“確定”.這時候再點擊下拉式菜單會新出現(xiàn)“數(shù)據(jù)分析”.然后就可以進行統(tǒng)計分析了.在Excel上實現(xiàn)方差分析先加載''數(shù)據(jù)分析"這個模塊,方30以下面的例子來說明用Excel進行方差分析的方法:保險公司某一險種在四個不同地區(qū)一年的索賠額情況記錄如表所示.試判斷在四個不同地區(qū)索賠額有無顯著的差異?以下面的例子來說明用Excel進行方差分析的方法:保險公司某31保險索賠記錄地區(qū)索賠額(萬元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.60保險索賠記錄地區(qū)索賠額(萬元)A11.601.611.65132在Excel工作表中輸入上面的數(shù)據(jù)點擊主菜單中“工具”點擊下拉式菜單中“數(shù)據(jù)分析”就會出現(xiàn)一個“數(shù)據(jù)分析”的框.點擊菜單中“方差分析:單因素方差分析”點擊“確定”,出現(xiàn)“方差分析:單因素方差分析”框.在Excel工作表中輸入上面的數(shù)據(jù)點擊主菜單中“工具”點擊33在“輸入?yún)^(qū)域”中標定你已經(jīng)輸入的數(shù)據(jù)的位置根據(jù)你輸入數(shù)據(jù)分組情況(是按行分或按列分)確定分組.選定方差分析中F檢驗的顯著水平選定輸出結果的位置點擊“確定”.在你指定的區(qū)域中出現(xiàn)如下方差分析表:在“輸入?yún)^(qū)域”中標定你已經(jīng)輸入的數(shù)據(jù)的位置根據(jù)你輸入數(shù)據(jù)分組34方差來源平方和自由度均方F比P-valueFcrit組內0.049230.01642.16580.12083.0491組間0.1666220.0076總計0.215825方差分析表方差來源平方和自由度均方F比P-valueFcrit組內035根據(jù)Excel給出的方差分析表,假設H0的判別有二種方法:根據(jù)Excel給出的方差分析表,假設H0的判別有二種方法:36數(shù)理統(tǒng)計的基本概念課件37方差分析的前提方差分析的前提38方差分析和其它統(tǒng)計推斷一樣,樣本的獨立性對方差分析是非常重要的,在實際應用中會經(jīng)常遇到非隨機樣本的情況,這時使用方差分析得出的結論不可靠.因此,在安排試驗或采集數(shù)據(jù)的過程中,一定要注意樣本的獨立性問題.方差分析和其它統(tǒng)計推斷一樣,樣本的獨立性對方差分析是非常重39在實際中,沒有一個總體真正服從正態(tài)分布的,但方差分析卻依賴于正態(tài)性的假設.但經(jīng)驗可知,方差分析F.檢驗對正態(tài)性的假設并不是非常敏感,也就是說,實際所得到的數(shù)據(jù),如果沒有異常值和偏性,或者說,數(shù)據(jù)顯示的分布比較對稱的話,即使樣本容量比較小(如每個水平下的樣本容量僅為5左右),方差分析的結果仍是值得依賴的.在實際中,沒有一個總體真正服從正態(tài)分布的,但方差分析卻依40方差齊性對于方差分析是非常重要的,因此在方差分析之前往往要進行方差齊性的診斷,即檢驗假設通常可采用Barlett檢驗.方差齊性檢驗也可采用如下的經(jīng)驗準則:當最大樣本標準差不超過最小樣本標準差的兩倍時,方差分析F檢驗結果近似正確.方差齊性對于方差分析是非常重要的,因此在方差分析之前往往要41§3一元線性回歸分析一、確定性關系:當自變量給定一個值時,就確定應變量的值與之對應。如:在自由落體中,物體下落的高度h與下落時間t之間有函數(shù)關系:
變量與變量之間的關系
§3一元線性回歸分析一、確定性關系:變量與變量之間的關系42二、相關性關系:
變量之間的關系并不確定,而是表現(xiàn)為具有隨機性的一種“趨勢”。即對自變量x的同一值,在不同的觀測中,因變量Y可以取不同的值,而且取值是隨機的,但對應x在一定范圍的不同值,對Y進行觀測時,可以觀察到Y隨x的變化而呈現(xiàn)有一定趨勢的變化。二、相關性關系:43如:身高與體重,不存在這樣的函數(shù)可以由身高計算出體重,但從統(tǒng)計意義上來說,身高者,體也重。如:父親的身高與兒子的身高之間也有一定聯(lián)系,通常父親高,兒子也高。如:身高與體重,不存在這樣的函數(shù)可以由身高計算出體重,但從統(tǒng)44我們以一個例子來建立回歸模型某戶人家打算安裝太陽能熱水器.為了了解室外溫度與燃氣消耗的關系,記錄了16個月燃氣的消耗量,數(shù)據(jù)見下表.我們以一個例子來建立回歸模型某戶人家打算安裝太陽能熱水器.45月份平均溫度燃氣用量月份平均溫度燃氣用量Nov.246.3Jul.01.2Dec.5110.9Aug.11.2Jan.438.9Sep.62.1Feb.337.5Oct.123.1Mar.265.3Nov.306.4Apr.134Dec.327.2May.41.7Jan.5211Jun.01.2Feb.306.9月份平均溫度燃氣用量月份平均溫度燃氣用量Nov.246.46在回歸分析時,我們稱“燃氣消耗量”為響應變量記為Y,“室外溫度”為解釋變量記為X,由所得數(shù)據(jù)計算相關系數(shù)得r=0.995,表明室外溫度與燃氣消耗之間有非常好的線性相關性.如果以室外溫度作為橫軸,以消耗燃氣量作為縱軸,得到散點圖的形狀大致呈線形.在回歸分析時,我們稱“燃氣消耗量”為響應變量記為Y,“室外47數(shù)理統(tǒng)計的基本概念課件48數(shù)理統(tǒng)計的基本概念課件49數(shù)理統(tǒng)計的基本概念課件50數(shù)理統(tǒng)計的基本概念課件51數(shù)理統(tǒng)計的基本概念課件52一元線性回歸要解決的問題:一元線性回歸要解決的問題:53參數(shù)估計參數(shù)估計54數(shù)理統(tǒng)計的基本概念課件55整理得正規(guī)方程系數(shù)行列式整理得正規(guī)方程系數(shù)行列式56數(shù)理統(tǒng)計的基本概念課件57數(shù)理統(tǒng)計的基本概念課件58
在誤差為正態(tài)分布假定下,最小二乘估計等價于極大似然估計。在誤差為正態(tài)分布假定下,最小二乘估計等價于極大似然估計。59采用最大似然估計給出參數(shù)a,b的估計與最小二乘法給出的估計完全一致。采用最大似然估計給出誤差的估計與最小二乘法給出的估計不一致。此時給出的估計不是無偏估計。采用最大似然估計給出參數(shù)a,b的估計與最小二乘法給出的估計60例1K.Pearson收集了大量父親身高與兒子身高的資料。其中十對如下:父親身高x(吋)60626465666768707274兒子身高y(吋)63.665.26665.566.967.167.468.370.170求Y關于x的線性回歸方程。例1K.Pearson收集了大量父親身高與兒子身高的資料61數(shù)理統(tǒng)計的基本概念課件62參數(shù)性質參數(shù)性質63即為正態(tài)隨機變量的線性組合,所以服從正態(tài)分布。證明(1)即為正態(tài)隨機變量的線性組合,所以服從正態(tài)分布。證明(1)64(2)類似可得。(2)類似可得。65回歸方程顯著性檢驗采用最小二乘法估計參數(shù)a和b,并不需要事先知道Y與x之間一定具有相關關系。因此μ(x)是否為x的線性函數(shù):一要根據(jù)專業(yè)知識和實踐來判斷,二要根據(jù)實際觀察得到的數(shù)據(jù)用假設檢驗方法來判斷?;貧w方程顯著性檢驗采用最小二乘法估計參數(shù)a和66(1)影響Y取值的,除了x,還有其他不可忽略的因素;(2)E(Y)與x的關系不是線性關系,而是其他關系;(3)Y與x不存在關系。若原假設被拒絕,說明回歸效果是顯著的,否則,若接受原假設,說明Y與x不是線性關系,回歸方程無意義。回歸效果不顯著的原因可能有以下幾種:(1)影響Y取值的,除了x,還有其他不可忽略的因素;若原假設67假設的檢驗統(tǒng)計量與方差分析方法類似,仍采用平方和分解。假設的檢驗統(tǒng)計量與方差分析方法類似,仍采用平方和分解。68可以證明:可以證明:69可以證明,由參數(shù)估計的性質可知,當b=0時,
可以證明,由參數(shù)估計的性質可知,當b=0時,70數(shù)理統(tǒng)計的基本概念課件71數(shù)理統(tǒng)計的基本概念課件72也可采用t檢驗也可采用t檢驗73例3檢驗例1中回歸效果是否顯著,取α=0.05。例3檢驗例1中回歸效果是否顯著,取α=0.05。74回歸系數(shù)的置信區(qū)間由于回歸系數(shù)的置信區(qū)間由于75數(shù)理統(tǒng)計的基本概念課件76回歸參數(shù)估計和顯著性檢驗的Excel實現(xiàn)
例1(續(xù))前面我們已經(jīng)分析了室外溫度與燃氣消耗量之間的關系,認為兩者具有較好的線性關系,下面我們進一步建立燃氣消耗量(響應變量)與室外溫度(解釋變量)之間的回歸方程.采用Excel中的“數(shù)據(jù)分析”模塊.在Excel工作表中輸入上面的數(shù)據(jù)點擊主菜單中“工具”點擊下拉式菜單中“數(shù)據(jù)分析”就會出現(xiàn)一個“數(shù)據(jù)分析”的框,點擊菜單中“回歸”,點擊“確定”,出現(xiàn)“回歸”框.回歸參數(shù)估計和顯著性檢驗的Excel實現(xiàn)例1(續(xù)77在“Y值輸入?yún)^(qū)域”中標定你已經(jīng)輸入的響應變量數(shù)據(jù)的位置,在“X值輸入?yún)^(qū)域”中標定你已經(jīng)輸入的解釋變量數(shù)據(jù)的位置(注意:數(shù)據(jù)安“列”輸入)“置信度”中輸入你已經(jīng)確定置信度的值選定輸出結果的位置點擊“確定”.在指定位置輸出相應的方差分析表和回歸系數(shù)輸出結果,例1的輸出結果如下所示,在“Y值輸入?yún)^(qū)域”中標定你已經(jīng)輸入的響應變量數(shù)據(jù)的位置,78
dfSSMSFSignificanceF回歸1168.581168.5811467.5511.415E-15誤差141.6080.115總的15170.189方差分析表dfSSMSFSignificanceF回歸116879
Coef.標準誤差tStatPvalueLower95%Upper95%Intercept1.0890.1397.8411.729E-060.7911.387X0.1890.00538.3091.415E-150.1780.200方差分析中,給出了假設檢驗H0:b=0的F檢驗.方差分析表中各項也前一節(jié)方差分析表中的意義類似.值得注意的是,方差分析表中``MS“列中,相應于``誤差”行的值即為模型誤碼差方差的估計,即=0.115.Coef.80數(shù)理統(tǒng)計的基本概念課件81數(shù)理統(tǒng)計的基本概念課件82預測預測一般有兩種意義.預測預測一般有兩種意義.83數(shù)理統(tǒng)計的基本概念課件84數(shù)理統(tǒng)計的基本概念課件85數(shù)理統(tǒng)計的基本概念課件86數(shù)理統(tǒng)計的基本概念課件87數(shù)理統(tǒng)計的基本概念課件88數(shù)理統(tǒng)計的基本概念課件89數(shù)理統(tǒng)計的基本概念課件90例合金鋼的強度y與鋼材中碳的含量x有密切關系。為了冶煉出符合要求強度的鋼常常通過控制鋼水中的碳含量來達到目的,為此需要了解y與x之間的關系。其中x:碳含量(%)y:鋼的強度(kg/mm2)數(shù)據(jù)見下:x0.030.040.050.070.090.100.120.150.170.20y40.539.541.041.543.042.045.047.553.056.0例合金鋼的強度y與鋼材中碳的含量x有密切關系。為了冶煉出符91(1)畫出散點圖;(2)設μ(x)=a+bx,求a,b的估計;(3)求誤差方差的估計,畫出殘差圖;(4)檢驗回歸系數(shù)b是否為零(取α=0.05);(5)求回歸系數(shù)b的95%置信區(qū)間;(6)求在x=0.06點,回歸函數(shù)的點估計和95%置信區(qū)間;(7)求在x=0.06點,Y的點預測和95%區(qū)間預測。
(1)畫出散點圖;920.030.050.070.090.110.130.150.170.1956545250484644424038(1)合金鋼的強度y與鋼材中碳的含量x的散點圖0.030.0593數(shù)理統(tǒng)計的基本概念課件94數(shù)理統(tǒng)計的基本概念課件95數(shù)理統(tǒng)計的基本概念課件960.030.050.070.090.110.130.150.170.19x0e0.030.05970.030.050.070.090.110.130.150.170.1956545250484644424038合金鋼的強度y與鋼材中碳的含量x的回歸直線圖0.030.0598顯著水平為0.05顯著水平為0.0599數(shù)理統(tǒng)計的基本概念課件100數(shù)理統(tǒng)計的基本概念課件101回歸診斷回歸函數(shù)線性的診斷誤差方差齊性診斷誤差的獨立性診斷誤差的正態(tài)性診斷回歸診斷回歸函數(shù)線性的診斷102一、回歸函數(shù)線性的診斷一、回歸函數(shù)線性的診斷103數(shù)理統(tǒng)計的基本概念課件104數(shù)理統(tǒng)計的基本概念課件105數(shù)理統(tǒng)計的基本概念課件106數(shù)理統(tǒng)計的基本概念課件107數(shù)理統(tǒng)計的基本概念課件108(2)模型修正
(2)模型修正
109數(shù)理統(tǒng)計的基本概念課件110模型修改后的預測值及殘差模型修改后的預測值及殘差111模型修改后的殘差圖模型修改后的殘差圖112二、誤差方差齊性診斷二、誤差方差齊性診斷113數(shù)理統(tǒng)計的基本概念課件114數(shù)理統(tǒng)計的基本概念課件115數(shù)理統(tǒng)計的基本概念課件116數(shù)理統(tǒng)計的基本概念課件117數(shù)理統(tǒng)計的基本概念課件118(2)模型修正如果發(fā)現(xiàn)線性假設是不適合,那么就需要修改模型.在目前的回歸分析的知識水平下,不一定能很好地修改誤差方差不相等這類模型,但可以嘗試響應變量的數(shù)據(jù)變換。(2)模型修正如果發(fā)現(xiàn)線性假設是不適合,那么就需要修改模型119用變換后的數(shù)據(jù),求出線性回歸方程,求出殘差,并畫出以擬合值主義為橫座標的殘差圖,如果這里殘差圖已經(jīng)沒有任何規(guī)律,那么說明這種變換是適合的.用變換后的數(shù)據(jù),求出線性回歸方程,求出殘差,并畫出以擬120數(shù)理統(tǒng)計的基本概念課件121三、誤差的獨立性診斷在不少有關時間問題中,觀測值往往呈相關的趨勢。如河流的水位總有一個變化過程,當一場暴雨使河流水位上漲后往往需要幾天才能使水位降低,因而當我們逐日測定河流最高水位時,相鄰兩天的觀測間就不一定獨立。三、誤差的獨立性診斷在不少有關時間問題中,觀測值往往呈相關的122(1)模型診斷
常用的殘差圖是以“時間”或“序號”為橫座標的殘差圖.相關性大約有二類.(1)模型診斷常用的殘差圖是以“時間”或“序號”為橫123一類是正相關,隨機誤差之間具有正相關的話,那么殘差圖中殘差``符號"會出現(xiàn)``集團性"的趨勢,即連續(xù)有一段時間內殘差均為``正號",然后又一段時間內殘差均為``負號"另一類是負相關,此時,殘差的符號改變非常頻繁,大致有正負相間的趨勢.一類是正相關,隨機誤差之間具有正相關的話,那么殘差圖中殘差124殘差圖殘差圖125殘差圖殘差圖126(2)模型修改(2)模型修改127數(shù)理統(tǒng)計的基本概念課件128數(shù)理統(tǒng)計的基本概念課件129四、誤差的正態(tài)性診斷我們可采用卡方擬合檢驗對殘差進行正態(tài)性的檢驗,也可以用殘差畫一下直方圖,直觀地判斷殘差量不是具有正態(tài)性.如果模型的誤差不滿足正態(tài)性時,一般可以作Box-Cox變換,這部分的內容這里不詳細介紹,有興趣的同學可以參考有關的回歸分析的參考文獻.四、誤差的正態(tài)性診斷我們可采用卡方擬合檢驗對殘差進行正態(tài)性的130第九章回歸分析和方差分析關鍵詞: 單因素試驗一元線性回歸回歸診斷
第九章回歸分析和方差分析關鍵詞:131方差分析(Analysisofvariance,簡稱:ANOVA),是由英國統(tǒng)計學家費歇爾(Fisher)在20世紀20年代提出的,可用于推斷兩個或兩個以上總體均值是否有差異的顯著性檢驗.方差分析(Analysisofvariance,簡稱:132§9.1單因素方差分析例:為了比較三種不同類型日光燈管的壽命(小時),現(xiàn)將從每種類型日光燈管中抽取8個,總共24個日光燈管進行老化試驗,根據(jù)下面經(jīng)老化試驗后測算得出的各個日光燈管的壽命(小時),試判斷三種不同類型日光燈管的壽命是不是有存在差異.§9.1單因素方差分析例:為了比較三種不同類型日光燈管的壽命133日光燈管的壽命(小時)類型壽命(小時)類型I52906210574050005930612060805310類型II58405500598062506470599054705840類型.III71306660634064707580656072906730引起日光燈管壽命不同的原因有二個方面:其一,由于日光燈類型不同,而引起壽命不同.其二,同一種類型日光燈管,由于其它隨機因素的影響,也使其壽命不同.日光燈管的壽命(小時)類型壽命(小時)類型I5290621134在方差分析中,通常把研究對象的特征值,即所考察的試驗結果(例如日光燈管的壽命)稱為試驗指標.對試驗指標產生影響的原因稱為因素,“日光燈管類型”即為因素.因素中各個不同狀態(tài)稱為水平,如日光燈管三個不同的類型,即為三個水平.在方差分析中,通常把研究對象的特征值,即所考察的試驗結果135單因素方差分析僅考慮有一個因素A對試驗指標的影響.假如因素A有r個水平,分別在第i水平下進行了多次獨立觀測,所得到的試驗指標的數(shù)據(jù)單因素方差分析僅考慮有一個因素A對試驗指標的影響.假如因136每個總體相互獨立.因此,可寫成如下的數(shù)學模型:每個總體相互獨立.因此,可寫成如下的數(shù)學模型:137
方差分析的目的就是要比較因素A的r個水平下試驗指標理論均值的差異,問題可歸結為比較這r個總體的均值差異.方差分析的目的就是要比較因素A的r個水平下試驗指標理論138檢驗假設檢驗假設139假設等價于假設等價于140為給出上面的檢驗,主要采用的方法是平方和分解。假設數(shù)據(jù)總的差異用總離差平方和分解為二個部分:一部分是由于因素A引起的差異,即效應平方和另一部分則由隨機誤差所引起的差異,即誤差平方和。為給出上面的檢驗,主要采用的方法是平方和分解。141數(shù)理統(tǒng)計的基本概念課件142證明:
證明:143數(shù)理統(tǒng)計的基本概念課件144數(shù)理統(tǒng)計的基本概念課件145數(shù)理統(tǒng)計的基本概念課件146數(shù)理統(tǒng)計的基本概念課件147定理9.1.1定理9.1.1148方差來源平方和自由度均方F比因素As-1誤差n-s總和n-1單因素試驗方差分析表方差來源平方和自由度均方F比因素As-1誤差n-s總和n-1149數(shù)理統(tǒng)計的基本概念課件150
例1設有5種治療蕁麻疹的藥,要比較它們的療效。假設將30個病人分成5組,每組6人,令同組病人使用一種藥,并記錄病人從使用藥物開始到痊愈所需時間,得到下面的記錄:(=0.05)例1設有5種治療蕁麻疹的藥,要比較它們的療效。假設將30151藥物x治愈所需天數(shù)y15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6藥物x治愈所需天數(shù)y15,8,7,7,10,824,6,6,152這里藥物是因子,共有5個水平,這是一個單因素方差分析問題,要檢驗的假設是“所有藥物的效果都沒有差別”。
這里藥物是因子,共有5個水平,這是一個單因素方差分析問題,要153數(shù)理統(tǒng)計的基本概念課件154方差來源平方和自由度均方F比因素A36.46749.1173.90誤差58.500252.334總和94.96729方差來源平方和自由度均方F比因素A36.46749.117155未知參數(shù)的估計未知參數(shù)的估計156數(shù)理統(tǒng)計的基本概念課件157數(shù)理統(tǒng)計的基本概念課件158數(shù)理統(tǒng)計的基本概念課件159在Excel上實現(xiàn)方差分析先加載''數(shù)據(jù)分析"這個模塊,方法如下:在excel工作表中點擊主菜單中“工具”點擊下拉式菜單中“加載宏”就會出現(xiàn)一個“加載宏”的框.在“分析工具庫”前的框內打勾點擊“確定”.這時候再點擊下拉式菜單會新出現(xiàn)“數(shù)據(jù)分析”.然后就可以進行統(tǒng)計分析了.在Excel上實現(xiàn)方差分析先加載''數(shù)據(jù)分析"這個模塊,方160以下面的例子來說明用Excel進行方差分析的方法:保險公司某一險種在四個不同地區(qū)一年的索賠額情況記錄如表所示.試判斷在四個不同地區(qū)索賠額有無顯著的差異?以下面的例子來說明用Excel進行方差分析的方法:保險公司某161保險索賠記錄地區(qū)索賠額(萬元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.60保險索賠記錄地區(qū)索賠額(萬元)A11.601.611.651162在Excel工作表中輸入上面的數(shù)據(jù)點擊主菜單中“工具”點擊下拉式菜單中“數(shù)據(jù)分析”就會出現(xiàn)一個“數(shù)據(jù)分析”的框.點擊菜單中“方差分析:單因素方差分析”點擊“確定”,出現(xiàn)“方差分析:單因素方差分析”框.在Excel工作表中輸入上面的數(shù)據(jù)點擊主菜單中“工具”點擊163在“輸入?yún)^(qū)域”中標定你已經(jīng)輸入的數(shù)據(jù)的位置根據(jù)你輸入數(shù)據(jù)分組情況(是按行分或按列分)確定分組.選定方差分析中F檢驗的顯著水平選定輸出結果的位置點擊“確定”.在你指定的區(qū)域中出現(xiàn)如下方差分析表:在“輸入?yún)^(qū)域”中標定你已經(jīng)輸入的數(shù)據(jù)的位置根據(jù)你輸入數(shù)據(jù)分組164方差來源平方和自由度均方F比P-valueFcrit組內0.049230.01642.16580.12083.0491組間0.1666220.0076總計0.215825方差分析表方差來源平方和自由度均方F比P-valueFcrit組內0165根據(jù)Excel給出的方差分析表,假設H0的判別有二種方法:根據(jù)Excel給出的方差分析表,假設H0的判別有二種方法:166數(shù)理統(tǒng)計的基本概念課件167方差分析的前提方差分析的前提168方差分析和其它統(tǒng)計推斷一樣,樣本的獨立性對方差分析是非常重要的,在實際應用中會經(jīng)常遇到非隨機樣本的情況,這時使用方差分析得出的結論不可靠.因此,在安排試驗或采集數(shù)據(jù)的過程中,一定要注意樣本的獨立性問題.方差分析和其它統(tǒng)計推斷一樣,樣本的獨立性對方差分析是非常重169在實際中,沒有一個總體真正服從正態(tài)分布的,但方差分析卻依賴于正態(tài)性的假設.但經(jīng)驗可知,方差分析F.檢驗對正態(tài)性的假設并不是非常敏感,也就是說,實際所得到的數(shù)據(jù),如果沒有異常值和偏性,或者說,數(shù)據(jù)顯示的分布比較對稱的話,即使樣本容量比較小(如每個水平下的樣本容量僅為5左右),方差分析的結果仍是值得依賴的.在實際中,沒有一個總體真正服從正態(tài)分布的,但方差分析卻依170方差齊性對于方差分析是非常重要的,因此在方差分析之前往往要進行方差齊性的診斷,即檢驗假設通常可采用Barlett檢驗.方差齊性檢驗也可采用如下的經(jīng)驗準則:當最大樣本標準差不超過最小樣本標準差的兩倍時,方差分析F檢驗結果近似正確.方差齊性對于方差分析是非常重要的,因此在方差分析之前往往要171§3一元線性回歸分析一、確定性關系:當自變量給定一個值時,就確定應變量的值與之對應。如:在自由落體中,物體下落的高度h與下落時間t之間有函數(shù)關系:
變量與變量之間的關系
§3一元線性回歸分析一、確定性關系:變量與變量之間的關系172二、相關性關系:
變量之間的關系并不確定,而是表現(xiàn)為具有隨機性的一種“趨勢”。即對自變量x的同一值,在不同的觀測中,因變量Y可以取不同的值,而且取值是隨機的,但對應x在一定范圍的不同值,對Y進行觀測時,可以觀察到Y隨x的變化而呈現(xiàn)有一定趨勢的變化。二、相關性關系:173如:身高與體重,不存在這樣的函數(shù)可以由身高計算出體重,但從統(tǒng)計意義上來說,身高者,體也重。如:父親的身高與兒子的身高之間也有一定聯(lián)系,通常父親高,兒子也高。如:身高與體重,不存在這樣的函數(shù)可以由身高計算出體重,但從統(tǒng)174我們以一個例子來建立回歸模型某戶人家打算安裝太陽能熱水器.為了了解室外溫度與燃氣消耗的關系,記錄了16個月燃氣的消耗量,數(shù)據(jù)見下表.我們以一個例子來建立回歸模型某戶人家打算安裝太陽能熱水器.175月份平均溫度燃氣用量月份平均溫度燃氣用量Nov.246.3Jul.01.2Dec.5110.9Aug.11.2Jan.438.9Sep.62.1Feb.337.5Oct.123.1Mar.265.3Nov.306.4Apr.134Dec.327.2May.41.7Jan.5211Jun.01.2Feb.306.9月份平均溫度燃氣用量月份平均溫度燃氣用量Nov.246.176在回歸分析時,我們稱“燃氣消耗量”為響應變量記為Y,“室外溫度”為解釋變量記為X,由所得數(shù)據(jù)計算相關系數(shù)得r=0.995,表明室外溫度與燃氣消耗之間有非常好的線性相關性.如果以室外溫度作為橫軸,以消耗燃氣量作為縱軸,得到散點圖的形狀大致呈線形.在回歸分析時,我們稱“燃氣消耗量”為響應變量記為Y,“室外177數(shù)理統(tǒng)計的基本概念課件178數(shù)理統(tǒng)計的基本概念課件179數(shù)理統(tǒng)計的基本概念課件180數(shù)理統(tǒng)計的基本概念課件181數(shù)理統(tǒng)計的基本概念課件182一元線性回歸要解決的問題:一元線性回歸要解決的問題:183參數(shù)估計參數(shù)估計184數(shù)理統(tǒng)計的基本概念課件185整理得正規(guī)方程系數(shù)行列式整理得正規(guī)方程系數(shù)行列式186數(shù)理統(tǒng)計的基本概念課件187數(shù)理統(tǒng)計的基本概念課件188
在誤差為正態(tài)分布假定下,最小二乘估計等價于極大似然估計。在誤差為正態(tài)分布假定下,最小二乘估計等價于極大似然估計。189采用最大似然估計給出參數(shù)a,b的估計與最小二乘法給出的估計完全一致。采用最大似然估計給出誤差的估計與最小二乘法給出的估計不一致。此時給出的估計不是無偏估計。采用最大似然估計給出參數(shù)a,b的估計與最小二乘法給出的估計190例1K.Pearson收集了大量父親身高與兒子身高的資料。其中十對如下:父親身高x(吋)60626465666768707274兒子身高y(吋)63.665.26665.566.967.167.468.370.170求Y關于x的線性回歸方程。例1K.Pearson收集了大量父親身高與兒子身高的資料191數(shù)理統(tǒng)計的基本概念課件192參數(shù)性質參數(shù)性質193即為正態(tài)隨機變量的線性組合,所以服從正態(tài)分布。證明(1)即為正態(tài)隨機變量的線性組合,所以服從正態(tài)分布。證明(1)194(2)類似可得。(2)類似可得。195回歸方程顯著性檢驗采用最小二乘法估計參數(shù)a和b,并不需要事先知道Y與x之間一定具有相關關系。因此μ(x)是否為x的線性函數(shù):一要根據(jù)專業(yè)知識和實踐來判斷,二要根據(jù)實際觀察得到的數(shù)據(jù)用假設檢驗方法來判斷?;貧w方程顯著性檢驗采用最小二乘法估計參數(shù)a和196(1)影響Y取值的,除了x,還有其他不可忽略的因素;(2)E(Y)與x的關系不是線性關系,而是其他關系;(3)Y與x不存在關系。若原假設被拒絕,說明回歸效果是顯著的,否則,若接受原假設,說明Y與x不是線性關系,回歸方程無意義?;貧w效果不顯著的原因可能有以下幾種:(1)影響Y取值的,除了x,還有其他不可忽略的因素;若原假設197假設的檢驗統(tǒng)計量與方差分析方法類似,仍采用平方和分解。假設的檢驗統(tǒng)計量與方差分析方法類似,仍采用平方和分解。198可以證明:可以證明:199可以證明,由參數(shù)估計的性質可知,當b=0時,
可以證明,由參數(shù)估計的性質可知,當b=0時,200數(shù)理統(tǒng)計的基本概念課件201數(shù)理統(tǒng)計的基本概念課件202也可采用t檢驗也可采用t檢驗203例3檢驗例1中回歸效果是否顯著,取α=0.05。例3檢驗例1中回歸效果是否顯著,取α=0.05。204回歸系數(shù)的置信區(qū)間由于回歸系數(shù)的置信區(qū)間由于205數(shù)理統(tǒng)計的基本概念課件206回歸參數(shù)估計和顯著性檢驗的Excel實現(xiàn)
例1(續(xù))前面我們已經(jīng)分析了室外溫度與燃氣消耗量之間的關系,認為兩者具有較好的線性關系,下面我們進一步建立燃氣消耗量(響應變量)與室外溫度(解釋變量)之間的回歸方程.采用Excel中的“數(shù)據(jù)分析”模塊.在Excel工作表中輸入上面的數(shù)據(jù)點擊主菜單中“工具”點擊下拉式菜單中“數(shù)據(jù)分析”就會出現(xiàn)一個“數(shù)據(jù)分析”的框,點擊菜單中“回歸”,點擊“確定”,出現(xiàn)“回歸”框.回歸參數(shù)估計和顯著性檢驗的Excel實現(xiàn)例1(續(xù)207在“Y值輸入?yún)^(qū)域”中標定你已經(jīng)輸入的響應變量數(shù)據(jù)的位置,在“X值輸入?yún)^(qū)域”中標定你已經(jīng)輸入的解釋變量數(shù)據(jù)的位置(注意:數(shù)據(jù)安“列”輸入)“置信度”中輸入你已經(jīng)確定置信度的值選定輸出結果的位置點擊“確定”.在指定位置輸出相應的方差分析表和回歸系數(shù)輸出結果,例1的輸出結果如下所示,在“Y值輸入?yún)^(qū)域”中標定你已經(jīng)輸入的響應變量數(shù)據(jù)的位置,208
dfSSMSFSignificanceF回歸1168.581168.5811467.5511.415E-15誤差141.6080.115總的15170.189方差分析表dfSSMSFSignificanceF回歸1168209
Coef.標準誤差tStatPvalueLower95%Upper95%Intercept1.0890.1397.8411.729E-060.7911.387X0.1890.00538.3091.415E-150.1780.200方差分析中,給出了假設檢驗H0:b=0的F檢驗.方差分析表中各項也前一節(jié)方差分析表中的意義類似.值得注意的是,方差分析表中``MS“列中,相應于``誤差”行的值即為模型誤碼差方差的估計,即=0.115.Coef.210數(shù)理統(tǒng)計的基本概念課件211數(shù)理統(tǒng)計的基本概念課件212預測預測一般有兩種意義.預測預測一般有兩種意義.213數(shù)理統(tǒng)計的基本概念課件214數(shù)理統(tǒng)計的基本概念課件215數(shù)理統(tǒng)計的基本概念課件216數(shù)理統(tǒng)計的基本概念課件217數(shù)理統(tǒng)計的基本概念課件218數(shù)理統(tǒng)計的基本概念課件219數(shù)理統(tǒng)計的基本概念課件220例合金鋼的強度y與鋼材中碳的含量x有密切關系。為了冶煉出符合要求強度的鋼常常通過控制鋼水中的碳含量來達到目的,為此需要了解y與x之間的關系。其中x:碳含量(%)y:鋼的強度(kg/mm2)數(shù)據(jù)見下:x0.030.040.050.070.090.100.120.150.170.20y40.539.541.041.543.042.045.047.553.056.0例合金鋼的強度y與鋼材中碳的含量x有密切關系。為了冶煉出符221(1)畫出散點圖;(2)設μ(x)=a+bx,求a,b的估計;(3)求誤差方差的估計,畫出殘差圖;(4)檢驗回歸系數(shù)b是否為零(取α=0.05);(5)求回歸系數(shù)b的95%置信區(qū)間;(6)求在x=0.06點,回歸函數(shù)的點估計和95%置信區(qū)間;(7)求在x=0.06點,Y的點預測和95%區(qū)間預測。
(1)畫出散點圖;2220.030.050.070.090.110.130.150.170.1956545250484644424038(1)合金
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 欠費整改報告范文
- 浙江國企招聘2024浙江清嶺科技有限公司招聘3人筆試參考題庫附帶答案詳解
- 二零二五年度私募股權基金自愿退股及退出機制協(xié)議
- 二零二五年度個人車位租賃與停車場安全監(jiān)控系統(tǒng)合同
- 二零二五年度商務酒店團體入住協(xié)議價合同樣本
- 廣州市2025年度租賃房屋修繕及維修服務合同
- 二零二五年度駕校合伙協(xié)議書:駕校與汽車租賃公司合作合同
- 二零二五年度健康管理項目可行性研究報告
- 二零二五年度商業(yè)地產租賃合同(含租戶品牌形象建設)
- 2025年度餐飲娛樂綜合體商鋪租賃合同
- 內鏡下ESD護理配合
- DB34∕T 1644-2012 南方紅豆杉用材林栽培技術規(guī)程
- 《中華人民共和國道路運輸條例》知識專題培訓
- 直腸癌課件完整版本
- 2024年山東省青島市普通高中自主招生物理試卷(含解析)
- 【三菱】M800M80系列使用說明書
- 【Z精密零部件公司企業(yè)文化建設問題及優(yōu)化建議14000字(論文)】
- 2024-2030年紅茶行業(yè)市場深度調研及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 高職高專教育英語課程教學基本要求-20211209120040
- 2024年山東能源棗莊礦業(yè)集團公司定向培養(yǎng)井下高技能員工招生200人高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 2024Growatt 15000-25000UE古瑞瓦特光伏逆變器用戶手冊
評論
0/150
提交評論