概率論與數(shù)理統(tǒng)計(jì)_第1頁(yè)
概率論與數(shù)理統(tǒng)計(jì)_第2頁(yè)
概率論與數(shù)理統(tǒng)計(jì)_第3頁(yè)
概率論與數(shù)理統(tǒng)計(jì)_第4頁(yè)
概率論與數(shù)理統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

概率論與數(shù)理統(tǒng)計(jì)第一頁(yè),共三十七頁(yè),2022年,8月28日1“回歸”一詞的歷史淵源“回歸”一詞最早由FrancisGalton引入。十九世紀(jì),英國(guó)生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓研究發(fā)現(xiàn):

其中x表示父親身高,

y

表示成年兒子的身高(單位:英寸,1英寸=2.54厘米)。這表明子代的平均高度有向中心回歸的意思,使得一段時(shí)間內(nèi)人的身高相對(duì)穩(wěn)定。之后回歸分析的思想滲透到了數(shù)理統(tǒng)計(jì)的其它分支中。第二頁(yè),共三十七頁(yè),2022年,8月28日2§9.1回歸分析的基本概念變量之間的關(guān)系確定性關(guān)系非確定性關(guān)系(相關(guān)關(guān)系)第三頁(yè),共三十七頁(yè),2022年,8月28日3對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過(guò)相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來(lái)完成的。對(duì)于相關(guān)關(guān)系,雖然不能求出變量之間精確的函數(shù)關(guān)系式,但是通過(guò)大量的觀測(cè)數(shù)據(jù),可以發(fā)現(xiàn)它們之間存在一定的統(tǒng)計(jì)規(guī)律性。第四頁(yè),共三十七頁(yè),2022年,8月28日4回歸分析是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。分為:一元線性回歸、多元線性回歸、可線性化的非線性歸(雙曲線、指數(shù)、對(duì)數(shù)、二次、冪函數(shù)等)第五頁(yè),共三十七頁(yè),2022年,8月28日5基本方法考察隨機(jī)變量Y與普通變量x之間的相關(guān)關(guān)系.例1.在農(nóng)業(yè)生產(chǎn)中小麥的畝產(chǎn)量Y與所施肥料量x有一定關(guān)系,在一定范圍內(nèi),若施肥量大,畝產(chǎn)也較高。問(wèn)題:Y是怎樣依賴施肥料量x的變化的。問(wèn)題的特征:x是普通變量,Y是隨機(jī)變量.處理方法:按數(shù)理統(tǒng)計(jì)處理問(wèn)題的方法。第六頁(yè),共三十七頁(yè),2022年,8月28日6(1)先進(jìn)行一些試驗(yàn),分別取不同的值Y也得到

個(gè)相應(yīng)觀察值得到n對(duì)數(shù)據(jù)對(duì),稱為樣本數(shù)據(jù)點(diǎn)(2)散點(diǎn)圖

Yxo····················第七頁(yè),共三十七頁(yè),2022年,8月28日7(3)尋找Y與x的數(shù)量關(guān)系:其中一般地,,

第八頁(yè),共三十七頁(yè),2022年,8月28日8

例1

合金的強(qiáng)度y(×107Pa)與合金中碳的含量x(%)有關(guān)。為研究?jī)蓚€(gè)變量間的關(guān)系。首先是收集數(shù)據(jù),我們把收集到的數(shù)據(jù)記為(xi,yi),i=1,2,,n。本例中,我們收集到12組數(shù)據(jù),列于表1中進(jìn)行回歸分析首先是回歸函數(shù)形式的選擇。當(dāng)只有一個(gè)自變量時(shí),通常可采用畫(huà)散點(diǎn)圖的方法進(jìn)行選擇。第九頁(yè),共三十七頁(yè),2022年,8月28日9表1合金鋼強(qiáng)度y與碳含量x的數(shù)據(jù)

序號(hào)x(%)y(×107Pa)序號(hào)x(%)y(×107Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.0第十頁(yè),共三十七頁(yè),2022年,8月28日10為找出兩個(gè)量間存在的回歸函數(shù)的形式,可以畫(huà)一張圖:把每一對(duì)數(shù)(xi,yi)看成直角坐標(biāo)系中的一個(gè)點(diǎn),在圖上畫(huà)出n個(gè)點(diǎn),稱這張圖為散點(diǎn)圖,見(jiàn)右圖。第十一頁(yè),共三十七頁(yè),2022年,8月28日11

從散點(diǎn)圖我們發(fā)現(xiàn)12個(gè)點(diǎn)基本在一條直線附近,這說(shuō)明兩個(gè)變量之間有一個(gè)線性相關(guān)關(guān)系,這個(gè)相關(guān)關(guān)系可以表示為

這便是y關(guān)于x的一元線性回歸的數(shù)據(jù)結(jié)構(gòu)式。通常假定

在對(duì)未知參數(shù)作區(qū)間估計(jì)或假設(shè)檢驗(yàn)時(shí),還需要假定誤差服從正態(tài)分布,即顯然假定(2)比假定(1)強(qiáng)

第十二頁(yè),共三十七頁(yè),2022年,8月28日12由于0,1均未知,需要我們從收集到的數(shù)據(jù)(xi,yi),i=1,2,…,n,出發(fā)進(jìn)行估計(jì)。在收集數(shù)據(jù)時(shí),我們一般要求觀察獨(dú)立地進(jìn)行,即假定y1,y2,,yn,相互獨(dú)立。綜合上述諸項(xiàng)假定,我們可以給出最簡(jiǎn)單、常用的一元線性回歸的數(shù)學(xué)模型:第十三頁(yè),共三十七頁(yè),2022年,8月28日13§9.2一元線性回歸1.本節(jié)考慮的模型是其中都是未知參數(shù),為回歸系數(shù),分別是直線的截距和斜率。稱為Y關(guān)于x的經(jīng)驗(yàn)回歸函數(shù)

。方程

稱為Y關(guān)于x的經(jīng)驗(yàn)線性回歸方程,或經(jīng)驗(yàn)回歸方程,其相應(yīng)的圖形稱為經(jīng)驗(yàn)回歸直線。

此模型稱為一元線性回歸模型,基于此種模型的統(tǒng)計(jì)分析稱為一元線性回歸分析.第十四頁(yè),共三十七頁(yè),2022年,8月28日142.下面用最小二乘法來(lái)求對(duì)于自變量x和因變量y的n對(duì)觀察值的最小二乘估計(jì)其中是對(duì)觀察時(shí)的隨機(jī)誤差.

的估計(jì)。第十五頁(yè),共三十七頁(yè),2022年,8月28日15使得成立的

稱為和的最小二乘估計(jì)。

第十六頁(yè),共三十七頁(yè),2022年,8月28日16于是得方程組第十七頁(yè),共三十七頁(yè),2022年,8月28日17解得,

記于是

第十八頁(yè),共三十七頁(yè),2022年,8月28日18設(shè)某化學(xué)過(guò)程的得率Y與該過(guò)程的溫度x有關(guān).現(xiàn)作了10次測(cè)量,其數(shù)據(jù)如下表所示.x/℃38434954606671778288y/%20.420.922.523.024.224.326.226.628.028.9解故于是得線性回歸方程第十九頁(yè),共三十七頁(yè),2022年,8月28日19由此給出回歸方程為:

例2

使用例1種合金鋼強(qiáng)度和碳含量數(shù)據(jù)求回歸方程。解第二十頁(yè),共三十七頁(yè),2022年,8月28日20,.第二十一頁(yè),共三十七頁(yè),2022年,8月28日21殘差顯然殘差的平方和

的無(wú)偏估計(jì)。

第二十二頁(yè),共三十七頁(yè),2022年,8月28日22中誤差方差的無(wú)偏估計(jì)

解 例9.2.1中已求出

所以第二十三頁(yè),共三十七頁(yè),2022年,8月28日23定理9.2.3 對(duì)一元線性回歸模型(9.2.3),若進(jìn)一步假定隨機(jī)誤差,則有(1).(2)RSS與和相互獨(dú)立.第二十四頁(yè),共三十七頁(yè),2022年,8月28日244回歸方程的顯著性檢驗(yàn)

在使用回歸方程作進(jìn)一步的分析以前,首先應(yīng)對(duì)回歸方程是否有意義進(jìn)行判斷。如果1=0,那么不管x如何變化,E(y)不隨x的變化作線性變化,那么這時(shí)求得的一元線性回歸方程就沒(méi)有意義,稱回歸方程不顯著。如果10,E(y)隨x的變化作線性變化,稱回歸方程是顯著的。綜上,對(duì)回歸方程是否有意義作判斷就是要作如下的顯著性檢驗(yàn):H0:1=0vsH1:10

拒絕H0表示回歸方程是顯著的。第二十五頁(yè),共三十七頁(yè),2022年,8月28日25需要檢驗(yàn)假設(shè)方法:第二十六頁(yè),共三十七頁(yè),2022年,8月28日26t檢驗(yàn)法第二十七頁(yè),共三十七頁(yè),2022年,8月28日27例9.2.3試說(shuō)明例9.2.1中的線性回歸效果是否顯著解 要在水平

下檢驗(yàn)如下假設(shè)故查表知

因?yàn)?/p>

24.1260>3.3554,

所以拒絕,線性回歸效果是顯著的.第二十八頁(yè),共三十七頁(yè),2022年,8月28日285.回歸系數(shù)的置信區(qū)間的置信水平為

的置信區(qū)間為例9.2.4求例9.2.1中回歸系數(shù)

的置信水平為95%的置信區(qū)間.

解第二十九頁(yè),共三十七頁(yè),2022年,8月28日29如果經(jīng)檢驗(yàn),回歸方程的線性回歸效果是顯著的,那么就可以用已經(jīng)獲得的回歸方程

進(jìn)行預(yù)測(cè).6.預(yù)測(cè)所謂預(yù)測(cè)(或稱預(yù)報(bào)),就是以一定的置信水平預(yù)測(cè)與

對(duì)應(yīng)的

的取值范圍.

稱為

的置信水平為

的預(yù)測(cè)區(qū)間,也稱為置信區(qū)間.第三十頁(yè),共三十七頁(yè),2022年,8月28日30

方法——通過(guò)適當(dāng)?shù)淖兞孔儞Q,化成一元線性回歸問(wèn)題進(jìn)行分析處理.兩邊取對(duì)數(shù)§9.3、可化為一元線性回歸的問(wèn)題第三十一頁(yè),共三十七頁(yè),2022年,8月28日31,,,,曲線變換變換后的線性式1雙曲函數(shù)2冪函數(shù)3指數(shù)函數(shù)4對(duì)數(shù)函數(shù)5倒指數(shù)函數(shù)6S型曲線第三十二頁(yè),共三十七頁(yè),2022年,8月28日32配曲線的一般方法是:第三十三頁(yè),共三十七頁(yè),2022年,8月28日33 一只紅鈴蟲(chóng)的產(chǎn)卵數(shù)Y和溫度x有關(guān).經(jīng)觀測(cè)獲得一組紅鈴蟲(chóng)產(chǎn)卵數(shù)與溫度的數(shù)據(jù)如下表所示.試求Y關(guān)于x的回歸方程.編號(hào)1234567溫度x/℃21232527293235產(chǎn)卵數(shù)y711212466115325第三十四頁(yè),共三十七頁(yè),2022年,8月28日34解 1.根據(jù)這組數(shù)據(jù)畫(huà)出散點(diǎn)圖.2.選擇模型作變換于是得到3.線性化第三十五頁(yè),共三十七頁(yè),2022

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論