版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一節(jié)簡(jiǎn)單直線回歸第二節(jié)線性回歸的應(yīng)用第十二章簡(jiǎn)單回歸分析一、直線回歸的概念及其統(tǒng)計(jì)描述二、回歸模型的前提假設(shè)
三、回歸參數(shù)的估計(jì)四、回歸系數(shù)的統(tǒng)計(jì)推斷回歸:描述反應(yīng)變量如何隨自變量變化而變化的規(guī)律性?;貧w分析的基本任務(wù):在相關(guān)分析的基礎(chǔ)上,具體描述反應(yīng)變量(Y)對(duì)自變量(X)的線性依賴關(guān)系的形式。
在上一章中,對(duì)15名健康人凝血濃度(Y)與凝血時(shí)間(X)數(shù)據(jù)計(jì)算相關(guān)系數(shù),定量描述了變量間關(guān)聯(lián)性的強(qiáng)弱程度與方向。為直觀地說(shuō)明直線回歸的概念,我們以以上一章中對(duì)15名健康人凝血濃度與凝血時(shí)間數(shù)據(jù)為例,來(lái)探討兩變量間依存變化關(guān)系。表12-1
15名健康成人凝血時(shí)間與凝血酶濃度測(cè)量值171514161516141716141315151314Y0.71.01.10.91.10.91.00.60.91.11.20.91.01.21.1X151413121110987654321受試者號(hào)圖12-1凝血濃度與凝血時(shí)間的散點(diǎn)分布
由圖12-1可見(jiàn),凝血時(shí)間隨凝血酶濃度增大而減少且呈直線趨勢(shì),但并非15點(diǎn)恰好全部都在一直線上。兩變量數(shù)量間雖然存在一定關(guān)系,但不是十分確定的。這與兩變量間嚴(yán)格對(duì)應(yīng)的函數(shù)關(guān)系不同,稱為直線回歸(Linearregression)。直線回歸是回歸分析中最基本、最簡(jiǎn)單的一種,故又稱簡(jiǎn)單simpleregression)。
反應(yīng)變量(Y)與自變量(X)的簡(jiǎn)單線性模型(simplelinearregressionmodel)可表達(dá)為:
在通常情況下,研究者只能獲取一定數(shù)量的樣本數(shù)據(jù),用該樣本數(shù)據(jù)建立的有關(guān)Y與X變化的線性方程稱為回歸方程(regressionequation)即:
在描述兩變量的關(guān)系時(shí),一般把兩個(gè)變量中能精確容易測(cè)量的作自變量,不易測(cè)量作為因變量。即用易測(cè)量的數(shù)據(jù)X估計(jì)不易測(cè)量的另一數(shù)據(jù)。如年齡估算小兒體重等。在描述凝血時(shí)間與凝血濃度的依存關(guān)系中,將凝血酶濃度作為自變量(X),凝血時(shí)間作為應(yīng)變量(Y)。一、直線回歸的概念及其統(tǒng)計(jì)描述三、回歸參數(shù)的估計(jì)四、回歸系數(shù)的統(tǒng)計(jì)推斷二、回歸模型的前提假設(shè)
線性回歸模型的前提條件是:線性(linear)、獨(dú)立(independent),正態(tài)(normal),等方差(equalvariance)
1、線性是指反應(yīng)變量Y的總體平均值與自變量X呈線性關(guān)系。
2、獨(dú)立是指任意兩觀察值互相獨(dú)立。
3、正態(tài)性假定是指線性模型的誤差項(xiàng)i服從正態(tài)分布。
4、等方差是指在自變量X取值范圍內(nèi),不論X取什么值,Y都具有相同的方差。一、直線回歸的概念及其統(tǒng)計(jì)描述三、回歸參數(shù)的估計(jì)四、回歸系數(shù)的統(tǒng)計(jì)推斷二、回歸模型的前提假設(shè)
一)回歸參數(shù)估計(jì)的最小二乘原則參數(shù)與一般只能通過(guò)樣本數(shù)據(jù)來(lái)估計(jì)。當(dāng)X取值為Xi時(shí),Y的平均值的估計(jì)應(yīng)為a+bXi,而實(shí)際觀察值為Yi。兩者之差稱為殘差,即當(dāng)a與b取不同值時(shí)獲取不同的候選直線,如能求a與b的適宜值,能使所有實(shí)測(cè)值到這條直線的上縱向距離的平方和為最小,則稱這一對(duì)a和b為與的最小二乘估計(jì)(leastestimation,LES)。二)回歸參數(shù)的估計(jì)方法
a為Y軸上的截距;b為斜率,表示X每改變一個(gè)單位,Y的變化的值,稱為回歸系數(shù);表示在X值處Y的總體均數(shù)估計(jì)值。為求a和b兩系數(shù),根據(jù)數(shù)學(xué)上的最小二乘法原理,可導(dǎo)出a和b的算式如下:1.由原始數(shù)據(jù)及散點(diǎn)圖的初步分析,本例呈直線趨勢(shì),故作下列計(jì)算。
2.求
3.計(jì)算X、Y的均數(shù),及離均差平方和lXY、lyy與離均差積和lXY。4.求回歸系數(shù)b和截距a。
5.列出回歸方程三)、直線回歸方程的圖示
為了進(jìn)行直觀分析或?qū)嶋H需要,可按回歸方程在坐標(biāo)紙上作圖。在自變量X的實(shí)測(cè)全距范圍內(nèi)任取相距較遠(yuǎn)且易讀的兩X值,代入回歸方程,如上例取在圖上確定(0.6,17.58581)和(1.1,14.09373)兩點(diǎn),用直線連接,即得直線方程的圖形。圖12-3凝血濃度與凝血時(shí)間的散點(diǎn)分布及擬合直線一、直線回歸的概念及其統(tǒng)計(jì)描述三、回歸參數(shù)的估計(jì)四、回歸系數(shù)的統(tǒng)計(jì)推斷二、回歸模型的前提假設(shè)
前面所求得的回歸方程是否成立,即X、Y是否有直線關(guān)系,是回歸分析要考慮的首要問(wèn)題。我們知道即使X、Y的總體回歸系數(shù)為零,由于抽樣誤差,其樣本回歸系數(shù)b也不一定為零。因此需作是否為零的假設(shè)檢驗(yàn),用方差分析或t檢驗(yàn)。一)、樣本回歸系數(shù)b的抽樣誤差本章例12-1,二)總體回歸系數(shù)的假設(shè)檢驗(yàn)例12-2檢驗(yàn)例12-1求凝血時(shí)間對(duì)凝血酶濃度的直線關(guān)系是否成立?
1.假設(shè)
2.檢驗(yàn)統(tǒng)計(jì)量三)回歸系數(shù)的區(qū)間估計(jì)例12-3試用例12-11所計(jì)算的樣本回歸系數(shù)b=-0.6902,估計(jì)總體回歸系數(shù)的95%的可信區(qū)間:Sb=0.76,(-6.9802-2.16×0.76,-6.9802+2.16×0.76)=(-8.6791,-5.2813)
第一節(jié)簡(jiǎn)單直線回歸第二節(jié)線性回歸的應(yīng)用第十二章簡(jiǎn)單回歸分析一、總體回歸線的95%置信帶二、個(gè)體Y值的容許區(qū)間
當(dāng)總體中X為某一定值X0時(shí),與X0所對(duì)應(yīng)的y值的總體均數(shù)為μ0,從總體中隨機(jī)抽取一份樣本,得到簡(jiǎn)單回歸方程為,則在樣本中與X0所對(duì)應(yīng)y值的樣本均數(shù)為,即是μ0
的點(diǎn)估計(jì)值。其標(biāo)準(zhǔn)誤為它的(1-)置信區(qū)間為例12-1試計(jì)算當(dāng)X0=1.1時(shí),μ的95%可信區(qū)間。用同樣方式,可計(jì)算出所有15個(gè)觀測(cè)點(diǎn)的總體均數(shù)的95%置信區(qū)間。一、總體回歸線的95%置信帶二、個(gè)體Y值的容許區(qū)間
總體中,X為某定值X0時(shí),個(gè)體Y值圍繞μ0波動(dòng),其標(biāo)準(zhǔn)差為:例12-5用例12-1所求回歸方程,試計(jì)算當(dāng)X0=1.1時(shí),個(gè)體Y值的95%容許區(qū)間。即估計(jì)總體中凝血酶濃度1.1毫升者,有95%的人凝血時(shí)間在12.9618~15.229范圍內(nèi)。圖12-6凝血時(shí)間依凝血濃度回歸線的95%置信帶與Y個(gè)體值95%預(yù)測(cè)帶直線回歸分析中應(yīng)注意的問(wèn)題作回歸分析一定要有實(shí)際意義。回歸分析之前首先應(yīng)繪制散點(diǎn)圖??紤]建立線性回歸模型的基本假定。直線回歸方程應(yīng)用與圖示一般以自變量x的取值范圍為限,超出自變量取值范圍所計(jì)算的值稱為外延。兩變量間的直線關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,即兩個(gè)變量的變化可能同受另一個(gè)因素的影響。直線相關(guān)與回歸的區(qū)別和聯(lián)系1.區(qū)別:1)分析目的:相關(guān)分析研究?jī)勺兞肯嚓P(guān)方向及密切程度;回歸分析研究變量間的數(shù)量依存關(guān)系。2)資料要求:相關(guān)分析要求兩變量都是隨機(jī)變量,分別服從正態(tài)分布;回歸分析要求因變量(Y)為隨機(jī)變量,而自變量無(wú)要求。3)統(tǒng)計(jì)量單位:相關(guān)系數(shù)無(wú)單位;回歸系數(shù)有單位,(Y的單位/X的單位)2.聯(lián)系1)符號(hào)方面:相關(guān)系數(shù)與回歸系數(shù)符號(hào)一致。2)假設(shè)檢驗(yàn)方面:對(duì)相關(guān)系數(shù)的假設(shè)檢驗(yàn)和對(duì)回歸系數(shù)的假設(shè)檢驗(yàn)是等價(jià)的。對(duì)相關(guān)系數(shù)的檢驗(yàn)比回歸系數(shù)的檢驗(yàn)容易,因此對(duì)同一組資料,常用對(duì)相關(guān)系數(shù)的假設(shè)檢驗(yàn)代替對(duì)回歸系數(shù)的假設(shè)檢驗(yàn)。3)直線相關(guān)與直線回歸的內(nèi)在聯(lián)系。
第三節(jié)殘差分析
殘差分析(residualanalysis)旨在通過(guò)殘差深入了解數(shù)據(jù)與模型之間的關(guān)系,評(píng)價(jià)資料是否符合回歸模型假設(shè),識(shí)別異常點(diǎn)等。
圖12-7凝血數(shù)據(jù)的回歸殘差圖
一般而言,自然界的生命現(xiàn)象中絕對(duì)線性關(guān)系并不多見(jiàn),但從相對(duì)與近似的觀點(diǎn)出發(fā),我們可以用前面已經(jīng)提到的線性回歸模型來(lái)解決許多實(shí)際問(wèn)題??梢哉f(shuō),非線性回歸要比線性回歸更能充分地表達(dá)變量間的關(guān)系。當(dāng)今線性回歸都比非線性回歸應(yīng)用多,原因在于無(wú)論從數(shù)學(xué)理論還是計(jì)算方法,線性回歸都比非線性回歸模型簡(jiǎn)單得多。第四節(jié)非線性回歸
一、曲線回歸的概念根據(jù)實(shí)測(cè)數(shù)據(jù),擬合反映變量間關(guān)系的曲線回歸方程稱為曲線回歸分析,也可將求解曲線回歸方程的過(guò)程稱作曲線擬合。二、曲線擬合步驟以對(duì)數(shù)曲線為例,說(shuō)明曲線擬合的基本步驟。(1)選定曲線類型。
首先繪制散點(diǎn)圖,觀察散點(diǎn)的分布趨勢(shì),結(jié)合專業(yè)知識(shí),選取適當(dāng)?shù)那€類型。比如兩變量間,當(dāng)X(或Y值)增大、Y(或X)隨之“加速度”增大或減小可擬合對(duì)數(shù)曲線。(2)變量的對(duì)數(shù)變換。
對(duì)X或Y進(jìn)行對(duì)數(shù)變換,使變換后的兩變量呈直線關(guān)系。對(duì)數(shù)曲線的表達(dá)式為:
Y=a+b*lgX(3)按最小二乘法原理求直線化方程。
令Z=lgX,求出(4)將直線化方程轉(zhuǎn)化為曲線式,作曲線圖。
將上述方程還原為,最終得到適合原始數(shù)據(jù)的曲線回歸方程。
例12-6
先在實(shí)驗(yàn)室中給予受試者某一刺激,然后檢測(cè)受試者的感覺(jué)反應(yīng)強(qiáng)度。設(shè)X為刺激量的物理強(qiáng)度,Y為受試者感覺(jué)量的反應(yīng)強(qiáng)度。12種不同強(qiáng)度刺激下的感覺(jué)量見(jiàn)下表,試求出Y對(duì)X的回歸曲線。
(1)根據(jù)原始數(shù)據(jù)在直角坐標(biāo)系中繪制出散點(diǎn)圖,觀察散點(diǎn)的分布形狀。本例散點(diǎn)分布近似于一條對(duì)數(shù)曲線,因此考慮用對(duì)數(shù)方程Y=a+b*lgX對(duì)數(shù)據(jù)進(jìn)行擬合。(2)令Z=lgX,得出對(duì)應(yīng)于每一個(gè)X值的Z值,作變量Y與變量Z的相關(guān)散點(diǎn)圖,可以發(fā)現(xiàn)散點(diǎn)幾乎落在一條直
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024蘇州二手房買(mǎi)賣(mài)合同協(xié)議范本:房屋交易保障及售后服務(wù)協(xié)議3篇
- 2025年度廠區(qū)綠化養(yǎng)護(hù)與生態(tài)景觀提升合同3篇
- 2025年度360借條合同多(信用評(píng)級(jí)合作版)3篇
- 2025年度油氣田廢棄井修復(fù)打井合同范本4篇
- 2025年度文化創(chuàng)意產(chǎn)業(yè)出資協(xié)議合同模板3篇
- 2024美團(tuán)外賣(mài)配送配送員配送區(qū)域合作伙伴服務(wù)標(biāo)準(zhǔn)合同3篇
- 2024網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估及防護(hù)服務(wù)合同
- 2025年度圖書(shū)檔案庫(kù)房智能化儲(chǔ)藏系統(tǒng)合同4篇
- 2025年度智能車(chē)場(chǎng)租賃服務(wù)合同(新能源汽車(chē)版)4篇
- 2025年度電磁兼容性實(shí)驗(yàn)室設(shè)備采購(gòu)合同2篇
- 《C語(yǔ)言從入門(mén)到精通》培訓(xùn)教程課件
- 2023年中國(guó)半導(dǎo)體行業(yè)薪酬及股權(quán)激勵(lì)白皮書(shū)
- 2024年Minitab全面培訓(xùn)教程
- 社區(qū)電動(dòng)車(chē)棚新(擴(kuò))建及修建充電車(chē)棚施工方案(純方案-)
- 項(xiàng)目推進(jìn)與成果交付情況總結(jié)與評(píng)估
- 鐵路項(xiàng)目征地拆遷工作體會(huì)課件
- 醫(yī)院死亡報(bào)告年終分析報(bào)告
- 建設(shè)用地報(bào)批服務(wù)投標(biāo)方案(技術(shù)方案)
- 工會(huì)工作人年度考核個(gè)人總結(jié)
- 上海民辦楊浦實(shí)驗(yàn)學(xué)校初一新生分班(摸底)語(yǔ)文考試模擬試卷(10套試卷帶答案解析)
- 機(jī)器人論文3000字范文
評(píng)論
0/150
提交評(píng)論