




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第一節(jié)簡單直線回歸第二節(jié)線性回歸的應(yīng)用第十二章簡單回歸分析一、直線回歸的概念及其統(tǒng)計描述二、回歸模型的前提假設(shè)
三、回歸參數(shù)的估計四、回歸系數(shù)的統(tǒng)計推斷回歸:描述反應(yīng)變量如何隨自變量變化而變化的規(guī)律性?;貧w分析的基本任務(wù):在相關(guān)分析的基礎(chǔ)上,具體描述反應(yīng)變量(Y)對自變量(X)的線性依賴關(guān)系的形式。
在上一章中,對15名健康人凝血濃度(Y)與凝血時間(X)數(shù)據(jù)計算相關(guān)系數(shù),定量描述了變量間關(guān)聯(lián)性的強(qiáng)弱程度與方向。為直觀地說明直線回歸的概念,我們以以上一章中對15名健康人凝血濃度與凝血時間數(shù)據(jù)為例,來探討兩變量間依存變化關(guān)系。表12-1
15名健康成人凝血時間與凝血酶濃度測量值171514161516141716141315151314Y0.71.01.10.91.10.91.00.60.91.11.20.91.01.21.1X151413121110987654321受試者號圖12-1凝血濃度與凝血時間的散點(diǎn)分布
由圖12-1可見,凝血時間隨凝血酶濃度增大而減少且呈直線趨勢,但并非15點(diǎn)恰好全部都在一直線上。兩變量數(shù)量間雖然存在一定關(guān)系,但不是十分確定的。這與兩變量間嚴(yán)格對應(yīng)的函數(shù)關(guān)系不同,稱為直線回歸(Linearregression)。直線回歸是回歸分析中最基本、最簡單的一種,故又稱簡單simpleregression)。
反應(yīng)變量(Y)與自變量(X)的簡單線性模型(simplelinearregressionmodel)可表達(dá)為:
在通常情況下,研究者只能獲取一定數(shù)量的樣本數(shù)據(jù),用該樣本數(shù)據(jù)建立的有關(guān)Y與X變化的線性方程稱為回歸方程(regressionequation)即:
在描述兩變量的關(guān)系時,一般把兩個變量中能精確容易測量的作自變量,不易測量作為因變量。即用易測量的數(shù)據(jù)X估計不易測量的另一數(shù)據(jù)。如年齡估算小兒體重等。在描述凝血時間與凝血濃度的依存關(guān)系中,將凝血酶濃度作為自變量(X),凝血時間作為應(yīng)變量(Y)。一、直線回歸的概念及其統(tǒng)計描述三、回歸參數(shù)的估計四、回歸系數(shù)的統(tǒng)計推斷二、回歸模型的前提假設(shè)
線性回歸模型的前提條件是:線性(linear)、獨(dú)立(independent),正態(tài)(normal),等方差(equalvariance)
1、線性是指反應(yīng)變量Y的總體平均值與自變量X呈線性關(guān)系。
2、獨(dú)立是指任意兩觀察值互相獨(dú)立。
3、正態(tài)性假定是指線性模型的誤差項(xiàng)i服從正態(tài)分布。
4、等方差是指在自變量X取值范圍內(nèi),不論X取什么值,Y都具有相同的方差。一、直線回歸的概念及其統(tǒng)計描述三、回歸參數(shù)的估計四、回歸系數(shù)的統(tǒng)計推斷二、回歸模型的前提假設(shè)
一)回歸參數(shù)估計的最小二乘原則參數(shù)與一般只能通過樣本數(shù)據(jù)來估計。當(dāng)X取值為Xi時,Y的平均值的估計應(yīng)為a+bXi,而實(shí)際觀察值為Yi。兩者之差稱為殘差,即當(dāng)a與b取不同值時獲取不同的候選直線,如能求a與b的適宜值,能使所有實(shí)測值到這條直線的上縱向距離的平方和為最小,則稱這一對a和b為與的最小二乘估計(leastestimation,LES)。二)回歸參數(shù)的估計方法
a為Y軸上的截距;b為斜率,表示X每改變一個單位,Y的變化的值,稱為回歸系數(shù);表示在X值處Y的總體均數(shù)估計值。為求a和b兩系數(shù),根據(jù)數(shù)學(xué)上的最小二乘法原理,可導(dǎo)出a和b的算式如下:1.由原始數(shù)據(jù)及散點(diǎn)圖的初步分析,本例呈直線趨勢,故作下列計算。
2.求
3.計算X、Y的均數(shù),及離均差平方和lXY、lyy與離均差積和lXY。4.求回歸系數(shù)b和截距a。
5.列出回歸方程三)、直線回歸方程的圖示
為了進(jìn)行直觀分析或?qū)嶋H需要,可按回歸方程在坐標(biāo)紙上作圖。在自變量X的實(shí)測全距范圍內(nèi)任取相距較遠(yuǎn)且易讀的兩X值,代入回歸方程,如上例取在圖上確定(0.6,17.58581)和(1.1,14.09373)兩點(diǎn),用直線連接,即得直線方程的圖形。圖12-3凝血濃度與凝血時間的散點(diǎn)分布及擬合直線一、直線回歸的概念及其統(tǒng)計描述三、回歸參數(shù)的估計四、回歸系數(shù)的統(tǒng)計推斷二、回歸模型的前提假設(shè)
前面所求得的回歸方程是否成立,即X、Y是否有直線關(guān)系,是回歸分析要考慮的首要問題。我們知道即使X、Y的總體回歸系數(shù)為零,由于抽樣誤差,其樣本回歸系數(shù)b也不一定為零。因此需作是否為零的假設(shè)檢驗(yàn),用方差分析或t檢驗(yàn)。一)、樣本回歸系數(shù)b的抽樣誤差本章例12-1,二)總體回歸系數(shù)的假設(shè)檢驗(yàn)例12-2檢驗(yàn)例12-1求凝血時間對凝血酶濃度的直線關(guān)系是否成立?
1.假設(shè)
2.檢驗(yàn)統(tǒng)計量三)回歸系數(shù)的區(qū)間估計例12-3試用例12-11所計算的樣本回歸系數(shù)b=-0.6902,估計總體回歸系數(shù)的95%的可信區(qū)間:Sb=0.76,(-6.9802-2.16×0.76,-6.9802+2.16×0.76)=(-8.6791,-5.2813)
第一節(jié)簡單直線回歸第二節(jié)線性回歸的應(yīng)用第十二章簡單回歸分析一、總體回歸線的95%置信帶二、個體Y值的容許區(qū)間
當(dāng)總體中X為某一定值X0時,與X0所對應(yīng)的y值的總體均數(shù)為μ0,從總體中隨機(jī)抽取一份樣本,得到簡單回歸方程為,則在樣本中與X0所對應(yīng)y值的樣本均數(shù)為,即是μ0
的點(diǎn)估計值。其標(biāo)準(zhǔn)誤為它的(1-)置信區(qū)間為例12-1試計算當(dāng)X0=1.1時,μ的95%可信區(qū)間。用同樣方式,可計算出所有15個觀測點(diǎn)的總體均數(shù)的95%置信區(qū)間。一、總體回歸線的95%置信帶二、個體Y值的容許區(qū)間
總體中,X為某定值X0時,個體Y值圍繞μ0波動,其標(biāo)準(zhǔn)差為:例12-5用例12-1所求回歸方程,試計算當(dāng)X0=1.1時,個體Y值的95%容許區(qū)間。即估計總體中凝血酶濃度1.1毫升者,有95%的人凝血時間在12.9618~15.229范圍內(nèi)。圖12-6凝血時間依凝血濃度回歸線的95%置信帶與Y個體值95%預(yù)測帶直線回歸分析中應(yīng)注意的問題作回歸分析一定要有實(shí)際意義?;貧w分析之前首先應(yīng)繪制散點(diǎn)圖??紤]建立線性回歸模型的基本假定。直線回歸方程應(yīng)用與圖示一般以自變量x的取值范圍為限,超出自變量取值范圍所計算的值稱為外延。兩變量間的直線關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,即兩個變量的變化可能同受另一個因素的影響。直線相關(guān)與回歸的區(qū)別和聯(lián)系1.區(qū)別:1)分析目的:相關(guān)分析研究兩變量相關(guān)方向及密切程度;回歸分析研究變量間的數(shù)量依存關(guān)系。2)資料要求:相關(guān)分析要求兩變量都是隨機(jī)變量,分別服從正態(tài)分布;回歸分析要求因變量(Y)為隨機(jī)變量,而自變量無要求。3)統(tǒng)計量單位:相關(guān)系數(shù)無單位;回歸系數(shù)有單位,(Y的單位/X的單位)2.聯(lián)系1)符號方面:相關(guān)系數(shù)與回歸系數(shù)符號一致。2)假設(shè)檢驗(yàn)方面:對相關(guān)系數(shù)的假設(shè)檢驗(yàn)和對回歸系數(shù)的假設(shè)檢驗(yàn)是等價的。對相關(guān)系數(shù)的檢驗(yàn)比回歸系數(shù)的檢驗(yàn)容易,因此對同一組資料,常用對相關(guān)系數(shù)的假設(shè)檢驗(yàn)代替對回歸系數(shù)的假設(shè)檢驗(yàn)。3)直線相關(guān)與直線回歸的內(nèi)在聯(lián)系。
第三節(jié)殘差分析
殘差分析(residualanalysis)旨在通過殘差深入了解數(shù)據(jù)與模型之間的關(guān)系,評價資料是否符合回歸模型假設(shè),識別異常點(diǎn)等。
圖12-7凝血數(shù)據(jù)的回歸殘差圖
一般而言,自然界的生命現(xiàn)象中絕對線性關(guān)系并不多見,但從相對與近似的觀點(diǎn)出發(fā),我們可以用前面已經(jīng)提到的線性回歸模型來解決許多實(shí)際問題??梢哉f,非線性回歸要比線性回歸更能充分地表達(dá)變量間的關(guān)系。當(dāng)今線性回歸都比非線性回歸應(yīng)用多,原因在于無論從數(shù)學(xué)理論還是計算方法,線性回歸都比非線性回歸模型簡單得多。第四節(jié)非線性回歸
一、曲線回歸的概念根據(jù)實(shí)測數(shù)據(jù),擬合反映變量間關(guān)系的曲線回歸方程稱為曲線回歸分析,也可將求解曲線回歸方程的過程稱作曲線擬合。二、曲線擬合步驟以對數(shù)曲線為例,說明曲線擬合的基本步驟。(1)選定曲線類型。
首先繪制散點(diǎn)圖,觀察散點(diǎn)的分布趨勢,結(jié)合專業(yè)知識,選取適當(dāng)?shù)那€類型。比如兩變量間,當(dāng)X(或Y值)增大、Y(或X)隨之“加速度”增大或減小可擬合對數(shù)曲線。(2)變量的對數(shù)變換。
對X或Y進(jìn)行對數(shù)變換,使變換后的兩變量呈直線關(guān)系。對數(shù)曲線的表達(dá)式為:
Y=a+b*lgX(3)按最小二乘法原理求直線化方程。
令Z=lgX,求出(4)將直線化方程轉(zhuǎn)化為曲線式,作曲線圖。
將上述方程還原為,最終得到適合原始數(shù)據(jù)的曲線回歸方程。
例12-6
先在實(shí)驗(yàn)室中給予受試者某一刺激,然后檢測受試者的感覺反應(yīng)強(qiáng)度。設(shè)X為刺激量的物理強(qiáng)度,Y為受試者感覺量的反應(yīng)強(qiáng)度。12種不同強(qiáng)度刺激下的感覺量見下表,試求出Y對X的回歸曲線。
(1)根據(jù)原始數(shù)據(jù)在直角坐標(biāo)系中繪制出散點(diǎn)圖,觀察散點(diǎn)的分布形狀。本例散點(diǎn)分布近似于一條對數(shù)曲線,因此考慮用對數(shù)方程Y=a+b*lgX對數(shù)據(jù)進(jìn)行擬合。(2)令Z=lgX,得出對應(yīng)于每一個X值的Z值,作變量Y與變量Z的相關(guān)散點(diǎn)圖,可以發(fā)現(xiàn)散點(diǎn)幾乎落在一條直
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物流中心造價控制措施
- 體育設(shè)施EPC采購管理計劃
- 護(hù)士在名師講座中的學(xué)習(xí)心得體會
- 中國市場營銷部工作總結(jié)和計劃
- 部編版三年級語文上自主檢測評估計劃
- 教師師德師風(fēng)與教學(xué)改革心得體會
- 新部編版一年級語文上冊教學(xué)進(jìn)度計劃
- 電商培訓(xùn)課程教學(xué)質(zhì)量的心得體會
- 應(yīng)用型本科高校學(xué)生返校心理疏導(dǎo)計劃
- 部編六年級語文下冊第一單元教學(xué)計劃
- 早孕期產(chǎn)科超聲檢查規(guī)范
- 2025版心肺復(fù)蘇培訓(xùn)課件
- 冠心病介入治療術(shù)
- 2025至2030中國環(huán)氧活性稀釋劑市場未來趨勢及前景規(guī)劃建議報告
- 網(wǎng)絡(luò)安全攻防實(shí)戰(zhàn)考核試卷
- 2025江蘇省惠隆資產(chǎn)管理限公司招聘30人易考易錯模擬試題(共500題)試卷后附參考答案
- ISO 37001-2025 反賄賂管理體系要求及使用指南(中文版-雷澤佳譯-2025)
- 初高中物理銜接講座(初高中物理對比)
- 籍貫對照表完整版
- 橋架、線槽支架重量計算表
- 北京師范大學(xué)地理科學(xué)專業(yè)本科培養(yǎng)方案
評論
0/150
提交評論