兩個變量的線性相關(guān)_第1頁
兩個變量的線性相關(guān)_第2頁
兩個變量的線性相關(guān)_第3頁
兩個變量的線性相關(guān)_第4頁
兩個變量的線性相關(guān)_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

兩個變量的線性相關(guān)在一次對人體脂肪含量和年齡關(guān)系的研究中,研究人員獲得了一組樣本數(shù)據(jù):年齡23273941454950脂肪9.517.821.225.927.526.328.2年齡53545657586061脂肪29.630.231.430.833.535.234.6根據(jù)上述數(shù)據(jù),人體的脂肪含量與年齡之間有怎樣的關(guān)系?散點圖:兩個變量的散點圖中點的分布的位置是從左下角到右上角的區(qū)域,即一個變量值由小變大,另一個變量值也由小變大,我們稱這種相關(guān)關(guān)系為正相關(guān)。二、兩個變量的線性相關(guān)思考:1、兩個變量成負(fù)相關(guān)關(guān)系時,散點圖有什么特點?兩個變量的散點圖中點的分布的位置是從左上角到右下角的區(qū)域,即一個變量值由小變大,而另一個變量值由大變小,我們稱這種相關(guān)關(guān)系為負(fù)相關(guān)。2、你能舉出一些生活中的變量成正相關(guān)或者負(fù)相關(guān)的例子嗎?3、若兩個變量散點圖呈下圖,它們之間是否具有相關(guān)關(guān)系?散點圖回歸直線:如果散點圖中點的分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線就叫做回歸直線。這條回歸直線的方程,簡稱為回歸方程。方案一:采用測量的方法:先畫一條直線,測量出各點到它的距離,然后移動直線,到達(dá)一個使距離之和最小的位置,測量出此時直線的斜率和截距,就得到回歸方程。如何具體的求出回歸方程?方案二、在圖中選取兩點畫直線,使得直線兩側(cè)的點的個數(shù)基本相同。我們應(yīng)該如何具體的求出這個回歸方程呢?方案三、在散點圖中多取幾組點,確定幾條直線的方程,分別求出各條直線的斜率和截距的平均數(shù),將這兩個平均數(shù)作為回歸方程的斜率和截距。我們應(yīng)該如何具體的求出這個回歸方程呢?上述三種方案均有一定的道理,但可靠性不強(qiáng),我們回到回歸直線的定義。求回歸方程的關(guān)鍵是如何用數(shù)學(xué)的方法來刻畫“從整體上看,各點與直線的偏差最小”。計算回歸方程的斜率和截距的一般公式:其中,b是回歸方程的斜率,a是截距。最小二乘法的公式的探索過程如下:設(shè)已經(jīng)得到具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn)設(shè)所求的回歸直線方程為Y=bx+a,其中a,b是待定的系數(shù)。當(dāng)變量x取x1,x2,…,xn時,可以得到

Yi=bxi+a(i=1,2,…,n)它與實際收集得到的yi之間偏差是

yi-Yi=yi-(bxi+a)(i=1,2,…,n)(x1,y1)(x2,y2)(xi,yi)yi-Yiy

x這樣,用這n個偏差的和來刻畫“各點與此直線的整體偏差”是比較合適的。我們可以用計算機(jī)來求回歸方程。人體脂肪含量與年齡之間的規(guī)律,由此回歸直線來反映。將年齡作為x代入上述回歸方程,看看得出數(shù)值與真實值之間有何關(guān)系?年齡23273941454950脂肪9.517.821.225.927.526.328.2回歸值12.815.122.023.225.527.828.4年齡53545657586061脂肪29.630.231.430.833.535.234.6回歸值30.130.731.832.433.034.134.7若某人65歲,可預(yù)測他體內(nèi)脂肪含量在37.1%(0.577×65-0.448=37.1%)附近的可能性比較大。但不能說他體內(nèi)脂肪含量一定是37.1%。例、假設(shè)關(guān)于某設(shè)備的使用年限x(年)和所支出的維修費用y(萬元),有如下的統(tǒng)計資料:使用年限x(年)23456維修費用y(萬元)2.23.85.56.57.0若資料知y,x呈線性相關(guān)關(guān)系,試求:(1)線性回歸方程Y=bx+a的回歸系數(shù)a、b;(2)估計使用年限為10年時,維修費用是多少?iˉˉ解:(1)于是有b=(112.3-5*4*5)/(90-5*4^2)=1.23,a=5-1.23*4=0.08(2)回歸方程為Y=1.23x+0.08,當(dāng)x=10時,Y=12.38(萬元),即估計使用10年時維護(hù)費用是12.38萬元。小結(jié)1.求樣本數(shù)據(jù)的線性回歸方程,可按下列步驟進(jìn)行:第一步,計算平均數(shù),第二步,求和,第三步,計算第四步,寫出回歸方程2.回歸方程被樣本數(shù)據(jù)惟一確定,各樣本點大致分布在回歸直線附近.對同一個總體,不同的樣本數(shù)據(jù)對應(yīng)不同的回歸直線,所以回歸直線也具有隨機(jī)性.3.對于任意一組樣本數(shù)據(jù),利用上述公式都可求得“回歸方程”,如果這組數(shù)據(jù)不具有線性相關(guān)關(guān)系,即不存在回歸直線,那么所得的“回歸方程”是沒有實際意義的.因此,對一組樣本數(shù)據(jù),應(yīng)先作散點圖,在具有線性相關(guān)關(guān)系的前提下再求回歸方程.例1:有一個同學(xué)家開了一個小賣部,他為了研究氣溫對熱飲銷售的影響,經(jīng)過統(tǒng)計,得到一個賣出的熱飲杯數(shù)與當(dāng)天氣溫的對比表:1、畫出散點圖;2、從散點圖中發(fā)現(xiàn)氣溫與熱飲銷售杯數(shù)之間關(guān)系的一般規(guī)律;3、求回歸方程;4、如果某天的氣溫是2攝氏度,預(yù)測這天賣出的熱飲杯數(shù)。1、散點圖2、從圖3-1看到,各點散布在從左上角到由下角的區(qū)域里,因此,氣溫與熱飲銷售杯數(shù)之間成負(fù)相關(guān),即氣溫越高,賣出去的熱飲

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論