版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、1相關分析的意義和任務2簡單線性相關3回歸分析4估計標準誤差一、函數(shù)關系與相關關系例如:半徑與圓面積的關系工資水平與社會商品零售額的關系良種比重與收獲量的關系沸點(100度) (a+b)2 = a2+2ab+b2磚頭的抗壓強度與抗折強度函數(shù)關系函數(shù)關系函數(shù)關系相關關系(因果)相關關系(因果)相關關系函數(shù)關系:當一個或幾個變量取一定值時,另一個變量有確定值與之相對應,這種關系稱為確定性的函數(shù)關系。 在函數(shù)關系中,一般把作為影響因素的變量稱為;把發(fā)生對應變化(結果)的變量稱為。相關關系:當一個或幾個相互聯(lián)系的變量取一定數(shù)值時,與之相對應的另一變量的值雖然不確定,但仍按某種規(guī)律在一定的范圍內(nèi)變化。變
2、量間的這種相互關系,稱為具有不確定性的相關關系。由于在觀察或?qū)嶒炛谐霈F(xiàn)的誤差,函數(shù)關系也就通過相關關系反映出來;而當對現(xiàn)象之間的內(nèi)在聯(lián)系和規(guī)律性了解得更加清楚的時候,相關關系就可能轉(zhuǎn)化為函數(shù)關系。在相關關系中,通常存在一定的因果關系。但也應該知道,在相關關系中,有時兩個變量之間只存在相互聯(lián)系而并不存在明顯的因果關系。按相關的程度劃分為:完全相關(函數(shù)關系)、不完全相關和不相關;按相關的方向劃分為:正相關和負相關;按相關的形式劃分為:線性相關(直線關系)和非線性相關;按所研究的變量多少可分為:單相關、復相關和偏相關。 完全相關:完全相關:當一個現(xiàn)象的數(shù)量變化完全由另一個現(xiàn)象的數(shù)量變化所決定時,這
3、兩種現(xiàn)象間的關系就為完全相關(函數(shù)關系)。如:半徑與圓面積之間的關系。 不相關:不相關:當兩個現(xiàn)象彼此互不影響,其數(shù)量變化各自獨立時,這兩種現(xiàn)象間的關系就為不相關。如:股票價格與人的平均壽命之間的關系。 不完全相關:不完全相關:當現(xiàn)象之間的關系介于完全相關和不相關之間時,這兩種現(xiàn)象間的關系就為不完全相關。如:居民的收入水平與恩格爾系數(shù)之間的關系。 正相關正相關:當一個現(xiàn)象的數(shù)量由小變大,另一個現(xiàn)象的數(shù)量也相應由小變大,這種相關稱為正相關。如:職工的工資水平應隨勞動生產(chǎn)率的提高而增加。 負相關負相關:當一個現(xiàn)象的數(shù)量由小變大,而另一個現(xiàn)象的數(shù)量相反地由大變小,這種相關稱為負相關。如:隨著銷售額的
4、增加,流通費用率下降 線性相關:線性相關:當兩種相關現(xiàn)象之間的關系大致呈現(xiàn)為線性關系時,稱之為線性相關(直線相關)。如:人們的消費水平與收入水平之間的關系。 非線性相關:非線性相關:當兩種相關現(xiàn)象之間近似于某種曲線方程的關系時,則這種相關關系稱為非線性關系。如:產(chǎn)品的平均成本與產(chǎn)品產(chǎn)量之間的關系。 單相關單相關:兩個現(xiàn)象的相關,即一個變量對另一個變量的相關關系。如:投資額與國內(nèi)生產(chǎn)總值之間的關系。 復相關:復相關:當所研究的是一個變量對兩個或兩個以上其他變量的相關關系時,稱為復相關。如:某種商品的銷售額與其價格水平和人們收入水平之間的相關關系。 偏相關:偏相關:在某一現(xiàn)象與多種現(xiàn)象相關的場合,
5、假定其它變量不變時,其中兩個變量的相關關系稱為偏相關。如:在假定人們的收入水平不變的條件下,某種商品的需求與其價格水平的關系就是一種偏相關。(一)、相關分析 所謂,就是用一個指標來表明現(xiàn)象間相互依存關系的密切程度。(二)、回歸分析 所謂,就是根據(jù)相關關系的具體形態(tài),選擇一個合適的數(shù)學模型,來近似地表達變量間的變化關系。 回歸一詞,最初是英國生物學家F.Golton在研究遺傳學的論文中所采用的詞匯(1877年)。他在研究中發(fā)現(xiàn),具有較高身軀的雙親,或具有較矮身軀的雙親,其子女的身高均表現(xiàn)出退回(即回歸)到人的的趨勢。他在這一研究中所建立的數(shù)學公式被稱為回歸方程式,其涵義應是關系方程式或估計方程式
6、,但基于歷史的原因,通常仍沿用回歸方程式這一提法。相關分析與回歸分析不僅具有共同的研究對象,而且在具體應用時,常常必須相互補充。相關分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關的具體形式。回歸分析需要依靠相關分析來表明現(xiàn)象數(shù)量變化的相關程度。只有當變量之間存在著高度相關時,進行回歸分析尋求其相關的具體形式才有意義。因此,相關分析與回歸分析被合稱為廣義的相關分析。 研究目的不同: 相關分析是研究變量之間相關的 方向、相關程度和相關形式。 回歸分析是研究變量之間相互關系的具體形式,即:當一個變量發(fā)生數(shù)量上的變化時,另一個變量平均會發(fā)生什么樣的變化。 研究方法不同: 相關分析是通過計算相關系數(shù)或相關指數(shù)來
7、判斷變量之間的相關關系。 回歸分析是通過數(shù)學模型來確定變量之間的具體的數(shù)量關系。 變量的性質(zhì)不同:在相關分析中,不用確定誰是自變量,誰是因變量,且所有變量都是隨機變量。 在回歸分析中,必須事先確定在具有相關關系的變量中,誰是自變量和誰是因變量。一般來說,自變量是給定的非隨機變量(一般變量),因變量是隨機變量。(一)、居民消費和收入的相關表消費支出15203040425360657078可支配收入18254560627588929998單位:百元可 支 配 收 入消費支出(二)、消費與收入的相關圖相關系數(shù):用于判斷線性相關關系。用 積差法進行計算。相關指數(shù):用于判斷所有相關關系,包 括線性和非線
8、性的相關關系。 但要用回歸系數(shù)b判別其相關 方向。相關系數(shù)是在直線相關的條件下,說明兩個現(xiàn)象之間相關關系密切程度的統(tǒng)計指標。相關系數(shù)的取值范圍,是在1和+1之間。計算結果r 0 為正相關,r 0,為正值;在第二、四象限中, (xx)(yy)0,為負值; 但(xx)(yy)的大小受變量值個數(shù)多少的影響,同樣的兩個現(xiàn)象會因為變量值個數(shù)的多少而出現(xiàn)計算結果的不一致。因此,需要消除計算結果受變量值個數(shù)多少的影響。方法就是:將計算結果除以變量值的個數(shù) n。兩個變量的協(xié)方差)與(表示yxyyxxnxy12顯示 x 與 y 是正相關,還是負相關。相關系數(shù)的正負完全取決于協(xié)方差的正負。顯示 x 與 y 相關程
9、度的大小。 協(xié)方差的絕對值小,表示相關程度低;協(xié)方差的絕對值大,表示相關程度高。222222212112yynxxnyxxynryyxxyyxxyyxxyyxxrnnnyxxy計算式:編號xyxyx2y21541926420381274832659127692287962689725910227101022811106311212331131293414138381515836合計15164234463216365412311例:觀察收入水平提高對用于食品支出的影響。設:收入水平為x,食品支出為y。收入水平食品支出9414. 0423123111515161636541542315164463
10、215222222yynxxnyxxynr 從計算結果可以知道,收入水平與用于食品的支出成高度的正相關。 在相關分析中,已知兩個變量之間有直線相關關系。 就需要確定一個數(shù)學表達式反映因變量與自變量之間的關系。 有了這種數(shù)學表達式就便于進行解析,當有了自變量的一定數(shù)值,就可以估計因變量的數(shù)值平均平均來說將會有怎樣的變動。 這樣的數(shù)學表達式稱為回歸方程式。 由于變量之間關系的復雜性,回歸方程式也有多種類型和形式。 一元線性回歸方程式是指一個自變量且相關形式為直線。編號xyxyx2yc1541919.722642021.523812724.584832624.945912726.386922826.
11、567962627.288972527.4691022728.36101022828.36111063129.0812123313222141383834.84151583638.44合計151642344632163654422.88從前面的相關分析中,已經(jīng)看出兩個變量之間是線性趨勢,因此,可以通過一個線性方程式來表達這種關系:a、b是回歸方程的待定參數(shù),其中b稱為回歸系數(shù)。bxay 根據(jù)方程所確定的估計值 應能代表所有觀察值y的全體,而按照 求出的估計直線與各觀察點之間應達到最大限度的接近,也就是說,用這條直線來代表y與x的關系,它和實際數(shù)據(jù)的誤差比任何其他直線都
12、小,這樣一來,根據(jù)回歸方程所求的直線就是反映y與x之間的關系的較為合理的一條直線。y y a:是截距,表示當x等于0時,y = a; b:是斜率,表示x每增加一個單位時,y所平均 增加的數(shù)值。也是回歸系數(shù),它與相關系數(shù) r 的取值方向一致: b為正值時,r為正,表示正相關; b為負值時,r為負,表示負相關。xbyaxxnyxxynbbabxayyy2222min)(min) ()(得到兩個標準方程組:零。求偏導數(shù),并令其等于和分別對xyxbyaxxnyxxynbbabxay18. 099. 999. 915151618. 01542318. 01516163654154231516446321
13、5222回歸方程式:第三步:建立一元線性(元)(元)(:和法,求解系數(shù)第二步:利用最小二乘回歸方程式:第一步:建立一元線性將人均收入水平(x)代入回歸方程式,計算得到估計值,將其結果填入統(tǒng)計表。我們可以看到因變量(y)的觀察值和估計值并不一致,存在差異。這個差異的大小就是衡量直線方程式對所有觀察點的代表性的標準。 回歸方程反映了因變量與自變量之間的變動關系。但它本身并不能反映擬合程度的好壞,在建立方程之后,需要進一步分析估計直線的代表性,所有觀察點與估計值之間的離差程度等,這就需要建立一些指標來加以測定。 所有觀察值y是上下波動的,y取值的這種波動的現(xiàn)象稱為變差。產(chǎn)生變差的原因是:受自變量變動
14、的影響,即x取值的不同;其他因素的影響。 為了分析這兩個方面的影響,需要對總變差進行分解,即:)() (yyyyyyxbxayyy yyyy yy yy0 222222220022yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy則有:后對所有觀察點求和,將上式的兩邊平方,然)()(都可分解為兩部分。每個觀察點的離差從上圖可以看出: :根據(jù)線性方程,可以把它看作是由于x的變動所引起。因此, 反映了在y的總變差中由于 x 與 y 的線性依存關系而引起 y 的變化部分,即總變差的變化中被判明或已經(jīng)解釋了的部分,稱為記作 。 :是每個觀察點距回歸直線離差的平方和。根據(jù)最小二乘法
15、原理,這個量是在所有的直線中與觀察點距離平方和最小的一個,它反映的是除了x對y的線性關系影響之外的一切因素對y的影響部分,稱為或未解釋的變差,記為 。2()yy2()yy2yybxay)()(2總變差yy )() (2Qyy剩余變差)回歸變差Uyy()(2yy yy0計算。用兩個自由度,因而應該兩個參數(shù),失去了和了中,根據(jù)實際資料計算)()(是因為在分母為)(根是稱為剩余方差,其平方)(表示。剩余變差的平均數(shù)以222222222222nbabxayyynnyynQSnyynQSSqqq 在回歸分析中,Sq則反映了所有觀察值y對估計值y的平均差異程度。 從回歸方程的意義中知道,對給定的自變量x值
16、,觀察值y并非總在回歸直線上,而是分布在它的周圍,這樣就必然形成一定的離差。 從直觀上看,它反映的是觀察值y與估計值y之間的離差,而在它的背后則是反映由自變量x來估計因變量y時所產(chǎn)生的誤差。 若是這個離差的值愈小,即按照給定的x值來估計y的誤差愈小,因而y的準確程度愈高;相反,若是這個離差的值愈大,從直觀上看就是各觀察點離開直線愈遠,這時按給定的x值來估計y值,其誤差就愈大,因而y的準確程度降低。 從這個意義上說,這個標準離差通稱為說明:觀察值y與估計值y的平均差異程度是1.91元。(元)將前面的資料帶入得:91. 11324.472154463218. 042399. 91231122qqS
17、nxybyayS趨勢值(預測值)落在下列區(qū)間的概率是:v落在ySq的區(qū)間內(nèi)約占總次數(shù)的68.27%;v落在y2Sq的區(qū)間內(nèi)約占總次數(shù)的95.45%;v落在y3Sq的區(qū)間內(nèi)約占總次數(shù)的99.73%;91. 1199.459 .4708.44%27.6899.4520018. 099. 918. 099. 9200元之間。至出在的概率估計人均食品支以(元)元時,如果人均月收入是xy 回歸變差U,從意義上講,就是在影響總變差的因素當中已被查明或已被解釋了的部分,也就是自變量x影響的部分。 當Q的數(shù)值愈小,而U 的數(shù)值愈大,即表明總變差中已被判明或被解釋了的因素(x)占的比率大,在圖形上表現(xiàn)為所有觀察點離回歸直線愈近,因而也就表示x與y的關系愈密切。 如果所有觀察點全在回歸直線上,則y = y,即總變差等于回歸變差,剩余變差等于零。這時產(chǎn)生的總變差完全是由x的變動所引起的,這就是完全相關。 但在一般情況下,對相關關系,除自變量的影響而外,還有其他未判明的因素起作用,其觀察點的分布不是在回歸直線上,而是分布在它的周圍,并表現(xiàn)出上下波動的狀況。2Uyy 在這種情況下,關系的密切程度主要根據(jù)U 對總變差的比率大小而異:v 若U 對總變差的比率逐漸增大,則相關關系隨之增加,并逐漸趨于完全相關;v 若U 對總變差的比率逐漸減少,則相關關系隨之減小,并逐漸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 去健身房鍛煉身體的說說范文
- 2025年粵教新版九年級歷史上冊月考試卷含答案
- 2025年華師大新版八年級物理下冊月考試卷含答案
- 2025年新世紀版選擇性必修二化學下冊月考試卷
- 2025年滬科新版九年級地理下冊月考試卷含答案
- 2025年湘師大新版必修2歷史上冊階段測試試卷
- 2025年華東師大版九年級科學上冊階段測試試卷含答案
- 2025年外研版八年級歷史上冊階段測試試卷
- 2025年粵教版必修1語文上冊階段測試試卷
- 2025年北師大版選修2地理上冊月考試卷含答案
- 醫(yī)院醫(yī)療質(zhì)量管理委員會會議記錄五篇
- 《中國高考評價體系》解讀(化學學科)
- 公司發(fā)展能力提升方案
- 電梯安全守則及乘客須知
- IT硬件系統(tǒng)集成項目質(zhì)量管理方案
- 《容幼穎悟》2020年江蘇泰州中考文言文閱讀真題(含答案與翻譯)
- 水上水下作業(yè)應急預案
- API520-安全閥計算PART1(中文版)
- 2023年廣東省廣州地鐵城際鐵路崗位招聘筆試參考題庫附帶答案詳解
- 商務提成辦法
- 直流電機電樞繞組簡介
評論
0/150
提交評論