




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
章末復習課[網(wǎng)絡構建][核心歸納]一、兩個基本思想1.回歸分析的基本思想
回歸分析包括線性回歸分析和非線性回歸分析兩種,而非線性回歸分析往往可以通過變量代換轉化為線性回歸分析,因此,回歸分析的思想主要是指線性回歸分析的思想.
注意理解以下幾點: (1)確定線性相關關系
線性相關關系有兩層含義:一是具有相關關系,如廣告費用與銷售量的關系等在一定條件下具有相關關系,而氣球的體積與半徑的關系是函數(shù)關系,而不是相關關系;二是具有線性相關關系. (4)回歸模型的擬合效果
判斷回歸模型的擬合效果的過程也叫殘差分析,殘差分析的方法有兩種,一是通過殘差圖直觀判斷,二是通過計算決定系數(shù)R2的大小判斷.2.獨立性檢驗的基本思想
獨立性檢驗的基本思想類似于反證法.要確認兩個分類變量有關系的可信程度,先假設兩個分類變量沒有關系,再計算隨機變量χ2的值,最后由χ2的值很大在一定程度上說明兩個分類變量有關系.進行獨立性檢驗要注意理解以下三個問題:(1)獨立性檢驗適用于兩個分類變量.(2)兩個分類變量是否有關系的直觀判斷:一是根據(jù)2×2列聯(lián)表計算|ad-bc|,值越大關系越強;二是觀察等高堆積條形圖,兩個深色條的高度相差越大關系越強;(3)獨立性檢驗是對兩個分類變量有關系的可信程度的判斷,而不是對其是否有關系的判斷.獨立性檢驗的結論只能是有多大的把握確認兩個分類變量有關系,而不能是兩個分類變量一定有關系或沒有關系.二、兩個重要參數(shù)1.決定系數(shù)R2
決定系數(shù)R2是用來刻畫回歸模型的回歸效果的,其值越大,殘差平方和越小,模型的擬合效果越好.2.隨機變量χ2
隨機變量χ2是用來判斷兩個分類變量在多大程度上相關的變量.獨立性檢驗即計算χ2的值,并與教材中所給表格中的數(shù)值進行比較,從而得到兩個分類變量在多大程度上相關.三、兩種重要圖形1.散點圖
散點圖是進行線性回歸分析的主要手段,其作用如下:
一是判斷兩個變量是否具有線性相關關系,如果樣本點呈條狀分布,則可以斷定兩個變量有較好的線性相關關系;
二是判斷樣本中是否存在異常.2.殘差圖
殘差圖可以用來判斷模型的擬合效果,其作用如下:
一是判斷模型的精度,殘差點所分布的帶狀區(qū)域越窄,說明模型的擬合精度越高,回歸方程的預報精度越高.
二是確認樣本點在采集中是否有人為的錯誤.要點一獨立性檢驗獨立性檢驗研究的問題是有多大把握認為兩個分類變量之間有關系.為此需先列出2×2列聯(lián)表,從表格中可以直觀地得到兩個分類變量是否有關系.另外等高條形圖能更直觀地反映兩個分類變量之間的情況.獨立性檢驗的思想是:可以先假設二者無關系,求隨機變量χ2的值,若χ2大于臨界值,則拒絕假設,否則,接受假設.要點一獨立性檢驗獨立性檢驗研究的問題是有多大把握認為兩個分類變量之間有關系.為此需先列出2×2列聯(lián)表,從表格中可以直觀地得到兩個分類變量是否有關系.另外等高條形圖能更直觀地反映兩個分類變量之間的情況.獨立性檢驗的思想是:可以先假設二者無關系,求隨機變量χ2的值,若χ2大于臨界值,則拒絕假設,否則,接受假設.【例1】考察小麥種子滅菌與否跟發(fā)生黑穗病的關系,經(jīng)試驗觀察,得到數(shù)據(jù)如下表:試分析種子滅菌與小麥發(fā)生黑穗病是否有關?
種子滅菌種子未滅菌合計黑穗病26184210無黑穗病50200250合計76384460解零假設為H0:認為種子滅菌與否與小麥發(fā)生黑穗病無關系.由列聯(lián)表的數(shù)據(jù)可求得而4.804>3.841=x0.05,根據(jù)小概率值α=0.05的χ2獨立性檢驗,我們推斷H0不成立,即認為種子是否滅菌與小麥發(fā)生黑穗病有關系,此推斷犯錯誤的概率不超過0.05.【訓練1】在研究某種新措施對豬白痢的防治效果問題時,得到以下數(shù)據(jù):試問新措施對防治豬白痢是否有效?
存活數(shù)死亡數(shù)合計對照11436150新措施13218150合計24654300解零假設為H0:新措施對防治豬白痢無效,由列聯(lián)表可求得根據(jù)小概率值α=0.01的χ2獨立性檢驗,我們推斷H0不成立,即認為新措施對防治豬白痢有效,此推斷犯錯誤的概率不超過0.01.要點二回歸分析
回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.其基本步驟為:通過散點圖和經(jīng)驗選擇回歸方程的類型,然后通過一定的規(guī)則確定出相應的回歸方程,通過一定的方法進行檢驗,最后應用于實際或對預報變量進行預測.【例2】某地搜集到的新房屋的銷售價格y(單位:萬元)和房屋面積x(單位:m2)的數(shù)據(jù)如下表:房屋面積x/m211511080135105銷售價格y/萬元24.821.618.429.222要點二回歸分析
回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.其基本步驟為:通過散點圖和經(jīng)驗選擇回歸方程的類型,然后通過一定的規(guī)則確定出相應的回歸方程,通過一定的方法進行檢驗,最后應用于實際或對預報變量進行預測.【例2】某地搜集到的新房屋的銷售價格y(單位:萬元)和房屋面積x(單位:m2)的數(shù)據(jù)如下表:房屋面積x/m211511080135105銷售價格y/萬元24.821.618.429.222(1)畫出數(shù)據(jù)對應的散點圖;(2)求回歸直線方程;(3)根據(jù)(2)的結果,估計當房屋面積為150m2時的銷售價格.解(1)設x軸表示房屋的面積,y軸表示銷售價格,數(shù)據(jù)對應的散點圖如圖.故當房屋面積為150m2時,估計銷售價格是31.2442萬元.【訓練2】在一段時間內,分5次測得某種商品的價格x(萬元)和需求量y(t)之間的一組數(shù)據(jù)為
12345價格x1.41.61.822.2需求量y1210753解(1)散點圖如下圖所示:樣本點分布在一條直線附近,y與x具有線性相關關系.故價格定為1.9萬元,預測需求量大約為6.25t.要點三數(shù)形結合思想
數(shù)形結合思想就是在解決與幾何圖形有關的問題時,將圖形信息轉換成代數(shù)信息,利用數(shù)量特征,將其轉化為代數(shù)問題;在解決與數(shù)量有關的問題時,根據(jù)數(shù)量的結構特征,構造出相應的幾何圖形,即化為幾何問題,從而利用數(shù)形的辯證統(tǒng)一和各自的優(yōu)勢盡快得到解決途徑,這對提高分析和解決問題的能力有極大的幫助.數(shù)形結合的主要途徑:(1)形轉化為數(shù),即用代數(shù)方法研究幾何問題,這是解決幾何問題的基本方法;(2)數(shù)轉化為形,即根據(jù)給出的“數(shù)”的結構特點,構造出與之相應的幾何圖形,用幾何方法解決代數(shù)問題;(3)數(shù)形結合,即用形研究數(shù),用數(shù)研究形,相互結合,使問題變得直觀、簡捷.在進行回歸分析時,常利用散點圖、殘差圖等說明線性相關情況或模型的擬合效果.在獨立性檢驗中,我們常用等高堆積條形圖直觀地反映數(shù)據(jù)的情況,從而可以粗略地判斷兩個分類變量是否有關系.【例3】電視傳媒公司為了解某地區(qū)電視觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調查.如圖所示的是根據(jù)調查結果繪制的觀眾日均收看該體育節(jié)目時間的頻率分布直方圖.將日均收看該體育節(jié)目時間不低于40分鐘的觀眾稱為“體育迷”.(1)根據(jù)已知條件完成下面的2×2列聯(lián)表,據(jù)此資料你是否認為“體育迷”與性別有關?
非體育迷體育迷合計男
女
1055合計
(2)將上述調查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機抽樣方法每次抽取1名觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數(shù)為X.若每次抽取的結果是相互獨立的,求X的分布列,期望E(X)和方差D(X).α0.050.01xα3.8416.635解(1)由頻率分布直方圖可知,在抽取的100人中,“體育迷”有25人,從而2×2列聯(lián)表如下:
非體育迷體育迷合計男301545女451055合計7525100將2×2列聯(lián)表中的數(shù)據(jù)代入公式計算,得:因為3.030<3.841=x0.05,所以沒有理由認為“體育迷”與性別有關.【訓練3】
PM2.5(細顆粒物)是指空氣中直徑小于或等于2.5微米的顆粒物(也稱可入肺顆粒物).為了探究車流量與PM2.5的質量分數(shù)是否相關,現(xiàn)采集到某城市周一至周五某一時間段車流量與PM2.5的數(shù)據(jù)如下表:時間周一周二周三周四周五車流量x/萬輛5051545758PM2.5的質量分數(shù)y/(微克/立方米)6970747879(1)根據(jù)上表數(shù)據(jù),請在下面坐標系(如圖)中畫出散點圖;解(1)散點圖如圖所示.樣本點分布在一條直線附近,y與x具有線性相關關系.∴可以預測此時PM2.5的質量分數(shù)約為37微克/立方米.備用工具&資料(1)根據(jù)上表數(shù)據(jù),請在下面坐標系(如圖)中畫出散點圖;要點二回歸分析
回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.其基本步驟為:通過散點圖和經(jīng)驗選擇回歸方程的類型,然后通過一定的規(guī)則確定出相應的回歸方程,通過一定的方法進行檢驗,最后應用于實際或對預報變量進行預測.【例2】某地搜集到的新房屋的銷售價格y(單位:萬元)和房屋面積x(單位:m2)的數(shù)據(jù)如下表:房屋面積x/m211511080135105銷售價格y/萬元24.821.618.429.222解零假設為H0:認為種子滅菌與否與小麥發(fā)生黑穗病無關系.由列聯(lián)表的數(shù)據(jù)可求得而4.804>3.841=x0.05,根據(jù)小概率值α=0.05的χ2獨立性檢驗,我們推斷H0不成立,即認為種子是否滅菌與小麥發(fā)生黑穗病有關系,此推斷犯錯誤的概率不超過0.05.進行獨立性檢驗要注意理解以下三個問題:(1)獨立性檢驗適用于兩個分類變量.(2)兩個分類變量是否有關系的直觀判斷:一是根據(jù)2×2列聯(lián)表計算|ad-bc|,值越大關系越強;二是觀察等高堆積條形圖,兩個深色條的高度相差越大關系越強;(3)獨立性檢驗是對兩個分類變量有關系的可信程度的判斷,而不是對其是否有關系的判斷.獨立性檢驗的結論只能是有多大的把握確認兩個分類變量有關系,而不能是兩個分類
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 英漢名詞單復數(shù)形式差異教案
- 月光下的村莊寫景文(7篇)
- 高一(上)物理階段檢測卷一
- 2021學年上海建平中學高一(下)期中歷史試題及答案
- 《長笛初級技巧與演奏練習教案》
- 婚內防協(xié)議書范本
- 為人需當孝父母作文900字(8篇)
- 八德之星活動方案
- 公主裙親子活動方案
- 公交公司送溫暖活動方案
- 老年高血壓特點及臨床診治流程專家共識(2024版)解讀
- 《建筑結構加固工程施工質量驗收規(guī)范》
- 中醫(yī)基礎理論考試題庫及答案五
- 合同委托協(xié)議書范文
- 國家開放大學電大《10861理工英語4》期末終考題庫及答案
- 【萬科股權結構和公司治理的關系探究11000字(論文)】
- 2024年江蘇省蘇州市中考物理真題(原卷版+解析版)
- 放射治療的劑量優(yōu)化算法
- 蔬菜栽培學智慧樹知到期末考試答案章節(jié)答案2024年浙江大學
- 變配電運行值班員(500kV及以上)初級工-機考題庫(導出版)
- JB-T 14320-2022 氧氣用止回閥
評論
0/150
提交評論