




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第十一章概率與統(tǒng)計第八課時統(tǒng)計案例知識梳理一、殘差分析1.線性回歸模型y=bx+a+e中,a,b叫做模型的未知參數(shù),e叫做隨機誤差.我們可以建立回歸方程為bx+a中的估計量,由于
,所以
是e的估計量,這樣,對于樣本點(i=1,2,…,n)相對于它們的隨機誤差為ei=y(tǒng)i-
=y(tǒng)i-bxi-a(i=1,2,…,n),其估計值為(i=1,2,…,n),
稱為相應(yīng)于樣本點(i=1,2,…,n)的殘差.2.殘差平方和Q=當(dāng)Q的值越小,說明線性回歸模型的擬合效果越好.3.相關(guān)指數(shù)用相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是:R2的值越大,說明殘差平方和越小,也就是說模型的擬合效果越好,在線性回歸模型中,R2表示解釋變量對預(yù)報變量變化的貢獻率,R2越接近于1,表示回歸效果越好.二、獨立性檢驗1.用變量的不同“值”表示個體所屬的不同類別,這種變量成為分類變量.例如:是否吸煙,宗教信仰,國籍等.2.列出兩個變量的頻數(shù)表,成為列聯(lián)表.3.一般地,假設(shè)有兩個分類變量X和Y,它們的值域分別是{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為2×2列聯(lián)表K2=(其中n=a+b+c+d為樣本容量),則利用獨立性檢驗判斷表來判斷“x與y的關(guān)系”.注意:常將k=叫做K2的觀測值.這種利用隨機變量K2(或說用K2的觀測值k)來確定在多大程度上可以認(rèn)為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗.經(jīng)過對統(tǒng)計量分布的研究,已經(jīng)得到了兩個臨界值:3.841與6.635.當(dāng)根據(jù)具體的數(shù)據(jù)算出的觀測值k>3.841時,有95%的把握說事件A與B有關(guān);當(dāng)k>6.635時,有99%的把握說事件A與B有關(guān);當(dāng)k≤3.841時,認(rèn)為事件A與B是無關(guān)的.基礎(chǔ)自測1.用獨立性檢驗來考察兩個變量x與y是否有關(guān)系,當(dāng)統(tǒng)計量K2的值()A.越大,“x與y是有關(guān)系的”成立可能性越小B.越大,“x與y是有關(guān)系的”成立可能性越大C.越小,“x與y是沒有關(guān)系的”成立可能性越小D.與“x與y有關(guān)系”成立的可能性無關(guān)B2.已知隨機事件A與B,經(jīng)計算得到K2的范圍是3.841<K2<6.635,則(下表是K2的臨界值表,供參考)()A.有95%把握說事件A與B有關(guān)B.有95%把握說事件A與B無關(guān)C.有99%把握說事件A與B有關(guān)D.有99%把握說事件A與B無關(guān)A3.樣本相關(guān)系數(shù)r的取值范圍是___________.[-1,1]4.若一組觀測值(x1,y1),(x2,y2),…,(xn,yn)之間滿足yi=a+bxi+ei(i=1,2,…,n),若ei=0恒成立,r為相關(guān)系數(shù),則r2=____________.1為了對2010年佛山市中考成績進行分析,從60分以上的全體同學(xué)中隨機抽出8位,他們的數(shù)學(xué)(已折算為百分制)、物理、化學(xué)分?jǐn)?shù)對應(yīng)如下表:(1)若規(guī)定85分(包括85分)以上為優(yōu)秀,求這8位同學(xué)中數(shù)學(xué)和物理分?jǐn)?shù)均為優(yōu)秀的頻率;(2)用變量y與x、z與x的相關(guān)系數(shù)說明物理與數(shù)學(xué)、化學(xué)與數(shù)學(xué)的相關(guān)程度;(3)求y與x、z與x的線性回歸方程(系數(shù)精確到0.01),并用相關(guān)指數(shù)比較所求回歸模型的效果.參考數(shù)據(jù):解析:(1)由表中可以看出,所選出的8位同學(xué)中,數(shù)學(xué)和物理分?jǐn)?shù)均為優(yōu)秀的人數(shù)是3人,其頻率是.(2)變量y與x、z與x的相關(guān)系數(shù)分別是
r=≈0.99,r′=≈0.99.可以看出,物理與數(shù)學(xué)、化學(xué)與數(shù)學(xué)的成績都是高度正相關(guān).(3)設(shè)y與x、z與x的線性回歸方程分別是根據(jù)所給的數(shù)據(jù),可以計算出
b=≈0.65,a=85-0.65×77.5=34.63,
b′=≈0.72,a′=81-0.72×77.5=25.20.所以y與x和z與x的回歸方程分別是
=0.72x+25.20.又y與x、z與x的相關(guān)指數(shù)是
R2=1-≈0.98、R′2=1-≈0.83.故回歸模型
=0.65x+34.63比回歸模型
=0.72x+25.20的擬合效果好.變式探究1.某校醫(yī)務(wù)室抽查了10名學(xué)生在高一和高二時的體重(單位:kg)如下表:(1)利用相關(guān)系數(shù)r判斷y與x是否具有相關(guān)關(guān)系?(2)若y與x具有相關(guān)關(guān)系,試估計高一體重為78kg的學(xué)生在高二時的體重.解析:(1)=71,=72.3,
=51467,10·=51333,=110,∵r>0.75,y與x具有很強的相關(guān)性.
(2)b=≈1.218,
a=72.3-1.218×71≈-14.178,∴回歸直線方程為:=1.218x-14.178,當(dāng)x=78時,y=1.218×78-14.178≈81.即估計高一體重為78kg的學(xué)生在高二時的體重約為81kg.(2010年廣州二模)某學(xué)校課題組為了研究學(xué)生的數(shù)學(xué)成績與物理成績之間的關(guān)系,隨機抽取高二年級20名學(xué)生某次考試成績(滿分100分)如下表所示:若單科成績85分以上(含85分),則該科成績?yōu)閮?yōu)秀.(1)根據(jù)上表完成下面的2×2列聯(lián)表(單位:人):(2)根據(jù)題(1)中表格的數(shù)據(jù)計算,有多大的把握,認(rèn)為學(xué)生的數(shù)學(xué)成績與物理成績之間有關(guān)系?(3)若從這20個人中抽出1人來了解有關(guān)情況,求抽到的學(xué)生數(shù)學(xué)成績與物理成績至少有一門不優(yōu)秀的概率.參考數(shù)據(jù):①假設(shè)有兩個分類變量X和Y,它們的值域分別為和,其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:則隨機變量K2=,其中n=a+b+c+d為樣本容量;②獨立檢驗隨機變量K2的臨界值參考表:解析:(1)2×2列聯(lián)表為(單位:人):(2)提出假設(shè)H0:學(xué)生數(shù)學(xué)成績與物理成績之間沒有關(guān)系.根據(jù)列聯(lián)表可以求得K2=≈8.802>7.879.當(dāng)H0成立時,P(K2>7.879)=0.005.
所以我們有99.5%的把握認(rèn)為:學(xué)生的數(shù)學(xué)成績與物理成績之間有關(guān)系.(3)由(1)可知數(shù)學(xué)成績與物理成績都優(yōu)秀的學(xué)生的人數(shù)為5人,則數(shù)學(xué)成績與物理成績至少有一門不優(yōu)秀的學(xué)生人數(shù)為15人.故從20名學(xué)生中抽出1名,抽到的學(xué)生數(shù)學(xué)成績與物理成績至少有一門不優(yōu)秀的概率為變式探究2.某校高二(1)、(2)班共100名同學(xué),在分科選擇中,一半同學(xué)(其中男生38人)選擇了物理,另一半(其中男生15人)選擇了歷史.你能否有99%的把握說選科與性別有關(guān)?解析:(1)列出2×2列聯(lián)表:
(2)提出假設(shè)
H0:選科與性別沒有關(guān)系.(3)根據(jù)列聯(lián)表中的數(shù)據(jù)計算K2的值
K2=≈21.24.(4)作出判斷因為當(dāng)H0成立時,K2≥6.635的概率約為0.01,所以我們有99%的把握說:選科與性別有關(guān).3.對196個接受心臟搭橋手術(shù)的病人和196個接受血管清障手術(shù)的病人進行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查結(jié)果如下表所示:試根據(jù)上述數(shù)據(jù)比較這兩種手術(shù)對病人又發(fā)作心臟病的影響有沒有差別.解析:由公式K2=2≈1.78,因為1.78<3.841,所以我們沒有理由說“心臟搭橋手術(shù)”與“又發(fā)作過心臟病”有關(guān),可以認(rèn)為病人又發(fā)作與否與其做過任何手術(shù)無關(guān).在對人們的休閑方式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人,女性中有43人主要的休閑方式是看電視,另外27人主要的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動.(1)根據(jù)以上數(shù)據(jù)建立一個2×2的列聯(lián)表;(2)判斷性別與休閑方式是否有關(guān)系.解析:(1)2×2列聯(lián)表如下:(2)假設(shè)“休閑方式與性別無關(guān)”,計算K2=≈6.201.因為K2>5.024.所以,有理由認(rèn)為假設(shè)“休閑方式與性別無關(guān)”是不合理的,即有97.5%的把握認(rèn)為“休閑方式與性別有關(guān)”.變式探究4.在一次惡劣氣候的航海過程中,調(diào)查了89位男女乘客的暈船的情況,男乘客暈船的有8人,不暈船的26人;女乘客暈船的有24人,不暈船的31人;請你根據(jù)所給數(shù)據(jù)判斷是否在惡劣氣候下航行,女人比男人更容易暈船?解析:(1)列聯(lián)表(2)假設(shè):“暈船與性別無關(guān)”,由公式得K2≈3.689,因為K2>2.706,所以我們有90%的把握說暈船與性別有關(guān)(女人更容易暈船).1.雖然兩個變量的觀測數(shù)據(jù)都可以用線性回歸模型來擬合,但不能保證這種模型對數(shù)據(jù)的擬合效果最好.為更好地刻畫兩個變量之間的關(guān)系,要根據(jù)觀測數(shù)據(jù)的特點來選擇回歸模型.2.獨立性檢驗的必要性:為什么不能只憑列聯(lián)表和圖形下結(jié)論?原因是列聯(lián)表中的數(shù)據(jù)是樣本數(shù)據(jù),它只是總體的代表,具有隨機性,因此需要用列聯(lián)表檢驗這個方法來確認(rèn)所得結(jié)論在多大程度上適用于總體.3.獨立性檢驗的思想來自于統(tǒng)計上的假設(shè)檢驗思想,它與反證法類似.假設(shè)檢驗和反證法都是先假設(shè)結(jié)論不成立,然后根據(jù)是否能夠
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療軟件購買合同范本
- 縣城餐飲轉(zhuǎn)讓合同范本
- 三個合伙購房合同范例
- 廚師保密協(xié)議合同范本
- 原油供銷合同范例
- 合伙創(chuàng)業(yè)辦廠合同范本
- 賣賣布合同范本
- 加工磚頭銷售合同范本
- 人保車險客戶專員合同范本
- 分期購買釘鞋合同范本
- 加德納多元智能測評量表【復(fù)制】
- 譯林英語四年級下冊4B各單元教學(xué)反思
- 鉆芯法檢測混凝土抗壓強度原始記錄1
- DB61∕T 1186-2018 花椒主要病蟲害防治技術(shù)規(guī)范
- QC成果提高大跨度多節(jié)點曲面鋼桁架一次安裝合格率
- 國家電網(wǎng)有限公司十八項電網(wǎng)重大反事故措施(修訂版)
- 環(huán)氧乙烷固定床反應(yīng)器課程設(shè)計
- 班、團、隊一體化建設(shè)實施方案
- 如何建構(gòu)結(jié)構(gòu)性思維 課后測試
- 施工方案(行車拆除)
- 開網(wǎng)店全部流程PPT課件
評論
0/150
提交評論