版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第五節(jié)變量間的相關(guān)關(guān)系、統(tǒng)計案例第九章算法初步、統(tǒng)計與統(tǒng)計案例考綱要求1.會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關(guān)關(guān)系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.3.了解下列兩種常用的統(tǒng)計方法,并能應用這些方法解決一些實際問題.(1)獨立檢驗:了解獨立性檢驗(只要求2×2列聯(lián)表)的基本思想、方法及其簡單應用.(2)回歸分析:了解回歸分析的基本思想、方法及其簡單應用.課前自修知識梳理1.散點圖.(1)將變量所對應的點描出來,就組成了變量之間的一個圖,這種圖為變量之間的________.(2)從散點圖上可以看出,如果變量之間存在著某種關(guān)系,這些點會有一個集中的大致趨勢,這種趨勢可用一條光滑的曲線來近似,這種近似的過程稱為曲線擬合.2.相關(guān)關(guān)系.(1)從散點圖上看,點散布在從左下角到右上角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為________;點散布在從左上角到右下角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系稱為________.散點圖正相關(guān)負相關(guān)(2)線性相關(guān):從散點圖上看,如果這些點從整體上看大致分布在一條直線附近,則稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做________.(3)若兩個變量x和y的散點圖中,所有點看上去都在某條曲線(不是一條直線)附近波動,則稱此相關(guān)是__________的.如果所有的點在散點圖中沒有顯示任何關(guān)系,則稱變量間是不相關(guān)的.3.回歸直線.(1)最小二乘法:如果有n個點:(x1,y1),(x2,y2),…,(xn,yn)可以用下面的表達式來刻畫這些點與回歸直線的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2,使得上式達到最小值的就是我們要求的直線,這種方法稱為最小二乘法.回歸直線非線性相關(guān)(1)當r>0時,表明兩個變量________;(2)當r<0時,表明兩個變量________;(3)r的絕對值越接近1,表明兩個變量的線性相關(guān)性________;r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常當|r|>0.75時,認為兩個變量有很強的線性相關(guān)關(guān)系.當|r|∈[0.3,0.75)時,相關(guān)性一般.當|r|∈[0,0.25]時,相關(guān)性較弱.正相關(guān)負相關(guān)越強
5.殘差分析.
(1)線性回歸模型:y=bx+a+e中,a,b稱為模型的未知參數(shù);e稱為隨機誤差.
(2)殘差平方和:對于樣本點(xi,yi)(i=1,2,…,n),Q=稱為殘差平方和,Q值越小,說明線性回歸模型的擬合效果越好.
(3)相關(guān)指數(shù):用相關(guān)指數(shù)R2來刻畫回歸的效果,公式是R2=1-.R2的值越大,說明殘差平方和越小,也就是說模型擬合效果________.越好6.獨立性檢驗.(1)若變量的不同“值”表示個體所屬的不同類型,則這類變量稱為分類變量.(2)列出兩個分類變量的頻數(shù)表,稱為列聯(lián)表.(3)利用隨機變量K2來確定在多大程度上可以認為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的____________________.獨立性檢驗2×2列聯(lián)表獨立性檢驗公式K2=__________________________________.y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d基礎自測1.下列命題:①任何兩個變量都具有相關(guān)關(guān)系;②圓的周長與該圓的半徑具有相關(guān)關(guān)系;③某商品的需求與該商品的價格是一種非確定性關(guān)系;④根據(jù)散點圖求得的回歸直線方程可能是沒有意義的;⑤兩個變量間的相關(guān)關(guān)系可以通過回歸直線,把非確定性問題轉(zhuǎn)化為確定性問題進行研究.其中正確的命題為(
)A.①③④
B.②④⑤C.③④⑤
D.②③⑤答案:C2.用獨立性檢驗來考察兩個變量x與y是否有關(guān)系,當統(tǒng)計量K2的值(
)A.越大,“x與y是有關(guān)系的”成立可能性越小B.越大,“x與y是有關(guān)系的”成立可能性越大C.越小,“x與y是沒有關(guān)系的”成立可能性越小D.與“x與y有關(guān)系”成立的可能性無關(guān)答案:B3.(2012·湛江市二模)通過隨機詢問110名大學生是否愛好某項運動,得到如下的列聯(lián)表:由上表算得k≈7.8,因此得到的正確結(jié)論是(
)男女總計愛好402060不愛好203050總計6050110A.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關(guān)”B.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關(guān)”C.有99%以上的把握認為“愛好該項運動與性別有關(guān)”D.有99%以上的把握認為“愛好該項運動與性別無關(guān)”解析:根據(jù)K2的臨界值表和獨立性檢驗的概念知,選項C正確.答案:C(2011·遼寧卷)調(diào)查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調(diào)查顯示年收入x與年飲食支出y具有線性相關(guān)關(guān)系,并由調(diào)查數(shù)據(jù)得到y(tǒng)對x的回歸直線方程:=0.254x+0.321.由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加________萬元.解析:由題意得
2-1=[0.254(x+1)+0.321]-[0.254x+0.321]=0.254,即家庭年收入每增加1萬元,年飲食支出平均增加0.254萬元.答案:0.254考點探究考點一利用散點圖判斷兩個變量的相關(guān)關(guān)系【例1】
(1)觀察下列各圖形:其中兩個變量x,y具有相關(guān)關(guān)系的圖形是(
)A.①②
B.①④C.①②④
D.②③④(2)下表是某地的年降雨量
y(單位:mm)與年平均氣溫x(單位:℃)的數(shù)據(jù)資料,兩者是(
)年平均氣溫x/℃12.5112.8412.8413.6913.3312.7413.05年降雨量y/mm748542507813574701432A.正相關(guān)關(guān)系B.負相關(guān)關(guān)系C.非線性相關(guān)關(guān)系D.不具有相關(guān)關(guān)系點評:(1)在散點圖中,如果所有的樣本點都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關(guān)系,即變量之間具有函數(shù)關(guān)系.如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系.(2)散點圖的最大優(yōu)點就是直觀,并且制作散點圖也較為方便,因此散點圖在判斷兩個變量是否相關(guān)的過程中起著重要作用.散點圖是判斷兩個變量是否相關(guān)的方法之一,至于相關(guān)性的強弱還要利用相關(guān)系數(shù)來判斷.解析:(1)相關(guān)關(guān)系有兩種情況:所有點看上去都在一條直線附近波動,是線性相關(guān);若所有點看上去都在某條曲線(不是一條直線)附近波動,是非線性相關(guān).由圖可以看出,①②是線性相關(guān),④是非線性相關(guān)的.只有③是不相關(guān)的.故選C.(2)以x軸為年平均氣溫,y軸為年降雨量,可得相應的散點圖如圖所示.由圖可以看出某地的年降雨量(mm)與年平均氣溫(℃)不具有相關(guān)關(guān)系.故選D.答案:(1)C
(2)D變式探究1.(1)有五組變量:①汽車的重量和汽車每消耗1升汽油所行使的平均路程;②平均日學習時間和平均學習成績;③某人每日吸煙量和身體健康情況;④圓的半徑與面積;⑤汽車的重量和每公里耗油量.其中兩個變量成正相關(guān)的是(
)A.①③
B.②④C.②⑤
D.④⑤(2)有10名同學高一(x)和高二(y)的數(shù)學成績?nèi)缦拢簞t兩個變量x和y(
) A.沒有相關(guān)關(guān)系B.有正相關(guān)關(guān)系C.有負相關(guān)關(guān)系D.無法判斷高一成績x74717268767367706574高二成績y76757170767965776272解析:(1)由正相關(guān)與負相關(guān)的概念知②⑤是正相關(guān),①③是負相關(guān),④為函數(shù)關(guān)系.故選C.(2)以高一成績?yōu)閤軸,高二成績?yōu)閥軸,畫出散點圖如圖,可以看出,這些點在一條直線附近波動,且y隨著x增加而增加,所以x與y有正相關(guān)關(guān)系.故選B.答案:(1)C
(2)B考點二求回歸直線方程【例2】
某工廠某產(chǎn)品產(chǎn)量與單位成本成線性相關(guān)關(guān)系,數(shù)據(jù)如下:根據(jù)以上數(shù)據(jù)求線性回歸方程.月份產(chǎn)量x/千件單位成本y/(元/件)x2xy127341462372921634711628443739219546916276656825340合計21426791481點評:(1)最小二乘法是一種有效地求回歸方程的方法,它保證了各點與此直線在整體上最接近,最能反映樣本觀測數(shù)據(jù)的規(guī)律.(2)用最小二乘法求回歸直線方程的步驟:①判斷是否線性相關(guān),可用散點圖判斷,也可以用殘差分析、相關(guān)指數(shù)判斷;②如果是線性相關(guān),先計算的值,再代入公式的值;③寫出直線回歸方程.變式探究如表,其提供了某廠節(jié)能降耗技術(shù)改造生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(單位:噸)與相應的生產(chǎn)能耗y(單位:噸標準煤)的幾組對應數(shù)據(jù).
(1)請畫出表中數(shù)據(jù)的散點圖;(2)請根據(jù)表中提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的回歸方程=.x3456y2.5344.5解析:(1)依題設所給數(shù)據(jù),可得散點圖如圖.考點三利用回歸直線方程對總體進行估計【例3】營養(yǎng)學家為研究食物中蛋白質(zhì)含量對嬰幼兒生長的影響,調(diào)查了一批年齡在兩個月到三歲的嬰幼兒,將他們按食物中蛋白質(zhì)含量的高低分為高蛋白食物組和低蛋白食物組兩組,并測量身高,得到下面的數(shù)據(jù):高蛋白食物組:年齡0.20.50.8111.41.8222.52.532.7身高5454.363666973828380.39193.29494低蛋白食物組:身高與年齡近似有線性關(guān)系,檢驗:不同食物的嬰幼兒的身高有無差異;若存在,這種差異有何特點.年齡0.40.7111.5222.42.831.31.80.23身高52556163.46668.567.972767465695177對低蛋白食物組,設年齡為x,身高為y,同樣可得線性回歸方程=51.226+8.686x,通過對斜率、截距進行比較,可以看出不同食物對嬰兒的身高有顯著的差異,且高蛋白食物組同齡嬰幼兒身高明顯高些.點評:線性回歸分析的主要作用是通過對兩個變量已有數(shù)據(jù)的分析,來預測這兩個變量的變化趨勢,一般步驟是:①進行線性相關(guān)性檢驗;②如果具有線性相關(guān)性,求出線性回歸方程;③將觀測值代入回歸方程進行預測.變式探究3.某班5名學生的數(shù)學和物理成績?nèi)缦卤恚?1)畫出散點圖;(2)求物理成績y對數(shù)學成績x的回歸直線方程;(3)一名學生的數(shù)學成績是96,試預測他的物理成績.學生ABCDE
數(shù)學成績x/分8876736663物理成績y/分7865716461解析:(1)散點圖如圖.考點四獨立性檢驗序號123456789數(shù)學成績957580949265678498序號101112131415161718數(shù)學成績716793647877905783【例4】
某學校課題組為了研究學生的數(shù)學成績與物理成績之間的關(guān)系,隨機抽取高二年級20名學生某次考試成績(滿分100分)如下表所示序號123456789物理成績906372879171588293序號101112131415161718物理成績817782488569916184若單科成績85分以上(含85分),則該科成績?yōu)閮?yōu)秀.(1)根據(jù)上表完成下面的2×2列聯(lián)表(單位:人).數(shù)學成績優(yōu)秀數(shù)學成績不優(yōu)秀
合計物理成績優(yōu)秀物理成績不優(yōu)秀合
計20(2)根據(jù)題(1)中表格的數(shù)據(jù)計算,有多大的把握,認為學生的數(shù)學成績與物理成績之間有關(guān)系?(3)若從這20個人中抽出1人來了解有關(guān)情況,求抽到的學生數(shù)學成績與物理成績至少有一門不優(yōu)秀的概率.參考數(shù)據(jù)①假設有兩個分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:則隨機變量K2=,其中n=a+b+c+d為樣本容量;y1y2合計x1aba+bx2cdc+d合計a+cb+da+b+c+d②獨立檢驗隨機變量K2的臨界值參考表:P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828解析:(1)2×2列聯(lián)表為(單位:人):數(shù)學成績優(yōu)秀數(shù)學成績不優(yōu)秀合計物理成績優(yōu)秀
5
27物理成績不優(yōu)秀
1
1213合計
6
1420(2)提出假設H0:學生數(shù)學成績與物理成績之間沒有關(guān)系.根據(jù)列聯(lián)表可以求得K
2=≈8.802>7.879.當H0成立時,P(K2>7.879)=0.005.所以我們有99.5%的把握認為學生的數(shù)學成績與物理成績之間有關(guān)系.(3)由(1)可知數(shù)學成績與物理成績都優(yōu)秀的學生的人數(shù)為5人,則數(shù)學成績與物理成績至少有一門不優(yōu)秀的學生人數(shù)為15人.故從20名學生中抽出1名,抽到的學生數(shù)學成績與物理成績至少有一門不優(yōu)秀的概率為=.點評:獨立性檢驗的一般步驟:(1)列出2×2列聯(lián)表,假設兩個變量無關(guān)系;(2)根據(jù)公式K2=計算K2的值;(3)比較K2與臨界值的大小關(guān)系作出統(tǒng)計推斷.變式探究(2012·羅定中學模擬)某研究小組為了研究中學生的身體發(fā)育情況,在某學校隨機抽出20名15至16周歲的男生,將他們的身高和體重制成2×2的列聯(lián)表,根據(jù)列聯(lián)表的數(shù)據(jù),可以有____________%的把握認為該學校15至16周歲的男生的身高和體重之間有關(guān)系.超重不超重合計偏高415不偏高31215合計71320附:獨立性檢驗臨界值表:
獨立性檢驗隨機變量K2值的計算公式:P(K2≥k0)0.0250.0100.0050.001k05.0246.6357.87910.828解析:K2=≈5.934>5.024,由K2的臨界值表可知,有97.5%的把握認為該學校15至16周歲的男生的身高和體重之間有關(guān)系.答案:97.5課時升華1.對兩個變量的線性關(guān)系情況的判斷有兩個方法:一是根據(jù)散點圖,這種方法是從圖形上粗略地觀察,比較直觀、簡單易行,但往往對相關(guān)程度刻畫得不夠準確;二是計算相關(guān)系數(shù)法,這種方法能比較準確地反映相關(guān)程度,相關(guān)系數(shù)的絕對值越接近1,相關(guān)性就越強,相關(guān)系數(shù)就是描述相關(guān)性強弱的,相關(guān)性有正相關(guān)和負相關(guān),強相關(guān)和弱相關(guān).2.建立回歸模型的步驟:(1)確定研究對象,明確解釋變量和預報變量;(2)畫出散點圖,觀察它們之間的關(guān)系(如是否具有線性相關(guān)關(guān)系);(3)由經(jīng)驗確定回歸方程的類型,主要是線性回歸模型;(4)用最小二乘法求線性回歸方程;(5)最后是相關(guān)性檢驗,若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適.3.利用獨立性檢驗可以考查兩個分類變量是否有關(guān)系,并能較為準確地給出這種判斷的可信度.具體做法是根據(jù)公式,計算隨機變量的觀測值k,k值越大,說明“兩個變量有關(guān)系”的可能性越大.感悟高考品味高考1.(2012·湖南卷)設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系,根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為=0.85x-85.71,則下列結(jié)論中不正確的是(
)A.y與x具有正的線性相關(guān)關(guān)系B.回歸直線過樣本點的中心(,)C.若該大學某女生身高增加1cm,則其體重約增加0.85kgD.若該大學某女生身高為170cm,則可斷定其體重必為58.79kg解析:根據(jù)回歸方程的概念和性質(zhì)知選項A,B,C三項均正確,選項D錯誤,線性回歸方程只能預測學生的體重.選項D應改為“若該大學某女生身高為170cm,則估計其體重大約為58.79kg”.答案:D2.某電視臺在一次對收看文藝節(jié)目和新聞節(jié)目觀眾的抽樣調(diào)查中,隨機抽取了100名電視觀眾,相關(guān)的數(shù)據(jù)如下表所示:(1)由表中數(shù)據(jù)直觀分析,收看新聞節(jié)目的觀眾是否與年齡有關(guān)?(2)用分層抽樣方法在收看新聞節(jié)目的觀眾中隨機抽取5名大于40歲的觀眾應該抽取幾名?(3)在上述抽取的5名觀眾中任取2名,求恰有1名觀眾年齡為20至40歲的概率.文藝節(jié)目新聞節(jié)目總計20至40歲401858大于40歲152742總計5545100解析:(1)有關(guān).收看新聞節(jié)目多為年齡大的.(2)應抽取的人數(shù)為:5×=3(人).(3)由(2)知,抽取的5名觀眾中,有2名觀眾年齡處于20至40歲,3名觀眾的年齡大于40歲.記大于40歲的人為a1,a2,a3,20至40歲的人為b1,b2,則從5人中抽取2人的基本事件有(a1,a2),(a1,a3),(a2,a3),(b1,b2),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),共10個,其中恰有1人為20至40歲的基本事件有(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),共6個,因此所求的概率P==.=高考預測1.(2012·江門市一模)有人收集了春節(jié)期間平均氣溫x與某取暖商品銷售額y的有關(guān)數(shù)據(jù)如下表:
根據(jù)以上數(shù)據(jù),用線性回歸的方法,求得銷售額y與平均氣溫x之間線性回歸方程y=x+的系數(shù)=-2.4,則預測平均氣溫
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年消防隊個人工作計劃
- 2025年急診科護理工作計劃范文急診科工作計劃
- 2025教師讀書學習計劃
- 2025年年度計劃表內(nèi)容年度計劃表小學生
- 2025年國培計劃大數(shù)據(jù)培訓心得
- 2025年學校辦公室工作計劃范本2
- 2025幼兒園教師繼續(xù)教育工作計劃模板
- 2025年幼兒園小班下學期班務計劃
- 2025年工會工作計劃規(guī)劃方案
- Unit 5 Our new home (說課稿)-2024-2025學年譯林版(三起)英語四年級上冊
- 安徽省蕪湖市2023-2024學年高一上學期期末考試 生物 含解析
- 通用電子嘉賓禮薄
- 浙江寧波廣播電視集團發(fā)射中心招考聘用筆試參考題庫答案解析
- 急性心衰搶救流程
- GB/T 3280-2015不銹鋼冷軋鋼板和鋼帶
- 新湘教版地理必修第一冊知識點總結(jié)
- 四年級上冊科學全冊知識點(2022年新教科版)
- 施工機械施工方案
- 哈爾濱市城市規(guī)劃管理技術(shù)規(guī)定
- 加拿大——文化ppt
- 100以內(nèi)不進位不退位加減法200道
評論
0/150
提交評論