新高考一輪復(fù)習(xí)人教A版 第八章 第三講 成對數(shù)據(jù)的統(tǒng)計分析 課件(74張)_第1頁
新高考一輪復(fù)習(xí)人教A版 第八章 第三講 成對數(shù)據(jù)的統(tǒng)計分析 課件(74張)_第2頁
新高考一輪復(fù)習(xí)人教A版 第八章 第三講 成對數(shù)據(jù)的統(tǒng)計分析 課件(74張)_第3頁
新高考一輪復(fù)習(xí)人教A版 第八章 第三講 成對數(shù)據(jù)的統(tǒng)計分析 課件(74張)_第4頁
新高考一輪復(fù)習(xí)人教A版 第八章 第三講 成對數(shù)據(jù)的統(tǒng)計分析 課件(74張)_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三講成對數(shù)據(jù)的統(tǒng)計分析課標要求考情分析1.了解樣本相關(guān)系數(shù)的統(tǒng)計含義,了解樣本相關(guān)系數(shù)與標準化數(shù)據(jù)向量夾角的關(guān)系.會通過相關(guān)系數(shù)比較多組成對數(shù)據(jù)的相關(guān)性.2.了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法.3.理解 22 列聯(lián)表的統(tǒng)計意義,了解 22 列聯(lián)表獨立性檢驗及其應(yīng)用回歸分析,獨立性檢驗是高考考查的重點,以解答題為主,常與概率結(jié)合考查.難度中高檔1.回歸分析(1)相關(guān)關(guān)系:當自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.(2)散點圖:表示具有相

2、關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖,它可直觀地判斷兩變量的關(guān)系是否可以用線性關(guān)系表示.若這些散點有 y 隨 x 增大而增大的趨勢,則稱兩個變量正相關(guān);若這些散點有 y 隨 x 增大而減小的趨勢,則稱兩個變量負相關(guān).它主要用于相關(guān)量的顯著性檢驗,以衡量它們之間的線性相關(guān)程度.當 r0 時表示兩個變量正相關(guān),當 r0 時表示兩個變量負相關(guān).|r|越接近 1,表明兩個變量的線性相關(guān)性越強;當|r|接近 0 時,表明兩個變量間幾乎不存在相關(guān)關(guān)系,相關(guān)性越弱.變量y1y2總計x1ababx2cdcd總計acbdabcd2.獨立性檢驗(1)22 列聯(lián)表設(shè) X,Y 為兩個分類變量,它們的取值分別為x

3、1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(22 列聯(lián)表)如下:(2)獨立性檢驗abcd 為樣本容量)來判斷“兩個變量有關(guān)系”的方法稱為獨立性檢驗.(3)獨立性檢驗的一般步驟根據(jù)樣本數(shù)據(jù)列出22列聯(lián)表;計算隨機變量2的值,查表確定臨界值x;如果2x,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過P(2x);否則,就認為在犯錯誤的概率不超過P(2x)的前提下不能推斷“X與Y有關(guān)系”.【名師點睛】(1)回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性分布時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.根據(jù)回歸方程進行預(yù)報,僅是一個預(yù)報值,而不是真實

4、發(fā)生的值.(2)獨立性檢驗是對兩個變量的關(guān)系的可信程度的判斷,而不是對其是否有關(guān)系的判斷.根據(jù)2 的值可以判斷兩個分類變量有關(guān)的可信程度,并用來指導(dǎo)科研和實際生活.題組一走出誤區(qū)1.判斷下列結(jié)論正誤(在括號內(nèi)打“”或“”)(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)系.()(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關(guān)性檢驗.()(4)事件 X,Y 關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的2 的觀測值越大.()答案:(1)(2)(3)(4)題組二走進教材2.(教材改編題)為調(diào)查中學(xué)生近視情況,測得某校 150名男生中有 80 名近視,140 名女生中

5、有 70 名近視.在檢驗這些學(xué)生眼睛近視是否與性別有關(guān)時,用下列哪種方法最有說服力()B.均值與方差D.概率A.回歸分析C.獨立性檢驗答案:C3.(教材改編題)兩個變量 y 與 x 的回歸模型中,分別選擇了 4 個不同模型,它們的相關(guān)指數(shù) R2 如下,其中擬合效果最好的模型是()A.模型 1 的相關(guān)指數(shù) R2 為 0.98B.模型 2 的相關(guān)指數(shù) R2 為 0.80C.模型 3 的相關(guān)指數(shù) R2 為 0.50D.模型 4 的相關(guān)指數(shù) R2 為 0.25答案:A題組三真題展現(xiàn)4.(2020 年全國)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率 y 和溫度 x(單位:)的關(guān)系,在 20 個不同的溫

6、度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)(xi,yi)(i1,2,20)得到散點圖(如圖 8-3-1):圖 8-3-1由此散點圖,在 10 至 40 之間,下面四個回歸方程類型中最適宜作為發(fā)芽率 y 和溫度 x 的回歸方程類型的是()B.yabx2D.yabln xA.yabxC.yabex答案:D相關(guān)關(guān)系的判斷考點一1.觀察下列各圖形,其中兩個變量 x,y 具有相關(guān)關(guān)系的圖是()A.B.C.D.解析:由散點圖知中的點都分布在一條直線附近.中的點都分布在一條曲線附近,所以中的兩個變量具有相關(guān)關(guān)系.故選 C.答案:C2.(多選題)關(guān)于回歸分析,下列說法正確的是()A.在回歸分析中,變量間的關(guān)系若是非

7、確定性關(guān)系,那么因變量不能由自變量唯一確定B.線性相關(guān)系數(shù)可以是正的也可以是負的C.在回歸分析中,如果 r21 或 r1,說明 x 與 y 之間完全線性相關(guān)D.樣本相關(guān)系數(shù) r(1,1)解析:選項 D 中,樣本相關(guān)系數(shù)應(yīng)滿足1r1,故 D 錯誤,ABC 都正確.故選 ABC.答案:ABC3.x 和 y 的散點圖如圖 8-3-2 所示,則下列說法中正確命題的序號有_.圖 8-3-2解析:在散點圖中,點散布在從左上角到右下角的區(qū)域,因此 x,y 是負相關(guān)關(guān)系,故正確;由散點圖知用 y正確;x,y 之間可以建立線性回歸方程,但擬合效果不好,故錯誤.答案:售價 x99.51010.511銷售量 y11

8、10865考點二線性回歸分析例 1(1)(多選題)某市物價部門對 5 家商場的某商品一天的銷售量及其價格進行調(diào)查,5 家商場的售價 x(元)和銷售量 y(件)之間的一組數(shù)據(jù)如表所示:答案:ABC編號x12345年份20152016201720182019單價y/(元kg1)1820232529(2)某農(nóng)科所實地考察,研究發(fā)現(xiàn)某貧困村適合種植兩種藥材,可以通過種植這兩種藥材脫貧,通過大量考察研究得知藥材 A 的畝產(chǎn)量約為 300 kg,其收購價格處于上漲趨勢,最近五年的價格如下表:藥材 B 的收購價格始終為 20 元/kg,其畝產(chǎn)量的頻率分布直方圖如圖 8-3-3,圖 8-3-3(1)若藥材 A

9、 的單價 y(單位:元/kg)與年份編號 x 具有線性相關(guān)關(guān)系,請求出 y 關(guān)于 x 的回歸直線方程,并估計2023 年藥材 A 的單價;(2)用上述頻率分布直方圖估計藥材 B 的平均畝產(chǎn)量,若不考慮其他因素,試判斷 2023 年該村應(yīng)種植藥材 A 還是藥材 B?并說明理由.(2)由(1)知,2023 年種植藥材 A 的收入為 39.230011 760(元),由頻率分布直方圖可知,(3600.0053800.014000.017 54200.012 54400.005)20401,藥材 B 的平均畝產(chǎn)量為 401 kg,藥材 B 的收購價格始終為 20 元/kg,2023 年種植藥材 B 的

10、收入為 204018 02011 760,故 2023 年該村應(yīng)種植藥材 A.【題后反思】回歸分析問題的類型及解題方法(1)求經(jīng)驗回歸方程根據(jù)散點圖判斷兩變量是否線性相關(guān),如不是,應(yīng)通過換元構(gòu)造線性相關(guān).利用公式,求出回歸系數(shù) .利用經(jīng)驗回歸直線過樣本點的中心求系數(shù)a.(2)利用經(jīng)驗回歸方程進行預(yù)測時,可把經(jīng)驗回歸方程看作一次函數(shù)求函數(shù)值.(3)利用經(jīng)驗回歸方程判斷正、負相關(guān)時,決定是正相關(guān)還是負相關(guān)的是系數(shù) .(4)判斷經(jīng)驗回歸方程的擬合效果,可以利用樣本相關(guān)系數(shù)判斷,|r|越趨近于 1,兩變量的線性相關(guān)性越強.廣告支出 x24568銷售額 y3040605070【變式訓(xùn)練】某公司為確定下一

11、年度投入某種產(chǎn)品的宣傳費,需了解這種產(chǎn)品的年廣告費支出 x(單位:萬元)對年銷售額 y(單位:萬元)的影響,對近 5 年的年廣告費支出 x 和年銷售額y 進行統(tǒng)計,得到如下數(shù)據(jù):(1)請根據(jù)表中數(shù)據(jù),建立 y 與 x 的經(jīng)驗回歸方程;(2)當年廣告費支出為 10 萬元時,估計年銷售額 y 的預(yù)報值是多少萬元?附:回歸方程中斜率和截距的最小乘估計公式分別(2)當 x10 時, 6.51017.582.5(萬元),所以當年廣告費支出為 10 萬元時,估計年銷售額 y的預(yù)報值是 82.5 萬元.考點三獨立性檢驗例 2電視傳媒公司為了解某地區(qū)觀眾對“中國詩詞大會”的收視情況,隨機抽取了 100 名觀眾

12、進行調(diào)查,其中女性有 55 名.將日均收看該節(jié)目時間不低于 40 分鐘的觀眾稱為“詩詞迷”,已知“詩詞迷”中有 15 名男性,“非詩詞迷”共有 75 名.性別非詩詞迷詩詞迷合計男女合計(1)根據(jù)已知條件完成下面的 22 列聯(lián)表,并據(jù)此資料判斷是否有 95%的把握認為是否為“詩詞迷”與性別有關(guān)?P(2x)0.150.100.050.0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828(2)采用分層隨機抽樣的方式從“詩詞迷”中任意選取 5 人進行問卷調(diào)查,若再從這 5 人中任意選取 2 人獎勵詩詞大禮包,求選取的 2 人為一位男性一位女性的

13、概率.性別非詩詞迷詩詞迷合計男301545女451055合計7525100解:(1)在抽取的 100 個人中,“非詩詞迷”共有 75名,則“詩詞迷”有 25 人,女性有 55 名,所以 22 列聯(lián)表如下:所以沒有 95%的把握認為是否為“詩詞迷”與性別有關(guān).【變式訓(xùn)練】新型冠狀病毒的傳染主要是人與人之間進行傳播,感染人群年齡大多數(shù)是 50 歲以上人群.該病毒進入人體后有潛伏期,潛伏期是指病原體侵入人體至最早出現(xiàn)臨床癥狀的這段時間,潛伏期越長,感染到他人的可能性越高,現(xiàn)對 400 個病例的潛伏期(單位:天)進行調(diào)查,如果認為超過 8 天的潛伏期屬于“長潛伏期”,按照年齡統(tǒng)計樣本,50 歲以上人數(shù)

14、占 70%,長期潛伏人數(shù)占 25%,其中 50 歲以上長期潛伏者有 60 人.潛伏者類型50 歲以下(含 50 歲)50 歲以上總計長期潛伏者非長期潛伏者總計(1)請根據(jù)以上數(shù)據(jù)完成 22 列聯(lián)表;單位:人P(2x)0.10.050.010 x2.7063.8416.635(2)判斷是否有 95% 的把握認為是否是“長期潛伏”者與年齡有關(guān).潛伏者類型50 歲以下(含 50 歲)50 歲以上總計長期潛伏者4060100非長期潛伏者80220300總計120280400解:(1)根據(jù)題目所給數(shù)據(jù)得到如下 22 列聯(lián)表,單位:人3.841,所以有 95%以上的把握認為是否是“長期潛伏者”與年齡有關(guān).

15、非線性回歸的應(yīng)用問題例 3為了研究一種昆蟲的產(chǎn)卵數(shù) y(單位:個)和溫度x(單位:)是否有關(guān),現(xiàn)收集了 7 組觀測數(shù)據(jù)列于下表中,并作出了如圖 8-3-4 所示的散點圖,發(fā)現(xiàn)樣本點沒有分布在某個帶狀區(qū)域內(nèi),兩個變量不呈線性相關(guān)關(guān)系,現(xiàn)分別和溫度 x 的回歸方程來建立兩個變量之間的關(guān)系.溫度 x/20222426283032產(chǎn)卵數(shù) y/個610212464113322tx24004845766767849001 024zln y1.792.303.043.184.164.735.77圖 8-3-4(1) 分別在圖 8-3-5(1)(2)中畫出 y 關(guān)于 t 的散點圖和 z關(guān)于 x 的散點圖,根據(jù)

16、散點圖判斷哪一個模型更適合作為昆蟲的產(chǎn)卵數(shù) y 關(guān)于溫度 x 的回歸方程.(給出判斷即可,不必說明理由)(1)(2)圖 8-3-5解:(1)畫出 y 關(guān)于 t 的散點圖,如圖 8-3-6 所示.圖 8-3-6畫出 z 關(guān)于 x 的散點圖,如圖 8-3-7 所示.圖 8-3-7根據(jù)散點圖可以判斷模型更適合作為昆蟲的產(chǎn)卵數(shù)y 關(guān)于溫度 x 的回歸方程類型.【反思感悟】非線性回歸方程的求法(1)根據(jù)原始數(shù)據(jù)作出散點圖;(2)根據(jù)散點圖,選擇恰當?shù)臄M合函數(shù);(3)作恰當變換,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程;(4)在(3)的基礎(chǔ)上通過相應(yīng)變換,即可得非線性回歸方程.【高分訓(xùn)練】1.(2021 年昌江

17、期中)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費 x(單位:千元)對年銷售量y(單位:t)和年利潤 z(單位:千元)的影響,對近 8 年的宣傳費xi和年銷售量yi(i1,2,8)數(shù)據(jù)作了初步處理,得到散點圖(如圖 8-3-8)及一些統(tǒng)計量的值.圖 8-3-8(1)根據(jù)散點圖判斷 yabx 與 ycd ,哪一個適合作為年銷售量 y 關(guān)于年宣傳費 x 的回歸方程類型;(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立 y 關(guān)于 x 的回歸方程;(3)已知這種產(chǎn)品的年利潤 z 與 x,y 的關(guān)系為 z0.2yx,根據(jù)(2)的結(jié)果回答下列問題:當年宣傳費 x49 時,年銷售量及年利潤的預(yù)報值是多少?當年宣傳費 x 為何值時,年利潤的預(yù)報值最大?使用年數(shù) x234567售價 y201286.44.43zln y3.002.482.081.861.481.102.(20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論