8.1.2樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第1頁
8.1.2樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第2頁
8.1.2樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第3頁
8.1.2樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第4頁
8.1.2樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

8.1成對數(shù)據(jù)的統(tǒng)計相關(guān)性8.1.2樣本的相關(guān)系數(shù)復(fù)習(xí)回顧1、變量的相關(guān)關(guān)系2、散點(diǎn)圖

兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.

成對樣本數(shù)據(jù)都可用直角坐標(biāo)系中的點(diǎn)表示出來,由這些點(diǎn)組成了統(tǒng)計圖.我們把這樣的統(tǒng)計圖叫做散點(diǎn)圖.復(fù)習(xí)回顧3、變量相關(guān)關(guān)系的分類正相關(guān)和負(fù)相關(guān)線性相關(guān)和非線性相關(guān)4、兩個變量之間相關(guān)關(guān)系的確定(1)經(jīng)驗作出推斷(2)通過樣本數(shù)據(jù)分析,從數(shù)據(jù)中提取信息,并構(gòu)建適當(dāng)?shù)哪P停倮媚P瓦M(jìn)行估計或推斷探究新知通過觀察散點(diǎn)圖中成對樣本數(shù)據(jù)的分布規(guī)律,我們可以大致推斷兩個變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān)、是線性相關(guān)還是非線性相關(guān)等.但無法確切地反映成對樣本數(shù)據(jù)的相關(guān)程度,也就無法量化兩個變量之間相關(guān)程度的大小.問題:能否引入一個適當(dāng)?shù)摹皵?shù)字特征”,對成對樣本數(shù)據(jù)的相關(guān)程度進(jìn)行定量分析呢?

對于變量x和變量y,設(shè)經(jīng)過隨機(jī)抽樣獲得的成對樣本數(shù)據(jù)為(x1,y1),(x2,y2),…,(xn,yn),其中將數(shù)據(jù)以

為零點(diǎn)進(jìn)行平移,得到平移后的成對數(shù)據(jù)為…,

并繪制散點(diǎn)圖.探究新知問題:能否引入一個適當(dāng)?shù)摹皵?shù)字特征”,對成對樣本數(shù)據(jù)的相關(guān)程度進(jìn)行定量分析呢?將數(shù)據(jù)以

為零點(diǎn)進(jìn)行平移,得到平移后的成對數(shù)據(jù)為…,

并繪制散點(diǎn)圖.探究新知線性負(fù)相關(guān)線性正相關(guān)無相關(guān)關(guān)系非線性相關(guān)線性負(fù)相關(guān)線性正相關(guān)無相關(guān)關(guān)系非線性相關(guān)數(shù)據(jù)預(yù)處理的常用方法:中心化(零均值化)中心化探究新知如果變量x和變量y負(fù)相關(guān),那么關(guān)于均值平移后的大多數(shù)點(diǎn)將分布在第二、四象限,對應(yīng)的成對數(shù)據(jù)異號居多.一般地,如果變量x和變量y正相關(guān),那么均值平移后的大多數(shù)點(diǎn)將分布在第一、三象限,對應(yīng)的成對數(shù)據(jù)同號居多;························探究新知思考1:

根據(jù)上述分析,你能利用正相關(guān)變量和負(fù)相關(guān)變量的成對樣本數(shù)據(jù)平移后呈現(xiàn)的規(guī)律,構(gòu)造一個度量成對樣本數(shù)據(jù)是正相關(guān)還是負(fù)相關(guān)的數(shù)字特征嗎?根據(jù)散點(diǎn)圖特征,初步構(gòu)造統(tǒng)計量.利用散點(diǎn)

的橫、縱坐標(biāo)是否同號,可以構(gòu)造一個量

一般情形下,Lxy>0表明成對樣本數(shù)據(jù)正相關(guān);Lxy<0表明成對樣本數(shù)據(jù)負(fù)相關(guān).探究新知思考2:

你認(rèn)為Lxy的大小一定能度量出成對樣本數(shù)據(jù)的相關(guān)程度嗎?

在研究體重與身高之間的相關(guān)程度時,如果體重的單位不變,把身高單位由米改為厘米,單位的改變不會改變體重與身高之間的相關(guān)程度.=100Lxy>0我們發(fā)現(xiàn),Lxy的大小與數(shù)據(jù)的度量單位有關(guān),所以不能直接用它度量成對樣本數(shù)據(jù)相關(guān)程度的大小.探究新知為了消除度量單位的影響,需要對數(shù)據(jù)作進(jìn)一步的“標(biāo)準(zhǔn)化”處理.我們用分別除為簡單起見,把上述“標(biāo)準(zhǔn)化”處理后的成對數(shù)據(jù)分別記為(x′1,y′1),(x′2,y′2),…,(x′n,y′n),仿照Lxy的構(gòu)造,可以得到探究新知為簡單起見,把上述“標(biāo)準(zhǔn)化”處理后的成對數(shù)據(jù)分別記為(x′1,y′1),(x′2,y′2),…,(x′n,y′n),仿照Lxy的構(gòu)造,可以得到概念講解樣本相關(guān)系數(shù)當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時,稱成對樣本數(shù)據(jù)負(fù)相關(guān).我們稱r為變量x和變量y的樣本相關(guān)系數(shù).

樣本相關(guān)系數(shù)r是一個描述成對樣本數(shù)據(jù)的數(shù)字特征,它的正負(fù)和絕對值的大小可以反映成對樣本數(shù)據(jù)的變化特征:探究新知思考3:樣本相關(guān)系數(shù)r的大小與成對樣本數(shù)據(jù)的相關(guān)程度有什么內(nèi)在聯(lián)系呢?相關(guān)系數(shù)r的取值范圍是多少呢?

觀察r的結(jié)構(gòu),聯(lián)想到二維(平面)向量、三維(空間)向量數(shù)量積的坐標(biāo)表示,我們將向量的維數(shù)推廣到n維,n維向量

的數(shù)量積仍然定義為

,其中θ為向量

的夾角.

類似于平面或空間向量的坐標(biāo)表示,對于向量

=(a1,a2,…,an)和

=(b1,b2,…,bn),我們有=a1b1+a2b2+…+anbn.“標(biāo)準(zhǔn)化”處理后的成對數(shù)據(jù):(x′1,y′1),(x′2,y′2),…,(x′n,y′n)探究新知設(shè)其第一分量構(gòu)成n維向量設(shè)其第二分量構(gòu)成n維向量

同理可得探究新知思考3:樣本相關(guān)系數(shù)r的大小與成對樣本數(shù)據(jù)的相關(guān)程度有什么內(nèi)在聯(lián)系呢?相關(guān)系數(shù)r的取值范圍是多少呢?樣本相關(guān)系數(shù)r的取值范圍為[-1,1]=cosθ∵-1≤cosθ≤1∵∴-1≤r≤1由向量的知識可知,存在實數(shù)λ,使得

,探究新知思考4:

相關(guān)系數(shù)|r|=1時,成對樣本數(shù)據(jù)之間具有怎樣的關(guān)系呢?r=cosθ這時,成對樣本數(shù)據(jù)的兩個分量之間滿足一種線性關(guān)系.這表明成對樣本數(shù)據(jù)(xi,yi)都落在直線

上.當(dāng)|r|=1時,r=cosθ中的θ=0或π,向量

共線.概念講解相關(guān)系數(shù)的性質(zhì):

由此可見,樣本相關(guān)系數(shù)r的取值范圍為[-1,1],樣本相關(guān)系數(shù)r的絕對值大小可以反映成對樣本數(shù)據(jù)之間線性相關(guān)的程度:①當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時,稱成對樣本數(shù)據(jù)負(fù)相關(guān).②

|r|≤1;③當(dāng)|r|越接近1時,成對數(shù)據(jù)的線性相關(guān)程度越強(qiáng);

當(dāng)|r|越接近0時,成對數(shù)據(jù)的線性相關(guān)程度越弱;特別地,當(dāng)|r|=0時,成對數(shù)據(jù)的沒有線性相關(guān)關(guān)系(但不排除它們間有其他相關(guān)關(guān)系);

當(dāng)|r|=1時,成對數(shù)據(jù)都落在一條直線上.探究新知圖(1)中成對樣本數(shù)據(jù)的正線性相關(guān)程度很強(qiáng).圖(2)中成對樣本數(shù)據(jù)的負(fù)線性相關(guān)程度比較強(qiáng).圖(3)中成對樣本數(shù)據(jù)的線性相關(guān)程度很弱.圖(4)中成對樣本數(shù)據(jù)的線性相關(guān)程度極弱.問題:觀察以下散點(diǎn)圖,判斷成對數(shù)據(jù)間的相關(guān)關(guān)系判斷線性相關(guān)程度:散點(diǎn)圖+r

兩個隨機(jī)變量的相關(guān)性可以通過散點(diǎn)圖對成對樣本數(shù)據(jù)進(jìn)行分析,而樣本相關(guān)系數(shù)r可以反映兩個隨機(jī)變量之間的線性相關(guān)程度:①r的符號反映相關(guān)關(guān)系的正負(fù)性;②|r|的大小反映兩個變量線性相關(guān)的程度,即散點(diǎn)集中于一條直線的程度.1、為了比較甲、乙、丙三組數(shù)據(jù)的線性相關(guān)性的強(qiáng)弱,小鄭分別計算了甲、乙、丙三組數(shù)據(jù)的樣本線性相關(guān)系數(shù),其數(shù)值分別為0.939,0.937,0.948,則().隨堂練習(xí)A、甲組數(shù)據(jù)的線性相關(guān)性最強(qiáng),乙組數(shù)據(jù)的線性相關(guān)性最弱B、乙組數(shù)據(jù)的線性相關(guān)性最強(qiáng),丙組數(shù)據(jù)的線性相關(guān)性最弱C、丙組數(shù)據(jù)的線性相關(guān)性最強(qiáng),甲組數(shù)據(jù)的線性相關(guān)性最弱D、丙組數(shù)據(jù)的線性相關(guān)性最強(qiáng),乙組數(shù)據(jù)的線性相關(guān)性最弱解:因為樣本線性相關(guān)系數(shù)的絕對值越大,則線性相關(guān)性越強(qiáng),所以丙組數(shù)據(jù)的線性相關(guān)性最強(qiáng),乙組數(shù)據(jù)的線性相關(guān)性最弱.D1、根據(jù)下表中脂肪含量和年齡的樣本數(shù)據(jù),推斷兩個變量是否線性相關(guān),計算樣本相關(guān)系數(shù),并推斷它們的相關(guān)程度.例題解析年齡2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6參考數(shù)據(jù):解:先畫出散點(diǎn)圖,如圖所示.觀察散點(diǎn)圖,可以看出樣本點(diǎn)都集中在一條直線附近,由此推斷脂肪含量和年齡線性相關(guān).例題解析參考數(shù)據(jù):根據(jù)樣本相關(guān)系數(shù)的定義,由樣本相關(guān)系數(shù)r≈0.97,可以推斷脂肪含量和年齡這兩個變量正線性相關(guān),且相關(guān)程度很強(qiáng)。脂肪含量與年齡變化趨勢相同.小結(jié)

散點(diǎn)圖可以從直觀上判斷成對樣本數(shù)據(jù)的相關(guān)性,通過樣本相關(guān)系數(shù)則可以從定量的角度刻畫成對樣本數(shù)據(jù)相關(guān)的正負(fù)性和線性相關(guān)程度.2、有人收集了某城市居民收入(所有居民在一年內(nèi)收入的總和)與A商品銷售額的10年數(shù)據(jù),如下表所示.例題解析第n年12345678910居民年收入/億元32.231.132.935.837.138.039.043.044.646.0A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0畫出散點(diǎn)圖,判斷成對樣本數(shù)據(jù)是否線性相關(guān),并通過樣本相關(guān)系數(shù)推斷居民年收入與A商品銷售額的相關(guān)程度和變化趨勢的異同.解:從散點(diǎn)圖看,A商品銷售額與居民年收入的樣本數(shù)據(jù)呈現(xiàn)線性相關(guān)關(guān)系.居民年收入/億元504540352030253035404550·······55A商品銷售額/萬元···2、有人收集了某城市居民收入(所有居民在一年內(nèi)收入的總和)與A商品銷售額的10年數(shù)據(jù),如下表所示.例題解析第n年12345678910居民年收入/億元32.231.132.935.837.138.039.043.044.646.0A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0畫出散點(diǎn)圖,判斷成對樣本數(shù)據(jù)是否線性相關(guān),并通過樣本相關(guān)系數(shù)推斷居民年收入與A商品銷售額的相關(guān)程度和變化趨勢的異同.解:r≈0.95由此可以推斷,A商品銷售額與居民年收入正線性相關(guān),即A商品銷售額與居民年收入有相同的變化趨勢,且相關(guān)程度很強(qiáng).3、在某校高一年級中隨機(jī)抽取25名男生,測得他們的身高、體重、臂展等數(shù)據(jù),如下表所示.例題解析體重與身高、臂展與身高分別具有怎樣的相關(guān)性?解:根據(jù)樣本數(shù)據(jù)畫出體重與身高、臂展與身高的散點(diǎn)圖,分別如圖(1)和(2)所示,兩個散點(diǎn)圖都呈現(xiàn)出線性相關(guān)的特征.3、在某校高一年級中隨機(jī)抽取25名男生,測得他們的身高、體重、臂展等數(shù)據(jù),如下表所示.例題解析體重與身高、臂展與身高分別具有怎樣的相關(guān)性?解:根據(jù)樣本數(shù)據(jù)畫出體重與身高、臂展與身高的散點(diǎn)圖,分別如圖(1)和(2)所示,兩個散點(diǎn)圖都呈現(xiàn)出線性相關(guān)的特征.通過計算得到體重與身高、臂展與身高的樣本相關(guān)系數(shù)分別約為0.34和0.78,都為正相關(guān).其中,臂展與身高的相關(guān)程度更高.2、對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得以下散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)比較,正確的是()隨堂練習(xí)AA、r2<r4<0<r3<r1B、r4<r2<0<r1<r3C、r4<r2<0<r3<r1D、r2<r4<0<r1<r33、根據(jù)統(tǒng)計,某蔬菜基地西紅柿畝產(chǎn)量的增加量y(百千克)與某種液體肥料每畝使用量x(千克)之間的對應(yīng)數(shù)據(jù)的散點(diǎn)圖,如圖所示.隨堂練習(xí)02468345x(千克)y(百千克)5·····依據(jù)數(shù)據(jù)的散點(diǎn)圖可以看出,y與x之間有較強(qiáng)的線性相關(guān)關(guān)系.請計算樣本相關(guān)系數(shù)r并加以說明(若|r|>0.75,則

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論