版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第八章成對數(shù)據(jù)的統(tǒng)計分析8.1成對數(shù)據(jù)的統(tǒng)計相關性8.1.1變量的相關關系8.1.2樣本相關系數(shù)復習引入(1)正方體的體積與棱長函數(shù)關系:(2)汽車勻速行駛時的路程與時間函數(shù)關系:復習引入
(3)俗話說“莊稼一枝花,全靠肥當家”,這說明施肥的多少對糧食的產量影響很大,施肥量和糧食的產量是確定的函數(shù)關系嗎?
那么糧食的產量還受其他因素的影響嗎?兩個變量間的關系除了可能是函數(shù)關系外,還可能是其他關系嗎?為了搞清這些問題,我們需要學習本節(jié)內容。復習引入
我們知道,一個人的體重與他的身高有關系.一般而言,個子高的人往往體重值較大,個子矮的人往往體重值較小.但身高并不是決定體重的唯一因素,例如生活中的飲食習慣、體育鍛煉、睡眠時間以及遺傳因素等也是影響體重的重要因素.像這樣,兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.問題1:上述情境中施肥量與糧食產量之間到底具有怎樣的關系?提示:上述兩變量間確實存在關系,但又不具備確定性,即當一個變量取值一定時,另一個變量取值帶有隨機性.概念形成1、變量的相關關系:
兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.注:①相關關系是一種不確定性關系;②相關關系是相對于函數(shù)關系而言的.
新知探索
兩個變量具有相關關系的事例在現(xiàn)實中大量存在.例如:
新知探索
新知探索
②
數(shù)據(jù)判斷:兩個變量之間的相關關系的確定:樣本數(shù)據(jù)分析
建立模型
估計或推斷.①
經(jīng)驗判斷;新知探索問題2:在對人體的脂肪含量和年齡之間關系的研究中,科研人員獲得了一些年齡和脂肪含量的簡單隨機樣本數(shù)據(jù),如表所示.表中每個編號下的年齡和脂肪含量數(shù)據(jù)都是對同一個體的觀測結果,它們構成了成對數(shù)據(jù).
根據(jù)以上數(shù)據(jù),你能推斷人體的脂肪含量與年齡之間存在怎樣的關系嗎?新知探索
為了更加直觀地描述上述成對數(shù)據(jù)中脂肪含量與年齡之間的關系,類似于用直方圖描述單個變量樣本數(shù)據(jù)的分布特征,我們用圖形展示成對樣本數(shù)據(jù)的變化特征.用橫軸表示年齡,縱軸表示脂肪含量,則表中每個編號下的成對樣本數(shù)據(jù)都可用直角坐標系中的點表示出來,由這些點組成了如圖所示的統(tǒng)計圖.我們把這樣的統(tǒng)計圖叫做散點圖.概念形成2.散點圖把成對樣本數(shù)據(jù)用直角坐標系中的點表示出來,由這些點組成的統(tǒng)計圖叫做散點圖.觀察圖,可以發(fā)現(xiàn),這些散點大致落在一條從左下角到右上角的直線附近,表明隨年齡值得增加,相應的脂肪含量值呈現(xiàn)增加的趨勢.這樣,由成對樣本數(shù)據(jù)的分布規(guī)律,我們可以推斷脂肪含量和年齡變量之間存在著相關關系.新知探索
如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)增加的趨勢,我們就稱之兩個變量正相關;如果當一個變量的值增加時,另一個變量的相應值呈現(xiàn)減小的趨勢,則稱這兩個變量負相關.
由上圖,能夠推斷脂肪含量與年齡這兩個變量正相關.3.變量相關關系的分類(1)正相關和負相關
正相關:指的是兩個變量有相同的變化趨勢,即從整體上來看一個變量會隨著另一個變量變大而變大,點的位置散布在從左下角到右上角的區(qū)域。負相關:指的是兩個變量有相反的變化趨勢,即從整體上來看一個變量會隨著另一個變量變大而變小,點的位置散布在從左上角到右下角的區(qū)域內(2)兩個變量正相關和負相關散點圖的特點概念形成概念形成(3)線性相關和非線性相關①線性相關散點圖是描述成對數(shù)據(jù)之間關系的一種直觀方法.一般地,如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在一一條直線附近,我們就稱這兩個變量線性相關oxy●●●●●●●●●●②非線性相關
一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.oxy●●●●●●●●●●概念形成散點雜亂無章,無規(guī)律可言,看不出兩個變量有什么相關性有相關性觀察散點圖中成對樣本數(shù)據(jù)的分布規(guī)律,可大致推斷兩個變量是否存在相關關系、是正相關還是負相關、是線性相關還是非線性相關等.散點圖雖然直觀,但無法確切(量化)地反映成對樣本數(shù)據(jù)的相關類型和相關程度的大小.例析例1.在下列各個量與量的關系中:①正方體的表面積與棱長之間的關系;②一塊農田的水稻產量與施肥量之間的關系;③家庭的收入與支出之間的關系;④某戶家庭用電量與水費之間的關系.其中是相關關系的為().A.①②
B.③④
C.②④
D.②③答案:D.解析:①正方體的表面積與棱長之間的關系是確定的函數(shù)關系;④某戶家庭用電量與水費之間無任何關系.②③中,都是非確定的關系,但自變量取值一定時,因變量的取值帶有一定的隨機性.例析方法技巧:
利用變量間相關關系的概念判斷量與量之間的關系時,一般是看當一個變量的值一定時,另一個變量是否帶有確定性,兩個變量之間的關系具有確定關系——函數(shù)關系;兩個變量之間的關系具有隨機性、不確定性——相關關系.例析例2.某種產品的廣告支出費x與銷售金額y之間有如表對應數(shù)據(jù)(單位:百萬元):x24568y3040605070①畫出散點圖;②從散點圖中判斷銷售金額與廣告支出費有什么樣的關系.解:①以x對應的數(shù)據(jù)為橫坐標,y對應的數(shù)據(jù)為縱坐標,所作的散點圖如圖所示.解:②從圖中可以發(fā)現(xiàn)廣告支出費與銷售金額之間具有相關關系,并且當廣告支出費由小變大時,銷售金額也大多由小變大,圖中的數(shù)據(jù)大致分布在某條直線的附近,即x與y呈正相關關系.例析
2.判斷兩個變量具有相關關系的方法(1)根據(jù)直觀感覺判斷,這時要用到已有的知識或學習、生活中的經(jīng)驗等.(2)根據(jù)散點圖判斷,這時要由兩個變量相應值的對應關系作出散點圖,通過觀察散點圖中變量的對應點是否分布在某條曲線的周圍判定這兩個變量是否具有相關關系.形數(shù)思考1:能否引入一個適當?shù)摹皵?shù)字特征”,來度量樣本數(shù)據(jù)是正相關還是負相關呢?新知探索新知探究
新知探究平移形數(shù)新知探究思考2:Lxy的大小一定能度量出成對樣本數(shù)據(jù)的相關程度大小嗎?
是不是Lxy越大,兩個變量的相關程度越強?Lxy>0表明成對樣本數(shù)據(jù)正相關;Lxy<0表明成對樣本數(shù)據(jù)負相關.Lxy的大小與數(shù)據(jù)的度量得有關,如:在研究體重與身高之間的相關程度時,如果體重的單位不變,把身高的單位由米改為厘米,則相應的Lxy將變?yōu)樵瓉淼?00倍,即(Lxy)2>(Lxy)1,但單位的改變并不會導致體重與身高之間相關程度的改變.不宜直接用Lxy度量成對樣本數(shù)據(jù)相關程度的大小.為了消除度量單位的影響,需要對數(shù)據(jù)作進一步的“標準化”處理.新知探究形數(shù)Bug:Lxy的大小受數(shù)據(jù)的度量單位的影響,但單位的改變并不會導致兩個變量之間相關程度的改變.新知探究為了消除度量單位的影響,需要對數(shù)據(jù)作進一步的“標準化”處理.稱r為變量x和變量y的樣本(線性)相關系數(shù).新知探究①r的正負:反映成對樣本數(shù)據(jù)的變化趨勢變量x和變量y的樣本(線性)相關系數(shù):思考3:r的大小能否刻畫成對樣本數(shù)據(jù)的相關程度的強弱?r的取值范圍是什么?強強弱弱新知探究觀察r的結構,聯(lián)想到二維(平面)向量、三維(空間)向量數(shù)量積的坐標表示,
新知探究①r的正負:反映成對樣本數(shù)據(jù)的變化趨勢變量x和變量y的樣本(線性)相關系數(shù):②r的范圍:?1≤r≤1新知探究思考4:當|r|=1時,成對樣本數(shù)據(jù)之間具有怎樣的關系呢?即此時兩個變量之間滿足一種線性(函數(shù))關系,即滿足完全線性相關.故|r|越接近1時,線性相關程度越強;|r|越接近0時,線性相關程度越弱;若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=-2x+1上,則這組樣本數(shù)據(jù)的樣本相關系數(shù)為()新知探究①r的正負:反映成對樣本數(shù)據(jù)的變化趨勢4、變量x和變量y的樣本(線性)相關系數(shù):②r的范圍:?1≤r≤1③|r|的大小:反映成對樣本數(shù)據(jù)線性相關的程度(即散點集中于某條直線的程度):|r|越接近1:線性相關程度越強;|r|越接近0:線性相關程度越弱.r=0時,只表明成對樣本數(shù)據(jù)間無線性相關關系,但不排除它們有其他相關關系.④樣本容量越大,用樣本相關系數(shù)估計兩個變量的相關系數(shù)的效果越好.新知探究r=0.97r=-0.85r=0.24r=-0.05正線性相關程度很強負線性相關程度較強正線性相關程度很弱負線性相關程度極弱①r的正負:反映成對樣本數(shù)據(jù)的變化特征②r的范圍:?1≤r≤1③|r|的大?。悍从吵蓪颖緮?shù)據(jù)間線性相關的程度(即散點集中于一條直線的程度):當|r|越接近1時,線性相關程度越強;當|r|越接近0時,線性相關程度越弱.新知探究如:要確切了解脂肪含量y與年齡x的線性相關程度,需要調查所有人的年齡及其脂肪含量,再將得到的成對數(shù)據(jù)代入r的公式,計算出相關系數(shù)r.在實際中,獲得總體中所有的成對數(shù)據(jù)往往是不容易的.在有限的總體中,可以利用這兩個變量取值的所有成對數(shù)據(jù),通過上述公式就可計算出兩個變量的相關系數(shù),這個相關系數(shù)就能確切地反映變量之間相關關系的正負性及線性相關程度的強弱.通過抽樣獲取兩個變量的一些成對樣本數(shù)據(jù),再計算出樣本相關系數(shù),通過樣本相關系數(shù)去估計總體相關系數(shù),從而了解兩個變量之間的相關程度.思想:用樣本估計總體樣本容量越大,用樣本相關系數(shù)估計兩個變量的相關系數(shù)的效果越好.新知探索
答案:較高.新知探索
答案:0.3.例析例3、對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關于其相關系數(shù)的比較,正確的是(
)A.r1<r4<0<r3<r2B.r4<r1<0<r3<r2C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3√例析例4、某廠的生產原料耗費x(單位:百萬元)與銷售額y(單位:百萬元)之間有如表所示的對應關系:x2468y30405070(1)畫出(x,y)的散點圖;(2)計算x與y之間的樣本相關系數(shù),并刻畫它們的相關程度.例析解:(1)畫出(x,y)的散點圖如圖所示.由樣本相關系數(shù)r≈0.9827,可以推斷生產原料耗費與銷售額這兩個變量正線性相關,且相關程度很強.課堂小結1.相關關系:兩個變量有關系,但又沒有確切到
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年中頻爐技術改造與產能提升合同3篇
- 2024年度智能硬件貼牌代工合作協(xié)議3篇
- 2024年網(wǎng)絡安全技術服務與合作合同
- 電腦網(wǎng)絡與應用課程設計
- 2024年版建筑工程委托管理合同
- 2024年度倒貸業(yè)務過橋借款合同模板下載6篇
- 2024年版股權投資與收購合同
- 站場樞紐課程設計
- 2024年度戶外健身場地專用雨棚定制合同3篇
- 2024年版員工勞動協(xié)議疑問全解版B版
- 化學與人類社會智慧樹知到期末考試答案章節(jié)答案2024年內江師范學院
- 2024年《關稅法》要點解讀
- 2024年遼寧生態(tài)工程職業(yè)學院單招職業(yè)適應性測試題庫必考題
- 《心理健康與職業(yè)生涯》開學第一課(教案)-【中職專用】中職思想政治《心理健康與職業(yè)生涯》(高教版2023·基礎模塊)
- 第六屆石油工程設計大賽方案設計類鉆完井單項組
- 紅色藝術欣賞 音樂舞蹈史詩《長征組歌》
- 演講與口才智慧樹知到期末考試答案2024年
- 空調安裝應急預案方案
- 大數(shù)據(jù)建模練習練習題及答案1-2023背題版
- 園林綠化員工培訓課件
- Ⅲ類射線裝置輻射工作人員考核試題 - 副本
評論
0/150
提交評論