知識(shí)精講:變量間的相關(guān)關(guān)系、回歸分析及獨(dú)立性檢驗(yàn)_第1頁(yè)
知識(shí)精講:變量間的相關(guān)關(guān)系、回歸分析及獨(dú)立性檢驗(yàn)_第2頁(yè)
知識(shí)精講:變量間的相關(guān)關(guān)系、回歸分析及獨(dú)立性檢驗(yàn)_第3頁(yè)
知識(shí)精講:變量間的相關(guān)關(guān)系、回歸分析及獨(dú)立性檢驗(yàn)_第4頁(yè)
知識(shí)精講:變量間的相關(guān)關(guān)系、回歸分析及獨(dú)立性檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

5/11變量間的相關(guān)關(guān)系、回歸分析及獨(dú)立性檢驗(yàn)【知識(shí)精講】1.會(huì)作兩個(gè)相關(guān)變量的數(shù)據(jù)的散點(diǎn)圖,會(huì)利用散點(diǎn)圖認(rèn)識(shí)變量的相關(guān)關(guān)系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.3.掌握獨(dú)立檢驗(yàn)(只要求2×2列聯(lián)表)的基本思想、方法簡(jiǎn)單應(yīng)用.4.掌握假設(shè)檢驗(yàn)和聚類分析的基本思想、方法簡(jiǎn)單應(yīng)用.【基礎(chǔ)梳理】1.相關(guān)關(guān)系的量:當(dāng)自變量一定時(shí),因變量的取值帶有一定的隨機(jī)性的兩個(gè)變量之間的關(guān)系稱為相關(guān)關(guān)系.2.回歸分析:對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析.3.散點(diǎn)圖:表示具有相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)的圖形叫做散點(diǎn)圖.4.正相關(guān)與負(fù)相關(guān)概念:如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),稱為正相關(guān).如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),稱為負(fù)相關(guān).相關(guān)系數(shù):r=叫做變量y與x之間的樣本相關(guān)系數(shù),簡(jiǎn)稱相關(guān)系數(shù),用它來(lái)衡量?jī)蓚€(gè)變量之間的線性相關(guān)程度.7.相關(guān)系數(shù)的性質(zhì):|r|≤1,且|r|越接近1,相關(guān)程度越大;且|r|越接近0,相關(guān)程度越小.8.獨(dú)立性檢驗(yàn):一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:2×2列聯(lián)表 若要推斷的論述為H1:X與Y有關(guān)系,可以按如下步驟判斷結(jié)論H1成立的可能性:(1)通過(guò)三維柱形圖和二維條形圖,可以粗略地判斷兩個(gè)分類變量是否有關(guān)系,但是這種判斷無(wú)法精確地給出所得結(jié)論的可靠程度.①在三維柱形圖中,主對(duì)角線上兩個(gè)柱形高度的乘積ad與副對(duì)角線上的兩個(gè)柱形高度的乘積bc相差越大,H1成立的可能性就越大.②在二維條形圖中,可以估計(jì)滿足條件X=x1的個(gè)體中具有Y=y(tǒng)1的個(gè)體所占的比例,也可以估計(jì)滿足條件X=x2的個(gè)體中具有Y=y(tǒng)2的個(gè)體所占的比例.“兩個(gè)比例的值相差越大,H1成立的可能性就越大.”(2)可以利用獨(dú)立性檢驗(yàn)來(lái)考察兩個(gè)分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度.具體做法是:①根據(jù)實(shí)際問(wèn)題需要的可信程度確定臨界值k0;②利用公式K2=,由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量K2的觀測(cè)值k;③如果k>k0,就以(1-P(K2≥k0))×100%的把握認(rèn)為“X與Y有關(guān)系”;否則就說(shuō)樣本觀測(cè)數(shù)據(jù)沒(méi)有提供“X與Y有關(guān)系”的充分證據(jù).【要點(diǎn)解讀】要點(diǎn)七相關(guān)關(guān)系的判斷【例7】山東魯潔棉業(yè)公司的科研人員在7塊并排、形狀大小相同的試驗(yàn)田上對(duì)某棉花新品種進(jìn)行施化肥量x對(duì)產(chǎn)量y影響的試驗(yàn),得到如下表所示的一組數(shù)據(jù)(單位:kg).然后進(jìn)行相關(guān)性檢驗(yàn),在確認(rèn)具有線性相關(guān)關(guān)系后,再求其回歸直線.?!敬鸢浮恳c(diǎn)九獨(dú)立性檢驗(yàn)【例9】(2009·遼寧)某企業(yè)有兩個(gè)分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在[29.94,30.06)的零件為優(yōu)質(zhì)品.從兩個(gè)分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得結(jié)果如下表:甲廠:乙廠:(1)試分別估計(jì)兩個(gè)分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;(2)由以上統(tǒng)計(jì)數(shù)據(jù)填下面2×2列聯(lián)表,并問(wèn)是否有99%的把握認(rèn)為“兩個(gè)分廠生產(chǎn)的零件的質(zhì)量有差異”.【命題立意】考查由采集樣本的數(shù)據(jù)檢驗(yàn)獨(dú)立性.【標(biāo)準(zhǔn)解析】利用公式計(jì)算K2的值,比較它與臨界值的大小關(guān)系,來(lái)判斷事件X與Y是否有關(guān)的問(wèn)題.【誤區(qū)警示】圖表數(shù)據(jù)及利用計(jì)算數(shù)據(jù)判斷獨(dú)立性的步驟必須正確理解.【答案】(1)甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計(jì)為=72%;乙廠抽查的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計(jì)為=64%.(2)所以有99%的把握認(rèn)為“兩個(gè)分廠生產(chǎn)的零件的質(zhì)量有差異”【變式訓(xùn)練】在對(duì)人們休閑方式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人.女性中有43人主要的休閑方式是看電視,另外27人的休閑方式是運(yùn)動(dòng);男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運(yùn)動(dòng). (1)根據(jù)以上數(shù)據(jù)建立一個(gè)2×2列聯(lián)表; (2)畫出二維條形圖; (3)檢驗(yàn)休閑方式是否與性別有關(guān),可靠性有多大.【標(biāo)準(zhǔn)解析】獨(dú)立性檢驗(yàn)的考查。【技巧點(diǎn)撥】先由已知條件轉(zhuǎn)化聯(lián)表及條形圖,然后由公式計(jì)算k2與臨界值的關(guān)系。【答案】(1)2×2列聯(lián)表如圖:(2)二維條形圖如圖:(3)假設(shè)休閑方式與性別無(wú)關(guān),則K2=≈6.201>5.024,所以有理由認(rèn)為休閑方式與性別無(wú)關(guān)是不合理的,即我們有97.5%的把握認(rèn)為休閑方式與性別有關(guān).【原創(chuàng)題探討】【原創(chuàng)精典1】某企業(yè)三月中旬生產(chǎn)A、B、C三種產(chǎn)品共3000件,根據(jù)分層抽樣的結(jié)果,企業(yè)統(tǒng)計(jì)員制作了如下的統(tǒng)計(jì)表:產(chǎn)品類別ABC產(chǎn)品數(shù)量(件)1300樣本容量130 由于不小心,表格中A、C產(chǎn)品的有關(guān)數(shù)據(jù)已被污染看不清楚了,統(tǒng)計(jì)員只記得A產(chǎn)品的樣本容量比C產(chǎn)品的樣本容量多10,根據(jù)以上信息,可得C產(chǎn)品的數(shù)量是________件.【解析】設(shè)樣本的總?cè)萘繛閤,則eq\f(x,3000)×1300=130,∴x=300. ∴A產(chǎn)品和C產(chǎn)品在樣本中共有300-130=170(件). 設(shè)C產(chǎn)品的樣本容量為y,則y+y+10=170,∴y=80.∴C產(chǎn)品的數(shù)量為eq\f(3000,300)×80=800.【答案】800[來(lái)源:Z。xx。k.Com]【原創(chuàng)精典2】如右圖是某電視臺(tái)綜藝節(jié)目舉辦的挑戰(zhàn)主持人大賽上,七位評(píng)委為某選手打出的分?jǐn)?shù)的莖葉統(tǒng)計(jì)圖,去掉一個(gè)最高分和一個(gè)最低分后,所剩數(shù)據(jù)的平均數(shù)和方差分別為()A.84,4.84B.84,1.6C.85,4D.85,1.6【解析】由莖葉圖可知評(píng)委打出的最低分為79,最高分為93,其余得分為84,84,86,84,87,故平均分為eq\f(84×3+86+87,5)=85,方差為eq\f(1,5)[3×(84-85)2+(86-85)2+(87-85)2]=1.6.【答案】D【原創(chuàng)精典3】近年來(lái),由于亂砍濫伐,掠奪性使用森林資源,我國(guó)長(zhǎng)江、黃河流域植被遭到破壞,土地沙化嚴(yán)重,洪澇災(zāi)害時(shí)有發(fā)生.沿黃某地區(qū)為積極響應(yīng)和支持“保護(hù)母親河”的倡議,建造了長(zhǎng)100千米,寬0.5千米的防護(hù)林.有關(guān)部門為掌握這一防護(hù)林共約有多少棵樹,從中選出10塊(每塊長(zhǎng)1千米,寬0.5千米)進(jìn)行統(tǒng)計(jì),每塊樹木數(shù)量如下(單位:棵)65100632006460064700673006330065100666006280065500請(qǐng)你根據(jù)以上數(shù)據(jù)計(jì)算這一防護(hù)林共約有多少棵樹(結(jié)果保留3個(gè)有效數(shù)字).【解析】要求學(xué)生有用樣本估計(jì)總體的思想方法,另一方面要求學(xué)生有應(yīng)用數(shù)學(xué)的意識(shí),這是今后中考命題發(fā)展的趨勢(shì).【答案】先計(jì)算出=(65100+63200+64600+64700+67300+63300+65100+66600+62800+65500)=64820.于是,可以估計(jì)這一防護(hù)林平均每塊約有64820株樹.又64820×100=6482000≈6.48×106(株),于是可以估計(jì)這一防護(hù)林大約共有6.48×106株樹.新動(dòng)向前瞻【樣題1】已知總體的各個(gè)體的值由小到大依次為2,3,3,7,a,b,12,13.7,18.3,20,且總體的中位數(shù)為10.5,若要使該總體的方差最小,則a、b的取值分別是________.【解析】∵中位數(shù)為10.5,∴eq\f(a+b,2)=10.5,a+b=21, ∵x=eq\f(2+3+3+7+a+b+12+13.7+18.3+20,10)=10, ∴s2=eq\f(1,10)[(10-2)2+(10-3)2+(10-3)2+(10-7)2+(10-a)2+(10-b)2+(10-12)2+(10-13.7)2+(10-18.3)2+(10-20)2]. 令y=(10-a)2+(10-b)2=2a2-42a+221=2eq\b\lc\(\rc\)(\a\vs4\al\co1(a-\f(21,2)))2+eq\f(1,2), 當(dāng)a=10.5時(shí),y取最小值,方差s2也取最小值.∴a=10.5,b=10.5.【答案】10.510.5【樣題2】某醫(yī)療研究所為了檢驗(yàn)?zāi)撤N血清預(yù)防感冒的作用,把500名使用血清的人與另外500名未用血清的人一年中的感冒記錄作比較,提出假設(shè)H0:“這種血清不能起到預(yù)防感冒的作用”,利用2×2列聯(lián)表計(jì)算得K2≈3.918,經(jīng)查對(duì)臨界值表知P(K2≥3.841)≈0.05. p:有95%的把握認(rèn)為“這種血清能起到預(yù)防感冒的作用”; q:若某人未使用該血清,那么他在一年中有95%的可能性得感冒; r:這種血清預(yù)防感冒的有效率為95%; s:這種血清預(yù)防感冒的有效率為5%. 則下列結(jié)論中,正確結(jié)論的序號(hào)是________.(把你認(rèn)為正確的命題序號(hào)都填上) ①p∧q;②綈p∧q;③(綈p∧綈q)∧(r∨s);④(p∨綈r)∧(綈q∨s).【解析】由題意,得K2≈3.918,P(K2≥3.841)≈0.05,所以只有p正確,即有95%的把握認(rèn)為“這種血清能起到預(yù)防感冒的作用”,由真值表知①、④為真命題.【答案】①④【樣題3】①合情推理是由特殊到一般的推理,得到的結(jié)論不一定正確,演繹推理是由一般到特殊的推理,得到的結(jié)論一定正確; ②一般地,當(dāng)r的絕對(duì)值大于0.75時(shí),認(rèn)為兩個(gè)變量之間有很強(qiáng)的線性相關(guān)關(guān)系,如果變量y與x之間的相關(guān)系數(shù)r=-0.9568,則變量y與x之間具有線性關(guān)系; ③用獨(dú)立性檢驗(yàn)(2×2列聯(lián)表法)來(lái)考察兩個(gè)分類變量是否有關(guān)系時(shí),算出的隨機(jī)變量K2的值越大,說(shuō)明“x與y有關(guān)系”成立的可能性越大; ④命題p:?x∈R使得x2+x+1<0,則綈p:?x∈R均有x2+x+1≥0. 其中結(jié)論正確的序號(hào)為________.(寫出你認(rèn)為正確的所有結(jié)論的序號(hào))【解析】②通過(guò)統(tǒng)計(jì)假設(shè),查表得結(jié)論正確;③參考兩個(gè)分類變量x和y有關(guān)系的可信度表:k2的值越大,說(shuō)明“x與y有關(guān)系”成立的可能性越大;④正確,命題p:?x∈R使得p(x),則綈p:?x∈R均有綈p(x).【答案】②③④【樣題4】出下列四個(gè)命題: ①?x∈R,cosx=sineq\b\lc\(\rc\)(\a\vs4\al\co1(x+\f(π,3)))+sineq\b\lc\(\rc\)(\a\vs4\al\co1(x+\f(π,6)))一定不成立;②今年初某醫(yī)療研究所為了檢驗(yàn)“達(dá)菲(藥物)”對(duì)甲型H1N1流感病毒是否有抑制作用,把墨西哥的患者數(shù)據(jù)庫(kù)中的500名使用達(dá)菲的人與另外500名未用達(dá)菲的人一段時(shí)間內(nèi)患甲型H1N1流感的療效記錄作比較,提出假設(shè)H0:“達(dá)菲不能起到抑制甲型H1N1流感病毒的作用”,利用2×2列聯(lián)表計(jì)算得K2≈3.918,經(jīng)查對(duì)臨界值表知P(K2≥3.841)≈0.05,說(shuō)明達(dá)菲抑制甲型H1N1流感病毒的有效率為95%;③|a·b|=|a||b|是|λa+μb|=|λ||a|+|μ||b|成立的充要條件;④如右圖的莖葉圖是某班在一次測(cè)驗(yàn)時(shí)的成績(jī):可斷定:女生成績(jī)比較集中,整體水平稍高于男生. 其中真命題的序號(hào)是________.(填上所有真命題的序號(hào))【解析】對(duì)于①,等式展開后可化簡(jiǎn)為asinx+bcosx=0的形式,可知一定有解;對(duì)于②,正確解釋是:有95%的把握認(rèn)為“達(dá)菲對(duì)甲型H1N1流感病毒有抑制作用”;對(duì)于③,由向量模的性質(zhì)知不正確.【答案】④【樣題5】某種產(chǎn)品的廣告費(fèi)支出x與銷售額y(單位:百萬(wàn)元)之間有如下對(duì)應(yīng)數(shù)據(jù):x24568y3040605070 (1)畫出散點(diǎn)圖; (2)求回歸直線方程; (3)試預(yù)測(cè)廣告費(fèi)支出為10百萬(wàn)元時(shí),銷售額多大?【解析】線性回歸問(wèn)題的綜合考查?!敬鸢浮?1)根據(jù)表中所列數(shù)據(jù)可得散點(diǎn)圖如下: (2)列出下表,并用科學(xué)計(jì)算器進(jìn)行有關(guān)計(jì)算.i12345xi24568yi3040605070xiyi60160300300560 因此,x=eq\f(25,5)=5,y=e

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論