版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三節(jié)統(tǒng)計(jì)案例【考試要求】,了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義,了解樣本相關(guān)系數(shù)與標(biāo)準(zhǔn)化數(shù)據(jù)向量夾角的關(guān)系,,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義,了解最小二乘法原理,,,理解2×2列聯(lián)表的統(tǒng)計(jì)意義,了解2×2列聯(lián)表獨(dú)立性檢驗(yàn)及其應(yīng)用.1.直線擬合(1)散點(diǎn)圖將成對(duì)樣本數(shù)據(jù)用直角坐標(biāo)系中的點(diǎn)表示出來,每個(gè)點(diǎn)對(duì)應(yīng)的一對(duì)數(shù)據(jù)(xi,yi),稱為成對(duì)數(shù)據(jù).這些點(diǎn)構(gòu)成的圖稱為散點(diǎn)圖.(2)直線擬合從散點(diǎn)圖上可以看出,如果變量之間存在著某種關(guān)系,這些點(diǎn)會(huì)有一個(gè)大致趨勢(shì),這種趨勢(shì)通??梢杂靡粭l光滑的曲線來近似地描述.這樣近似描述的過程稱為曲線擬合.若在兩個(gè)變量X和Y的散點(diǎn)圖中,所有點(diǎn)看上去都在一條直線附近波動(dòng),此時(shí)就可以用一條直線來近似地描述這兩個(gè)量之間的關(guān)系,稱之為直線擬合.2.一元線性回歸方程(1)最小二乘法對(duì)于給定的兩個(gè)變量X和Y(如身高和體重),可以把其成對(duì)的觀測(cè)值(x1,y1),(x2,y2),…,(xn,yn)表示為平面直角坐標(biāo)系中的n個(gè)點(diǎn).現(xiàn)在希望找到一條直線Y=a+bX,使得對(duì)每一個(gè)xi(i=1,2,…,n),由這個(gè)直線方程計(jì)算出來的值a+bxi與實(shí)際觀測(cè)值yi的差異盡可能?。疄榇耍M鸞y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2達(dá)到最?。畵Q句話說,我們希望a,b的取值能使上式達(dá)到最?。@個(gè)方法稱為最小二乘法.(2)用向量的方法可得使[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2達(dá)到最小的a,b取值為eq\b\lc\{(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n,)(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\i\su(i=1,n,)(xi-\o(x,\s\up6(-)))2),\o(a,\s\up6(^))=\o(y,\s\up6(-))-b\o(x,\s\up6(-))))其中,eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn),eq\x\to(y)=eq\f(1,n)(y1+y2+…+yn).這時(shí)直線方程Y=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))X稱作Y關(guān)于X的線性回歸方程,相應(yīng)的直線稱作Y關(guān)于X的回歸直線(如圖),eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是這個(gè)線性回歸方程的系數(shù).3.相關(guān)系數(shù)及其范圍(1)相關(guān)系數(shù)一般地,設(shè)隨機(jī)變量X,Y的n組觀測(cè)值分別為(x1,y1),(x2,y2),…,(xn,yn),記r=eq\f((x1-\x\to(x))(y1-\x\to(y))+(x2-\x\to(x))(y2-\x\to(y))+…+(xn-\x\to(x))(yn-\x\to(y)),\r((x1-\x\to(x))2+(x2-\x\to(x))2+…+(xn-\x\to(x))2)\r((y1-\x\to(y))2+(y2-\x\to(y))2+…+(yn-\x\to(y))2))=eq\f(\i\su(i=1,n,)(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\i\su(i=1,n,)(xi-\o(x,\s\up6(-)))2\i\su(i=1,n,)(yi-\o(y,\s\up6(-)))2)),稱r為隨機(jī)變量X和Y的樣本(線性)相關(guān)系數(shù).為了計(jì)算的方便,我們?cè)俳o出如下式子:r=eq\f((x1y1+x2y2+…+xnyn)-n\x\to(x)\x\to(y),\r((xeq\o\al(\s\up1(2),\s\do1(1))+xeq\o\al(\s\up1(2),\s\do1(2))+…+xeq\o\al(\s\up1(2),\s\do1(n)))-n\x\to(x)2)\r((yeq\o\al(\s\up1(2),\s\do1(1))+yeq\o\al(\s\up1(2),\s\do1(2))+…+yeq\o\al(\s\up1(2),\s\do1(n)))-n\x\to(y)2))樣本(線性)相關(guān)系數(shù)r的取值范圍為[-1,1].(2)相關(guān)系數(shù)的應(yīng)用|r|值越接近1,隨機(jī)變量之間的線性相關(guān)程度越強(qiáng);|r|值越接近0,隨機(jī)變量之間的線性相關(guān)程度越弱.當(dāng)r>0時(shí),兩個(gè)隨機(jī)變量的值總體上變化趨勢(shì)相同,此時(shí)稱兩個(gè)隨機(jī)變量正相關(guān);當(dāng)r<0時(shí),兩個(gè)隨機(jī)變量的值總體上變化趨勢(shì)相反,此時(shí)稱兩個(gè)隨機(jī)變量負(fù)相關(guān);當(dāng)r=0時(shí),此時(shí)稱兩個(gè)隨機(jī)變量線性不相關(guān).4.獨(dú)立性檢驗(yàn)(1)分類變量①分類變量:用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量.②取值:分類變量的取值可以用實(shí)數(shù)表示.(2)2×2列聯(lián)表設(shè)A,B為兩個(gè)變量,每一個(gè)變量都可以取兩個(gè)值,變量A:A1,A2=eq\o(A,\s\up6(-))1;變量B:B1,B2=eq\o(B,\s\up6(-))1.通過觀察得到如下表所示的數(shù)據(jù):ABB1B2總計(jì)A1aba+bA2cdc+d總計(jì)a+cb+dn=a+b+c+d其中,a表示變量A取A1,且變量B取B1時(shí)的數(shù)據(jù);b表示變量A取A1,且變量B取B2時(shí)的數(shù)據(jù);c表示變量A取A2,且變量B取B1時(shí)的數(shù)據(jù);d表示變量A取A2,且變量B取B2時(shí)的數(shù)據(jù).設(shè)n=a+b+c+d,用eq\f(a,n)估計(jì)P(A1B1),eq\f(a+b,n)估計(jì)P(A1),eq\f(a+c,n)估計(jì)P(B1).若有式子eq\f(a,n)=eq\f(a+b,n)·eq\f(a+c,n),則可以認(rèn)為A1與B1獨(dú)立.根據(jù)2×2列聯(lián)表中的數(shù)據(jù)來判斷兩個(gè)分類變量是否有關(guān)系,即它們是否獨(dú)立,這一問題稱為2×2列聯(lián)表的獨(dú)立性檢驗(yàn).(3)獨(dú)立性檢驗(yàn)的基本思想計(jì)算隨機(jī)變量χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).統(tǒng)計(jì)上已經(jīng)證明:在變量A,B獨(dú)立的前提下,當(dāng)樣本量很大時(shí),χ2近似服從一個(gè)已知的分布.當(dāng)χ2較大時(shí),說明變量之間不獨(dú)立.在統(tǒng)計(jì)中,用以下結(jié)果對(duì)變量的獨(dú)立性進(jìn)行判斷.①當(dāng)χ2≤時(shí),沒有充分的證據(jù)判斷變量A,B有關(guān)聯(lián),可以認(rèn)為變量A,B是沒有關(guān)聯(lián)的;②當(dāng)χ2,有90%的把握判斷變量A,B有關(guān)聯(lián);③當(dāng)χ2,有95%的把握判斷變量A,B有關(guān)聯(lián);④當(dāng)χ2,有99%的把握判斷變量A,B有關(guān)聯(lián).[常用結(jié)論]1.求解回歸方程的關(guān)鍵是確定回歸系數(shù)eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),應(yīng)充分利用回歸直線過樣本中心點(diǎn)(eq\x\to(x),eq\x\to(y)).2.根據(jù)χ2的值可以判斷兩個(gè)分類變量有關(guān)的可信程度,若χ2越大,則兩分類變量有關(guān)的把握越大.3.根據(jù)回歸方程計(jì)算的Y值,僅是一個(gè)預(yù)報(bào)值,不是真實(shí)發(fā)生的值.[思考辨析]判斷下列結(jié)論是否正確(請(qǐng)?jiān)诶ㄌ?hào)中打“√”或“×”)(1)散點(diǎn)圖是判斷兩個(gè)變量相關(guān)關(guān)系的一種重要方法和手段.()(2)線性回歸方程Y=b^X+a^至少經(jīng)過點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)中的一個(gè)點(diǎn).()(3)樣本相關(guān)系數(shù)的絕對(duì)值越接近1,成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng).()(4)若事件X,Y關(guān)系越密切,則由觀測(cè)數(shù)據(jù)計(jì)算得到的χ2的觀測(cè)值越小.()答案:(1)√(2)×(3)√(4)×[對(duì)點(diǎn)查驗(yàn)]1.兩個(gè)變量的相關(guān)關(guān)系有①正相關(guān),②負(fù)相關(guān),③不相關(guān),則下列散點(diǎn)圖從左到右分別反映的變量間的相關(guān)關(guān)系是()A.①②③B.②③①C.②①③D.①③②D第一個(gè)散點(diǎn)圖中,散點(diǎn)圖中的點(diǎn)是從左下角區(qū)域分布到右上角區(qū)域,則是正相關(guān);第三個(gè)散點(diǎn)圖中,散點(diǎn)圖中的點(diǎn)是從左上角區(qū)域分布到右下角區(qū)域,則是負(fù)相關(guān);第二個(gè)散點(diǎn)圖中,散點(diǎn)圖中的點(diǎn)的分布沒有什么規(guī)律,則是不相關(guān),所以應(yīng)該是①③②.2.(多選題)在統(tǒng)計(jì)中,由一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到兩個(gè)變量的線性回歸方程為Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^)),那么下列說法正確的是()A.相關(guān)系數(shù)r不可能等于1B.直線Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^))必經(jīng)過點(diǎn)(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))C.直線Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^))表示最接近y與x之間真實(shí)關(guān)系的一條直線D.相關(guān)系數(shù)為r,且|r|越接近于1,相關(guān)程度越大;|r|越接近于0,相關(guān)程度越小BCD相關(guān)系數(shù)的取值范圍是|r|≤1,故A錯(cuò);直線Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^))必過樣本點(diǎn)中心即點(diǎn)(eq\x\to(x),eq\x\to(y)),故B正確;直線Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^))是采用最小二乘法求解出的直線方程,接近真實(shí)關(guān)系,故C正確;相關(guān)系數(shù)r的絕對(duì)值越接近于1,表示相關(guān)程度越大,越接近于0,相關(guān)程度越小,故D正確.故選BCD.3.某車間為了規(guī)定工時(shí)定額,需要確定加工零件所花費(fèi)的時(shí)間,為此進(jìn)行了5次試驗(yàn).根據(jù)收集到的數(shù)據(jù)(如下表),由最小二乘法求得回歸方程YX+54.9.零件數(shù)x(個(gè))1020304050加工時(shí)間y(min)62758189現(xiàn)發(fā)現(xiàn)表中有一個(gè)數(shù)據(jù)看不清,請(qǐng)你推斷出該數(shù)據(jù)的值為.答案68解析由eq\x\to(x)=30,得eq\x\to(y)×30+=75.設(shè)表中的“模糊數(shù)字”為a,則62+a+75+81+89=75×5,∴a=68.4.某單位為了了解用電量(度)與當(dāng)天平均氣溫(℃)之間的關(guān)系,隨機(jī)統(tǒng)計(jì)了某4天的當(dāng)天平均氣溫與用電量(如下表).由數(shù)據(jù)運(yùn)用最小二乘法得線性回歸方程Y=-2X+a,則a=.平均氣溫X(℃)181310-1用電量Y(度)25353763答案60解析eq\x\to(x)=eq\f(18+13+10-1,4)=10,eq\x\to(y)=eq\f(25+35+37+63,4)=40,樣本中心為(10,40),回歸直線經(jīng)過樣本中心,所以40=-2×10+a?a=60.5.利用獨(dú)立性檢驗(yàn)來考慮兩個(gè)分類變量X與Y是否有關(guān)系時(shí),通過查閱下表來確定“X和Y有關(guān)系”的可信度.如果χ2>5.024,那么在犯錯(cuò)誤的概率不超過的前提下認(rèn)為“X和Y有關(guān)系”.P(χ2≥k)k2.706答案解析因?yàn)棣?,,“X和Y有關(guān)系”.考點(diǎn)一成對(duì)數(shù)據(jù)的相關(guān)性1.(2022·陜西寶雞市陳倉(cāng)高級(jí)中學(xué)模擬)對(duì)兩個(gè)變量X,Y進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)r1=0.8995,對(duì)兩個(gè)變量U,V進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)r2=-0.9568,則下列判斷正確的是()A.變量X與Y正相關(guān),變量U與V負(fù)相關(guān),變量X與Y的線性相關(guān)性較強(qiáng)B.變量X與Y負(fù)相關(guān),變量U與V正相關(guān),變量X與Y的線性相關(guān)性較強(qiáng)C.變量X與Y正相關(guān),變量U與V負(fù)相關(guān),變量U與V的線性相關(guān)性較強(qiáng)D.變量X與Y負(fù)相關(guān),變量U與V正相關(guān),變量U與V的線性相關(guān)性較強(qiáng)C依題意:r1=0.8995,r2=-0.9568,所以X,Y正相關(guān),U,V負(fù)相關(guān),|r1|<|r2|<1,所以U,V的線性相關(guān)性較強(qiáng).2.(2022·廣東潮州模擬)(多選題)對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的關(guān)系,正確的有()A.r1<r4B.r2<r3C.r3>0D.AC由圖形特征可知r1,r4都是負(fù)相關(guān),都是負(fù)數(shù),r1比r4的相關(guān)系數(shù)更強(qiáng),所以r1<r4<0,r2,r3都是正相關(guān),r2比r3的相關(guān)系數(shù)更強(qiáng),所以0<r3<r2,所以AC正確.3.(多選題)對(duì)相關(guān)系數(shù)r來說,下列說法錯(cuò)誤的有()A.|r|≤1,|r|越接近0,相關(guān)程度越大;|r|越接近1,相關(guān)程度越小B.|r|≥1,|r|越接近1,相關(guān)程度越大;|r|越大,相關(guān)程度越小C.|r|≤1,|r|越接近1,相關(guān)程度越大;|r|越接近0,相關(guān)程度越小D.|r|≥1,|r|越接近1,相關(guān)程度越小;|r|越大,相關(guān)程度越大ABD用相關(guān)系數(shù)r可以衡量?jī)蓚€(gè)變量之間的相關(guān)關(guān)系的強(qiáng)弱,r的絕對(duì)值越接近于1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng),r的絕對(duì)值接近于0時(shí),表示兩個(gè)變量之間幾乎不存在相關(guān)關(guān)系,故“對(duì)于相關(guān)系數(shù)r來說,|r|≤1,|r|越接近1,相關(guān)程度越大;|r|越接近0,相關(guān)程度越小”,C正確,故選ABD.思維升華判斷相關(guān)關(guān)系的兩種方法(1)散點(diǎn)圖法:如果樣本點(diǎn)的分布從整體上看大致在某一曲線附近,變量之間就有相關(guān)關(guān)系;如果樣本點(diǎn)的分布從整體上看大致在某一直線附近,變量之間就有線性相關(guān)關(guān)系.(2)相關(guān)系數(shù):r>0時(shí),正相關(guān);r<0時(shí),負(fù)相關(guān).|r|越趨向于1,相關(guān)性越強(qiáng).考點(diǎn)二一元線性回歸模型命題點(diǎn)1線性回歸方程及應(yīng)用(2022·全國(guó)模擬)小李準(zhǔn)備在某商場(chǎng)租一間商鋪開服裝店,為了解市場(chǎng)行情,在該商場(chǎng)調(diào)查了20家服裝店,統(tǒng)計(jì)得到了它們的面積X(單位:m2)和日均客流量Y(單位:百人)的數(shù)據(jù)(xi,yi)(i=1,2,…,20),并計(jì)算得eq\i\su(i=1,20,x)i=2400,eq\i\su(i=1,20,y)i=210,eq\i\su(i=1,20,)(xi-eq\x\to(x))2=42000,eq\i\su(i=1,20,)(xi-eq\x\to(x))(yi-eq\x\to(y))=6300.(1)求Y關(guān)于X的線性回歸方程;(2)已知服裝店每天的經(jīng)濟(jì)效益W=keq\r(y)+mx(k>0,m>0),該商場(chǎng)現(xiàn)有60~150m2的商鋪出租,根據(jù)(1)的結(jié)果進(jìn)行預(yù)測(cè),要使單位面積的經(jīng)濟(jì)效益Z最高,小李應(yīng)該租多大面積的商鋪?附:線性回歸方程Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估計(jì)分別為:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).解(1)由已知可得eq\x\to(x)=eq\f(1,20)eq\i\su(i=1,20,x)i=120,eq\x\to(y)=eq\f(1,20)eq\i\su(i=1,20,y)i,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,20,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,20,)(xi-\x\to(x))2)=eq\f(6300,42000),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)×,所以線性回歸方程為YX-7.5.(2)根據(jù)題意得Z=eq\f(W,x)=eq\f(k\rx-7.5),x)+m,60≤x≤150.設(shè)f(x)=eq\fx,x2)=eq\f,x)-eq\f,x2),令t=eq\f(1,x),eq\f(1,150)≤t≤eq\f(1,60),則f(x)=g(ttt2×(t-)2+0.00075,當(dāng)t,即x=100時(shí),f(x)取最大值,又因?yàn)閗,m>0,所以此時(shí)Z也取最大值,因此,小李應(yīng)該租100m2的商鋪.命題點(diǎn)2相關(guān)系數(shù)r(2022·全國(guó)乙卷)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計(jì)一林區(qū)某種樹木的總材積量,隨機(jī)選取了10棵這種樹木,測(cè)量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數(shù)據(jù):樣本號(hào)i12345678910總和根部橫截面積xi材積量yi并計(jì)算得eq\i\su(i=1,10,x)eq\o\al(\s\up1(2),\s\do1(i)),eq\i\su(i=1,10,y)eq\o\al(\s\up1(2),\s\do1(i)),eq\i\su(i=1,10,x)iyi=0.2474.(1)估計(jì)該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);(3)現(xiàn)測(cè)量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為186m2附:相關(guān)系數(shù)r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2\i\su(i=1,n,)(yi-\x\to(y))2)),eq\r(1.896)≈1.377.解(1)樣本中10棵這種樹木的根部橫截面積的平均值eq\x\to(x)=eq\f,10),樣本中10棵這種樹木的材積量的平均值eq\x\to(y)=eq\f,10)=0.39.據(jù)此可估計(jì)該林區(qū)這種樹木平均一棵的根部橫截面積為m2,平均一棵的材積量為0.39m3.(2)r=eq\f(\i\su(i=1,10,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,10,)(xi-\x\to(x))2\i\su(i=1,10,)(yi-\x\to(y))2))=eq\f(\i\su(i=1,10,x)iyi-10\x\to(x)\x\to(y),\r(\b\lc\(\rc\)(\a\vs4\al\co1(\i\su(i=1,10,x)eq\o\al(\s\up1(2),\s\do1(i))-10\x\to(x)2))\b\lc\(\rc\)(\a\vs4\al\co1(\i\su(i=1,10,y)eq\o\al(\s\up1(2),\s\do1(i))-10\x\to(y)2))))=eq\f-10××,\r((0.038-10×2)(1.6158-10×0.39)2))=eq\f(0.0134,\r(0.0001896))≈eq\f(0.0134,0.01377)≈,則r≈0.97.(3)設(shè)該林區(qū)這種樹木的總材積量的估計(jì)值為Ym3,又已知樹木的材積量與其根部橫截面積近似成正比,可得eq\f,0.39)=eq\f(186,Y),解之得Y=1209m3.則該林區(qū)這種樹木的總材積量估計(jì)為1209m3.命題點(diǎn)3非線性回歸方程及應(yīng)用(2022·四川成都七中模擬)新冠肺炎疫情發(fā)生以來,我國(guó)某科研機(jī)構(gòu)開展應(yīng)急科研攻關(guān),研制了一種新型冠狀病毒疫苗,并已進(jìn)入二期臨床試驗(yàn).根據(jù)普遍規(guī)律,志愿者接種疫苗后體內(nèi)會(huì)產(chǎn)生抗體,人體中檢測(cè)到抗體,說明有抵御病毒的能力.通過檢測(cè),用X表示注射疫苗后的天數(shù).Y表示人體中抗體含量水平(單位:miu/mL,即:百萬(wàn)國(guó)際單位毫升),現(xiàn)測(cè)得某志愿者的相關(guān)數(shù)據(jù)如下表所示:天數(shù)X123456抗體含量水平Y(jié)510265096195根據(jù)以上數(shù)據(jù),繪制了散點(diǎn)圖.(1)根據(jù)散點(diǎn)圖判斷,y=c·edx與y=a+bx(a,b,c,d均為大于零的常數(shù))哪一個(gè)更適宜作為描述Y與X關(guān)系的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結(jié)果求出Y關(guān)于X的回歸方程,并預(yù)測(cè)該志愿者在注射疫苗后的第10天的抗體含量水平值;(3)從這位志愿者的前6天的檢測(cè)數(shù)據(jù)中隨機(jī)抽取4天的數(shù)據(jù)作進(jìn)一步的分析,記其中的Y值大于50的天數(shù)為X,求X的分布列與數(shù)學(xué)期望.參考數(shù)據(jù):其中W=lnY.參考公式:用最小二乘法求經(jīng)過點(diǎn)(u1,v1),(u2,v2),(u3,v3),…,(ui,vi)的線性回歸方程V=eq\o(b,\s\up6(^))U+eq\o(a,\s\up6(^))的系數(shù)公式,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)(ui-\x\to(u))(vi-\x\to(v)),\i\su(i=1,n,)(ui-\x\to(u))2)=eq\f(\i\su(i=1,n,u)ivi-n\x\to(u)\x\to(v),\i\su(i=1,n,u)eq\o\al(\s\up1(2),\s\do1(i))-n\x\to(u)2),eq\o(a,\s\up6(^))=eq\x\to(v)-eq\o(b,\s\up6(^))eq\x\to(u).解(1)根據(jù)散點(diǎn)圖,點(diǎn)的分布呈現(xiàn)曲線狀,所以Y=cedX更適合作為描述Y與X關(guān)系的回歸方程類型.(2)設(shè)W=lnY,變換后可得W=lnc+dX,設(shè)p=lnc,建立W關(guān)于X的線性回歸方程W=eq\o(p,\s\up6(^))+eq\o(d,\s\up6(^))X,eq\o(d,\s\up6(^))=eq\f(\i\su(i=1,6,)\b\lc\(\rc\)(\a\vs4\al\co1(ωi-\x\to(ω)))\b\lc\(\rc\)(\a\vs4\al\co1(xi-\x\to(x))),\i\su(i=1,6,)(xi-\x\to(x))2)=eq\f,17.50),eq\o(p,\s\up6(^))=eq\x\to(ω)-eq\o(d,\s\up6(^))eq\x\to(x)×,所以W關(guān)于X的線性回歸方程為WX,所以Y=eX,當(dāng)x=10時(shí),Y=e×10=e≈,即該志愿者在注射疫苗后的第10天的抗體含量水平值約為4023.87miu/mL.(3)由表格數(shù)據(jù)可知,第5,6天的Y值大于50,故X的可能取值為0,1,2,P(X=0)=eq\f(Ceq\o\al(\s\up1(4),\s\do1(4)),Ceq\o\al(\s\up1(4),\s\do1(6)))=eq\f(1,15),P(X=1)=eq\f(Ceq\o\al(\s\up1(3),\s\do1(4))Ceq\o\al(\s\up1(1),\s\do1(2)),Ceq\o\al(\s\up1(4),\s\do1(6)))=eq\f(8,15),P(X=2)=eq\f(Ceq\o\al(\s\up1(2),\s\do1(4))Ceq\o\al(\s\up1(2),\s\do1(2)),Ceq\o\al(\s\up1(4),\s\do1(6)))=eq\f(2,5),X的分布列為X012Peq\f(1,15)eq\f(8,15)eq\f(2,5)EX=0×eq\f(1,15)+1×eq\f(8,15)+2×eq\f(2,5)=eq\f(4,3).思維升華(1)①計(jì)算平均數(shù)eq\x\to(x),eq\x\to(y).②計(jì)算eq\i\su(i=1,n,x)iyi.③計(jì)算eq\i\su(i=1,n,x)eq\o\al(\s\up1(2),\s\do1(i)).(2)將結(jié)果代入公式eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)eq\o\al(\s\up1(2),\s\do1(i))-n\o(x,\s\up6(-))2),求eq\o(b,\s\up6(^)).(3)利用eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),求eq\o(a,\s\up6(^)).(4)寫出線性回歸方程.2.利用相關(guān)系數(shù)公式r=eq\f(\i\su(i=1,n,)(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\i\su(i=1,n,)(xi-\o(x,\s\up6(-)))2)\r(\i\su(i=1,n,)(yi-\o(y,\s\up6(-)))2))),可計(jì)算兩個(gè)變量的相關(guān)系數(shù),并利用其大小判斷兩個(gè)變量的相關(guān)性,進(jìn)行回歸分析.3.非線性回歸分析問題的處理方法(1)描點(diǎn),選模.畫出已知數(shù)據(jù)的散點(diǎn)圖,把它與已經(jīng)學(xué)過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)等)圖象作比較,挑選一種跟這些散點(diǎn)擬合最好的函數(shù).(2)解模.先對(duì)變量進(jìn)行適當(dāng)?shù)刈儞Q,再利用線性回歸模型來解模.(3)比較檢驗(yàn).通過回歸分析比較所建模型的優(yōu)劣.對(duì)點(diǎn)強(qiáng)化1(1)(2022·陜西西安模擬)打好脫貧攻堅(jiān)戰(zhàn),穩(wěn)步實(shí)施鄉(xiāng)村振興,離不開農(nóng)村基層黨組織的堅(jiān)強(qiáng)戰(zhàn)斗堡壘作用的發(fā)揮.某村村黨支部書記為改良鹽堿地土壤,從省城請(qǐng)來專家進(jìn)行技術(shù)指導(dǎo),并從某農(nóng)業(yè)大學(xué)引進(jìn)富硒草莓.功夫不負(fù)有心人,富硒草莓種植成功,村里建起了草苺采摘園,到了年底,種植草莓的收入連同合作社的其他經(jīng)營(yíng)項(xiàng)目一起,成了貧困戶的主要經(jīng)濟(jì)來源.該村對(duì)近幾年草莓的采摘價(jià)格和采摘人數(shù)情況進(jìn)行了統(tǒng)計(jì),發(fā)現(xiàn)草莓的采摘價(jià)格X(元/斤)和采摘人數(shù)Y(千人)的關(guān)系如下表:草莓采摘價(jià)格X(元/斤)2025303540采摘人數(shù)Y(千人)5852453228①已知X與Y之間有較強(qiáng)的線性相關(guān)性,試用最小二乘法求出Y關(guān)于X的線性回歸方程Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^));②該村根據(jù)2022年草莓的產(chǎn)量,估計(jì)約34千人采摘,那么2022年草莓的采摘價(jià)格應(yīng)定為多少元/斤?(結(jié)果保留整數(shù))參考公式:線性回歸方程Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估計(jì)分別為eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).參考數(shù)據(jù):eq\i\su(i=1,5,)(xi-eq\x\to(x))(yi-eq\x\to(y))=-400,eq\i\su(i=1,5,)(xi-eq\x\to(x))2=250.解①由表中數(shù)據(jù)得:eq\x\to(x)=eq\f(20+25+30+35+40,5)=30,eq\x\to(y)=eq\f(58+52+45+32+28,5)=43,∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,5,)(xi-\x\to(x))2)=eq\f(-400,250)=,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=43-(-1.6)×30=91,∴Y關(guān)于X的線性回歸方程為YX+91.②令y=34,x+91=34,解得x≈36(元/斤),∴2022年草莓的價(jià)格應(yīng)定為36元/斤.(2)(2022·陜西渭南模擬)近年來,隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)約車服務(wù)在我國(guó)各城市迅猛發(fā)展,為人們出行提供了便利,但也給城市交通管理帶來了一些困難.為了解網(wǎng)約車在某省的發(fā)展情況,調(diào)查機(jī)構(gòu)從該省抽取了5個(gè)城市,分別收集和分析了網(wǎng)約車的A,B兩項(xiàng)指標(biāo)數(shù)xi,yi(i=1,2,3,4,5),數(shù)據(jù)如下表所示:城市1城市2城市3城市4城市5A指標(biāo)數(shù)X35679B指標(biāo)數(shù)Y56789①由表中數(shù)據(jù)可知,Y與X具有較強(qiáng)的線性相關(guān)關(guān)系,請(qǐng)利用相關(guān)系數(shù)r加以說明;(精確到0.01)②建立Y關(guān)于X的線性回歸方程,并預(yù)測(cè)當(dāng)A指標(biāo)數(shù)為8時(shí),B指標(biāo)數(shù)的估計(jì)值.相關(guān)系數(shù)r參考值:當(dāng)0.3<|r,線性相關(guān)程度一般;當(dāng)|r,線性相關(guān)程度較高.參考公式:r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2\i\su(i=1,n,)(yi-\x\to(y))2)),線性回歸方程Y=eq\o(b,\s\up6(^))X+eq\o(a,\s\up6(^))的斜率和截距的最小二乘法估計(jì)分別為eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).參考數(shù)據(jù):eq\i\su(i=1,5,)(xi-eq\x\to(x))(yi-eq\x\to(y))=14,eq\r(2)≈1.414.解①由表得eq\x\to(x)=eq\f(3+5+6+7+9,5)=6,eq\x\to(y)=eq\f(5+6+7+8+9,5)=7,∴eq\i\su(i=1,5,)(xi-eq\x\to(x))2=20,eq\i\su(i=1,5,)(yi-eq\x\to(y))2=10,r=eq\f(\i\su(i=1,5,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,5,)(xi-\x\to(x))2\i\su(i=1,5,)(yi-\x\to(y))2))=eq\f(14,\r(10×20))≈,∴該A指標(biāo)X與B指標(biāo)Y具有較高的線性相關(guān)程度.②eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,5,)(xi-\x\to(x))2)=eq\f(14,20),則eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=7-6×,∴Y關(guān)于X的線性回歸方程為YX,將x=8代入,得y×,故預(yù)測(cè)當(dāng)A指標(biāo)數(shù)為8時(shí),B指標(biāo)數(shù)的估計(jì)值為8.4.(3)(2022·河北承德模擬)某制造企業(yè)從生產(chǎn)的產(chǎn)品中隨機(jī)抽查了1000件,經(jīng)檢驗(yàn),其中一等品有800件,二等品有150件,次品有50件.若銷售1件該產(chǎn)品,可獲得利潤(rùn)165元.根據(jù)統(tǒng)計(jì),該制造企業(yè)在2021年12月至2022年5月的產(chǎn)量Y(萬(wàn)件)與月份編號(hào)X(記2021年12月,2022年1月,…編號(hào)分別為1,2,…)近似滿足關(guān)系式y(tǒng)=b·xa(a>0,b>0),相關(guān)統(tǒng)計(jì)量的值如下:eq\i\su(i=1,6,)lnxi,eq\i\su(i=1,6,)lnyi,eq\i\su(i=1,6,)(lnxi)2,eq\i\su(i=1,6,)(lnxi·lnyi,e≈2.7.根據(jù)所給的統(tǒng)計(jì)量,求Y關(guān)于X的回歸方程,并估計(jì)該制造企業(yè)2022年8月份的利潤(rùn)為多少萬(wàn)元.(結(jié)果精確到0.01)附:對(duì)于一組數(shù)據(jù)(ui,vi)(i=1,2,3,…,n),其回歸直線V=eq\o(β,\s\up6(^))U+eq\o(α,\s\up6(^))的斜率和截距的最小二乘估計(jì)分別為eq\o(β,\s\up6(^))=eq\f(\i\su(i=1,n,u)ivi-n\o(u,\s\up6(-))\o(v,\s\up6(-)),\i\su(i=1,n,u)eq\o\al(\s\up1(2),\s\do1(i))-n\o(u,\s\up6(-))2),eq\o(α,\s\up6(^))=eq\o(v,\s\up6(-))-eq\o(β,\s\up6(^))eq\o(u,\s\up6(-)).解因?yàn)閥=b·xa(a>0,b>0),所以lny=ln(b·xa)=lnb+alnx.令v=lny,u=lnx,則v=lnb+au.因?yàn)閑q\i\su(i=1,6,)lnxi=eq\i\su(i=1,6,u)i,eq\i\su(i=1,6,)lnyi=eq\i\su(i=1,6,v)i,eq\i\su(i=1,6,)(lnxi)2=eq\i\su(i=1,6,u)eq\o\al(\s\up1(2),\s\do1(i)),eq\i\su(i=1,6,)(lnxi·lnyi)=eq\i\su(i=1,6,)eq\b\lc\(\rc\)(\a\vs4\al\co1(ui·vi)),所以eq\o(u,\s\up6(-)),eq\o(v,\s\up6(-)),eq\o(a,\s\up6(^))=eq\f(\i\su(i=1,6,)(uivi)-6\o(u,\s\up6(-))\o(v,\s\up6(-)),\i\su(i=1,6,u)eq\o\al(\s\up1(2),\s\do1(i))-6\o(u,\s\up6(-))2)=eq\f(-1.87-6××(-0.45),9.46-6×2)=eq\f(1,2)因?yàn)閘nb=eq\o(v,\s\up6(-))-eq\o(a,\s\up6(^))eq\o(u,\s\up6(-))=-0.45-eq\f(1,2)×=-1,所以b=eq\f(1,e),所以回歸方程為Y=eq\f(\r(X),e).當(dāng)x=9時(shí),y=eq\f(3,e)≈,×165=183.15萬(wàn)元.考點(diǎn)三獨(dú)立性檢驗(yàn)(2022·全國(guó)甲卷)甲、乙兩城之間的長(zhǎng)途客車均由A和B兩家公司運(yùn)營(yíng),為了解這兩家公司長(zhǎng)途客車的運(yùn)行情況,隨機(jī)調(diào)查了甲、乙兩城之間的500個(gè)班次,得到下面列聯(lián)表:準(zhǔn)點(diǎn)班次數(shù)未準(zhǔn)點(diǎn)班次數(shù)A24020B21030(1)根據(jù)上表,分別估計(jì)這兩家公司甲、乙兩城之間的長(zhǎng)途客車準(zhǔn)點(diǎn)的概率;(2)能否有90%的把握認(rèn)為甲、乙兩城之間的長(zhǎng)途客車是否準(zhǔn)點(diǎn)與客車所屬公司有關(guān)?附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 第8課 三國(guó)至隋唐的文化 說課稿 -2023-2024學(xué)年高中歷史統(tǒng)編版2019必修中外歷史綱要上冊(cè)
- 安全網(wǎng)絡(luò)信息傳播與輿論引導(dǎo)考核試卷
- 第5課我愛我們班第二課時(shí)說課稿-2023-2024學(xué)年道德與法治二年級(jí)上冊(cè)統(tǒng)編版
- 2006年湖北黃岡中考滿分作文《關(guān)愛無(wú)處不在》
- 安防監(jiān)控系統(tǒng)設(shè)計(jì)與實(shí)施考核試卷
- 第三單元 學(xué)寫文學(xué)短評(píng) 說課稿 2024-2025學(xué)年統(tǒng)編版高中語(yǔ)文必修上冊(cè)
- 單板加工企業(yè)人才培養(yǎng)與激勵(lì)機(jī)制考核試卷
- 二零二五年度售樓處物業(yè)管理及綠化養(yǎng)護(hù)合同3篇
- 2025年北師大版七年級(jí)地理上冊(cè)階段測(cè)試試卷含答案
- 2025年北師大新版八年級(jí)化學(xué)下冊(cè)階段測(cè)試試卷含答案
- 綠色簡(jiǎn)潔商務(wù)匯總報(bào)告PPT模板課件
- 下肢皮牽引護(hù)理PPT課件(19頁(yè)P(yáng)PT)
- 臺(tái)資企業(yè)A股上市相關(guān)資料
- 電 梯 工 程 預(yù) 算 書
- 參會(huì)嘉賓簽到表
- 形式發(fā)票格式2 INVOICE
- 2.48低危胸痛患者后繼治療評(píng)估流程圖
- 人力資源管理之績(jī)效考核 一、什么是績(jī)效 所謂績(jī)效簡(jiǎn)單的講就是對(duì)
- 山東省醫(yī)院目錄
- 云南地方本科高校部分基礎(chǔ)研究
- 廢品管理流程圖
評(píng)論
0/150
提交評(píng)論