版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
--1-第三章統(tǒng)計案例回歸分析的根本思想及其初步應(yīng)用〔4〕授課類型:授課一、教學(xué)內(nèi)容與教學(xué)對象分析學(xué)生將在必修課程學(xué)習(xí)統(tǒng)計的根底上,通過對典型案例的爭論,了解和使用一些常用的統(tǒng)計方法,進(jìn)一步體會運(yùn)用統(tǒng)計方法解決實際問題的根本思想,生疏統(tǒng)計方法在決策中的作用。二、學(xué)習(xí)目標(biāo)1、學(xué)問與技能通過本節(jié)的學(xué)習(xí),了解回歸分析的根本思想,會對兩個變量進(jìn)展回歸分析,明確建立回歸模型的根本步驟,并對具體問題進(jìn)展回歸分析,解決實際應(yīng)用問題。2、過程與方法本節(jié)的學(xué)習(xí),應(yīng)當(dāng)讓學(xué)生通過實際問題去理解回歸分析的必要性,明確回歸分析的根本思想,從散點(diǎn)圖中點(diǎn)的分布上我們覺察直接求回歸直線方程存在明顯的缺乏,從中引導(dǎo)學(xué)生去覺察解決問題的思路—進(jìn)展回歸分析,進(jìn)而介紹殘差分析的方法和利用R的平方來表示解釋變量對于預(yù)報變量變化的奉獻(xiàn)率,從中選擇較為合理的回歸方程,最終是建立回歸模型根本步驟。3、情感、態(tài)度與價值觀通過本節(jié)課的學(xué)習(xí),首先讓顯示了解回歸分析的必要性和回歸分析的根本思想,明確回歸分析的根本方法和根本步驟,培育我們利用整體的觀點(diǎn)和相互聯(lián)系的觀點(diǎn),來分析問題,進(jìn)一步加強(qiáng)數(shù)學(xué)的應(yīng)用意識,培育學(xué)生學(xué)好數(shù)學(xué)、用好數(shù)學(xué)的信念。加強(qiáng)與現(xiàn)實生活的聯(lián)系,以科學(xué)的態(tài)度評價兩個變量的相關(guān)系。教學(xué)中適當(dāng)?shù)卦黾訉W(xué)生合作與溝通的時機(jī),多從實際生活中找出例子,使學(xué)生在學(xué)習(xí)的同時。體會與他人合作的重要性,理解處理問題的方法與結(jié)論的聯(lián)系,形成實事求是的嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度和鍥而不舍的求學(xué)精神。培育學(xué)生運(yùn)用所學(xué)學(xué)問,解決實際問題的力量。三、教學(xué)重點(diǎn)、難點(diǎn)教學(xué)重點(diǎn):嫻熟把握回歸分析的步驟;各相關(guān)指數(shù)、建立回歸模型的步驟;通過探究使學(xué)生體會有些非線性模型通過變換可以轉(zhuǎn)化為線性回歸模型,了解在解決實際問題的過程中查找更好的模型的方法。教學(xué)難點(diǎn):求回歸系數(shù)a,b;相關(guān)指數(shù)的計算、殘差分析;了解常用函數(shù)的圖象特點(diǎn),選擇不同的模型建模,并通過比較相關(guān)指數(shù)對不同的模型進(jìn)展比較。四、教學(xué)策略:教學(xué)方法:誘思探究教學(xué)法學(xué)習(xí)方法:自主探究、觀看覺察、合作溝通、歸納總結(jié)。教學(xué)手段:多媒體關(guān)心教學(xué)五、教學(xué)過程:〔一、復(fù)習(xí)引入:回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)展統(tǒng)計分析的一種常用方法?!捕?、課:探究:對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù):〔x,y1 1
),(x,y2
),?,(x,y),n n我們知道其回歸方程的截距和斜率的最小二乘估量公式分別為:yx
〔1〕n(xx)(yy) i i
ni1
(xx)2i
〔2〕
1nni1
x,yi
1nni1
y〔x,y〕i注:回歸直線過樣本中心.你能推導(dǎo)出這兩個計算公式嗎?從我們已經(jīng)學(xué)過的學(xué)問知道,截距和斜率分別是使Q(,)ni1
(ybxa)2i i取到最小值時,的值.由于Q,)ni1
[yx(yx)(yx)]2i ii1
{[yi
xi
(yx)]22[yi
xi
(yx)][(yx)][(yx)]2}
[yxi
(yx)2
[yxi
(yx)](yx)n[(yx)]2i1 i1留意到n
[yx(yx)](yx)i i(yx)n[yii1
xi
(yx)](yx
yi
xn(yx)]ii1 i1(yx)[nynxn(yx)]0.,)n[yii1
xi
(yx)]2n(yx)22
(xx)2i
(xx)(yi
y)
(yy)2n(yx)2ii1 i1 i1(yx)2
(xx)2[i
n
(xx)(yy)i in
[n(xii1n
x)(yy)]2i
(yy)2ii1
(xx)2ii1
i1
(xx)2i
i1在上式中,后兩項和,無關(guān),而前兩項為非負(fù)數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)0,即有n1i 1i
xynxyi i
,yx.ni1
x2nx2i這正是我們所要推導(dǎo)的公式.下面我們從另一個角度來推導(dǎo)的公式.A2-2P371.4A4用測量工具測量某物體的長度,由于工具的精度以及測量技術(shù)的緣由,測得n個數(shù)據(jù)a,a1 2
, ,a .n證明x
1nan ii1表示這個物體的長度,能使這n個數(shù)據(jù)的方差f(x)最?。?/p>
1nni1
(xa)2i思考:這個結(jié)果說明白什么?通過這個問題,你能說明最小二乘法的根本原理嗎?f(x)nni1
(xa)2,所以if”(x)nni1
(xa),if(x)0x
1na。n ii1可以得到,x
1nni1
af(x)的微小值點(diǎn),也是最小值點(diǎn).i這個結(jié)果說明,用n1nan i1
表示這個物體的長度是合理的,這就是最小二乘法的根本原理.由最小二乘法的根本原理即得xxx定理設(shè)xR,x 1 2n
n,則1 [(xx)2(xx)2(xx)2] [(xx)2(xx)2(xx)2]s2 (*)1 n 1 2 n n 1 2 nxxx當(dāng)且僅當(dāng)xx 1 2n
n時取等號.xxx(*)式說明,x 1 2
nxxx
,,x
的差的平方的平均n 1 2 n數(shù)中最小的數(shù).從而說明白方差具有最小性,也即定義標(biāo)準(zhǔn)差的合理性.下面借助(*)Qy1值.
bx1
a)2
(y2
bx2
a)2
(yn
bxn
a)2的最小(ybx)(ybx)(ybx)1 1 2 2 n nnyyy xxx 1 2
nb1 2
nybx,n n由(*)式知,Q[a(ybx1 1
)]2[a(ybx)]2 [a(y2 2
bx)]2n[(ybx)(ybx)]2[(ybx)(y1 1
bx)]2 [(ybx)(y2
bxn
)]2[(xx)b(yy)]2[(xx)b(y1 1 2
y)]2 [(xn
x)b(yn
y)]2n(xx)2b22n(xx)(yi i
ybn(yy)2ii1 i1 i1
n(xx)2[bi1i
(xx)(yy)i in
2
[n((yy)2i1ii i
x)(yy)]2ii1
(xx)2ii1
i1
i1
(xx)2in(xii1
nx)2[bi1
(xx)(yy)i in(xx)2ii1
]2
n(yii1
[ny)2
(xini1
(xx)2x)(x)(yy)]2i
[n((yy)2i1ii i
x)(yy)]2ii1
(xx)2ii1n(xx)2i
(yy)2[i
(xx)(yi
y)]2i1 i1
ni1
i1(xx)2in(xx)(yy)
xynxy當(dāng)且僅當(dāng)aybx,且bi1
i i i ii1
Q到達(dá)最小值ni1
(xx)2i
ni1
x2nx2in(xx)2
(yy)2[
(xx)(y
y)]2i i1 i1
ni1
i ii1 .(xx)2i n (x
x)(yi
y)
n xyi
nxybi1
i1 ,
ni1
(xx)2i
n xii1
其中ba是截距.
aybx. 借助||a||b|||ab||a||b|A3ybxa的一個合理的解釋1、回歸分析的根本步驟:畫出兩個變量的散點(diǎn)圖.求回歸直線方程.用回歸直線方程進(jìn)展預(yù)報.下面我們通過案例,進(jìn)一步學(xué)習(xí)回歸分析的根本思想及其應(yīng)用2、舉例:1.從某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高和體重數(shù)據(jù)如表編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求依據(jù)女大學(xué)生的身高預(yù)報體重的回歸方程,并預(yù)報一名身高為172cm的女大學(xué)生的體重.解:由于問題中要求依據(jù)身高預(yù)報體重,因此選取身高為自變量x,體重為因變量y.3.1一1)3.11中可以看出,樣本點(diǎn)呈條狀分布,身高和體重有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程來近似刻畫它們之間的關(guān)系依據(jù)探究中的公式〔1〕和〔2),可以得到0.849,85.712.--6-于是得到回歸方程0849x85.712.172cm的女大學(xué)生,由回歸方程可以預(yù)報其體重為084917285.71260.316(kg).b0.849是斜率的估量值,說明身高x1y0.849位,這說明體重與身高具有正的線性相關(guān)關(guān)系.如何描述它們之間線性相關(guān)關(guān)系的強(qiáng)弱?在必修3系數(shù)的具體計算公式為iini1(xx)2n(yiini1(xx)2n(yy)2i ii1 i1rr>0r<0r1,說明兩個變量的線性相關(guān)性越強(qiáng);r0相關(guān)關(guān)系.通常,當(dāng)r0.75時認(rèn)為兩個變量有很強(qiáng)的線性相關(guān)關(guān)系在本例中,可以計算出r=0.798.這說明體重與身高有很強(qiáng)的線性相關(guān)關(guān)系,從而也說明我們建立的回歸模型是有意義的172cm60.316kg,但一般可以認(rèn)為她的體重接60.316kg3.1一2中的樣本點(diǎn)和回歸直線的相互位置說明白這一點(diǎn)由于全部的樣本點(diǎn)不共線,而只是散布在某一條直線的四周,所以身高和體重的關(guān)系可用下面的線性回歸模型來表示:ybxae,(3)這里a和b為模型的未知參數(shù),eybxa之間的誤差.通常e稱為隨機(jī)誤差,它的均值E(e〕=0,方差D〔e〕D(e)
2>0.這樣線性回歸模型的完整表達(dá)式為:--7-ybxae,E(e)0,D(e)2.
在線性回歸模型〔4〕中,隨機(jī)誤差e的方差護(hù)越小,通過回歸直線bxa (5)預(yù)報真實值y與真實值y之間的誤差的緣由之一,大小取決于隨機(jī)誤差的方差.另一方面,由于公式〕和〕中 和為截距和斜率的估量值,它們與真實值a和b與真實值y思考:產(chǎn)生隨機(jī)誤差項e的緣由是什么?一個人的體重值除了受身高的影響外,還受很多其他因素的影響.例如飲食習(xí)慣、是否寵愛運(yùn)動、度量誤差等.事實上,我們無法知道身高和體重之間的精準(zhǔn)關(guān)系是什么,這里只是利用線性回歸方程來近似這種關(guān)系.這種近似以及上面提到的影響因素都是產(chǎn)生隨機(jī)誤差e的緣由.由于隨機(jī)誤差是隨機(jī)變量,所以可以通過這個隨機(jī)變量的數(shù)字特征來刻畫它的一些總體特征.均值是反映隨機(jī)變量取值平均水平的數(shù)字特征,方差是反映隨機(jī)變量集中于均值程度0,因此可以用方差2來衡量隨機(jī)誤差的大?。疄榱撕饬款A(yù)報的精度,需要估量護(hù)的值.一個自然的想法是通過樣本方差來估量總體方e的樣本呢?由于模型〔3〕或〔4〕中的e隱含在預(yù)報變量y中,我們無法準(zhǔn)確地把它從y中分別出來,因此也就無法得到隨機(jī)變量e的樣本.解決問題的途徑是通過樣本的估量值來估量2〔1〕〔2可以建立回歸方程bxa,因此y是〔5〕中y的估量量.由于隨機(jī)誤差eyy,所以yy是e的估量量.對于樣本點(diǎn)〔x,y1 1
),(x,y2
),?,(x,y)n n而言,相應(yīng)于它們的隨機(jī)誤差為eyyi i
ybxi
a,i1,2,,n,其估量值為yyyi i i i
,i1,2,,n,稱為相應(yīng)于點(diǎn)(x,y)的殘差〔residual).類比樣本方差估量總體方差的思想,可以用i i i2
1
i1
i
1
Q(,)(n2)作為
2的估量量,其中和由公1)(給出〔 ,稱殘差平方residualsumofsquares).可以用2
越小,預(yù)報精度越高.在爭論兩個變量間的關(guān)系時,首先要依據(jù)散點(diǎn)圖來粗略推斷它們是否線性相關(guān),是否可,,,1 2 n殘差-6.3732.627殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382編號12345678身高/cm165165157170175165155170體重/kg4857505464614359我們可以利用圖形來分析殘差特性作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重的估量值等,這樣作出的圖形稱為殘差圖.圖3.1一3是以樣本編號為橫坐標(biāo)的殘差圖。31一3中可以看出,第1個樣本點(diǎn)和第6個樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集這兩個樣本點(diǎn)的過程中是否有人為的錯誤.假設(shè)數(shù)據(jù)采集有錯誤,就予以訂正,然后再重利用線性回歸模型擬合數(shù)據(jù);假設(shè)數(shù)據(jù)采集沒有錯誤,則需要查找其他的緣由.另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較適宜.這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報精度越高.另外,我們還可以用相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是:nR21i1ni1
(yy)2i i(yy)2i明顯,R2取值越大,意味著殘差平方和越小,也就是說模型的擬合效果越好.在線性回R2表示解釋變量對于預(yù)報變量變化的奉獻(xiàn)率.R2越接近于1,表示回歸的效果越好〔由于R2越接近于,表示解釋變量和預(yù)報變量的線性相關(guān)性越強(qiáng).假設(shè)對某組數(shù)據(jù)可能實行幾種不同的回歸方程進(jìn)展回歸分析,也可以通過比較幾個R2R2大的模型作為--9-這組數(shù)據(jù)的模型。在例1中,R2=0.64,說明“女大學(xué)生的身高解釋了64大學(xué)生的體重差異有64%是由身高引起的”用身高預(yù)報體重時,需要留意以下問題:回歸方程只適用于我們所爭論的樣本的總體.例如,不能用女大學(xué)生的身高和體重之間的回歸方程,描述女運(yùn)發(fā)動的身高和體重之間的關(guān)系.同樣,不能用生長在南方多雨地區(qū)的樹木的高與直徑之間的回歸方程,描述北方干旱地區(qū)的樹木的高與直徑之間的關(guān)系。20世紀(jì)80年月的身高體重數(shù)據(jù)所建立的回歸方程,描述現(xiàn)在的身高和體重之間的關(guān)系。樣本取值的范圍會影響回歸方程的適用范圍.例如,我們的回歸方程是由女大學(xué)生身高和體重數(shù)據(jù)建立的,那么用它來描述一個人幼兒時期的身高和體重之間的關(guān)系就不恰當(dāng)〔即在回歸方程中,解釋變量x的樣本的取值范圍為[155cm,170cm〕,而用這x-70cm時的y不能期望回歸方程得到的預(yù)報值就是預(yù)報變量的準(zhǔn)確值.事實上,它是預(yù)報變量的可能取值的平均值.一般地,建立回歸模型的根本步驟為:(1〕確定爭論對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量;(2〕畫出確定好的解釋變量和預(yù)報變量的散點(diǎn)圖,觀看它們之間的關(guān)系〔如是否存在線性關(guān)系等〕(3〕由閱歷確定回歸方程的類型〔如我們觀看到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程y=bx+a)(4〕按肯定規(guī)章估量回歸方程中的參數(shù)〔如最小二乘法〕;(5〕得出結(jié)果后分析殘差圖是否有特別〔個別數(shù)據(jù)對應(yīng)殘差過大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等等,假設(shè)存在特別,則檢查數(shù)據(jù)是否有誤,或模型是否適宜等2.現(xiàn)收集了一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x7溫度溫度C2123252729產(chǎn)卵數(shù)y/個71121246632 35115325試建立y與x之間的回歸方程;并推測溫度為2C時產(chǎn)卵數(shù)目。你所建立的模型中溫度在多大程度上解釋了產(chǎn)卵數(shù)的變化? 探究:1〔學(xué)生實施〕:選擇變量,畫散點(diǎn)圖。y=19.87x-463.73進(jìn)展回歸分析和推測:R2=≈0.864=0.746428時,產(chǎn)卵數(shù)為9274.64%產(chǎn)卵數(shù)的變化。困惑:隨著自變量的增加,因變量也隨之增加,氣溫為28時,估量產(chǎn)卵數(shù)應(yīng)當(dāng)?shù)陀?69266262:--10-找到變量t=x2,將y=bx2+a轉(zhuǎn)化成y=bt+a;利用計算器計算出yty=0.367t-202.54(3)轉(zhuǎn)換回y和x(4)y=0.367x2-202.54〔5〕R2≈0.80280.2%產(chǎn)卵數(shù)的變化。2885困惑66193:作變換z=lgy,將y c10c2x轉(zhuǎn)化成z=cx+lgc〔線性模型〕。1 2 1利用計算器計算出zxz=0.118x-1.672(3)轉(zhuǎn)換回yxy100.118x1.672(4R2≈0.98598.5%產(chǎn)卵數(shù)的變化。2842解:依據(jù)收集的數(shù)據(jù)作散點(diǎn)圖〔3.14).在散點(diǎn)圖中,樣本點(diǎn)并沒有分布在某個帶狀區(qū)域內(nèi),因此兩個變量不呈線性相關(guān)關(guān)系,所以不能直接利用線性回歸方程來建立兩個變量之間的關(guān)系.依據(jù)已有的函數(shù)學(xué)問,可以發(fā)ycec2x的四周,其中c和c
是待定參數(shù).現(xiàn)在,問題1 1 2變?yōu)槿绾喂懒看▍?shù)cc1 2
.我們可以通過對數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系.令zlny,則變換后樣本點(diǎn)應(yīng)當(dāng)分布在直線zbxa(alnc,blnc
1 1以利用線性回歸模型來建立y和x之間的非線性回歸方程了.33343.15給出了表3一43.1一5中可以看出,變換后的樣本點(diǎn)分布在一條直線的四周,因此可以用線性回歸方程來擬合.x21232527293235z1.9463.3983.0453.1784.1904.7455.784由表3一4中的數(shù)據(jù)得到線性回歸方程0.272x3.849.因此紅鈴蟲的產(chǎn)卵數(shù)對溫度的非線性回歸方程為y(1)
e0.272x3.849. (6)3.14yc3
x2c4
的四周,其中c和c3
為待定參數(shù).因此可以對溫度變量做變換,即令tx2yt回歸方程,從而得到y(tǒng)x35是紅鈴蟲的產(chǎn)卵數(shù)和對應(yīng)的溫3.16t44152962572984110241225x7112124661153253.16中可以看出,ytyc3
x2c4
來擬合y和x還可以通過殘差分析得到,下面介紹具體方法.為比較兩個不同模型的殘差,需要建立兩個相應(yīng)的回歸方程.前面我們已經(jīng)建立了yxy關(guān)于x3一5中的數(shù)據(jù),得到y(tǒng)關(guān)于t的線性回歸方程y(2)
0.367t202.543,即y關(guān)于x的二次回歸方程為y(2)
0.367x2202.543. (7)可以通過殘差來比較兩個回歸方程〔6〕和〔7〕x33中第1i行第i列的數(shù)據(jù),則回歸方程〔6〕和〔7〕的殘差計算公式分別為i
yi
(1)
ye0.272x3.849,i1,2, ,7;ii
yi
(2)
y0.367x2202.543,i1,2, ,7.i36給出了原始數(shù)據(jù)及相應(yīng)的兩個回歸方程的殘差.從表中的數(shù)據(jù)可以看出模型(6〕的殘差確實定值明顯比模型〔7〕的殘差確實定值小,因此模型〔6〕的擬合效果比模型xyxyii212325272932357112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.000-40.1.4-58.26577.968在一般狀況下,比較兩個模型的殘差比較困難.緣由是在某些樣本點(diǎn)上一個模型的殘差確實定值比另一個模型的小,而另一些樣本點(diǎn)的狀況則相反.這時可以通過比較兩個模型的殘差平方和的大小來推斷模型的擬合效果.殘差平方和越小的模型,擬合的效果越好.由表3—6簡潔算出模型〔6〕和〔7〕的殘差平方和分別為
1550.538,
15448.431.因此模型〔6〕的擬合效果遠(yuǎn)遠(yuǎn)優(yōu)于模型〔7〕.2越大,擬合的效果越好.由表3一6簡潔算出模型〔6〕和〔7〕的R2分別約為0.98和0.80〔6〕的效果好于模型〔7)對于給定的樣本點(diǎn)〔x,y1 1
),(x,y2
),?,(x,yn n
),兩個含有未知參數(shù)的模型y(1)
g(x,b),其中a和b都是未知參數(shù).可以按如下的步驟來比較它們的擬合效果:分別建立對應(yīng)于兩個模型的回歸方程y
g(x,b),,其中和分別是參數(shù)ab分別計算兩個回歸方程的殘差平方和(1)i1
(yi
(1))2 與(2)i1
(yi
(2))2;(s〕假設(shè)
,則y
f(x,)的效果比y
g(x,)的好;反之,y
f(x,)的效果不如y
g(x,)的好.例2〔提示后做練習(xí)、作業(yè)〕爭論某澆灌渠道水的流速y與水深x組數(shù)據(jù)如下:xm1.401.501.601.701.801.902.002.10流速1.701.791.881.952.032.102.162.21ym/s求yx1。95m時水的流速是多少?解:依題意,把溫度作為解釋變量x,產(chǎn)卵個數(shù)y作為預(yù)報變量,作散點(diǎn)圖,由觀看知兩個變量不呈線性相關(guān)關(guān)系。但樣本點(diǎn)分布在某一條指數(shù)函數(shù)y=cec2x1
四周.令z=lny,a=lnc1
,b=c2
則z=bx+a此時可用線性回歸來擬合 z=0.272x-3.843因此紅鈴蟲的產(chǎn)卵數(shù)對溫度的非線性回歸方程為Y=e0.272x-3.843.31Y=bx+a+e解釋變量x預(yù)報變量y隨機(jī)誤差e4〔1〕相關(guān)指數(shù):相關(guān)系數(shù)r(公式), r>0正相關(guān).R<0負(fù)相關(guān)R確定值接近于1相關(guān)性強(qiáng)接 r確定值近于0相關(guān)性幾乎無2總偏差平方和:
yy2i3
殘差i
1=y-?i i4殘差平方和
y?2i i 15回歸平方和=總偏差平方和-殘差平方和6回歸效果的相關(guān)指數(shù)R2
n1 1
y?2i in 1
yy2i7殘差分析通過殘差推斷模型擬合效果推斷原始數(shù)據(jù)是否存在可疑數(shù)據(jù)5回憶建立模型的根本步驟 ① 例2問題背景分析畫散點(diǎn)圖② 觀看散點(diǎn)圖,分析解釋變量與預(yù)報變量更可能是什么函數(shù)關(guān)系。③學(xué)生爭論后建立自己的模型④引導(dǎo)學(xué)生探究假設(shè)不是線性回歸模型如何估量參數(shù)。能否利用回歸模型通過探究體會有些不是線性的模型通過變換可以轉(zhuǎn)化為線性模型⑤對數(shù)據(jù)進(jìn)展變換后,對數(shù)據(jù)〔〕建立線性模型⑥轉(zhuǎn)化為原來的變量模型,并通過計算相關(guān)指數(shù)比較幾個不同模型的擬合效果⑦總結(jié)建模的思想。鼓舞學(xué)生大膽創(chuàng)。⑧布置1.11、61:5xy75ABCDEx8876736663y7865716461解略。練習(xí)2:某醫(yī)院用光電比色計檢驗?zāi)蚬瘯r,得尿汞含量(mg/l)與消光系數(shù)的結(jié)果如下:尿汞含量x246810消光系數(shù)y64138205285360〔1〕〔2〕R2。解:略?!踩痴n堂小結(jié)1.學(xué)問梳理:2〔〕〔〕〔〕4〕樣本指數(shù);〔5〕建立回歸模型的根本步驟。〔四〕作業(yè):〔五〕課后反思:本節(jié)內(nèi)容對回歸分析的探討過程很精彩,學(xué)生爭論很喧鬧,激發(fā)了學(xué)生的學(xué)習(xí)熱忱。但對殘差分析學(xué)生只能賞識它的過程,計算量太大,思維的跳動性太強(qiáng)!獨(dú)立性檢驗的根本思想及其初步應(yīng)用〔3〕授課類型:授課一、教學(xué)內(nèi)容與教學(xué)對象分析通過典型案例,學(xué)習(xí)以下一些常用的統(tǒng)計方法,并能初步應(yīng)用這些方法解決一些實際問題。① 通過對典型案例〔如“患肺癌與吸煙有關(guān)嗎”等〕的探究。了解獨(dú)立性檢驗〔只要2×2〕的根本思想、方法及初步應(yīng)用。② 通過對典型案例〔如“人的體重與身高的關(guān)系”等〕的探究,了解回歸的根本思想、方法及其初步應(yīng)用。二.學(xué)習(xí)目標(biāo)1、學(xué)問與技能通過本節(jié)學(xué)問的學(xué)習(xí),了解獨(dú)立性檢驗的根本思想和初步應(yīng)用,能對兩個分類變量是否有關(guān)做出明確的推斷。明確對兩個分類變量的獨(dú)立性檢驗的根本思想具體步驟,會對具體問題作出獨(dú)立性檢驗。2、過程與方法在本節(jié)學(xué)問的學(xué)習(xí)中,應(yīng)使學(xué)生從具體問題中生疏進(jìn)展獨(dú)立性檢驗的作用及必要性,樹立學(xué)好本節(jié)學(xué)問的信念,在此根底上學(xué)習(xí)三維柱形圖和二維柱形圖,并生疏它們的根本作用和存K的平方的計算公式和K的平方的觀測值R“XY來考察兩個分類變量是否有關(guān)系,并能較準(zhǔn)確地給出這種推斷的牢靠程度的具體做法和可信程度的大小。最終介紹了獨(dú)立性檢驗思想的綜合運(yùn)用。3、情感、態(tài)度與價值觀通過本節(jié)學(xué)問的學(xué)習(xí),首先讓學(xué)生了解對兩個分類博變量進(jìn)展獨(dú)立性檢驗的必要性和作用,并引導(dǎo)學(xué)生留意比較與觀測值之間的聯(lián)系與區(qū)分,從而引導(dǎo)學(xué)生去探究學(xué)問,培育學(xué)生全面的觀點(diǎn)和辨證地分析問題,不為假想所迷惑,尋求問題的內(nèi)在聯(lián)系,培育學(xué)生學(xué)習(xí)數(shù)學(xué)、應(yīng)用數(shù)學(xué)的良好的數(shù)學(xué)品質(zhì)。加強(qiáng)與現(xiàn)實生活相聯(lián)系,從對實際問題的分析中學(xué)會利用圖形分析、解決問題及用具體的數(shù)量來衡量兩個變量之間的聯(lián)系,學(xué)習(xí)用圖形、數(shù)據(jù)來正確描述兩個變量的關(guān)系。明確數(shù)學(xué)在現(xiàn)實生活中的重要作用和實際價值。教學(xué)中,應(yīng)多給學(xué)生供給自主學(xué)習(xí)、獨(dú)立探究、合作溝通的時機(jī)。養(yǎng)成嚴(yán)謹(jǐn)?shù)膶W(xué)習(xí)態(tài)度及實事求是的分析問題、解決問題的科學(xué)世界觀,并會用所學(xué)到的學(xué)問來解決實際問題。三.教學(xué)重點(diǎn)、難點(diǎn)教學(xué)重點(diǎn):理解獨(dú)立性檢驗的根本思想;獨(dú)立性檢驗的步驟。教學(xué)難點(diǎn);1、理解獨(dú)立性檢驗的根本思想;2、了解隨機(jī)變量K2的含義;3、獨(dú)立性檢驗的步驟。四、教學(xué)策略教學(xué)方法:誘思探究教學(xué)法學(xué)習(xí)方法:自主探究、觀看覺察、合作溝通、歸納總結(jié)。教學(xué)手段:多媒體關(guān)心教學(xué)五、教學(xué)過程:對于性別變量,其取值為男和女兩種.這種變量的不同“值”表示個體所屬的不同類別,像這類變量稱為分類變量.在現(xiàn)實生活中,分類變量是大量存在的,例如是否吸煙,宗教信仰,國籍,等等.在日常生活中,我們常常關(guān)心兩個分類變量之間是否有關(guān)系.例如,吸煙與患肺癌是否有關(guān)系?性別對于是否寵愛數(shù)學(xué)課程有影響?等等.為調(diào)查吸煙是否對肺癌有影響,某腫瘤爭論所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果〔單位:人〕3-7吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965那么吸煙是否對患肺癌有影響嗎?37這樣列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表.由吸煙狀況和患肺癌狀況的列聯(lián)表可以粗略估量出:在不吸煙者中,有0.54%患有肺癌;在吸煙者中,有2.28%患有肺癌.因此,直觀上可以得到結(jié)論:吸煙者和不吸煙者患肺癌的可能性存在差異.3.2一1是列聯(lián)表的三維柱形圖,從中能清楚地看出各個頻數(shù)的相對大小.3.22是疊在一起的二維條形圖,其中淺色條高表示不患肺癌的人數(shù),深色條高表示患肺癌的人數(shù).從圖中可以看出,吸煙者中患肺癌的比例高于不吸煙者中患肺癌的比例.為了更清楚地表達(dá)這個特征,我們還可用如下的等高條形圖表示兩種狀況下患肺癌的比3.23所示,在等高條形圖中,淺色的條高表示不患肺癌的百分比;深色的條高表示患肺癌的百分比.通過分析數(shù)據(jù)和圖形,我們得到的直觀印象是“吸煙和患肺癌有關(guān)以肯定的把握認(rèn)為“吸煙與患肺癌有關(guān)”呢?為了答復(fù)上述問題,我們先假設(shè)HAB0H0
等價于PAB〕=P(A〕+P(B).373-8吸煙與肺癌列聯(lián)表不患肺癌患肺癌不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d38a恰好為大事ABa+ba+cAB頻數(shù).由于頻率近似于概率,所以在H0
成立的條件下應(yīng)當(dāng)有aabac,n n n其中nabcd為樣本容量,(a+b+c+d)≈(a+b)(a+c),ad≈bc.因此,|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強(qiáng).為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上面的分析,我們構(gòu)造一個隨機(jī)變量nadbc2
abcdacbd (1)其中nabcd為樣本容量.假設(shè)H成立,即“吸煙與患肺癌沒有關(guān)系K“應(yīng)當(dāng)很?。罁?jù)表3一7中的數(shù)據(jù),0利用公式〔1〕計算得到K“的觀測值為9965777549429K278172148987491這個值到底能告知我們什么呢?
56.632,統(tǒng)計學(xué)家經(jīng)過爭論后覺察,在H0
成立的狀況下,P(K26.635)0.01. (2)(2〕式說明,在H0
K2的觀測值超過6.635001,是一個小概率大事.現(xiàn)在K2的觀測值k≈56.6326.635,所以有理由斷定H0.01,0即我們有99%的把握認(rèn)為“吸煙與患肺癌有關(guān)系”K2的觀測值k建立了一個推斷H0
是否成立的規(guī)則:假設(shè)k≥6.635,就推斷H0
不成立,即認(rèn)為吸煙與患肺癌有關(guān)系;否則,就推斷H0
成立,即認(rèn)為吸煙與患肺癌沒有關(guān)系在該規(guī)章下,把結(jié)論“H成立”錯判成“H不成立”的概率不會超過0 0P(K26.635)0.01,即有99%的把握認(rèn)為從不成立.上面解決問題的想法類似于反證法.要確認(rèn)是否能以給定的可信程度認(rèn)為“兩個分類變H0K2K2的觀測值kH不成立,即在肯定可信程度上認(rèn)為“兩個分類變量0k的值很小,則說明由樣本觀測數(shù)據(jù)沒有覺察反對H的充分證據(jù)0K2的觀測值k是大還是小呢?這僅需確定一個正數(shù)k0
kk0
時就認(rèn)為K2的觀測值kk0
的推斷規(guī)章為:假設(shè)kk0關(guān)系”.
,就認(rèn)為“兩個分類變量之間有關(guān)系k0
為一個推斷規(guī)章的臨界值.依據(jù)上述規(guī)章,把“兩個分類變量之間沒有關(guān)系”錯誤地推斷為“兩個分類變量之間有關(guān)系”的概率為P(K2
k).0kk0
解釋為有(1P(K2
k100%的把握認(rèn)為“兩個分類0--19-kk0
解釋為不能以(1P(K2
k100%的把握認(rèn)為“兩個分類變0這種利用隨機(jī)變量K2來確定是否能以肯定把握認(rèn)為“兩個分類變量有關(guān)系”的方法,稱為兩個分類變量的獨(dú)立性檢驗利用上面結(jié)論,你能從列表的三維柱形圖中看出兩個變量是否相關(guān)嗎?一般地,假設(shè)有兩個分類變量XY,它們的可能取值分別為{x,x1 2
}和{y,y1 2
}y1y2總計x1ababy1y2總計x1ababx2cdcdabcd假設(shè)要推斷的論述為H:XYl可以按如下步驟推斷結(jié)論H成立的可能性:l通過三維柱形圖和二維條形圖,可以粗略地推斷兩個分類變量是否有關(guān)系,但是這種推斷無法準(zhǔn)確地給出所得結(jié)論的牢靠程度.①在三維柱形圖中,主對角線上兩個柱形高度的乘積ad與副對角線上的兩個柱形高度的乘積bcH1②在二維條形圖中,可以估量滿足條件X=x1
的個體中具有Y=y1
的個體所占的比例a X=x的個體中具有Y=y,的個體所占的比例c
.“兩個比例ab 2 2 cd的值相差越大,H成立的可能性就越大.l可以利用獨(dú)立性檢驗來考察兩個分類變量是否有關(guān)系,并且能較準(zhǔn)確地給出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年沈陽地鐵集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 2024年餐飲店轉(zhuǎn)讓合同協(xié)議樣本
- 二零二五年度自愿離婚協(xié)議書-2025版婚姻解除合同2篇
- 2024版公寓布草采購合同3篇
- 2024版材料開口合同范本
- 二零二五年度旅游餐飲廣告發(fā)布與地方特色推廣合同3篇
- 二零二五年度白酒團(tuán)購市場推廣合同3篇
- 二零二五年度智能房產(chǎn)過戶合同示范文本3篇
- 感染科醫(yī)生崗位工作總結(jié)
- 家居建材行業(yè)客服工作總結(jié)
- 廣東大灣區(qū)2024-2025學(xué)年度高一上學(xué)期期末統(tǒng)一測試英語試題(無答案)
- 2024-2025學(xué)年遼寧省沈陽市高一上學(xué)期1月期末質(zhì)量監(jiān)測數(shù)學(xué)試題(含解析)
- 物理(四川)-【八省聯(lián)考】河南、山西、陜西、內(nèi)蒙古、四川、云南、寧夏、青海八省2025年高考綜合改革適應(yīng)性演練聯(lián)考試題和答案
- 《少兒主持人》課件
- 北京市朝陽區(qū)2024-2025學(xué)年高二上學(xué)期期末考試生物試卷(含答案)
- 2025年西藏拉薩市柳梧新區(qū)城市投資建設(shè)發(fā)展集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- DB51T 1069-2010 四川泡菜生產(chǎn)規(guī)范
- 斷絕關(guān)系協(xié)議書
- 2023-建筑施工技02課件講解
- 2025年部編版一年級語文上冊期末復(fù)習(xí)計劃
- 2024高考物理一輪復(fù)習(xí):觀察電容器的充、放電現(xiàn)象(練習(xí))(學(xué)生版+解析)
評論
0/150
提交評論