版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
相關(guān)分析和回歸分析一、相關(guān)分析(一)相關(guān)的概念兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系稱為相關(guān)關(guān)系。兩個(gè)變量之間的變化關(guān)系,既表現(xiàn)在變化方向上,又表現(xiàn)在密切程度上。(二)相關(guān)的種類1、從變化方向上劃分正相關(guān):一個(gè)變量增大,另一個(gè)變量對(duì)應(yīng)值也隨之增大;或另一個(gè)變量值減小,另一個(gè)變量對(duì)應(yīng)值也隨之減小,兩列變量變化方向相同。負(fù)相關(guān):一個(gè)變量增大,另一個(gè)變量對(duì)應(yīng)值也隨之減少;或一個(gè)變量值減小,另一個(gè)變量對(duì)應(yīng)值也隨之增大,兩列變量變化方向相反。零相關(guān):兩變量值的變化方向無(wú)規(guī)律。2、從變量相互關(guān)系的程度上劃分無(wú)論兩個(gè)變量的變化方向是否一致,凡密切程度高的稱為強(qiáng)相關(guān)或高度相關(guān);密切程度一般的稱為中度相關(guān);密切程度弱的稱為弱相關(guān)或低度相關(guān)。(三)相關(guān)散布圖它是表示兩種事物之間的相關(guān)性及聯(lián)系的模式。以直角坐標(biāo)的橫軸表示x列變量,縱軸表示y列變量,在相關(guān)的兩變量對(duì)應(yīng)值的垂直相交處畫點(diǎn),構(gòu)成相關(guān)散布圖。相關(guān)散布圖的用途:圖5-2(b)直線相關(guān)圖5-2(a)曲線相關(guān)1、判斷相關(guān)是否直線式圖5-2(b)直線相關(guān)圖5-2(a)曲線相關(guān)圖5-3b低度相關(guān)圖5-3(a)高度相關(guān)2、判斷相關(guān)密切程度高低圖5-3b低度相關(guān)圖5-3(a)高度相關(guān)圖5-4(a)正相關(guān)3、判斷相關(guān)變化方向圖5-4(a)正相關(guān)圖5-4(b)負(fù)相關(guān)圖5-4(b)負(fù)相關(guān)(四)相關(guān)系數(shù)用來(lái)描述兩個(gè)變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù)。一般用r表示。注:(1)相關(guān)系數(shù)的數(shù)值范圍是。(2)從r的正負(fù)以及絕對(duì)值的大小,可以表明兩個(gè)變量之間變化的方向及密切程度?!?”、“—”號(hào)表示變化方向(“+”號(hào)表示變化方向一致,即正相關(guān);“—”號(hào)表示變化方向相反,即負(fù)相關(guān))r的絕對(duì)值表示兩變量之間的密切程度(即強(qiáng)度)。絕對(duì)值越接近1,表示兩個(gè)變量之間關(guān)系越密切;越接近0,表示兩個(gè)變量之間關(guān)系越不密切。(3)相關(guān)系數(shù)只能描述兩個(gè)變量之間的變化方向及密切程度,并不能揭示兩者之間的內(nèi)在本質(zhì)聯(lián)系。另外若兩變量相關(guān)系數(shù)為0,只能表示兩變量間沒(méi)有線性關(guān)系,也可能存在曲線關(guān)系,即r=0,并不意味著兩變量是獨(dú)立的。(五)積差相關(guān)1.積差相關(guān)的概念當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,且兩者之間呈線性關(guān)系時(shí),表示這兩個(gè)變量之間的相關(guān)稱為積差相關(guān)。2.積差相關(guān)的適用條件(1)兩變量均應(yīng)由測(cè)量得到的連續(xù)性數(shù)據(jù)(量—量數(shù)據(jù))。兩個(gè)變量的總體都呈是正態(tài)分布,或接近正態(tài)的單峰對(duì)稱分布。3.積差相關(guān)系數(shù)的定義公式積差相關(guān)系數(shù)就是兩個(gè)變量標(biāo)準(zhǔn)分?jǐn)?shù)乘積之和除以n所得之商。用公式可表示為:在此:表示X變量的樣本標(biāo)準(zhǔn)差,表示Y變量的樣本標(biāo)準(zhǔn)差。(六)相關(guān)系數(shù)的顯著性檢驗(yàn)1.:條件下,相關(guān)系數(shù)的顯著性檢驗(yàn)對(duì)于總體相關(guān)系數(shù)的零假設(shè)進(jìn)行顯著性檢驗(yàn)時(shí),又分為兩種情況:(1)當(dāng)?shù)那闆r當(dāng)時(shí),r的抽樣分布接近于正態(tài)分布,其檢驗(yàn)的統(tǒng)計(jì)量為:在此r表示兩個(gè)變量的積差相關(guān)系數(shù)n表示樣本的容量(2)當(dāng)?shù)那闆r當(dāng)時(shí),關(guān)于的零假設(shè),可以用t統(tǒng)計(jì)量來(lái)檢驗(yàn)相關(guān)系數(shù)的顯著性。在此r表示兩個(gè)變量的積差相關(guān)系數(shù)n表示樣本的容量例2.從高一學(xué)生中隨機(jī)抽取26名學(xué)生,其數(shù)學(xué)與英語(yǔ)考試成績(jī)的積差相關(guān)系數(shù)為0.65,試問(wèn)從總體上講,數(shù)學(xué)與英語(yǔ)考試成績(jī)是否相關(guān)?解:(1)提出假設(shè):(2)選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算其值由于假設(shè),樣本相關(guān)系數(shù)的標(biāo)準(zhǔn)記分呈t分布,故選擇t作為檢驗(yàn)統(tǒng)計(jì)量,將r=0.65,n=26代入公式,則(3)確定檢驗(yàn)的形式:雙側(cè)檢驗(yàn)(4)統(tǒng)計(jì)決斷根據(jù)df=n-2=26-2=24,查t值表得,。由于實(shí)際的。根據(jù)統(tǒng)計(jì)決斷規(guī)則,在0.01的顯著性水平上拒絕原假設(shè)。結(jié)論:從總體上看:高一學(xué)生數(shù)學(xué)與英語(yǔ)考試成績(jī)呈正相關(guān)。 2.:()條件下,相關(guān)系數(shù)的顯著性檢驗(yàn)檢驗(yàn)步驟:(1)提出假設(shè)(2)查r與的轉(zhuǎn)換表將r轉(zhuǎn)換成,轉(zhuǎn)換成(3)選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算其值由于的抽樣分布呈正態(tài)分布,則檢驗(yàn)統(tǒng)計(jì)量為在這里表示的標(biāo)準(zhǔn)誤,其中n代表樣本容量(4)、確定檢驗(yàn)的形式(5)、統(tǒng)計(jì)決斷例3,26名高一學(xué)生的數(shù)學(xué)與英語(yǔ)考試成績(jī)的積差相關(guān)系數(shù)為0.65是否來(lái)自于相關(guān)系數(shù)等于0.5的總體?解:提出假設(shè),進(jìn)行r與的轉(zhuǎn)換:查r與轉(zhuǎn)換表得,與r=0.65相對(duì)應(yīng)的=0.775,與相對(duì)應(yīng)的。選擇統(tǒng)計(jì)量并計(jì)算—由于的抽樣分布呈正態(tài)分布,故選擇Z作為統(tǒng)計(jì)量,將上述數(shù)據(jù)代入公式: 統(tǒng)計(jì)決斷:由于實(shí)際算出的|Z|=1.08<1.96=,根據(jù)雙側(cè)Z檢驗(yàn)統(tǒng)計(jì)決斷規(guī)則,則P>0.05。于是,只得保留原假設(shè)。結(jié)論是:在0.05的顯著性水平上可以認(rèn)為,高一學(xué)生數(shù)學(xué)與英語(yǔ)考試成績(jī)總體相關(guān)系數(shù)一致,來(lái)源于總體。(七)其他相關(guān)系數(shù)1.等級(jí)相關(guān)系數(shù)等級(jí)相關(guān)是指以等級(jí)次序排列或以等級(jí)次序表示的變量之間的相關(guān)。我們主要介紹斯皮爾曼等級(jí)相關(guān)。(1)斯皮爾曼等級(jí)相關(guān)的概念及適用條件兩變量是等級(jí)測(cè)量數(shù)據(jù),且總體不一定呈正態(tài)分布,樣本容量也不一定大于30,這樣兩變量的相關(guān),稱為斯皮爾曼等級(jí)相關(guān)。適用條件:①兩變量的資料為等級(jí)測(cè)量數(shù)據(jù),且具有線性關(guān)系。②對(duì)于粗略估計(jì)到的連續(xù)變量的測(cè)量數(shù)據(jù),按其大小排成等級(jí),亦可用等級(jí)相關(guān)計(jì)算。③不要求總體呈正態(tài)分布。(2)相關(guān)系數(shù)的計(jì)算計(jì)算等級(jí)相關(guān)系數(shù)的公式為:在這里表示等級(jí)相關(guān)系數(shù)D表示兩個(gè)變量每對(duì)數(shù)據(jù)等級(jí)(不是指原始的等級(jí))之差n表示樣本的容量注:若出現(xiàn)相同的等級(jí)分?jǐn)?shù)時(shí),可用它們所占等級(jí)位置的平均數(shù)作為它們的等級(jí)。如下例,X列中90分有兩個(gè),且所占等級(jí)位置分別為3、4,故取它們的平均值(3+4)/2=3.5。例4,某校為了研究學(xué)生自學(xué)能力與學(xué)業(yè)成績(jī)之間的關(guān)系,隨機(jī)抽取10名學(xué)生的自學(xué)能力和學(xué)科成績(jī),見(jiàn)下表,求其相關(guān)系數(shù)。序號(hào)X(能力)等級(jí)Y(成績(jī))等級(jí)D 1903.5884-10.25285780611370108064164857798-115903.5952.51168097010-117857759-2481001981009875806-1110922922.5-10.25 25.5解:即學(xué)生的自學(xué)能力與學(xué)習(xí)成績(jī)的相關(guān)程度是0.852.點(diǎn)二列相關(guān)(質(zhì)—量相關(guān))(1)概念及適用條件兩列變量一列是正態(tài)連續(xù)變量,另一列是二分變量,描述這兩個(gè)變量之間的相關(guān),稱為點(diǎn)二列相關(guān)。適用條件:一列是正態(tài)連續(xù)變量,另一列是二分變量(如男與女,對(duì)與錯(cuò)等)。(2)相關(guān)系數(shù)的計(jì)算在此p為二分變量中某一項(xiàng)所占比例q為二分變量中另一項(xiàng)所占比例為二分變量中比例為p部分所對(duì)應(yīng)的連續(xù)變量的平均數(shù)為二分變量中比例為q部分所對(duì)應(yīng)的連續(xù)變量的平均數(shù)為連續(xù)變量的標(biāo)準(zhǔn)差另一種表示形式為:在這里表示連續(xù)變量中所有分?jǐn)?shù)的平均數(shù)(八)相關(guān)分析小結(jié)一、如何判斷兩個(gè)變量的相關(guān)性——步驟(1)找出兩個(gè)變量的正確相應(yīng)數(shù)據(jù);(2)畫出它們的散布圖(散點(diǎn)圖);(3)通過(guò)散布圖判斷它們的相關(guān)性;(4)給出相關(guān)系數(shù)的解答;(5)對(duì)結(jié)果進(jìn)行評(píng)價(jià)和顯著性檢驗(yàn)。二、知識(shí)結(jié)構(gòu)一覽表 相關(guān)類型相關(guān)系數(shù)水平顯著性檢驗(yàn)適用條件統(tǒng)計(jì)量檢驗(yàn)類備注量-量相關(guān)積差相關(guān)系數(shù)r=(n<50)T檢驗(yàn)小樣本(n>50)Z檢驗(yàn)大樣本,近似于正態(tài)分:Z檢驗(yàn)近似于正態(tài)分質(zhì)-質(zhì)相關(guān)等級(jí)相關(guān)系數(shù)兩類都是等級(jí)變量T檢驗(yàn)非正態(tài)分布質(zhì)-量相關(guān)點(diǎn)二列相一列是正態(tài)變量一列是二分變量采用積差相關(guān)系數(shù)的檢驗(yàn)方法同上同上查表法——df=n-2,找到相關(guān)系數(shù)的臨界值,將計(jì)算所得的值與臨界值進(jìn)行比較,若小于臨界值,保留原假設(shè),否則,拒絕。。T檢驗(yàn)非正態(tài)分布二、回歸分析相關(guān)表示兩個(gè)變量之間的雙向相互的關(guān)系。如果我們將存在相關(guān)的兩個(gè)變量,一個(gè)作為自變量,另一個(gè)作為因變量,并把兩者之間不十分準(zhǔn)確、穩(wěn)定的關(guān)系,用數(shù)學(xué)方程式來(lái)表達(dá),則可利用該方程由自變量的值來(lái)估計(jì)、預(yù)測(cè)因變量的估計(jì)值,這一過(guò)程稱為回歸分析??梢?jiàn),回歸表示一個(gè)變量隨另一個(gè)變量作不同程度變化的單向關(guān)系?;貧w分析的目的在于了解兩個(gè)或多個(gè)變量間是否相關(guān)、相關(guān)方向與強(qiáng)度,并建立數(shù)學(xué)模型以便觀察特定變量來(lái)預(yù)測(cè)研究者感興趣的變量。在教育研究中,不少變量之間存在一定的關(guān)系,但是由于關(guān)系比較復(fù)雜,而且受偶然因素影響較大,兩者只是一種不十分確定的回歸關(guān)系。如果散點(diǎn)的分布有明確的直線趨勢(shì),我們就可以配制一條最能代表散點(diǎn)圖上分布趨勢(shì)的直線,這條最優(yōu)擬合線即稱為回歸線。確定回歸線的方程稱為回歸方程。(一)一元線性回歸方程的建立一元線性回歸方程的通式為,式中a是回歸線在Y軸上的截距;b是回歸線的斜率,稱為回歸系數(shù)。如何求a、b?方法一:用最小二乘法確定a、b:我們構(gòu)造一元線性回歸方程,用來(lái)估計(jì)實(shí)際值y,要使這樣估計(jì)獲得最好的效果。那么,a、b的值應(yīng)該使的值最小,由于用計(jì)算,有正有負(fù),總體上看趨向于0。因此,在計(jì)算時(shí),我們對(duì)其取平方值,用,求a、b,使得最小。因此,構(gòu)造一個(gè)新的函數(shù),令求出Q(a,b)的最小值點(diǎn)——根據(jù)微積分求極值原理:(2)(1)(2)(1)將代入(2)中運(yùn)用最小二乘法,確定回歸方程:方法二:在r(相關(guān)系數(shù))已知的情況下,可以代入以下公式::Y的標(biāo)準(zhǔn)差:X的標(biāo)準(zhǔn)差一元線性回歸方程的檢驗(yàn)用回歸系數(shù)檢驗(yàn)回歸方程的顯著性模型:首先,提出原假設(shè)和備擇假設(shè):其次,確定并計(jì)算統(tǒng)計(jì)量:最后,統(tǒng)計(jì)決斷:查自由度為n-2的t值分布表,若,拒絕原假設(shè),認(rèn)為X對(duì)Y有顯著影響。 2、用積差相關(guān)系數(shù)檢驗(yàn)回歸方程的顯著性采用統(tǒng)計(jì)量:(同積差相關(guān)系數(shù)顯著性檢驗(yàn))3、用方差分析檢驗(yàn)回歸方程的顯著性回歸平方和所占比重越大,誤差平方和所占比重就越小,意味著變量間線性關(guān)系就越顯著。所以,回歸方程的顯著性,可以采用回歸平方和的分析來(lái)進(jìn)行??偲椒胶?回歸平方和+誤差平方和方差分析檢驗(yàn)的過(guò)程1.提出假設(shè):2.采用統(tǒng)計(jì)量:注:F= 3.查表并作統(tǒng)計(jì)推斷:當(dāng)F<,接受,不存在顯著關(guān)系;當(dāng),在0.05水平上拒絕原假設(shè);當(dāng),在0.01水平上拒絕原假設(shè)。 15名學(xué)生的數(shù)學(xué)分?jǐn)?shù)與物理分?jǐn)?shù)計(jì)算表序號(hào) 13132-1.40-6.731.9645.299.422238-9.40-30.7388.36944.33288.86340697.6030.2757.76916.27230.0541921-13.40-17.73179.56314.35273.585606627.6027.27761.76743.65752.6561541-17.402.27302.765.15-39.507465713.6018.27184.96333.79248.478267-6.40-31.7340.961006.79203.0793257-0.4018.270.16333.79-7.31103037-2.40-173.005.762.994.1511586825.6029.27655.36856.73749.31122827-4.40-11.7319.36137.5951.61132241-10.402.27108.165.19-23.61142321-9.40-18.7388.36305.81176.601533300.60-8.730.3676.21-5.24總和4865816072.932875.60平均32.438.73例5,對(duì)建立的數(shù)學(xué)分?jǐn)?shù)預(yù)測(cè)物理分?jǐn)?shù)的回歸方程進(jìn)行顯著性檢驗(yàn)。解:提出假設(shè):(1)用回歸系數(shù)檢驗(yàn)回歸方程的顯著性由表11.1中的結(jié)果得:由表中數(shù)據(jù),計(jì)算帶入查表得,結(jié)論:在0.01的顯著性水平上拒絕,其回歸方程是顯著的。(2)用積差相關(guān)系數(shù)檢驗(yàn)回歸方程的顯著性由于N<50,采用統(tǒng)計(jì)量查表得所以,在0.01的顯著性水平上拒絕原假設(shè),認(rèn)為回歸方程是顯著的。(3)用方差分析檢驗(yàn)回歸方程的顯著性由于查表得,因?yàn)樗?,?.01水平上拒絕原假設(shè),認(rèn)為兩個(gè)變量間回歸關(guān)系極其顯著。綜上所述:三種檢驗(yàn)方法得到的結(jié)果是相同的,可見(jiàn),三種檢驗(yàn)具有等效性。參考文獻(xiàn)【1】《教育統(tǒng)計(jì)與測(cè)量評(píng)價(jià)新編教程》【M】黃光揚(yáng),原霞,華東師范大學(xué)出版社【2】《教育統(tǒng)計(jì)學(xué)》第4版【M】王孝玲,華東師范大學(xué)出版社【3】《教育統(tǒng)計(jì)與測(cè)量導(dǎo)論》【M】劉新平,劉存?zhèn)b,科學(xué)出版社【4】《教育統(tǒng)計(jì)學(xué)—思想、方法與應(yīng)用》第2版【M】徐文彬,南京師范大學(xué)文獻(xiàn)使用情況:相關(guān)分析主要借鑒的是王孝玲的《教育統(tǒng)計(jì)學(xué)》。例如相關(guān)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度環(huán)保型離婚協(xié)議書格式與實(shí)施指南2篇
- 二零二五年度城市綠化工程設(shè)計(jì)承包合同3篇
- 二零二五年度個(gè)人電子競(jìng)技賽事參賽協(xié)議4篇
- 稅務(wù)工作新思路探討
- 2025版汽車零部件退貨及換貨服務(wù)協(xié)議書3篇
- 二零二五年度個(gè)人住房公積金貸款合同爭(zhēng)議解決流程合同模板4篇
- 二零二五年度個(gè)人自用房屋全屋定制裝修服務(wù)合同
- 二零二五年度企業(yè)銷售合同發(fā)票管理標(biāo)準(zhǔn)化臺(tái)賬
- 二零二五年度個(gè)人反擔(dān)保債務(wù)清償協(xié)議3篇
- 生產(chǎn)與運(yùn)作管理-第5版 課件全套 陳志祥 第1-14章 生產(chǎn)系統(tǒng)與生產(chǎn)運(yùn)作管理概述 -豐田生產(chǎn)方式與精益生產(chǎn)
- 語(yǔ)言學(xué)概論全套教學(xué)課件
- 大數(shù)據(jù)與人工智能概論
- 《史記》上冊(cè)注音版
- 2018年湖北省武漢市中考數(shù)學(xué)試卷含解析
- 測(cè)繪工程產(chǎn)品價(jià)格表匯編
- 《腎臟的結(jié)構(gòu)和功能》課件
- 裝飾圖案設(shè)計(jì)-裝飾圖案的形式課件
- 護(hù)理學(xué)基礎(chǔ)教案導(dǎo)尿術(shù)catheterization
- ICU護(hù)理工作流程
- 天津市新版就業(yè)、勞動(dòng)合同登記名冊(cè)
- 廣東版高中信息技術(shù)教案(全套)
評(píng)論
0/150
提交評(píng)論