spss假設(shè)檢驗(yàn)

上傳人：0*** IP屬地：湖北上傳時(shí)間：2022-05-09 格式：PPT 頁(yè)數(shù)：27 大?。?53.01KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩22頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第七章假設(shè)檢驗(yàn)n第一節(jié) 引言n第二節(jié) 實(shí)驗(yàn)研究 n第三節(jié) 假設(shè) 一、假設(shè)的特征二、假設(shè)的種類n第四節(jié) 假設(shè)檢驗(yàn) 一、假設(shè)檢驗(yàn)證實(shí)與證偽二、顯著水平三、顯著性檢驗(yàn)中的兩類錯(cuò)誤四、檢驗(yàn)統(tǒng)計(jì)值與臨界值五、單尾與雙尾檢驗(yàn)第一節(jié) 引言假設(shè)檢驗(yàn)是推斷統(tǒng)計(jì)的最重要的一個(gè)部分。語(yǔ)言研究經(jīng)常要涉及統(tǒng)計(jì)值之間的差異問(wèn)題，即在比較兩個(gè)樣本統(tǒng)計(jì)量（比如平均數(shù)、相關(guān)系數(shù)等）或者樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)之間的差異的基礎(chǔ)上，推斷總體參數(shù)之間是否確實(shí)存在差異。簡(jiǎn)單來(lái)說(shuō)，我們先對(duì)兩個(gè) （或多個(gè)）異提出一個(gè)假設(shè)，然后在樣本統(tǒng)計(jì)量的基礎(chǔ)上，運(yùn)用適當(dāng)?shù)慕y(tǒng)計(jì)手段對(duì)該假設(shè)進(jìn)行檢驗(yàn)，就可以發(fā)現(xiàn)在多大程度上（或有多大的可

2、能性）兩者之間的差異是真正存在的。第二節(jié)實(shí)驗(yàn)研究實(shí)驗(yàn)研究實(shí)質(zhì)上是一個(gè)假設(shè)檢驗(yàn)的過(guò)程，一般來(lái)說(shuō)，有以下幾個(gè)步驟：（1）首先對(duì)研究結(jié)果作出預(yù)測(cè)或提出假設(shè)：如果X出現(xiàn)，那么 Y 將會(huì)隨之出現(xiàn)。假設(shè)不能憑空而來(lái)，而是要有一定的依據(jù)，譬如已有的理論或研究結(jié)果等。（2）操縱某一或某些因素，以創(chuàng)造使Y出現(xiàn)的條件X。所操縱的因素就是我們要研究的變量。與此同時(shí)，要盡量控制所有其它變量，如果不加以嚴(yán)格的控制，就有可能使研究結(jié)果模糊不清。（3）觀察預(yù)期出現(xiàn)的結(jié)果是否出現(xiàn)了。這一階段就要用到統(tǒng)計(jì)分析（例如進(jìn)行各種假設(shè)檢驗(yàn)）。（4）得出結(jié)論。一個(gè)實(shí)驗(yàn)研究的結(jié)果會(huì)有以下幾種可能：一是預(yù)期中的Y明確無(wú)誤地出現(xiàn)了

3、，意味著所提出的假設(shè)（及其所基于的理論等）得到了證實(shí)；二是Y沒(méi)有出現(xiàn)，這說(shuō)明假設(shè)及其所基于的理論被推翻了，或至少被部分地推翻了；三是結(jié)果模糊，無(wú)法解釋，因而不能得出任何結(jié)論。至于假設(shè)是否被推翻或得到了證實(shí)，其實(shí)往往難以下一個(gè)絕對(duì)的結(jié)論，因?yàn)槲覀儫o(wú)法保證在整個(gè)實(shí)驗(yàn)過(guò)程中把所有可能影響實(shí)驗(yàn)結(jié)果的潛在因素都排除掉或控制住了。因此實(shí)驗(yàn)研究的過(guò)程是先提出假設(shè)，然后再根據(jù)觀測(cè)資料或數(shù)據(jù)來(lái)檢驗(yàn)假設(shè)的可能性或正確性。例如，根據(jù)圖式理論（schematic theory)，閱讀者對(duì)閱讀材料的熟悉程度（或者是否具備理解閱讀材料所需的背景知識(shí)）可能會(huì)影響閱讀的質(zhì)量（即理解程度），據(jù)此，我們可以提出如下

4、假設(shè)：熟悉材料的閱讀質(zhì)量要高于生疏材料的閱讀質(zhì)量。我們可以用實(shí)驗(yàn)的方法來(lái)檢驗(yàn)這一假設(shè)。在此過(guò)程中，需要控制的因素是非常多的，例如被試的年齡、智商、受教育情況、母語(yǔ)閱讀能力、外語(yǔ)的語(yǔ)言水平、閱讀材料的語(yǔ)言難度等等，我們可以通過(guò)隨機(jī)抽樣、隨機(jī)分組、增大樣本容量等措施（有關(guān)隨機(jī)抽樣、樣本容量等概念參見(jiàn)有關(guān)章節(jié)）來(lái)控制與被試有關(guān)的變量，用改寫(xiě)的方法來(lái)控制閱讀材料的語(yǔ)言難度（使兩類材料在語(yǔ)言本身的難度上具有可比性）等等。對(duì)于實(shí)驗(yàn)研究特別需要注意的問(wèn)題是：提出的假設(shè)是否得當(dāng)；對(duì)統(tǒng)計(jì)檢驗(yàn)是否科學(xué)。變量的操縱與控制是否合理；第三節(jié) 假設(shè) 一、假設(shè)的特征如前所述，實(shí)驗(yàn)研究是

5、一個(gè)假設(shè)檢驗(yàn)的過(guò)程，因此我們必須對(duì)假設(shè)有一定的了解。簡(jiǎn)單地說(shuō)，假設(shè)就是根據(jù)已知理論與事實(shí)等對(duì)研究結(jié)果所作出的預(yù)測(cè)。一般來(lái)講，假設(shè)應(yīng)具備以下幾個(gè)特征：它要表明兩個(gè)或多個(gè)變量之間的關(guān)系；要用陳述句的形式來(lái)表達(dá)，措辭要清楚明確；要具有可檢驗(yàn)性。例如，上述有關(guān)閱讀材料的熟悉程度的假設(shè)就是用陳述句的形式清楚、明確地表明了熟悉程度與閱讀質(zhì)量?jī)蓚€(gè)變量之間的關(guān)系，然后我們?cè)儆脤?shí)驗(yàn)的方法來(lái)檢驗(yàn)這一假設(shè)的有效性。二、假設(shè)的種類實(shí)驗(yàn)研究的目的是為了回答或解決問(wèn)題。譬如我們對(duì)各種教學(xué)方進(jìn)行對(duì)比研究，其中一個(gè)問(wèn)題是：對(duì)于提高學(xué)生的外語(yǔ)水平，交際教學(xué)是否優(yōu)于語(yǔ)法翻譯法。對(duì)于這個(gè)問(wèn)題我們可以提出三種假設(shè)：（1）交際

6、教學(xué)法的效果好于語(yǔ)法翻譯法；（2）交際教學(xué)法的效果劣于語(yǔ)法翻譯法；（3）交際教學(xué)法與語(yǔ)法翻譯法的效果相同（或沒(méi)有差別）。假設(shè)一般分為 “零假設(shè)” 與 “備擇假設(shè)” 兩種。簡(jiǎn)單來(lái)說(shuō)，零假設(shè)就是預(yù)測(cè)兩個(gè)特征之間沒(méi)有差別的假設(shè)。零假設(shè)一般表述為“（兩個(gè)或多個(gè)）樣本所來(lái)自的總體的某個(gè)參數(shù)之間沒(méi)有差異”，因?yàn)殡m然我們研究的是樣本，但是我們感興趣的是總體，也就是說(shuō)要把對(duì)樣本的研究結(jié)果推廣至整個(gè)總體。零假設(shè)通常用符號(hào)表示為，例如：意思是說(shuō)，A總體的平均值與B總體的平均值之間沒(méi)有差異。另一種假設(shè)是 “備擇假設(shè)” 或 “對(duì)立假設(shè)” 、 “擇一假設(shè)” 等。顧名思義，這類假設(shè)是與零假設(shè)對(duì)立的，它預(yù)

7、測(cè)兩特征之間存在差異，例如上例中的假設(shè)（1）和（2）。備擇假設(shè)通常用來(lái)表示，例如：第一個(gè)假設(shè)的意思是：A總體的平均值小于B總體的平均值；第二個(gè)假設(shè)則表示：A總體的平均值大于B 總體的平均值。當(dāng)然，備擇假設(shè)也可以不指出差異的方向（即大于或小于、高于或低于等），而僅僅指出總體的參數(shù)不相等。第四節(jié) 假設(shè)檢驗(yàn) 在實(shí)驗(yàn)研究中，我們不是直接去證實(shí) 的正確性，而是去設(shè)法推翻，也就是先假設(shè)有關(guān)參數(shù)之間不存在差異，然后再通過(guò)實(shí)驗(yàn)收集證據(jù)，看能不能推翻這一假設(shè)。這時(shí)，只要找到一條反證，就足以證明零假設(shè)是錯(cuò)誤的。采用這種檢驗(yàn)假設(shè)的方法，就能夠得出確定的結(jié)論。如果推翻了零假設(shè)（即為真），就表明有關(guān)

8、差異是由各種誤差造成的，就表明差異確實(shí)存在，那么就接受與零假設(shè)對(duì)立的備擇假設(shè) （即為真）；如果無(wú)法推翻它（即為真），而不是真正的差異，那么就接受零假設(shè)，而拒絕有關(guān)備擇假設(shè)。如果推翻了零假設(shè)（即為假），就表明差異確實(shí)存在，那么就接受與零假設(shè)對(duì)立的備擇假設(shè) （即為真）；如果無(wú)法推翻它（即為真），就表明有關(guān)差異是由各種誤差造成的，而不是真正的差異，那么就接受零假設(shè)，而拒絕有關(guān)備擇假設(shè)（即為假）。因此，統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)的方法是：先對(duì)有關(guān)總體參數(shù)之間的差異提出零假設(shè)（同時(shí)給出相應(yīng)的備擇假設(shè)），然后分析樣本統(tǒng)計(jì)量之間的差異看看是否能推翻零假設(shè)。二、顯著水平在決定

9、是否能推翻零假設(shè)時(shí)，必須確定一個(gè)允許的誤差限度，即隨機(jī)誤差造成的差異在多大范圍之內(nèi)才能推翻零假設(shè)。這個(gè)范圍用概率表示，譬如5%，1%的等（或0.05， 0.01等）。如果隨機(jī)誤差的概率（即可能性）為，就表示當(dāng)隨機(jī)誤差造成的差異在等于或小于5%，就可以推翻零假設(shè)。如果零假設(shè)被推翻，我們就說(shuō)觀察到的差異有顯著意義或者說(shuō)檢驗(yàn)有顯著意義，所以這個(gè)概率通常稱為顯著水平。顯著水平是由研究者決定的，顯著水平的設(shè)定需要考慮多種因素，譬如研究領(lǐng)域、研究目的、研究對(duì)象、研究?jī)?nèi)容等等。另外還要考慮，假如所得出的結(jié)論是錯(cuò)誤的（例如在不該推翻零假設(shè)時(shí)而推翻了），是否會(huì)帶來(lái)嚴(yán)重的后果，如果其后果是嚴(yán)重的，

10、就要謹(jǐn)慎一些，要把顯著水平定得嚴(yán)一些（即不要輕易推翻零假設(shè)），否則就可以定得松一些。在語(yǔ)言研究中（譬如比較不同教學(xué)方法的優(yōu)劣），一般來(lái)說(shuō)即使結(jié)論有誤，也不會(huì)帶來(lái)分嚴(yán)重的后果，所以，可以定得寬松一些。三、顯著性檢驗(yàn)中的兩類錯(cuò)誤上面談到，我們?cè)趯?duì)差異進(jìn)行顯著性檢驗(yàn)時(shí)有可能得出錯(cuò)誤的結(jié)論。一種情況是 “錯(cuò)誤地拒絕” ，即零假設(shè)成立或?qū)僬鏁r(shí) （也就是說(shuō)不存在真正的差異，所觀察到的差異只是由隨機(jī)誤差造成的），應(yīng)該接受零假設(shè)而我們卻拒絕了。另一種情況是 “錯(cuò)誤地接受” ，即零假設(shè)不成立或?qū)偌贂r(shí) （也就是所觀察到的差異是確實(shí)存在的），應(yīng)該拒絕零假設(shè)而我們卻過(guò)于謹(jǐn)慎，認(rèn)為沒(méi)有足夠的證據(jù)推

11、翻它，所以在不該接受零假設(shè)時(shí)接受了它。四、檢驗(yàn)統(tǒng)計(jì)值與臨界值誤差概率是否低于某水平，是用根據(jù)樣本所計(jì)算的一個(gè)值來(lái)判斷或檢驗(yàn)的，這個(gè)值就叫做檢驗(yàn)統(tǒng)計(jì)值。顯著水平（即認(rèn)為差異顯著時(shí)所允許的最大隨機(jī)誤差概率）其實(shí)就是抽樣分布曲線中處于尾端部分的面積。當(dāng)我們說(shuō)“低于某個(gè)顯著水平”時(shí)拒絕零假設(shè)，就等于說(shuō)尾端的面積要小于該面積，這個(gè)面積或區(qū)域叫做 “臨界區(qū)域” 或 “拒絕區(qū)域” ，界定該區(qū)域的值叫做臨界值，也就是對(duì)應(yīng)于該區(qū)域面積的Z值、t值等。當(dāng)我們對(duì)零假設(shè)進(jìn)行檢驗(yàn)時(shí)，要首先依據(jù)樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)值，如果檢驗(yàn)統(tǒng)計(jì)值的絕對(duì)值小于顯著水平對(duì)應(yīng)的臨界值，我們稱檢驗(yàn)統(tǒng)計(jì)值落在了臨界區(qū)域之外，這就意味著檢驗(yàn)統(tǒng)

12、計(jì)值對(duì)應(yīng)的尾端的面積大于臨界值對(duì)應(yīng)的尾端的面積，這時(shí)就要接受零假設(shè)。反之，如果檢驗(yàn)統(tǒng)計(jì)值的絕對(duì)值大于顯著水平對(duì)應(yīng)的臨界值，我們稱檢驗(yàn)統(tǒng)計(jì)值落在了臨界區(qū)域之內(nèi)，這就意味著檢驗(yàn)統(tǒng)計(jì)值對(duì)應(yīng)的尾端的面積小于臨界值對(duì)應(yīng)的尾端的面積，這時(shí)就可以推翻或拒絕零假設(shè)。五、單尾與雙尾檢驗(yàn) 我們已經(jīng)知道，在檢驗(yàn)零假設(shè)時(shí)，要同時(shí)提出適當(dāng)?shù)膫鋼窦僭O(shè)。備擇假設(shè)預(yù)測(cè)總體參數(shù)之間存在差異，但是具體來(lái)講，又有兩種情況。一種在指出存在差異的同時(shí)，還指出差異的方向（即 “大于” 、 “小于” 、 “高于“低于” 等），例如：而另一種則僅僅強(qiáng)調(diào)差異的存在，而不指出差異的方向，例如：如果備擇假設(shè)是方向性的，譬如，這時(shí)檢驗(yàn)

13、只與抽樣分布曲線下的一個(gè)尾巴（即右側(cè)的尾巴）有關(guān)，所以這樣的檢驗(yàn)叫做單尾或單側(cè)檢驗(yàn)。如果備擇假設(shè)為非方向性的，譬如，那么由于可能大于也可能小于，所以檢驗(yàn)與分布曲線的兩個(gè)尾巴都有關(guān)系，因此我們稱這樣的檢驗(yàn)為雙尾或雙側(cè)檢驗(yàn)。單尾檢驗(yàn)與雙尾檢驗(yàn)的差別示意圖如圖7.2和圖7.3。從圖7.2和圖7.3可以看出，同樣的顯著水平，單尾檢驗(yàn)的臨界值要小于雙尾檢驗(yàn)的臨界值，因此對(duì)于同樣的檢驗(yàn)統(tǒng)計(jì)值，就有可能在使用單尾檢驗(yàn)時(shí)差異是顯著的，而在使用雙尾檢驗(yàn)時(shí)差異卻是不顯著的。反過(guò)來(lái)講，在單尾檢驗(yàn)時(shí)，推翻零假設(shè)所需的檢驗(yàn)統(tǒng)計(jì)值要小于雙尾檢驗(yàn)所需的檢驗(yàn)統(tǒng)計(jì)值，這是因?yàn)樵趩挝矙z驗(yàn)時(shí)我們輸入了更多的信息的

14、存在以及差異的方向，所以為了證明差異有顯著意義所需的檢驗(yàn)統(tǒng)計(jì)值就小一些。六、參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn) 所謂的“參數(shù)檢驗(yàn)”一般對(duì)所涉及的變量的測(cè)量水平、總體的分布形態(tài)、總體的方差等方面有一定的要求。嚴(yán)格來(lái)講，參數(shù)檢驗(yàn)只適用于連續(xù)性的等距（或比率）變量，譬如考試分?jǐn)?shù)。此外，參數(shù)檢驗(yàn)一般都要求樣本所來(lái)自的總體呈正態(tài)分布，因?yàn)檫@對(duì)決定檢驗(yàn)統(tǒng)計(jì)值的抽樣分布非常重要。當(dāng)數(shù)據(jù)為正態(tài)分布時(shí)，參數(shù)檢驗(yàn)最為有效，隨著其偏斜程度的增加，參數(shù)檢驗(yàn)的有效性也隨之降低。不過(guò)，這一要求在有些情況下可以有所放松，譬如當(dāng)樣本容量較大時(shí)，根據(jù)“中心極限定理”，即使總體的分布為非正態(tài)，平均數(shù)的抽樣分布也會(huì)接近正態(tài)。參數(shù)檢

15、驗(yàn)與非參數(shù)檢驗(yàn)各有其優(yōu)缺點(diǎn)。參數(shù)檢驗(yàn)用于等距數(shù)據(jù)，因此能夠把數(shù)據(jù)中每一個(gè)觀測(cè)值的大小都考慮進(jìn)去，也就是說(shuō)能夠最大限度地利用數(shù)據(jù)所提供的信息。由于這個(gè)原因，參數(shù)檢驗(yàn)的“靈敏度”比較高，即在保證樣本容量的情況下，參數(shù)檢驗(yàn)?zāi)軌虬l(fā)現(xiàn)數(shù)據(jù)間存在的很小的真正差異。，非參數(shù)檢驗(yàn)的計(jì)算過(guò)程相對(duì)簡(jiǎn)便一些，因此如果只是要粗略地看看差異情況，非參數(shù)檢驗(yàn)是個(gè)比較好的選擇。但是非參數(shù)檢驗(yàn)的缺陷是對(duì)真正差異的反應(yīng)不夠靈敏，對(duì)存在的差異可能檢驗(yàn)不出來(lái)，這是因?yàn)榉菂?shù)檢驗(yàn)利用的數(shù)據(jù)信息量小一些。七、假設(shè)檢驗(yàn)的一般步驟對(duì)于多數(shù)假設(shè)檢驗(yàn)，檢驗(yàn)的過(guò)程都是一樣的：（1）陳述零假設(shè)，同時(shí)提出適當(dāng)?shù)膫鋼窦僭O(shè)（表明是方向性的，還是非方向性的，以便決定采用單尾檢驗(yàn)還是雙尾檢驗(yàn)）；（2）根據(jù)研究的性質(zhì)和目的設(shè)定適當(dāng)?shù)娘@著水平；（3）根據(jù)數(shù)據(jù)的測(cè)量水平、分布的形態(tài)以及實(shí)驗(yàn)設(shè)計(jì)等選擇適當(dāng)?shù)臋z驗(yàn)；（4）根據(jù)樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)值；

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

spss假設(shè)檢驗(yàn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

spss假設(shè)檢驗(yàn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔