spss假設(shè)檢驗(yàn)_第1頁(yè)
spss假設(shè)檢驗(yàn)_第2頁(yè)
spss假設(shè)檢驗(yàn)_第3頁(yè)
spss假設(shè)檢驗(yàn)_第4頁(yè)
spss假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第七章 假設(shè)檢驗(yàn)n第一節(jié) 引言n第二節(jié) 實(shí)驗(yàn)研究 n第三節(jié) 假設(shè) 一、假設(shè)的特征 二、假設(shè)的種類n第四節(jié) 假設(shè)檢驗(yàn) 一、假設(shè)檢驗(yàn)證實(shí)與證偽 二、顯著水平 三、顯著性檢驗(yàn)中的兩類錯(cuò)誤 四、檢驗(yàn)統(tǒng)計(jì)值與臨界值 五、單尾與雙尾檢驗(yàn)第一節(jié) 引 言 假設(shè)檢驗(yàn)是推斷統(tǒng)計(jì)的最重要的一個(gè)部分。語(yǔ)言研究經(jīng)常要涉及統(tǒng)計(jì)值之間的差異問(wèn)題,即在比較兩個(gè)樣本統(tǒng)計(jì)量(比如平均數(shù)、相關(guān)系數(shù)等)或者樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)之間的差異的基礎(chǔ)上,推斷總體參數(shù)之間是否確實(shí)存在差異。簡(jiǎn)單來(lái)說(shuō), 我們先對(duì)兩個(gè) (或多個(gè))異提出一個(gè)假設(shè),然后在樣本統(tǒng)計(jì)量的基礎(chǔ)上,運(yùn)用適當(dāng)?shù)慕y(tǒng)計(jì)手段對(duì)該假設(shè)進(jìn)行檢驗(yàn),就可以發(fā)現(xiàn)在多大程度上(或有多大的可

2、能性)兩者之間的差異是真正存在的。第二節(jié)實(shí)驗(yàn)研究 實(shí)驗(yàn)研究實(shí)質(zhì)上是一個(gè)假設(shè)檢驗(yàn)的過(guò)程,一般來(lái)說(shuō),有以下幾個(gè)步驟: (1)首先對(duì)研究結(jié)果作出預(yù)測(cè)或提出假設(shè):如果X出現(xiàn),那么 Y 將會(huì)隨之出現(xiàn)。假設(shè)不能憑空而來(lái),而是要有一定的依據(jù),譬如已有的理論或研究結(jié)果等。 (2)操縱某一或某些因素,以創(chuàng)造使Y出現(xiàn)的條件X。所操縱的因素就是我們要研究的變量。與此同時(shí),要盡量控制所有其它變量,如果不加以嚴(yán)格的控制,就有可能使研究結(jié)果模糊不清。 (3)觀察預(yù)期出現(xiàn)的結(jié)果是否出現(xiàn)了。這一階段就要用到統(tǒng)計(jì)分析(例如進(jìn)行各種假設(shè)檢驗(yàn)) 。 (4)得出結(jié)論。一個(gè)實(shí)驗(yàn)研究的結(jié)果會(huì)有以下幾種可能:一是預(yù)期中的Y明確無(wú)誤地出現(xiàn)了

3、,意味著所提出的假設(shè)(及其所基于的理論等)得到了證實(shí); 二是Y沒(méi)有出現(xiàn),這說(shuō)明假設(shè)及其所基于的理論被推翻了,或至少被部分地推翻了;三是結(jié)果模糊,無(wú)法解釋,因而不能得出任何結(jié)論。至于假設(shè)是否被推翻或得到了證實(shí),其實(shí)往往難以下一個(gè)絕對(duì)的結(jié)論,因?yàn)槲覀儫o(wú)法保證在整個(gè)實(shí)驗(yàn)過(guò)程中把所有可能影響實(shí)驗(yàn)結(jié)果的潛在因素都排除掉或控制住了。 因此實(shí)驗(yàn)研究的過(guò)程是先提出假設(shè),然后再根據(jù)觀測(cè)資料或數(shù)據(jù)來(lái)檢驗(yàn)假設(shè)的可能性或正確性。例如,根據(jù)圖式理論(schematic theory),閱讀者對(duì)閱讀材料的熟悉程度(或者是否具備理解閱讀材料所需的背景知識(shí)) 可能會(huì)影響閱讀的質(zhì)量 (即理解程度) , 據(jù)此, 我們可以提出如下

4、假設(shè):熟悉材料的閱讀質(zhì)量要高于生疏材料的閱讀質(zhì)量。我們可以用實(shí)驗(yàn)的方法來(lái)檢驗(yàn)這一假設(shè)。 在此過(guò)程中, 需要控制的因素是非常多的, 例如被試的年齡、 智商、 受教育情況、 母語(yǔ)閱讀能力、 外語(yǔ)的語(yǔ)言水平、 閱讀材料的語(yǔ)言難度等等, 我們可以通過(guò)隨機(jī)抽樣、 隨機(jī)分組、 增大樣本容量等措施 (有關(guān)隨機(jī)抽樣、 樣本容量等概念參見(jiàn)有關(guān)章節(jié))來(lái)控制與被試有關(guān)的變量,用改寫(xiě)的方法來(lái)控制閱讀材料的語(yǔ)言難度(使兩類材料在語(yǔ)言本身的難度上具有可比性)等等。 對(duì)于實(shí)驗(yàn)研究特別需要注意的問(wèn)題是: 提出的假設(shè)是否得當(dāng); 對(duì)統(tǒng)計(jì)檢驗(yàn)是否科學(xué)。 變量的操縱與控制是否合理;第三節(jié) 假設(shè) 一、 假設(shè)的特征 如前所述,實(shí)驗(yàn)研究是

5、一個(gè)假設(shè)檢驗(yàn)的過(guò)程,因此我們必須對(duì)假設(shè)有一定的了解。簡(jiǎn)單地說(shuō),假設(shè)就是根據(jù)已知理論與事實(shí)等對(duì)研究結(jié)果所作出的預(yù)測(cè)。一般來(lái)講,假設(shè)應(yīng)具備以下幾個(gè)特征:它要表明兩個(gè)或多個(gè)變量之間的關(guān)系;要用陳述句的形式來(lái)表達(dá),措辭要清楚明確;要具有可檢驗(yàn)性。例如,上述有關(guān)閱讀材料的熟悉程度的假設(shè)就是用陳述句的形式清楚、明確地表明了熟悉程度與閱讀質(zhì)量?jī)蓚€(gè)變量之間的關(guān)系,然后我們?cè)儆脤?shí)驗(yàn)的方法來(lái)檢驗(yàn)這一假設(shè)的有效性。 二、 假設(shè)的種類 實(shí)驗(yàn)研究的目的是為了回答或解決問(wèn)題。譬如我們對(duì)各種教學(xué)方進(jìn)行對(duì)比研究,其中一個(gè)問(wèn)題是:對(duì)于提高學(xué)生的外語(yǔ)水平,交際教學(xué)是否優(yōu)于語(yǔ)法翻譯法。對(duì)于這個(gè)問(wèn)題我們可以提出三種假設(shè): (1)交際

6、教學(xué)法的效果好于語(yǔ)法翻譯法; (2)交際教學(xué)法的效果劣于語(yǔ)法翻譯法; (3)交際教學(xué)法與語(yǔ)法翻譯法的效果相同(或沒(méi)有差別)。 假設(shè)一般分為 “零假設(shè)” 與 “備擇假設(shè)” 兩種。 簡(jiǎn)單來(lái)說(shuō), 零假設(shè)就是預(yù)測(cè)兩個(gè)特征之間沒(méi)有差別的假設(shè)。零假設(shè)一般表述為“(兩個(gè)或多個(gè))樣本所來(lái)自的總體的某個(gè)參數(shù)之間沒(méi)有差異”,因?yàn)殡m然我們研究的是樣本,但是我們感興趣的是總體,也就是說(shuō)要把對(duì)樣本的研究結(jié)果推廣至整個(gè)總體。零假設(shè)通常用符號(hào)表示為 , 例如:意思是說(shuō),A總體的平均值與B總體的平均值之間沒(méi)有差異。 另一種假設(shè)是 “備擇假設(shè)” 或 “對(duì)立假設(shè)” 、 “擇一假設(shè)” 等。 顧名思義,這類假設(shè)是與零假設(shè)對(duì)立的,它預(yù)

7、測(cè)兩特征之間存在差異,例如上例中的假設(shè)(1)和(2)。備擇假設(shè)通常用 來(lái)表示, 例如:第一個(gè)假設(shè)的意思是:A總體的平均值小于B總體的平均值; 第二個(gè)假設(shè)則表示:A總體的平均值大于B 總體的平均值。當(dāng)然,備擇假設(shè)也可以不指出差異的方向 (即大于或小于、 高于或低于等) , 而僅僅指出總體的參數(shù)不相等。第四節(jié) 假設(shè)檢驗(yàn) 在實(shí)驗(yàn)研究中,我們不是直接去證實(shí) 的正確性,而是去設(shè)法推翻 , 也就是先假設(shè)有關(guān)參數(shù)之間不存在差異,然后再通過(guò)實(shí)驗(yàn)收集證據(jù),看能不能推翻這一假設(shè)。這時(shí),只要找到一條反證,就足以證明零假設(shè)是錯(cuò)誤的。采用這種檢驗(yàn)假設(shè)的方法,就能夠得出確定的結(jié)論。如果推翻了零假設(shè)(即 為真),就表明有關(guān)

8、差異是由各種誤差造成的, 就表明差異確實(shí)存在, 那么就接受與零假設(shè)對(duì)立的備擇假設(shè) (即 為真) ; 如果無(wú)法推翻它 (即 為真),而不是真正的差異,那么就接受零假設(shè),而拒絕有關(guān)備擇假設(shè)。 如果推翻了零假設(shè)(即 為假) , 就表明差異確實(shí)存在, 那么就接受與零假設(shè)對(duì)立的備擇假設(shè) (即 為真) ; 如果無(wú)法推翻它 (即 為真),就表明有關(guān)差異是由各種誤差造成的,而不是真正的差異,那么就接受零假設(shè),而拒絕有關(guān)備擇假設(shè)(即 為假) 。 因此,統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)的方法是:先對(duì)有關(guān)總體參數(shù)之間的差異提出零假設(shè)(同時(shí)給出相應(yīng)的備擇假設(shè)),然后分析樣本統(tǒng)計(jì)量之間的差異看看是否能推翻零假設(shè)。二、 顯著水平 在決定

9、是否能推翻零假設(shè)時(shí),必須確定一個(gè)允許的誤差限度,即隨機(jī)誤差造成的差異在多大范圍之內(nèi)才能推翻零假設(shè)。這個(gè)范圍用概率表示,譬如5%,1%的等(或0.05, 0.01等)。 如果隨機(jī)誤差的概率 (即可能性)為 ,就表示當(dāng)隨機(jī)誤差造成的差異在等于或小于5%,就可以推翻零假設(shè)。如果零假設(shè)被推翻,我們就說(shuō)觀察到的差異有顯著意義或者說(shuō)檢驗(yàn)有顯著意義,所以這個(gè)概率通常稱為顯著水平。 顯著水平是由研究者決定的,顯著水平的設(shè)定需要考慮多種因素,譬如研究領(lǐng)域、 研究目的、 研究對(duì)象、 研究?jī)?nèi)容等等。另外還要考慮, 假如所得出的結(jié)論是錯(cuò)誤的(例如在不該推翻零假設(shè)時(shí)而推翻了),是否會(huì)帶來(lái)嚴(yán)重的后果,如果其后果是嚴(yán)重的,

10、就要謹(jǐn)慎一些,要把顯著水平定得嚴(yán)一些(即不要輕易推翻零假設(shè)),否則就可以定得松一些。在語(yǔ)言研究中 (譬如比較不同教學(xué)方法的優(yōu)劣) , 一般來(lái)說(shuō)即使結(jié)論有誤, 也不會(huì)帶來(lái)分嚴(yán)重的后果, 所以, 可以定得寬松一些。三、 顯著性檢驗(yàn)中的兩類錯(cuò)誤 上面談到,我們?cè)趯?duì)差異進(jìn)行顯著性檢驗(yàn)時(shí)有可能得出錯(cuò)誤的結(jié)論。一種情況是 “錯(cuò)誤地拒絕” , 即零假設(shè)成立或?qū)僬鏁r(shí) (也就是說(shuō)不存在真正的差異,所觀察到的差異只是由隨機(jī)誤差造成的),應(yīng)該接受零假設(shè)而我們卻拒絕了。 另一種情況是 “錯(cuò)誤地接受” , 即零假設(shè)不成立或?qū)偌贂r(shí) (也就是所觀察到的差異是確實(shí)存在的),應(yīng)該拒絕零假設(shè)而我們卻過(guò)于謹(jǐn)慎,認(rèn)為沒(méi)有足夠的證據(jù)推

11、翻它,所以在不該接受零假設(shè)時(shí)接受了它。四、檢驗(yàn)統(tǒng)計(jì)值與臨界值 誤差概率是否低于某水平,是用根據(jù)樣本所計(jì)算的一個(gè)值來(lái)判斷或檢驗(yàn)的,這個(gè)值就叫做檢驗(yàn)統(tǒng)計(jì)值。顯著水平(即認(rèn)為差異顯著時(shí)所允許的最大隨機(jī)誤差概率)其實(shí)就是抽樣分布曲線中處于尾端部分的面積。當(dāng)我們說(shuō)“低于某個(gè)顯著水平”時(shí)拒絕零假設(shè),就等于說(shuō)尾端的面積要小于該面積,這個(gè)面積或區(qū)域叫做 “臨界區(qū)域” 或 “拒絕區(qū)域” , 界定該區(qū)域的值叫做臨界值, 也就是對(duì)應(yīng)于該區(qū)域面積的Z值、t值等。 當(dāng)我們對(duì)零假設(shè)進(jìn)行檢驗(yàn)時(shí),要首先依據(jù)樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)值,如果檢驗(yàn)統(tǒng)計(jì)值的絕對(duì)值小于顯著水平對(duì)應(yīng)的臨界值,我們稱檢驗(yàn)統(tǒng)計(jì)值落在了臨界區(qū)域之外,這就意味著檢驗(yàn)統(tǒng)

12、計(jì)值對(duì)應(yīng)的尾端的面積大于臨界值對(duì)應(yīng)的尾端的面積,這時(shí)就要接受零假設(shè)。反之,如果檢驗(yàn)統(tǒng)計(jì)值的絕對(duì)值大于顯著水平對(duì)應(yīng)的臨界值,我們稱檢驗(yàn)統(tǒng)計(jì)值落在了臨界區(qū)域之內(nèi),這就意味著檢驗(yàn)統(tǒng)計(jì)值對(duì)應(yīng)的尾端的面積小于臨界值對(duì)應(yīng)的尾端的面積,這時(shí)就可以推翻或拒絕零假設(shè)。五、 單尾與雙尾檢驗(yàn) 我們已經(jīng)知道,在檢驗(yàn)零假設(shè)時(shí),要同時(shí)提出適當(dāng)?shù)膫鋼窦僭O(shè)。備擇假設(shè)預(yù)測(cè)總體參數(shù)之間存在差異,但是具體來(lái)講,又有兩種情況。一種在指出存在差異的同時(shí), 還指出差異的方向 (即 “大于” 、 “小于” 、 “高于“低于” 等) , 例如:而另一種則僅僅強(qiáng)調(diào)差異的存在,而不指出差異的方向,例如: 如果備擇假設(shè)是方向性的,譬如 ,這時(shí)檢驗(yàn)

13、只與抽樣分布曲線下的一個(gè)尾巴(即右側(cè)的尾巴)有關(guān),所以這樣的檢驗(yàn)叫做單尾或單側(cè)檢驗(yàn)。 如果備擇假設(shè)為非方向性的, 譬如 , 那么由于可能大于 也可能小于 , 所以檢驗(yàn)與分布曲線的兩個(gè)尾巴都有關(guān)系,因此我們稱這樣的檢驗(yàn)為雙尾或雙側(cè)檢驗(yàn)。 單尾檢驗(yàn)與雙尾檢驗(yàn)的差別示意圖如圖7.2和圖7.3。 從圖7.2和圖7.3可以看出,同樣的顯著水平,單尾檢驗(yàn)的臨界值要小于雙尾檢驗(yàn)的臨界值,因此對(duì)于同樣的檢驗(yàn)統(tǒng)計(jì)值,就有可能在使用單尾檢驗(yàn)時(shí)差異是顯著的,而在使用雙尾檢驗(yàn)時(shí)差異卻是不顯著的。反過(guò)來(lái)講,在單尾檢驗(yàn)時(shí),推翻零假設(shè)所需的檢驗(yàn)統(tǒng)計(jì)值要小于雙尾檢驗(yàn)所需的檢驗(yàn)統(tǒng)計(jì)值,這是因?yàn)樵趩挝矙z驗(yàn)時(shí)我們輸入了更多的信息的

14、存在以及差異的方向,所以為了證明差異有顯著意義所需的檢驗(yàn)統(tǒng)計(jì)值就小一些。六、 參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn) 所謂的“參數(shù)檢驗(yàn)”一般對(duì)所涉及的變量的測(cè)量水平、總體的分布形態(tài)、總體的方差等方面有一定的要求。嚴(yán)格來(lái)講, 參數(shù)檢驗(yàn)只適用于連續(xù)性的等距 (或比率) 變量, 譬如考試分?jǐn)?shù)。 此外,參數(shù)檢驗(yàn)一般都要求樣本所來(lái)自的總體呈正態(tài)分布,因?yàn)檫@對(duì)決定檢驗(yàn)統(tǒng)計(jì)值的抽樣分布非常重要。當(dāng)數(shù)據(jù)為正態(tài)分布時(shí),參數(shù)檢驗(yàn)最為有效,隨著其偏斜程度的增加,參數(shù)檢驗(yàn)的有效性也隨之降低。不過(guò),這一要求在有些情況下可以有所放松,譬如當(dāng)樣本容量較大時(shí),根據(jù)“中心極限定理”,即使總體的分布為非正態(tài),平均數(shù)的抽樣分布也會(huì)接近正態(tài)。 參數(shù)檢

15、驗(yàn)與非參數(shù)檢驗(yàn)各有其優(yōu)缺點(diǎn)。參數(shù)檢驗(yàn)用于等距數(shù)據(jù),因此能夠把數(shù)據(jù)中每一個(gè)觀測(cè)值的大小都考慮進(jìn)去,也就是說(shuō)能夠最大限度地利用數(shù)據(jù)所提供的信息。由于這個(gè)原因,參數(shù)檢驗(yàn)的“靈敏度”比較高,即在保證樣本容量的情況下,參數(shù)檢驗(yàn)?zāi)軌虬l(fā)現(xiàn)數(shù)據(jù)間存在的很小的真正差異。,非參數(shù)檢驗(yàn)的計(jì)算過(guò)程相對(duì)簡(jiǎn)便一些,因此如果只是要粗略地看看差異情況,非參數(shù)檢驗(yàn)是個(gè)比較好的選擇。但是非參數(shù)檢驗(yàn)的缺陷是對(duì)真正差異的反應(yīng)不夠靈敏,對(duì)存在的差異可能檢驗(yàn)不出來(lái),這是因?yàn)榉菂?shù)檢驗(yàn)利用的數(shù)據(jù)信息量小一些。七、假設(shè)檢驗(yàn)的一般步驟 對(duì)于多數(shù)假設(shè)檢驗(yàn),檢驗(yàn)的過(guò)程都是一樣的: (1)陳述零假設(shè),同時(shí)提出適當(dāng)?shù)膫鋼窦僭O(shè)(表明是方向性的,還是非方向性的,以便決定采用單尾檢驗(yàn)還是雙尾檢驗(yàn)); (2)根據(jù)研究的性質(zhì)和目的設(shè)定適當(dāng)?shù)娘@著水平; (3)根據(jù)數(shù)據(jù)的測(cè)量水平、分布的形態(tài)以及實(shí)驗(yàn)設(shè)計(jì)等選擇適當(dāng)?shù)臋z驗(yàn); (4)根據(jù)樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)值;

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論