愛(ài)上統(tǒng)計(jì)學(xué)_學(xué)習(xí)筆記_第1頁(yè)
愛(ài)上統(tǒng)計(jì)學(xué)_學(xué)習(xí)筆記_第2頁(yè)
愛(ài)上統(tǒng)計(jì)學(xué)_學(xué)習(xí)筆記_第3頁(yè)
愛(ài)上統(tǒng)計(jì)學(xué)_學(xué)習(xí)筆記_第4頁(yè)
愛(ài)上統(tǒng)計(jì)學(xué)_學(xué)習(xí)筆記_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第I部分耶!我喜歡統(tǒng)計(jì)學(xué)1. 統(tǒng)計(jì)學(xué)還是虐待學(xué)?由你決定統(tǒng)計(jì)學(xué)簡(jiǎn)史計(jì)數(shù)是非常好的創(chuàng)意;一旦數(shù)字成為語(yǔ)言的組成部分,接下來(lái)就是將數(shù)字和結(jié)果結(jié)合在一起。17世紀(jì)早期開(kāi)始收集與人口相關(guān)的數(shù)據(jù),達(dá)爾文兄弟采用“相關(guān)系數(shù)”(第五章)回答了家庭成員智力一致性的基本問(wèn)題;最簡(jiǎn)單的用于比較兩個(gè)群體的均值差異的檢驗(yàn)方法在20世紀(jì)初取得首次進(jìn)展。如果想更好的了解統(tǒng)計(jì)歷史:http:/www.*統(tǒng)計(jì)學(xué):是什么(不是什么)描述性統(tǒng)計(jì),可以學(xué)到收集、整理和匯總數(shù)據(jù);推論性統(tǒng)計(jì),學(xué)會(huì)解釋數(shù)據(jù)什么是描述性統(tǒng)計(jì)(descriptive statistics)用于整理、描述所收集數(shù)據(jù)的特征:如眾數(shù)、均值什么是推論統(tǒng)計(jì)(infe

2、rential statistics)樣本推論總體。我在統(tǒng)計(jì)課堂上做什么使用本書(shū)的十種方式關(guān)于那些符號(hào)練習(xí)時(shí)間第II部分西格瑪弗洛伊德和描述統(tǒng)計(jì)第2章討論集中趨勢(shì)的測(cè)量,以及如何計(jì)算多種平均數(shù)中的一種以便更好地代表一組數(shù)據(jù)。第3章介紹用于描述一組數(shù)據(jù)的離散型的工具,標(biāo)準(zhǔn)差和方差。第4章描述不同的數(shù)據(jù)分布或不同數(shù)據(jù)集間的差異,以及這種差異的意義。第5章處理變量之間的關(guān)系,相關(guān)關(guān)系。2. 計(jì)算和理解平均數(shù)平均數(shù)(average),也叫做集中趨勢(shì)量數(shù)(measures of central tendency),三種形式:均值、中位數(shù)和眾數(shù)計(jì)算均值均值(mean),數(shù)組中所有數(shù)值加和除以該數(shù)組的數(shù)值的

3、個(gè)數(shù)需要記憶的內(nèi)容均值有時(shí)也用M表示,也叫做典型平均數(shù)或中心值。小寫(xiě)字母n表示從中計(jì)算均值的樣本的規(guī)模,大寫(xiě)N表示總體規(guī)模;均值對(duì)極值非常敏感;均值也指算數(shù)平均數(shù)(arithmetic mean)。計(jì)算加權(quán)平均數(shù),樣本中同樣的數(shù)值不止出現(xiàn)一次的情況下,即每一數(shù)值乘以出現(xiàn)頻數(shù),累計(jì)加和除以頻數(shù)總和。計(jì)算中位數(shù)中位數(shù)(median),一系列數(shù)據(jù)的中點(diǎn),如果數(shù)值有偶數(shù)個(gè),中位數(shù)是中間兩個(gè)數(shù)的均值,最重要特性是對(duì)極值不敏感。需要記憶的內(nèi)容均值是一系列數(shù)值的中間點(diǎn),而中位數(shù)是一系列個(gè)體的中間點(diǎn)。計(jì)算眾數(shù)眾數(shù)(mode)就是出現(xiàn)次數(shù)最多的數(shù)值。如果數(shù)據(jù)分布中,有多個(gè)數(shù)值的出現(xiàn)頻數(shù)相同,成為多峰分布。何時(shí)用

4、什么一般來(lái)說(shuō),定性、類(lèi)別和定類(lèi)數(shù)據(jù)的集中趨勢(shì)只能使用眾數(shù)來(lái)描述。中位數(shù)和均值適用于定量數(shù)據(jù)。公平的說(shuō),均值比中位數(shù)精確,中位數(shù)比眾數(shù)精確,即在同等條件下,優(yōu)先選擇均值、中位數(shù)。應(yīng)用計(jì)算機(jī)并計(jì)算描述統(tǒng)計(jì)值3. 理解變異性為什么理解變異性很重要變異性(variability,也叫做散布或離散度)反應(yīng)數(shù)據(jù)之間的不同。計(jì)算極差極差(range),最籠統(tǒng)的變異性測(cè)量,數(shù)據(jù)分布中的最大值-最小值分為:不包含極差(如上),另外是包含極差為r=h-l+1。計(jì)算標(biāo)準(zhǔn)差字面含義,標(biāo)準(zhǔn)化了的與某個(gè)值的偏差。標(biāo)準(zhǔn)差(standard deviation,縮寫(xiě)為s或SD),表示一個(gè)數(shù)組中變異性的平均數(shù)量。實(shí)際的含義是與

5、均值的平均距離。其中,開(kāi)方的原因是平方后的操作需要單位的回歸統(tǒng)一;采用n-1,而不是n,答案是s是總體標(biāo)準(zhǔn)差的估計(jì),但只有在n-1的情況下才是無(wú)偏估計(jì)。把分母-1會(huì)使得標(biāo)準(zhǔn)差大于實(shí)際的大小。因?yàn)楹玫目茖W(xué)家都是保守的,及如果我們不得不出錯(cuò),也是由于高估了總體的標(biāo)準(zhǔn)差,除以較小的分母可以達(dá)到這樣的目的。需要記憶的內(nèi)容標(biāo)準(zhǔn)差是偏離均值的平均距離計(jì)算的;對(duì)極值非常敏感計(jì)算方差方差(variance),是標(biāo)準(zhǔn)差的平方。在文章雜志中很少提到,因?yàn)榉讲钪岛茈y解釋一組數(shù)據(jù)。但卻很重要,因?yàn)樗恢皇且粋€(gè)概念。與標(biāo)準(zhǔn)差的區(qū)別:1)標(biāo)準(zhǔn)差以最初的計(jì)算單位存在,而方差以平方單位存在使用計(jì)算機(jī)計(jì)算變異性量數(shù)4. 一圖千

6、言萬(wàn)語(yǔ)為什么要用圖表說(shuō)明數(shù)據(jù)好圖表的十個(gè)方面首先是建立頻數(shù)分布組距確定的一般原則:選擇一個(gè)包含2、5、10或20個(gè)點(diǎn)的組距;1020個(gè)組距就可以覆蓋所有的數(shù)據(jù);最大的組距處在頻數(shù)分布的頂端。圖形密度:建立直方圖扁平和細(xì)長(zhǎng)的頻數(shù)分布數(shù)據(jù)分布之間,在四個(gè)方面不同:平均值、變異性、偏度和峰度;偏度(skewness),是對(duì)數(shù)據(jù)分布對(duì)稱(chēng)性缺失,就是分布的一個(gè)尾巴比另一個(gè)長(zhǎng)。例如,一個(gè)數(shù)據(jù)分布的右側(cè)尾比左側(cè)尾長(zhǎng),即分布的大數(shù)據(jù)值一端的發(fā)生次數(shù)較小,這是正偏度分布。反之則為負(fù)偏度分布(即中位數(shù)大于均值)。峰度(kurtosis)簡(jiǎn)單的偏度計(jì)算公式=均值-中位數(shù),>0表示正偏度分布;還有更復(fù)雜的偏度計(jì)

7、算公式,而且不是相對(duì)的,能相互比較,SK-皮爾遜偏度量數(shù)。其他的圖表數(shù)據(jù)的絕妙方法使用計(jì)算機(jī)圖示數(shù)據(jù)5. 計(jì)算相關(guān)系數(shù)相關(guān)系數(shù)到底是什么相關(guān)系數(shù)(correlation coefficient)是反映兩個(gè)變量之間線(xiàn)性關(guān)系的數(shù)值型指標(biāo),值域范圍是-1到1。兩個(gè)變量的相關(guān)有時(shí)也叫二元相關(guān)。本章大部分討論的相關(guān)類(lèi)型是皮爾遜積聚相關(guān)(Pearson product-moment correlation)*注:皮爾遜相關(guān)系數(shù)考察兩個(gè)變量之間的關(guān)系,但這些變量的屬性是連續(xù)的。但大多數(shù)其他變量是不連續(xù)的,這時(shí)要用到點(diǎn)二列相關(guān),隨后討論。還有其他類(lèi)型的相關(guān)系數(shù)用于測(cè)量?jī)蓚€(gè)以上變量之間的關(guān)系,留到下一個(gè)統(tǒng)計(jì)課程

8、。相關(guān)系數(shù)的類(lèi)型:選擇1和選擇2。相關(guān)反映變量間關(guān)系的動(dòng)態(tài)性質(zhì)。如果變量變化方向相同,相關(guān)時(shí)直接相關(guān)或正相關(guān)(direct correlation或positive correlation)。如果方向相反,相關(guān)時(shí)間接相關(guān)或負(fù)相關(guān)(indirect correlation或negative correlation)。需要記憶的內(nèi)容相關(guān)系數(shù)的值域范圍(-1,1);絕對(duì)值反映相關(guān)的強(qiáng)度;相關(guān)總是反映每個(gè)案例至少有兩個(gè)數(shù)據(jù)點(diǎn)(或變量)的狀況;皮爾遜積聚相關(guān)系數(shù)用小寫(xiě)字母r表示,r的下標(biāo)表示相關(guān)的兩個(gè)變量計(jì)算簡(jiǎn)單相關(guān)系數(shù)變量X和Y的簡(jiǎn)單皮爾遜積聚相關(guān)系數(shù)=以上兩個(gè)公式等價(jià)。不是所有的相關(guān)都是用直線(xiàn)表明X

9、和Y的關(guān)系的線(xiàn)性相關(guān)。相關(guān)可能不是線(xiàn)性的,如人的年齡和智力,這是曲線(xiàn)相關(guān)。如果有多個(gè)變量,可以采用相關(guān)矩陣。理解相關(guān)系數(shù)的含義不成文的解釋?zhuān)何覀冞€選擇更加精確的方法,如下內(nèi)容決定性的努力:相關(guān)系數(shù)平方更精確的解釋相關(guān)系數(shù)的方法是計(jì)算決定系數(shù)。決定系數(shù)(coefficient of determination)是一個(gè)變量的方差可以被另一個(gè)變量的方差解釋的百分比。例如,如果平均成績(jī)和學(xué)習(xí)時(shí)間的之間的相關(guān)系數(shù)是.7,那么決定系數(shù)是.49,這意味著平均成績(jī)方差的49%可以被學(xué)習(xí)時(shí)間的方差解釋。但即使如此,還是有51%無(wú)法被解釋?zhuān)虼思词故?7的強(qiáng)相關(guān),也存在很多無(wú)法解釋的原因?qū)е伦兞恐g的差異。需要牢

10、記一點(diǎn):相關(guān)和因果沒(méi)關(guān)系(冰激凌的消費(fèi)量與犯罪率強(qiáng)相關(guān),是因?yàn)橄奶斓脑?,這是他們共享的條件,但不會(huì)因?yàn)閺?qiáng)制冰激凌的消費(fèi),而消滅犯罪)。其他重要的相關(guān)使用計(jì)算機(jī)計(jì)算相關(guān)系數(shù)第III部分抓住那些有趣也有利的機(jī)會(huì)6. 你和假設(shè):檢驗(yàn)?zāi)愕膯?wèn)題也許你想成為一個(gè)科學(xué)家假設(shè)(hypothesis)基本上是“學(xué)術(shù)猜測(cè)”。假設(shè)最重要的角色是表示一般問(wèn)題的陳述,或在最初的時(shí)候促使人們?nèi)ヌ剿餮芯康膯?wèn)題。一個(gè)好的假設(shè)將問(wèn)題陳述或研究問(wèn)題轉(zhuǎn)化為更適合于檢驗(yàn)的形式。在討論如何建立好的假設(shè)前,先討論下樣本和總體的差異,因?yàn)榧僭O(shè)檢驗(yàn)用于樣本,然后才將結(jié)論一般化到更大的總體。接著將注意力轉(zhuǎn)向假設(shè)的兩個(gè)主要類(lèi)型(零假設(shè)和研究假

11、設(shè))。樣本和總體:從加大的群體(總體population)中選擇的較小群體就是樣本(sample)。測(cè)量樣本和總體特征近似程度的量數(shù)叫做抽樣誤差(sampling error),是樣本統(tǒng)計(jì)值和總體參數(shù)之間的差異。如果樣本確實(shí)代表了總體,就可以說(shuō)研究結(jié)論有很高的一般化水平。零假設(shè)采用總體中的一個(gè)樣本來(lái)檢驗(yàn)我們的研究假設(shè),首先建立零假設(shè)(null hypothesis)。如果零假設(shè)能講話(huà),一定會(huì)說(shuō)類(lèi)似這樣的話(huà)“我代表你們正在研究的兩個(gè)變量無(wú)關(guān)”。零假設(shè)的目的:零假設(shè)即是研究起點(diǎn)也是測(cè)量實(shí)際的研究結(jié)果的基準(zhǔn)。現(xiàn)在詳細(xì)討論每一個(gè)目的:首先,零假設(shè)是研究的起點(diǎn),因?yàn)樵跊](méi)有其他信息的情況下零假設(shè)就被看做可

12、接受的真實(shí)狀態(tài)。換句話(huà)說(shuō),直到你能證明存在差異,否則你只能研究沒(méi)有差異;進(jìn)一步講,如果兩個(gè)群體之間存在任何差異,你必須假定這些差異是出于偶然!在沒(méi)有任何其他信息前,這種解釋都是對(duì)的、有吸引力的。零假設(shè)的第二個(gè)目的:提供與觀(guān)察到得結(jié)果進(jìn)行比較的基準(zhǔn),進(jìn)而分析是否由于其他因素引起這些差異。研究假設(shè)研究假設(shè)(research hypothesis)是變量間有關(guān)系的明確陳述。研究假設(shè)有共同的方面-不等價(jià)陳述,即假定變量間存在一定的關(guān)系(有方向研究假設(shè)-“多于”、“少于”和無(wú)方向研究假設(shè)-“不同于”)。無(wú)方向研究假設(shè)(nondirectional research hypothesis)反映群體間的差異

13、,但是差異的方向是不確定的??梢杂孟旅娴氖阶颖硎酒渲蠬1表示第一個(gè)(可能有幾個(gè)研究假設(shè))研究假設(shè)的符號(hào);右邊表示兩個(gè)變量不相同的關(guān)系;有方向研究假設(shè)(directional research hypothesis)反映群體間的差異,而且差異的方向是確定的。其中的大于號(hào),表示第一個(gè)變量大于第二個(gè)變量的關(guān)系研究假設(shè)的目的是什么?直接檢驗(yàn)的研究假設(shè)是研究過(guò)程中的重要一步。通過(guò)比較檢驗(yàn)的結(jié)果與隨機(jī)預(yù)期的結(jié)果(也就是零假設(shè))來(lái)確定這兩個(gè)中哪一個(gè)是你觀(guān)察到得群體間差異的更好的解釋。討論有方向和無(wú)方向假設(shè)的另一種方式是討論單位和雙尾檢驗(yàn)。單尾檢驗(yàn)(one-tailed test反映有方向假設(shè))假定了特定方向

14、的差異,如我們假設(shè)群體1的得分比群體2高。雙尾檢驗(yàn)(two-tailed test反映無(wú)方向假設(shè))假定差異沒(méi)有特定的方向。如果你想檢驗(yàn)不同類(lèi)型的假設(shè)(單尾和雙尾的檢驗(yàn)),建立拒絕或接受零假設(shè)的概率水平,這個(gè)區(qū)別就十分重要。在第十章更多討論。研究假設(shè)和零假設(shè)的一些區(qū)別:首先,零假設(shè)表示兩個(gè)變量之間沒(méi)有關(guān)系(相等),而另一個(gè)表示有關(guān)系(不相等);其次,零假設(shè)總是對(duì)應(yīng)總體,而研究假設(shè)總是對(duì)應(yīng)樣本;第三,零假設(shè)只能間接檢驗(yàn),而研究假設(shè)能夠被直接檢驗(yàn);第四,零假設(shè)常用希臘字母表達(dá),而研究假設(shè)常用羅馬字母表達(dá)。好假設(shè)的標(biāo)準(zhǔn)是什么假設(shè)是學(xué)術(shù)猜測(cè)-進(jìn)一步研究的起點(diǎn)。案例說(shuō)明,這項(xiàng)研究是考察為工作到很晚的身為父

15、母的員工提供的放學(xué)后兒童照料對(duì)父母工作適應(yīng)性的影響。下面是一個(gè)很好的假設(shè):讓自己的孩子加入放學(xué)后兒童照料計(jì)劃的父母一年之內(nèi)的耽誤的工作日會(huì)減少,同時(shí)依據(jù)工作態(tài)度調(diào)查的測(cè)量,工作態(tài)度也會(huì)比沒(méi)有讓自己的孩子加入計(jì)劃的父母更積極。下面是標(biāo)準(zhǔn):首先,一個(gè)好的假設(shè)以陳述句的形式出現(xiàn)而不是以問(wèn)題出現(xiàn)。其次,一個(gè)好的假設(shè)提出變量間預(yù)期的關(guān)系。案例中清楚的描述了放學(xué)后兒童照料、父母的態(tài)度和缺勤率間的關(guān)系。第三,假設(shè)反映他們建立的理論和文獻(xiàn)基礎(chǔ)。第四,假設(shè)應(yīng)該簡(jiǎn)短并切中要點(diǎn),第五,好的假設(shè)可檢驗(yàn)的假設(shè)。7. 你的曲線(xiàn)是正態(tài)的嗎-概率和概率的重要性為什么學(xué)習(xí)概率學(xué)習(xí)概率是理解正態(tài)曲線(xiàn)的基礎(chǔ),也是理解推論統(tǒng)計(jì)的基礎(chǔ)

16、。為什么?首先,正態(tài)曲線(xiàn)給我們提供了理解任何可能結(jié)果的概率的基礎(chǔ)。其次,概率研究是決定我們?cè)陉愂鎏囟ǖ陌l(fā)現(xiàn)是“真”時(shí)所具有的可信度的基礎(chǔ)。或者更好的說(shuō)法是,某個(gè)結(jié)果沒(méi)有出現(xiàn)是由于偶然因素。一旦把對(duì)零假設(shè)和研究假設(shè)的理解和概率基礎(chǔ)的想法結(jié)合在一起,我們就可以討論特定結(jié)果出現(xiàn)的可能性。正態(tài)曲線(xiàn)正態(tài)曲線(xiàn)(normal curve)具備三個(gè)特征的數(shù)據(jù)分布的形象表示正態(tài)曲線(xiàn)表示均值、中位數(shù)、眾數(shù)相等的數(shù)值分布;正態(tài)曲線(xiàn)以均值為中心完全對(duì)稱(chēng);正態(tài)曲線(xiàn)的雙尾是漸近的(曲線(xiàn)的雙尾越來(lái)越逼近橫軸,但是永遠(yuǎn)不會(huì)與橫軸相交)。我們希望接下來(lái)的問(wèn)題是:“但是有許多數(shù)據(jù)集的分布不是正態(tài)的,對(duì)吧?”是的,但當(dāng)我們處理大樣

17、本數(shù)據(jù)集,而且重復(fù)的從總體中抽取樣本時(shí),曲線(xiàn)的數(shù)值就接近正態(tài)曲線(xiàn)的形狀,這很重要,因?yàn)槲覀冇懻摰耐ㄟ^(guò)樣本推論總體時(shí)所作的大部分工作都是基于這樣的假設(shè)總體中抽取的樣本時(shí)正態(tài)分布的。而且事實(shí)是大體上許多事物的分布特征就是我們所說(shuō)的正態(tài)分布。也就是說(shuō)大多數(shù)事件或發(fā)生次數(shù)正好在數(shù)據(jù)分布的中間,而兩端卻較少。更正態(tài)的曲線(xiàn)101如果深入討論,能夠發(fā)現(xiàn)均值為100,標(biāo)準(zhǔn)差為10的正態(tài)分布表示的數(shù)值范圍是70到130;有關(guān)正態(tài)分布、均值和標(biāo)準(zhǔn)差的一個(gè)重要事實(shí):對(duì)任何數(shù)值分布來(lái)說(shuō)(不論均值和標(biāo)準(zhǔn)差的具體數(shù)值),如果數(shù)值是正態(tài)分布的,幾乎100%的數(shù)值處于均值的-3到3個(gè)標(biāo)準(zhǔn)差范圍內(nèi)。如果數(shù)值分布是正態(tài)的,我們也

18、可以說(shuō)數(shù)值會(huì)落在x軸的不同數(shù)據(jù)點(diǎn)之間。實(shí)際上數(shù)值分布中大約34%(實(shí)際是34.13%)的數(shù)值落在了一個(gè)均值和均值以上1個(gè)標(biāo)準(zhǔn)差(即110)的范圍內(nèi)。我們最鐘意的標(biāo)準(zhǔn)值:z值在一般的研究中,我們會(huì)發(fā)現(xiàn)所處理的分布相當(dāng)不同,但是我們需要對(duì)他們進(jìn)行相互比較,而進(jìn)行這樣的比較我們需要一定的標(biāo)準(zhǔn)。這就是標(biāo)準(zhǔn)值(standard scores),這些值以標(biāo)準(zhǔn)差為單位進(jìn)行了標(biāo)準(zhǔn)化所以是可以比較的。例如,均值為50,標(biāo)準(zhǔn)差為10的分布的標(biāo)準(zhǔn)值與均值為100,標(biāo)準(zhǔn)差為5的分布的標(biāo)準(zhǔn)值都是1;雖然還有其他類(lèi)型的標(biāo)準(zhǔn)值,但是學(xué)習(xí)統(tǒng)計(jì)學(xué)過(guò)程中最長(zhǎng)看到的是z值(z scores):原始數(shù)據(jù)于數(shù)據(jù)分布均值的差除以標(biāo)準(zhǔn)差。

19、換句話(huà)說(shuō),z值就是偏離均值的標(biāo)準(zhǔn)差的個(gè)數(shù)。這是一個(gè)很好的想法,可以不用考慮不同數(shù)據(jù)分布的均值數(shù)值,單獨(dú)來(lái)看各自分布中的相對(duì)位置來(lái)進(jìn)行相互比較。Z值表示什么:特定的z值表示一個(gè)原始數(shù)值,也表示數(shù)據(jù)分布在x軸上的特定位置。而且z越大,距離均值越遠(yuǎn)。當(dāng)z為非整數(shù)時(shí),需要使用微積分來(lái)計(jì)算x軸上每一個(gè)可能的值對(duì)應(yīng)的曲線(xiàn)面積z值真正表示什么:統(tǒng)計(jì)游戲的另一個(gè)作用是能估計(jì)某個(gè)結(jié)果的概率。我們使用一些標(biāo)準(zhǔn)來(lái)判斷我們考慮的事件的發(fā)生是高于還是低于我們預(yù)期的隨機(jī)概率水平。研究假設(shè)提出了預(yù)期事件發(fā)生的命題,我們使用統(tǒng)計(jì)工具來(lái)估計(jì)事件發(fā)生的概率。比如說(shuō),一朋友給你一枚硬幣,并讓你決定是否真幣也就是拋十次,可以得到5次

20、正面、5次反面?,F(xiàn)在的問(wèn)題是出現(xiàn)多少次正面會(huì)確認(rèn)這枚硬幣是偽造的?“5%”,是統(tǒng)計(jì)學(xué)家們使用的標(biāo)準(zhǔn),如果事件(正面出現(xiàn)的次數(shù)、一次考試的成績(jī)、兩個(gè)數(shù)據(jù)組的舉止的差)發(fā)生的概率是極值(極值的定義為出現(xiàn)次數(shù)小于5%),那么就是不可能出現(xiàn)的結(jié)果,在這個(gè)案例中就是不正當(dāng)?shù)慕Y(jié)果。10次隨機(jī)拋幣,所有的結(jié)果的組合是2的10次方,即1024種:我們的定義標(biāo)準(zhǔn)也是5%,如果觀(guān)察到得結(jié)果的概率小于5%,我們可以斷定這是不可能的,除非有非概率事件出現(xiàn)我們的結(jié)論就是“非概率事件”是偽造的硬幣。從上表中可以看到,觀(guān)察到8、9、10次正面的結(jié)果都小于5%,因此,如果10次的結(jié)果是8、9、10次正面,結(jié)論是這枚硬幣不是真

21、的。(當(dāng)然出現(xiàn)0、1、2次也能得出相同結(jié)論,反面亦然)。在z值中,1.65是該臨界點(diǎn),即1.65以下包含了曲線(xiàn)覆蓋的95%區(qū)域。使用計(jì)算機(jī)計(jì)算z值第IV部分顯著性差異-使用推論統(tǒng)計(jì)8. 顯著性的顯著顯著性的概念研究案例,“單親母親家庭中母親的職業(yè)和青少年的日常經(jīng)驗(yàn)”。特別的是他們調(diào)查了母親有工作和沒(méi)工作的青少年在態(tài)度上是否存在差異,近一步,在是否存在差異的討論中增加顯著性,因此我們的研究假設(shè)類(lèi)似如下的陳述:“依據(jù)情緒狀態(tài)的測(cè)量,母親工作和不工作的青少年對(duì)母親就業(yè)的態(tài)度具有顯著性差異”。顯著性的含義是指兩個(gè)群體的態(tài)度之間的任何差異是由于系統(tǒng)因素的影響而不是偶然性因素。在這個(gè)案例中,影響因素是母親

22、是否工作,我們假定控制了可能影響兩個(gè)群體之間差異的所有其他因素,因此,余下的解釋青少年態(tài)度差異的唯一因素就是母親是否工作。這是正確的解釋?zhuān)€不完全。是否只有我們是完美的:我們的世界并不完美,所以我們?cè)谝欢ǔ潭壬洗_信我們確定的引起群體間差異的那些因素時(shí)要留有余地。在大多數(shù)涉及假設(shè)檢驗(yàn)的科學(xué)研究中一定存在一定數(shù)量的不能控制的誤差-這也是前幾章討論過(guò)的偶然性因素。你愿意承擔(dān)的風(fēng)險(xiǎn)水平或者概率水平就是顯著水平。顯著水平(significance level)是不能100%確信試驗(yàn)中觀(guān)察到的結(jié)果是由于處理因素或需要檢驗(yàn)的因素引起的-在案例中是母親是否工作-所要承擔(dān)的風(fēng)險(xiǎn)。如果你看到的陳述式顯著性結(jié)論是

23、在.05概率水平下(或更專(zhuān)業(yè)的說(shuō)p<.05),換句話(huà)說(shuō),就是20次中有1次所發(fā)現(xiàn)的任何差異不是由于假定的原因,而是由于其他未知的原因引起的。你的工作就是盡可能減少這種可能性,消除所有可能引起觀(guān)察到的任何差異的其他原因。沒(méi)有可能完全消除,所以,必須分配一定的概率水平,并謹(jǐn)慎的陳述結(jié)論??傊?,研究者定義了他原因承擔(dān)的風(fēng)險(xiǎn)水平。如果結(jié)果落在這個(gè)范圍內(nèi),也就是說(shuō)這不是偶然出現(xiàn)的-而是由其他因素在產(chǎn)生影響。研究這就知道零假設(shè)不是觀(guān)察到得結(jié)果的最有利的解釋?zhuān)喾囱芯考僭O(shè)是可選擇的解釋。另一個(gè)案例,這是假設(shè)的案例。研究者有興趣了解參與學(xué)前項(xiàng)目的孩子與沒(méi)有參與的孩子在學(xué)習(xí)成績(jī)上是否存在差異。零假設(shè)是“兩

24、個(gè)群體的學(xué)習(xí)成績(jī)相等“;研究假設(shè)是“參與學(xué)前項(xiàng)目的孩子的平均成績(jī)高于沒(méi)有參與項(xiàng)目的孩子的平均成績(jī)”。作為一個(gè)優(yōu)秀的研究者,你的工作就是表明(盡你所能)兩個(gè)群體之間存在任何差異僅僅是由于學(xué)前項(xiàng)目的影響,但可以絕對(duì)確定嗎?不。如果推斷考試成績(jī)的差異是由于經(jīng)歷的不同,就得接受一定的風(fēng)險(xiǎn),實(shí)際上風(fēng)險(xiǎn)水平就是你愿意執(zhí)行的顯著性水平。統(tǒng)計(jì)顯著性(statistical significance)是指零假設(shè)為真的情況下拒絕零假設(shè)所有承擔(dān)的風(fēng)險(xiǎn)水平。就上面的例子來(lái)說(shuō),在找的數(shù)據(jù)證據(jù)下,群體成員的身份似乎對(duì)學(xué)習(xí)成績(jī)有影響,但是在真實(shí)的世界中卻可能沒(méi)有差異。如果你拒絕了零假設(shè),就犯了一個(gè)錯(cuò)誤。犯此類(lèi)錯(cuò)誤你可能承擔(dān)

25、的風(fēng)險(xiǎn)(或者說(shuō)顯著水平)就是人們熟知的第一類(lèi)錯(cuò)誤。世界上最重要的表格:格子2表示嚴(yán)重的錯(cuò)誤,拒絕了零假設(shè),而零假設(shè)實(shí)際上是真實(shí)的,就是人們常說(shuō)的第一類(lèi)錯(cuò)誤,也就是顯著水平;格子3也是一種嚴(yán)重錯(cuò)誤,接受了虛假的零假設(shè),這就是第二類(lèi)錯(cuò)誤?;仡櫟谝活?lèi)錯(cuò)誤:第一類(lèi)錯(cuò)誤或者說(shuō)顯著水平具有特定的值,而且與任何零假設(shè)檢驗(yàn)中定義的你愿意承擔(dān)的風(fēng)險(xiǎn)聯(lián)系在一起。一般設(shè)置的顯著水平是在.01與.05之間。例如,如果顯著水平是.01,這意味著在任何一個(gè)零假設(shè)檢驗(yàn)中,只有1%的可能性是零假設(shè)為真,而你拒絕了零假設(shè),并且在群體之間實(shí)際沒(méi)有差異的情況下得出群體之間有差異的結(jié)論。換句話(huà)說(shuō),拒絕零假設(shè),犯錯(cuò)的概率只有1%,99

26、%的可能是我的拒絕是正確的,即實(shí)際中群體之間確實(shí)有差異。顯著性的意義對(duì)研究者來(lái)說(shuō),有趣的狀況是發(fā)現(xiàn)實(shí)驗(yàn)的結(jié)果在統(tǒng)計(jì)上是顯著的(拒絕零假設(shè)在一定的顯著水平)。-研究在統(tǒng)計(jì)上成功了,而且零假設(shè)不是發(fā)現(xiàn)結(jié)果的合理解釋?zhuān)词聦?shí)上是不是由于偶然因素導(dǎo)致的差異)。但是統(tǒng)計(jì)顯著性的值和其重要性或意義必須認(rèn)真考慮。例如,我們面對(duì)的情況是將規(guī)模非常大文盲青年分A、B組分別接受電腦、課堂閱讀訓(xùn)練,得出的閱讀測(cè)驗(yàn)平均成績(jī)是75.6和75.7,兩組的方差數(shù)量幾乎相等。但是對(duì)獨(dú)立均值的顯著性進(jìn)行t檢驗(yàn)時(shí),結(jié)果在.01的水平是顯著的,表明電腦學(xué)習(xí)者比教室學(xué)習(xí)者學(xué)的更好。兩組之間0.1的差異實(shí)際上是統(tǒng)計(jì)顯著的,但是是否有意

27、義?考試成績(jī)0.1分的提高是否能夠?yàn)榛ㄙM(fèi)3000000美元建立這個(gè)項(xiàng)目提供充分的合理解釋?zhuān)拷y(tǒng)計(jì)顯著性的重要性結(jié)論:統(tǒng)計(jì)顯著性本身或內(nèi)部是無(wú)意義的;統(tǒng)計(jì)顯著性不能脫離發(fā)生的背景獨(dú)立地解釋?zhuān)唤y(tǒng)計(jì)學(xué)重要但不是終極目標(biāo)。推論統(tǒng)計(jì)介紹描述統(tǒng)計(jì)是用于描述樣本的特征,而推論統(tǒng)計(jì)是基于樣本特征推斷總體的某些特征。先了解推論方法應(yīng)用的邏輯,下面是研究項(xiàng)目的一般步驟,仍以青少年對(duì)母親工作的態(tài)度為案例:下面是事件可能發(fā)生的次序:1. 研究者從母親工作的青少年和母親不工作的青少年中選擇代表性樣本。樣本選擇方式是樣本能夠代表從中選擇的總體;2. 每一個(gè)青少年要進(jìn)行一次測(cè)試來(lái)評(píng)價(jià)她的態(tài)度。接著計(jì)算群體的均值并使用一些檢驗(yàn)

28、方法來(lái)比較;3. 可以得出的結(jié)論是成績(jī)之間的差異是由于偶然性因素引起,或是由于群體之間“真實(shí)的”以及統(tǒng)計(jì)顯著的差異引起(也就是母親工作)4. 可以得出的結(jié)論是從中選擇樣本的總體中母親就業(yè)和青少年態(tài)度之間的關(guān)系。換句話(huà)說(shuō),基于樣本數(shù)據(jù)分析所得結(jié)論進(jìn)行的推論是關(guān)于青少年總體的。如何選擇用于檢驗(yàn)的方法:上面的3讓我們提出這樣的問(wèn)題“我如何選擇恰當(dāng)?shù)慕y(tǒng)計(jì)檢驗(yàn)來(lái)確定群體之間的差異是否存在?”,檢驗(yàn)方法太多了,你必須決定使用哪一種已經(jīng)如何使用(而這需要的是經(jīng)驗(yàn))。為了實(shí)現(xiàn)我們目的并開(kāi)始學(xué)習(xí),我們建立了各種工具的簡(jiǎn)易流程表。顯著性檢驗(yàn)介紹推論統(tǒng)計(jì)的優(yōu)勢(shì)就是可以依據(jù)樣本的信息得出關(guān)于總體的結(jié)論。進(jìn)行推論的最有

29、用的工具之一就是統(tǒng)計(jì)顯著性檢驗(yàn),顯著性檢驗(yàn)可以依據(jù)所提問(wèn)題的性質(zhì)和零假設(shè)的形式而應(yīng)用于不同的情形。如何進(jìn)行顯著性檢驗(yàn):計(jì)劃:顯著性檢驗(yàn)是基于這樣的事實(shí),每一類(lèi)型的零假設(shè)都與特定的統(tǒng)計(jì)類(lèi)型聯(lián)系在一起。而每一種統(tǒng)計(jì)類(lèi)型與特定的分布聯(lián)系在一起,你要比較從樣本獲得的數(shù)據(jù)的分布。依據(jù)樣本特征與檢驗(yàn)的分布特征的比較你可以推斷樣本特征是否不同于預(yù)期的隨機(jī)分布特征。下面是任何零假設(shè)進(jìn)行統(tǒng)計(jì)檢驗(yàn)時(shí)需要采用的一般步驟。1. 零假設(shè)的陳述;2. 設(shè)置零假設(shè)的風(fēng)險(xiǎn)水平(顯著水平,或第一類(lèi)錯(cuò)誤);3. 選擇恰當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量。每一個(gè)零假設(shè)伴隨著特定的檢驗(yàn)統(tǒng)計(jì)量;在本書(shū)的這部分你可以知道什么樣的檢驗(yàn)與什么樣的問(wèn)題類(lèi)型相聯(lián)系

30、;4. 計(jì)算檢驗(yàn)統(tǒng)計(jì)值。檢驗(yàn)統(tǒng)計(jì)值(也叫實(shí)際值)是特定的統(tǒng)計(jì)檢驗(yàn)的結(jié)果。例如,兩個(gè)群體的平均值之間差異的顯著性,都需要進(jìn)行統(tǒng)計(jì)檢驗(yàn),得到一個(gè)具體的數(shù)值。5. 使用特定統(tǒng)計(jì)量的統(tǒng)計(jì)臨界值表確定拒絕零假設(shè)需要的值。每一個(gè)檢驗(yàn)統(tǒng)計(jì)量(同時(shí)考慮群體規(guī)模和愿意承擔(dān)的風(fēng)險(xiǎn))都有相應(yīng)的臨界值。這個(gè)值是零假設(shè),是真實(shí)的情況下你預(yù)期的拒絕零假設(shè)的統(tǒng)計(jì)檢驗(yàn)值;6. 比較實(shí)際值和臨界值,就是比較通過(guò)檢驗(yàn)統(tǒng)計(jì)量獲得的值與你預(yù)期的隨機(jī)的情況下對(duì)應(yīng)的值(臨界值);7. 如果實(shí)際值大于臨界值,不能接受零假設(shè)。即,零假設(shè)的等式陳述(反映偶然性)不是我們發(fā)現(xiàn)的差異的最有力的解釋。這也是推論方法表現(xiàn)出其優(yōu)點(diǎn)的地方。8. 如果實(shí)際

31、值沒(méi)有超過(guò)臨界值,零假設(shè)是最有力的解釋。一張圖勝過(guò)千言萬(wàn)語(yǔ):1. 整個(gè)曲線(xiàn)表示基于特定零假設(shè)-如兩個(gè)群體之間的差異或相關(guān)系數(shù)的顯著性-的所有可能的結(jié)果;2. 臨界值是這樣的點(diǎn),即超過(guò)這個(gè)點(diǎn)的實(shí)際結(jié)果如此稀少,因此可以推斷實(shí)際結(jié)果不是由于偶然因素而是由于其他因素引起的。在這個(gè)案例中,我們定義的稀少程度是發(fā)生的可能性不足5%;3. 如果結(jié)果表示實(shí)際值落在臨界值的左邊(就是小于極值),結(jié)論就是零假設(shè)是觀(guān)察到的任何差異的最有力的解釋。4. 如果實(shí)際值落在臨界值的右邊(就是大于極值),結(jié)論就是研究假設(shè)是觀(guān)察到得任何差異的最有力的解釋。9. 兩個(gè)群體的t檢驗(yàn)-不同群體的均值檢驗(yàn)獨(dú)立樣本t檢驗(yàn)介紹研究人員對(duì)

32、297個(gè)澳大利亞大學(xué)生和249個(gè)印度大學(xué)生進(jìn)行飲食態(tài)度測(cè)試和肥胖恐懼量表測(cè)試,然后比較群體得分,就澳大利亞學(xué)生和印度學(xué)生的均值比較而言,印度學(xué)生的兩個(gè)測(cè)試得分都高于澳大利亞學(xué)生。飲食態(tài)度測(cè)試的結(jié)果是t(545)=-4.19,p<.0001,肥胖恐懼量的測(cè)試結(jié)果是t(545)=-7.64,p<.0001。結(jié)果意味著什么?為什么t檢驗(yàn)用于獨(dú)立均值?研究者的興趣在于發(fā)現(xiàn)兩個(gè)相互獨(dú)立的群體在一個(gè)(或多個(gè))變量的平均值上是否有差異。研究者采用獨(dú)立均值的t檢驗(yàn),依據(jù)對(duì)每一個(gè)結(jié)果變量得出的結(jié)論,兩個(gè)群體之間的差異在等于和小于.0001的顯著性水平下是顯著的。這么小的第一類(lèi)錯(cuò)誤意味著兩個(gè)群體得分的

33、差異是由群體成員本身之外的因素引起的幾率非常小。幾乎每一個(gè)統(tǒng)計(jì)檢驗(yàn)都有特定的假設(shè)支持檢驗(yàn)的使用。例如,t檢驗(yàn)的一個(gè)主要的假設(shè)是兩個(gè)群體中每個(gè)群體的變化的量是相等的。這是方差齊性假定。如果樣本規(guī)模足夠大就會(huì)破壞這個(gè)假定。計(jì)算檢驗(yàn)統(tǒng)計(jì)量如下公式是計(jì)算獨(dú)立均值t檢驗(yàn)中t值的公式。公式的分子式均值之間的差。群體內(nèi)和群體之間的變化的數(shù)量構(gòu)成分母。下面的數(shù)據(jù)是一個(gè)案例去說(shuō)明如何使用t檢驗(yàn):老年癡呆患者日常生活秩序不同能夠記住單詞的數(shù)量,群體1使用視覺(jué)教學(xué),群體2使用視覺(jué)教學(xué)和發(fā)生訓(xùn)練。下面是著名的八個(gè)步驟和t檢驗(yàn)統(tǒng)計(jì)量的計(jì)算。1. 零假設(shè)和研究假設(shè)的表述:零假設(shè)表示群體1和群體2的均值之間沒(méi)有差異,就我們

34、的目的而言,研究假設(shè)表示兩個(gè)群體的均值之間有差異。研究假設(shè)是雙側(cè)的無(wú)方向假設(shè),因?yàn)檠芯考僭O(shè)只是表示差異存在,而沒(méi)有特定的方向。零假設(shè):研究假設(shè):2. 設(shè)置零假設(shè)的風(fēng)險(xiǎn)水平(或顯著水平,或第一類(lèi)錯(cuò)誤),此處設(shè)為.05,完全由研究者決定;3. 選擇合適的檢驗(yàn)統(tǒng)計(jì)量。使用之前的流程圖,我們確定合適的檢驗(yàn)方法是獨(dú)立均值的t檢驗(yàn)。因?yàn)檫@兩個(gè)群體相互獨(dú)立,所以不是非獨(dú)立均值的t檢驗(yàn);4. 計(jì)算檢驗(yàn)統(tǒng)計(jì)值(也叫實(shí)際值)。按書(shū)中例子計(jì)算的t=-.14。要記住一點(diǎn),即使檢驗(yàn)是無(wú)方向的,而且任何差異都是假定的,差異的符號(hào)也是無(wú)意義的。5. 使用特定的統(tǒng)計(jì)量的臨界值分布表確定拒絕零假設(shè)需要的值。第一個(gè)任務(wù)是確定自由

35、度(degrees of freedom,df),自由度近似于樣本規(guī)模。對(duì)于目前選定的檢驗(yàn)統(tǒng)計(jì)量來(lái)說(shuō)自由度是n1-1+n2-1。在這個(gè)案例中是58。這是這類(lèi)檢驗(yàn)統(tǒng)計(jì)量的自由度,但不是對(duì)其他統(tǒng)計(jì)量也合適。使用這個(gè)數(shù)字(58),你愿意承擔(dān)的風(fēng)險(xiǎn)水平(早先定義的.05)以及雙側(cè)檢驗(yàn),你就可以使用t檢驗(yàn)表來(lái)查找臨界值。哦,表中沒(méi)有自由度為58的值,又該如何?如果選擇自由度為55的值,你會(huì)顯得保守,因?yàn)槟闶褂昧诵∮诂F(xiàn)有規(guī)模的樣本對(duì)應(yīng)的值(臨界值t會(huì)變大);反之,選擇自由度60的值,但相對(duì)于58更為隨意一些。雖然統(tǒng)計(jì)學(xué)家的看法不同,我們通常選擇最接近實(shí)際樣本規(guī)模的值。因此選了60對(duì)應(yīng)的臨界值2.001;6

36、. 比較實(shí)際值和臨界值。實(shí)際值是-.14,拒絕零假設(shè)也就是群體1與群體2取得的成績(jī)沒(méi)有差異的臨界值是2.001.7. 做出決定。如果實(shí)際值大于臨界值就不能接受零假設(shè)。否則,零假設(shè)就是最有力的解釋。在這個(gè)案例中,實(shí)際值小于臨界值,我們只能選擇接受零假設(shè)。那么如何解釋?zhuān)簍表示我們所使用的檢驗(yàn)統(tǒng)計(jì)量;58是樣本自由度-.14是實(shí)際值p>.05,表示對(duì)零假設(shè)的任何檢驗(yàn)來(lái)說(shuō),兩個(gè)群體的差異是由于隨機(jī)因素的可能性大于5%。特殊效果:差異是真實(shí)的嗎如果已經(jīng)知道群體之間具有顯著性差異,但是投入64000美元的問(wèn)題不僅僅是差異是否顯著,而且是否有意義的問(wèn)題。我們的問(wèn)題是代表不同群體的數(shù)據(jù)分布之間的差異是否

37、足以說(shuō)明你觀(guān)察到的差異,以及你檢驗(yàn)的差異是真實(shí)的差異!好吧,現(xiàn)在進(jìn)入效應(yīng)量的討論。效應(yīng)量是對(duì)兩個(gè)群體之間如何相互不同的測(cè)量-也是對(duì)處理規(guī)模的測(cè)量。類(lèi)似于多大才算大。而且計(jì)算效應(yīng)量特別有趣的二方面是不考慮樣本規(guī)模。計(jì)算效應(yīng)量并且對(duì)效應(yīng)量做出判斷是理解顯著性結(jié)果的全新的維度。現(xiàn)在看下面的案例。研究者檢驗(yàn)的問(wèn)題是參與社區(qū)自助服務(wù)是否提高了美國(guó)老年人的生活質(zhì)量(從1到10分等級(jí))。下面是統(tǒng)計(jì)結(jié)果。而且結(jié)論是在風(fēng)險(xiǎn)水平.034下差異是顯著的(也就是p<.05)?,F(xiàn)在,差異是顯著的,但是差異的規(guī)模是多大?科亨的書(shū)可以指導(dǎo)研究者就差異和變量之間的關(guān)系提出的不同問(wèn)題計(jì)算效應(yīng)量。下面是具體介紹。計(jì)算和理解

38、效應(yīng)量與其他統(tǒng)計(jì)技術(shù)一樣,計(jì)算效應(yīng)量(effect size)的方式也有多種。我們會(huì)介紹最簡(jiǎn)單、直接的方法:以均值之間的差除以任何一個(gè)群體的標(biāo)準(zhǔn)差。這樣做有一定的風(fēng)險(xiǎn)-因?yàn)檫@是假定了兩個(gè)群體的標(biāo)準(zhǔn)差相等。結(jié)果等于.366,意味著什么?科亨等人非常重要的一點(diǎn)是效應(yīng)量的大、中、小的范圍:l 小效應(yīng)量范圍:0.0.20;l 中等效應(yīng)量范圍:.20.50;l 大效應(yīng)量范圍:.5以上。案例中的.366屬于中等規(guī)模。但實(shí)際上意味著什么?效應(yīng)量給我們這樣的認(rèn)識(shí),即每個(gè)群體相對(duì)于另一個(gè)群體的位置。例如,效應(yīng)量=0,意味著兩個(gè)群體非常的相似而且?guī)缀跬耆丿B-兩個(gè)數(shù)值分布之間沒(méi)有差異。另一方面,效應(yīng)量為1意味著兩

39、個(gè)群體大約有45%重疊,而且效應(yīng)量越大意味著兩個(gè)群體重疊的部分越少。項(xiàng)立交更多效應(yīng)量的信息,參看行為科學(xué)的統(tǒng)計(jì)檢定力分析。當(dāng)然,簡(jiǎn)單而更合適的消應(yīng)力公式,分母可以使用綜合的方差:10. 兩個(gè)群體的t檢驗(yàn)-兩個(gè)相關(guān)群體的均值檢驗(yàn)非獨(dú)立樣本t檢驗(yàn)介紹如何給孩子提供最好的教育是個(gè)大問(wèn)題,孩子之間差異太大,所以不得不在滿(mǎn)足整體的基本需求和保證特殊的孩子(差異連續(xù)體的兩端)得到他們需要的機(jī)會(huì)之間尋求平衡。教授研究閱讀資料和常規(guī)教學(xué)對(duì)有學(xué)習(xí)障礙的孩子的閱讀能力的影響,研究發(fā)現(xiàn),大體上來(lái)說(shuō),對(duì)閱讀資料和課堂教學(xué)給予一年的日常知道在閱讀成績(jī)提高方面沒(méi)有差異。通過(guò)對(duì)閱讀資料這一組前測(cè)試和后測(cè)試的特定比較,他們發(fā)

40、現(xiàn)t34=1.23,p>.05。在項(xiàng)目初,閱讀資料組孩子的閱讀成績(jī)是85.5;項(xiàng)目最后,為88.5-有差異,但是差異不顯著。為什么用非獨(dú)立均值檢驗(yàn)?非獨(dú)立均值檢驗(yàn)表明是相同的群體在兩種不同的條件下進(jìn)行相同的研究。在這個(gè)案例中,條件是實(shí)驗(yàn)前和實(shí)驗(yàn)結(jié)束后。首要的原因是相同的孩子測(cè)試兩次,所以我們使用非獨(dú)立均值檢驗(yàn)。依據(jù)上面的結(jié)果你可以知道,項(xiàng)目前后閱讀成績(jī)沒(méi)有差異。t值(1.23)非常小,沒(méi)有落在我們拒絕零假設(shè)的值域范圍之外。換句話(huà)說(shuō),變化太小,我們不能說(shuō)變化時(shí)由隨機(jī)因素之外的因素引起的。知識(shí)和智識(shí)路徑:下面介紹如何使用流程表選擇合適的統(tǒng)計(jì)檢驗(yàn),也就是非獨(dú)立均值的t檢驗(yàn)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量非獨(dú)立

41、均值t檢驗(yàn)包含每一個(gè)群體均值的比較,而且重點(diǎn)是不同數(shù)值之間的差異。如下公式,兩次測(cè)試的差異總和構(gòu)成分子,表示群體之間的差異。下面是著名的8步驟和t檢驗(yàn)統(tǒng)計(jì)量的計(jì)算:1. 零假設(shè)和研究假設(shè)的表述:“零假設(shè)”-前測(cè)試和后測(cè)試的閱讀成績(jī)均值之間沒(méi)有差異;“研究假設(shè)”-單側(cè)、有方向的假設(shè),因?yàn)檠芯考僭O(shè)假定后測(cè)試成績(jī)高于前測(cè)試成績(jī)。零假設(shè):研究假設(shè):2. 設(shè)置零假設(shè)的風(fēng)險(xiǎn)水平=.05;3. 選擇合適的檢驗(yàn)統(tǒng)計(jì)量,采用之間的工具圖,選定合適的檢驗(yàn)方法是非獨(dú)立均值的t檢驗(yàn)。因?yàn)閮蓚€(gè)群體相互不獨(dú)立,所以不是獨(dú)立均值的t檢驗(yàn)。實(shí)際上,這兩個(gè)群體不是參與者群體而是相同參與者的兩組成績(jī),兩組之間相互依賴(lài)。非獨(dú)立均值

42、t檢驗(yàn)的另一個(gè)名稱(chēng)是“配對(duì)樣本的t檢驗(yàn)”,或相關(guān)樣本的t檢驗(yàn)。你會(huì)在第13章看到兩組成績(jī)之間相關(guān)關(guān)系的顯著性檢驗(yàn)和我們這里計(jì)算的t值之間有很大關(guān)系。4. 計(jì)算檢驗(yàn)統(tǒng)計(jì)值,帶入公式計(jì)算得到實(shí)際t值2.45;項(xiàng)目前測(cè)試成績(jī)的均值是6.32,項(xiàng)目測(cè)試后測(cè)試成績(jī)的均值是7.52。5. 使用特定統(tǒng)計(jì)量的臨界值分布表確定拒絕零假設(shè)需要的臨界值?,F(xiàn)在我們需要查閱與第9章相同的t值表。首先是確定自由度,自由度近似于樣本規(guī)模。對(duì)現(xiàn)在選定的檢驗(yàn)統(tǒng)計(jì)量來(lái)說(shuō),自由度是n-1,此處為24;使用自由度為24,風(fēng)險(xiǎn)水平為.05及單側(cè)檢驗(yàn),拒絕零假設(shè)的臨界值是1.711;6. 比較實(shí)際值和臨界值。實(shí)際值是2.45,大于拒絕零

43、假設(shè)值需要的臨界值;7. 做出決定。實(shí)際值大于臨界值就不能接受零假設(shè)。我們可以說(shuō),前測(cè)試成績(jī)和后測(cè)試成績(jī)的差異的確是由于隨機(jī)因素之外的因素引起的。如果實(shí)驗(yàn)安排正確,那么是什么因素影響結(jié)果?很簡(jiǎn)單-是日常閱讀項(xiàng)目的引入。那么如何解釋t(24)=2.45,p<.05;l T表示我們所用的檢驗(yàn)統(tǒng)計(jì)量l 24是自由度數(shù)值;l 2.45是實(shí)際值,l p<.05表示對(duì)零假設(shè)的任何檢驗(yàn)來(lái)說(shuō),后測(cè)成績(jī)的均值大于前測(cè)成績(jī)的均值是由于隨機(jī)因素的可能性小于5%。11. 兩個(gè)群體是否太多?-嘗試進(jìn)行方差分析方差分析介紹什么心理技能對(duì)于成為一個(gè)成功的運(yùn)動(dòng)員是必需的?研究者對(duì)運(yùn)動(dòng)員應(yīng)對(duì)技能量表的有效性進(jìn)行了檢

44、驗(yàn)。作為研究的一部分,他們使用簡(jiǎn)單的方差分析(或ANOVA)檢驗(yàn)假設(shè),也就是某項(xiàng)運(yùn)動(dòng)的訓(xùn)練年數(shù)與應(yīng)對(duì)技能(或運(yùn)動(dòng)員應(yīng)對(duì)技能量表的得分)的關(guān)系。因?yàn)樾枰獧z驗(yàn)兩個(gè)以上的群體,并比較這些群體的平均成績(jī),所以使用方差分析。具體的說(shuō),群體1是訓(xùn)練年數(shù)在6年之內(nèi)的運(yùn)動(dòng)員,群體2是訓(xùn)練了710年的運(yùn)動(dòng)員,群體3是訓(xùn)練年數(shù)在10年以上的運(yùn)動(dòng)員。方差分析的檢驗(yàn)統(tǒng)計(jì)量是F值(以這個(gè)統(tǒng)計(jì)量的建立者命名),結(jié)果是F(2.110)=13.08,p<.01。三個(gè)群體的壓力下巔峰表現(xiàn)子量表測(cè)試成績(jī)的均值兩兩不同。換句話(huà)說(shuō)測(cè)試成績(jī)的不同是由于在運(yùn)動(dòng)方面的訓(xùn)練年數(shù)的不同,而不是可能影響成績(jī)的隨機(jī)因素。下面介紹如何使用常用

45、的知識(shí)和智識(shí)路徑:l 我們檢驗(yàn)不同群體之間的差異,在這個(gè)案例中是檢驗(yàn)運(yùn)動(dòng)員巔峰成績(jī)的差異;l 每一個(gè)運(yùn)動(dòng)員只接受一次測(cè)試;l 有三個(gè)群體;l 合適的檢驗(yàn)統(tǒng)計(jì)是簡(jiǎn)單方差分析方差分析的不同類(lèi)型:方差分析有許多不同的形式,最簡(jiǎn)單的是簡(jiǎn)單方差分析(simple analysis of variance),也是本章的重點(diǎn),只分析一個(gè)因素或者一個(gè)處理變量(如群體身份),而有兩個(gè)以上的群體受到這個(gè)因素的影響。簡(jiǎn)單方差分析也叫做一元方差分析(one-way analysis of variance),因?yàn)橹挥幸粋€(gè)分組維度。實(shí)際上,方差分析在許多情況下類(lèi)似于t檢驗(yàn)。在這兩項(xiàng)檢驗(yàn)中都需要計(jì)算均值之間的差異。但方差

46、分析要處理兩個(gè)以上的均值。例如,我們調(diào)查每個(gè)星期呆在預(yù)備學(xué)校5、10、20個(gè)小時(shí)對(duì)語(yǔ)言發(fā)展的影響。每個(gè)孩子所屬的組別就是處理變量,或者就是分組因素。語(yǔ)言發(fā)展是被解釋變量或者是結(jié)果。實(shí)驗(yàn)設(shè)計(jì)如下所示:更復(fù)雜的方差分析是析因設(shè)計(jì)(factorial design),是分析一個(gè)以上的處理變量。下面的案例是研究參加預(yù)備學(xué)校的時(shí)間所產(chǎn)生的效應(yīng),但是性別差異產(chǎn)生的效應(yīng)也是研究的內(nèi)容。實(shí)驗(yàn)設(shè)計(jì)類(lèi)似如下所示:這是3*2的析因設(shè)計(jì)。3表示分組因素有三個(gè)層級(jí),2表示其他分組因素有兩個(gè)層級(jí)(男、女)。綜合起來(lái)就有6種不同的可能性。析因設(shè)計(jì)遵循和簡(jiǎn)單方差分析一樣的基本邏輯和原則,但是析因設(shè)計(jì)更為復(fù)雜,需要同時(shí)檢驗(yàn)一個(gè)

47、以上的因素的影響以及因素綜合的影響。不用擔(dān)心-接下來(lái)的一章會(huì)全面學(xué)習(xí)析因設(shè)計(jì)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量簡(jiǎn)單方差分析檢驗(yàn)兩個(gè)以上的群體在一個(gè)因素或一個(gè)維度上的均值差異。例如,你可能想知道四個(gè)群體(20、2、30、35歲的年齡群體)對(duì)私人學(xué)校的公共財(cái)政支持的態(tài)度。或者你想知道5個(gè)不同年級(jí)(2、4、6、8、10)的學(xué)生群體的父母參與學(xué)?;顒?dòng)的水平是否有差異。任何分析結(jié)果:l 只有一個(gè)維度或者一個(gè)處理變量;l 分組因素有兩個(gè)以上的層級(jí);l 關(guān)注不同群體在平均成績(jī)上的差異就使用簡(jiǎn)單方差分析。F值是檢驗(yàn)假設(shè)也就是群體之間有差異的檢驗(yàn)統(tǒng)計(jì)量,計(jì)算公式如公式11.1所示。就方差分析而言這是最簡(jiǎn)單的公式,但是對(duì)于前幾章學(xué)

48、習(xí)的其他檢驗(yàn)統(tǒng)計(jì)量來(lái)說(shuō)需要花費(fèi)更多精力來(lái)結(jié)算。這個(gè)比率背后的邏輯是這樣。如果組內(nèi)完全沒(méi)有變化(所有的成績(jī)都相同),那么組之間的任何差異都有意義,對(duì)吧?可能如此。方差分析公式比較組間的變化量(由于分組因素產(chǎn)生)與組內(nèi)的變化量(由于隨機(jī)因素產(chǎn)生)。如果比值為1,那么組內(nèi)的差異產(chǎn)生的變化量等于組間差異產(chǎn)生的變化量,而且組間的任何差異都不顯著。如果組間差異的平均值變大,F(xiàn)值也變大,如果F值變大,在所有的F值分布中就會(huì)更趨向于極值,也就是更可能由于隨機(jī)因素之外的因素影響。下面給出一些數(shù)據(jù)并初步的計(jì)算來(lái)說(shuō)明F值如何計(jì)算。例子,假定這是三個(gè)預(yù)備學(xué)校參與者群體和他們的語(yǔ)言測(cè)試成績(jī)。下面是著名的8個(gè)步驟和F檢驗(yàn)

49、統(tǒng)計(jì)量的計(jì)算1. 零假設(shè)和研究假設(shè)的表述。零假設(shè)11.2表示三個(gè)不同的群體沒(méi)有差異;方差分析,也叫F檢驗(yàn)(因?yàn)橛?jì)算得出的是F統(tǒng)計(jì)量或F比值),尋求不同群體之間的差異;F檢驗(yàn)不是分析配對(duì)差異,如群體1和群體2之間的差異。我們需要另一項(xiàng)統(tǒng)計(jì)技術(shù)進(jìn)行配對(duì)差異分析,本章后面會(huì)討論。公式11.3所示的是研究假設(shè),表示三個(gè)群體的均值之間相互差異。要注意的是所有的差異之間沒(méi)有方向,這是因?yàn)樗械腇值都是無(wú)方向的。到現(xiàn)在為止,我們已經(jīng)討論了單側(cè)和雙側(cè)檢驗(yàn),在討論方差分析時(shí)不需要確定單側(cè)還是雙側(cè),因?yàn)橐獧z驗(yàn)兩個(gè)以上的群體,而且F檢驗(yàn)是綜合的檢驗(yàn)(也就是檢驗(yàn)均值之間所有差異),討論特定差異的方向沒(méi)有意義。2. 設(shè)

50、置零假設(shè)的風(fēng)險(xiǎn)水平。.05,研究者自行決定3. 選擇合適的檢驗(yàn)統(tǒng)計(jì)量。使用流程圖,確定合適的檢驗(yàn)方法是簡(jiǎn)單方差分析;4. 計(jì)算檢驗(yàn)統(tǒng)計(jì)值(也叫實(shí)際值)?,F(xiàn)在我們代入具體的值并進(jìn)行計(jì)算。需要很多計(jì)算。l F值是組間差異和組內(nèi)差異的比值,要計(jì)算這些值,首先我們要計(jì)算每一種差異-組間、組內(nèi)和總的差異的平方和。l 組間差異平方和=所有值的均值和每一個(gè)群體的均值之差平方然后求和。這意味著每一群體的均值和總的均值的差異的大??;l 組內(nèi)差異平方和=群體內(nèi)每一個(gè)具體的值和該群體的均值之間的差異平方然后求和。這意味著群體內(nèi)每一個(gè)值和這個(gè)群體的均值的差異的大??;l 總的差異平方和=組間差異平方和與組內(nèi)平方和的總和

51、;現(xiàn)在我們計(jì)算這些值:首先計(jì)算“組間平方和”、“組內(nèi)平方和”、“總平方和”;其次,我們需要計(jì)算平方和的均值,也就是簡(jiǎn)單的平方和的平均值。我們是以近似的自由度(df)去除每一個(gè)平方和。自由度是樣本規(guī)?;蛘呷后w規(guī)模的近似值。對(duì)方差分析來(lái)說(shuō)我們需要兩類(lèi)自由度。對(duì)組間估計(jì)來(lái)說(shuō),自由都市k-1,其中k等于群體的數(shù)量(在該案例中,有3個(gè)群體,自由度是2),對(duì)組內(nèi)估計(jì)來(lái)說(shuō),我們需要的自由度是N-k,其中N是總體樣本規(guī)模(也就是說(shuō)自由度是30-3=27)。而且F比率是組間差異平方和均值與組內(nèi)平方和均值的簡(jiǎn)單比值=566.54/64.39=8.799,這就是實(shí)際的F值。要計(jì)算一個(gè)小小的F值確實(shí)挺麻煩的呀!你已經(jīng)

52、了解t檢驗(yàn),所以想知道t值(總是用于兩個(gè)群體的均值差異的檢驗(yàn))和F值(總是用于兩個(gè)以上的群體)之間的關(guān)系。有趣的是,兩個(gè)群體的F值等于兩個(gè)群體的t值的平方。5. 使用特定統(tǒng)計(jì)量的臨界值分布表確定拒絕零假設(shè)需要的值。由于F(2,27)=8.7999,在顯著水平.05、分子自由度為2、分母自由度為27情況下臨界值是3.36.6. 比較實(shí)際值與臨界值。8.799大于3.367. 做出決定,不能接受零假設(shè),也就是說(shuō),三個(gè)群體之間的兩兩差異不是由于隨機(jī)因素引起的。如果實(shí)驗(yàn)過(guò)程正確,可以說(shuō)是在預(yù)備學(xué)校的時(shí)間,引起的差異。那么如何解釋F(2,27)=8.7999,p<.05l F表示我們使用的是F統(tǒng)計(jì)

53、檢驗(yàn)量;l 2,27是組間估計(jì)和組內(nèi)估計(jì)的自由度數(shù)值;l 8.799是實(shí)際值;l P<.05,表示對(duì)零假設(shè)的任何檢驗(yàn)來(lái)說(shuō),每個(gè)群體語(yǔ)言技能的平均成績(jī)相互不同的原因是由于隨機(jī)因素而不是實(shí)驗(yàn)變量的影響造成的可能性小于5%。結(jié)論就是,三個(gè)群體之間存在顯著差異。12. 兩個(gè)因素-析因方差分析析因方差分析介紹人們?nèi)绾巫龀鰶Q策已經(jīng)成為迷惑心理學(xué)者幾十年的問(wèn)題.研究者研究積極參與決策過(guò)程(在一系列的條件下)的經(jīng)驗(yàn)和年齡如何對(duì)道德歸因產(chǎn)生影響。研究樣本由148個(gè)裁判構(gòu)成-56個(gè)足球裁判、55個(gè)籃球裁判以及37個(gè)手球裁判。他們的年齡范圍是1750歲,性別不是考慮的重要變量。在整個(gè)樣本中,大約8%沒(méi)有社會(huì)、

54、政治或運(yùn)動(dòng)領(lǐng)域全面參與決策制定過(guò)程的任何經(jīng)驗(yàn),大約53%表現(xiàn)積極但沒(méi)有全面參與,大約39%既表現(xiàn)積極,又全面參與一些組織中的決策制定。二院方差分析(在第17章可以更多了解多元方差分析)可以展現(xiàn)經(jīng)驗(yàn)和年齡對(duì)道德歸因和參評(píng)的目標(biāo)定位的交互影響。什么是二元方差分析?很容易-有兩個(gè)獨(dú)立因素,第一個(gè)是經(jīng)驗(yàn)水平,第二個(gè)是年齡。與每一個(gè)方差分析程序類(lèi)似,包括:1. 對(duì)年齡的主效應(yīng)的檢驗(yàn);2. 對(duì)經(jīng)驗(yàn)的主效應(yīng)的檢驗(yàn);3. 對(duì)經(jīng)驗(yàn)和年齡的交互效應(yīng)的檢驗(yàn)(結(jié)果可能是顯著的)。在檢驗(yàn)一個(gè)以上因素或者獨(dú)立變量時(shí)就體現(xiàn)出方差分析的一個(gè)重要特點(diǎn),也就是研究者可以分析每一個(gè)因素的效應(yīng),同時(shí)可以通過(guò)交互效應(yīng)分析兩者共同的效應(yīng)

55、。知識(shí)和智識(shí)路徑:下面介紹如何使用那張圖選擇方差分析(現(xiàn)在處理一個(gè)以上的因素)作為合適的檢驗(yàn)統(tǒng)計(jì)。1. 我們檢驗(yàn)不同群體的數(shù)值之間的差異,在這個(gè)案例中是檢驗(yàn)經(jīng)驗(yàn)水平和年齡之間的差異;2. 參與者接受一次測(cè)試;3. 我們檢驗(yàn)兩個(gè)或多個(gè)群體;4. 我們處理不止一個(gè)因素或獨(dú)立變量;5. 合適的檢驗(yàn)統(tǒng)計(jì)是析因方差分析。方差分析的新類(lèi)型:析因方差分析(factorial analysis of variance),一個(gè)簡(jiǎn)單的包含兩個(gè)因素的案例:性別(男和女)和處理變量(不同類(lèi)型的訓(xùn)練項(xiàng)目-高強(qiáng)度和低強(qiáng)度),以及結(jié)果-體重減少的數(shù)量,這個(gè)案例的實(shí)驗(yàn)設(shè)計(jì)類(lèi)似于:接著我們來(lái)看什么是主效應(yīng)和交互效應(yīng)。就析因分析

56、來(lái)說(shuō)可以提出并回答三個(gè)問(wèn)題:1. 不同的而訓(xùn)練項(xiàng)目層級(jí)也就是高強(qiáng)度和低強(qiáng)度之間是否有差異;2. 不同性別-男性和女性之間是否有差異?3. 高強(qiáng)度或低強(qiáng)度項(xiàng)目是否對(duì)男性或女性有不同的效應(yīng)?問(wèn)題1和問(wèn)題2確定主效應(yīng)是否存在,問(wèn)題3確定兩個(gè)因素之間是否有交互效應(yīng)。主要方面:析因方差分析的主效應(yīng)你應(yīng)該記得方差分析的最初目標(biāo)是檢驗(yàn)兩個(gè)或兩個(gè)以上群體之間的差異.如果數(shù)據(jù)分析表明某個(gè)因素的不同層級(jí)之間存在差異,我們就會(huì)說(shuō)存在主效應(yīng)(main effect).現(xiàn)在來(lái)看一個(gè)例子,上面給出的案例中共有四個(gè)群體,每個(gè)群體10個(gè)參與者。下面給出可能的分析結(jié)果(使用SPSS計(jì)算得出),得到一個(gè)表叫做源表(source

57、table)。結(jié)論是,性別有主效應(yīng)(p=.000),而處理變量沒(méi)有主效應(yīng)(p=.091),而且這兩個(gè)主要因素之間沒(méi)有交互效應(yīng)(p=.665)。因此,在高強(qiáng)度組或低強(qiáng)度組隊(duì)減少體重來(lái)說(shuō)并不重要,但是性別是最重要的影響因素。而且處理因素和性別之間沒(méi)有交互效應(yīng),所以不同的強(qiáng)度對(duì)性別沒(méi)有差異性影響。更有趣的方面:交互效應(yīng)現(xiàn)在開(kāi)始討論交互效應(yīng),先看一組新數(shù)據(jù)的源表,這些數(shù)據(jù)表明男性和女性受到處理變量的影響,也就是存在交互效應(yīng)(interaction effect)。而且你還可以看到一些非常有趣的分析結(jié)果。處理變量和性別沒(méi)有主效應(yīng)(分別為p=.127,p=.176),但是存在交互效應(yīng)(p=.004),這是一個(gè)非常有意思的結(jié)果。實(shí)際上,你是在高強(qiáng)度項(xiàng)目或者你是男性或者女性都不重要,但是處理變量對(duì)于男性和女性的體重減少有不同的影響。如何理解這個(gè)結(jié)果?解釋非常簡(jiǎn)單:訓(xùn)練類(lèi)型沒(méi)有主效應(yīng),性別沒(méi)有主效應(yīng);處理變量和性別之間有明顯的交互效應(yīng),也就是說(shuō)在高強(qiáng)度項(xiàng)目中女性減少的體重比男性減少的體重多,而在低強(qiáng)度項(xiàng)目中男性減少的體重比女性減少的多。需要記憶的內(nèi)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論