版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、統(tǒng)計(jì)學(xué):思想、方法與應(yīng)用統(tǒng)計(jì)學(xué):思想、方法與應(yīng)用袁衛(wèi)袁衛(wèi) 劉超劉超 第第1章章1. 1. 什么是統(tǒng)計(jì)學(xué)?什么是統(tǒng)計(jì)學(xué)?2. 2.如何運(yùn)用統(tǒng)計(jì)學(xué)?如何運(yùn)用統(tǒng)計(jì)學(xué)?3. 3. 統(tǒng)計(jì)學(xué)的基本概念統(tǒng)計(jì)學(xué)的基本概念4. 4.數(shù)據(jù)的收集數(shù)據(jù)的收集5. 5.數(shù)據(jù)陣數(shù)據(jù)陣/ /數(shù)據(jù)文件數(shù)據(jù)文件6. 6.統(tǒng)計(jì)學(xué)和數(shù)學(xué)、統(tǒng)計(jì)軟件的關(guān)系統(tǒng)計(jì)學(xué)和數(shù)學(xué)、統(tǒng)計(jì)軟件的關(guān)系學(xué)習(xí)目標(biāo)學(xué)習(xí)目標(biāo) 用一句話說(shuō)明統(tǒng)計(jì)學(xué);用一句話說(shuō)明統(tǒng)計(jì)學(xué); 理解我們?yōu)槭裁匆獙W(xué)習(xí)統(tǒng)計(jì)學(xué);理解我們?yōu)槭裁匆獙W(xué)習(xí)統(tǒng)計(jì)學(xué); 懂得如何運(yùn)用統(tǒng)計(jì)學(xué);懂得如何運(yùn)用統(tǒng)計(jì)學(xué); 知道統(tǒng)計(jì)學(xué)的基本概念;知道統(tǒng)計(jì)學(xué)的基本概念; 什么是描述統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)學(xué);什么是描述統(tǒng)計(jì)學(xué)和推
2、斷統(tǒng)計(jì)學(xué); 了解數(shù)據(jù)如何收集以及數(shù)據(jù)收集中存在的問(wèn)題;了解數(shù)據(jù)如何收集以及數(shù)據(jù)收集中存在的問(wèn)題; 知道常用的統(tǒng)計(jì)軟件。知道常用的統(tǒng)計(jì)軟件。 數(shù)據(jù)顯示,數(shù)據(jù)顯示,2010年中國(guó)名義年中國(guó)名義GDP為為58786億美元,億美元,GDP增速為增速為10%左右。而左右。而2010年日本名義年日本名義GDP為為54742億美元,億美元,GDP增速為增速為3.9。中國(guó)。中國(guó)GDP比日本多比日本多4044億美億美元,這意味著中國(guó)超越日本成為世界第二大經(jīng)濟(jì)體。盡管中元,這意味著中國(guó)超越日本成為世界第二大經(jīng)濟(jì)體。盡管中國(guó)總量國(guó)總量GDP超過(guò)日本,但中國(guó)人均超過(guò)日本,但中國(guó)人均GDP卻只有日本卻只有日本1/10,
3、在世界排名第在世界排名第100位左右,不到世界平均水平的一半。這樣位左右,不到世界平均水平的一半。這樣的結(jié)果對(duì)我們的結(jié)果對(duì)我們意味著意味著什么呢?毫無(wú)疑問(wèn),我們需要知道一些什么呢?毫無(wú)疑問(wèn),我們需要知道一些統(tǒng)計(jì)知識(shí)。統(tǒng)計(jì)知識(shí)。1960到到2009全球主要國(guó)家人均全球主要國(guó)家人均GDP的增長(zhǎng)圖表(來(lái)源:的增長(zhǎng)圖表(來(lái)源:Google網(wǎng)站)網(wǎng)站) 作為一名潛在的汽車購(gòu)買(mǎi)者和一名有責(zé)任心的市民,你作為一名潛在的汽車購(gòu)買(mǎi)者和一名有責(zé)任心的市民,你樂(lè)意為保護(hù)地球生態(tài)環(huán)境應(yīng)有的貢獻(xiàn)。你應(yīng)該買(mǎi)使用柴油發(fā)動(dòng)樂(lè)意為保護(hù)地球生態(tài)環(huán)境應(yīng)有的貢獻(xiàn)。你應(yīng)該買(mǎi)使用柴油發(fā)動(dòng)機(jī)的汽車,還是購(gòu)買(mǎi)電動(dòng)車,或者干脆騎自行車呢?報(bào)紙
4、、雜機(jī)的汽車,還是購(gòu)買(mǎi)電動(dòng)車,或者干脆騎自行車呢?報(bào)紙、雜志或網(wǎng)絡(luò)中的志或網(wǎng)絡(luò)中的統(tǒng)計(jì)結(jié)果統(tǒng)計(jì)結(jié)果對(duì)于你的決定非常關(guān)鍵,這些結(jié)果建議對(duì)于你的決定非常關(guān)鍵,這些結(jié)果建議你該有怎樣的消費(fèi)觀。你該有怎樣的消費(fèi)觀。 低碳社會(huì)要求汽車廠商根據(jù)他們的總產(chǎn)量生產(chǎn)一定比例的低碳社會(huì)要求汽車廠商根據(jù)他們的總產(chǎn)量生產(chǎn)一定比例的電動(dòng)車,以減少機(jī)動(dòng)車造成的空氣污染,這已開(kāi)始成為整個(gè)國(guó)電動(dòng)車,以減少機(jī)動(dòng)車造成的空氣污染,這已開(kāi)始成為整個(gè)國(guó)家的趨勢(shì)。對(duì)于立法者來(lái)說(shuō),統(tǒng)計(jì)信息在使他們家的趨勢(shì)。對(duì)于立法者來(lái)說(shuō),統(tǒng)計(jì)信息在使他們相信相信并檢測(cè)使并檢測(cè)使用電動(dòng)車在改進(jìn)空氣質(zhì)量上的有效性方面起著關(guān)鍵性的作用。用電動(dòng)車在改進(jìn)空氣質(zhì)量
5、上的有效性方面起著關(guān)鍵性的作用。 在金融危機(jī)發(fā)生后,各國(guó)政府對(duì)于國(guó)家經(jīng)濟(jì)在金融危機(jī)發(fā)生后,各國(guó)政府對(duì)于國(guó)家經(jīng)濟(jì)的現(xiàn)狀和對(duì)未來(lái)經(jīng)濟(jì)走勢(shì)的預(yù)測(cè)十分的現(xiàn)狀和對(duì)未來(lái)經(jīng)濟(jì)走勢(shì)的預(yù)測(cè)十分關(guān)注關(guān)注,每個(gè),每個(gè)月都要編制月都要編制CPI等各類指數(shù)以評(píng)價(jià)通貨膨脹情況。等各類指數(shù)以評(píng)價(jià)通貨膨脹情況。有關(guān)商品銷售額、新開(kāi)工的住宅、貨幣流通以及有關(guān)商品銷售額、新開(kāi)工的住宅、貨幣流通以及工業(yè)生產(chǎn)的信息僅僅是構(gòu)成預(yù)測(cè)基礎(chǔ)的成百上千工業(yè)生產(chǎn)的信息僅僅是構(gòu)成預(yù)測(cè)基礎(chǔ)的成百上千類信息的一小部分。我們?cè)撊绾谓庾x這些數(shù)據(jù)呢類信息的一小部分。我們?cè)撊绾谓庾x這些數(shù)據(jù)呢?知道一些統(tǒng)計(jì)知識(shí)?知道一些統(tǒng)計(jì)知識(shí)有助于有助于我們知道這些數(shù)據(jù)是我
6、們知道這些數(shù)據(jù)是如何與我們的生活息息相關(guān)的。如何與我們的生活息息相關(guān)的。 假設(shè)你是市場(chǎng)部的新任經(jīng)理,一次廣告活動(dòng)假設(shè)你是市場(chǎng)部的新任經(jīng)理,一次廣告活動(dòng)的統(tǒng)計(jì)結(jié)果擺到了你面前,聲稱某個(gè)結(jié)果是的統(tǒng)計(jì)結(jié)果擺到了你面前,聲稱某個(gè)結(jié)果是“統(tǒng)計(jì)統(tǒng)計(jì)顯著顯著”的。你如何解釋這份報(bào)告而又不暴露你對(duì)該的。你如何解釋這份報(bào)告而又不暴露你對(duì)該術(shù)語(yǔ)的無(wú)知呢?趕快學(xué)點(diǎn)統(tǒng)計(jì),這對(duì)你和你的事術(shù)語(yǔ)的無(wú)知呢?趕快學(xué)點(diǎn)統(tǒng)計(jì),這對(duì)你和你的事業(yè)都非常有用。業(yè)都非常有用。1.11.1什么是統(tǒng)計(jì)學(xué)什么是統(tǒng)計(jì)學(xué) 在三百多年前,統(tǒng)計(jì)的英文單詞在三百多年前,統(tǒng)計(jì)的英文單詞Sta atistics首次被人首次被人們應(yīng)用。們應(yīng)用。 統(tǒng)計(jì)學(xué)是研究收
7、集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)以及統(tǒng)計(jì)學(xué)是研究收集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)以及由數(shù)據(jù)分析得出結(jié)論的方法,簡(jiǎn)稱為由數(shù)據(jù)分析得出結(jié)論的方法,簡(jiǎn)稱為“數(shù)據(jù)的科學(xué)數(shù)據(jù)的科學(xué)” 2010 2010年年6月月3日,第日,第64屆聯(lián)合國(guó)大會(huì)第屆聯(lián)合國(guó)大會(huì)第90次會(huì)議通過(guò)次會(huì)議通過(guò)決議確定每年決議確定每年10月月20日為日為“世界統(tǒng)計(jì)日世界統(tǒng)計(jì)日”。 2011年初,國(guó)務(wù)院學(xué)位委員會(huì)在新的研究生專業(yè)目年初,國(guó)務(wù)院學(xué)位委員會(huì)在新的研究生專業(yè)目錄中將統(tǒng)計(jì)學(xué)上升為錄中將統(tǒng)計(jì)學(xué)上升為一級(jí)學(xué)科一級(jí)學(xué)科,為統(tǒng)計(jì)學(xué)科和統(tǒng)計(jì)教,為統(tǒng)計(jì)學(xué)科和統(tǒng)計(jì)教育的發(fā)展提供了更廣闊的平臺(tái),也顯示出統(tǒng)計(jì)對(duì)科學(xué)育的發(fā)展提供了更廣闊的平臺(tái),也顯示出統(tǒng)計(jì)
8、對(duì)科學(xué)研究、經(jīng)濟(jì)增長(zhǎng)和社會(huì)發(fā)展的重要性。研究、經(jīng)濟(jì)增長(zhǎng)和社會(huì)發(fā)展的重要性。人物小傳:瓦爾德人物小傳:瓦爾德 有人把統(tǒng)計(jì)學(xué)定義為數(shù)據(jù)處理的一門(mén)藝術(shù),有人把統(tǒng)計(jì)學(xué)定義為數(shù)據(jù)處理的一門(mén)藝術(shù),瓦爾德瓦爾德(A. WaldA. Wald,1902190219501950年)年)的事例就是明證。的事例就是明證。 瓦爾德是二戰(zhàn)時(shí)期的統(tǒng)計(jì)學(xué)家,他發(fā)明的一些統(tǒng)計(jì)方瓦爾德是二戰(zhàn)時(shí)期的統(tǒng)計(jì)學(xué)家,他發(fā)明的一些統(tǒng)計(jì)方法在戰(zhàn)時(shí)被視為法在戰(zhàn)時(shí)被視為軍事機(jī)密軍事機(jī)密。 瓦爾德被咨詢飛機(jī)上什么部位應(yīng)該瓦爾德被咨詢飛機(jī)上什么部位應(yīng)該加強(qiáng)加強(qiáng)鋼板時(shí),他開(kāi)鋼板時(shí),他開(kāi)始研究從戰(zhàn)役中返航的軍機(jī)上受敵軍創(chuàng)傷的始研究從戰(zhàn)役中返航的軍機(jī)上受
9、敵軍創(chuàng)傷的彈孔位置彈孔位置。他。他畫(huà)了飛機(jī)的輪廓,并且標(biāo)示出彈孔的位置。資料累積一段畫(huà)了飛機(jī)的輪廓,并且標(biāo)示出彈孔的位置。資料累積一段時(shí)間后,幾乎把機(jī)身各部位都填滿了。于是瓦爾德時(shí)間后,幾乎把機(jī)身各部位都填滿了。于是瓦爾德提議提議,把剩下少數(shù)幾個(gè)沒(méi)有彈孔的部位補(bǔ)強(qiáng)把剩下少數(shù)幾個(gè)沒(méi)有彈孔的部位補(bǔ)強(qiáng)因?yàn)檫@些部位被因?yàn)檫@些部位被擊中的飛機(jī)都沒(méi)有返航。擊中的飛機(jī)都沒(méi)有返航。 這是一個(gè)簡(jiǎn)單但近乎完美的實(shí)例,簡(jiǎn)單的統(tǒng)計(jì)方法一這是一個(gè)簡(jiǎn)單但近乎完美的實(shí)例,簡(jiǎn)單的統(tǒng)計(jì)方法一旦融入了統(tǒng)計(jì)學(xué)家的智慧,便顯得生動(dòng)而唯美!旦融入了統(tǒng)計(jì)學(xué)家的智慧,便顯得生動(dòng)而唯美! 1.21.2如何運(yùn)用統(tǒng)計(jì)學(xué)如何運(yùn)用統(tǒng)計(jì)學(xué) 統(tǒng)計(jì)在許多
10、學(xué)科中得到廣泛的應(yīng)用統(tǒng)計(jì)在許多學(xué)科中得到廣泛的應(yīng)用。 比如說(shuō),學(xué)術(shù)研究雜志就依賴于統(tǒng)計(jì)結(jié)果比如說(shuō),學(xué)術(shù)研究雜志就依賴于統(tǒng)計(jì)結(jié)果。在許多學(xué)科中,一篇文章是否能夠發(fā)表在主要雜在許多學(xué)科中,一篇文章是否能夠發(fā)表在主要雜志上,在很大程度上志上,在很大程度上取決于取決于該文章是否能正確地該文章是否能正確地使用統(tǒng)計(jì)方法使用統(tǒng)計(jì)方法。 除了除了學(xué)術(shù)領(lǐng)域,統(tǒng)計(jì)在其他領(lǐng)域也被人們廣學(xué)術(shù)領(lǐng)域,統(tǒng)計(jì)在其他領(lǐng)域也被人們廣泛使用。泛使用。 統(tǒng)計(jì)在工業(yè)中得到大量使用,尤其統(tǒng)計(jì)在工業(yè)中得到大量使用,尤其用于用于研究研究新產(chǎn)品、質(zhì)量控制和市場(chǎng)開(kāi)發(fā)中;市場(chǎng)調(diào)查也需新產(chǎn)品、質(zhì)量控制和市場(chǎng)開(kāi)發(fā)中;市場(chǎng)調(diào)查也需要統(tǒng)計(jì)。要統(tǒng)計(jì)。讀者文
11、摘的總統(tǒng)選舉調(diào)查讀者文摘的總統(tǒng)選舉調(diào)查 這個(gè)故事有關(guān)一次著名的失敗的統(tǒng)計(jì)調(diào)查。這個(gè)故事有關(guān)一次著名的失敗的統(tǒng)計(jì)調(diào)查。 在在19361936年美國(guó)總統(tǒng)選舉前,一份名為讀者文摘年美國(guó)總統(tǒng)選舉前,一份名為讀者文摘( (Literry Digest)Literry Digest)的雜志曾進(jìn)行了一次民意調(diào)查。的雜志曾進(jìn)行了一次民意調(diào)查。調(diào)查的焦點(diǎn)是誰(shuí)將成為下一屆總統(tǒng)調(diào)查的焦點(diǎn)是誰(shuí)將成為下一屆總統(tǒng)是挑戰(zhàn)者,堪是挑戰(zhàn)者,堪薩斯州州長(zhǎng)阿爾夫薩斯州州長(zhǎng)阿爾夫蘭登蘭登( (Alf Landon)Alf Landon),還是現(xiàn)任總,還是現(xiàn)任總統(tǒng)富蘭克林統(tǒng)富蘭克林德拉諾德拉諾羅斯福羅斯福( (Franklin Del
12、ano Franklin Delano Roosevelt)Roosevelt)。 為了了解選民意向,民意調(diào)查專家們?yōu)榱肆私膺x民意向,民意調(diào)查專家們根據(jù)根據(jù)電話簿電話簿和車輛登記簿上的名單給一大批人發(fā)了簡(jiǎn)單的調(diào)查表和車輛登記簿上的名單給一大批人發(fā)了簡(jiǎn)單的調(diào)查表( (電話和汽車在電話和汽車在1936-1936-年并不像現(xiàn)在這樣年并不像現(xiàn)在這樣普遍普遍,但是這,但是這些名單比較容易得到些名單比較容易得到) )。盡管發(fā)出的調(diào)查表大約有一。盡管發(fā)出的調(diào)查表大約有一千萬(wàn)張,但收回的千萬(wàn)張,但收回的比例比例并不高。在收回的調(diào)查表中,并不高。在收回的調(diào)查表中,蘭登蘭登非常受歡迎。于是,該雜志預(yù)測(cè)蘭登將贏得選
13、舉非常受歡迎。于是,該雜志預(yù)測(cè)蘭登將贏得選舉。 讀者文摘的總統(tǒng)選舉調(diào)查讀者文摘的總統(tǒng)選舉調(diào)查 你可能對(duì)聲稱蘭登將贏得選舉的預(yù)測(cè)結(jié)果有疑問(wèn)你可能對(duì)聲稱蘭登將贏得選舉的預(yù)測(cè)結(jié)果有疑問(wèn)。正如你所懷疑的,在經(jīng)濟(jì)大蕭條時(shí)期調(diào)查擁有電話。正如你所懷疑的,在經(jīng)濟(jì)大蕭條時(shí)期調(diào)查擁有電話和汽車的人們,和汽車的人們,并不能并不能夠很好地反映全體選民的觀點(diǎn)夠很好地反映全體選民的觀點(diǎn)。此外此外,只有少數(shù)的調(diào)查表被收回,這一點(diǎn)也是值得,只有少數(shù)的調(diào)查表被收回,這一點(diǎn)也是值得懷疑的。事實(shí)表明,懷疑的。事實(shí)表明,最終最終是羅斯福而不是蘭登贏得了是羅斯福而不是蘭登贏得了這次選舉。這次選舉。 由此可見(jiàn),那次的調(diào)查結(jié)果有多么錯(cuò)誤
14、了。當(dāng)前由此可見(jiàn),那次的調(diào)查結(jié)果有多么錯(cuò)誤了。當(dāng)前大多數(shù)應(yīng)用統(tǒng)計(jì)不會(huì)像這個(gè)例子錯(cuò)得那樣厲害,但即大多數(shù)應(yīng)用統(tǒng)計(jì)不會(huì)像這個(gè)例子錯(cuò)得那樣厲害,但即便在今天,我們也很容易發(fā)現(xiàn)統(tǒng)計(jì)便在今天,我們也很容易發(fā)現(xiàn)統(tǒng)計(jì)被誤用被誤用的情況,尤的情況,尤其在需要考慮選擇正確的樣本時(shí)。其在需要考慮選擇正確的樣本時(shí)。1.3 1.3 統(tǒng)計(jì)學(xué)的基本概念統(tǒng)計(jì)學(xué)的基本概念 1.3.1隨機(jī)性和規(guī)律性隨機(jī)性和規(guī)律性 我們不能預(yù)測(cè)我們不能預(yù)測(cè)某某事情的結(jié)果時(shí),它就和事情的結(jié)果時(shí),它就和隨機(jī)性隨機(jī)性聯(lián)系起來(lái)了。聯(lián)系起來(lái)了。例如,擲硬幣,參加統(tǒng)計(jì)考試是否會(huì)達(dá)到預(yù)期的分?jǐn)?shù)。例如,擲硬幣,參加統(tǒng)計(jì)考試是否會(huì)達(dá)到預(yù)期的分?jǐn)?shù)。 把大量隨機(jī)事件
15、放在一起時(shí),就表現(xiàn)出令人驚奇的把大量隨機(jī)事件放在一起時(shí),就表現(xiàn)出令人驚奇的規(guī)律性規(guī)律性。 比如,考察擲硬幣這樣的隨機(jī)事件,如果你將同樣的硬幣擲比如,考察擲硬幣這樣的隨機(jī)事件,如果你將同樣的硬幣擲100100次,次,經(jīng)驗(yàn)經(jīng)驗(yàn)告訴我們差不多告訴我們差不多5050次正面朝上,次正面朝上,5050次反面朝上。次反面朝上。 類似地,盡管每個(gè)人死于二手煙的可能性很小,但是全球每類似地,盡管每個(gè)人死于二手煙的可能性很小,但是全球每年有年有6060萬(wàn)人死于二手煙,這個(gè)數(shù)字卻令人難以置信地萬(wàn)人死于二手煙,這個(gè)數(shù)字卻令人難以置信地穩(wěn)定穩(wěn)定。 通過(guò)對(duì)看起來(lái)隨機(jī)的現(xiàn)象進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)知識(shí)能夠幫助通過(guò)對(duì)看起來(lái)隨機(jī)的現(xiàn)
16、象進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)知識(shí)能夠幫助我們把隨機(jī)性我們把隨機(jī)性歸納于歸納于可能的規(guī)律性中可能的規(guī)律性中。統(tǒng)計(jì)從我們?nèi)绾斡^察事統(tǒng)計(jì)從我們?nèi)绾斡^察事物和事物本身如何真正發(fā)生物和事物本身如何真正發(fā)生這兩個(gè)方面這兩個(gè)方面幫助我們理解隨機(jī)性和幫助我們理解隨機(jī)性和規(guī)律性的重要性。規(guī)律性的重要性。 統(tǒng)計(jì)可以看做是一項(xiàng)對(duì)隨機(jī)性中的規(guī)律性的統(tǒng)計(jì)可以看做是一項(xiàng)對(duì)隨機(jī)性中的規(guī)律性的研究研究。1.3.11.3.1隨機(jī)性和規(guī)律性隨機(jī)性和規(guī)律性 規(guī)律也表現(xiàn)出某種規(guī)律也表現(xiàn)出某種隨機(jī)性隨機(jī)性。 如果你再擲如果你再擲100100次硬幣次硬幣,正面朝上的次數(shù)正面朝上的次數(shù)幾乎幾乎不會(huì)和前不會(huì)和前1 10000次完全一樣。在第一個(gè)次完
17、全一樣。在第一個(gè)100100次中,也許有次中,也許有5252次硬幣的正面朝上次硬幣的正面朝上,然而在第二個(gè),然而在第二個(gè)100100次中,也許就有次中,也許就有4949次正面朝上。次正面朝上。 這種偏差發(fā)生于調(diào)查、實(shí)驗(yàn)和其它任何一種方式的數(shù)據(jù)收這種偏差發(fā)生于調(diào)查、實(shí)驗(yàn)和其它任何一種方式的數(shù)據(jù)收集中集中。 比如在某次調(diào)查中,如果對(duì)兩個(gè)不同群的人做同樣的調(diào)查比如在某次調(diào)查中,如果對(duì)兩個(gè)不同群的人做同樣的調(diào)查,則有不同的比例的人支持這一觀點(diǎn),則有不同的比例的人支持這一觀點(diǎn)。這這兩兩個(gè)個(gè)比例之間的差比例之間的差異主要是由于數(shù)據(jù)本身的隨機(jī)性異主要是由于數(shù)據(jù)本身的隨機(jī)性引起引起的。的。 在這種意義下來(lái)說(shuō),
18、統(tǒng)計(jì)就成在這種意義下來(lái)說(shuō),統(tǒng)計(jì)就成了對(duì)了對(duì)數(shù)數(shù)據(jù)中的偏差問(wèn)題的據(jù)中的偏差問(wèn)題的研研究究。根。根據(jù)作為統(tǒng)計(jì)基礎(chǔ)的數(shù)學(xué)理論,我們可以確定一項(xiàng)調(diào)查據(jù)作為統(tǒng)計(jì)基礎(chǔ)的數(shù)學(xué)理論,我們可以確定一項(xiàng)調(diào)查中的某一比例有多大的隨機(jī)性,以及中的某一比例有多大的隨機(jī)性,以及在在下一次的重復(fù)調(diào)查中下一次的重復(fù)調(diào)查中,這個(gè)比例可能有多大的偏差。我們還可以指出,兩個(gè)比例,這個(gè)比例可能有多大的偏差。我們還可以指出,兩個(gè)比例之間的差之間的差異異是否大到了隨機(jī)性本身所是否大到了隨機(jī)性本身所不能解釋不能解釋的地步。我們的地步。我們將在以后章節(jié)中詳細(xì)討論這些思想將在以后章節(jié)中詳細(xì)討論這些思想。比如人的壽命在比如人的壽命在70-90歲
19、歲之間。某人的壽命為之間。某人的壽命為130歲,則不能用隨機(jī)性解釋歲,則不能用隨機(jī)性解釋1.3.21.3.2概率概率 因?yàn)樯婕暗诫S機(jī)性因?yàn)樯婕暗诫S機(jī)性,統(tǒng)計(jì)學(xué)還需要統(tǒng)計(jì)學(xué)還需要一一個(gè)很重要個(gè)很重要的概念的概念概率概率(probability) (probability) 。 概率是一個(gè)概率是一個(gè)0 0到到1 1之間的數(shù),它告訴我們某一事之間的數(shù),它告訴我們某一事件發(fā)生的機(jī)會(huì)有多大件發(fā)生的機(jī)會(huì)有多大。 概率為統(tǒng)計(jì)學(xué)的第三個(gè)方面概率為統(tǒng)計(jì)學(xué)的第三個(gè)方面如何從數(shù)據(jù)中如何從數(shù)據(jù)中得出結(jié)論得出結(jié)論奠定了奠定了基石基石。 我們我們可能可能永遠(yuǎn)不能確定兩個(gè)數(shù)字的差異是否超永遠(yuǎn)不能確定兩個(gè)數(shù)字的差異是否超出了
20、隨機(jī)性本身所預(yù)期的范圍,但是我們可以出了隨機(jī)性本身所預(yù)期的范圍,但是我們可以確確定定,這種差異發(fā)生的概率是大還是小。根據(jù)這個(gè),這種差異發(fā)生的概率是大還是小。根據(jù)這個(gè)基本思想,在很多情況下,我們可以得出關(guān)于我基本思想,在很多情況下,我們可以得出關(guān)于我們所處的這個(gè)世界的重要結(jié)論們所處的這個(gè)世界的重要結(jié)論。 我們我們將在將在第四章及其后章節(jié)中詳細(xì)闡述。第四章及其后章節(jié)中詳細(xì)闡述。1.3.31.3.3變量變量 變量變量(variable)(variable) 是是指指一個(gè)可以取兩個(gè)或一個(gè)可以取兩個(gè)或更多個(gè)可能值的特征、特質(zhì)或?qū)傩?。更多個(gè)可能值的特征、特質(zhì)或?qū)傩浴?比如,比如,性別是取兩個(gè)值的變量,因?yàn)?/p>
21、一性別是取兩個(gè)值的變量,因?yàn)橐粋€(gè)人只可能是男性或女性個(gè)人只可能是男性或女性。還有其它變量的還有其它變量的例子例子,如人的壽命,體重,以及汽車每升汽如人的壽命,體重,以及汽車每升汽油所能行駛的距離,等等油所能行駛的距離,等等。1.3.31.3.3變量變量圖圖1.1 1.1 變量及其取值變量及其取值1.3.31.3.3變量變量變量的值值(value)通常是對(duì)某一特定個(gè)體的度量,特定個(gè)體可能是指一個(gè)人,一個(gè)家庭,一個(gè)地區(qū),或一個(gè)國(guó)家。表1.1列出了一些變量、變量的取值及其所測(cè)量的個(gè)體的例子。從表中可知,性別變量是以人為個(gè)體的觀測(cè),孩子的數(shù)目是以家庭為個(gè)體的觀測(cè)。表表1.1 1.1 變量,值和個(gè)體變量
22、,值和個(gè)體變量變量變量的值變量的值個(gè)體個(gè)體性別男,女人學(xué)歷小學(xué),中學(xué),本科,碩士,博士人失業(yè)有工作,無(wú)工作人孩子數(shù)0, 1, 2, 3,家庭貧困程度嚴(yán)重,一般,邊緣,沒(méi)有地區(qū)1.3.31.3.3變量變量上面介紹的是經(jīng)經(jīng)驗(yàn)驗(yàn)變量變量(empirical variables) ,級(jí)處理的對(duì)像是我們周圍可觀測(cè)到的物質(zhì)世界中的事物。用數(shù)學(xué)方法推導(dǎo)的變量稱為理論變量理論變量(theoretical variables)z,t, 和F變量。 與變量相對(duì)的概念是常數(shù)常數(shù)(constant)(constant)。在統(tǒng)計(jì)中經(jīng)常使用的一種被稱做參數(shù)參數(shù)(parameter)(parameter)的常數(shù)。1.4 1
23、.4 數(shù)據(jù)的收集數(shù)據(jù)的收集 1.4.1 定義變量定義變量 數(shù)據(jù)收集的第一個(gè)準(zhǔn)則是要清楚測(cè)量的是什么。換句話說(shuō),變量必須有一個(gè)明確的適合研究目的的定義。 這有時(shí)是說(shuō)起來(lái)容易做起來(lái)難。如果我們對(duì)問(wèn)題考慮得不全面,那么就沒(méi)理由指望回答問(wèn)題的人(一般稱為響應(yīng)者)能按照我們期望的回答問(wèn)題。 在我們做研究之前,對(duì)變量必須要有一個(gè)清晰、詳盡的定義。1.4 1.4 數(shù)據(jù)的收集數(shù)據(jù)的收集 1.4.1 定義變量定義變量 假定我們?cè)谝淮问称菲髽I(yè)的市場(chǎng)調(diào)查中包含了這樣的問(wèn)題在您的家庭中有多少個(gè)孩子?我們也許認(rèn)為自己知道想要了解的是什么,但是,沒(méi)有理由期待響應(yīng)者和我們有同樣的想法。1.4 1.4 數(shù)據(jù)的收集數(shù)據(jù)的收集
24、1.4.1 定義變量定義變量 我們也許不加考慮地認(rèn)為,孩子應(yīng)定義為一個(gè)不滿18歲并和他(她)的親生父母一起生活的人。但如果一個(gè)家庭中包含大于18歲的親生子女、前妻或前夫的孩子、養(yǎng)子或養(yǎng)女、過(guò)繼子女或者其他年輕的親戚,那該怎么辦呢?對(duì)于不和親生父母生活在一起的孩子怎么算呢?對(duì)于父母離了婚而共同撫養(yǎng)的孩子怎么算呢?這有很多種發(fā)生混淆的可能。因此,我們?cè)谡{(diào)查之前首先需要明確孩子的定義。1.4.2 1.4.2 觀測(cè)數(shù)據(jù)觀測(cè)數(shù)據(jù) 數(shù)據(jù)收集有兩種主要方法,其中一種是當(dāng)我們觀測(cè)現(xiàn)實(shí)世界時(shí)收集到的數(shù)據(jù),如在不同城市中的流動(dòng)人口數(shù)量。觀觀測(cè)數(shù)據(jù)測(cè)數(shù)據(jù)(observational data)(observatio
25、nal data)是指僅通過(guò)對(duì)世界的觀察是指僅通過(guò)對(duì)世界的觀察( (而而沒(méi)有操縱或控制它沒(méi)有操縱或控制它) )所得到的數(shù)據(jù)所得到的數(shù)據(jù)。收集觀測(cè)數(shù)據(jù)的研究者們盡量不干涉研究對(duì)象的行為模式。 例如,證券分析人員可能會(huì)記錄某即將被收購(gòu)的公司在被收購(gòu)的前一天的股市收盤(pán)價(jià)格,并與其宣布被收購(gòu)的當(dāng)天的收盤(pán)價(jià)比較??傮w和樣本總體和樣本收集數(shù)據(jù)是為了從收集的個(gè)體中得出結(jié)論。所有我們感興趣的個(gè)體就組成了總體總體 (population) (population) 。比如,你讀本教材這一時(shí)刻,我國(guó)所有居民就構(gòu)成了一個(gè)總體。 有時(shí)我們能夠收集到總體中所有個(gè)體的數(shù)據(jù)。在這種情況下,我們就是對(duì)總體做了普查普查(cen
26、sus)(census)。 我國(guó)進(jìn)行的第六次全國(guó)人口普查就是希望確定我國(guó)所有居民數(shù)。 然而,在苛刻的現(xiàn)實(shí)生活中,由于資金、時(shí)間有限以及不斷變化的環(huán)境條件,普查通常是很困的。此時(shí),我們需要把收集數(shù)據(jù)限制在總體的一個(gè)樣本樣本(sample)(sample)上,樣本是總體的中的一個(gè)被選中的部分。樣本的選擇樣本的選擇 統(tǒng)計(jì)研究者所面臨的一個(gè)關(guān)鍵問(wèn)題是如何選擇樣本。 我們希望基于樣本得出的結(jié)論能夠適用于該樣本所屬的總體,這依賴于獲得一個(gè)好的樣本,否則這是不可能實(shí)現(xiàn)的。 以烹調(diào)為例子來(lái)幫助你理解為什么一個(gè)好的樣本如此重要。 當(dāng)我們品嘗一勺我們做的湯時(shí),我們關(guān)心的不是這勺湯怎樣,而是整個(gè)鍋里的湯味道如何。如
27、果鍋里的湯被充分?jǐn)嚢枇耍覀冎恍杵穱L一勺即可知道整鍋湯的味道。我們品嘗的這一勺湯無(wú)論是來(lái)自家庭廚房中的一個(gè)小鍋,還是來(lái)自一個(gè)更大的鍋,我們都可以窺一斑而知全豹。 這正如我們從總體中選擇一個(gè)樣本,從某種意義上來(lái)說(shuō),需要選擇一個(gè)來(lái)自攪拌均勻的總體的樣本。如果總體能被攪拌均勻,那么一個(gè)包含1000個(gè)個(gè)體的樣本,不管它是以整個(gè)國(guó)家為總體,還是以一個(gè)城市為總體,都可以告訴我們同樣多的內(nèi)容。樣本的選擇樣本的選擇 我們可以把這個(gè)例子應(yīng)用于樣本調(diào)查。某產(chǎn)品上市之前的市場(chǎng)調(diào)查表明,有70%的人喜該產(chǎn)品。如果樣本選擇正確,這個(gè)比例將和整個(gè)市場(chǎng)中的消費(fèi)者中的比例大致相同。類似地,在對(duì)大學(xué)畢業(yè)生就業(yè)狀況的研究中,檢查
28、畢業(yè)生的某個(gè)樣本的目的,不是要看這些抽查到的畢業(yè)生是否能順利就業(yè),而是要要看所有大學(xué)畢業(yè)生組成的總體能否順利就業(yè)。選擇的這個(gè)樣本應(yīng)該能夠很好地反映總體,因此也就能夠很好地反映大學(xué)畢業(yè)生就業(yè)狀況。 如果不能正確地選擇樣本,那么對(duì)于整鍋湯的判斷可能導(dǎo)致錯(cuò)誤的結(jié)論。如果市場(chǎng)調(diào)查專家們只對(duì)他們的家人和朋友提問(wèn),那么將可能產(chǎn)生壞樣本。如果只對(duì)已經(jīng)就業(yè)的畢業(yè)生進(jìn)行調(diào)查,而忽略校漂族,那么此樣本將產(chǎn)生錯(cuò)誤的結(jié)論。由于樣本選擇對(duì)于結(jié)果的可信度有重要作用,所以根據(jù)正確的統(tǒng)計(jì)原理選擇樣本是非常必要的。 隨機(jī)樣本隨機(jī)樣本 隨機(jī)樣本隨機(jī)樣本(random sample)指一個(gè)合適的、能夠被推廣應(yīng)用于更大的總體的統(tǒng)計(jì)樣
29、本。從一個(gè)紙箱子中抽簽對(duì)學(xué)生點(diǎn)名回答問(wèn)題,是選擇隨機(jī)樣本的最簡(jiǎn)單的例子。疊好的寫(xiě)有學(xué)生名字的紙簽是組成整個(gè)總體的個(gè)體,每一個(gè)個(gè)體都有相等的被選中的機(jī)會(huì)。從這種意義上說(shuō)完全可能實(shí)現(xiàn)總體中所有的群體在某樣本中的代表的數(shù)量比例大致等于這些群體在總體中的比例。比如,如果一個(gè)工科院系的班級(jí)有25個(gè)男生和5個(gè)女生,那么在該班級(jí)的一個(gè)隨機(jī)樣本中,每5個(gè)男生應(yīng)該對(duì)應(yīng)著大約1個(gè)女生。 當(dāng)一個(gè)總體中的名字或代碼被放進(jìn)一個(gè)紙箱子里,攪拌均勻,并隨機(jī)抽取,其結(jié)果就是一個(gè)簡(jiǎn)單隨機(jī)樣本單隨機(jī)樣本(simple (simple random sample)random sample) 。本書(shū)中每一章末尾的所有公式都基于簡(jiǎn)單
30、隨機(jī)樣本的使用。方便樣本:如何產(chǎn)生一個(gè)方便樣本:如何產(chǎn)生一個(gè) 壞的壞的 樣本樣本 研究者們經(jīng)常習(xí)慣于研究手頭方便的總體中的個(gè)體。例如,醫(yī)學(xué)研究者經(jīng)常對(duì)他們自己的病人做研究;市場(chǎng)調(diào)查者研究被他們說(shuō)服進(jìn)行合作的消費(fèi)者。 能夠很容易、很經(jīng)濟(jì)地得到的樣本稱為方便樣本方便樣本(convenience sample)(convenience sample) 。 從方便樣本中得出的結(jié)果有時(shí)候很難推廣到整個(gè)總體。 有時(shí)候大型商場(chǎng)會(huì)要求他們的顧客回答某些問(wèn)題并收回問(wèn)卷,由此得到一些樣本。根據(jù)隨機(jī)取樣的原則,我們可以對(duì)此提出疑問(wèn):不在該商場(chǎng)買(mǎi)東西的人顯然不包含在樣本中,而回答問(wèn)卷的人構(gòu)成了方便樣本,從他們那兒得到
31、的數(shù)據(jù)是不能夠作為該樣本以外的其他人的推廣的;即使對(duì)于該商場(chǎng)的顧客總體本身而言,它們也不一定是典型的。這些數(shù)據(jù)只是很好地描述了那些花了時(shí)間和精力回答問(wèn)卷的顧客,僅此而已。抽樣的其它形式抽樣的其它形式 抽取比簡(jiǎn)單隨機(jī)樣本更復(fù)雜的樣本也是可能的。其中一種抽樣方法是隨機(jī)選取若干小的地區(qū),然后隨機(jī)選取居住在這個(gè)地區(qū)的一些人進(jìn)行直接調(diào)查。這是得到樣本的一種有效途徑。通過(guò)調(diào)查每一地區(qū)居住相臨的一些人,研究者們就避免了走好遠(yuǎn)的路從一個(gè)居住區(qū)到另一個(gè)居住區(qū)。任何一種抽樣程序的一個(gè)普遍的困難是,很少能完全包含屬于某一特定總體的所有樣本。1.4.3 1.4.3 收集觀測(cè)數(shù)據(jù)時(shí)的錯(cuò)誤和誤差收集觀測(cè)數(shù)據(jù)時(shí)的錯(cuò)誤和誤差
32、 研究抽樣技術(shù)使我們意識(shí)到,很多因素可使樣本中的數(shù)據(jù)產(chǎn)生錯(cuò)誤并導(dǎo)致錯(cuò)誤結(jié)論。若僅憑某一樣本中有55%的人認(rèn)為他們的生活很幸福,我們還不能夠得出結(jié)論說(shuō)全國(guó)人口中的55%的人生活很幸福。從剛開(kāi)始決定調(diào)查到最后報(bào)告結(jié)果,任何一件事情都有可能出錯(cuò)。大部分調(diào)查也的確犯了這樣或那樣的錯(cuò)誤。抽樣誤差:并非錯(cuò)誤的抽樣誤差:并非錯(cuò)誤的 誤差誤差 調(diào)查中的有些誤差純粹是統(tǒng)計(jì)上的,主要的統(tǒng)計(jì)誤差即所謂的抽抽樣誤差樣誤差( (sampling error)sampling error)。這并不是某件事出錯(cuò)造成的誤差,而是指這樣的一個(gè)事實(shí):如果研究被再做一遍,結(jié)果未必會(huì)和上次一模一樣。例如,前面提到過(guò)的在第二個(gè)100次
33、擲硬幣中,也許就有49次正面朝上,即正面朝上的比例為49%,不同于第一個(gè)100次擲硬幣中正面朝上的比例52%。又例如,在下一次的抽樣中,也許并不是60%的人贊同政府開(kāi)征的房地產(chǎn)稅,而是57%或63%或其它相近比例的人贊同房地產(chǎn)稅。但是,即便不同的樣本會(huì)產(chǎn)生不同的答案,大部分答案仍都位于總體中的真正比例的某一變化范圍內(nèi)。例如,通過(guò)每次大約1000個(gè)響應(yīng)者的多次抽樣,大部分樣本(95%)得出的比例和實(shí)際的比例至多相差3個(gè)百分點(diǎn)。也就是說(shuō),抽樣誤差等于加或減三個(gè)百分點(diǎn)( 3%)。 這種結(jié)果僅僅是每一個(gè)統(tǒng)計(jì)研究所固有的隨機(jī)性的反映。別忘了這些比例是來(lái)自不同的樣本,我們沒(méi)有理由相信一個(gè)樣本的結(jié)果會(huì)和另一
34、個(gè)樣本的結(jié)果一模一樣。并且,沒(méi)有理由相信某一特定樣本的結(jié)果恰好等于從整個(gè)總體可能得到的結(jié)果。抽樣誤差:并非錯(cuò)誤的抽樣誤差:并非錯(cuò)誤的 誤差誤差 圖1.2表明當(dāng)實(shí)際的總體比例為50%時(shí),計(jì)算機(jī)產(chǎn)生的數(shù)據(jù)的情況。其中,100個(gè)不同樣本中的95個(gè)樣本比例位于47%和53%之間。在這種情況下,我們說(shuō)有3%的抽樣誤差53%比50%多( +)3個(gè)百分點(diǎn),47%比50%少( -)3個(gè)百分點(diǎn)。圖1.2 實(shí)際的總體比例和抽樣誤差為3%的例子這一例子是基于實(shí)際的總體比例為50%的基礎(chǔ)之上的。而現(xiàn)實(shí)中,我們幾乎從來(lái)不知道這個(gè)數(shù)字。實(shí)際上,我們之所以做調(diào)查,就是要估計(jì)總體比例。然而,我們通過(guò)樣本依然可以計(jì)算出抽樣誤差
35、有多大。在第5章和第6章的參數(shù)估計(jì)和假設(shè)檢驗(yàn)中會(huì)給出一些計(jì)算抽樣誤差的公式。抽樣誤差的大小依賴于得到樣本的方式和樣本中包含的觀測(cè)的個(gè)數(shù)。樣本越大,誤差越小。如果樣本等于整個(gè)總體,則樣本比例就等于總體比例。在總體變化以前,對(duì)整個(gè)總體做重復(fù)研究,就會(huì)得到相同的結(jié)果。在這種情況下,抽樣誤差是0。抽樣誤差:并非錯(cuò)誤的抽樣誤差:并非錯(cuò)誤的 誤差誤差 在公布任何一次抽樣調(diào)查的結(jié)果時(shí)都應(yīng)說(shuō)明抽樣誤差的大小,不管是比例、均值還是其它形式。抽樣誤差告訴我們,樣本離總體的實(shí)際值可能有多遠(yuǎn)。我們將在第5章和第6章的參數(shù)估計(jì)和假設(shè)檢驗(yàn)中再次提到抽樣誤差。未響應(yīng)誤差未響應(yīng)誤差 另外一種影響抽樣調(diào)查結(jié)果的誤差是未響應(yīng)誤差
36、未響應(yīng)誤差( ( nonresponnonrespons se error)e error) 。未響應(yīng)誤差是指由于包含在樣本中未響應(yīng)誤差是指由于包含在樣本中的一部分人未回答調(diào)查而造成的誤差。的一部分人未回答調(diào)查而造成的誤差。這可能是由于某一選定的電話號(hào)碼撥了多次也沒(méi)有反應(yīng)或接通后那人拒絕回答問(wèn)題。郵寄調(diào)查通常比電話調(diào)查有更多的未響應(yīng)誤差,因?yàn)椴焕頃?huì)一封信比不理會(huì)一個(gè)響著的電話容易得多,而且信被寄錯(cuò)地址的可能性也要比撥一個(gè)無(wú)人使用的電話號(hào)碼的可能性大得多。有時(shí),一次好的電話調(diào)查,通常會(huì)有85%至90%的響應(yīng)率;而一次郵寄調(diào)查的響應(yīng)率很少有到達(dá)50%的. 對(duì)研究者來(lái)說(shuō),高拒絕率是一個(gè)很大的問(wèn)題,因
37、為他們對(duì)于被選中但未參與調(diào)查的人了解很少。于是出現(xiàn)許多無(wú)法回答的問(wèn)題:是什么使得人們有了不響應(yīng)和響應(yīng)的區(qū)別?相對(duì)響應(yīng)者來(lái)說(shuō),未響應(yīng)者是富有還是貧窮?保守還是自由?有影響力還是缺乏影響力?如果他們響應(yīng),他們的回答會(huì)怎樣影響研究結(jié)果?未響應(yīng)誤差未響應(yīng)誤差 我們通過(guò)一個(gè)最壞的假設(shè)情況來(lái)表明未響應(yīng)誤差的影響可能有多大。假定我們計(jì)劃調(diào)查1200個(gè)人,卻只有1000人接受了調(diào)查,這意味著我們?nèi)绷?00人的數(shù)據(jù)。在1000個(gè)我們調(diào)查的響應(yīng)者中,我們發(fā)現(xiàn)600人(或60%)贊成某事物而其余人反對(duì)它。如果我們假定另外200人也贊成,那么在1200人中就有800人贊成,比例為67%。但另一方面,如果我們假定那20
38、0人反對(duì),那么1200人中只有600人贊成,比例為50%。因此,僅僅由于未響應(yīng)誤差,觀測(cè)樣本中60%的贊成比例有可能實(shí)際只是50%和67%之間的一個(gè)隨機(jī)數(shù)。這就可能給我們的研究結(jié)論帶來(lái)很大的差別。 一些經(jīng)驗(yàn)表明,在大部分情況下,未響應(yīng)者和響應(yīng)者并無(wú)多大差別。如果我們開(kāi)始時(shí)有一個(gè)高的響應(yīng)率,那么可假定未響應(yīng)者也依同樣的比例作出回答。但是如果響應(yīng)率很低,例如不超過(guò)50%,那么不響應(yīng)的影響可能會(huì)很大。響應(yīng)誤差響應(yīng)誤差如果研究者小心一點(diǎn)的話,由調(diào)查得來(lái)的數(shù)據(jù)是有可能避免響應(yīng)誤差響應(yīng)誤差(response error)(response error)的。響應(yīng)誤差是在調(diào)查過(guò)程中,由于問(wèn)題的提問(wèn)方式、問(wèn)題所
39、響應(yīng)誤差是在調(diào)查過(guò)程中,由于問(wèn)題的提問(wèn)方式、問(wèn)題所處的位置或訪員的影響而使得響應(yīng)者在回答問(wèn)題時(shí)產(chǎn)生的處的位置或訪員的影響而使得響應(yīng)者在回答問(wèn)題時(shí)產(chǎn)生的偏差。偏差。我們?cè)谶@里討論其中的一部分(而不是全部)情況。即使所有的問(wèn)題都有了回答,我們所知道的也僅僅是調(diào)查時(shí)人們告訴訪員的,而未必是他們實(shí)際上做的、感覺(jué)的或想的。當(dāng)我們?cè)趫?bào)紙上讀到,在最近的一次調(diào)查中有55%的人認(rèn)為他們的生活很幸福,那么我們應(yīng)該知道這句話其實(shí)是這個(gè)意思:被調(diào)查并回答了問(wèn)題的人在當(dāng)時(shí)有55%對(duì)訪員說(shuō)他們認(rèn)為生活很幸福。1.4.4 1.4.4 實(shí)驗(yàn)數(shù)據(jù):尋找造成結(jié)果的原因?qū)嶒?yàn)數(shù)據(jù):尋找造成結(jié)果的原因 收集數(shù)據(jù)的另一種辦法是在實(shí)驗(yàn)中
40、控制一個(gè)或多個(gè)變量并測(cè)量操縱的結(jié)果。例如,如果我們給一組植物施肥,另外一組不給施肥,那么我們就是在控制植物土壤的成分。我們可以測(cè)量像增長(zhǎng)率、成活率等變量。 實(shí)驗(yàn)數(shù)據(jù)(實(shí)驗(yàn)數(shù)據(jù)(exexp pe erimental datarimental data)是指在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的變量的數(shù)據(jù)。實(shí)驗(yàn)是檢驗(yàn)變量間因果關(guān)系的一種方法。在實(shí)驗(yàn)中,研究者試圖控制某一情形的所有相關(guān)方面,操縱少數(shù)感興趣的變量,然后觀察實(shí)驗(yàn)結(jié)果。1.5 1.5 數(shù)據(jù)陣數(shù)據(jù)陣/ /數(shù)據(jù)文件數(shù)據(jù)文件數(shù)據(jù)表通常叫做數(shù)據(jù)陣或數(shù)據(jù)文件。表1.2是一個(gè)根據(jù)抽樣調(diào)查得來(lái)的數(shù)據(jù)生成的小數(shù)據(jù)陣的例子。 表表1.21.2一次抽樣調(diào)查的原始數(shù)據(jù)
41、一次抽樣調(diào)查的原始數(shù)據(jù)序號(hào)年齡性別態(tài)度120男反對(duì)223男贊成317女反對(duì)438女中立525女贊成643男贊成738男中立851女贊成935男贊成1.5 1.5 數(shù)據(jù)陣數(shù)據(jù)陣/ /數(shù)據(jù)文件數(shù)據(jù)文件在計(jì)算機(jī)分析數(shù)據(jù)時(shí),需要把數(shù)據(jù)文件中的描述性文字轉(zhuǎn)化成數(shù)字。每一個(gè)人都被分配一個(gè)身份號(hào)碼作為名字。年齡變量本來(lái)就是用數(shù)字測(cè)量的,因此不需要任何轉(zhuǎn)化。性別變量的兩個(gè)取值是“女”或“男”,因此,“女”用數(shù)字0代替,“男”用數(shù)字1代替。當(dāng)然還可以使用任何兩個(gè)別的數(shù)字,比如用17代替“女”,用23代替“男”。“態(tài)度”這個(gè)值可以用三個(gè)等級(jí)數(shù)1、2和3表示反對(duì)、中立和贊成。表表1.3 1.3 適合計(jì)算機(jī)處理的適合計(jì)算機(jī)處理的一次抽樣調(diào)查的數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《義務(wù)教育法》知識(shí)考試復(fù)習(xí)題庫(kù)(含答案)
- (技師)化學(xué)檢驗(yàn)工職業(yè)技能鑒定理論考試題庫(kù)(含答案)
- 年產(chǎn)1000噸納米復(fù)合氧化鋯項(xiàng)目可行性研究報(bào)告寫(xiě)作模板-申批備案
- 2025年江西外語(yǔ)外貿(mào)職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年常考版參考題庫(kù)含答案解析
- 2025年新疆工業(yè)職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 幼兒園月亮故事活動(dòng)策劃方案五篇
- 標(biāo)線承包合同范本
- 精準(zhǔn)醫(yī)療項(xiàng)目研發(fā)合作合同
- 麻雀的聽(tīng)評(píng)課記錄
- 承攬貨物運(yùn)輸合同范本
- 房地產(chǎn)調(diào)控政策解讀
- 產(chǎn)前診斷室護(hù)理工作總結(jié)
- 2024-2025學(xué)年八年級(jí)數(shù)學(xué)人教版上冊(cè)寒假作業(yè)(綜合復(fù)習(xí)能力提升篇)(含答案)
- 《AP內(nèi)容介紹》課件
- 醫(yī)生定期考核簡(jiǎn)易程序述職報(bào)告范文(10篇)
- 安全創(chuàng)新創(chuàng)效
- 《中國(guó)糖尿病防治指南(2024版)》更新要點(diǎn)解讀
- 初級(jí)創(chuàng)傷救治課件
- 2024年社會(huì)工作者(中級(jí))-社會(huì)綜合能力考試歷年真題可打印
- 《處理人際關(guān)系》課件
- 五年級(jí)行程問(wèn)題應(yīng)用題100道
評(píng)論
0/150
提交評(píng)論