統(tǒng)計(jì)案例分析_第1頁(yè)
統(tǒng)計(jì)案例分析_第2頁(yè)
統(tǒng)計(jì)案例分析_第3頁(yè)
統(tǒng)計(jì)案例分析_第4頁(yè)
統(tǒng)計(jì)案例分析_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

本文格式為Word版,下載可任意編輯——統(tǒng)計(jì)案例分析

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

哺乳動(dòng)物大腦發(fā)育水平相關(guān)因素回歸分析

小組成員:

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

目錄

一、數(shù)據(jù)來(lái)源及背景1

1.?dāng)?shù)據(jù)來(lái)源12.?dāng)?shù)據(jù)背景及研究目的13.?dāng)?shù)據(jù)說(shuō)明1二、統(tǒng)計(jì)分析1

1.?dāng)?shù)據(jù)描述性分析1

1.1數(shù)據(jù)基本描述11.2置信區(qū)間分析21.3brainweight與bodyweight的數(shù)據(jù)相關(guān)性21.4所有參數(shù)的相關(guān)性32.?dāng)?shù)據(jù)圖形化分析33.多元回歸分析5

3.1原始數(shù)據(jù)直接多元回歸分析53.2對(duì)多元回歸原始數(shù)據(jù)處理和調(diào)整83.3數(shù)據(jù)模型的確定123.4對(duì)Cook距離的分析17

三、總結(jié)18附錄:研究數(shù)據(jù)19

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

統(tǒng)計(jì)案例分析

一、數(shù)據(jù)來(lái)源及背景1.?dāng)?shù)據(jù)來(lái)源

數(shù)據(jù)來(lái)源于AmericanNaturalist(1974)雜志p.593-613.

2.?dāng)?shù)據(jù)背景及研究目的

達(dá)爾文在他的《進(jìn)化論》一書中指出“生物之間存在著生存斗爭(zhēng),適應(yīng)者生存下來(lái),不適者則被淘汰,這就是自然的選擇。生物正是通過(guò)遺傳、變異和自然選擇,從低級(jí)到高級(jí),從簡(jiǎn)單到繁雜,種類由少到多地進(jìn)化著、發(fā)展著。〞從達(dá)爾文的觀點(diǎn)中我們可以得出動(dòng)物具備使它們自身更好的生存和繁衍后代的能力,這是一種內(nèi)在的屬性。有一種觀點(diǎn)認(rèn)為,具備更大大腦容量的動(dòng)物,譬如哺乳動(dòng)物在生存和繁衍方面一般會(huì)表現(xiàn)得更好。雖然,哺乳動(dòng)物的自然選擇有一些限制,譬如他們尋常需要更長(zhǎng)的懷孕期并且一次孕育后代的數(shù)量更少。這些負(fù)面因素在一定程度上減弱了哺乳動(dòng)物的優(yōu)勢(shì)。但是總體來(lái)說(shuō),哺乳動(dòng)物的優(yōu)勢(shì)要大于它們的劣勢(shì)。尋常狀況下,較大的大腦意味著軀體也更加的碩大。我們嘗試用統(tǒng)計(jì)的方法,研究和分析一下具備更大大腦容量的哺乳動(dòng)物之間具有什么樣一致和不同的特征,在這些特征中是否會(huì)存在某些特別突出的因素。眾所周知,哺乳動(dòng)物是動(dòng)物發(fā)展史上最高級(jí)的階段,也是與人類關(guān)系最密切的一個(gè)類群。我們希望通過(guò)此次的論證和研究,能夠得到關(guān)于一些哺乳動(dòng)物大腦重量的信息,并找到與之相關(guān)聯(lián)的因素,為促進(jìn)哺乳動(dòng)物大腦重量的研究提供可以參考的依據(jù)。3.?dāng)?shù)據(jù)說(shuō)明

我們小組分析的案例,是研究哺乳動(dòng)物大腦重量和其他幾種因素的關(guān)系。這些因素主要包括哺乳動(dòng)物的妊娠期天數(shù)、身體重量以及平均每窩產(chǎn)仔數(shù)量。數(shù)據(jù)總共采集了96種不同哺乳動(dòng)物的信息。當(dāng)模型具有顯著的統(tǒng)計(jì)意義并且樣本足夠大(n=96)時(shí),可以獲得比較確鑿的估計(jì)值。

二、統(tǒng)計(jì)分析

1.?dāng)?shù)據(jù)描述性分析1.1數(shù)據(jù)基本描述

我們對(duì)所采用的數(shù)據(jù)首先進(jìn)行了簡(jiǎn)單的描述性分析,具體信息見(jiàn)下圖。

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

從上圖的描述性分析初步可知,哺乳動(dòng)物的平均懷孕期為151天,平均大腦重量為219毫克,平均體重108公斤,平均每次產(chǎn)仔數(shù)量為2.3。

對(duì)數(shù)據(jù)置信區(qū)間的分析使我們得知了:

對(duì)數(shù)據(jù)gestationperiod,樣本均值為151.3,標(biāo)準(zhǔn)誤11.0,由此構(gòu)造的區(qū)間(129.4,173.2)有95%包括gestationperiod總體均值。

對(duì)數(shù)據(jù)brainweight,樣本均值為219.0,標(biāo)準(zhǔn)誤51.7,由此構(gòu)造的區(qū)間(116.3,321.7)有95%包括brainweight總體均值。

對(duì)數(shù)據(jù)bodyweight,樣本均值為108.3,標(biāo)準(zhǔn)誤33.6,由此構(gòu)造的區(qū)間(41.6,175.1)有95%包括bodyweight總體均值。

對(duì)數(shù)據(jù)av.Littersize,樣本均值為2.310,標(biāo)準(zhǔn)誤0.178,由此構(gòu)造的區(qū)間(1.956,2.664)有95%包括av.Littersize

總體均值。

根據(jù)結(jié)果顯示,哺乳動(dòng)物的大腦重量和軀體重量是有十分強(qiáng)的相關(guān)性的。但是對(duì)brainweight取對(duì)數(shù)后,lnbrainweight和bodyweight之間的相關(guān)性減弱。而lnbrainweight和lnbody

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

對(duì)brainweight和bodyweight取對(duì)數(shù)以后的整體相關(guān)性分析,可以粗略的看到,數(shù)據(jù)之間的相關(guān)性更加緊湊,整體感覺(jué)好于之前的分析。

2.?dāng)?shù)據(jù)圖形化分析

這里,我們分別觀測(cè)了brainweight和bodyweight的散點(diǎn)圖,以及l(fā)nbrainweight和lnbodyweight的散點(diǎn)圖。從第一張圖上可以看到,絕大多數(shù)哺乳動(dòng)物集中在圖的左下角,也就是體重小于500公斤,大腦重量小于1000毫克的范圍里。哺乳動(dòng)物的體重變化范圍還是相對(duì)較大的,下圖中最大的體重是非洲象,體重2800公斤同時(shí)其大腦重量也達(dá)到了4480毫克,其次

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

是河馬體重1400公斤。相對(duì)于體重,腦容量更重的兩個(gè)物種則是人類和海豚。海豚的腦重量

我們還嘗試使用箱線圖的方式對(duì)四種變量進(jìn)行簡(jiǎn)單的摸索性數(shù)據(jù)分析,以便更直觀的看到幾種數(shù)據(jù)的分布概況。

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

3.多元回歸分析

3.1原始數(shù)據(jù)直接多元回歸分析

我們以大腦重量為因變量,其他3種數(shù)據(jù)作為自變量,直接進(jìn)行回歸分析?;貧w結(jié)果如下:

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

數(shù)據(jù)分析:

H0:0

根據(jù)假設(shè)檢驗(yàn)的定義來(lái)初步分析一下回歸結(jié)果,假設(shè)檢驗(yàn):

H:0a

從回歸方程上分析,常數(shù)項(xiàng),gestationperiod和bodyweight的P-值很小,說(shuō)明可以明顯

拒絕原假設(shè)H0。但是av.littersize的P-值為0.116,不能拒絕原假設(shè)。因此,對(duì)數(shù)據(jù)的回歸分析還需要進(jìn)一步的分析和驗(yàn)證。

Brainweight殘差正態(tài)圖和殘差與擬合值圖如下:

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

數(shù)據(jù)分析:

從殘差的正態(tài)分布圖和殘差與擬合值圖分析,明顯可以看到殘差和正態(tài)分布擬合的不好,具有異方差的特性,是十分?jǐn)?shù)方差。因此,初始的設(shè)置對(duì)數(shù)據(jù)進(jìn)行直接回歸分析是不恰當(dāng)?shù)?。考慮采用其他模型來(lái)重新進(jìn)行回歸分析。

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

3.2對(duì)多元回歸原始數(shù)據(jù)處理和調(diào)整

考慮到殘差圖的形狀,為了消除異方差的影響,我們對(duì)brainweight取對(duì)數(shù),并再一次進(jìn)行回歸分析:

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

數(shù)據(jù)分析:

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

從殘差圖的正態(tài)圖和殘差與擬合值圖分析,殘差的分布效果更好。但是殘差的正態(tài)擬合圖的擬合效果依舊不是很好。并且,從上面的結(jié)果可以明顯看到,對(duì)brainweight取對(duì)數(shù)進(jìn)行回歸以后,bodyweight參數(shù)的P-值明顯變大。考慮到哺乳動(dòng)物的brainweight和bodyweight還是應(yīng)當(dāng)有比較直接的聯(lián)系的。因此我們對(duì)數(shù)據(jù)進(jìn)行了進(jìn)一步的調(diào)整,對(duì)bodyweight也取其對(duì)數(shù)值并用取對(duì)數(shù)以后的值再次進(jìn)行分析。可以說(shuō)哺乳動(dòng)物的重量67.8%可以用妊娠周期的變異和每窩產(chǎn)仔數(shù)的變化來(lái)說(shuō)明。在產(chǎn)仔一致的狀況下,妊娠時(shí)間每多一天,幼仔大腦的重量提高0.015,會(huì)增加一微克。在控制其他因素的狀況下,每窩幼仔多產(chǎn)一只,平均大腦重量會(huì)減少0.215微克。

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

72757778

655390115240

8.40745.52155.19306.3801

8.53586.53764.77807.3992

0.2956-0.12850.1337-1.01620.23470.41500.1101-1.0191

-0.33X-2.16R0.97X-2.14R

R表示此觀測(cè)值含有大的標(biāo)準(zhǔn)化殘差X表示受X值影響很大的觀測(cè)值。

weight殘差正態(tài)圖lnbrainweight殘差正態(tài)圖殘差與擬合值正態(tài)概率圖(響應(yīng)為lnbrainweight)99.99995908070605040302010510.1

百分比

-1.5

-1.0

-0.5

0.0殘差

0.5

1.0

1.5

2.0

-11-

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

數(shù)據(jù)分析:

對(duì)bodyweight取對(duì)數(shù)以后的回歸結(jié)果,明顯好于之前。三個(gè)自變量的P-值0.05,說(shuō)明可以拒絕自變量的系數(shù)為0的假設(shè)。因此,可以認(rèn)為哺乳動(dòng)物大腦容量和其他幾種因素是具有一定聯(lián)系的。根據(jù)回歸的結(jié)果,異常數(shù)據(jù)有3個(gè)數(shù)據(jù)點(diǎn)殘差大,這說(shuō)明這些數(shù)據(jù)點(diǎn)與方程擬合程度一般。其中殘存最大的兩種哺乳動(dòng)物是人類和海豚,如上圖上方2個(gè)數(shù)據(jù)點(diǎn)所示。人類作為一種高智商的哺乳動(dòng)物,在統(tǒng)計(jì)數(shù)據(jù)分析過(guò)程中,表達(dá)出一個(gè)比較大的殘差值還是可以理解的。同樣,我們從統(tǒng)計(jì)分析中也可以得知海豚也是一種高智商的哺乳動(dòng)物。這些結(jié)論都和我們?nèi)粘I畛WR(shí)是吻合的。

3.3數(shù)據(jù)模型的確定

Minitab提供了自動(dòng)選擇最優(yōu)的回歸模型的功能,為了確定最終的數(shù)據(jù)統(tǒng)計(jì)分析模型,我們嘗試讓Minitab自動(dòng)得出一個(gè)結(jié)論?;貧w的匯總報(bào)告如下圖:

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

從上面的分析中,看到lnbrainweight和lnbodyweight之間用線性模型進(jìn)行擬合的效果要

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

稍遜于使用二次模型。二次模型具有顯著的二次項(xiàng)以及較高的調(diào)整的R平方。因此改用二次模

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

嘗試添加lnbodyweight的二次項(xiàng),重新對(duì)數(shù)據(jù)集進(jìn)行回歸分析?;貧w分析:ln回歸分析:lnbrainwei與gestation

pe,av.Litters,lnbodyweig,lnbwsq回歸方程為lnbrainweight=2.52+0.00338gestationperiod(days)-0.112av.Littersize+0.659lnbodyweight-0.0239lnbwsq自變量系數(shù)系數(shù)標(biāo)準(zhǔn)誤T常量2.51620.155116.23gestationperiod(days)0.00338100.00083904.03av.Littersize-0.111540.03623-3.08lnbodyweight0.658750.0270624.35lnbwsq-0.0238830.005878-4.06S=0.452819方差分析來(lái)源自由度SS回歸4429.15殘差誤差9118.66合計(jì)95447.81MSFP107.29523.240.0000.21R-Sq=95.8%R-Sq(調(diào)整)=95.7%P0.0000.0000.0030.0000.000

來(lái)源自由度SeqSSgestationperiod(days)1291.10av.Littersize111.05lnbodyweight1123.62lnbwsq13.38異常觀測(cè)值gestationperiodlnbrain擬合值標(biāo)準(zhǔn)化(days)weight擬合值標(biāo)準(zhǔn)誤殘差殘差2707.17015.65120.07411.51893.40R671.45402.43260.0669-0.9786-2.19R3607.37786.34990.11101.02792.34R6558.40748.34320.27750.06420.18X3905.52156.59930.1246-1.0778-2.48R1155.19304.81160.21730.38140.96X2406.38016.73480.1926-0.3547-0.87X

觀測(cè)值24465272757778

R表示此觀測(cè)值含有大的標(biāo)準(zhǔn)化殘差-15-

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

數(shù)據(jù)分析:

受Minitab擬合建議的啟發(fā),嘗試添加了一個(gè)二次項(xiàng)后,我們可以看到新增加的二次項(xiàng)的

商務(wù)統(tǒng)計(jì)案例分析,小組作業(yè)。

P-值為0.000。這說(shuō)明,二次項(xiàng)在回歸模型里還是有一定意義的。從上圖中可以看到調(diào)整的R平方進(jìn)一步提高到95.7%。也就是說(shuō)模型對(duì)變異的解釋能力進(jìn)一步提高。在進(jìn)行回歸分析的最終,我們?cè)贛in

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論