SPSS統(tǒng)計軟件課程作業(yè)_第1頁
SPSS統(tǒng)計軟件課程作業(yè)_第2頁
SPSS統(tǒng)計軟件課程作業(yè)_第3頁
SPSS統(tǒng)計軟件課程作業(yè)_第4頁
SPSS統(tǒng)計軟件課程作業(yè)_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、SPSS統(tǒng)計軟件課程作業(yè) 信計111 劉曉蕾1. 某單位對100名女生測定血清總蛋白含量,數(shù)據(jù)如下:74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.575.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.070.4

2、72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.767.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.775.8 73.5 75.0 73.5 73.5 73.5 72.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4計算樣本均值、中位數(shù)、方差、標(biāo)準(zhǔn)差、最大值、最小值、極差、偏度和峰度,并給出均值的置信水平為95%的置信區(qū)間。第1步 數(shù)

3、據(jù)組織:定義1個變量為:“血清總蛋白含量”,其度量標(biāo)準(zhǔn)為“度量”。第2步 探索分析設(shè)置:選擇菜單“分析 描述統(tǒng)計 探索”,打開“探索” 對話框,將“血清總蛋白含量”字段移入“因變量列表”。 打開“統(tǒng)計量”對話框,選中“描述性”選項;打開“探索:圖”對話框,選中“按因子水平分組”、“莖葉圖”、“帶檢驗的正態(tài)圖”、“直方圖”等選項。打開“探索:選項”,選中“按列表排除個案”選項。第3步 運行結(jié)果及分析:描述統(tǒng)計量標(biāo)準(zhǔn)誤血清總蛋白含量均值73.6680.39389均值的 95% 置信區(qū)間下限72.8864上限74.44965% 修整均值73.6533中值73.5000方差15.515標(biāo)準(zhǔn)差3.938

4、92極小值64.30極大值84.30范圍20.00四分位距4.60偏度.054.241峰度.037.478表中顯示“血清總蛋白含量”的描述性統(tǒng)計量,左表中只顯示的是均值、均值的95%置信區(qū)間的上下限、中值、方差、標(biāo)準(zhǔn)差、極大/小值、偏度、峰度等 2. 繪出習(xí)題1所給數(shù)據(jù)的直方圖、盒形圖和QQ圖,并判斷該數(shù)據(jù)是否服從正態(tài)分布。上圖為標(biāo)準(zhǔn)Q-Q圖,Q-Q圖可以用來檢驗數(shù)據(jù)是否服從某種分布,在Q-Q圖中,檢驗數(shù)據(jù)是否較好地服從給定分布的標(biāo)準(zhǔn)有兩個:看標(biāo)準(zhǔn)Q-Q圖上的數(shù)據(jù)點與直線的重合度;Q-Q趨勢圖上的點是否關(guān)于直線Y=0在較小的范圍內(nèi)上下波動。從上圖中可以看出,題目中的數(shù)據(jù)與直線重合度較好,故很好

5、地服從正態(tài)分布,這與前面的正態(tài)檢驗表中的結(jié)果是一致的 箱圖中顯示血清蛋白總含量數(shù)據(jù)繪制成對應(yīng)的箱體。每一個箱體上方那條線的取值代表該分組中最大值,下方那條線的取值代表最小值。箱體自身的三條線從上到下分別代表3/4分位點、中位點、1/4分位點的取值。正態(tài)性檢驗Kolmogorov-SmirnovaShapiro-Wilk統(tǒng)計量dfSig.統(tǒng)計量dfSig.血清總蛋白含量.073100.200*.990100.671a. Lilliefors 顯著水平修正*. 這是真實顯著水平的下限。表中顯示了血清總蛋白含量的兩種檢驗方法的正態(tài)性檢驗結(jié)果,包括各分組的統(tǒng)計量、自由度及顯著性水平,以K-S方法的分析

6、:其自由度sig.=0.200,明顯大于0.05,故應(yīng)接受原假設(shè),認(rèn)為題中數(shù)據(jù)服從正態(tài)分布3. 正常男子血小板計數(shù)均值為, 今測得20名男性油漆工作者的血小板計數(shù)值(單位:)如下: 220 188 162 230 145 160 238 188 247 113 126 245 164 231 256 183 190 158 224 175問油漆工人的血小板計數(shù)與正常成年男子有無異常? 分析:這是一個典型的比較樣本均值和總體均值的T檢驗問題 ;第1步 數(shù)據(jù)組織:首先建立SPSS數(shù)據(jù)文件,只需建立一個變量“血小板計數(shù)”,錄入相應(yīng)的數(shù)據(jù)即可第2步 單樣本T檢驗分析設(shè)置選擇菜單“分析比較均值單樣本T檢

7、驗(S)”,打開 “單樣本T檢驗” 對話框,將變量“血小板計數(shù)”移入”檢驗變量”列表框,并輸入檢驗值225;打開“單樣本T檢驗:選項”對話框 ,設(shè)置置信區(qū)間為95%(缺省為95%);單個樣本統(tǒng)計量N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤血小板計數(shù)20192.150042.236529.44437上表給出了單樣本T檢驗的描述性統(tǒng)計量,包括樣本數(shù)(N)、均值、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤。 單個樣本檢驗檢驗值 = 225 tdfSig.(雙側(cè))均值差值差分的 95% 置信區(qū)間下限上限血小板計數(shù)-3.47819.003-32.85000-52.6173-13.0827本例置信水平為95%,顯著性水平為0.05,從上表中可以

8、看出,雙尾檢測概率P值為0.003,小于0.05,故原假設(shè)不成立,也就是說,男性油漆工作者的血小板與有顯著性差異,無理由相信油漆工人的血小板計數(shù)與正常成年男子無異常。4. 在某次考試中,隨機抽取男女學(xué)生的成績各10名,數(shù)據(jù)如下: 男:99 79 59 89 79 89 99 82 80 85 女:88 54 56 23 75 65 73 50 80 65假設(shè)總體服從正態(tài)分布,比較男女得分是否有顯著性差異。第1步 數(shù)據(jù)組織:在SPSS數(shù)據(jù)文件中建立兩個變量,分別為“性別”、“成績”,度量標(biāo)準(zhǔn)分別為“名義”、“度量”,變量“品種”的值標(biāo)簽為:b男生,g女生,錄入數(shù)據(jù)。第2步 獨立樣本T檢驗設(shè)置:選

9、擇菜單 “選擇比較均值獨立樣本T檢驗”,打開“獨立樣本T檢驗”對話框,將“成績” 作為要進行T檢驗的變量,將“性別”字段作為分組變量,定義分組變量的兩個分組分別為“b”和“g”。 打開“獨立樣本T檢驗:選項”對話框,具體選項內(nèi)容及設(shè)置與單樣本T檢驗相同。 組統(tǒng)計量性別N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤成績男生1084.000011.527743.64539女生1062.900018.453855.83562上表給出了本例獨立樣本T檢驗的基本描述統(tǒng)計量,包括兩個樣本的均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤。 獨立樣本檢驗方差方程的 Levene 檢驗均值方程的 t 檢驗差分的 95% 置信區(qū)間FSig.tdfSig.

10、(雙側(cè))均值差值標(biāo)準(zhǔn)誤差值下限上限成績假設(shè)方差相等1.607.2213.06718.00721.100006.880656.6442935.55571假設(shè)方差不相等3.06715.096.00821.100006.880656.4423535.75765根據(jù)上表“方差方程的 Levene 檢驗”中的sig.為0.221,遠大于設(shè)定的顯著性水平0.05,故本例兩組數(shù)據(jù)方差相等。在方差相等的情況下,獨立樣本T檢驗的結(jié)果應(yīng)該看上表中的“假設(shè)方差相等”一行,第5列為相應(yīng)的雙尾檢測概率(Sig.(雙側(cè))為0.007,在顯著性水平為0.05的情況下,T統(tǒng)計量的概率p值小于0.05,故應(yīng)拒絕零假設(shè),,即認(rèn)為

11、兩樣本的均值不是相等的,在本例中,能認(rèn)為男女得分績有顯著性差異。 5. 設(shè)有5種治療蕁麻疹的藥,要比較它們的療效。假設(shè)將30個病人分成5組,每組6人,令同組病人使用一種藥,并記錄病人從使用藥物開始到痊愈所需時間,得到下面的記錄:藥物類別治愈所需天數(shù)15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6問所有藥物的效果是否一樣?第1步 分析:由于考慮的是一個控制變量(藥物)對一個觀測變量(治愈所需天數(shù))的影響,而且是五種藥物,所以不適宜用獨立樣本T檢驗(僅適用兩組數(shù)據(jù)),應(yīng)采用單因素方差分析。第2步 數(shù)據(jù)的組織:數(shù)據(jù)分成兩列,一

12、列是治愈所需天數(shù),變量名為“治愈所需天數(shù)”,另一變量是藥物種類(變量值分別為1,2,3,4,5),變量名為“藥物種類”,輸入數(shù)據(jù)并保存。 第3步 方差相等的齊性檢驗:由于方差分析的前提是各個水平下(這里是不同的藥物種類影響下的治愈所需天數(shù))的總體服從方差相等的正態(tài)分布,且各組方差具有齊性。其中正態(tài)分布的要求并不是很嚴(yán)格,但對于方差相等的要求是比較嚴(yán)格的,因此必須對方差相等的前提進行檢驗。 誤差方差等同性的 Levene 檢驗a因變量:治愈所需天數(shù)Fdf1df2Sig.552425.699檢驗零假設(shè),即在所有組中因變量的誤差方差均相等。a. 設(shè)計 : 截距 + 藥物類別方差齊性檢驗的H0假設(shè)是:

13、方差相等。從上表可看出相伴根據(jù)Sig.=0.699>(0.05)說明應(yīng)該接受H0假設(shè)(即方差相等)。故下面就用方差相等的檢驗方法。 ANOVA治愈所需天數(shù)平方和df均方F顯著性組間36.46749.1173.896.014組內(nèi)58.500252.340總數(shù)94.96729上表是幾種飼料方差分析的結(jié)果,組間(Between Groups)平方和(Sum of Squares)為36.467,自由度(df)為4,均方為9.117;組內(nèi)(Within Groups)平方和為58.500,自由度為25,均方為2.340;F統(tǒng)計量為3.896。由于組間比較的相伴概率Sig.(p值)=0.014&l

14、t;0.05,故應(yīng)拒絕H0假設(shè)(四種飼料喂豬效果無顯著差異),說明五種藥物對治愈所需天數(shù)有顯著性差異。第4步 多重比較分析:通過上面的步驟,只能判斷4種飼料喂豬效果是否有顯著差異。如果想進一步了解究竟是哪種藥物與其他組有顯著性的均值差別(即哪種藥物更好)等細(xì)節(jié)問題,就需要在多個樣本均值間進行兩兩比較。由于第3步檢驗出來方差具有齊性,故選擇一種方差相等的方法,這里選LSD方法;顯著性水平默認(rèn)取0.05;多個比較治愈所需天數(shù)LSD(I) 藥物類別(J) 藥物類別均值差值 (I-J)標(biāo)準(zhǔn) 誤差Sig.95% 置信區(qū)間下限上限類別1類別22.5000*.88318.009.68114.3189類別33

15、.1667*.88318.0011.34774.9856類別42.3333*.88318.014.51444.1523類別51.3333.88318.144-.48563.1523類別2類別1-2.5000*.88318.009-4.3189-.6811類別3.6667.88318.457-1.15232.4856類別4-.1667.88318.852-1.98561.6523類別5-1.1667.88318.198-2.9856.6523類別3類別1-3.1667*.88318.001-4.9856-1.3477類別2-.6667.88318.457-2.48561.1523類別4-.833

16、3.88318.354-2.6523.9856類別5-1.8333*.88318.048-3.6523-.0144類別4類別1-2.3333*.88318.014-4.1523-.5144類別2.1667.88318.852-1.65231.9856類別3.8333.88318.354-.98562.6523類別5-1.0000.88318.268-2.8189.8189類別5類別1-1.3333.88318.144-3.1523.4856類別21.1667.88318.198-.65232.9856類別31.8333*.88318.048.01443.6523類別41.0000.88318.

17、268-.81892.8189基于觀測到的均值。 誤差項為均值方 (錯誤) = 2.340。*. 均值差值在 .05 級別上較顯著。從整個表反映出來五種藥物相互之間均存在顯著性差異,從效果來看是第3種最好,其次是第2種,第1種最差。 上圖為幾種藥物均值的折線圖,可以看出均值分布比較陡峭,均值差異也較大。6. 某公司在各地區(qū)銷售一種特殊化妝品。該公司觀測了15 個城市在某月內(nèi)對該化妝品的銷售量Y及各地區(qū)適合使用該化妝品的人數(shù)X1和人均收入X2,得到數(shù)據(jù)如下: 地區(qū)銷售(箱)人數(shù)(千人)人均收入(元)1162274245021201803254322337538024131205283856786

18、23476169265378278198300881923302450911619521371055532560112524304020122323724427131442362660141031572088152123702605(1) 畫出這三個變量的兩兩散點圖,并計算出兩兩之間的相關(guān)系數(shù)。(2)試建立Y與X1,X2之間的線性回歸方程,并研究相應(yīng)的統(tǒng)計推斷問題,同時預(yù)測適合購買此化妝品的人數(shù)為220千人,人均收入為2500元的某城市對該化妝品的銷量。第1步 分析:這是一個因變量和兩個自變量之間的問題,故應(yīng)該考慮用二元線性回歸解決。第2步 數(shù)據(jù)組織:定義三個變量,分別為“z”(銷售量)、“x

19、”(人數(shù))、“y”(人均收入)。第3步 一元線性回歸分析設(shè)置:選擇菜單“分析回歸線性”,打開“線性回歸”對話框,將變量“銷售量”作為因變量 ,“人數(shù)”和“人均收入”作為自變量。打開“統(tǒng)計量”對話框,選上“估計”和“模型擬合度”。單擊“繪制(T)”按鈕,打開“線性回歸:圖”對話框,選用DEPENDENT作為y軸,*ZPRED為x軸作圖。并且選擇“直方圖”和“正態(tài)概率圖” 作相應(yīng)的保存選項設(shè)置,如預(yù)測值、殘差和距離等。輸入移去的變量模型輸入的變量移去的變量方法1人均收入, 人數(shù)a.輸入a. 已輸入所有請求的變量。表中顯示回歸模型編號、進入模型的變量、移出模型的變量和變量的篩選方法??梢钥闯?,進入模

20、型的自變量為“銷售量” 模型匯總b模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差1.999a.999.9992.17722a. 預(yù)測變量: (常量), 人均收入, 人數(shù)。b. 因變量: 銷售量R=0.999,說明自變量與因變量之間的相關(guān)性很強。R方(R2) =0.999,說明自變量“銷售量”可以解釋因變量“人數(shù)”和“人均收入”的99.9%的差異性。 Anovab模型平方和df均方FSig.1回歸53844.716226922.3585679.466.000a殘差56.884124.740總計53901.60014a. 預(yù)測變量: (常量), 人均收入, 人數(shù)。b. 因變量: 銷售量表中顯示因變量的方

21、差來源、方差平方和、自由度、均方、F檢驗統(tǒng)計量的觀測值和顯著性水平。方差來源有回歸、殘差。從表中可以看出,F(xiàn)統(tǒng)計量的觀測值為5679.466,顯著性概率為0.000,即檢驗假設(shè)“H0:回歸系數(shù)B = 0”成立的概率為0.000,從而應(yīng)拒絕原假設(shè),說明因變量和自變量的線性關(guān)系是非常顯著的,可建立線性模型。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差試用版1(常量)3.4532.4311.420.181人數(shù).496.006.93481.924.000人均收入.009.001.1089.502.000a. 因變量: 銷售量表中顯示回歸模型的常數(shù)項、非標(biāo)準(zhǔn)化的回歸系數(shù)B值及其標(biāo)準(zhǔn)誤差、標(biāo)準(zhǔn)化的

22、回歸系數(shù)值、統(tǒng)計量t值以及顯著性水平(Sig.)。從表中可看出,回歸模型的常數(shù)項為3.453,自變量“人數(shù)”的回歸系數(shù)為0.496,“人均收入”的回歸系數(shù)為0.009.因此,可以得出回歸方程:銷售量=3.453+ 0.496 × 人數(shù)+0.009×人均收入。回歸系數(shù)的顯著性水平為0.000,明顯小于0.05,故應(yīng)拒絕T檢驗的原假設(shè),這也說明了回歸系數(shù)的顯著性,說明建立線性模型是恰當(dāng)?shù)?。?dāng)購買此化妝品的人數(shù)為220千人,人均收入為2500元時,該城市該化妝品的銷量為:銷售量=220×0.496+0.009×2500+3.453=135.073箱系數(shù)a模型非

23、標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.相關(guān)性B標(biāo)準(zhǔn) 誤差試用版零階偏部分1(常量)3.4532.4311.420.181人數(shù).496.006.93481.924.000.995.999.768人均收入.009.001.1089.502.000.639.940.089a. 因變量: 銷售量7. 研究青春發(fā)育階段的年齡和遠視率的變化關(guān)系,測得數(shù)據(jù)如下年齡6789101112131415161718遠視率63.6461.0638.8413.7514.58.074.412.272.091.022.513.122.98請對年齡與遠視率的關(guān)系進行曲線估計。第1步 分析:先用散點圖的形式進行分析,看究竟是否具有一元線

24、性關(guān)系,如果具有一元線性關(guān)系,則用一元線性回歸分析,否則采用曲線估計求解。第2步 數(shù)據(jù)組織:定義為兩個變量,分別是“x”(年齡)、“y”(遠視率),輸入數(shù)據(jù)并保存。第3步 作散點圖初步判定變量的分布趨勢:第4步 進行曲線估計:依次選擇菜單“分析回歸曲線估計”,將所有模型全部選上,看哪種模型擬合效果更好(主要看決定系數(shù)R2),其所有模型的擬合優(yōu)度R2如下表所示。模型匯總和參數(shù)估計值因變量:遠視率方程模型匯總參數(shù)估計值R 方Fdf1Df2Sig.常數(shù)b1b2b3線性.75828.18219.00088.198-6.265對數(shù).85151.22119.000180.617-68.560倒數(shù).9129

25、3.29119.000-48.486679.341二次.95381.44828.000214.566-31.3111.138三次.95650.63837.000271.869-48.7352.804-.050復(fù)合.925110.42219.000834.164.658冪.934127.84819.000232454.999-4.351S.90182.30119.000-1.96340.901增長.925110.42219.0006.726-.419指數(shù).925110.42219.000834.164-.419Logistic.925110.42219.000.0011.520自變量為 年齡。從決定系數(shù)(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論