第9章數(shù)據(jù)分析一課件

上傳人：x*** IP屬地：貴州上傳時(shí)間：2023-09-11 格式：PPT 頁數(shù)：125 大?。?.06MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩120頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第九講數(shù)據(jù)分析（一）余可發(fā)博士江西財(cái)經(jīng)大學(xué)工商管理學(xué)院1第九講數(shù)據(jù)分析（一）余可發(fā)博士1一、數(shù)據(jù)處理與分析過程1、編輯2、編碼3、數(shù)據(jù)輸入4、數(shù)據(jù)分析（描述性分析、單變量分析、雙變量分析、多變量分析）5、解釋2一、數(shù)據(jù)處理與分析過程1、編輯2二、編輯編輯就是檢查和調(diào)整數(shù)據(jù)遺漏、易讀性和一致性的過程。編輯人員的任務(wù)就是要檢查調(diào)查問卷或者其他數(shù)據(jù)收集形式中出現(xiàn)的錯(cuò)誤和遺漏。當(dāng)發(fā)現(xiàn)問題時(shí)，編輯要及時(shí)調(diào)整數(shù)據(jù)讓他們變得更加完整、一致、可讀。3二、編輯編輯就是檢查和調(diào)整數(shù)據(jù)遺漏、易讀性和一致性的過程。3編輯技巧：1、退回重新填寫2、按缺失數(shù)據(jù)處理3、丟棄（1）不符合要求的問卷和少。（2）樣本單位數(shù)很大。（3）不符合要求的問卷與符合要求的問卷之間在調(diào)查對(duì)象上的特征上沒有明顯的不同。（4）不符合要求的回答在該問卷中占很大的比例。（5）對(duì)關(guān)鍵變量的回答是缺失的。4編輯技巧：4編輯的類型：現(xiàn)場編輯后期編輯5編輯的類型：5編輯的任務(wù)：1、確定是否需要補(bǔ)充調(diào)查2、編輯的一致性3、編輯的完整性6編輯的任務(wù)：6三、編碼編碼就是將數(shù)字標(biāo)度或其他符號(hào)分配給不同答案的過程。相關(guān)概念：域：一種類型的數(shù)據(jù)。記錄：相關(guān)域的集合。文件：相關(guān)記錄的集合。7三、編碼編碼就是將數(shù)字標(biāo)度或其他符號(hào)分配給不同答案的過程。788編碼工作一般包括以下幾個(gè)方面：（1）確定變量（2）確定變量值（3）無結(jié)構(gòu)問題的編碼（4）編碼說明書及數(shù)據(jù)輸出格式說明書。9編碼工作一般包括以下幾個(gè)方面：9問題025：您認(rèn)為打工的外地人對(duì)北京市的社會(huì)秩序是否有影響？（單選）1□有很大影響2□有較大影響3□沒有影響4□不好說4編碼答案10問題025：您認(rèn)為打工的外地人對(duì)北京市的社會(huì)秩序是否有影響？2）制作編碼表112）制作編碼表11直接過錄0-1編碼變量名:一個(gè)數(shù)據(jù)文件中,一個(gè)變量只能有一個(gè)唯一名稱。碼位：某一變量在數(shù)據(jù)文件中占據(jù)的欄位碼數(shù)：某一變量由幾位數(shù)組成。該變量是數(shù)值型（Numeric）——如定距、定比，還是字串型（String），如定類、定序。前者在統(tǒng)計(jì)中可以做高級(jí)運(yùn)算，后者則不可以。不適于被訪人回答的問題的編碼。一般采用7，97，997等。被訪人回答不知道時(shí)的編碼。一般采用8，98，998等。被訪人拒絕回答某變量時(shí)的編碼。一般采用9，99，999等。問卷中出現(xiàn)漏答時(shí)的處理編碼。一般采用9，99，999等。12直接過錄變量名:一個(gè)數(shù)據(jù)文件中,碼位：某一變量在碼數(shù)：該變四、數(shù)據(jù)錄入外部式錄入內(nèi)部式錄入采用DOS、WPS、CCED等軟件，按ASCII碼方式錄入成文本文件（*.dat；*.txt）。這種錄入方式的特點(diǎn)是，數(shù)據(jù)之間沒有間隔，錄完一個(gè)數(shù)碼后自動(dòng)后移，錄入速度較快。缺點(diǎn)是容易錯(cuò)位。采用SPSS數(shù)據(jù)編輯器（SPSSDataEditor）錄入。其優(yōu)點(diǎn)是不容易錯(cuò)位，缺點(diǎn)是不能自動(dòng)后移，錄入速度慢，數(shù)據(jù)錯(cuò)誤不容易修改。13四、數(shù)據(jù)錄入外部式錄入內(nèi)部式錄入采用DOS、WPS、CCED五、數(shù)據(jù)分析描述分析法假設(shè)檢驗(yàn)法方差分析法聚類分析法判別分析法回歸分析法14五、數(shù)據(jù)分析描述分析法141、描述性統(tǒng)計(jì)分析頻數(shù)、頻率分析數(shù)據(jù)集中趨勢分析算術(shù)平均數(shù)中位數(shù)眾數(shù)數(shù)據(jù)分散趨勢分析全距（極差）四分位差標(biāo)準(zhǔn)差數(shù)據(jù)總體形態(tài)分布偏度（Skewness）峰度（Kurtosis）

151、描述性統(tǒng)計(jì)分析頻數(shù)、頻率分析15頻數(shù)、頻率分析（1）例1：假設(shè)有樣本數(shù)據(jù)ABCDEFGHIJ11221465332261122325433441331433541345642463535211211466263455132276366236511841533646349513252226210325234144516頻數(shù)、頻率分析（1）例1：假設(shè)有樣本數(shù)據(jù)ABCDEFGHIJ17171818算術(shù)平均數(shù)未分組數(shù)據(jù)的平均數(shù)計(jì)算分組數(shù)據(jù)的平均數(shù)計(jì)算上例的計(jì)算結(jié)果19算術(shù)平均數(shù)未分組數(shù)據(jù)的平均數(shù)計(jì)算19中位數(shù)的計(jì)算（1）未分組數(shù)據(jù)的中位數(shù)計(jì)算對(duì)所有數(shù)據(jù)進(jìn)行排序，當(dāng)數(shù)據(jù)量為奇數(shù)時(shí)，取中間數(shù)為中位數(shù)，當(dāng)數(shù)據(jù)量為偶數(shù)時(shí)，取最中間兩位數(shù)的平均數(shù)為中位數(shù)。上例中數(shù)據(jù)量為100，是偶數(shù)，所以應(yīng)取排序后第50位數(shù)和第51位數(shù)的平均值作為中位數(shù)。第50位數(shù)是3，第51位數(shù)也是3，所以中位數(shù)為3。20中位數(shù)的計(jì)算（1）未分組數(shù)據(jù)的中位數(shù)計(jì)算20中位數(shù)的計(jì)算（2）分組數(shù)據(jù)的中位數(shù)計(jì)算下式中L為中位數(shù)所在組的下限值，fm為中位數(shù)所在組的組頻數(shù)，Sm-1為至中位數(shù)組時(shí)累計(jì)總頻數(shù)，h為組距。21中位數(shù)的計(jì)算（2）分組數(shù)據(jù)的中位數(shù)計(jì)算21中位數(shù)的計(jì)算（3）例2：假設(shè)有分組數(shù)據(jù)如下（銷售額單位為萬元）年銷售額組中值商店數(shù)目累計(jì)頻數(shù)80-90853390-10095710100-1101051323110-120115528120-130125230合計(jì)3022中位數(shù)的計(jì)算（3）例2：假設(shè)有分組數(shù)據(jù)如下（銷售額單位為萬元中位數(shù)的計(jì)算（4）依據(jù)公式例2的中位數(shù)為23中位數(shù)的計(jì)算（4）依據(jù)公式23眾數(shù)的計(jì)算未分組數(shù)據(jù)的眾數(shù)為出現(xiàn)次數(shù)最多的數(shù)。分組數(shù)據(jù)的眾數(shù)依據(jù)下式計(jì)算獲得。表達(dá)式中△1表示眾數(shù)所在組與前一組的頻數(shù)差，△2表示眾數(shù)所在組與后一組的頻數(shù)差。依據(jù)公式，例2分組數(shù)據(jù)的眾數(shù)為104.29萬元。24眾數(shù)的計(jì)算未分組數(shù)據(jù)的眾數(shù)為出現(xiàn)次數(shù)最多的數(shù)。24全距（極差）的計(jì)算全距指的是樣本數(shù)據(jù)中最大值與最小值之間的距離，因而也叫極差。例1中最小值為1，最大值為6，因而全距為6-1=5。25全距（極差）的計(jì)算全距指的是樣本數(shù)據(jù)中最大值與最小值之間的距四分位差的計(jì)算四分位差是一種按照位置來測定數(shù)據(jù)離散趨勢的計(jì)量方法，它只取決于位于樣本排序后中間50%位置內(nèi)數(shù)據(jù)的差異程度。即第一個(gè)四分位與第三個(gè)四分位數(shù)據(jù)之間的差異。例2的四分位差計(jì)算過程如下26四分位差的計(jì)算四分位差是一種按照位置來測定數(shù)據(jù)離散趨勢的計(jì)量標(biāo)準(zhǔn)差的計(jì)算（1）未分組數(shù)據(jù)的標(biāo)準(zhǔn)差計(jì)算27標(biāo)準(zhǔn)差的計(jì)算（1）未分組數(shù)據(jù)的標(biāo)準(zhǔn)差計(jì)算27標(biāo)準(zhǔn)差的計(jì)算（2）分組數(shù)據(jù)的標(biāo)準(zhǔn)差的計(jì)算28標(biāo)準(zhǔn)差的計(jì)算（2）分組數(shù)據(jù)的標(biāo)準(zhǔn)差的計(jì)算28常用圖形——柱形圖29常用圖形——柱形圖29直方圖德國英國法國意大利西班牙荷蘭瑞典瑞士比利時(shí)奧地利土耳其挪威丹麥中國芬蘭葡萄牙希臘俄羅斯200400600800100012001400

xxx年中國內(nèi)地與歐洲各國市場調(diào)查業(yè)的市場規(guī)模比較（年?duì)I業(yè)額：百萬美元）30直方圖德國30餅形圖31餅形圖31趨勢圖32.5215元14元13元12元11元10元9元8元以下32趨勢圖332散點(diǎn)圖森氏滿10.5%意4度沃力中美314.4%38.5%2120%40%首都知名度

鄭州市主要純水品牌的知名度、美譽(yù)度和市場占有率

33散點(diǎn)圖森氏33態(tài)度對(duì)比圖34態(tài)度對(duì)比圖34輪廓形象圖35輪廓形象圖35雷達(dá)圖36雷達(dá)圖36數(shù)據(jù)分布形態(tài)圖37數(shù)據(jù)分布形態(tài)圖37SPSS的描述性分析Frequencies：頻數(shù)分布表Descriptives：一般性描述Explore：探索性分析Crosstabs：交叉列表38SPSS的描述性分析Frequencies：頻數(shù)分布表38描述性分析頻數(shù)分布表一般性描述探索性分析交叉列表計(jì)算連續(xù)變量的相對(duì)比39描述性分析頻數(shù)分布表一般性描述探索性分析交叉列表計(jì)算連續(xù)變量頻數(shù)分布表(Frequencies)調(diào)用此過程可進(jìn)行頻數(shù)分布表的分析.頻數(shù)分布表是描述性統(tǒng)計(jì)中最常用的方法之一,此外還可對(duì)數(shù)據(jù)的分布趨勢進(jìn)行初步分析。40頻數(shù)分布表(Frequencies)調(diào)用此過程可進(jìn)行頻數(shù)分布待分析變量的列表是否顯示頻數(shù)表定義需要計(jì)算的統(tǒng)計(jì)量定義需要繪制的統(tǒng)計(jì)圖定義表格41待分析變量的列表是否顯示頻數(shù)表定義需要計(jì)算的統(tǒng)計(jì)量定義需要繪百分位數(shù)分布特征描述離散趨勢集中趨勢Frequencies：定義統(tǒng)計(jì)量42百分位數(shù)分布特征描述離散趨勢集中趨勢Frequencies：統(tǒng)計(jì)圖類型直方圖加上正態(tài)曲線以頻數(shù)繪制條圖或餅圖Frequencies：定義統(tǒng)計(jì)圖無圖形條圖餅圖直方圖以構(gòu)成比繪制條圖或餅圖43統(tǒng)計(jì)圖類型直方圖加上正態(tài)曲線以頻數(shù)繪制條圖或餅圖FrequeFrequencies：定義表格頻數(shù)表排列次序按數(shù)值升序按數(shù)值降序按頻數(shù)升序按頻數(shù)降序44Frequencies：定義表格頻數(shù)表排列次序按數(shù)值升序按數(shù)Frequencies：結(jié)果解釋45Frequencies：結(jié)果解釋45Frequencies：結(jié)果解釋46Frequencies：結(jié)果解釋46Frequencies：結(jié)果解釋47Frequencies：結(jié)果解釋47一般性描述(Descriptives)描述性分析

調(diào)用此過程可對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析，計(jì)算并列出一系列相應(yīng)的統(tǒng)計(jì)指標(biāo)，且可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)Z分值并存入數(shù)據(jù)庫，所謂Z分值是指某原始數(shù)值比其均值高或低多少個(gè)標(biāo)準(zhǔn)差單位，高的為正值，低的為負(fù)值，相等的為零。48一般性描述(Descriptives)描述性分析調(diào)用是否保存標(biāo)準(zhǔn)變換后的數(shù)據(jù)49是否保存標(biāo)準(zhǔn)49Descriptives：定義統(tǒng)計(jì)量50Descriptives：定義統(tǒng)計(jì)量50Descriptives：結(jié)果解釋51Descriptives：結(jié)果解釋51Descriptives：結(jié)果解釋此外，系統(tǒng)以zheight和zweight為變量名將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)z分值，存放在原數(shù)據(jù)庫中。新變量具有均值為0、標(biāo)準(zhǔn)差為1的特征，亦即變量的標(biāo)準(zhǔn)化過程。52Descriptives：結(jié)果解釋此外，系統(tǒng)以zheight探索性分析(Explore)描述性分析調(diào)用此過程可對(duì)變量進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析，故稱之為探索性統(tǒng)計(jì)。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上，增加有關(guān)數(shù)據(jù)其它特征的文字與圖形描述，顯得更加細(xì)致與全面，有助于用戶思考對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析的方案。53探索性分析(Explore)描述性分析調(diào)用此過程可對(duì)變量進(jìn)行兩者均有統(tǒng)計(jì)量圖分組變量列表待分析變量列表54兩者均有統(tǒng)計(jì)量圖分組變量列表待分析變量列表54Explore：定義統(tǒng)計(jì)量Descriptives：輸出均數(shù)、均數(shù)的95%可信區(qū)間、去掉5%極端值的均數(shù)、中位數(shù)、方差、標(biāo)準(zhǔn)差、最小值、最大值、全距、四分位數(shù)間距、偏度系數(shù)、峰度系數(shù)。M-estimators：輸出集中趨勢的最大似然比的穩(wěn)健估計(jì)。Outliers：輸出五個(gè)最大值與五個(gè)最小值。Percentiles：輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)。55Explore：定義統(tǒng)計(jì)量Descriptives：輸出均數(shù)箱圖繪制方式莖葉圖正態(tài)性檢驗(yàn)/正態(tài)分布圖Explore：定義統(tǒng)計(jì)圖直方圖56箱圖繪制方式莖葉圖正態(tài)性檢驗(yàn)/正態(tài)分布圖Explore：定義Excludecaselistwise:不分析有任一缺失值的記錄Excludecasepairwise:不分析計(jì)算某統(tǒng)計(jì)量時(shí)有缺失值的記錄Reportvalues:報(bào)告缺失值缺失值的處理方式Explore：缺失值的處理57Excludecaselistwise:不分析有任一缺失Explore：結(jié)果解釋

原始數(shù)據(jù)的基本情況：男性有效數(shù)據(jù)459，缺失1，合計(jì)460；女性有效數(shù)據(jù)538，缺失2，合計(jì)540。58Explore：結(jié)果解釋原始數(shù)據(jù)的基本情況：男性有效數(shù)據(jù)Explore：結(jié)果解釋59Explore：結(jié)果解釋59Explore：結(jié)果解釋描述性分析左面為箱圖，圖中方箱為四分位數(shù)，中心粗線為中位數(shù)，兩端線為最大值與最小值，之外的圓圈代表可疑的離群值。60Explore：結(jié)果解釋描述性分析左面為箱圖，圖中方箱為四分2、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)又叫顯著性檢驗(yàn)（testofsignificance）。顯著性檢驗(yàn)的方法很多，常用的有u檢驗(yàn)、t檢驗(yàn)、F檢驗(yàn)和

2檢驗(yàn)等。盡管這些檢驗(yàn)方法的用途及使用條件不同，但其檢驗(yàn)的基本原理是相同的。612、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)又叫顯著性檢驗(yàn)（testofsig假設(shè)檢驗(yàn)的步驟建立假設(shè)。對(duì)樣本所屬總體提出假設(shè)，包括無效假設(shè)H0和備擇假設(shè)HA；確定顯著水平α。常用的顯著水平α＝0.05和α＝0.01；從無效假設(shè)H0出發(fā)，根據(jù)樣本提供信息構(gòu)造適宜統(tǒng)計(jì)量，并計(jì)算統(tǒng)計(jì)量值或概率；由附表查出相應(yīng)的統(tǒng)計(jì)量臨界值，比較樣本統(tǒng)計(jì)量值與臨界值大小，根據(jù)小概率原理做出統(tǒng)計(jì)推斷（或由概率大小做出判斷）。62假設(shè)檢驗(yàn)的步驟建立假設(shè)。對(duì)樣本所屬總體提出假設(shè)，包括無效假設(shè)統(tǒng)計(jì)假設(shè)檢驗(yàn)的幾何意義統(tǒng)計(jì)假設(shè)檢驗(yàn)從本質(zhì)上來說，就是根據(jù)顯著水平а將統(tǒng)計(jì)量（數(shù)）的分布劃分為接受區(qū)和否定區(qū)兩部分。前者為接受原假設(shè)H0的區(qū)間，后者為否定H0，而接受HA的區(qū)間。當(dāng)試驗(yàn)結(jié)果落入接受區(qū)，就接受H0；反之，否定H0，而接受HA。否定區(qū)的概率為α，接受區(qū)的概率為1-α。63統(tǒng)計(jì)假設(shè)檢驗(yàn)的幾何意義統(tǒng)計(jì)假設(shè)檢驗(yàn)從本質(zhì)上來說，就是根據(jù)顯著

是否否定無效假設(shè)或，用實(shí)際計(jì)算出的統(tǒng)計(jì)量u或t的絕對(duì)值與顯著水平α對(duì)應(yīng)的臨界值ua或ta比較。若|u|≥ua或|t|≥ta，則在α水平上否定；若|u|<ua或|t|<ta，則不能在α水平上否定。區(qū)間和或稱為α水平上的否定域，而區(qū)間（）則稱為α水平上的接受域。64是否否定無效假設(shè)或圖1雙側(cè)檢驗(yàn)時(shí)H0的接受域和否定域65圖1雙側(cè)檢驗(yàn)時(shí)H0的接受域和否定域65統(tǒng)計(jì)假設(shè)檢驗(yàn)的兩類錯(cuò)誤

統(tǒng)計(jì)假設(shè)檢驗(yàn)的是根據(jù)“小概率事件實(shí)際不可能性原理”來否定或接受無效假設(shè)的，所以不論是接受還是否定無效假設(shè)，都沒有100%的把握。也就是說，在檢驗(yàn)無效假設(shè)時(shí)可能犯兩類錯(cuò)誤。第一類錯(cuò)誤：H0本身是成立，但通過檢驗(yàn)卻否定了它，犯了“棄真”錯(cuò)誤，也叫Ⅰ型錯(cuò)誤（typeⅠerror）、а錯(cuò)誤。Ⅰ型錯(cuò)誤，就是把非真實(shí)差異錯(cuò)判為真實(shí)差異，即為真，卻接受了。66統(tǒng)計(jì)假設(shè)檢驗(yàn)的兩類錯(cuò)誤統(tǒng)計(jì)假設(shè)檢驗(yàn)的是根據(jù)“小第二類錯(cuò)誤：H0本身不成立，但通過檢驗(yàn)卻接受了它，犯了“納偽”錯(cuò)誤，也叫Ⅱ型錯(cuò)誤（typeⅡerror）、β錯(cuò)誤。Ⅱ型錯(cuò)誤，就是把真實(shí)差異錯(cuò)判為非真實(shí)差異，即為真，卻未能否定。統(tǒng)計(jì)檢驗(yàn)是基于“小概率事件實(shí)際不可能性原理”來否定H0，但在一次試驗(yàn)中小概率事件并不是絕對(duì)不會(huì)發(fā)生的。如果我們抽得一個(gè)樣本，它雖然來自與H0對(duì)應(yīng)的抽樣總體，但計(jì)算所得的統(tǒng)計(jì)量卻落入了否定域中，因而否定了H0，于是犯了Ⅰ型錯(cuò)誤。犯Ⅰ這類錯(cuò)誤的概率不會(huì)超過a。67第二類錯(cuò)誤：H0本身不成立，但通過檢驗(yàn)卻接受了它，圖2兩類錯(cuò)誤示意圖68圖2兩類錯(cuò)誤示意圖68假設(shè)檢驗(yàn)的類型參數(shù)假設(shè)檢驗(yàn)U檢驗(yàn)t檢驗(yàn)非參數(shù)檢驗(yàn)69假設(shè)檢驗(yàn)的類型參數(shù)假設(shè)檢驗(yàn)69參數(shù)統(tǒng)計(jì)（parametricstatistics）：t、Z、和F檢驗(yàn)均屬參數(shù)檢驗(yàn)。其共同特點(diǎn)是，假定隨機(jī)樣本來自某種已知分布（如正態(tài)分布）的總體，并對(duì)總體分布的參數(shù)（如總體均數(shù)）進(jìn)行估計(jì)或檢驗(yàn)。非參數(shù)統(tǒng)計(jì)（nonparametricstatistics）：對(duì)總體分布不作嚴(yán)格規(guī)定，不依賴于總體分布類型，也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷。70參數(shù)統(tǒng)計(jì)（parametricstatistics）：t參數(shù)檢驗(yàn)——U檢驗(yàn)當(dāng)樣本容量大于30時(shí)，可以采用U檢驗(yàn)。均值檢驗(yàn)百分比檢驗(yàn)雙樣本平均數(shù)差異的檢驗(yàn)雙樣本百分比差異的檢驗(yàn)71參數(shù)檢驗(yàn)——U檢驗(yàn)當(dāng)樣本容量大于30時(shí)，可以采用U檢驗(yàn)。71均值檢驗(yàn)（U）假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)U的計(jì)算結(jié)果，比較U的絕對(duì)值與的大小。若有則接受H0，否則拒絕H0。72均值檢驗(yàn)（U）假設(shè)有72百分比檢驗(yàn)（U）假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)U的計(jì)算結(jié)果，比較U的絕對(duì)值與的大小。若有則接受H0，否則拒絕H0。73百分比檢驗(yàn)（U）假設(shè)有73雙樣本平均數(shù)差異的檢驗(yàn)（U）假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)U的計(jì)算結(jié)果，比較U的絕對(duì)值與的大小。若有則接受H0，否則拒絕H0。74雙樣本平均數(shù)差異的檢驗(yàn)（U）假設(shè)有74雙樣本百分比差異的檢驗(yàn)（U）假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)U的計(jì)算結(jié)果，比較U的絕對(duì)值與的大小。若有則接受H0，否則拒絕H0。75雙樣本百分比差異的檢驗(yàn)（U）假設(shè)有75練習(xí)例1：某一釀造廠新引進(jìn)一種釀醋曲種，以原曲種為對(duì)照進(jìn)行試驗(yàn)。已知原曲種釀出的食醋醋酸含量平均為μ0＝9.75％，其標(biāo)準(zhǔn)差為σ＝5.30％?，F(xiàn)采用新曲種釀醋，得到30個(gè)醋樣，測得其醋酸含量平均為＝11.99％。試問，能否由這30個(gè)醋樣的平均數(shù)判斷新曲種好于原曲種？76練習(xí)例1：某一釀造廠新引進(jìn)一種釀醋曲種，以原曲種為對(duì)前例分析：所以在a＝0.05水平上的接受域?yàn)椋?.0785<<0.1165）否定域?yàn)椤?.0785，≥0.1165

試驗(yàn)結(jié)果＝0.1199，落入否定區(qū)間，所以否定，接受結(jié)論：采用新曲種釀造食醋，其醋酸含量有顯著改變。77對(duì)前例分析：所以在a＝0.05水平上的接受域?yàn)椋?.0785例題：在食品廠的甲乙兩條生產(chǎn)線上各測定了30個(gè)日產(chǎn)量如表所示，試檢驗(yàn)兩條生產(chǎn)線的平均日產(chǎn)量有無顯著差異。甲生產(chǎn)線（x1）乙生產(chǎn)線（x2）747156547178655354605669625762697363584951536662617262707874585866715356776554586362607065585669596278536770687052555557表1甲乙兩條生產(chǎn)線日產(chǎn)量記錄78例題：在食品廠的甲乙兩條生產(chǎn)線上各測定了30個(gè)日產(chǎn)量如表所示（1）建立假設(shè)。即兩條生產(chǎn)線的平均日產(chǎn)量無差異。（2）確定顯著水平α＝0.01（3）計(jì)算故：79（1）建立假設(shè)。（2）確定顯著水平α＝0.01（3）計(jì)算（4）統(tǒng)計(jì)推斷。由α＝0.01查附表2，得u0.01＝2.58實(shí)際|u|＝3.28>u0.01＝2.58，故P<0.01，應(yīng)否定H0，接受HA。說明兩個(gè)生產(chǎn)線的日平均產(chǎn)量有極顯著差異，甲生產(chǎn)線日平均產(chǎn)量高于乙生產(chǎn)線日平均產(chǎn)量。80（4）統(tǒng)計(jì)推斷。80參數(shù)檢驗(yàn)——t檢驗(yàn)當(dāng)樣本容量小于30時(shí)，不可以使用U檢驗(yàn)，而需要使用t檢驗(yàn)。均值檢驗(yàn)均值差異的檢驗(yàn)百分比差異的檢驗(yàn)81參數(shù)檢驗(yàn)——t檢驗(yàn)當(dāng)樣本容量小于30時(shí)，不可以使用U檢驗(yàn)，而均值檢驗(yàn)（t）假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)t的計(jì)算結(jié)果，比較t的絕對(duì)值與的大小。若有則接受H0，否則拒絕H0。82均值檢驗(yàn)（t）假設(shè)有82均值差異的檢驗(yàn)（t）假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)t的計(jì)算結(jié)果，比較t的絕對(duì)值與的大小。若有

則接受H0，否則拒絕H0。83均值差異的檢驗(yàn)（t）假設(shè)有83百分比差異的檢驗(yàn)（t）假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)t的計(jì)算結(jié)果，比較t的絕對(duì)值與的大小。若有

則接受H0，否則拒絕H0。84百分比差異的檢驗(yàn)（t）假設(shè)有84例1用山楂加工果凍，傳統(tǒng)工藝平均每100g加工500g果凍，采用新工藝后，測定了16次，得知每100g山楂可出果凍平均為＝520g，標(biāo)準(zhǔn)差S＝12g。問新工藝與老工藝在每100g加工果凍的量上有無顯著差異？85例1用山楂加工果凍，傳統(tǒng)工藝平均每100g加工500本例總體方差未知，又是小樣本，采用雙側(cè)t檢驗(yàn)。（1）提出無效假設(shè)與備擇假設(shè)，即新老工藝沒有差異。，即新老工藝有差異。（2）確定顯著水平α＝0.01（3）計(jì)算t值86本例總體方差未知，又是小樣本，采用雙側(cè)t檢驗(yàn)。86（4）查臨界t值，作出統(tǒng)計(jì)推斷由=15，查t值，得t0.01（15）=2.947，因?yàn)閨t|>t0.01，P<0.01，故應(yīng)否定H0，接受HA，表明新老工藝的每100g加工出的果凍量差異極顯著。（在統(tǒng)計(jì)量t上標(biāo)記**）87（4）查臨界t值，作出統(tǒng)計(jì)推斷87例題2：海關(guān)抽檢出口罐頭質(zhì)量，發(fā)現(xiàn)有脹聽現(xiàn)象，隨機(jī)抽取了6個(gè)樣品，同時(shí)隨機(jī)抽取6個(gè)正常罐頭樣品測定其SO2含量，測定結(jié)果見表4-3。試分析兩種罐頭的SO2含量有無差異。正常罐頭（x1）100.094.298.599.296.4102.5異常罐頭（x2）130.2131.3130.5135.2135.2133.5表2正常罐頭與異常罐頭SO2含量測定結(jié)果88例題2：海關(guān)抽檢出口罐頭質(zhì)量，發(fā)現(xiàn)有脹聽現(xiàn)象，隨機(jī)抽取了6個(gè)（1）提出無效假設(shè)與備擇假設(shè)兩種罐頭SO2含量沒有差異；（2）確定顯著水平α＝0.01（兩尾概率）（3）計(jì)算89（1）提出無效假設(shè)與備擇假設(shè)兩種罐頭SO2含量沒有差（4）統(tǒng)計(jì)推斷由df＝10，α＝0.01查附表3得t0.01(10)＝3.169。實(shí)得|t|＝22.735>t0.01(10)＝3.169，P<0.01，故應(yīng)否定無效假設(shè)H0，即兩種罐頭的SO2含量有高度顯著差異，該批罐頭質(zhì)量不合格。90（4）統(tǒng)計(jì)推斷90例題3：現(xiàn)有兩種茶多糖提取工藝，分別從兩種工藝中各取1個(gè)隨機(jī)樣本來測定其粗提物中的茶多糖含量，結(jié)果見表4-4。問兩種工藝的粗提物中茶多糖含量有無差異？醇沉淀法（x1）27.5227.7828.0328.8828.7527.94超濾法（x2)29.3228.1528.0028.5829.00表4-4兩種工藝粗提物中茶多糖含量測定結(jié)果91例題3：現(xiàn)有兩種茶多糖提取工藝，分別從兩種工藝中各取1個(gè)隨機(jī)（1）建立假設(shè)，提出無效假設(shè)與備擇假設(shè)，兩種工藝的粗提物中茶多糖含量無差異；（2）確定顯著水平α＝0.05（兩尾概率）

（3）計(jì)算92（1）建立假設(shè)，提出無效假設(shè)與備擇假設(shè)，兩種工藝的粗因兩個(gè)樣本的容量不等，所以93因兩個(gè)樣本的容量不等，所以93（4）查臨界t值，作出統(tǒng)計(jì)推斷當(dāng)df=9時(shí)，查臨界值得：t0.05（9）=2.262，|t|＝1.381<t0.05（9），所以P>0.05，接受，表明兩種工藝的粗提物中茶多糖含量無顯著差異。94（4）查臨界t值，作出統(tǒng)計(jì)推斷94非參數(shù)檢驗(yàn)（X2）在市場調(diào)查中常獲得一些量表數(shù)據(jù)，對(duì)量表數(shù)據(jù)求取平均數(shù)與方差都是毫無意義的。對(duì)量表數(shù)據(jù)的處理更適宜于采用非參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)中常用的方法是X2檢驗(yàn)。X2檢驗(yàn)的統(tǒng)計(jì)量是上述統(tǒng)計(jì)量中，表示第類別在樣本中實(shí)際出現(xiàn)的次數(shù)，表示期望出現(xiàn)的次數(shù)，為類別數(shù)。95非參數(shù)檢驗(yàn)（X2）在市場調(diào)查中常獲得一些量表數(shù)據(jù)，對(duì)量表數(shù)據(jù)一般選用非參數(shù)統(tǒng)計(jì)方法的資料：①總體分布不易確定；②分布呈非正態(tài)而又無適當(dāng)?shù)臄?shù)據(jù)轉(zhuǎn)換方法；③等級(jí)資料；④一端或兩端無確定數(shù)值等。因此，非參數(shù)檢驗(yàn)又稱任意分布檢驗(yàn)（distribution-freetest）。在實(shí)際應(yīng)用中，對(duì)符合參數(shù)檢驗(yàn)的資料，或經(jīng)變量變換后符合參數(shù)檢驗(yàn)的資料應(yīng)首選參數(shù)檢驗(yàn)；對(duì)不能滿足參數(shù)檢驗(yàn)條件的資料，應(yīng)選用非參數(shù)檢驗(yàn)。

96一般選用非參數(shù)統(tǒng)計(jì)方法的資料：①總體分布不易確定；②分布呈非兩個(gè)配對(duì)樣本的非參數(shù)檢驗(yàn)兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)多個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)多個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)97兩個(gè)配對(duì)樣本的非參數(shù)檢驗(yàn)97例1以下為治療前后，病人某項(xiàng)指標(biāo)的測量值，數(shù)據(jù)見npa.sav配對(duì)樣本的非參數(shù)檢驗(yàn)治療前（x）：24.0016.7021.6023.7037.5031.4014.9037.3017.9015.5029.0019.90治療后（Y）：23.1020.4017.7020.7042.136.1021.8040.3026.0015.5035.4025.5098例1以下為治療前后，病人某項(xiàng)指標(biāo)的測量值，數(shù)據(jù)見npa.s9999100100

Wilcoxon符號(hào)檢驗(yàn)適用于連續(xù)變量

sign符號(hào)檢驗(yàn)適用于對(duì)無法用數(shù)字計(jì)量的情況進(jìn)行比較，如兩分類，對(duì)于連續(xù)資料最好不要使用

McNemar實(shí)際上就是常用的配對(duì)χ2檢驗(yàn)，只適用于二分類資料

MarginalHomogeneity是McNemar法向多分類情形下的擴(kuò)展，適用于資料為有序分類情況配對(duì)樣本的非參數(shù)檢驗(yàn)101Wilcoxon符號(hào)檢驗(yàn)配對(duì)樣本的非參數(shù)檢驗(yàn)101Exact：用于計(jì)算確切概率只給出近似概率蒙特卡羅方法給出精確概率值，并可設(shè)定耗時(shí)限制102Exact：用于計(jì)算確切概率只給出近似概率蒙特卡羅方法給出共12對(duì)指標(biāo)，指標(biāo)值治療后小于治療前的有3對(duì)，其平均秩次為2.83，總秩和為8.50；治療后大于治療前的有8對(duì)，其平均秩次為7.19，總秩和為57.50；治療后等于治療前的有1對(duì)。（1）秩次表103共12對(duì)指標(biāo)，指標(biāo)值治療后小于治療前的有3對(duì)，其平均秩次為2

Wilcoxon符號(hào)秩檢驗(yàn)的統(tǒng)計(jì)量Z值＝-2.179，近似概率（Asymp.sig.）P＝0.029，按α＝0.05的水準(zhǔn)可以認(rèn)為治療前后該指標(biāo)值的差別具有統(tǒng)計(jì)學(xué)意義。（2）檢驗(yàn)統(tǒng)計(jì)量104Wilcoxon符號(hào)秩檢驗(yàn)的統(tǒng)計(jì)量Z值＝-2.179，近似例2在缺氧條件下，觀察4只貓與12只兔的生存時(shí)間（分鐘），結(jié)果如下。試判斷貓、兔在缺氧條件下生存時(shí)間的差異是否具有統(tǒng)計(jì)學(xué)意義。數(shù)據(jù)見npb.sav：生存時(shí)間（貓）：2534444646生存時(shí)間（兔）：1515161719212123252728283035兩獨(dú)立樣本的非參數(shù)檢驗(yàn)105例2在缺氧條件下，觀察4只貓與12只兔的生存時(shí)間（分鐘），106106107107108108默認(rèn)的Mann-WhitneyU檢驗(yàn)最常用109默認(rèn)的Mann-WhitneyU檢驗(yàn)最常用109生存時(shí)間樣本共19例，其中貓的生存時(shí)間5例，其平均秩次為15.70，總秩和為78.50；兔的生存時(shí)間14例，其平均秩次為7.96，總秩和為111.50。（1）秩次表110生存時(shí)間樣本共19例，其中貓的生存時(shí)間5例，其平均秩次為1給出Mann-WhitneyU、WilcoxonW統(tǒng)計(jì)量和Z值，近似值概率（Asymp.Sig）和精確概率值（Exact.sig）均

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第9章數(shù)據(jù)分析一課件

文檔簡介

溫馨提示

最新文檔

評(píng)論

第9章數(shù)據(jù)分析一課件

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔