




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第九講數(shù)據(jù)分析(一)余可發(fā)博士江西財(cái)經(jīng)大學(xué)工商管理學(xué)院1第九講數(shù)據(jù)分析(一)余可發(fā)博士1一、數(shù)據(jù)處理與分析過程1、編輯2、編碼3、數(shù)據(jù)輸入4、數(shù)據(jù)分析(描述性分析、單變量分析、雙變量分析、多變量分析)5、解釋2一、數(shù)據(jù)處理與分析過程1、編輯2二、編輯編輯就是檢查和調(diào)整數(shù)據(jù)遺漏、易讀性和一致性的過程。編輯人員的任務(wù)就是要檢查調(diào)查問卷或者其他數(shù)據(jù)收集形式中出現(xiàn)的錯(cuò)誤和遺漏。當(dāng)發(fā)現(xiàn)問題時(shí),編輯要及時(shí)調(diào)整數(shù)據(jù)讓他們變得更加完整、一致、可讀。3二、編輯編輯就是檢查和調(diào)整數(shù)據(jù)遺漏、易讀性和一致性的過程。3編輯技巧:1、退回重新填寫2、按缺失數(shù)據(jù)處理3、丟棄(1)不符合要求的問卷和少。(2)樣本單位數(shù)很大。(3)不符合要求的問卷與符合要求的問卷之間在調(diào)查對(duì)象上的特征上沒有明顯的不同。(4)不符合要求的回答在該問卷中占很大的比例。(5)對(duì)關(guān)鍵變量的回答是缺失的。4編輯技巧:4編輯的類型:現(xiàn)場編輯后期編輯5編輯的類型:5編輯的任務(wù):1、確定是否需要補(bǔ)充調(diào)查2、編輯的一致性3、編輯的完整性6編輯的任務(wù):6三、編碼編碼就是將數(shù)字標(biāo)度或其他符號(hào)分配給不同答案的過程。相關(guān)概念:域:一種類型的數(shù)據(jù)。記錄:相關(guān)域的集合。文件:相關(guān)記錄的集合。7三、編碼編碼就是將數(shù)字標(biāo)度或其他符號(hào)分配給不同答案的過程。788編碼工作一般包括以下幾個(gè)方面:(1)確定變量(2)確定變量值(3)無結(jié)構(gòu)問題的編碼(4)編碼說明書及數(shù)據(jù)輸出格式說明書。9編碼工作一般包括以下幾個(gè)方面:9問題025:您認(rèn)為打工的外地人對(duì)北京市的社會(huì)秩序是否有影響?(單選)1□有很大影響2□有較大影響3□沒有影響4□不好說4編碼答案10問題025:您認(rèn)為打工的外地人對(duì)北京市的社會(huì)秩序是否有影響?2)制作編碼表112)制作編碼表11直接過錄0-1編碼變量名:一個(gè)數(shù)據(jù)文件中,一個(gè)變量只能有一個(gè)唯一名稱。碼位:某一變量在數(shù)據(jù)文件中占據(jù)的欄位碼數(shù):某一變量由幾位數(shù)組成。該變量是數(shù)值型(Numeric)——如定距、定比,還是字串型(String),如定類、定序。前者在統(tǒng)計(jì)中可以做高級(jí)運(yùn)算,后者則不可以。不適于被訪人回答的問題的編碼。一般采用7,97,997等。被訪人回答不知道時(shí)的編碼。一般采用8,98,998等。被訪人拒絕回答某變量時(shí)的編碼。一般采用9,99,999等。問卷中出現(xiàn)漏答時(shí)的處理編碼。一般采用9,99,999等。12直接過錄變量名:一個(gè)數(shù)據(jù)文件中,碼位:某一變量在碼數(shù):該變四、數(shù)據(jù)錄入外部式錄入內(nèi)部式錄入采用DOS、WPS、CCED等軟件,按ASCII碼方式錄入成文本文件(*.dat;*.txt)。這種錄入方式的特點(diǎn)是,數(shù)據(jù)之間沒有間隔,錄完一個(gè)數(shù)碼后自動(dòng)后移,錄入速度較快。缺點(diǎn)是容易錯(cuò)位。采用SPSS數(shù)據(jù)編輯器(SPSSDataEditor)錄入。其優(yōu)點(diǎn)是不容易錯(cuò)位,缺點(diǎn)是不能自動(dòng)后移,錄入速度慢,數(shù)據(jù)錯(cuò)誤不容易修改。13四、數(shù)據(jù)錄入外部式錄入內(nèi)部式錄入采用DOS、WPS、CCED五、數(shù)據(jù)分析描述分析法假設(shè)檢驗(yàn)法方差分析法聚類分析法判別分析法回歸分析法14五、數(shù)據(jù)分析描述分析法141、描述性統(tǒng)計(jì)分析頻數(shù)、頻率分析數(shù)據(jù)集中趨勢分析算術(shù)平均數(shù)中位數(shù)眾數(shù)數(shù)據(jù)分散趨勢分析全距(極差)四分位差標(biāo)準(zhǔn)差數(shù)據(jù)總體形態(tài)分布偏度(Skewness)峰度(Kurtosis)
151、描述性統(tǒng)計(jì)分析頻數(shù)、頻率分析15頻數(shù)、頻率分析(1)例1:假設(shè)有樣本數(shù)據(jù)ABCDEFGHIJ11221465332261122325433441331433541345642463535211211466263455132276366236511841533646349513252226210325234144516頻數(shù)、頻率分析(1)例1:假設(shè)有樣本數(shù)據(jù)ABCDEFGHIJ17171818算術(shù)平均數(shù)未分組數(shù)據(jù)的平均數(shù)計(jì)算分組數(shù)據(jù)的平均數(shù)計(jì)算上例的計(jì)算結(jié)果19算術(shù)平均數(shù)未分組數(shù)據(jù)的平均數(shù)計(jì)算19中位數(shù)的計(jì)算(1)未分組數(shù)據(jù)的中位數(shù)計(jì)算對(duì)所有數(shù)據(jù)進(jìn)行排序,當(dāng)數(shù)據(jù)量為奇數(shù)時(shí),取中間數(shù)為中位數(shù),當(dāng)數(shù)據(jù)量為偶數(shù)時(shí),取最中間兩位數(shù)的平均數(shù)為中位數(shù)。上例中數(shù)據(jù)量為100,是偶數(shù),所以應(yīng)取排序后第50位數(shù)和第51位數(shù)的平均值作為中位數(shù)。第50位數(shù)是3,第51位數(shù)也是3,所以中位數(shù)為3。20中位數(shù)的計(jì)算(1)未分組數(shù)據(jù)的中位數(shù)計(jì)算20中位數(shù)的計(jì)算(2)分組數(shù)據(jù)的中位數(shù)計(jì)算下式中L為中位數(shù)所在組的下限值,fm為中位數(shù)所在組的組頻數(shù),Sm-1為至中位數(shù)組時(shí)累計(jì)總頻數(shù),h為組距。21中位數(shù)的計(jì)算(2)分組數(shù)據(jù)的中位數(shù)計(jì)算21中位數(shù)的計(jì)算(3)例2:假設(shè)有分組數(shù)據(jù)如下(銷售額單位為萬元)年銷售額組中值商店數(shù)目累計(jì)頻數(shù)80-90853390-10095710100-1101051323110-120115528120-130125230合計(jì)3022中位數(shù)的計(jì)算(3)例2:假設(shè)有分組數(shù)據(jù)如下(銷售額單位為萬元中位數(shù)的計(jì)算(4)依據(jù)公式例2的中位數(shù)為23中位數(shù)的計(jì)算(4)依據(jù)公式23眾數(shù)的計(jì)算未分組數(shù)據(jù)的眾數(shù)為出現(xiàn)次數(shù)最多的數(shù)。分組數(shù)據(jù)的眾數(shù)依據(jù)下式計(jì)算獲得。表達(dá)式中△1表示眾數(shù)所在組與前一組的頻數(shù)差,△2表示眾數(shù)所在組與后一組的頻數(shù)差。依據(jù)公式,例2分組數(shù)據(jù)的眾數(shù)為104.29萬元。24眾數(shù)的計(jì)算未分組數(shù)據(jù)的眾數(shù)為出現(xiàn)次數(shù)最多的數(shù)。24全距(極差)的計(jì)算全距指的是樣本數(shù)據(jù)中最大值與最小值之間的距離,因而也叫極差。例1中最小值為1,最大值為6,因而全距為6-1=5。25全距(極差)的計(jì)算全距指的是樣本數(shù)據(jù)中最大值與最小值之間的距四分位差的計(jì)算四分位差是一種按照位置來測定數(shù)據(jù)離散趨勢的計(jì)量方法,它只取決于位于樣本排序后中間50%位置內(nèi)數(shù)據(jù)的差異程度。即第一個(gè)四分位與第三個(gè)四分位數(shù)據(jù)之間的差異。例2的四分位差計(jì)算過程如下26四分位差的計(jì)算四分位差是一種按照位置來測定數(shù)據(jù)離散趨勢的計(jì)量標(biāo)準(zhǔn)差的計(jì)算(1)未分組數(shù)據(jù)的標(biāo)準(zhǔn)差計(jì)算27標(biāo)準(zhǔn)差的計(jì)算(1)未分組數(shù)據(jù)的標(biāo)準(zhǔn)差計(jì)算27標(biāo)準(zhǔn)差的計(jì)算(2)分組數(shù)據(jù)的標(biāo)準(zhǔn)差的計(jì)算28標(biāo)準(zhǔn)差的計(jì)算(2)分組數(shù)據(jù)的標(biāo)準(zhǔn)差的計(jì)算28常用圖形——柱形圖29常用圖形——柱形圖29直方圖德國英國法國意大利西班牙荷蘭瑞典瑞士比利時(shí)奧地利土耳其挪威丹麥中國芬蘭葡萄牙希臘俄羅斯200400600800100012001400
xxx年中國內(nèi)地與歐洲各國市場調(diào)查業(yè)的市場規(guī)模比較(年?duì)I業(yè)額:百萬美元)30直方圖德國30餅形圖31餅形圖31趨勢圖32.5215元14元13元12元11元10元9元8元以下32趨勢圖332散點(diǎn)圖森氏滿10.5%意4度沃力中美314.4%38.5%2120%40%首都知名度
鄭州市主要純水品牌的知名度、美譽(yù)度和市場占有率
33散點(diǎn)圖森氏33態(tài)度對(duì)比圖34態(tài)度對(duì)比圖34輪廓形象圖35輪廓形象圖35雷達(dá)圖36雷達(dá)圖36數(shù)據(jù)分布形態(tài)圖37數(shù)據(jù)分布形態(tài)圖37SPSS的描述性分析Frequencies:頻數(shù)分布表Descriptives:一般性描述Explore:探索性分析Crosstabs:交叉列表38SPSS的描述性分析Frequencies:頻數(shù)分布表38描述性分析頻數(shù)分布表一般性描述探索性分析交叉列表計(jì)算連續(xù)變量的相對(duì)比39描述性分析頻數(shù)分布表一般性描述探索性分析交叉列表計(jì)算連續(xù)變量頻數(shù)分布表(Frequencies)調(diào)用此過程可進(jìn)行頻數(shù)分布表的分析.頻數(shù)分布表是描述性統(tǒng)計(jì)中最常用的方法之一,此外還可對(duì)數(shù)據(jù)的分布趨勢進(jìn)行初步分析。40頻數(shù)分布表(Frequencies)調(diào)用此過程可進(jìn)行頻數(shù)分布待分析變量的列表是否顯示頻數(shù)表定義需要計(jì)算的統(tǒng)計(jì)量定義需要繪制的統(tǒng)計(jì)圖定義表格41待分析變量的列表是否顯示頻數(shù)表定義需要計(jì)算的統(tǒng)計(jì)量定義需要繪百分位數(shù)分布特征描述離散趨勢集中趨勢Frequencies:定義統(tǒng)計(jì)量42百分位數(shù)分布特征描述離散趨勢集中趨勢Frequencies:統(tǒng)計(jì)圖類型直方圖加上正態(tài)曲線以頻數(shù)繪制條圖或餅圖Frequencies:定義統(tǒng)計(jì)圖無圖形條圖餅圖直方圖以構(gòu)成比繪制條圖或餅圖43統(tǒng)計(jì)圖類型直方圖加上正態(tài)曲線以頻數(shù)繪制條圖或餅圖FrequeFrequencies:定義表格頻數(shù)表排列次序按數(shù)值升序按數(shù)值降序按頻數(shù)升序按頻數(shù)降序44Frequencies:定義表格頻數(shù)表排列次序按數(shù)值升序按數(shù)Frequencies:結(jié)果解釋45Frequencies:結(jié)果解釋45Frequencies:結(jié)果解釋46Frequencies:結(jié)果解釋46Frequencies:結(jié)果解釋47Frequencies:結(jié)果解釋47一般性描述(Descriptives)描述性分析
調(diào)用此過程可對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算并列出一系列相應(yīng)的統(tǒng)計(jì)指標(biāo),且可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)Z分值并存入數(shù)據(jù)庫,所謂Z分值是指某原始數(shù)值比其均值高或低多少個(gè)標(biāo)準(zhǔn)差單位,高的為正值,低的為負(fù)值,相等的為零。48一般性描述(Descriptives)描述性分析調(diào)用是否保存標(biāo)準(zhǔn)變換后的數(shù)據(jù)49是否保存標(biāo)準(zhǔn)49Descriptives:定義統(tǒng)計(jì)量50Descriptives:定義統(tǒng)計(jì)量50Descriptives:結(jié)果解釋51Descriptives:結(jié)果解釋51Descriptives:結(jié)果解釋此外,系統(tǒng)以zheight和zweight為變量名將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)z分值,存放在原數(shù)據(jù)庫中。新變量具有均值為0、標(biāo)準(zhǔn)差為1的特征,亦即變量的標(biāo)準(zhǔn)化過程。52Descriptives:結(jié)果解釋此外,系統(tǒng)以zheight探索性分析(Explore)描述性分析調(diào)用此過程可對(duì)變量進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析,故稱之為探索性統(tǒng)計(jì)。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其它特征的文字與圖形描述,顯得更加細(xì)致與全面,有助于用戶思考對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析的方案。53探索性分析(Explore)描述性分析調(diào)用此過程可對(duì)變量進(jìn)行兩者均有統(tǒng)計(jì)量圖分組變量列表待分析變量列表54兩者均有統(tǒng)計(jì)量圖分組變量列表待分析變量列表54Explore:定義統(tǒng)計(jì)量Descriptives:輸出均數(shù)、均數(shù)的95%可信區(qū)間、去掉5%極端值的均數(shù)、中位數(shù)、方差、標(biāo)準(zhǔn)差、最小值、最大值、全距、四分位數(shù)間距、偏度系數(shù)、峰度系數(shù)。M-estimators:輸出集中趨勢的最大似然比的穩(wěn)健估計(jì)。Outliers:輸出五個(gè)最大值與五個(gè)最小值。Percentiles:輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)。55Explore:定義統(tǒng)計(jì)量Descriptives:輸出均數(shù)箱圖繪制方式莖葉圖正態(tài)性檢驗(yàn)/正態(tài)分布圖Explore:定義統(tǒng)計(jì)圖直方圖56箱圖繪制方式莖葉圖正態(tài)性檢驗(yàn)/正態(tài)分布圖Explore:定義Excludecaselistwise:不分析有任一缺失值的記錄Excludecasepairwise:不分析計(jì)算某統(tǒng)計(jì)量時(shí)有缺失值的記錄Reportvalues:報(bào)告缺失值缺失值的處理方式Explore:缺失值的處理57Excludecaselistwise:不分析有任一缺失Explore:結(jié)果解釋
原始數(shù)據(jù)的基本情況:男性有效數(shù)據(jù)459,缺失1,合計(jì)460;女性有效數(shù)據(jù)538,缺失2,合計(jì)540。58Explore:結(jié)果解釋原始數(shù)據(jù)的基本情況:男性有效數(shù)據(jù)Explore:結(jié)果解釋59Explore:結(jié)果解釋59Explore:結(jié)果解釋描述性分析左面為箱圖,圖中方箱為四分位數(shù),中心粗線為中位數(shù),兩端線為最大值與最小值,之外的圓圈代表可疑的離群值。60Explore:結(jié)果解釋描述性分析左面為箱圖,圖中方箱為四分2、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)又叫顯著性檢驗(yàn)(testofsignificance)。顯著性檢驗(yàn)的方法很多,常用的有u檢驗(yàn)、t檢驗(yàn)、F檢驗(yàn)和
2檢驗(yàn)等。盡管這些檢驗(yàn)方法的用途及使用條件不同,但其檢驗(yàn)的基本原理是相同的。612、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)又叫顯著性檢驗(yàn)(testofsig假設(shè)檢驗(yàn)的步驟建立假設(shè)。對(duì)樣本所屬總體提出假設(shè),包括無效假設(shè)H0和備擇假設(shè)HA;確定顯著水平α。常用的顯著水平α=0.05和α=0.01;從無效假設(shè)H0出發(fā),根據(jù)樣本提供信息構(gòu)造適宜統(tǒng)計(jì)量,并計(jì)算統(tǒng)計(jì)量值或概率;由附表查出相應(yīng)的統(tǒng)計(jì)量臨界值,比較樣本統(tǒng)計(jì)量值與臨界值大小,根據(jù)小概率原理做出統(tǒng)計(jì)推斷(或由概率大小做出判斷)。62假設(shè)檢驗(yàn)的步驟建立假設(shè)。對(duì)樣本所屬總體提出假設(shè),包括無效假設(shè)統(tǒng)計(jì)假設(shè)檢驗(yàn)的幾何意義統(tǒng)計(jì)假設(shè)檢驗(yàn)從本質(zhì)上來說,就是根據(jù)顯著水平а將統(tǒng)計(jì)量(數(shù))的分布劃分為接受區(qū)和否定區(qū)兩部分。前者為接受原假設(shè)H0的區(qū)間,后者為否定H0,而接受HA的區(qū)間。當(dāng)試驗(yàn)結(jié)果落入接受區(qū),就接受H0;反之,否定H0,而接受HA。否定區(qū)的概率為α,接受區(qū)的概率為1-α。63統(tǒng)計(jì)假設(shè)檢驗(yàn)的幾何意義統(tǒng)計(jì)假設(shè)檢驗(yàn)從本質(zhì)上來說,就是根據(jù)顯著
是否否定無效假設(shè)或,用實(shí)際計(jì)算出的統(tǒng)計(jì)量u或t的絕對(duì)值與顯著水平α對(duì)應(yīng)的臨界值ua或ta比較。若|u|≥ua或|t|≥ta,則在α水平上否定;若|u|<ua或|t|<ta,則不能在α水平上否定。區(qū)間和或稱為α水平上的否定域,而區(qū)間()則稱為α水平上的接受域。64是否否定無效假設(shè)或圖1雙側(cè)檢驗(yàn)時(shí)H0的接受域和否定域65圖1雙側(cè)檢驗(yàn)時(shí)H0的接受域和否定域65統(tǒng)計(jì)假設(shè)檢驗(yàn)的兩類錯(cuò)誤
統(tǒng)計(jì)假設(shè)檢驗(yàn)的是根據(jù)“小概率事件實(shí)際不可能性原理”來否定或接受無效假設(shè)的,所以不論是接受還是否定無效假設(shè),都沒有100%的把握。也就是說,在檢驗(yàn)無效假設(shè)時(shí)可能犯兩類錯(cuò)誤。第一類錯(cuò)誤:H0本身是成立,但通過檢驗(yàn)卻否定了它,犯了“棄真”錯(cuò)誤,也叫Ⅰ型錯(cuò)誤(typeⅠerror)、а錯(cuò)誤。Ⅰ型錯(cuò)誤,就是把非真實(shí)差異錯(cuò)判為真實(shí)差異,即為真,卻接受了。66統(tǒng)計(jì)假設(shè)檢驗(yàn)的兩類錯(cuò)誤統(tǒng)計(jì)假設(shè)檢驗(yàn)的是根據(jù)“小第二類錯(cuò)誤:H0本身不成立,但通過檢驗(yàn)卻接受了它,犯了“納偽”錯(cuò)誤,也叫Ⅱ型錯(cuò)誤(typeⅡerror)、β錯(cuò)誤。Ⅱ型錯(cuò)誤,就是把真實(shí)差異錯(cuò)判為非真實(shí)差異,即為真,卻未能否定。統(tǒng)計(jì)檢驗(yàn)是基于“小概率事件實(shí)際不可能性原理”來否定H0,但在一次試驗(yàn)中小概率事件并不是絕對(duì)不會(huì)發(fā)生的。如果我們抽得一個(gè)樣本,它雖然來自與H0對(duì)應(yīng)的抽樣總體,但計(jì)算所得的統(tǒng)計(jì)量卻落入了否定域中,因而否定了H0,于是犯了Ⅰ型錯(cuò)誤。犯Ⅰ這類錯(cuò)誤的概率不會(huì)超過a。67第二類錯(cuò)誤:H0本身不成立,但通過檢驗(yàn)卻接受了它,圖2兩類錯(cuò)誤示意圖68圖2兩類錯(cuò)誤示意圖68假設(shè)檢驗(yàn)的類型參數(shù)假設(shè)檢驗(yàn)U檢驗(yàn)t檢驗(yàn)非參數(shù)檢驗(yàn)69假設(shè)檢驗(yàn)的類型參數(shù)假設(shè)檢驗(yàn)69參數(shù)統(tǒng)計(jì)(parametricstatistics):t、Z、和F檢驗(yàn)均屬參數(shù)檢驗(yàn)。其共同特點(diǎn)是,假定隨機(jī)樣本來自某種已知分布(如正態(tài)分布)的總體,并對(duì)總體分布的參數(shù)(如總體均數(shù))進(jìn)行估計(jì)或檢驗(yàn)。非參數(shù)統(tǒng)計(jì)(nonparametricstatistics):對(duì)總體分布不作嚴(yán)格規(guī)定,不依賴于總體分布類型,也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷。70參數(shù)統(tǒng)計(jì)(parametricstatistics):t參數(shù)檢驗(yàn)——U檢驗(yàn)當(dāng)樣本容量大于30時(shí),可以采用U檢驗(yàn)。均值檢驗(yàn)百分比檢驗(yàn)雙樣本平均數(shù)差異的檢驗(yàn)雙樣本百分比差異的檢驗(yàn)71參數(shù)檢驗(yàn)——U檢驗(yàn)當(dāng)樣本容量大于30時(shí),可以采用U檢驗(yàn)。71均值檢驗(yàn)(U)假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)U的計(jì)算結(jié)果,比較U的絕對(duì)值與的大小。若有則接受H0,否則拒絕H0。72均值檢驗(yàn)(U)假設(shè)有72百分比檢驗(yàn)(U)假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)U的計(jì)算結(jié)果,比較U的絕對(duì)值與的大小。若有則接受H0,否則拒絕H0。73百分比檢驗(yàn)(U)假設(shè)有73雙樣本平均數(shù)差異的檢驗(yàn)(U)假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)U的計(jì)算結(jié)果,比較U的絕對(duì)值與的大小。若有則接受H0,否則拒絕H0。74雙樣本平均數(shù)差異的檢驗(yàn)(U)假設(shè)有74雙樣本百分比差異的檢驗(yàn)(U)假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)U的計(jì)算結(jié)果,比較U的絕對(duì)值與的大小。若有則接受H0,否則拒絕H0。75雙樣本百分比差異的檢驗(yàn)(U)假設(shè)有75練習(xí)例1:某一釀造廠新引進(jìn)一種釀醋曲種,以原曲種為對(duì)照進(jìn)行試驗(yàn)。已知原曲種釀出的食醋醋酸含量平均為μ0=9.75%,其標(biāo)準(zhǔn)差為σ=5.30%?,F(xiàn)采用新曲種釀醋,得到30個(gè)醋樣,測得其醋酸含量平均為=11.99%。試問,能否由這30個(gè)醋樣的平均數(shù)判斷新曲種好于原曲種?76練習(xí)例1:某一釀造廠新引進(jìn)一種釀醋曲種,以原曲種為對(duì)前例分析:所以在a=0.05水平上的接受域?yàn)椋?.0785<<0.1165)否定域?yàn)椤?.0785,≥0.1165
試驗(yàn)結(jié)果=0.1199,落入否定區(qū)間,所以否定,接受結(jié)論:采用新曲種釀造食醋,其醋酸含量有顯著改變。77對(duì)前例分析:所以在a=0.05水平上的接受域?yàn)椋?.0785例題:在食品廠的甲乙兩條生產(chǎn)線上各測定了30個(gè)日產(chǎn)量如表所示,試檢驗(yàn)兩條生產(chǎn)線的平均日產(chǎn)量有無顯著差異。甲生產(chǎn)線(x1)乙生產(chǎn)線(x2)747156547178655354605669625762697363584951536662617262707874585866715356776554586362607065585669596278536770687052555557表1甲乙兩條生產(chǎn)線日產(chǎn)量記錄78例題:在食品廠的甲乙兩條生產(chǎn)線上各測定了30個(gè)日產(chǎn)量如表所示(1)建立假設(shè)。即兩條生產(chǎn)線的平均日產(chǎn)量無差異。(2)確定顯著水平α=0.01(3)計(jì)算故:79(1)建立假設(shè)。(2)確定顯著水平α=0.01(3)計(jì)算(4)統(tǒng)計(jì)推斷。由α=0.01查附表2,得u0.01=2.58實(shí)際|u|=3.28>u0.01=2.58,故P<0.01,應(yīng)否定H0,接受HA。說明兩個(gè)生產(chǎn)線的日平均產(chǎn)量有極顯著差異,甲生產(chǎn)線日平均產(chǎn)量高于乙生產(chǎn)線日平均產(chǎn)量。80(4)統(tǒng)計(jì)推斷。80參數(shù)檢驗(yàn)——t檢驗(yàn)當(dāng)樣本容量小于30時(shí),不可以使用U檢驗(yàn),而需要使用t檢驗(yàn)。均值檢驗(yàn)均值差異的檢驗(yàn)百分比差異的檢驗(yàn)81參數(shù)檢驗(yàn)——t檢驗(yàn)當(dāng)樣本容量小于30時(shí),不可以使用U檢驗(yàn),而均值檢驗(yàn)(t)假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)t的計(jì)算結(jié)果,比較t的絕對(duì)值與的大小。若有則接受H0,否則拒絕H0。82均值檢驗(yàn)(t)假設(shè)有82均值差異的檢驗(yàn)(t)假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)t的計(jì)算結(jié)果,比較t的絕對(duì)值與的大小。若有
則接受H0,否則拒絕H0。83均值差異的檢驗(yàn)(t)假設(shè)有83百分比差異的檢驗(yàn)(t)假設(shè)有選取統(tǒng)計(jì)量設(shè)定顯著性水平查表得到根據(jù)t的計(jì)算結(jié)果,比較t的絕對(duì)值與的大小。若有
則接受H0,否則拒絕H0。84百分比差異的檢驗(yàn)(t)假設(shè)有84例1用山楂加工果凍,傳統(tǒng)工藝平均每100g加工500g果凍,采用新工藝后,測定了16次,得知每100g山楂可出果凍平均為=520g,標(biāo)準(zhǔn)差S=12g。問新工藝與老工藝在每100g加工果凍的量上有無顯著差異?85例1用山楂加工果凍,傳統(tǒng)工藝平均每100g加工500本例總體方差未知,又是小樣本,采用雙側(cè)t檢驗(yàn)。(1)提出無效假設(shè)與備擇假設(shè),即新老工藝沒有差異。,即新老工藝有差異。(2)確定顯著水平α=0.01(3)計(jì)算t值86本例總體方差未知,又是小樣本,采用雙側(cè)t檢驗(yàn)。86(4)查臨界t值,作出統(tǒng)計(jì)推斷由=15,查t值,得t0.01(15)=2.947,因?yàn)閨t|>t0.01,P<0.01,故應(yīng)否定H0,接受HA,表明新老工藝的每100g加工出的果凍量差異極顯著。(在統(tǒng)計(jì)量t上標(biāo)記**)87(4)查臨界t值,作出統(tǒng)計(jì)推斷87例題2:海關(guān)抽檢出口罐頭質(zhì)量,發(fā)現(xiàn)有脹聽現(xiàn)象,隨機(jī)抽取了6個(gè)樣品,同時(shí)隨機(jī)抽取6個(gè)正常罐頭樣品測定其SO2含量,測定結(jié)果見表4-3。試分析兩種罐頭的SO2含量有無差異。正常罐頭(x1)100.094.298.599.296.4102.5異常罐頭(x2)130.2131.3130.5135.2135.2133.5表2正常罐頭與異常罐頭SO2含量測定結(jié)果88例題2:海關(guān)抽檢出口罐頭質(zhì)量,發(fā)現(xiàn)有脹聽現(xiàn)象,隨機(jī)抽取了6個(gè)(1)提出無效假設(shè)與備擇假設(shè)兩種罐頭SO2含量沒有差異;(2)確定顯著水平α=0.01(兩尾概率)(3)計(jì)算89(1)提出無效假設(shè)與備擇假設(shè)兩種罐頭SO2含量沒有差(4)統(tǒng)計(jì)推斷由df=10,α=0.01查附表3得t0.01(10)=3.169。實(shí)得|t|=22.735>t0.01(10)=3.169,P<0.01,故應(yīng)否定無效假設(shè)H0,即兩種罐頭的SO2含量有高度顯著差異,該批罐頭質(zhì)量不合格。90(4)統(tǒng)計(jì)推斷90例題3:現(xiàn)有兩種茶多糖提取工藝,分別從兩種工藝中各取1個(gè)隨機(jī)樣本來測定其粗提物中的茶多糖含量,結(jié)果見表4-4。問兩種工藝的粗提物中茶多糖含量有無差異?醇沉淀法(x1)27.5227.7828.0328.8828.7527.94超濾法(x2)29.3228.1528.0028.5829.00表4-4兩種工藝粗提物中茶多糖含量測定結(jié)果91例題3:現(xiàn)有兩種茶多糖提取工藝,分別從兩種工藝中各取1個(gè)隨機(jī)(1)建立假設(shè),提出無效假設(shè)與備擇假設(shè),兩種工藝的粗提物中茶多糖含量無差異;(2)確定顯著水平α=0.05(兩尾概率)
(3)計(jì)算92(1)建立假設(shè),提出無效假設(shè)與備擇假設(shè),兩種工藝的粗因兩個(gè)樣本的容量不等,所以93因兩個(gè)樣本的容量不等,所以93(4)查臨界t值,作出統(tǒng)計(jì)推斷當(dāng)df=9時(shí),查臨界值得:t0.05(9)=2.262,|t|=1.381<t0.05(9),所以P>0.05,接受,表明兩種工藝的粗提物中茶多糖含量無顯著差異。94(4)查臨界t值,作出統(tǒng)計(jì)推斷94非參數(shù)檢驗(yàn)(X2)在市場調(diào)查中常獲得一些量表數(shù)據(jù),對(duì)量表數(shù)據(jù)求取平均數(shù)與方差都是毫無意義的。對(duì)量表數(shù)據(jù)的處理更適宜于采用非參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)中常用的方法是X2檢驗(yàn)。X2檢驗(yàn)的統(tǒng)計(jì)量是上述統(tǒng)計(jì)量中,表示第類別在樣本中實(shí)際出現(xiàn)的次數(shù),表示期望出現(xiàn)的次數(shù),為類別數(shù)。95非參數(shù)檢驗(yàn)(X2)在市場調(diào)查中常獲得一些量表數(shù)據(jù),對(duì)量表數(shù)據(jù)一般選用非參數(shù)統(tǒng)計(jì)方法的資料:①總體分布不易確定;②分布呈非正態(tài)而又無適當(dāng)?shù)臄?shù)據(jù)轉(zhuǎn)換方法;③等級(jí)資料;④一端或兩端無確定數(shù)值等。因此,非參數(shù)檢驗(yàn)又稱任意分布檢驗(yàn)(distribution-freetest)。在實(shí)際應(yīng)用中,對(duì)符合參數(shù)檢驗(yàn)的資料,或經(jīng)變量變換后符合參數(shù)檢驗(yàn)的資料應(yīng)首選參數(shù)檢驗(yàn);對(duì)不能滿足參數(shù)檢驗(yàn)條件的資料,應(yīng)選用非參數(shù)檢驗(yàn)。
96一般選用非參數(shù)統(tǒng)計(jì)方法的資料:①總體分布不易確定;②分布呈非兩個(gè)配對(duì)樣本的非參數(shù)檢驗(yàn)兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)多個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)多個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)97兩個(gè)配對(duì)樣本的非參數(shù)檢驗(yàn)97例1以下為治療前后,病人某項(xiàng)指標(biāo)的測量值,數(shù)據(jù)見npa.sav配對(duì)樣本的非參數(shù)檢驗(yàn)治療前(x):24.0016.7021.6023.7037.5031.4014.9037.3017.9015.5029.0019.90治療后(Y):23.1020.4017.7020.7042.136.1021.8040.3026.0015.5035.4025.5098例1以下為治療前后,病人某項(xiàng)指標(biāo)的測量值,數(shù)據(jù)見npa.s9999100100
Wilcoxon符號(hào)檢驗(yàn)適用于連續(xù)變量
sign符號(hào)檢驗(yàn)適用于對(duì)無法用數(shù)字計(jì)量的情況進(jìn)行比較,如兩分類,對(duì)于連續(xù)資料最好不要使用
McNemar實(shí)際上就是常用的配對(duì)χ2檢驗(yàn),只適用于二分類資料
MarginalHomogeneity是McNemar法向多分類情形下的擴(kuò)展,適用于資料為有序分類情況配對(duì)樣本的非參數(shù)檢驗(yàn)101Wilcoxon符號(hào)檢驗(yàn)配對(duì)樣本的非參數(shù)檢驗(yàn)101Exact:用于計(jì)算確切概率只給出近似概率蒙特卡羅方法給出精確概率值,并可設(shè)定耗時(shí)限制102Exact:用于計(jì)算確切概率只給出近似概率蒙特卡羅方法給出共12對(duì)指標(biāo),指標(biāo)值治療后小于治療前的有3對(duì),其平均秩次為2.83,總秩和為8.50;治療后大于治療前的有8對(duì),其平均秩次為7.19,總秩和為57.50;治療后等于治療前的有1對(duì)。(1)秩次表103共12對(duì)指標(biāo),指標(biāo)值治療后小于治療前的有3對(duì),其平均秩次為2
Wilcoxon符號(hào)秩檢驗(yàn)的統(tǒng)計(jì)量Z值=-2.179,近似概率(Asymp.sig.)P=0.029,按α=0.05的水準(zhǔn)可以認(rèn)為治療前后該指標(biāo)值的差別具有統(tǒng)計(jì)學(xué)意義。(2)檢驗(yàn)統(tǒng)計(jì)量104Wilcoxon符號(hào)秩檢驗(yàn)的統(tǒng)計(jì)量Z值=-2.179,近似例2在缺氧條件下,觀察4只貓與12只兔的生存時(shí)間(分鐘),結(jié)果如下。試判斷貓、兔在缺氧條件下生存時(shí)間的差異是否具有統(tǒng)計(jì)學(xué)意義。數(shù)據(jù)見npb.sav:生存時(shí)間(貓):2534444646生存時(shí)間(兔):1515161719212123252728283035兩獨(dú)立樣本的非參數(shù)檢驗(yàn)105例2在缺氧條件下,觀察4只貓與12只兔的生存時(shí)間(分鐘),106106107107108108默認(rèn)的Mann-WhitneyU檢驗(yàn)最常用109默認(rèn)的Mann-WhitneyU檢驗(yàn)最常用109生存時(shí)間樣本共19例,其中貓的生存時(shí)間5例,其平均秩次為15.70,總秩和為78.50;兔的生存時(shí)間14例,其平均秩次為7.96,總秩和為111.50。(1)秩次表110生存時(shí)間樣本共19例,其中貓的生存時(shí)間5例,其平均秩次為1給出Mann-WhitneyU、WilcoxonW統(tǒng)計(jì)量和Z值,近似值概率(Asymp.Sig)和精確概率值(Exact.sig)均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 汽車行業(yè)合同樣本:會(huì)員服務(wù)協(xié)議
- 移動(dòng)基站租賃合同書范本
- 城市老舊小區(qū)消防系統(tǒng)改造項(xiàng)目合同
- 幼兒園臨時(shí)教師聘任合同
- 新版民間房產(chǎn)抵押權(quán)轉(zhuǎn)讓合同
- 腎性水腫課件
- 智能化煤礦培訓(xùn)課件下載
- 舊貨零售互聯(lián)網(wǎng)+創(chuàng)新實(shí)踐考核試卷
- 搪瓷器的創(chuàng)造思維與創(chuàng)意設(shè)計(jì)考核試卷
- 建筑施工現(xiàn)場安全監(jiān)測與預(yù)警考核試卷
- 2025年黑龍江交通職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫必考題
- 個(gè)人畫協(xié)議合同范本
- 2024-2025學(xué)年高一下學(xué)期開學(xué)第一節(jié)課(哪吒精神)主題班會(huì)課件
- 人教版2025-初中物理實(shí)驗(yàn)室實(shí)驗(yàn)課程安排
- 2024年無錫科技職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- 舞蹈藝術(shù)賞析課件
- 2025江蘇泰州興化市陳堡鎮(zhèn)村級(jí)后備干部招聘10人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- (完整版)python學(xué)習(xí)課件
- CNAS-RL01:2019實(shí)驗(yàn)室認(rèn)可規(guī)則
- 2025中國人民解放軍空軍部隊(duì)軍工廠招聘21人管理單位筆試遴選500模擬題附帶答案詳解
- 成人腦室外引流護(hù)理-中華護(hù)理學(xué)會(huì)團(tuán)體 標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論