考研學習筆記 《統(tǒng)計學》(第6版)筆記和課后習題(含考研真題)詳解-184-365_第1頁
考研學習筆記 《統(tǒng)計學》(第6版)筆記和課后習題(含考研真題)詳解-184-365_第2頁
考研學習筆記 《統(tǒng)計學》(第6版)筆記和課后習題(含考研真題)詳解-184-365_第3頁
考研學習筆記 《統(tǒng)計學》(第6版)筆記和課后習題(含考研真題)詳解-184-365_第4頁
考研學習筆記 《統(tǒng)計學》(第6版)筆記和課后習題(含考研真題)詳解-184-365_第5頁
已閱讀5頁,還剩354頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

3.在假設檢驗中,原假設和備擇假設()。A.都有可能成立B.都有可能不成立C.只有一個成立而且必有一個成立D.原假設一定成立,備擇假設不一定成立【答案】C查看答案【解析】原假設和備擇假設是對立的,二者只有一個成立且4.某工廠在生產過程的產品檢驗中,假設H?:產品是合格的,顯著水平為0.05,工廠經理問什么是顯著性水平?下列說法正確的是()。A.若產品是合格的,則有5%的概率檢驗為不合格B.若產品是不合格的,則有5%的概率檢驗為合格C.在該檢驗中,有95%的檢驗結論是正確的,錯誤結論的可能性為5%D.假設這批產品有95%是合格的,不合格的概率為5%【答案】C查看答案【解析】通常把C稱為顯著性水平,在假設檢驗中,它的含義是當原假設正確時卻被拒絕5.在假設檢驗中,原假設為H?,備擇假設為H?,則稱()為犯第二類錯誤。A.H?為真,接受H?B.H?為真,拒絕H?C.H?不真,接受H?D.H?不真,拒絕H?【答案】C查看答案6.若用90%的置信水平對總體均值進行大樣本雙側區(qū)間估計,則Z值為().【答案】D查看答案【解析】若用90%的置信水平對總體均值進行大樣本雙側區(qū)間估計,則Z值為7.將由顯著性水平所規(guī)定的拒絕域平分為兩部分,置于概率分布的兩邊,每邊占顯著性水平的1/2,這是()。A.單側檢驗B.雙側檢驗C.右單側檢驗D.左單側檢驗【答案】B查看答案邊占顯著性水平的1/2;單側檢驗將顯著水平規(guī)定的拒絕域置于概率分布的左側或者右側,8.若假設檢驗H?:新工藝不比舊工藝好,H?:新工藝好于舊工藝,則下列屬于犯第二類的A.新工藝較好,采用新工藝B.新工藝較好,保留舊工藝C.新工藝不好,采用新工藝D.新工藝不好,保留舊工藝【答案】B查看答案【解析】當原假設H?為假時,卻被接受了,犯了第二類錯誤,即取偽的錯誤。B項,新工藝好的條件下(即H?為假),卻保留舊工藝(即接受了H?),是犯了第二類錯誤。9.比較兩個總體均值是否相同的假設檢驗中,采用t檢驗的條件是()。A.兩總體為正態(tài)分布,方差已知B.兩總體為正態(tài)分布,方差未知C.兩總體非正態(tài)分布,方差已知D.兩總體非正態(tài)分布,方差未知【答案】B查看答案【解析】兩總體為正態(tài)分布,方差已知采用z檢驗;兩總體為正態(tài)分布,方差未知采用t檢服從正態(tài)分布且方差已知或兩個均為大樣本時11.P值越小,()。A.拒絕原假設的可能性越小B.拒絕原假設的可能性越大C.拒絕備擇假設的可能性越大D.不拒絕備擇假設的可能性越小【答案】B查看答案【解析】P值就是當原假設為真時所得到的樣本觀察結果或更極端結果出現(xiàn)的概率。如果P12.在單側檢驗中,給定顯著性水平C和P值,可以拒絕原假設的是()?!敬鸢浮緽查看答案【解析】P值就是當原假設為真時所得到的樣本觀察結果或更極端結13.在小樣本情況下,當總體方差未知時,檢驗總體均值所使用的統(tǒng)計量是()。B.C.14.從方差未知的正態(tài)總體中隨機抽取容量為n的一個小樣本,在顯著性水平為C的條件下,檢驗的假設為H?:,H?:==,則拒絕域為()。D.【解析】當雙側檢驗時,由顯著水平為C,可知拒絕域的臨界值為三。方差未知的小樣本情況下,使用檢驗統(tǒng)計量,拒絕域為,即15.檢驗一個正態(tài)總體的方差時所使用的分布為()。A.正態(tài)分布C.x2分布D.F分布【答案】C查看答案16.隨機抽取一個n=100的樣本,計算得到X=60,s=15,要檢驗假設Ho:μ=65,H?:μ≠65,檢驗的統(tǒng)計量的值為()?!敬鸢浮緼查看答案17.若檢驗的假設為H?:μ≥μo,H?:μ<μo,則拒絕域為()。【解析】檢驗問題為左單側檢驗,在正態(tài)總體方差已知或大樣本情形下,顯著性水平C下的拒絕域為18.設=為檢驗統(tǒng)計量的計算值,檢驗的假設為Ho:=,H?,當【答案】A查看答案19.由49個觀測數據組成的隨機樣本得到的計算結果為x2=68。取顯著性水平α=0.01,檢驗假設H?:H≥1.18,H?:H<1.18,得到的檢驗結論是()。A.拒絕原假設B.不拒絕原假設C.可以拒絕也可以不拒絕原假設D.可能拒絕也可能不拒絕原假設【答案】B查看答案【解析】檢驗統(tǒng)計量為,代入數據計算得z=設。,所以在顯著性水平C=0.01下,不能拒絕原假20.從一個二項總體中隨機抽出一個n=135的樣本,得到p=0.63,在C=0.01的顯著性水平下,檢驗假設H?:T=0.63,H?:π≠0.63,所得的結論是()。A.拒絕原假設B.接受原假設C.可以拒絕也可以接受原假設D.可能拒絕也可能接受原假設【答案】B查看答案【解析】p=0.63;;由于-=<z<=,所以接受原假設。21.從正態(tài)總體中隨機抽取一個n=35的隨機樣本,計算得到X=20,F=18,假定=20,要檢驗假設H?:,則檢驗統(tǒng)計量的值為()。D.x2=34【答案】C查看答案【解析】檢驗統(tǒng)計量的值為:22.從正態(tài)總體中隨機抽取一個n=10的隨機樣本,計算得到X=31.7,s=7,假定在α=0.05的顯著性水平下,檢驗假設H?:=≥50,H?:<50,得到的結論是()。C.可以拒絕也可以接受H?D.可能拒絕也可能接受H?【答案】B查看答案由于,所以在顯著性在α=0.05的水平下,接受Ho。23.隨機抽取一個n=40的樣本,得到X=6.5,s=7。在C=0.02的顯著性水平下,檢驗假設Ho:μ≤5,H?:μ>5,統(tǒng)計量的臨界值為()。B.z=2.05D.z=-1.9624.檢驗假設Ho:μ≤50,H?:μ>50,隨機抽取一個n=16的樣本,得到的統(tǒng)計量的值為t=2.5,在α=0.05的顯著性水平下,得到的結論是()。C.可以拒絕也可以接受H?D.可能拒絕也可能接受H?【解析】這是右側檢驗,方差未知并且n=16為小樣本,拒絕域是:====1.7531,因為t==,所以在0.05的假設水平下,拒絕H?。25.從某個城市中隨機抽取15個家庭組成一個隨機樣本,得到樣本均值為84.50,標準差為C.可以拒絕也可以接受H?D.可能拒絕也可能接受H?或者。代入數據計算得,=2.1448,所以,即在顯著性水平C=0.05下,不能拒絕H?。26.檢驗假設H?:π=0.3,H?:π≠0.3,由n=100組成的一個隨機樣本,得到樣本比例為p=0.295。用于檢驗的P值為0.2,在α=0.05的顯著性水平下,得到的結論是()。B.不拒絕H?C.可以拒絕也可以不拒絕H?D.可能拒絕也可能不拒絕H?【答案】B查看答案【解析】因為檢驗P值大于顯著性水平C=0.05,所以在顯著性水平C=0.05下,不能拒絕27.檢驗兩個總體的方差比時所使用的分布為()。A.正態(tài)分布B.t分布C.x2分布D.F分布28.從均值為μ和μ2的兩個總體中,隨機抽取兩個大樣本,在C=0.05的顯著性水平下,要檢驗假設H?:μ1-μ2=0,H?:μ1-μ2≠0,則拒絕域為()。【答案】A查看答案【解析】因為是大樣本總體均值差檢驗,所以應該采用z檢驗統(tǒng)計量。拒絕域為【答案】A查看答案【解析】30.一項研究表明,男人和女人對產品質量的評估角度有所不同。在對某一產品的質量評估中,被調查的500個女人中有58%對該產品的評分等級是“高”,而被調查的500個男人中給同樣評分的卻只有43%。要檢驗對該產品的質量評估中,女人評高分的比例是否超過男人B.不拒絕H?C.可以拒絕也可以不拒絕H?D.可能拒絕也可能不拒絕H?因為=2.33,所以在顯著性水平a=0.01下,拒絕Ho。31.來自總體1的一個容量為16的樣本的方差=6,來自總體2的一個容量為20的樣本的方差==3。在C=0.05的顯著性水平下,檢驗假設H?:E≤E,H:E>E,得到的結論是()。C.可以拒絕也可以接受H?D.可能拒絕也可能接受H?【答案】B查看答案,所以在顯著性水平C=0.05下,接受H?。1.下列屬于假設檢驗基本思想的有()。A.先對總體的參數或分布函數的表達式做出某種假設,然后找出一個在假設成立條件下出現(xiàn)可能性甚小的(條件)小概率事件B.如果試驗或抽樣的結果使該小概率事件出現(xiàn)了,這與小概率原理相違背,表明原來的假C.若該小概率事件在一次試驗或抽樣中并未出現(xiàn),就沒有理由否定這個假設,表明試驗或抽樣結果支持這個假設,這時稱假設也實驗結果是相容的,或者說D.如果試驗或抽樣的結果使該小概率事件出現(xiàn)了,則不能否認這個假設E.若該小概率事件在一次試驗或抽樣中并未出現(xiàn),則否定這個假設【答案】ABC查看答案2.在假設檢驗中,當我們作出拒絕原假設而接受備擇假設的結論時,表示()。A.有充足的理由否定原假設B.原假設必定是錯誤的C.犯錯誤的概率不大于CD.犯錯誤的概率不大于βE.在H?為真的假設下發(fā)生了小概率【答案】ACE查看答案犯錯誤的概率不超過C;換言之,就是在H?為真的假設下發(fā)生了小概率事件。3.關于假設檢驗中兩類錯誤的說法正確的有()。A.如果拒絕的是真的Ho,就可能犯棄真(第一類)錯誤,一般犯棄真錯誤的概率記為CB.如果接受的是不真的Ho,就可能會犯取偽(第二類)錯誤,一般犯取偽錯誤的概率記為βC.在樣本容量n固定的條件下,要使C,β同時減小是可能的D.在樣本容量n固定的條件下,當C增大時,β將隨之減??;當CE.增大樣本容量可以使C,β同時減小【答案】ABDE查看答案【解析】第I類錯誤是原假設H0為真卻被拒絕了,犯這種錯誤的概率稱為棄真錯誤;第Ⅱ類錯誤是原假設為偽卻沒有拒絕,犯這種錯誤的概率稱為取偽錯誤。對于一定的樣本量n,4.下面關于單側和雙側假設檢驗的說法正確的有()。A.在顯著性α水平下,檢驗假設Ho:μ=Ho;H?:μ≠μo的假設檢驗,稱為雙側假設檢驗B.右側檢驗和左側檢驗統(tǒng)稱為單側檢驗C.在顯著性α水平下,檢驗假設Ho:μ≥Ho;H?:μ<μo的假設檢驗,稱為左側檢驗D.在顯著性α水平下,檢驗假設Ho:μ≥Ho;H?:μ<μo的假設檢驗,稱為右側檢驗E.在顯著性α水平下,檢驗假設H?:μ≤μo;H?:μ>μo的假設檢驗,稱為右側檢驗【答案】ABCE查看答案【解析】假設檢驗:①雙側檢驗:Ho:μ=Ho;H?:μ≠μo;②單側檢驗:右側檢驗Ho:μ≤po,H?:μ>Ho;左側檢驗Ho:μ≥μo,H?:μ<μo。5.在實際應用中,原假設的確定一般應遵循的原則有()。C.要把等號放在備擇假設里D.要所答是所問,不要所答非所問【答案】ABDE查看答案【解析】在實際應用中,等號一般放在原假設里。6.為了考察某種類型的電子元件的使用壽命情況,假定該電子元件使用壽命的分布是正態(tài)分布。而且根據歷史記錄得知該分布的參數為:平均使用壽命=為100小時,標準差T為10小時。現(xiàn)在隨機抽取100個該類型的電子元件,測得平均壽命為102小時,給定顯著性A.提出假設Ho:μ≤100;H?:μ>100B.提出假設H?:μ≥100;H?:μ<100C.檢驗統(tǒng)計量及所服從的概率分布為D.如果則稱不與μo的差異是顯著的,這時拒絕E.檢驗結果認為該類型的電子元件的使用壽命確實有顯著提高【答案】ACDE查看答案③求出拒絕域:因為Za=Z0.05=1.645,所以拒絕域為:[1.645,+0];④作出統(tǒng)計判斷:因為Z>Za=1.645,所以拒絕H?,接受H?,即當顯著性水平等于0.05時,7.某種電子元件的重量x(單位:g)服從正態(tài)分布,μ,o2均未知。測得16只元件的重量分別為:159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170,判斷元件的平均重量是否大于225g(取α=0.05)。下列計算過程中正確的提法有()。A.提出假設:Ho:μ≤225,H:μ>225B.提出假設:Ho:μ≥225,H?:μ<225C.檢驗統(tǒng)計量及其概率分布為D.取α=0.05,經計算有:t<to.o?(15)E.接受Ho,即認為元件的平均重量不大于225g【答案】ACDE查看答案【解析】由題意知n=16,,X=241.5,s=98.7259。這屬于總體②計算統(tǒng)計量③求出拒絕域:因為ta(n-1)=6ns(15)=1.7531所以拒絕域為:(1.7531,+o);④作出統(tǒng)計判斷:因為t=0.6685<1.7531,所以,當顯著性水平為0.05時,接受H?,即認為該種電子元件的平均重量不大于225g。8.關于假設檢驗,下列說法正確的有()。A.若P=1.1%=結論是統(tǒng)計顯著,但不是高度顯著B.一個檢驗的P值是H?為真的概率C.若C=0.05時,一個統(tǒng)計結果是顯著的,則它有5%的機會應歸因于偶然性,95%的機D.在其他情況都相等,P=98%是比P=2%對原假設更加有力的支持E.P>C,則接受Ho計算出檢驗統(tǒng)計量超過或者小于(還要依照分布的不同、單側檢驗、雙側檢驗的差異而定)設,它們均只有5%或更小。9.下列關于假設檢驗的陳述正確的有()。A.假設檢驗實質上是對原假設進行檢驗B.假設檢驗實質上是對備擇假設進行檢驗C.當拒絕原假設時,只能認為肯定它的根據尚不充分,而不是認為它絕對錯誤D.假設檢驗并不是根據樣本結果簡單地或直接地判斷原假設和備擇假設哪一個更有可能正確E.當接受原假設時,只能認為否定它的根據尚不充分,而不是認為它絕對正確1.如果一個假設檢驗問題只是提出一個原假設,而且檢驗的目的僅在于判斷原假設是否成立,那么這個檢驗問題稱為顯著性檢驗。()3.一項研究表明,司機駕車時因接打手機而發(fā)生事故的比例超過20%,用來檢驗這一結論的原假設和備擇假設為H?:π<20%;H?:T≥20%。(4.設樣本是來自正態(tài)總體N(μ,o2),其中o2未知,那么檢驗假設Ho:μ=μo時,用的是Z檢驗。()【解析】總體均值的假設檢驗中,①對于正態(tài)總體且o2已知,利用Z檢驗;②對于正態(tài)總體且o2未知,利用t檢驗;③對于非正態(tài)總體且為大樣本,利用Z檢驗。5.檢驗一個正態(tài)總體的方差時所使用的分布為正態(tài)分布或者t分布。()【解析】檢驗一個正態(tài)總體的方差時所使用的分布為x2分布。1.某商場從一批袋裝食品中隨機抽取10袋,測得每袋重量(單位:克)分別為789,780,794,762,802,813,770,785,810,806,假設重量服從正態(tài)分布,要求在5%的顯著性水平下,檢驗這批食品平均每袋重量是否為800克。(2)由于σ2未知,故選擇檢驗統(tǒng)計量為:(3)由α=0.05,查t分布表得臨界值:拒絕域為:(-0,—ta/2)=[ta/2,+o),即(-,-2.2622][2.2622,+);(4)計算統(tǒng)計量觀測值t:因為|t|=1.642<2.2622,所以當C=0.05時,不能拒絕H?,即在5%的顯著性水平下,這批食品平均每袋重量是800克。2.某企業(yè)生產的袋裝食品采用自動打包機包裝,每袋標準重量為100克?,F(xiàn)從某天生產的一批產品中按重復抽樣隨機抽取50包進行檢查,測得每包重量,如表8-3所示。表8-3袋裝食品的重量分組表每包重量(克)包數102102~104104~106合計7450(1)確定該種食品平均重量的95%的置信區(qū)間。(2)采用假設檢驗方法檢驗該批食品的重量是否符合標準要求(α=0.05,寫出檢驗的具體步驟)。樣本標準差為:由于是大樣本,所以食品平均重量95%的置信區(qū)間為:即(100.867,101.773)。(2)提出假設:Ho:μ=100,H?:μ≠100。檢驗的統(tǒng)計量的值為:由于z=5.712>Z?.05/2=1.96,所以拒絕原假設,即該批食品的重量不符合標準要求。3.某市全部職工中,平常訂閱某種報紙的占40%,最近從訂閱率來看似乎出現(xiàn)降低的現(xiàn)象,隨機抽200戶職工家庭進行調查,有76戶職工訂閱該報紙,問報紙的訂閱率是否顯著降低解:假設檢驗為Ho:π≥40%,H?:π<40%。計算統(tǒng)計量值為:由于Z=-0.577>-1.645,所以接受原假設,即報紙的訂閱率沒有顯著降低。4.兩種化學溶液,其濃度服從正態(tài)分布,經驗說明兩種溶液濃度的標準差分別為0.4和0.6。對兩種化學溶液進行隨機抽樣,分別抽取10個和15個樣本,若樣本標準差分別為0.7和0.5,試分別在0.01和0.05的顯著性水平下檢驗兩種溶液濃度的方差是否相同。解:依題意有:n?=10,n?=15,si=0.7,s?=0.5。(1)建立假設:Ho:≥=,H?:(2)檢驗統(tǒng)計量:(3)臨界值:C=0.01,Fo.o?(9,14)=4.0297;在C=0.05,Fo.05(9,14)=2.646。(4)樣本統(tǒng)計量的計算及判斷:由于F=1.96<Fo.o?(9,14)=4.0297;F=1.96<Fo.05(9,14)=2.646,所以無論在C=0.01或C=0.05,都不能拒絕原假設,即兩種溶液濃度的方差相同。9.1復習筆記一、分類數據與x2統(tǒng)計量1.分類數據統(tǒng)計數據的類型有分類數據、順序數據和數值型數據。分類數據和順序數據的共同特征是,調查結果雖然是用數值表現(xiàn)的,但不同數值描述了調查對象的不同特征;數值型數據可以轉化為分類數據。2.x2統(tǒng)計量x2統(tǒng)計量可以對分類數據擬合優(yōu)度檢驗和獨立性檢驗,可以用于測定兩個分類變量之間的相關程度。若用仁表示觀察值頻數,用=表示期望值頻數,則x2統(tǒng)計量可以寫為:x2檢驗:是運用x2的計算結果與x2分布中的臨界值進行比較,作出對原假設的統(tǒng)計決策。(1)x2統(tǒng)計量的特征①x2≥0,因為它是對平方值結果的匯總。②x2統(tǒng)計量的分布與自由度有關。③x2統(tǒng)計量描述了觀察值與期望值的接近程度。兩者越接近,即-三的絕對值越小,計算出的x2值越??;反之,-F的絕對值越大,計算出的x2值也越大。(2)x2分布與自由度的密切關系自由度越小,x2的分布就越向左邊傾斜;隨著自由度的增加,x2分布的偏斜程度趨于緩解,逐漸顯露出對稱性,隨著自由度的繼續(xù)增大,x2分布將趨近于對稱的正態(tài)分布。二、擬合優(yōu)度檢驗擬合優(yōu)度檢驗(goodnessoffittest)是用x2統(tǒng)計量進行統(tǒng)計顯著性檢驗的重要內容之一。它是依據總體分布狀況,計算出分類變量中各類別的期望頻數,與分布的觀察頻數進行對比,判斷期望頻數與觀察頻數是否有顯著差異,從而達到對分類變量進行分析的目的。三、列聯(lián)分析:獨立性檢驗對于兩個分類變量的分析,稱為獨立性檢驗,分析過程可以通過列聯(lián)表的方式呈現(xiàn),故又可稱為列聯(lián)分析。1.列聯(lián)表列聯(lián)表(contingencytable)是由兩個以上的變量進行交叉分類的頻數分布表。表中的行(row)是態(tài)度變量,表中的列(column)是單位變量。將橫向變量(行)的劃分類別視為R,縱向變量(列)的劃分類別視為C,則可以把每一個具體的列聯(lián)表稱為R×C列聯(lián)表。2.獨立性檢驗獨立性檢驗就是分析列聯(lián)表中行變量和列變量是否相互獨立。也就是檢驗行變量與列變量之間是否存在依賴關系。四、列聯(lián)表中的相關測量對兩個變量之間相關程度的測定,主要用相關系數表示;列聯(lián)表中的變量通常是類別變量,它們所表現(xiàn)的是研究對象的不同品質類別,所以,把這種分類數據之間的相關稱為品質相關。經常用到的品質相關系數有:φ相關系數、列聯(lián)相關系數、V相關系數。1.φ相關系數φ相關系數是描述2×2列聯(lián)表數據相關程度最常用的一種相關系數,其計算公式為:φ系數適合2×2列聯(lián)表,這是因為對于2×2列聯(lián)表中的數據,計算出的φ系數可以控制在0~1這個范圍。當φ=0,表明兩變量相互獨立;當Iφl=1,表明兩變量完全相關。注意:當列聯(lián)表R×C中的行數R或列數C大于2時,φ系數將隨著R或C的變大而增大,且φ值沒有上限。這時用φ系數測定兩個變量的相關程度就不夠清晰,可以采用列聯(lián)相關2.列聯(lián)相關系數列聯(lián)相關系數又稱列聯(lián)系數,簡稱c系數,主要用于大于2×2列聯(lián)表的情況,其計算公式為:當列聯(lián)表中的兩個變量相互獨立時,系數c=0,但它不可能大于1。c系數的特點:其可能的最大值依賴于列聯(lián)表的行數和列數,且隨著R和C的增大而增大。列聯(lián)系數的局限:根據不同的行和列計算的列聯(lián)系數不便于比較,除非兩個列聯(lián)表中行數和列數一致。3.V相關系數V系數的計算公式為:當兩個變量相互獨立時,V=0;當兩個變量完全相關時,V=1,所以V的取值在0~1之間。如果列聯(lián)表中有一維為2,即min[(R-1),(C-1)]=1,則V值就等于φ值。注意:對于同一個數據,系數F,,的結果不同。同樣,對于不同的列聯(lián)表,行數和列數的差異也會影響系數值。因此,在對不同列聯(lián)表變量之間的相關程度進行比較時,不同列聯(lián)表中行與行、列與列的個數要相同,并且采用同一種系數,這樣的系數值才具有可比性。4.數值分析對于同一個數據,系數φ,c,V的結果不同。同樣,對于不同的列聯(lián)表,行數和列數的差異也會影響系數值。因此,在對不同列聯(lián)表變量之間的相關程度進行比較時,不同列聯(lián)表中行與行、列與列的個數要相同,并且采用同一種系數,這樣的系數值才具有可比性。五、列聯(lián)分析中應注意的問題1.條件百分表的方向一般說來,在列聯(lián)表中變量的位置是任意的,即既可以把變量X放在列的位置,也可以放在行的位置。①如果變量X與Y存在因果關系,令X為自變量(原因),Y為因變量(結果),那么一般的做法是把自變量X放在列的位置,條件百分表也多按自變量的方向計算,這樣便于更好地表現(xiàn)原因對結果的影響。②如果因變量在樣本內的分布不能代表其在總體內的分布,例如,為了滿足分析的需要,抽樣時擴大了因變量某項內容的樣本量,這時仍以自變量的方向計算百分表就會歪曲實際情況。在這種情況下,可以把計算百分表的方向變換一下,改為按因變量方向計算。次品類型根據抽查檢驗的數據表明:次品類型與廠家(即哪一個廠)生產是無關的(即是相互獨立的)。建立假設:H?:次品類型與廠家生產是獨立的,H?:次品類型與廠家生產不是獨立的。可以計算各組的期望值,如表9-3所示(表中括號內的數值為期望值)。表9-3各組的期望值計算表生產廠生產廠AB次品類型而自由度等于(R-1)(C-1)=(3-1)×(3-1)=4,總計C若以0.01的顯著性水平進行檢驗,查x2分布表得=。由于,故接受原假設Ho,即次品類型與廠家生產是獨立的。3.說明計算x2統(tǒng)計量的步驟。答:計算x2統(tǒng)計量的步驟:(1)用觀察值三減去期望值Je;(3)將平方結果除以;(4)將步驟(3)的結果加總,即得:答:(1)相關系數是描述2×2列聯(lián)表數據相關程度最常用的一種相關系數。它的計算公式為:],式中,;n為列聯(lián)表中的總頻數,也即樣本量。說系數適合2×2列聯(lián)表,是因為對于2×2列聯(lián)表中的數據,計算出的系數可以控制在0~1這個范圍。(2)列聯(lián)相關系數又稱列聯(lián)系數,簡稱c系數,主要用于大于2×2列聯(lián)表的情況。c系數的計算公式為:當列聯(lián)表中的兩個變量相互獨立時,系數c=0,但它不可能大于1。c系數的特點是,其可能的最大值依賴于列聯(lián)表的行數和列數,且隨著R和C的增大而增大。(3)克萊默提出了V系數。V系數的計算公式為:當兩個變量相互獨立時,V=0;當兩個變量完全相關時,V=1。所以V的取值在0~1之間。如果列聯(lián)表中有一維為2,5.構造下列維數的列聯(lián)表,并給出x2檢驗的自由度。答:i行年列聯(lián)表,如表9-4所示。甲廠甲廠乙丙乙丙總計項目態(tài)度1態(tài)度2單位1單位2…單位j而一=檢驗的自由度=(行數-1)(列數-1),所以a.當i=2,j=5時,表9-4即為2行5列的列聯(lián)表,其三檢驗的自由度=(2-1)×(5-1)=4;b.當i=4,j=6時,表9-4即為4行6列的列聯(lián)表,其檢驗的自由度=(4-1)×(6-1)=15;c.當i=3,j=4時,表9-4即為3行4列的列聯(lián)表,其=檢驗的自由度=(3-1)×(4-1)=6。二、練習題1.欲研究不同收入群體對某種特定商品是否有相同的購買習慣,市場研究人員調查了四個不同收入組的消費者共527人,購買習慣分為:經常購買,不購買,有時購買。調查結果如表9-4所示。表9-4調查結果項目經常購買低收入偏低收入偏高收入高收入(1)提出假設;(2)計算x2值;(3)以α=0.1的顯著性解:(1)提出假設:H?:(即不同收入不完全相等(即不同收入群體對某種特定商品的購買習慣不完全相同)。(2)計算得各組的期望值,如表9-5所示(表中括號內的數值為期望值)。表9-5各組的期望值計算表偏低收入偏高收入項目低收入組高收入組總計買88(3)調查結果是3行4列的列聯(lián)表,其自由度=(3-1)×算出的x2值為17.67>10.64=,故拒絕原假設,即不同收入群體對某種特定商品的購買習慣不完全相同。2.從總體中隨機抽取了n=200的樣本,調查后按不同屬性依據經驗數據,各類別在總體中的比例分別為:以C=0.1的顯著性水平進行檢驗,說明現(xiàn)在的情況與經驗數據相比是否發(fā)生了變化(用F值)。解:提出假設:Ho:現(xiàn)在情況與經驗數據相比沒有發(fā)生變而P[三(5-1)>14]=0.007295<0.1=C,故拒絕原假設。3.某報社關心其讀者的閱讀習慣是否與其文化程度有關,隨機調查了254位讀者。得到如表9-6所示的數據。表9-6調查數據閱讀習慣大學以上大學和大專高中高中以下早上看中看有空看以0.05的顯著性水平檢驗讀者的閱讀習慣是否與文化程度解:建立假設:Ho:(即閱讀習慣與文化程度無關),H?:不完全相等(即閱讀習慣與文化程度有關)。計算各組的期望值,如表9-7所示(表中括號內的數值為期望值)。閱表9-7高中高中以下合計看12(13.34)16(15.76)8(7.28)8(7.62)65044956晚38(28.80)40(34.04)11(15.71)(16.46)5看21(19.70)2223.29)9(10.75)13(11.26)。表中各項的期望值的計算方法為:此調查數據是4行4列的列聯(lián)表,其自由度為=(4-1)×(4-1)=9,P[x2(9)>31.86]=0.0002<0.05=C,故拒絕原假設,認為閱讀習慣與文化程度有關。4.教學改革后學生有了更多的選課自由,但學院領導在安排課程上也面臨新的問題。例如,MBA研究生班的學生選課學年之間的變化常常很大,去年的學生很多人選會計課,而今年的學生很多人選市場營銷課。由于事先無法確定究竟有多少學生選各門課程,所以無法有效地進行教學資源的準備。有人提出學生所選課程與其本科所學專業(yè)有關。為此,學院領導將學生本科所學專業(yè)和MBA三門課程的選修課程情況做了統(tǒng)計,得到如表9-8所示的結果。表9-8選修課程統(tǒng)計結果MBA所選課程專業(yè)一專業(yè)一專業(yè)二專3181316業(yè)三其他專業(yè)1210105市場營銷(1)以0.05的顯著性水平檢驗學生本科所學專業(yè)是否影響其讀MBA期間所選課程;解:(1)建立假設:Ho:π?=π?=π?=π4(即本科專業(yè)與MBA選課無關),H?:πI,π2,π3,π4不完全相等(即本科專業(yè)與MBA選課有關)。計算各組的期望值,如表9-9所示(表中括號內的數值為期望值)。業(yè)MBA所選課程31(24.08)813(17.37)1(12.44)12(8.97)10此選修課程統(tǒng)計結果是4行3列的列聯(lián)表,其自由度為=(4-1)×(3-1)=6,當C=0.05時,G==12.592,,x2值14.87>12.592=oos(6),所以拒絕原假設。(2)由第(1)題計算結果可得:P[x2(6)>14.87]=0.021<0.05=C,故拒絕原假設,認為本科專業(yè)與MBA選課有關。解:由習題1中計算結果可得:1.列聯(lián)分析是利用列聯(lián)表來研究()。2.設列聯(lián)表的行數為3,列數為4,則x2檢驗的自由度為()。3.列聯(lián)表中的每個變量()。4.一所大學準備采取一項學生對餐廳改革的調查,為了解男女學生對這一措施的看法,分別抽取了300名男學生和240名女學生進行調查,得到的結果如表9-10所示。表9-10關于餐廳改革的調查結果這個表格是()。A.4×3列聯(lián)表B.3×2列聯(lián)表C.2×3列聯(lián)表D.3×4列聯(lián)表【答案】B查看答案【解析】表中的行是態(tài)度變量,這里劃分為三類,即贊成,中立和反對;表中的列是單位變量,這里劃分為兩類,即男同學和女同學,即3×2列聯(lián)表。5.一所大學為了解男女學生對后勤服務質量的評價,分別抽取了300名男學生和240名女學生進行調查,得到的結果如表9-11所示。表9-11關于后勤服務質量評價的調查結果滿滿男同學女同學這個列聯(lián)表的最下邊一行稱為()。B.條件頻數C.行邊緣頻數D.列邊緣頻數【答案】D查看答案6.某中學為了解教師對新課標改革的看法,分別抽取了300名男教師和240名女教師進行調查,得到的結果如表9-13所示。表9-13關于中學新課標改革的調查結果這個列聯(lián)表的最右邊一列稱為()。A.總頻數B.條件頻數C.行邊緣頻數D.列邊緣頻數【答案】C查看答案7.某大學為了解學生對研究生獎學金制度改革的看法,分別抽取了300名男性研究生和240名女性研究生進行調查,得到的結果如表9-14所示。表9-14關于研究生獎學金制度改革的調查結果贊成計根據這個列聯(lián)表計算的贊成研究生獎學金制度改革的行百分比分別為()?!窘馕觥抠澇裳芯可剬W金制度改革的行百分比分別為:90/174×100%=51.7%;8.某學校準備采取一項新的教師體制改革,為了解男女學生對這一措施的看法,分別抽取了300名男學生和240名女學生進行調查,得到的結果如表9-14所示。贊成觀察值期望值表9-14男同學女同學B.1.2352C.2.6176【解析】x2檢驗可以用于變量間擬合優(yōu)度檢驗和獨立性檢驗,可以用于測定兩個分類變量將表9-14中的數據代入計算得:x2=1.2352。9.某學校準備采取一項新的教師體制改革,為了解男女教師對這一措施的看法,分別抽取了50名男教師和50名女教師進行調查,得到的結果如表9-15所示。表9-15關于教師體制改革的調查結果男教師女教師合計如果要檢驗男女教師對教師體制改革的看法是否相同,提出的原假設為()。B.Ho:π1=π2=50【答案】D查看答案例應該是相同的(均為65/100=0.65)。所以提出的原假設和備擇假設分別為:Ho:π1=π2=0.65(贊成比例一致);H?:(贊成比例不一致)10.某大學為了解男女畢業(yè)生對開設《職業(yè)規(guī)劃》這門課程的看法,分別抽取了500名男學生和500名女學生進行調查,得到的結果如表9-16所示。表9-16關于開設《職業(yè)規(guī)劃》課程的調查結果男同學女同學5如果要檢驗男女畢業(yè)生對開設《職業(yè)規(guī)劃》這門課程的看法是否相同,即檢驗假設H?:π1=π2=850/1000=0.85,x2檢驗統(tǒng)B.2C.3【答案】B查看答案【解析】x2統(tǒng)計量的自由度是(R-1)(C-1)=(2-1)×(3-1)=2。11.相關系數是描述兩個分類變量之間相關程度的一個統(tǒng)計量,它主要用于()。A.2×2列聯(lián)表數據B.2×3列聯(lián)表數據C.3×3列聯(lián)表數據D.3×4列聯(lián)表數據【答案】A查看答案【解析】W相關系數是描述2×2列聯(lián)表數據相關程度最常用的一種相關系數。它的計算公12.φ相關系數的取值范圍是()?!敬鸢浮緼查看答案【解析】φ相關系數的取值范圍在0~1之間,且φ的絕對值越大,說明變量X與Y的相關13.如果兩個分類變量之間相互獨立,則φ相關系數的取值為()?!敬鸢浮緼查看答案A.完全相關B.相互獨立C.存在相關關系,但不是完全相關D.無法判斷【答案】A查看答案15.當列聯(lián)表中的兩個變量相互獨立時,計算的列聯(lián)相關系數c()?!敬鸢浮緼查看答案16.對于同一個列聯(lián)表計算的c系數和φ系數,其結果是().A.c值必然大于等于φ值B.c值必然等于φ值C.c值必然小于等于φ值D.c值可能小于φ值【答案】C查看答案【解析】由于,所以c值必然小于等于φ值。17.利用x2分布進行獨立性檢驗,要求樣本容量必須足夠大,特別是每個單元中的期望頻數fe不能過小。如果只有兩個單元,每個單元的期望頻數必須()。A.等于或大于1B.等于或大于2C.等于或大于5D.等于或大于10【答案】C查看答案是5或以上;②如果有兩個以上單元,且20%的單元期望頻數fe小于5,則不能應用x2檢18.如果列聯(lián)表有兩個以上的單元,不能應用x2檢驗的條件是()。B.20%的單元期望頻數e小于10C.20%的單元期望頻數e大于10【答案】D查看答案1.某電視機廠對三個元件生產廠提供的電子元件的三種性能進行質量檢驗。他們想知道元件生產廠家同元件性能的質量差異是否有關系。抽查了450只元件次品,整根據抽查檢驗的數據,他們認為次品類型與廠家(即哪一個廠)生產是無關的。(1)試以0.01的顯著性水平進行檢驗,作出判斷。(2)計算c系數和V系數。解:(1)建立假設:H?:次品類型與廠家生產是獨立的,H?:次品類型與廠家生產不是獨立的。計算得各組的頻數理論值,如表9-18所示。表9-18各組的頻數理論值計算表次品類型表中各項的理論頻數計算方法為:即X的計算值為9.821。自由度等于(r-1)-1)(3-1)=4,查x2分布表得1。由于,故接受Ho,即次品類型與廠2.一種原料來自三個不同的地區(qū),原料質量被分成三個不同等級。從這批原料中隨機抽取500件進行檢驗,結果如表9-19所示。要求:檢驗各個地區(qū)和原料質量之間是否存表9-19抽樣檢驗結果甲乙丙甲乙丙區(qū)丙地區(qū)050965解:(1)建立假設如下:Ho:地區(qū)和原料質量之間沒有明顯的關系(2)在原假設成立的條件下,可用x2進行獨立性檢驗,計算的理論頻數列于表9-20的括號中。表9-20區(qū)乙52(45.36)6064(52.64)5924(42.00)52地區(qū)(55.40)50(64.30)65(51.30)74丙地(61.24)(71.06)(56.70)9區(qū)合計162188150500(3)自由度為(3-1)×(3-1)=4,α=0.05的x2分布的臨界值x2(4)=9.488<19.82,所以拒絕原假設,即認為地第10章方差分析10.1復習筆記一、方差分析引論1.方差分析及其有關術語方差分析:通過檢驗各總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。因素(或因子):在方差分析中,所要檢驗的對象稱為因素或因子。水平(或處理):因素的不同表現(xiàn)稱為水平或處理。觀測值:每個因子水平下得到的樣本數據稱為觀測值。2.方差分析的基本思想和原理組內誤差:來自水平內部的數據誤差。它反映了一個樣本內部數據的離散程度,只含有隨機組間誤差:來自不同水平之間的數據誤差。這種差異可能是由于抽樣本身形成的隨機誤差,也可能是由于行業(yè)本身的系統(tǒng)性因素造成的系統(tǒng)誤差。因此,組間誤差是隨機誤差和系統(tǒng)誤差的總和,它反映了不同樣本之間數據的離散程度。在方差分析中,數據的誤差是用平方和來表示的。總平方和(SST):反映全部數據誤差大小的平方和,它反映了全部觀測值的離散狀況。組內平方和(SSE):反映組內誤差大小的平方和,也稱為誤差平方和,或殘差平方和,它反映了每個樣本內各觀測值的總離散狀況。組間平方和(SSR):反映組間誤差大小的平方和,也稱為因素平方和,它反映了樣本均值之間的差異程度。(1)方差分析中的三個基本假定①每個總體都應服從正態(tài)分布。也就是說,對于因素的每一個水平,其觀測值是來自正態(tài)分布總體的簡單隨機樣本。②各個總體的方差a2必須相同。也就是說,對于各組觀察數據,是從具有相同方差的正態(tài)總體中抽取的。③觀測值是獨立的。在上述假定成立的前提下,要分析自變量對因變量是否有影響,形式上也就轉化為檢驗自變量的各個水平(總體)的均值是否相等。(2)問題的一般提法設因素有k個水平,每個水平的均值分別用μ1,μ2,…,=表示,要檢驗k個水平(總體)的均值是否相等,需要提出如下假設:Ho:H=H?=….=自變量對因變量沒有顯著影響二、單因素方差分析單因素方差分析:方差分析中只涉及一個分類型自變量,其研究的是一個分類型自變量對一個數值型因變量的影響。進行單因素方差分析時,需要得到如表10-1所示的數據結構。表10-1單因素方差分析的數據結構觀測值(j)因素(i)Xii(i=1,2,…,k;j=1,2,…,n)表示,即表示第1個水平(總體)的第j個觀測值。其中,從不同水平中所抽取的樣本量可以相等,也可以不相等。2.分析步驟(1)提出假設檢驗因素的k個水平(總體)的均值是否相等,需要提出假設為:Ho:自變量對因變量沒有顯著影響H?:(i=1,2,…,k)不全相等自變量對因變量有顯著影響如果拒絕原假設Ho,則意味著自變量對因變量有顯著影響,也就是自變量與因變量之間有顯著關系;如果不拒絕原假設Ho,則沒有證據表明自變量對因變量有顯著影響,也就是說,不能認為自變量與因變量之間有顯著關系。(2)構造檢驗的統(tǒng)計量①計算各樣本的均值假定從第個總體中抽取一個容量為的簡單隨機樣本,令F為第1個總體的樣本均值,則:,其中,N為第2個總體的樣本量;i為第2個總體的第j個觀測值。②計算全部觀測值的總均值它是全部觀測值的總和除以觀測值的總個數,令總均值為巨,則有:③計算各誤差平方和a.總平方和(SST)它是全部觀測值與總平均值的誤差平方和,其計算公式為:b.組間平方和(SSA)它是各組平均值(=1,2,….,k)與總平均值x的誤差平方和,反映各樣本均值之問的差異程度,其計算公式為:它是每個水平或組的各樣本數據與其組平均值誤差的平方和,反映了每個樣本各觀測值的離散狀況,因此又稱為組內平方和或殘差平方和。該平方和反映了隨機誤差的大小,其計算公三個平方和之間的關系為:總平方和(SST)=組間平方和(SSA)+組內平方和(SSE)SSA是對隨機誤差和系統(tǒng)誤差大小的度量,它反映了自變量對因變量的影響,也稱為自變均方(方差):由于各誤差平方和的大小與觀測值的多少有關,為了消除觀測值多少對誤差SSA的自由度為k-1,其中k為因素水平(總體)的個數;SSE的自由度為n-k。SSA的均方也稱為組間均方或組間方差,記為MSA,其計算公式為:SSE的均方也稱為組內均方或組內方差,記為MSE,其計算公式為:分子自由度為k-1、分母自由度為n-k的F分布,即(3)統(tǒng)計決策如果原假設成立,則表明沒有系統(tǒng)誤差,組間方差一與組內方差一的比值差異就不會太大;如果組間方差顯著大于組內方差,說明各水平(總體)之間的差異顯然不僅僅有隨機誤差,還有系統(tǒng)誤差。因此,判斷因素的水平是否對其觀根據給定的顯著性水平C,在F分布表中查找與分子自由度一==、分母自由度若F>日,則拒絕原假設Ho:H?=μ2=…-=Hk,表明從(i=1,2,…,k)之間的差異是顯著若F<日,則不拒絕原假設H?,沒有證據表明A(i=1,2,…,k)之間有顯著差異,即這(4)方差分析表差分析表。其一般形式如表10-2所示。表10-2方差分析表的一般形式誤差來源平方和自由度均方組間(因素影則拒絕Ho。3.關系強度的測量這一比例記為R2,即4.方差分析中的多重比較山與從、.….、日與A之間究竟是哪兩個均值不同呢?這就需要做進一步的分析,所使用的方法就是多重比較方法(例如最小顯著差異方法),它是通過對總體均值之間的配對比較最小顯著差異方法(LSD)是由費希爾提出的,其進行檢驗的具體步驟為:(2)計算檢驗統(tǒng)計量:(3)計算LSD,其公式為:則不拒絕H?。1.雙因素方差分析及其類型(1)無交互作用的雙因素方差分析(又稱為無重復雙因素分析):兩個因素對因變量的影(2)有交互作用的雙因素方差分析(又稱為可重復雙因素分析):兩個因素搭配在一起會(1)數據結構(如表10-3所示)列因素(j):平均值一=…(2)分析步驟行因素(自變量)對因變量沒有顯著影響不全相等行因素(自變量)對因變量有顯著影響Ho:H=H?=…-間..-F列因素(自變量)對因變量沒有顯著影響H?:(j=1,2,..,r)不全相等列因素(自變量)對因變量有顯著影響其中,分解后的等式右邊的第一項是行因素所產生的誤差平方和,記為SSR,即第二項是列因素所產生的誤差平方和,記為SSC,即記為SSE,即總平方和SST的自由度為一;行因素的誤差平方和SSR的自由度為k-1;列因素的誤差平方和SSC的自由度為r-1;隨機誤差平方和SSE的自由度為(k-1)×(k-1)。b.均方是各平方和除以相應的自由度,所以各因素的均方分別為:行因素的均方;列因素的均方隨機誤差項的均方c.檢驗各因素對因變量的影響是否顯著采檢驗行因素對因變量的影響是否顯著,采用的統(tǒng)計量:檢驗列因素的影響是否顯著,采用的統(tǒng)計量:若FR>Fα,,則拒絕原假設Ho:H?=μ2=..=A=..=A,表明H(i=1,2,….,k)之間的差(3)關系強度的測量比值定義為R2,其平方根R則反映了這兩個自變量合起來與因變量之間的關系強度。即3.有交互作用的雙因素方差分析,行變量平方和,交互作用平方和,列變1.什么是方差分析?它研究的是什么?方差分析是檢驗多個總體均值是否相等的統(tǒng)計方法,但本質上它所研究的是分類型自變量對數值型因變量的影響,例如,變量之間有沒有關系、關系的強度如何等。2.要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分析方法?答:方差分析不僅可以提高檢驗的效率,同時由于它是將所有的樣本信息結合在一起,也增加了分析的可靠性。檢驗多個總體均值是否相等時,如果作兩兩比較,則需要進行多次的t檢驗。隨著增加個體顯著性檢驗的次數,偶然因素導致差別的可能性也會增加(并非均值真的存在差別)。而方差分析方法則是同時考慮所有的樣本,因此排除了錯誤累積的概率,從而避免拒絕一個真實的原假設。3.方差分析包括哪些類型?它們有何區(qū)別?答:(1)根據所分析的分類自變量的多少,方差分析可分為單因素方差分析和雙因素方差分析。(2)區(qū)別:①單因素方差分析研究的是一個分類型自變量對一個數值型因變量的影響;②雙因素方差分析研究的是兩個分類變量對數值型因變量的影響。4.方差分析中有哪些基本假定?答:方差分析中有三個基本假定:(1)每個總體都應服從正態(tài)分布。也就是說,對于因素的每一個水平,其觀測值是來自正態(tài)分布總體的簡單隨機樣本。(2)各個總體的方差o2必須相同。也就是說,對于各組觀察數據,是從具有相同方差的正態(tài)總體中抽取的。(3)觀測值是獨立的。5.簡述方差分析的基本思想。答:方差分析的基本思想:通過分析研究中不同來源的變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。6.解釋因子和處理的含義。答:在方差分析中,所要檢驗的對象稱為因素或因子;因素的不同表現(xiàn)稱為水平或處理。例如:要分析行業(yè)(零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè))對投訴次數是否有顯著影響,7.解釋組內誤差和組間誤差的含義。答:由于抽樣的隨機性所造成的隨機誤差,這種來自水平內部的數據誤差稱為組內誤差。來自不同水平之間的數據誤差稱為組間誤差,這種差異可能是由于抽樣本身形成的隨機誤差,也可能是由于行業(yè)本身的系統(tǒng)性因素造成的系統(tǒng)誤差。因此,組間誤差是隨機誤差和系統(tǒng)誤差的總和。8.解釋組內方差和組間方差的含義。答:組內平方和SSE的均方稱為組內均方或組內方差,記為MSE,其計算公式為:組間平方和SSA的均方稱為組間均方或組間方差,記為MSA,其計算公式為:9.簡述方差分析的基本步驟。答:(1)單因素方差分析的基本步驟包括:H?:μi(i=1,2,…,k)不全相等,即自變量對因變量有顯著影響。若F>Fa,則拒絕原假設Ho:H=μ2=….-H,表明網(i=1,2,…,k)之間的差異是顯著若F<Fa,則不拒絕原假設Ho,沒有證據表明從(i=1,2,….,k)之間有顯著差異。(2)無交互作用的雙因素方差分析的基本步驟包括:Ho:H1=μ2=…=Hi=…=Hk,即行因素(自變量)對因變量沒有顯著影響;H?:μi(i=1,2,…,k)不完全相等,即行因素(自變量)對因變量有顯著影響。Ho:μ=μ2=…=Hj=…=Hr,即列因素(自變量)對因變量沒有顯著影響;H?:H(j=1,2,…,r)不完全相等,即列因素(自變量)對因變量有顯著影響。若FR>Fa,,則拒絕原假設Ho:H?=μ2=...=A=...=H,表明從(i=1,2,….,k)之間的差若Fc>Fa,則拒絕原假設H?:H?=μ2=...=(3)有交互作用的雙因素方差分析的基本步驟包括:Ho:H1=μ2=…=μi=…=Hk,即行因素(自變量)對因變量沒有顯著影響;H?:Hi(i=1,2,…,k)不完全相等,即行因素(自變量)對因變量有顯著影響。Ho:Hi=μ2=…=Hj=…=μr,即列因素(自變量)對因變量沒有顯著影響;H?:Hi(j=1,2,.….,r)不完全相等,即列因素(自變量)對因變量有顯著影響。H?:μ(t=1,2,…,m)不完全相等,即交互作用對因變量有顯著影響。②構造檢驗的統(tǒng)計量檢驗行因素對因變量的影響是否顯著的統(tǒng)計量:檢驗列因素的影響是否顯著的統(tǒng)計量:檢驗交互作用的影響是否顯著的統(tǒng)計量:③統(tǒng)計決策若FR>Fa,則拒絕原假設Ho:HI=H?=…-A=.-A,表明A(?=1,2,…,k)之間的差若Fe>Fa,則拒絕原假設Ho:HI=H?=….-Hy=….-4,表明竹(j=1,2,…,r)之間的差若FRc>F,,則拒絕原假設Ho:H=μ2=….=A=..-F,表明從(j=1,2,…,m)之間的10.方差分析中多重比較的作用是什么?答:多重比較方法是通過對總體均值之間的配對比較來進步檢驗到底哪些均值之間存在差異。多重比較的方法有許多,常用的是由費希爾提出的最小顯著差異方法(LSD)。11.什么是交互作用?答:交互作用是一因素對另一因素的不同水平有不同的效果。例如:對于雙因素方差分析,有交互作用就是兩個因素搭配在一起對應變量產生一種新的效應。12.解釋無交互作用和有交互作用的雙因素方差分析。答:如果兩個自變量因素對因變量的影響是相互獨立的,需分別判斷兩個自變量因素對因變量的影響情況,稱為無交互作用的雙因素方差分析。如果除了兩個自變量因素對因變量的單獨影響外,兩個因素的搭配還會對因變量產生一種新的影響效應,這時的雙因素方差分析稱為有交互作用的雙因素方差分析。13.解釋-F的含義和作用。答:(1)單因素方差分析中,R2表示組間平方和(SSA)占總平方和(SST)的比例,其平方根R反映了兩個變量之間的關系強度。其計算公式為:(2)無交互作用的方差分析中,行平方和與列平方和加在一起度量了兩個自變量對因變量的聯(lián)合效應,聯(lián)合效應與總平方和的比值定義為R2,其平方根R則反映了這兩個自變量合起來與因變量之間的關系強度。即(3)有交互作用的方差分析中,R2的定義為:其中SSRC為交互作用的平方和。二、練習題1.從3個總體中各抽取容量不同的樣本數據,結果如表10-4所示。檢驗3個總體的均值之間是否有顯著差異(α=0.01)?表10-43個樣本數據樣本1樣本2樣本3解:設3個總體的均值分別為提出假設:由Excel輸出的方差分析表,如表10-5所示。表10-5方差分析表由于P-value=0.040877>X=0.01(或F=4.6574<Fo.o?(2,9)=8.0215),不拒絕原假設,沒有證據表明3個總體的均值之間有顯著差異。2.下面是來自5個總體的樣本數據,如表10-6所示。表10-65個總體的樣本數據樣本1樣本2樣本3樣本4樣本5取顯著性水平C=0.01,檢驗5個總體的均值是否相等?解:設5個總體的均值分別為提出假設:由Excel輸出的方差分析表,如表10-7所示。表10-7方差分析表由于P-value=0.00001<C=0.01(或F=15.8234>Fo.o?(4,18)=4.579),拒絕原假設。表明5個總體的均值之間有顯著差異。3.一家牛奶公司有4臺機器裝填牛奶,每桶的容量為4L。下面是從4臺機器中抽取的樣本數據,如表10-8所示。表10-8樣本數據機器1機器2機器3機器4取顯著性水平F=0.01,檢驗4臺機器的裝填量是否相同?解:設4臺機器的平均裝填量分別為由Excel輸出的方差分析表,如表10-9所示。表10-9方差分析表由于P-value=0.000685<X=0.01(或F=10.0984>Fo.o?(3,15)=5.4170),拒絕原假設。表明4臺機器的平均裝填量之間有顯著差異。4.一家管理咨詢公司為不同的客戶進行人力資源管理講座。每次講座的內容基本上是一樣理者的滿意度評分,如表10-10所示(評分標準從1~10,10代表非常滿意)。表10-10不同層次管理者的滿意度評分高級管理者中級管理者低級管理者取顯著性水平C=0.05,檢驗管理者的水平不同是否會導致評分的顯著性差異?由Excel輸出的方差分析表,如表10-11所示。表10-11方差分析表由于P-value=0.000849<C=0.05(或F=11.75573>Fo.o?(2,15)=3.68232),5.某家電制造公司準備購進一批5#電池,現(xiàn)有A,B,C三個電池生產企業(yè)愿意供貨,為比較它們生產的電池質量,從每個企業(yè)各隨機抽取5只電池,經試驗得其壽命(單位:h)數據如表10-12所示。表10-12電池壽命試驗號ABC試分析3個企業(yè)生產的電池的平均壽命之間有無顯著差異(C=0.05)?如果有差異,用LSD方法檢驗哪些企業(yè)之間有差異?解:設3個企業(yè)生產的電池的平均壽命分別為E提出假設:Ho:H?:不全相等。由Excel輸出的方差分析表,如表10-13、10-14所示。表10-13表10-14方差分析表由于P-value=0.0003<X=0.05(或F=17.0684>Fo.o?(2,12)=3.8853),拒絕原假設。表明電池的平均壽命之間有顯著差異。為判斷哪兩個企業(yè)生產的電池平均使用壽命之間有顯著差異,首先提出如下假設:檢驗1:檢驗2:檢驗3:計算檢驗統(tǒng)計量:根據方差分析表10-14可知,MSE=18.03333。根據自由度=n-k=15-3=12,查t分布表得==。由于每個樣本的樣本量均為5,所以池的平均使用壽命之間有顯著差異;,拒絕原假設。因此,企業(yè)A與企業(yè)B電池的平均使用壽命之間有顯著差異。6.一家產品制造公司管理者想比較A,B,C三種不同的培訓方式對產品組裝時間的多少培訓方式不同培訓方式對產品組裝有顯著影響。7.某企業(yè)準備用三種方法組裝一種新的產品,為確定哪種方法每小時生產的產品數量最多,進行方差分析得到的結果,如表10-17所示。組內總計6 要求:(1)完成上面的方差分析表。(2)若顯著性水平C=0.05,檢驗三種方法組裝的產品數量之間是否有顯著差異?表10-18方差分析表不能拒絕原假設,即沒有證據表明3種方法組裝的產品數量之間有顯著差異。程度進行測試,分別在低速(40km/h)、中速(80km/h)、高速(120km/h)下進行測試。表10-19是對5家供應商抽取的輪胎隨機樣本在輪胎行駛1000km后的磨損程度。表10-19輪胎行駛1000km后的磨損程度供應商車速低速(1)不同車速對磨損程度是否有顯著影響?(2)不同供應商生產的輪胎的磨損程度是否有顯著差異?解:(1)設低速、中速、高速的平均磨損程度分別為由Excel輸出的方差分析表,如表10-20所示。表10-20方差分析表由于P-value=2.39E-06<C=0.01(或一=97.6822>(2,8)=8.6491),拒絕原假設。(2)設不同供應商輪胎的平均磨損程度分別為-9.有5種不同品種的種子和4種不同的施肥方案,在20塊同樣面積的土地上,分別采用5種種子和4種施肥方案搭配進行試驗,取得的收獲量數據如表10-21所示。表10-21土地收獲量施肥方案檢驗種子的不同品種對收獲量的影響是否有顯著差異?不同的施肥方案對收獲量的影響是否有顯著差異(α=0.05)?解:設不同品種的種子的平均收獲量分別為M,A2,A?,A?,A。設不同施肥方式的平均收獲量分別為提出假設:H1:A,H?,H?H4由Excel輸出的方差分析表如10-22所示。表10-22方差分析表由于P-value=0.0033<C=0.05(或一==7.2397>(4,12)=3.2592),拒絕原假設。表明不同品種的種子對收獲量的影響有顯著差異。P-value=0.0019<C=0.05(或一=9.2047>間(3,12)=3.4903),拒絕原絕原假設。表明不同施肥方案對收獲量的影響有顯著差異。10.為研究食品的包裝和銷售地區(qū)對其銷售量是否有影響,在某周的三個不同地區(qū)中用三種不同包裝方法進行銷售,獲得的銷售量數據如表10-23所示。表10-23銷售量數據檢驗不同的地區(qū)和不同的包裝方法對該食品的銷售量是否有顯著影響(CX=0.05)?解:設不同地區(qū)的平均銷售量分別為提出假設:H?:不全相等。提出假設:Ho:由Excel輸出的方差分析表如表10-24所示。表10-24方差分析表由于P-value=0.9311>C=0.05(或一=0.0727<Foos(2,4)=6.9443),不拒絕原假設。沒有證據表明不同的地區(qū)對該食品的銷售量有顯著影響。P-value=0.1522>C=0.05(或—==3.1273<Foos(2,4)=6.9443),不拒絕原假設。沒有證據表明不同的包裝方法對該食品的銷售量有顯著影響。11.一家超市連鎖店進行一項研究,確定超市所在的位置和競爭者的數量對銷售額是否有顯著影響。表10-25是獲得的月銷售額數據(單位:萬元)。表10-25月銷售額數據超市位置超市位置0位于市內居民小411位于市內居民小41區(qū)位于寫字樓區(qū)位于寫字樓位于郊區(qū)取顯著性水平C=0.01,取顯著性水平C=0.01,檢驗:2(1)競爭者的數量對銷售額是否有顯著影響?(2)超市的位置對銷售額是否有顯著影響?(3)競爭者的數量和超市的位置對銷售額是否有交互影響?解:由Excel輸出的方差分析表如表10-26所示。表10-26方差分析表設。表明競爭者的數量對銷售額有顯著影響;廣告方案廣告媒體報紙電視2.下列關于單因素方差分析的敘述,不正確的是()。A.方差分析可以對若干平均值是否相等同時進行檢驗B.進行方差分析要求各水平下的樣本容量相同C.總平方和能分解為組內平方和與組間平方和之和D.進行方差分析時各水平下的樣本容量可以不相同【答案】B查看答案【解析】方差分析通過檢驗各總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響??偲椒胶?組內平方和+組間平方和。進行方差分析時不要求各水平下的樣本容量相等。3.雙因素方差分析有兩種類型:一個是有交互作用的,一個是無交互作用的。區(qū)別的關鍵是看這對因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論