統(tǒng)計學(xué)復(fù)習(xí)串講(已更新)解答_第1頁
統(tǒng)計學(xué)復(fù)習(xí)串講(已更新)解答_第2頁
統(tǒng)計學(xué)復(fù)習(xí)串講(已更新)解答_第3頁
統(tǒng)計學(xué)復(fù)習(xí)串講(已更新)解答_第4頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、導(dǎo)論參數(shù):描述總體的特征,總體平均數(shù) ,總體標(biāo)準(zhǔn)差統(tǒng)計量:描述樣本的特征,樣本平均數(shù)X ,樣本標(biāo)準(zhǔn)差SD數(shù)據(jù) /變量的類型:統(tǒng)計數(shù)據(jù)的分類按計量層次按收集方法按時間狀況分順數(shù)觀實截時類序值察驗面序的的型的的的的數(shù)數(shù)數(shù)數(shù)數(shù)數(shù)數(shù)據(jù)據(jù)據(jù)據(jù)據(jù)據(jù)據(jù)類別型(品質(zhì)型)變量(分類的數(shù)據(jù)),如性別,男、女(男、女表示兩種不同類別);數(shù)值型變量(數(shù)值型數(shù)據(jù)),如身高, 170cm。數(shù)據(jù)的搜集數(shù)據(jù)搜集方法:二手?jǐn)?shù)據(jù):網(wǎng)絡(luò)、年鑒、報紙、白皮書、研究報告、咨詢機(jī)構(gòu)的調(diào)研報告;一手?jǐn)?shù)據(jù):觀察、訪談、問卷調(diào)查(自填式、面訪式、電話式)、實驗。收集一手?jǐn)?shù)據(jù)時,由于人力物力財力的限制,很難窮盡所有的研究對象(普查),只能抽取量

2、一定的研究對象,構(gòu)成樣本。 借助樣本的信息,推斷總體的狀況。但樣本畢竟不等于總體,兩者的差別稱為抽樣誤差。增加樣本的容量以及采用不同的抽樣方法能一定程度降低誤差,但誤差不能根除。按照抽樣過程是否受主觀的因素的影響,分為概率抽樣 (客觀抽樣)和非概率抽樣(主觀抽樣) 。概率抽樣具體分為:簡單隨機(jī)抽樣;分層抽樣;系統(tǒng)抽樣(等距隨機(jī)抽樣) ;整群抽樣(抽樣以群體為單位,如華軟學(xué)院被抽中了,則全院的教師和學(xué)生都成為樣本) ;多階段抽樣(每階段隨機(jī)抽取樣本既可以是以個體為單位,又可以是以群體為單位) 。概率抽樣的實施必須找到清晰的抽樣框,也就是研究對象的總體界限必須明確, 實際中大部分研究的對象包含哪些

3、并不明確,轉(zhuǎn)而采用非概率抽樣。非概率抽樣第1頁共6頁具體分為:方便抽樣;配額抽樣;判斷抽樣;自愿樣本;滾雪球抽樣。非概率抽樣的耗時短,成本低,無需確定抽樣框,但是樣本質(zhì)量不高,不能有效推斷總體的狀況,只能起到了解總體概況的作用。數(shù)據(jù)的誤差: 兩類型的來源抽樣誤差與非抽樣誤差。采用概率抽樣的方法能減少抽樣誤差。非抽樣誤差包括:抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測量誤差。數(shù)據(jù)的圖表展示頻數(shù):條形圖(每組頻數(shù)的統(tǒng)計可以借助Excel 的數(shù)據(jù)透視表模塊實現(xiàn))比例:餅圖變化趨勢:折線圖X 與 Y 的關(guān)系:散點(diǎn)圖數(shù)據(jù)的分布狀況:直方圖,先將數(shù)值型數(shù)據(jù)排序,然后分組(組中距和組數(shù)),畫條形,條形

4、之間沒有間隔,勾畫出該組數(shù)據(jù)的全貌。數(shù)據(jù)的概括性度量(一)集中趨勢眾數(shù):頻數(shù)最多的組對應(yīng)的指標(biāo)值中位數(shù):處于中間位置的數(shù)據(jù)。步驟排序;定位(50%位置);抽取數(shù)值。平均數(shù):數(shù)據(jù)質(zhì)量高,但易受極端值的影響。類型簡單平均數(shù);加權(quán)平均數(shù)(結(jié)合例題 P95 習(xí)題 4.5);幾何平均數(shù)(平均增長率、平均盈利率)。(二)離散趨勢指標(biāo)異眾比率:非眾數(shù)對應(yīng)的頻數(shù)除以總頻數(shù)極差(全距):最大值 -最小值四分位差: 3rd 四分位數(shù) -1st 四分位數(shù)平均差:( mean deviation)每一數(shù)據(jù)與平均數(shù)的差的絕對值,再求和, 最后求平均數(shù) (用nXiX得比較少)。 M di 1n第2頁共6頁nX ) 22(

5、 X i方差:SDi 1,記得一般提供的是樣本數(shù)據(jù),分母是n-1,到了后面的n1n( XiX )2章節(jié) n-1 稱為自由度??傮w數(shù)據(jù)的話,2 = i 1。n標(biāo)準(zhǔn)差:方差的開方,由于標(biāo)準(zhǔn)差與原始數(shù)據(jù)同一個等級,帶單位。標(biāo)準(zhǔn)差系數(shù)(離散系數(shù)):用于比較多組數(shù)據(jù)離散(波動)程度的差異。由于離散系數(shù)SD能克服各組數(shù)據(jù)單位的差別以及平均值的差異,所得結(jié)論更為精確。v S =。X(三)數(shù)據(jù)分布指標(biāo):偏態(tài)和峰態(tài)偏態(tài)系數(shù)SK, SK>0 右偏, SK<0 左偏, SK=0 無偏。 SK>1 ,嚴(yán)重右偏; SK<-1 ,嚴(yán)重左偏。這里要注意繪圖,如右偏,長尾巴在右,高峰在左,則眾數(shù)<

6、;中位數(shù) <平均數(shù)。峰態(tài)系數(shù) >0,則分布形狀又高又窄;峰態(tài)系數(shù)<0,則分布形狀又矮又寬。指數(shù)指數(shù)反映的是某指標(biāo)隨時間推移的變化。 經(jīng)濟(jì)管理中, 生產(chǎn)者關(guān)注銷售量變化, 消費(fèi)者關(guān)注價格變化, 因此,常見的指數(shù)包括銷售量指數(shù)和價格指數(shù)。實際情況下,要合并幾種不同種類產(chǎn)品的價格或銷售量,但每種產(chǎn)品的價格、銷售量的單位都不相同,需要借助銷售額的形式進(jìn)行合并,所求指數(shù)稱“加權(quán)綜合指數(shù)” 。加權(quán)綜合指數(shù)的計算步驟為“先綜合(求和, pq),后對比(作差或作商;作差稱為絕對指數(shù),帶單位;作商稱為相對指數(shù),不帶單位)”。加權(quán)綜合指數(shù)中, 為了分離價格的變化, 研究者需要將銷售量固定在相同的

7、時期 (此時銷售量稱為同度量因素) 。如果選擇固定在基期( q0),該加權(quán)綜合指數(shù)稱為拉氏指數(shù);如果選擇固定在報告期(q1),該加權(quán)綜合指數(shù)稱為帕(派)氏指數(shù)。分離銷售量的變化時,則將價格固定即可。對于指數(shù)的因素分析過程,p0q0 變?yōu)?p1q1,研究者規(guī)定,先量變(銷售量的影響,p0q0變?yōu)?p0q1),后質(zhì)變(價格的影響,p0q1 變?yōu)?p1q1)。抽樣分布研究者用概率抽樣的方法獲得代表性高的樣本,重復(fù)N 次抽樣后獲得N 個樣本,每個第3頁共6頁樣本包含n 個元素( n 稱為樣本容量)計算出X ,這些 X 構(gòu)成的分布稱為“抽樣分布”。抽樣分布的形狀根據(jù)以下規(guī)則判斷:總體分布為正態(tài),則抽樣分

8、布為正態(tài)分布;總體分布狀況為偏態(tài)或未知,如果樣本容量n>30,則抽樣分布趨近于正態(tài)分布(此定理稱 “中心極限定理” );如果 n<30,則抽樣分布形狀未能確定。抽樣分布的數(shù)量估計關(guān)系緊記下列兩條公式:X=,X=n區(qū)間估計理論上研究者用N 個樣本的均值去推斷總體的均值和標(biāo)準(zhǔn)差,現(xiàn)實由于人力物力財力的限制, 研究者大都用一個樣本均值推斷總體均值。但是 X 只會落在 附近,做出 X =的推斷未免太絕對了,因而研究者圍繞 X (以 X 為對稱軸)構(gòu)造一個區(qū)間 X -ZX , X +ZX ,這個區(qū)間包含 ,作出這個結(jié)論的把握為95%,95%稱為置信水平,22另外 1-95%=5% 則稱為 錯

9、誤, ZX 稱為允許誤差(邊際誤差、估計誤差) 。2假設(shè)檢驗假設(shè)包括原假設(shè)H 0 和研究(備擇)假設(shè)H 1,兩者是對立的關(guān)系,因此檢驗的時候只需檢驗其中一個即可,一般選擇H 0。檢驗 H 0 的時候,存在錯誤是難免的,只是這個錯誤比較小,在研究者可承受的范圍內(nèi)即可。這里規(guī)定了兩種類型的錯誤:第類錯誤,也稱錯誤(棄真),當(dāng) H 0 正確時,研究者拒絕了H 0,犯錯了,此時的錯誤為 錯誤;第類錯誤,也稱 錯誤(取偽),當(dāng) H0 錯誤時,研究者接受了H0,犯錯了,此時的錯誤為錯誤。根據(jù)題目寫假設(shè),按照英語的思維:H0, but H I ,H1 由研究者提出,研究者通常會做抽樣的工作,當(dāng)題目陳述樣本情

10、況時,則是研究者的觀點(diǎn)(H 1),之前的內(nèi)容就是H0。建議先寫 H 0,再寫 H1,因為 H0 一般交代總體均值 狀況,寫假設(shè)只涉及 。如 H0: =1000,則H1: 1000。繼而進(jìn)行假設(shè)檢驗先繪制正態(tài)分布圖,然后標(biāo)記H 1 的區(qū)域(由于 H1 為研究者, 即少數(shù)人的觀點(diǎn),小塊面積。上述H 1: 1000,包含兩種情況, <1000,在正態(tài)分布圖的左側(cè), >1000,在正態(tài)分布圖的右側(cè),分別標(biāo)記H 1 的區(qū)域), H1 的區(qū)域同時也是H0 的拒第4頁共6頁絕區(qū)域。 X 定位,計算ZXi- X,與 Z 臨界值比較,這里需要區(qū)分雙側(cè)檢驗還是單側(cè)X檢驗。雙側(cè)的話, ZZ (左側(cè))或

11、ZZ (右側(cè))。單側(cè)情況,左側(cè)的話 Z - Z;而22右側(cè)則是 Z Z。一旦出現(xiàn)這些結(jié)果,做出結(jié)論,支持H1,拒絕 H0;反之亦然。方差分析n( Xi X )2(離均差平方和)方差 = i 1SS(均方)n-1=MSdf (自由度)數(shù)據(jù)的總的變異以總方差表示,總方差分解為兩個來源,一個是組間方差,另一個是組內(nèi)方差。 組間方差 ( MSB )表示自變量造成的影響(藥劑: A 、B、C、D),組內(nèi)方差 ( MSW )表示干擾因素造成的影響(同一組內(nèi)4 棵水稻苗高不相等,由于遺傳因素的影響造成,但遺傳因素不是本實驗探討的重點(diǎn),稱為干擾因素)。PK 兩個方差時作商,構(gòu)造出F 統(tǒng)計量,組間均方( MSB

12、)F組內(nèi)均方( MSW)。研究者預(yù)期,自變量造成的影響遠(yuǎn)大于干擾因素造成的影響,因此 F 越大越好,對應(yīng)只需要看F 值是否越過右側(cè)的臨界值Fcrit 即可。若F>Fcrit ,則 H1 成立。方差分析的H0 和 H 1 都比較固定。 H0: 1= 2= 3= 4(至少有3 組總體的平均值) ,H1: 1、 2、 3、 4 不全相等。可見,方差分析的目的就是檢驗3 組或以上的總體平均數(shù)是否相等,但是使用的途徑則是方差的分解以及F 統(tǒng)計量。方差分析有三個前提必須滿足:數(shù)據(jù)正態(tài)分布、 自變量是類別型 (自變量的取值或水平level )相互獨(dú)立、各組方差要齊性。具體解釋可查閱課本。相關(guān)與回歸分析

13、兩個變量的關(guān)系最簡單的考察方式是繪制散點(diǎn)圖,如果要精確地加以衡量,則需要使用相關(guān)系數(shù)或回歸系數(shù)。相關(guān)分析和回歸分析都是考察兩個變量的關(guān)聯(lián)程度,只是相關(guān)分析中兩變量 X(吸煙)與Y(肺癌)的影響方向是雙向的,屬于共變關(guān)系,不能確切地說哪個影響哪個;但回歸分析中明確規(guī)定由X (收入)影響Y (消費(fèi)),屬于典型的因果關(guān)系。分析不同的問題,我們將視情況選擇相關(guān)分析或回歸分析。相關(guān)系數(shù) r-1,1 ,正負(fù)號反映相關(guān)的方向,r>0 正相關(guān)表示X 與 Y 同方向變化,r<0第5頁共6頁負(fù)相關(guān)表示X 與 Y 反方向變化,r=0 零相關(guān)表示X 與 Y 不存在線性相關(guān)。其中,r=1 為完全正相關(guān), r

14、=-1 為完全負(fù)相關(guān)。相關(guān)系數(shù)的數(shù)值表示相關(guān)的程度大小,r 0.8 為高度(強(qiáng))相關(guān), 0.5 r<0.8 為中等相關(guān), 0.3r<0.5 為低度(弱)相關(guān)?;貧w方程y=B 1x+B 0,回歸系數(shù) B 1 表示當(dāng) x 變化一個單位時, y 平均變化 B1 個單位。(注意: r 和 B1 的計算公式的區(qū)別)而回歸直線與散點(diǎn)的擬合程度( fit ),則用判斷(可決)系數(shù) R2 表示,一般要求 R275%(越大越好) ,表示 100 個散點(diǎn)中,有75 個或以上的點(diǎn)落在直線附近,說明該直線能較好地代表散點(diǎn)的位置關(guān)系,或者說直線能較好地擬合這堆散點(diǎn)(擬合度高)。時間序列分析與預(yù)測時間序列指的是按時間先后順序排列的數(shù)據(jù),反映某指標(biāo)隨時間推移的變化規(guī)律,用于預(yù)測該指標(biāo)在未來一期或未來幾期的數(shù)值。指數(shù)雖然也是反映某指標(biāo)隨時間推移的變化趨勢(增加或減少),但其并不能用于預(yù)測未來一期的具體數(shù)值,其次不能還原指標(biāo)變化的具體過程(有可能是先增后減,然后過一段時間又重復(fù)先增后減的趨勢,總的來說呈現(xiàn)出增加的趨勢)。遇到增長率的問題,用連乘,然后減 1 計算累計增長率;對連乘結(jié)果開方(幾何平均數(shù)),然后減 1 計算平均增長率。時間序列按照波動幅度大小分為平穩(wěn)序列(波動幅度?。?和非平穩(wěn)序列 (波動幅度大) 。平穩(wěn)序列的預(yù)測通常用三種

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論