經(jīng)濟(jì)學(xué)統(tǒng)計(jì)學(xué)經(jīng)典真題及答案2003_第1頁
經(jīng)濟(jì)學(xué)統(tǒng)計(jì)學(xué)經(jīng)典真題及答案2003_第2頁
經(jīng)濟(jì)學(xué)統(tǒng)計(jì)學(xué)經(jīng)典真題及答案2003_第3頁
經(jīng)濟(jì)學(xué)統(tǒng)計(jì)學(xué)經(jīng)典真題及答案2003_第4頁
經(jīng)濟(jì)學(xué)統(tǒng)計(jì)學(xué)經(jīng)典真題及答案2003_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、人大統(tǒng)計(jì)學(xué)考研歷年真題精華版(98-10)2010年人大統(tǒng)計(jì)學(xué)專業(yè)課初試題2009年人大統(tǒng)計(jì)學(xué)專業(yè)課初試題一、有兩個(gè)正態(tài)總體,均值和方差未知,但已知方差相等。從第一個(gè)總體中抽取n=16的隨機(jī)樣本,均值為24,方差為64;從第二個(gè)總體中抽取n=36的隨機(jī)樣本,均值為20,方差為49。如何檢驗(yàn)第一個(gè)總體的均值是否大于第二個(gè)總體的均值?二、在何種情形下,回歸系數(shù)的最小二乘估計(jì)不具有無偏性?說出原因并指出解決辦法。三、周期過程,其中頻率和振幅都是常數(shù),而相位是一個(gè)在區(qū)間-,上服從均勻分布的隨機(jī)變量。問是否平穩(wěn)?說明原因。四、把一個(gè)總體分為三層,各層的權(quán)重和預(yù)估的比例見下表。待估計(jì)的參數(shù)為總體比例。如采

2、用奈曼分層抽樣,請說明需要多大的樣本容量才能與樣本容量為600的無放回簡單隨機(jī)抽樣有相同的估計(jì)量方差。(假設(shè)各層總體單位數(shù)量都充分大,忽略“有限總體校正系數(shù)”)層總體權(quán)重預(yù)估的層內(nèi)總體比例10.50.520.30.730.20.6五、與人大出版社21世紀(jì)統(tǒng)計(jì)學(xué)系列教材之統(tǒng)計(jì)學(xué)(第二版)第四章習(xí)題第10題是一樣的。六、若有線性回歸模型,其中,則(1)該模型是否違背古典線性回歸模型的假定?請簡要說明。(2)如果對該模型進(jìn)行估計(jì),你會(huì)采用什么方法?請說明理由。七、測試某種安眠藥效果,隨機(jī)選40只白鼠,將其隨機(jī)分為20對,再隨機(jī)分為兩組。第一組10對白鼠中每一對的兩只分別關(guān)在不同的籠中喂養(yǎng);第二組10

3、對白鼠中每一對的兩只關(guān)在同一個(gè)籠中喂養(yǎng)。每對白鼠中隨機(jī)抽取一只喂以實(shí)驗(yàn)的安眠藥,在三個(gè)不同的時(shí)間點(diǎn)記錄每只白鼠的活動(dòng)情況:吃藥后立即記錄,吃藥后一小時(shí)記錄,吃藥后兩小時(shí)記錄。對于不吃藥的白鼠,記錄時(shí)間與同一對中另外一只白鼠的記錄時(shí)間相同。假定40只白鼠的初始活動(dòng)狀態(tài)相同。請?jiān)敿?xì)闡述你用何種方法分析安眠藥的效果?八、某大學(xué)從教師中抽取一個(gè)隨機(jī)樣本進(jìn)行滿意度調(diào)查。1分表示非常不滿意,100分表示非常滿意。數(shù)據(jù)匯總?cè)缦卤?,欲分析教師職稱和性別對滿意度有無顯著性影響,則(1)你會(huì)選擇什么分析方法?簡述你的分析思路(可用公式說明,不需計(jì)算結(jié)果)。(2)要采用該分析方法,數(shù)據(jù)必須滿足哪些幾本假定?請加以說

4、明。職稱男女調(diào)查人數(shù)滿意度調(diào)查人數(shù)滿意度教授30883082副教授30833080講師307430752008年人大統(tǒng)計(jì)學(xué)專業(yè)課初試題一、(10分)07年香港一則報(bào)道說:“隨著經(jīng)濟(jì)的增長,香港低收入家庭的比例在增長,其中低收入的家庭是指低于中位數(shù)的家庭?!闭埬銖慕y(tǒng)計(jì)的角度對該報(bào)道做簡要評論。二、(10分)經(jīng)常有人說方差分析是比較多個(gè)總體的均值是否相同,但為什么叫方差分析呢?請談?wù)勀銓Ψ讲罘治龅睦斫?,并說明方差分析解決問題的基本思路。三、(10分)如果時(shí)間序列在隨時(shí)間變化的過程中既有趨勢又有季節(jié)變動(dòng),你認(rèn)為可以建立什么樣的預(yù)測模型?請你寫出模型形式并加以簡要說明。四、(30分)食品廠家說:凈含量

5、是每袋不低于250g。但有消費(fèi)者向消協(xié)反映不是250g,消協(xié)據(jù)此要求廠家自檢,同時(shí)消協(xié)也從中隨機(jī)抽取20袋檢驗(yàn)。 (1)如果廠家自己檢驗(yàn),你認(rèn)為提出什么樣的原假設(shè)和備擇假設(shè)?并說明理由; (2)如果從消費(fèi)者利益出發(fā),你認(rèn)為應(yīng)該提出什么樣的原假設(shè)和備擇假設(shè)?并說明理由; (3)消協(xié)抽取20袋,數(shù)據(jù)如下(略),得p值為0.4297,在=0.5的顯著水平下,檢驗(yàn)假設(shè)意味著什么?p值的含義是什么?(4)據(jù)樣本數(shù)據(jù)得該食品每袋平均重量95%置信區(qū)間(241.1,257.5),你認(rèn)為這種食品實(shí)際平均重量是否在該區(qū)間?為什么?五、(15分)在經(jīng)典的多元線性回歸模型里,針對自變量事實(shí)上是有許多假設(shè)的。(1)請

6、具體指明這些假設(shè)有哪些?(2)說明這些假設(shè)所發(fā)揮的主要作用;(3)請討論這些假設(shè)最終產(chǎn)生的影響。六、(15分)在有關(guān)統(tǒng)計(jì)知識方面內(nèi)容的中學(xué)課本里編者認(rèn)為基本的抽樣方式只有三種,并不包括整群抽樣,請說明你贊同與否并詳列理由。七、(30分)敘述貝葉斯判別分析的原理(包括完整的假設(shè))并說明:(1)與聚類分析相比,貝葉斯判別分析賴以進(jìn)行的數(shù)據(jù)結(jié)構(gòu)有何特點(diǎn)?(2)與其他判別分析相比,貝葉斯判別分析結(jié)果的表現(xiàn)形式有何不同?八、(30分)在諸如大壩、碼頭等工程設(shè)計(jì)中,壩高和碼頭高度的確定十分關(guān)鍵,要考慮許多因素。(1)以大壩為例,概略說明需考慮的主要因素;(2)大壩高度通常利用長期洪水歷史記錄數(shù)據(jù),依據(jù)幾十

7、年一遇的標(biāo)準(zhǔn)確定,請寫出計(jì)算壩高詳細(xì)的具體步驟。(畫出框圖,并盡量避免過多使用文字)2007年人大統(tǒng)計(jì)學(xué)專業(yè)課初試題一、(20分)下面是一種零件誤差的數(shù)據(jù)(單位:克):6.1 4.7 6.5 6.2 7.76.4 5.5 7.1 6.1 5.35.7 6.1 5.3 4.0 4.83.2 3.9 1.9 4.9 3.85.3 2.6 5.3 5.5 5.82.7 6.8 7.4 5.6 3.3 (1)根據(jù)涉及t分布的計(jì)算,該數(shù)據(jù)所代表的總體均值的95%置信區(qū)間為(4.637785,5.728882)。請問,若使該置信區(qū)間有意義,需要對總體進(jìn)行何等假定?這種假定能不能用數(shù)據(jù)證明?是不是該區(qū)間以0

8、.95的概率覆蓋真實(shí)總體均值?如果不是,說出理由及合適的說法; (2)對于該數(shù)據(jù)所代表的總體的均值進(jìn)行檢驗(yàn):零假設(shè)為總體均值等于4.8克,備選假設(shè)為總體均值大于4.8克。如果進(jìn)行t檢驗(yàn),需要假定哪些條件?t檢驗(yàn)結(jié)果為p值等于0.0807。能不能說“在顯著性水平為0.05時(shí),接受零假設(shè)”?為什么?你的結(jié)論是什么?二、(20分)一家研究機(jī)構(gòu)想估計(jì)在30個(gè)網(wǎng)絡(luò)公司工作的員工每周加班的平均時(shí)間,為此進(jìn)行抽樣調(diào)查。請回答以下問題: (1)如果對這些員工進(jìn)行隨機(jī)電子郵件調(diào)查,由答復(fù)的郵件所得到的數(shù)據(jù)是不是簡單隨機(jī)樣本?為什么? (2)抽樣調(diào)查中,說“響應(yīng)誤差總是人們不說實(shí)話導(dǎo)致的”對不對?為什么?隨機(jī)誤差

9、是不是可以避免的? (3)這些員工的加班時(shí)間是否獨(dú)立?如果不是,原因可能是什么? 三、(20分)某城市交通管理部門的一項(xiàng)調(diào)查表明,該城市中駕車上班的人數(shù)超過30%。但一家研究機(jī)構(gòu)則認(rèn)為自駕車上班的人數(shù)比例達(dá)不到這一水平。為證明自己的這一看法,該研究機(jī)構(gòu)準(zhǔn)備抽取一個(gè)簡單的隨機(jī)樣本進(jìn)行檢驗(yàn)。 (1)請寫出檢驗(yàn)的原假設(shè)和備擇假設(shè); (2)請對小樣本情況寫出計(jì)算p值的公式,并論述你所依賴的分布。對大樣本情況,寫出檢驗(yàn)統(tǒng)計(jì)量的公式以及使該統(tǒng)計(jì)量有意義所需要的假定的條件; (3)對于一般檢驗(yàn)來說,如果結(jié)果表明“統(tǒng)計(jì)上顯著”,是不是實(shí)際上也顯著? 四、(10分)在對某項(xiàng)產(chǎn)品的認(rèn)可的抽樣調(diào)查報(bào)告中,如果報(bào)告僅

10、僅說,“對該產(chǎn)品認(rèn)可的有90%”,那么該報(bào)告是否負(fù)責(zé)?一個(gè)負(fù)責(zé)任的調(diào)查報(bào)告應(yīng)該給什么有關(guān)信息? 五、(10分)對于主成分分析,有人在進(jìn)行了主成分分析之后,對得到的主成分又進(jìn)行了第二次主成分分析,以得到更加精確的結(jié)果。請問,這樣做是否有道理?請加以說明。什么樣的數(shù)據(jù)不適宜于主成分分析?選擇那些主成分累計(jì)方差貢獻(xiàn)率為70-80%之類的準(zhǔn)則是不是總是適用?為什么? 六、(20分)回歸模型y=0+1x1+2x2+pxp+中的一定是隨機(jī)誤差嗎?如果回答是否定的,討論在何種情況下,答案是肯定的?此外,最小二乘回歸是不是需要對誤差項(xiàng)作出假定?如果不是,那么在什么情況下需要對誤差項(xiàng)作出假定?作什么假定? 七、

11、(25分)對于聚類分析,請回答以下問題: (1)分層聚類前,需要對什么進(jìn)行選擇? (2)描述分層聚類分析的詳細(xì)步驟; (3)描述k均值(快速)聚類分析的詳細(xì)步驟。 八、(25分)應(yīng)用多元線性回歸模型y=0+1x1+2x2+pxp+,如果一個(gè)spss回歸分析的結(jié)果如下表所示:anovamodelsum of squaresdfmean squarefsig.1regressionresidualtotal106831048750.12431085446686.216137916495436.340 1472473106831048750.12465858997.2171622.118.000a2

12、regressionresidualtotal111136313278.11826780182158.221137916495436.340 2471473 55568156639.05956858136.217997.312.000ba. predictors:(constant),beginning salaryb. predictors:(constant),beginning salary,employment category則:(1)表中所用選擇自變量的方法可能是什么?(2)表中的最后一個(gè)sig.如何求得?意義是什么?(3)請給出該表最后一個(gè)f所表示的統(tǒng)計(jì)量服從f分布所需要的假定條

13、件,并對該統(tǒng)計(jì)量服從f分布予以證明。2006年人大統(tǒng)計(jì)專業(yè)課初試題一、(20分)某銀行為縮短到銀行辦理業(yè)務(wù)等待的時(shí)間,準(zhǔn)備采用兩種排隊(duì)方式進(jìn)行試驗(yàn):一種是所有顧客都進(jìn)入一個(gè)等待隊(duì)列;另一種是顧客在三個(gè)業(yè)務(wù)窗口處列隊(duì)三排等待。為比較那種排列方式使顧客等待的時(shí)間更短,兩種排隊(duì)方式各隨機(jī)抽取9名顧客,得到第一種排隊(duì)方式的平均等待時(shí)間為7.2分鐘,標(biāo)準(zhǔn)差為1.97分鐘,第二種排隊(duì)方式的等待時(shí)間(單位:分鐘)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 (1)畫出第二種排隊(duì)方式等待時(shí)間的莖葉圖; (2)比較兩種排隊(duì)方式等待時(shí)間的離散程度; (3)如果讓你選擇一種排隊(duì)方式,

14、你會(huì)選擇哪一種?試說明理由。 二、(20分)某企業(yè)生產(chǎn)的袋裝食品采用自動(dòng)打包機(jī)包裝,每袋標(biāo)準(zhǔn)重量為100克。現(xiàn)從某天生產(chǎn)的一批產(chǎn)品中按重量重復(fù)抽樣方式隨機(jī)抽取50包進(jìn)行檢查,測得每包重量(單位:克)如下:每包重量/g包數(shù)96-9898-100100-102102-104104-106 2 3 34 7 4合計(jì) 50已知食品包重量服從正態(tài)分布,要求: (1)確定該種食品平均重量95%的置信區(qū)間; (2)如果廠家認(rèn)為每袋食品重量不低于100克,請寫出檢驗(yàn)的原假設(shè)和備擇假設(shè); (3)利用p值進(jìn)行檢驗(yàn)和利用統(tǒng)計(jì)量進(jìn)行檢驗(yàn)有什么不同? (z0.05=1.645, z0.025=1.96,t0.05=1.

15、69,t0.025=2.03) 三、(20分)一家汽車制造商準(zhǔn)備購進(jìn)一批輪胎,考慮的因素主要有輪胎供應(yīng)商牌和耐磨程度。為了對耐磨程度進(jìn)行測試,分別在低速(40公里/小時(shí)),中速(80公里/小時(shí)),高速(120公里/小時(shí))下進(jìn)行測試。根據(jù)對5家供應(yīng)商抽取的輪胎隨機(jī)樣本對輪胎在行駛1000公里后磨損程度進(jìn)行試驗(yàn),在顯著水平=0.01下得到的有關(guān)結(jié)果如下:差異源ssdfmsfp-valuef crit行列誤差總計(jì)1.553.480.145.17 4 2 8 140.391.740.0221.7297.680.0002360.0000027.018.65(1)不同的車速對磨損程度是否有顯著影響?(2)

16、不同供應(yīng)商的輪胎之間磨損程度是否顯著差異?(3)在上面的分析中,你都做了哪些假設(shè)?四、(15分)說明什么條件下適合采取簡單隨機(jī)抽樣? 五、(25分)說明回歸模型的假設(shè)以及當(dāng)這些假設(shè)不成立時(shí)的應(yīng)對方法。 六、(20分)解釋因子模型x=af+的意義并寫出模型的假設(shè)。七、(15分)以下是從中國統(tǒng)計(jì)年鑒-2005摘引的資料,要求:單位:元/人2003年2004年人均國內(nèi)生產(chǎn)總值 城鎮(zhèn)居民人均可支配收入農(nóng)村居民人均純收入91118472262210561 9422 2936 (1)根據(jù)國民經(jīng)濟(jì)收入分配核算原理,說明居民人均收入低于人均gdp水平的原因; (2)計(jì)算各指標(biāo)的動(dòng)態(tài)變動(dòng)率(不考慮價(jià)格變化),對

17、其結(jié)果予以簡要分析。 八、(15分)下表是中國全部國有及規(guī)模以上非國有供企業(yè)統(tǒng)計(jì)的主要指標(biāo),要求: (1)設(shè)計(jì)并計(jì)算反映企業(yè)經(jīng)濟(jì)效益的指標(biāo); (2)對經(jīng)濟(jì)效益指標(biāo)的動(dòng)態(tài)變化狀況做簡要分析。2003年2004年工業(yè)總產(chǎn)值(億元)工業(yè)增加值(億元)企業(yè)單位數(shù)(個(gè))資產(chǎn)總計(jì)(億元)流動(dòng)資產(chǎn)年平均余額(億元)固定資產(chǎn)凈值年平均余額(億元)負(fù)債合計(jì)(億元)產(chǎn)品銷售收入(億元)產(chǎn)品銷售成本(億元)產(chǎn)品銷售稅金及附加(億元)利潤總額(億元)本年應(yīng)繳增值稅(億元)全部從業(yè)人員年平均人數(shù)(萬人)142271 41990196222168808 71488 66008 73414143172118638 2049

18、 8337 5488 5749187221 54805219463195262 86885 73849115529187815157071 2467 11342 6396 60992005年人大統(tǒng)計(jì)專業(yè)課初試題一、(15分)一家網(wǎng)吧想了解上網(wǎng)人員的年齡分布狀況,隨機(jī)抽取25人,得到他們的年齡數(shù)據(jù)如下:15 19 22 24 3016 19 22 24 3117 20 23 25 3418 20 23 27 3819 21 23 29 41 (1)畫出該組數(shù)據(jù)的莖葉圖; (2)畫出該組數(shù)據(jù)的箱線圖; (3)根據(jù)莖葉圖和箱線圖說明上網(wǎng)者年齡分布的特征。二、(15分)設(shè)有三個(gè)總體的均值分別為:1,2

19、,3。要檢驗(yàn)三個(gè)總體的均值是否相等(=0.05),我們?yōu)槭裁床幌葘⑺鼈兒唵蔚嘏鋵?,即h0:1=2,h0:1=3,h0:2=3,然后分別進(jìn)行檢驗(yàn),而是采用方差分析的方法? 三、(20分)某城市的餐飲管理協(xié)會(huì)估計(jì),餐館的月平均用水量為100噸,一家研究機(jī)構(gòu)認(rèn)為實(shí)際用水量要高于這個(gè)數(shù)字,該研究機(jī)構(gòu)隨機(jī)抽取了36家餐館,記錄了每個(gè)餐館的月用水量(單位:噸),經(jīng)過初步計(jì)算得到樣本數(shù)據(jù)的部分描述統(tǒng)計(jì)量如下:平均 107標(biāo)準(zhǔn)誤差 4.99樣本標(biāo)準(zhǔn)差 29.96樣本方差 897.77 (1)確定餐館月平均用水量95%的置信區(qū)間; (2)餐館實(shí)際月平均用水量在你所建立的置信區(qū)間里嗎?請說明原因; (3)如果要檢

20、驗(yàn)研究機(jī)構(gòu)的看法是否正確,應(yīng)該如何建立原假設(shè)和備擇假設(shè)?請談?wù)劸芙^和不拒絕原假設(shè)的含義; (4)在上面的估計(jì)和檢驗(yàn)中,你使用了統(tǒng)計(jì)中的哪一個(gè)重要定理?請簡要解釋這一定理。 (z0.05=1.645, z0.025=1.96,t0.05=1.69,t0.025=2.03)四、(20分)一家房地產(chǎn)評估公司想對某城市的房地產(chǎn)銷售價(jià)格(y)與地產(chǎn)評估價(jià)值(x1)、房產(chǎn)評估價(jià)值(x2)和使用面積(x3)建立一個(gè)模型,以便對銷售價(jià)格做合理預(yù)測。為此,收集了15棟住宅的房地產(chǎn)評估數(shù)據(jù),經(jīng)回歸得到下面的有關(guān)結(jié)果(=0.05): 方差分析dfssmsfsignificance f回歸 370090029.082

21、3363343.0348.620.00殘差11 5285944.25 480540.39總計(jì)1475375973.33coefficient標(biāo)準(zhǔn)誤差t statp-valueintercept207.9037617.04860.33690.7425x variable 1 1.4378 0.56452.54720.0271x variable 2 0.8545 0.26633.20910.0083x variable 3 0.0626 0.06560.95380.3607(1)寫出銷售價(jià)格對地產(chǎn)評估價(jià)值、房產(chǎn)評估價(jià)值、使用面積的多元線性回歸方程,并解釋各回歸系數(shù)的意義;(2)檢驗(yàn)回歸方程的線性

22、關(guān)系是否顯著;(3)檢驗(yàn)各回歸系是否顯著;(4)計(jì)算多重判定系數(shù)r2,并說明它的實(shí)際意義;(5)計(jì)算估計(jì)標(biāo)準(zhǔn)誤差sy,并說明它的實(shí)際意義;(6)你認(rèn)為使用面積(x3)在預(yù)測銷售價(jià)格時(shí)是否有用?試說明理由。五、(42分)假設(shè)一個(gè)已知簡單總體的全部真實(shí)數(shù)據(jù)列于下表:編號1 2 3 4 5 6 7 8 99.3 1.8 1.9 1.7 1.5 1.3 1.4 2.0 1.9(1)繪出散點(diǎn)圖;(2)如果根據(jù)的數(shù)值將總體分成兩個(gè)子總體,最好的分發(fā)是什么?(3)舉例說明上表數(shù)據(jù)所反映的現(xiàn)象可能是什么?(4)計(jì)算出的總體均值和總體方差s2;(5)四種基本抽樣方式中最不適合上述總體情形的是哪一種?并說明理由;

23、(6)對其余三種基本抽樣方式,假定n=2,分別列出每一種方式所對應(yīng)的全部可能樣本,并計(jì)算樣本均值的數(shù)學(xué)期望和方差;(7)計(jì)算每一種方式在此情形下的設(shè)計(jì)效應(yīng),并說明其意義。六、(8分)說明抽樣里的回歸估計(jì)與一般回歸分析方法的聯(lián)系與區(qū)別。七、(6分)請解釋下面的說法:“生產(chǎn)核算的范圍決定了收入分配和收入使用核算的范圍”。 八、(9分)a、b兩個(gè)地區(qū)的貧困線均為年收入1000元。a地區(qū)有11%的人年收入900元,9%的人年收入200元;b地區(qū)有1%的人年收入900元,9%的人年收入500元。 (1)根據(jù)上述數(shù)據(jù),計(jì)算兩地區(qū)的貧困者比重和貧困深度;(2分) (2)請根據(jù)貧困者比重和貧困深度對兩地區(qū)貧困

24、狀況進(jìn)行簡要的比較分析;(4分) (3)你覺得這兩個(gè)指標(biāo)能夠準(zhǔn)確反映兩地區(qū)貧困狀況的差異嗎?如果不能,應(yīng)當(dāng)如何改進(jìn)?(3分) 九、(15分)下面是某國某核算年度的國際收支平衡表(單位:億元):一、經(jīng)常賬戶差額 a、貨物與服務(wù) b、收益 c、經(jīng)常轉(zhuǎn)移二、資本與金融賬戶 a、資本賬戶b、金融賬戶三、儲備資產(chǎn)四、誤差與遺漏205230( )-65( )-40( ) -125-10 (1)在表中括號內(nèi)填上適當(dāng)?shù)臄?shù)字;(3分) (2)請解釋儲備資產(chǎn)所對應(yīng)的-125億元的含義;(3分) (3)請根據(jù)表中數(shù)字分析該國國內(nèi)生產(chǎn)總值、國民總收入和國民可支配收入三者之間的關(guān)系;(6分) (4)根據(jù)表中數(shù)字,對于該

25、國當(dāng)年國內(nèi)的投融資狀況你能得出何種結(jié)論?(3分)2004年人大統(tǒng)計(jì)專業(yè)課初試題本試卷分為兩部分,一部分為必答題,計(jì)105分,一部分為選答題,計(jì)45分。第一部分 必答題1.(25分)下面是a、b兩個(gè)班學(xué)生的數(shù)學(xué)考試成績數(shù)據(jù):a班:55 76 66 85 75 62 79 73 93 7667 85 74 61 78 71 92 79 65 8373 57 77 70 90 75 63 81 73 96b班:34 71 56 90 66 48 81 58 96 7155 85 62 44 79 57 95 68 54 8461 39 73 57 94 68 51 82 61 100(1)將兩個(gè)班的

26、考試成績用一個(gè)公共的莖制成莖葉圖,比較兩個(gè)班考試成績分布的特點(diǎn);(2)兩個(gè)班考試成績的描述統(tǒng)計(jì)量如下,試進(jìn)行比較分析:a班b班平均 75中位數(shù) 75眾數(shù) 73標(biāo)準(zhǔn)偏差 10.44樣本方差 108.90峰值 -0.35偏斜度 0.11極差 41最小值 55最大值 96平均 68中位數(shù) 67眾數(shù) 57標(biāo)準(zhǔn)偏差 17.64樣本方差 311.10峰值 -0.76偏斜度 0.11極差 66最小值 34最大值 100(3)要判斷考試成績是否有離群點(diǎn),可使用哪些方法?(4)要判斷考試成績是否服從正態(tài)分布,可使用那些描述性方法?2.(25分)某企業(yè)準(zhǔn)備用三種方法組裝一種新的產(chǎn)品,為確定哪種方法每小時(shí)生產(chǎn)的產(chǎn)品

27、數(shù)量最多,隨機(jī)抽取了30名工人,并指定每人使用其中的一種方法。通過excel進(jìn)行方差分析得到下面的部分結(jié)果:方差分析表差異源ssdfmsfp-valuef crit組間2100.2459463.354131組內(nèi)3836總計(jì)29(1)完成上面的方差分析表;(2)若顯著性水平=0.05,檢驗(yàn)三種方法組裝的產(chǎn)品數(shù)量之間是否有顯著性差異;(3)在上面的方差分析中包含了哪些基本假定?(4)簡述多重比較的前提和作用。3.(20分)一袋中有黑、白兩種球,p表示白球所占的比例,待檢驗(yàn)假設(shè)為h0:p=1/2;h1:p=1/5。 從袋中任取4個(gè)球(放回抽樣),當(dāng)白球數(shù)小于2時(shí),拒絕原假設(shè)。試給出以下內(nèi)容: (1)

28、總體及其分布;(2)樣本量n;(3)拒絕域;(4)第一類錯(cuò)誤的概率。4.(15分)試舉例說明方差分析中效應(yīng)的意義和用效應(yīng)如何表達(dá)它的數(shù)學(xué)模型。5.(20分)試證明正態(tài)線性回歸模型其回歸系數(shù)的最大似然估計(jì)與最小二乘估計(jì)相同。 第二部分 選答題(在下面五道題中任選三道題)6.(15分)下表是中國1992和2002兩個(gè)年份國民經(jīng)濟(jì)核算的部分資料。要求: (1)根據(jù)資料,計(jì)算反映經(jīng)濟(jì)發(fā)展?fàn)顩r的基本總量指標(biāo)和結(jié)構(gòu)比例指標(biāo); (2)根據(jù)計(jì)算結(jié)果,對10年間中國經(jīng)濟(jì)發(fā)展特征及其變化予以簡要說明。中國國民經(jīng)濟(jì)核算有關(guān)資料 單位:億元1992年2002年第一產(chǎn)業(yè)增加值第二產(chǎn)業(yè)增加值第三產(chǎn)業(yè)增加值最終消費(fèi)貨物服務(wù)

29、凈出口來自國外要素收入凈額平均人口總數(shù)(億人)5800117009138159522761411.64161175354035133623652794-123712.807.(15分)2003年7月,中央政府和香港特區(qū)政府簽定了簡稱cepa的內(nèi)地與香港關(guān)于建立更緊密經(jīng)貿(mào)關(guān)系的安排。其中內(nèi)容之一是自2004年起,273種香港原產(chǎn)貨物進(jìn)入內(nèi)地市場實(shí)行零關(guān)稅;內(nèi)容之二是放寬香港企業(yè)對內(nèi)地投資的限制,包括投資的行業(yè)、注冊資本數(shù)額和資質(zhì)條件等。可以預(yù)見,由此將大大促進(jìn)香港對內(nèi)地的貿(mào)易和投資活動(dòng)。要求:根據(jù)上述貿(mào)易和投資兩方面的內(nèi)容,應(yīng)用國際收支平衡表原理,說明中國未來國際收支所產(chǎn)生的影響。(說明:根據(jù)目

30、前中國國民經(jīng)濟(jì)核算,仍將香港作為“非常住單位”,即作為“境外”看待。)8.(15分)假定某地區(qū)人口和勞動(dòng)力就業(yè)統(tǒng)計(jì)數(shù)據(jù)如下表所示,要求: (1)計(jì)算有關(guān)指標(biāo),描述該地區(qū)人口基本結(jié)構(gòu)狀況; (2)計(jì)算有關(guān)指標(biāo),描述該地區(qū)人口變動(dòng)狀況; (3)計(jì)算有關(guān)指標(biāo),描述該地區(qū)勞動(dòng)就業(yè)狀況。單位:萬人指標(biāo)數(shù)值年末常住人口數(shù) 其中:女性人口數(shù) 其中:15歲及以上人口數(shù) 其中:城市人口數(shù)其中:文盲人口數(shù)當(dāng)年平均常住人口數(shù)當(dāng)年出生人口數(shù)當(dāng)年死亡人口數(shù)當(dāng)年凈遷出人口數(shù)年末社會(huì)勞動(dòng)力資源總數(shù)年末就業(yè)人數(shù)年末失業(yè)人數(shù)128462399050211512802791986860559.(15分)對(30)的1000元3年

31、定期壽險(xiǎn),死亡年末給付,保費(fèi)在兩年內(nèi)每年繳一次。已知預(yù)定利率為5%,q30=0.02,q31=0.03,q32=0.04,假設(shè)費(fèi)用發(fā)生在保年初,各年費(fèi)用為:年份 每份保單 每1000元保額 占總保費(fèi)的比例1 10 2.5 0.102 5 1.0 0.053 5 1.0 賠付處理費(fèi)發(fā)生在死亡年末,每1000保額為10元,假設(shè)有退保。計(jì)算: (1)每年總保費(fèi); (2)第一年在總保費(fèi)下的責(zé)任準(zhǔn)備金。10.(15分)某人在25歲時(shí)計(jì)劃每年初存入200元建立個(gè)人賬戶,如果他在60歲退休,存款利率假設(shè)恒定為4%。 (1)求退休時(shí)個(gè)人賬戶的累計(jì)額; (2)如果個(gè)人賬戶累計(jì)額在退休后以固定年金方式在30年內(nèi)每

32、月領(lǐng)取一次,求每月可以領(lǐng)取的數(shù)額。2003年人大統(tǒng)計(jì)專業(yè)課初試題一、(15分)考慮兩個(gè)國家之間按gdp進(jìn)行經(jīng)濟(jì)比較。假定在既定匯率水平上,甲國gdp與乙國gdp之間的比例為1:20。一場金融危機(jī)放生之后,如果甲國貨幣相對乙國貨幣貶值了50%,那么,在新的匯率水平上,兩國gdp之間的比例將變化為1:40。請問:我們能否根據(jù)比較結(jié)果說甲國的經(jīng)濟(jì)發(fā)展水平下降了50%?這種比較所包含的統(tǒng)計(jì)方法問題是什么? 二、(15分)假定一時(shí)期國際收支平衡表上“儲備資產(chǎn)變動(dòng)”一項(xiàng)為正差額100億元,據(jù)此,應(yīng)用國際收支平衡表原理判斷當(dāng)期國際收支的順、逆差狀況。 三、(30分)以下是某經(jīng)濟(jì)總體1985和2001兩年份城

33、鎮(zhèn)居民住戶部門的調(diào)查資料。要求: (1)列表計(jì)算各年城鎮(zhèn)住戶部門的原始收入、可支配收入和最終消費(fèi)支出;(15分) (2)計(jì)算有關(guān)指標(biāo),比較說明城鎮(zhèn)居民住戶部門經(jīng)濟(jì)活動(dòng)特征的變化。(15分)1985年2001年?duì)I業(yè)盈余(經(jīng)營凈收入)10400各種收入:1.工資及補(bǔ)貼收入2.其他勞動(dòng)收入3.利息紅利收入4.其他財(cái)產(chǎn)收入5.養(yǎng)老金和離退休金收入6.社會(huì)救濟(jì)收入7.其他轉(zhuǎn)移收入8.借貸收入9.出售資產(chǎn)收入549 63 3 1 50 32 18 25 124277 422 101 133 805 321 547 123 143各種支出:1.食品支出2.衣著支出3.醫(yī)療教育交通通訊支出4.居住及家庭耐用消

34、費(fèi)品支出5.購房和建房支出6.交納各種社會(huì)保障基金7.交納所得稅8.其他各種轉(zhuǎn)移支出9.借貸支出351 98 86137 22 0 0 10 592014 53314901271 903 324 75 52 608四、(30分)一家種業(yè)開發(fā)股份公司研究出三個(gè)新的小麥品種:品種一、品種二、品種三。公司為研究不同品種對產(chǎn)量的影響,選擇了四個(gè)面積相同的地塊進(jìn)行試驗(yàn),分別為:地塊一、地塊二、地塊三、地塊四。經(jīng)過試驗(yàn)獲得產(chǎn)量數(shù)據(jù),經(jīng)分析得到下面的方差分析表(=0.05):差異源 平方和 自由度 均方 統(tǒng)計(jì)量 p-值 臨界值(ss) (df) (ms) (f)品種 _ 2 _ _ 0.0178 4.459

35、0地塊 2669290 4 _ _ 0.0000 3.8379誤差 _ 8 296.1總計(jì) 2675774 14(1)將方差分析表中劃線部分的數(shù)值補(bǔ)齊;(6分)(2)分析小麥品種對產(chǎn)量的影響是否顯著;(4分)(3)分析不同地塊對產(chǎn)量的影響是否顯著;(4分)(4)在產(chǎn)量變動(dòng)的差異中,被品種所解釋的百分比是多少?(3分)(5)在產(chǎn)量變動(dòng)的差異中,被地塊所解釋的百分比是多少?(3分)(6)上面的分析包含哪些假定?(10分)五、(30分)統(tǒng)計(jì)資料表明,某地區(qū)職工年人均病假天數(shù)為5.1天。某公司從本公司職工中隨機(jī)抽取了46名職工作為樣本,測得其平均病假天數(shù)為7天,樣本標(biāo)準(zhǔn)差為2.5天。公司領(lǐng)導(dǎo)想知道本公

36、司職工是否比其他單位的職工更容易生病。 (1)公司領(lǐng)導(dǎo)感興趣的原假設(shè)和替換假設(shè)是什么?(3分) (2)若令=0.05,請用假設(shè)檢驗(yàn)的方法幫助公司領(lǐng)導(dǎo)作出判斷(寫清檢驗(yàn)步驟,并作示意圖)。(10分)(z/2=1.96, z=1.645,t/2(45)=2.0141,t(45)=1.6794) (3)在假設(shè)檢驗(yàn)中,p值代表什么含義?(6分) (4)在本例中,p=0.001說明了什么?(3分) (5)用區(qū)間估計(jì)的方法找出該公司職工病假天數(shù)與其他職工病假天數(shù)顯著不同的臨界點(diǎn)。(8分)六、(30分)關(guān)于回歸分析討論下列問題: (1)畫出回歸建模步驟的流程圖;(7分) (2)簡要描述各個(gè)步驟的內(nèi)容;(8分

37、) (3)設(shè)是多元回歸方程參數(shù)的最小二乘估計(jì),證明;(8分) (4)根據(jù),結(jié)合一元線性回歸,你能看出對建模有指導(dǎo)意義的什么信息(7分)人大統(tǒng)計(jì)學(xué)考研歷年真題參考解答精華版(03-09)2009年人大統(tǒng)計(jì)學(xué)專業(yè)課初試題參考解答一、設(shè)第一、二個(gè)總體均值分別為與,樣本均值分別為與,樣本方差分別為與。1.構(gòu)造原假設(shè)和備擇假設(shè)2.構(gòu)造統(tǒng)計(jì)量。由于兩總體方差相等,且均為正態(tài)總體,則可以構(gòu)造如下檢驗(yàn)統(tǒng)計(jì)量:其中則3.計(jì)算臨界值。給定顯著性水平,如,計(jì)算臨界值,由于5030,則。4.做出決策。由于,故拒絕原假設(shè),即認(rèn)為。二、1.對于回歸模型,的最小二乘估計(jì)為:?,F(xiàn)在來看它的期望從上面可以看出,要使為無偏估計(jì),

38、則必須滿足,所以只有當(dāng)時(shí),才為有偏估計(jì)。2.使的原因: 遺漏了關(guān)鍵自變量,即全模型正確時(shí),而我們誤用了選模型。用選模型建模時(shí),使得誤差項(xiàng)中含有遺漏自變量的信息,從而期望不為零。證明過程如下證明:假設(shè)正確模型為,令,。而我們選用了模型來估計(jì),得到,則從上式可以看出是的有偏估計(jì)。加入了無關(guān)緊要的自變量,即選模型正確,而我們誤用了全模型,這樣會(huì)過度提取誤差項(xiàng)信息,使得估計(jì)量有偏。證明過程和上式差不多。這里省略。3.解決辦法:在選擇自變量時(shí),對因變量有重要影響的自變量盡量考慮全面,但自變量又不是越多越好,應(yīng)該去掉那些對因變量沒有影響或者影響很小的自變量。具體實(shí)施辦法有前進(jìn)法、后退法、逐步回歸法等。三、

39、是平穩(wěn)過程,證明如下 即協(xié)方差函數(shù)只與有關(guān)。由平穩(wěn)過程的定義知,題中所定義的過程為平穩(wěn)過程。四、1.先來估計(jì)各層總體的方差。在比例估計(jì)中定義則可得如下關(guān)于總體方差的式子 從上式我們可以估計(jì)出各層的方差(由于很大,故省略系數(shù)。)2.考慮樣本容量為600的簡單隨機(jī)抽樣的方差。在簡單隨機(jī)抽樣下總體比例的估計(jì)量為估計(jì)量方差的估計(jì)值為 3.考慮奈曼分配的情形。設(shè)抽取的樣本容量為,樣本量在各層的分配公式為代入數(shù)據(jù)得到則奈曼分配的估計(jì)量方差的估計(jì)為4.計(jì)算。要使奈曼分層抽樣與簡單隨機(jī)抽樣有相同估計(jì)量方差,則必須滿足即 解得 五、略。六、1.來看的性質(zhì)由上可看出,該模型違背古典線性回歸模型的方差一致性假設(shè),殘

40、差存在異方差性。2.加權(quán)最小二乘法。當(dāng)殘差存在異方差時(shí),如果還是用最小二乘法估計(jì)參數(shù),會(huì)帶來嚴(yán)重的后果,如下參數(shù)估計(jì)值雖是無偏的,但不是最小方差線性無偏估計(jì);參數(shù)的顯著性檢驗(yàn)失效;回歸方差的應(yīng)用效果極不理想。鑒于此,我們必須尋求適當(dāng)?shù)姆椒▽υ瓉淼墓烙?jì)方法進(jìn)行變換,使變換后的估計(jì)方法滿足同方差性假設(shè)。由于異方差性導(dǎo)致離差平方和中的各項(xiàng)的比重不一樣,地位不平等,導(dǎo)致使用普通最小二乘法時(shí),回歸線就被拉向方差大的項(xiàng)。而在此題中,殘差系列與自變量觀測值的平方成正比,即因此當(dāng)我們在平方和各項(xiàng)前面加入一個(gè)權(quán)重時(shí),各項(xiàng)的地位就平等了。從而克服了普通最小二乘法的弊端,這就是加權(quán)最小二乘法。它實(shí)施起來簡單,原理清

41、晰,是解決本題最好的方法。 七、1.數(shù)據(jù)分析。在本題中有三個(gè)影響因素:時(shí)間、活動(dòng)空間、安眠藥。因變量是老鼠的活動(dòng)狀態(tài),可以把它看成數(shù)值型變量。要研究的是時(shí)間、活動(dòng)空間、安眠藥對老鼠活動(dòng)狀態(tài)是否有顯著的影響。我的分析思路是:首先,我把數(shù)據(jù)列成如下的表格吃藥后立即記錄的數(shù)據(jù)吃藥不吃藥關(guān)在一起分開喂養(yǎng)吃藥后一小時(shí)記錄的數(shù)據(jù)吃藥不吃藥關(guān)在一起分開喂養(yǎng)吃藥后兩小時(shí)記錄的數(shù)據(jù)吃藥不吃藥關(guān)在一起分開喂養(yǎng)其中表示老鼠的編號,每個(gè)組有10只老鼠。代表時(shí)間。其次,對每個(gè)表格的數(shù)據(jù)進(jìn)行有交互作用的方差分析,通過分析得到活動(dòng)空間、安眠藥是否對老鼠活動(dòng)狀態(tài)有顯著的影響,也可得到它們的交互作用是否對老鼠活動(dòng)狀態(tài)有顯著的影

42、響。通過在三個(gè)觀測時(shí)間上各自的分析,最后得到安眠藥在那個(gè)時(shí)間點(diǎn)上的效果最好。2.分析步驟。(和第八題的步驟差不多,這里就不寫了。)注:上述問題屬于有重復(fù)測量的方差分析問題,它與一般方差分析的不同之處在于它的時(shí)間觀測值數(shù)據(jù)之間不是獨(dú)立的、是相關(guān)的。這里將時(shí)間分開來處理,似乎有所不妥,特此說明,僅供參考。八、1.本題中職稱和性別都是屬性變量,滿意度是數(shù)值型變量,要研究屬性變量對數(shù)值型的影響,很自然會(huì)想到用方差分析方法,而本題中我們用無交互作用的雙因素方差分析方法。問題提出:在分析一個(gè)屬性變量對一個(gè)數(shù)值型變量的影響時(shí),我們把屬性變量的各個(gè)水平各看成一個(gè)總體,然后比較這幾個(gè)總體的均值,看它們是否有顯著

43、的差異,如果有顯著的差異,則說明在各個(gè)水平下得到的數(shù)據(jù)之間是有差異的,即認(rèn)為屬性變量對數(shù)值型變量有顯著影響。在本題中,比如我們要研究性別對滿意度有無顯著影響,我們的思路是把男、女兩個(gè)水平各看成一個(gè)總體,然后根據(jù)數(shù)據(jù)設(shè)計(jì)一種方法檢驗(yàn)它們的均值有無顯著的差異,如果沒有差異,那么我們認(rèn)為兩總體間的數(shù)據(jù)沒有什么區(qū)別,即滿意度差異不大,也即性別對滿意度沒有影響。基本思想:在方差分析中我們假定因素的各個(gè)水平服從方差相等正態(tài)分布,這樣在每個(gè)總體下抽取樣本,由于抽樣的隨機(jī)性,會(huì)導(dǎo)致數(shù)據(jù)的不同,且各水平之間數(shù)據(jù)也會(huì)不同,我們現(xiàn)在要研究的各水平數(shù)據(jù)的差異性能完全由抽樣的隨機(jī)性解釋嗎?如果可以,我們認(rèn)為個(gè)水平均值沒

44、有差異;否則,就有差異。具體的做法是,我們引進(jìn)組內(nèi)誤差和組間誤差兩個(gè)概念,它們分別用組內(nèi)平方和與組間平方和詮釋。如果組間平方和與組內(nèi)平方和經(jīng)過平均后的數(shù)值相接近,則說明數(shù)據(jù)間的差異是由抽樣的隨機(jī)性引起的,不存在系統(tǒng)性差異,即屬性變量對數(shù)值型變量沒有影響。分析步驟a.提出假設(shè)b.構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量總誤差平方和 行因素誤差平方和,均方誤差 列因素誤差平方和,均方誤差 剩余因素誤差平方和,均方誤差 f統(tǒng)計(jì)量 c.統(tǒng)計(jì)決策。給定顯著性水平,如果,則拒絕原假設(shè),說明行因素對觀測值有顯著的影響;如果,則拒絕原假設(shè),說明列因素對觀測值有顯著的影響。2.假定:各個(gè)水平對應(yīng)的總體都服從正態(tài)分布; 各個(gè)總體的方差相

45、同; 各觀測值是獨(dú)立的; 性別和職稱對滿意度的影響是獨(dú)立的,即它們之間沒有交互作用。2008年人大統(tǒng)計(jì)學(xué)專業(yè)課初試題參考解答一、用中位數(shù)來描述家庭收入數(shù)據(jù)的集中趨勢有優(yōu)點(diǎn)亦有不足。 1.中位數(shù)是指一組數(shù)據(jù)排序后處于中間位置的變量值,不受極端值影響,對偏斜程度較大的順序或數(shù)值型數(shù)據(jù)代表性較好,所以它能夠排除過高收入或過低收入帶來的不良影響。 2.作為描述數(shù)據(jù)集中趨勢的指標(biāo),中位數(shù)的應(yīng)用遠(yuǎn)不及平均值廣泛,中位數(shù)只是一組數(shù)據(jù)中的一個(gè)值,因而對整個(gè)香港家庭收入信息有較大浪費(fèi);而平均值能包含所有收入信息,而且具有優(yōu)良的數(shù)學(xué)性質(zhì),不過它易受極端值的影響,主要適用于測度偏斜度不大的數(shù)據(jù)。 3.用中位數(shù)作為判

46、別低收入的指標(biāo),那么低收入的比例一直都是50%,這顯然與“比例在增長”相矛盾。二、方差分析表面上是檢驗(yàn)多總體均值是否相等,本質(zhì)上是研究變量間的關(guān)系,即通過各總體均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響,其中需要分析數(shù)據(jù)變異的來源,所以叫做方差分析。觀察到的數(shù)據(jù)一般是參差不齊的,我們用sst(總平方和)度量數(shù)據(jù)總的變異,將它分解為可追溯到來源的部分變異sse(組內(nèi)平方和)與ssa(組間平方和)之和,若后者的平均msa(組間均方)明顯比前者的平均mse(組內(nèi)均方)大,就認(rèn)為自變量對因變量有顯著影響。在方差分析的基本假定下,上述問題形式上就轉(zhuǎn)化為檢驗(yàn)各總體均值是否相等的問題。所謂基

47、本假定就是,各總體服從正態(tài)分布;各總體方差相同;各觀測值相互獨(dú)立。三、有多種預(yù)測模型可供選擇:1.時(shí)間序列分解模型 加法模型:;乘法模型:;混合模型:,。其中為時(shí)刻的序列值,分別表示趨勢、季節(jié)性、隨機(jī)波動(dòng),下同。2.季節(jié)多元回歸模型 其中為0-1虛擬變量。3. arima(p,q,d,t)模型(求和自回歸移動(dòng)平均模型) 符號說明 a. 為一階延遲算子();b. 為自回歸系數(shù)多項(xiàng)式;c. 為移動(dòng)平均系數(shù)多項(xiàng)式;d. 為階差分算子,用于消除趨勢成分;e. 為步長為周期的步差分算子,用于消除季節(jié)成分。四、(1)廠家從自身利益出發(fā),當(dāng)然希望每袋平均重量,這樣有利于提高產(chǎn)品銷量,于是可以把放在“被保護(hù)”

48、的位置,而原假設(shè)正具有“被保護(hù)”的特性,于是可提出如下檢驗(yàn)假設(shè): (2)從消費(fèi)者利益出發(fā),我們擔(dān)心每袋平均重量,如果要我們相信,那么廠家就得拿出充分的證據(jù)來證明,所以應(yīng)放在“不利”的位置,即放在備擇假設(shè)中,于是有: (3)在的顯著性水平和(2)中的檢驗(yàn)假設(shè)下,意味著是顯著不成立的,即拒絕原假設(shè),我們可以相信廠家所言。 值的含義是當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量取其實(shí)現(xiàn)值以及更極端值的概率,它是檢驗(yàn)的真實(shí)顯著性水平。 (4)這里的區(qū)間(241.1,257.5)是一個(gè)確定的區(qū)間,而食品的實(shí)際平均重量要么在其中,要么不在其中,無概率可言。該區(qū)間是95%的隨機(jī)置信區(qū)間的一個(gè)實(shí)現(xiàn),后者的意思是食品的實(shí)際平均重

49、量以95%的概率落入其中。五、經(jīng)典多元線性回歸模型為 其中是維隨機(jī)向量,是設(shè)計(jì)矩陣,是維系數(shù)向量,是維隨機(jī)誤差向量。 關(guān)于自變量的假設(shè)主要有:1.自變量都是確定性變量。回歸分析中的自變量與因變量地位是不等的,其中后者是隨機(jī)的,這與相關(guān)分析二者都是隨機(jī)的不同。從而自變量與隨機(jī)誤差(以及因變量)也就不相關(guān),保證了回歸分析理論的順利進(jìn)行。2.自變量不存在多重共線性。這就要求設(shè)計(jì)矩陣列滿秩,進(jìn)而觀測次數(shù)(樣本量)必須大于自變量個(gè)數(shù)。該假設(shè)保證了的普通最小二乘估計(jì)可表示為 并且具有良好的數(shù)學(xué)性質(zhì),更方便了進(jìn)一步的假設(shè)檢驗(yàn)和回歸分析的實(shí)際操作與應(yīng)用。否則出現(xiàn)多重共線性,就會(huì)帶來上述諸多方面的麻煩。六、常見

50、的(概率)抽樣方式有簡單隨機(jī)抽樣、分層抽樣、整群抽樣、多階段抽樣和系統(tǒng)抽樣,其中簡單隨機(jī)抽樣是最基本的,是其他抽樣方式的基礎(chǔ)。所謂基本抽樣方式,我覺得以不同的標(biāo)準(zhǔn)或不同的思維角度會(huì)得出不同的分類方式,比如: 1.如果將整群抽樣(通常指一階)看作特殊的二階段抽樣(二階段抽樣比100%),則有四種基本抽樣方式。 2.如果又將分層抽樣視為特殊的二階段抽樣(一階段抽樣比100%),則有三種基本抽樣方式。 3.如果將系統(tǒng)抽樣看作特殊的分層抽樣(每層抽一個(gè)單元)或者特殊的整群抽樣(只抽一個(gè)群),則有四種基本抽樣方式。七、貝葉斯判別分析的原理是將貝葉斯統(tǒng)計(jì)思想用于判別分析。具體說來,設(shè)有個(gè)總體,分別有密度函數(shù)(一般假定總體都服從正態(tài)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論