衛(wèi)生統(tǒng)計學(xué)趙耐青習(xí)題答案_第1頁
衛(wèi)生統(tǒng)計學(xué)趙耐青習(xí)題答案_第2頁
衛(wèi)生統(tǒng)計學(xué)趙耐青習(xí)題答案_第3頁
衛(wèi)生統(tǒng)計學(xué)趙耐青習(xí)題答案_第4頁
衛(wèi)生統(tǒng)計學(xué)趙耐青習(xí)題答案_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、習(xí)題答案第一章一、是非題1. 家庭中子女數(shù)是離散型的定量變量。答:對。2. 同質(zhì)個體之間的變異稱為個體變異。答:對。3. 學(xué)校對某個課程進行 1 次考試,可以理解為對學(xué)生掌握該課程知識的一次隨機抽樣。答:對。4. 某醫(yī)生用某個新藥治療了 100 名牛皮癬患者,其中55 個人有效,則該藥的有效率為55%。答:錯。只能說該樣本有效率為55或稱用此藥總體有效率的樣本估計值為55%。5.已知在某個人群中,糖尿病的患病率為8%,則可以認為在該人群中,隨機抽一個對象,其患糖尿病的概率為8%。答:對,人群的患病率稱為總體患病率。在該人群中隨機抽取一個對象,每個對象均有相同的機會被抽中,抽到是糖尿病患者的概率

2、為8。二、選擇題1. 下列屬于連續(xù)型變量的是 A 。A 血壓 B 職業(yè) C 性別 D 民族2. 某高校欲了解大學(xué)新生心理健康狀況,隨機選取了1000 例大學(xué)新生調(diào)查,這1000 例大學(xué)生新生調(diào)查問卷是 A 。A 一份隨機樣本 B 研究總體 C 目標總體 D 個體3. 某研究用 X 表示兒童在一年中患感冒的次數(shù),共收集了1000 人,請問:兒童在一年中患感冒次數(shù)的資料屬于 C 。A 連續(xù)型資料 B 有序分類資料 C 不具有分類的離散型資料 D 以上均不對4. 下列描述中,不正確的是 D 。A 總體中的個體具有同質(zhì)性B 總體中的個體大同小異C 總體中的個體在同質(zhì)的基礎(chǔ)上有變異D 如果個體間有變異那

3、它們肯定不是來自同一總體5用某個降糖藥物對糖尿病患者進行治療,根據(jù)某個大規(guī)模隨機抽樣調(diào)查的研究結(jié)果得到該藥的降糖有效率為85%的結(jié)論,請問降糖有效率是指 D 。A 每治療100 個糖尿病患者,正好有85 個人降糖有效,15 個人降糖無效B 每個接受該藥物治療的糖尿病患者,降糖有效的機會為85%C 接受該藥物治療的糖尿病人群中,降糖有效的比例為85%D 根據(jù)該研究的入選標準所規(guī)定的糖尿病患者人群中,估計該藥降糖有效的比例為85%三、簡答題1. 某醫(yī)生收治 200 名患者,隨機分成2 組,每組100 人。一組用A 藥,另一組用B 藥。經(jīng)過2 個月的治療,A 藥組治愈了90 人,B 組治愈了85 名

4、患者,請根據(jù)現(xiàn)有結(jié)果評議下列說法是否正確,為什么?a)A 藥組的療效高于B 藥組。b)A 藥的療效高于B 藥。答:a)正確,因為就兩組樣本而言,的確A 組療效高于B 組。b) 不正確,因為樣本的結(jié)果存在抽樣誤差,因此有可能人群的A 藥療效高于B 藥,也可能人群的兩藥的療效相同甚至人群B 藥的療效高于A 藥,2. 某校同一年級的 A 班和B 班用同一試卷進行一次數(shù)學(xué)測驗。經(jīng)過盲態(tài)改卷后,公布成績:A 班的平均成績?yōu)?0 分,B 班的平均成績?yōu)?1 分,請評議下列說法是否正確,為什么?a)可以稱A 班的這次考試的平均成績低于B 班,不存在抽樣誤差。b)可以稱A 班的數(shù)學(xué)平均水平低于B 班。答:a)

5、 正確,因為此處將A 班和B 班作為研究總體,故不存在抽樣誤差。b)不正確,因為這一次數(shù)學(xué)平均成績只是兩班數(shù)學(xué)成績總體中的兩個樣本,樣本的差異可能僅僅由抽樣誤差造成。3. 在某個治療兒童哮喘的激素噴霧劑新藥的臨床試驗中,研究者收集了300 名哮喘兒童患者,隨機分為試驗組和對照組,試驗組在哮喘緩解期內(nèi)采用激素噴霧劑,在哮喘發(fā)作期內(nèi)采用激素噴霧劑擴展氣管藥;對照組在哮喘緩解期不使用任何藥物,在哮喘發(fā)作期內(nèi)采用擴展氣管藥物。通過治療3 個月,以肺功能檢查中的第1 秒用力呼吸率(FEV1/FRC1)作為主要有效性評價指標,評價兩種治療方案的有效性和安全性。請闡述這個研究中的總體和總體均數(shù)是什么?答:試

6、驗組的研究總體是接受試驗組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 值的全體。對照組的研究總體是接受對照組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 值的全體。試驗組對應(yīng)的總體均數(shù)是接受試驗組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 的平均值;對照組對應(yīng)的總體均數(shù)是接受對照組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 的平均值。4. 請簡述什么是小概率事件?對于一次隨機抽樣,能否認為小概率事件是不可能發(fā)生的?答:在統(tǒng)計學(xué)中,如果隨機事件發(fā)生的概率小于或等于0.05,則通常可以認為是一個小概率事件,表示該事件在大

7、多數(shù)情況下不會發(fā)生,并且一般可以認為小概率事件在一次隨機抽樣中不會發(fā)生,這就是小概率事件原理。小概率事件原理是統(tǒng)計學(xué)檢驗的基礎(chǔ)。5. 變量的類型有哪幾種?請舉例說明,各有什么特點?答:(1) 連續(xù)型變量,可以一個區(qū)間中任意取值的變量,即在忽略測量精度的情況下,連續(xù)型變量在理論上可以取到區(qū)間中的任意一個值,并且通常含有測量單位。觀察連續(xù)型變量所得到的數(shù)據(jù)資料稱為計量資料(measurement data)。如例1-1 中的身高變量就是連續(xù)型變量,身高資料為計量資料。.(2) 離散型變量, 變量的取值范圍是有限個值或者為一個數(shù)列。離散型變量的取值情況可以分為具有分類性質(zhì)的資料和不具有分類性質(zhì)的資料

8、,表示分類情況的離散型變量亦稱分類變量(categorical variable)。觀察分類變量所得到的資料稱為分類資料(categorical data)。分類資料可以分為二分類資料和多分類資料,而多分類資料又分成無序分類資料和有序分類資料,二分類資料如癥狀指標分為感染或未感染,無序多分類資料(nominal data) 如血型可以分為A、B、AB 和O 型,有序多分類資料(ordinal data) 如病情指標分為無癥狀、輕度、中度和重度。第二章一、是非題1不論數(shù)據(jù)呈何種分布,都可以用算術(shù)均數(shù)和中位數(shù)表示其平均水平。答:錯。只有資料滿足正態(tài)或近似正態(tài)分布時計算算術(shù)均數(shù)是比較有統(tǒng)計學(xué)意義的。

9、2在一組變量值中少數(shù)幾個變量值比大多數(shù)變量值大幾百倍,一般不宜用算術(shù)均數(shù)表示其平均水平。答:對,可以采用中位數(shù)表示。3只要單位相同,用s 和用CV 來表示兩組資料的離散程度,結(jié)論是完全一樣的。答:錯,標準差S 是絕對誤差的一種度量,變異系數(shù)CV 是相對誤差的一種度量,對于兩組資料離散程度的比較,即使兩組資料的度量單位相同,也完全有可能出現(xiàn)兩個指標的結(jié)論是不同的。在實際應(yīng)用時,選擇離散程度的指標時,考慮其結(jié)果是否有研究背景意義。例如:一組資料為成人的身高觀察值,另一組資料為2 歲幼兒的身高觀察值,雖然可以用標準差S比較兩組的離散程度,也不能認為這是錯誤的,但根本沒有研究背景意義,相反選擇變異系數(shù)

10、CV 比較兩組資料的相對變異程度,這就有一定的研究背景意義。4描述200 人血壓的分布,應(yīng)繪制頻數(shù)圖。答:對。5. 算術(shù)均數(shù)與中位數(shù)均不容易受極值的影響。答:錯。算術(shù)均數(shù)比中位數(shù)容易受到極值的影響。二、選擇題1中位數(shù)是表示變量值 A 的指標。A 平均水平B 變化范圍C 頻數(shù)分布D 相互間差別大小2對于最小組段無確定下限值和(或)最大組段無確定上限值的頻數(shù)分布表資料,宜用下列哪些指標進行統(tǒng)計描述? C _A 中位數(shù),極差 B 中位數(shù),四分位數(shù)間距C 中位數(shù),四分位數(shù)范圍 D 中位數(shù),標準差3描述年齡(分8 組)與療效(有效率)的關(guān)系,應(yīng)繪制 A 。A線圖 B. 圓圖 C. 直方圖 D. 百分條圖

11、4、為了描述資料分布概況,繪制直方圖時,直方圖的縱軸可以為 D 。A 頻數(shù) B 頻率 C 頻率密度(頻率/組距) D 都可以三、簡答與分析題1 100 名健康成年女子血清總蛋白含量(g/L)如表2-14,試描述之。表2-12 100 名成年健康女子血清總蛋白含量(g/L)73.5 74.3 78.8 78.0 70.4 80.5 84.3 68.8 69.7 71.272.0 79.5 75.6 78.8 72.0 72.0 72.7 75.0 74.3 71.268.0 75.0 75.0 74.3 75.8 65.0 67.3 78.8 71.2 69.773.5 73.5 75.8 64

12、.3 75.8 80.3 81.6 72.0 74.3 73.568.0 75.8 72.0 76.5 70.4 71.2 67.3 68.8 75.0 70.474.3 70.4 79.5 74.3 76.5 77.6 81.2 76.5 72.0 75.072.7 73.5 76.5 74.7 65.0 76.5 69.7 73.5 75.4 72.772.7 67.2 73.5 70.4 77.2 68.8 74.3 72.7 67.3 67.374.3 75.8 79.5 72.7 73.5 73.5 72.0 75.0 81.6 74.370.4 73.5 73.5 76.5 72.

13、7 77.2 80.5 70.4 75.0 76.5答:制作頻數(shù)表如下:_組段 頻數(shù) 百分比 累積頻數(shù) 累積百分比_64 3 3.00 3 3.0066 5 5.00 8 8.0068 8 8.00 16 16.0070 11 11.00 27 27.0072 25 25.00 52 52.0074 24 24.00 76 76.0076 10 10.00 86 86.0078 7 7.00 93 93.0080 6 6.00 99 99.0084 1 1.00 100 100.00變量 例數(shù) 均數(shù) 標準差 最小值最大值中位數(shù)25 百分位數(shù)75 百分位數(shù)x 100 73.7 3.925 64.

14、3 84.3 73.5 71.2 75.82某醫(yī)師測得300 名正常人尿汞值(ng/L)如表2-15,試描述資料。表2-13 300 名正常人尿汞值(ng/L)尿 汞 例 數(shù) 累計例數(shù) 累計百分數(shù)(%)0 49 49 16.34 27 76 25.38 58 134 44.712 50 184 61.316 45 229 76.320 22 251 83.724 16 267 89.028 10 277 92.332 7 284 94.736 5 289 96.340 5 294 98.044 0 294 98.048 3 297 99.052 0 297 99.056 2 299 99.76

15、0 1 300 100.0合計 300 答:根據(jù)資料給出統(tǒng)計描述的指標如下:例數(shù) 均數(shù) 標準差 最小值 最大值16 15.053 49.014 2 62對于同一的非負樣本資料,其算數(shù)均數(shù)一定大于等于幾何均數(shù)。答:根據(jù)初等數(shù)學(xué)中的不等式1 21 2n nna a a a a an+ + +􀀢 􀀢 ,可以得到算數(shù)均數(shù)一定大于等于幾何均數(shù)。常用的描述集中趨勢的指標有哪些,并簡述其適用條件。答:(1)算術(shù)均數(shù):適用對稱分布,特別是正態(tài)或近似正態(tài)分布的數(shù)值變量資料。(2)幾何均數(shù):適用于頻數(shù)分布呈正偏態(tài)的資料,或者經(jīng)對數(shù)變換后服從正態(tài)分布(對數(shù)正態(tài)分布)的資料,以及等

16、比數(shù)列資料。(3)中位數(shù):適用各種類型的資料,尤其以下情況:A 資料分布呈明顯偏態(tài);B 資料一端或兩端存在不確定數(shù)值(開口資 料或無界資料);C資料分布不明。第三章一、 是非題1. 二項分布越接近 Poisson 分布時,也越接近正態(tài)分布。答:錯。當二項分布的 不太接近 0或者 1,隨著的增大,n 和n(1 )均較大時,二項分布的X 的逐漸近似正態(tài)分布; n 較大, 較小,二項分布的X 近似總體均數(shù)為 = n 的 Poisson 分布,只有n較大、 較小并且n 較大時,二項分布的 X 既近似Poisson 分布又近似正態(tài)分布,其本質(zhì)是當n 較大、 較小時二項分布的X 所近似的Poisson 分

17、布在其總體均數(shù) = n 較大時逼近正態(tài)分布。2. 從同一新生兒總體(無限總體)中隨機抽樣 200 人,其中新生兒窒息人數(shù)服從二項分布。答:對。因為可以假定每個新生發(fā)生窒息的概率 是相同的并且相互獨立,對于隨機抽取 200 人,新生兒窒息人數(shù) X 服從二項分布B(n, )。3. 在 n 趨向無窮大、總體比例趨向于0,且n 保持常數(shù)時的二項分布的極限分布是Poisson 分布。答:對。這是二項分布的性質(zhì)。4. 某一放射物體,以一分鐘為單位的放射性計數(shù)為 50,40,30,30,10,如果以5 分鐘為時間單位,其標準差為 1605 。答:錯。設(shè)i X 服從總體均數(shù)為 的 Poisson 分布,i =

18、 1,2,3,4,5,并且相互獨立。根據(jù)Poisson 分布的可加性, 1 2 3 4 5 X + X + X + X + X 服從總體均數(shù)為5 ,_其總體方差為5 ,本題 5 分鐘的總體方差5 的估計值為50 + 40 + 30 + 30 +10 = 160,所以其標準差為160 。5. 一個放射性物體一分鐘脈沖數(shù)為 20 次,另一個放射性物體一分鐘脈沖數(shù)為50 次。假定兩種放射性物體的脈沖性質(zhì)相同,并且兩種放射性物體發(fā)生脈沖是相互獨立的,則這兩種物體混合后,其一分鐘脈沖數(shù)的總體均數(shù)估計值為70 次。答:對。根據(jù)Poisson 分布的可加性,這兩種物體混合后的發(fā)生的脈沖數(shù)為1 2 X + X

19、 ,混合后一分鐘脈沖數(shù)的總體均數(shù)估計值為20+5070 次。6. 一個放射性物體平均每分鐘脈沖數(shù)為 5 次(可以認為服從Poisson 分布),用X 表示連續(xù)觀察20 分鐘的脈沖數(shù),則X 也服從Poisson 分布。答:對,這是Poisson 分布的可加性。7. 一個放射性物體平均每分鐘脈沖數(shù)為 5 次(可以認為服從Poisson 分布),用X 表示連續(xù)觀察20 分鐘的脈沖數(shù),則X 的總體均數(shù)和總體方差均為100 次。答:對。Poisson 分布的可加性原理。8. 用 X 表示某個放射性物體的每分鐘脈沖數(shù),其平均每分鐘脈沖數(shù)為5 次(可以認為服從Poisson 分布),用Y 表示連續(xù)觀察20

20、分鐘的脈沖數(shù),則可以認為Y 近似服從正態(tài)分布,但不能認為X 近似服從正態(tài)分布。答:對。因為Y 的總體均數(shù)為100,當比較小的時候,Poisson 分布是一個偏態(tài)的分布,但是當增大時,Poisson 分布會逐漸趨于對稱。二、 選擇題1. 理論上,二項分布是一種 B。A 連續(xù)性分布 B 離散分布C 均勻分布 D 標準正態(tài)分布2. 在樣本例數(shù)不變的情況下,下列何種情況時,二項分布越接近對稱分布。 CA 總體率越大 B 樣本率P 越大C 總體率越接近0.5 D 總體率越小3. 醫(yī)學(xué)上認為人的尿氟濃度以偏高為不正常,若正常人的尿氟濃度X 呈對數(shù)正態(tài)分布,Y = lgX , G 為X 的幾何均數(shù),尿氟濃度

21、的95%參考值范圍的界值計算公式是 A 。A lg 1( 1.64 ) Y Y + S B + 1.96 X G S C + 1.64 X G S D lg 1( 1.96 ) Y Y + S4. 設(shè)1 2 10 X , X ,􀀢, X 均 服 從 B(4,0.01) , 并 且 1 2 10 X , X ,􀀢, X 相 互 獨 立 。 令1 2 10 Y = X + X +􀀢+ X ,則 DA Y 近似服從二項分布 B Y 近似服從Poisson 分布C Y 近似服從正態(tài)分布 D Y B(40,0.01)5. 設(shè)1 2 10 X , X

22、,􀀢, X 均服從 Poisson(2.2) ,并且 1 2 10 X , X ,􀀢, X 相互獨立。令1 2 10 Y = (X + X +􀀢+ X ) /10,則 CA Y 近似服從B(10,0.22) B Y 服從Poisson(22)分布C Y 近似服從正態(tài)分布 D Y 服從Poisson(2.2)分布三、 簡答題1. 如果X 的總體均數(shù)為,總體標準差為,令Y a+bX,則可以證明:Y 的總體均數(shù)為a+b,標準差為b。如果X 服從40 的Poisson 分布,請問:Y = X /2 的總體均數(shù)和標準差是多少?答:總體均數(shù)=20,總體

23、標準差= 40 / 2。2. 設(shè)X 服從40 的Poisson 分布,請問:Y = X /2 是否服從Poisson 分布?為什么?答:不是的。因為Y = X /2 的總體均數(shù)=20,不等于總體方差10。3. 設(shè)X 服從40 的Poisson 分布,可以認為X 近似服從正態(tài)分布。令Y = X /10,試問:是否可以認為Y 也近似服從正態(tài)分布?答:正態(tài)分布的隨機變量乘以一個非0 常數(shù)仍服從正態(tài)分布,所以可以認為Y 也近似服從正態(tài)分布。4. 設(shè)X 服從均數(shù)為的 Poisson 分布。請利用兩個概率之比:P(X +1) / P(X ),證明:當x < 1 時,概率P(X )隨著X 增大而增加;

24、當 X > 時,概率P(X )隨著X 增大而減小。答:1( 1)/( ) ( )/ /( 1)( 1)! !x xP X x P X x e e xx x += + = = = +, 顯然, 當x < 1 時,對應(yīng)x +1 < ,由此得到 1x 1>+,所以P(X = x +1) / P(X = x) > 1,說 明 概 率 P(X ) 隨 著 X 增 大 而 增 加 ; 當 X > 時 , 則( 1)/( ) 11P X x P X xx x = + = = < <+,說明當X>時,概率P(X )隨著X 增大而減小。5. 已知某飲用水的合

25、格標準是每升水的大腸桿菌數(shù)2 個,如果隨機抽取1 升飲用水,檢測出大腸桿菌數(shù)的95參考值范圍是多少?(提示考慮合格標準的總體均數(shù)最大值為2 個/L,求95參考值范圍)。答:由于合格標準的總體均數(shù)最大值為2 個/L,對于正常而言,大腸桿菌數(shù)越少越好,所以這是單側(cè)參考值范圍。即求滿足累計概率的不等式20 0( | 2) 2 0.95!X X kk kP k ek = = = = 的最大X 的解。X 0 1 2 3 4 5 6P(X ) 0.135335 0.270671 0.270671 0.180447 0.090224 0.036089 0.012030( )XkP k= 0.135335 0

26、.406006 0.676676 0.857123 0.947347 0.983436 0.995466根據(jù)上述計算得到 X 的95參考值范圍是 X < 5個/L。?第四章一、是非題1、設(shè) X 的總體均數(shù)為,則樣本均數(shù)X 的總體均數(shù)也為。答:對。經(jīng)隨機抽樣得到的樣本均數(shù)X 的總體均數(shù)也為。2、設(shè) X 的總體方差為2,則樣本均數(shù)X 的總體方差也為2。答:錯。經(jīng)隨機抽樣后得到的樣本均數(shù)X 的總體方差為2/n。3、設(shè) 隨 機 變 量1, , n X X 均服從 B(1, ) ,n 很大時,則11 niiX Xn = 近似服從N( , (1 ) / n)答:對。4、某研究者做了一個兒童血鉛濃度的

27、流行病學(xué)調(diào)查,共調(diào)查了 1000 人,檢測了每個人血鉛濃度。雖然血鉛檢濃度一般呈非正態(tài)分布,但由于該研究樣本量很大,可以認為這些血鉛濃度近似服從正態(tài)分布。答:錯。血鉛濃度的分布與樣本量是否很大無關(guān),如果樣本量充分大時,血鉛濃度的樣本均數(shù)的分布近似正態(tài)分布。5、某研究者做了一個兒童血鉛濃度的流行病學(xué)調(diào)查,共調(diào)查了 1000 人,檢測了每個人血鉛濃度,計算這1000 人的血鉛平均濃度。對于現(xiàn)有的1000 人的血鉛濃度資料,可以認為該資料的樣本均數(shù)近似服從正態(tài)分布。答: 錯。樣本均數(shù)的概率分布是指隨機抽樣前將要隨機抽取的樣本,其樣本均數(shù)近似服從某個概率分布,樣本量很大時,樣本均數(shù)逼近正態(tài)分布。對于這

28、個資料而言,這是已經(jīng)完成隨機抽樣的資料,這個資料的樣本均數(shù)只是一個數(shù),不存在服從哪種分布的問題。6、某研究者做了一個兒童血鉛濃度的流行病學(xué)調(diào)查,已知血鉛測量值非正態(tài)分布,計劃調(diào)查1000 人,并將計算1000 人的血鉛濃度的樣本均數(shù),由于該研究樣本量很大,可以認為隨機抽樣所獲得血鉛濃度的樣本均數(shù)將近似服從正態(tài)分布。答:對。如果從某個均數(shù)為,標準差為的非正態(tài)分布的總體中抽樣,只要樣本量足夠大,則樣本均數(shù) X 的分布也將近似于正態(tài)分布N(, 2 / n)。二、選擇題1、以下方法中唯一可行的減小抽樣誤差的方法是_B_。A、減少個體變異 B、增加樣本量C、設(shè)立對照 D、嚴格貫徹隨機抽樣的原則2、X S

29、 表示_C_。A、總體均數(shù)的離散程度 B、總體標準差的離散程度C、樣本均數(shù)的離散程度 D、樣本標準差的離散程度3、設(shè)連續(xù)性隨機變量X的總體均數(shù)為,從X總體中反復(fù)隨機抽樣,隨樣本量n 增大,XXS將趨于_D_。A、X 的原始分布 B、正態(tài)分布C、均數(shù)的抽樣分布 D、標準正態(tài)分布4、在均數(shù)為 ,標準差為 的正態(tài)總體中隨機抽樣,理論上| X | _B_的可能性為5%。A、 1.96 B 1.96 X C、 0.05/ 2,v t S D 1.96 X S5、下面關(guān)于標準誤的四種說法中,哪一種是不正確_C_。A、標準誤是樣本統(tǒng)計量的標準差B、標準誤反映了樣本統(tǒng)計量的變異C、標準誤反映了總體參數(shù)的變異D

30、、標準誤反映了抽樣誤差的大小6、變量 X 偏離正態(tài)分布,只要樣本量足夠大,樣本均數(shù)_C_。A、偏離正態(tài)分布 B、服從F 分布C、近似正態(tài)分布 D、服從t 分布三、簡答題1、樣本均數(shù)的抽樣誤差定義是什么?答:樣本均數(shù)的抽樣誤差是指樣本均數(shù)和總體均數(shù)間的差異,但同時可以表現(xiàn)為從同一總體中多次隨機抽樣所得的樣本均數(shù)間的差異,通常用樣本均數(shù)的標準誤度量平均的抽樣誤差大小。2、估計樣本均數(shù)的平均抽樣誤差的統(tǒng)計量是什么?答:是樣本均數(shù)的標準差,即樣本均數(shù)的標準誤。3、簡述樣本均數(shù)的抽樣誤差的規(guī)律?。答:樣本均數(shù)的標準誤的理論值為x n = ,而其估計值為XS Sn= ;4、簡述 t 分布、F 分布,2 分

31、布曲線的特征與自由度的關(guān)系。答:t 分布是一簇以0 為中心,左右對稱的單峰曲線,隨著自由度的增加,t 分布曲線將越來越接近于標準正態(tài)分布曲線,當自由度為無窮大時,t 分布就是標準正態(tài)分布。t 分布的曲線下兩側(cè)尾部的面積可以通過查對應(yīng)自由度下的t 分布界值表得到。2 分布的圖形為一簇單峰正偏態(tài)分布曲線,且隨著自由度的增加,正偏的程度越來越小。2 分布的曲線下右側(cè)尾部的面積可通過查2 界值表得到。F 分布的特征有:(1)F 分布有兩個自由度,F(xiàn) 的取值范圍為0。(2)F 分布為一簇單峰正偏態(tài)分布曲線,與兩個自由度有關(guān)。(3)每一對自由度下的F 分布曲線下面積,見方差分析用F 界值表(附表4),橫標

32、目為第一自由度,縱標目為第二自由度,表中分別給出了概率為0.05 和0.01 時的F 界值,記為, 1 , 2 F 。t 分布,2 分布和F 分布是三種沒有未知參數(shù),只有自由度的概率分布,常用于抽樣研究中,故稱為三種常見的抽樣分布。5、簡述正態(tài)分布、t 分布、F 分布、2 分布之間的關(guān)系。答:(1)若隨機變量 X 服從于正態(tài)分布N (, 2 ),那么從總體中隨機抽取的樣本,其樣本均數(shù) X 將服從于正態(tài)分布 ( , 2 ) X N 。令Z 為對X 進行標準化變換的結(jié)果,Z 將服從于標準正態(tài)分布,即X /Z X Xn = = 服從標準正態(tài)分布。(2)自由度為1 的2 分布可以通過將服從標準正態(tài)分布

33、的變量平方得到。(3)若隨機變量X1 和X2 分別為服從自由度為v1和v2 的2 分布,并且相互獨立,則比值1 )21 1 122 2 2 /F XX = = 分布(分布( 2 )/服從自由度為(v1,v2)的F 分布(F-distribution)。6、目前一般的統(tǒng)計軟件(如 SAS,SPSS 和Stata)均能隨機模擬產(chǎn)生服從均勻分布、正態(tài)分布、二項分布的隨機數(shù)。利用這些程序,可以生成指定參數(shù)下的隨機數(shù)據(jù),這種產(chǎn)生隨機數(shù)的方法稱為“蒙特卡洛方法”(Monte-Carlo Method)。請參考光盤中隨機模擬操作,借助統(tǒng)計軟件隨機模擬產(chǎn)生隨機數(shù)據(jù),重現(xiàn)本章中關(guān)于均數(shù)和率的抽樣分布規(guī)律。答:以

34、Stata 為例正態(tài)分布資料的樣本均數(shù)的分布模擬。用記事本寫入下來語句clearset memory 100mdi "輸入 樣本量 總體均數(shù) 總體標準差"scalar m=1'scalar mm=2'scalar oo=3'set obs 10000local j=1gen xx=0gen ss=0while j'<=mgen xj'=invnorm(uniform()*oo+mmreplace xx=xx+xj'replace ss=ss+xj'*xj'local j=j'+1gen ssd=s

35、qrt(ss-xx*xx/m)/(m-1)replace xx=xx/mdi "mean=" xxdi "sd=" ssd用文件名"simumean.do"保存在Stata 窗口中打入do 路徑simumean 樣本量 總體均數(shù) 總體標準差對于Stata 7.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph xx,bin(50) xlabel對于 Stata 8.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph7 xx,bin(50) xlabel非正態(tài)分布的樣本均數(shù)的分布模擬。用記事本寫入下來語句clearset memory 100m

36、di "輸入 樣本量 "scalar m=1'set obs 10000local j=1gen xx=0gen ss=0while j'<=mgen xj'=invnorm(uniform()2replace xx=xx+xj'replace ss=ss+xj'*xj'local j=j'+1gen ssd=sqrt(ss-xx*xx/m)/(m-1)replace xx=xx/mdi "mean=" xxdi "sd=" ssd用文件名"simumean1.d

37、o"保存在Stata 窗口中打入do 路徑simumean1 樣本量 總體均數(shù) 總體標準差對于Stata 7.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph xx,bin(50) xlabel顯示原始資料的頻數(shù)分布圖graph x1,bin(50) xlabel對于 Stata 8.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph7 xx,bin(50) xlabel顯示原始資料的頻數(shù)分布圖graph7 x1,bin(50) xlabel樣本率的分布模擬。用記事本寫入下來語句clearset memory 100mdi "輸入 樣本量 總體率 "scalar m=1

38、'scalar pp=2'set obs 10000local j=1gen xx=0gen ss=0while j'<=mreplace xx=xx+int(uniform()+pp)local j=j'+1gen ppp=xx/msu ppp用文件名"simumean3.do"保存在Stata 窗口中打入do 路徑simumean3 樣本量 總體率對于Stata 7.0,輸入下列命令顯示樣本率的頻數(shù)圖graph ppp,bin(50) xlabel對于Stata 8.0,輸入下列命令顯示樣本率的頻數(shù)圖graph7 ppp,bin(5

39、0) xlabel7、利用蒙特卡洛方法,產(chǎn)生標準正態(tài)分布的隨機數(shù),并計算樣本方差,驗證方差乘自由度(n 1)S2服從于自由度為n 1的 2 分布,兩個獨立樣本的方差之比服從于自由度為1 n 1, 2 n 1的 F 分布。答:標準正態(tài)分布資料的樣本方差×(n1)的分布模擬。用記事本寫入下來語句clearset memory 100mdi "輸入 樣本量 "scalar m=1'set obs 10000local j=1gen xx=0gen ss=0while j'<=mgen xj'=invnorm(uniform()replace

40、 xx=xx+xj'replace ss=ss+xj'*xj'local j=j'+1gen ss= ss-xx*xx/m用文件名"simuvariance.do"保存在Stata 窗口中打入do 路徑 simuvariance.do 樣本量對于Stata 7.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph ss,bin(50) xlabel對于 Stata 8.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph7 ss,bin(50) xlabelF 分布的模擬。用記事本寫入下來語句clearset memory 100mdi "輸入

41、 樣本量1 總體均數(shù)1 樣本量2 總體均數(shù)2 總體標準差 "scalar m1=1'local mn1=1'scalar mm1=2'scalar m2=3'scalar mm2=4'scalar oo=5'set obs 10000local j=1gen xx=0gen ss=0gen xx0=0while j'<=m1replace xx0=invnorm(uniform()*oo+m1replace xx=xx+xx0replace ss=ss+xx0*xx0local j=j'+1gen ss1= (ss

42、-xx*xx/m1)/(m1-1)replace ss=0replace xx=0local j=1while j'<=m2gen xx0=invnorm(uniform()*oo+m2replace xx=xx+xx0replace ss=ss+xx0*xx0local j=j'+1gen ss2= (ss-xx*xx/m2)/(m2-1)gen f=ss1/ss2用文件名"simuf.do"保存在Stata 窗口中打入do 路徑 simuf.do 樣本量對于Stata 7.0,輸入下列命令顯示統(tǒng)計量F 的頻數(shù)圖graph f,bin(50) xla

43、bel對于 Stata 8.0,輸入下列命令顯示統(tǒng)計量F 的頻數(shù)圖graph7 f,bin(50) xlabel第五章一、是非題1t 檢驗統(tǒng)計量服從自由度為 的t 分布。答:錯。只有在H0 假設(shè)為真時才成立。2. 當拒絕0 H 時,只可能發(fā)生第一類錯誤。答:對。3. 對于H0 : = 0 H1 : 0的t檢驗,當 1 H 為真時,檢驗統(tǒng)計量/ 2,n 1 t t > 的_概率為1 。答:對。當1 H 為真時,作出正確推斷的概率即為1 。4. 對于0 0 1 0 H : = H : 的t檢驗, 0 H 為真而言,發(fā)生拒絕0 H 的機會與樣本量n 無關(guān)。答:對。無論樣本量n 多大,犯第一類錯

44、誤的概率為。5. 對于定量資料用95%可信區(qū)間的公式0.05/ 2,n 1 X X t S ± 估計總體均數(shù)所在范圍,要求資料服從正態(tài)分布或樣本量很大。答:對。二選擇題1在同一總體隨機抽樣,其他條件不變,樣本量越大,則總體均數(shù)的95%可信區(qū)間( A )。A 越窄 B 越寬 C 越可靠 D 越穩(wěn)定2從兩個不同總體中隨機抽樣,樣本含量相同,則兩總體均數(shù)95可信區(qū)間(D )。A 標準差小者,可信度大 B 標準差小者,準確度高C 標準差小者,可信度大且準確度高 D 兩者的可信度相同3其他條件不變,可信度1- 越大,則總體均數(shù)可信區(qū)間( A )A 越寬 B 越窄 C不變 D還與第二類錯誤有關(guān)4

45、其他條件不變,可信度1- 越大,則隨機抽樣所獲得的總體均數(shù)可信區(qū)間將不包含總體均數(shù)的概率( B )。A 越大 B 越小 C 不變 D 不確定5. 區(qū)間內(nèi)包含總體均數(shù)的概率為(D )。A 95 B 97.5 C 99 D 1006 從某正態(tài)總體中隨機抽樣,樣本含量固定, 區(qū)間內(nèi)包含樣本均數(shù)的概率為( A )。A 95 B 97.5 C 99 D 不確定7增大樣本含量,則錯誤的是( A )。A 可信區(qū)間的可信度變大 B x S 變小C 同樣可信度情況下,可信區(qū)間變窄 D 抽樣誤差減少8下列公式中,哪一個可以用于正態(tài)分布總體均數(shù)的95%可信區(qū)間的估計(C )。A ±1.96 X B 1.9

46、6 X ± C 0.05(v) X X ± t S D 0.05(v) X ± t S9由兩個獨立樣本計算得到兩個總體均數(shù)的可信區(qū)間,則下列結(jié)論中正確的是( C )。A 如果兩個可信區(qū)間無重疊,可認為兩樣本均數(shù)差別無統(tǒng)計意義B 如果兩個可信區(qū)間有重疊,可認為兩樣本均數(shù)差別有統(tǒng)計意義C 如果兩個可信區(qū)間無重疊,可認為兩樣本均數(shù)差別有統(tǒng)計意義D 以上都不對10在總體方差相等的條件下,由兩個獨立樣本計算兩個總體均數(shù)之差的可信區(qū)間包含了0,則( B )。A 可認為兩樣本均數(shù)差別無統(tǒng)計學(xué)意義B 可認為兩樣本均數(shù)差別有統(tǒng)計學(xué)意義C 可認為兩總體均數(shù)差別無統(tǒng)計學(xué)意義D 可認為兩

47、總體均數(shù)差別有統(tǒng)計學(xué)意義11假設(shè)檢驗中的第二類錯誤是指( D )所犯的錯誤。1.96 X ± 1.96 X ± A 拒絕了實際上成立的H0 B 未拒絕實際上成立的H0C 拒絕了實際上不成立的H0 D 未拒絕實際上不成立的H012. 兩樣本均數(shù)比較的假設(shè)檢驗中,差別有統(tǒng)計學(xué)意義時,P 越小,說明( D )。A. 兩樣本均數(shù)差別越大 B. 兩總體均數(shù)差別越大C. 越有理由認為兩樣本均數(shù)不同 D. 越有理由認為兩總體均數(shù)不同13作兩樣本均數(shù)差別的t 檢驗中,P 值與 值中( A )。A 值是研究者指定的 BP 值是研究者指定的C兩者意義相同,數(shù)值不同 D兩者意義相同,數(shù)值相同14

48、. 兩樣本均數(shù)的t 檢驗,按0.05 的檢驗水準拒絕H0,若此時推斷有誤,其錯誤的概率為( A )。A 0.05 B >0.05 C <0.05 D 不一定15.在樣本均數(shù)與總體均數(shù)差別的雙側(cè)顯著性檢驗中,結(jié)果為P< 而拒絕H0,接受H1,原因是( D )。A. H0 假設(shè)成立的可能性小于B. H1 假設(shè)成立的可能性大于1-C. H0 成立的可能性小于 且H1 成立的可能性大于1-D.從H0 成立的總體中隨機抽取一個樣本,其樣本均數(shù)比現(xiàn)有樣本的均數(shù)更遠離(H0 為真時)總體均數(shù)的可能性小于注:假設(shè)檢驗是反證法思想,即:考察0 H 為真情況下,樣本統(tǒng)計量出現(xiàn)背離0 H 并且逼近

49、1 H 的概率是否為小概率事件,所以假設(shè)檢驗中不涉及到0 H 成立的概率。三、統(tǒng)計分析題和簡答題1. 在假設(shè)檢驗中,當出現(xiàn)P > 時,雖然不能拒絕 H0,但不能推斷 H0成立。(提示:假設(shè)檢驗是基于反證法的思想)。答:假設(shè)檢驗是基于反證法的思想。拒絕H0是因為在H0為真的假設(shè)下樣本統(tǒng)計量出現(xiàn)在小概率事件范圍內(nèi),所以可以推斷H0非真;反之,在H0為真的假設(shè)下樣本統(tǒng)計量未出現(xiàn)在小概率事件范圍,只是沒有足夠證據(jù)支持不能拒絕H0。正如反證法只是尋找推翻假設(shè)的證據(jù),并不是尋找支持假設(shè)的證據(jù),不能推翻假設(shè)的結(jié)果并不能成為證實假設(shè)成立的證據(jù)。事實上,不拒絕H0 時犯第二類錯誤的概率 有時還很大,并且無

50、法由研究者直接控制,所以不拒絕H0 時,不能直接推斷H0 成立。2. 下面是18 例冠心病患者高密度脂蛋白(HDL,g/L)的測定結(jié)果,請回答下列問題。0.30,0.43,0.26,0.34,0.57,0.49,0.35,0.22,0.33,0.37,0.28,0.35,0.40,0.36,0.42,0.28,0.41,0.301)本題所研究的總體是什么?答:滿足者該研究中入選標準的全部冠心病患的高密度脂蛋白(HDL,g/L)實際值的全體構(gòu)成的集合。2)根據(jù)本題的研究背景和研究問題,請用研究背景語言給出本題總體均數(shù)的具體定義。答:滿足者該研究中入選標準的全部冠心病患的高密度脂蛋白(HDL,g/

51、L)實際值的平均數(shù)。3)試估計本題的總體均數(shù)及其95%可信區(qū)間,并用通俗的研究背景語言論述您的結(jié)果。答:X = 0.3589, 0.08567, 18, 0.08567 / 18 0.02 X S = n = S = = ,95%可信區(qū)間為: x X t s 0.05,17 ± =0.3589±2.11×0.02=(0.3167, 0.4011)。以95可信度推斷冠心病患者人群的高密度脂蛋白(HDL,g/L)的平均數(shù)在0.31670.4011 g/L。3. 已知大腸桿菌在飲用水中呈Poisson 分布,根據(jù)有關(guān)規(guī)定:對于合格的飲用水而言,平均每升飲用水中的大腸桿菌

52、個數(shù)不超過2 個,先在某飲用水生產(chǎn)處抽樣2L 水,經(jīng)檢測發(fā)現(xiàn)6 個大腸桿菌,請估計該處的飲用水平均1L 中的大腸桿菌數(shù)在什么范圍內(nèi)?答:X=6,查Poisson 分布總體均數(shù)的可信區(qū)間界值表得,95%的可信區(qū)間為(2.20/2, 13.06/2)=(1.10,6.53)。4. 續(xù)第3 題,在實際的衛(wèi)生監(jiān)督執(zhí)法中,一般不進行統(tǒng)計分析,但需要根據(jù)統(tǒng)計學(xué)原理和飲用水衛(wèi)生標準,指定一個飲用水大腸桿菌數(shù)的界值:隨機抽取1L 水,當檢測到的細菌數(shù)低于這個界值,可以推斷該處飲用水的平均1L 水的大腸桿菌數(shù)不會超過2 個,請以95的可信度確定這個界值。答: = 2,查 Poisson 分布總體均數(shù)的 95可信

53、區(qū)間界值表得到大于 2 的最小下限為X=6,其95%可信區(qū)間為(2.2,13.1),而X=5 的95可信區(qū)間為(1.6,11.7),所以當檢測結(jié)果為大腸桿菌數(shù)6 時,可以推斷該處飲用水的平均每升水的大腸桿菌數(shù) > 2,即該飲用水不合格。5. 續(xù)第3 題和第4 題,請推敲下列描述有何不同,適用于何種情況?1) 每1L 飲用水中的平均大腸桿菌個數(shù)不超過2 個是合格的2)合格的飲用水中,1L 飲用水的大腸桿菌個數(shù)不得高于于2 個3)第3 題中,能否按1L 水檢測到3 個大腸桿菌估計該處的飲用水平均每每1L 中的大腸桿菌數(shù)在什么范圍內(nèi),為什么?答:第一個問題是對于合格的飲用水而言,平均每1L 飲

54、用水的大腸桿菌個數(shù)不超過 2( 2),也就是在檢測樣品為 1 升飲用水時,容許樣品中的大腸桿菌數(shù)超過2 個。第二個問題是指檢測樣品為1 升水時,不容許樣品中的大腸桿菌數(shù)超過2個。(X 2)3)根據(jù)Poisson 分布的95可信區(qū)間推斷該處的飲用水平均每升中的大腸桿菌數(shù)在(0.62,8.8)第六章一、是非題1. 隨機區(qū)組設(shè)計的檢驗效能一定高于完全隨機設(shè)計答:錯。如果在完全隨機設(shè)計中,實驗條件和實驗過程控制都非常好,研究對象的同質(zhì)性非常好,幾乎不存在可能的混雜因素,即可以認為可能混雜效應(yīng)很小甚至可以忽略,則完全隨機設(shè)計的檢驗效能可能要高于隨機區(qū)組設(shè)計。2. 隨機對照試驗就是實驗性研究答:對。隨機對照試驗的英文名是Random control trial,縮寫為RCT。在隨機分組前,隨機對照試驗的研究對象來自同一人群,通過選擇不同的干預(yù),構(gòu)成試驗組和對照組,由此評價干預(yù)效應(yīng)。因此隨機對照試驗就是實驗性研究,但要注意:實驗性研究未必是隨機對照試驗。3. 隨機對照試驗就是完全隨機設(shè)計答:錯。隨機對照試驗貫徹了隨機化原則,對照組和實驗組間除實驗因素不同外,其他條件基本相同,研究設(shè)計可以是完全隨機對照設(shè)計,也可以是隨機區(qū)組設(shè)計。4. 采取隨機分組可以提高檢驗效能答:錯。采取隨機分組的主要目的是控制或減少混雜因素對結(jié)果的影響,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論