必修三第二章-----統(tǒng)計(jì)知識點(diǎn)_第1頁
必修三第二章-----統(tǒng)計(jì)知識點(diǎn)_第2頁
必修三第二章-----統(tǒng)計(jì)知識點(diǎn)_第3頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二章 統(tǒng)計(jì)簡單隨機(jī)抽樣1. 總體和樣本總體:在統(tǒng)計(jì)學(xué)中,把研究對象的全體叫做總體.個體:把每個研究對象叫做個體.總體容量:把總體中個體的總數(shù)叫做總體容量.為了研究總體的有關(guān)性質(zhì),一般從總體中隨機(jī)抽取一局部:I ,=,''研究,我們稱它為樣本其中個體的個數(shù)稱為樣本容量。2簡單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類、排隊(duì)等,完全隨機(jī)地抽取調(diào)查單位。特點(diǎn):每個樣本單位被抽中的可能性相同概率相等,樣本的每個單位完全獨(dú)立,彼此間無一定的關(guān)聯(lián)性和排斥性。簡單隨機(jī)抽樣是其它各種抽樣形式的根底。 通常只是在總體單位之間 差異程度較小 和數(shù)目較少時,才采用這種方法。3簡單隨機(jī)

2、抽樣常用的方法:1抽簽法;隨機(jī)數(shù)表法;電腦模擬法;使用統(tǒng)計(jì)軟件直接抽取。在簡單隨機(jī)抽樣的樣本容量設(shè)計(jì)中,主要考慮:總體變異情況;允許誤差范圍;概率保證程度。4 .抽簽法:1給調(diào)查對象群體中的每一個對象編號;2準(zhǔn)備抽簽的工具,實(shí)施抽簽3對樣本中的每一個個體進(jìn)行測量或調(diào)查例:請調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動情況。5.隨機(jī)數(shù)表法:例:利用隨機(jī)數(shù)表在所在的班級中抽取10位同學(xué)參加某項(xiàng)活動。系統(tǒng)抽樣1系統(tǒng)抽樣等距抽樣或機(jī)械抽樣:把總體的單位進(jìn)行排序,再計(jì)算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機(jī)抽樣的方法抽取。K抽樣距離=N總體規(guī)模/n樣本規(guī)模前提條件:總體中個體的

3、排列對于研究的變量來說,應(yīng)是隨機(jī)的,即不存在某種與研究 變量相關(guān)的規(guī)那么分布??梢栽谡{(diào)查允許的條件下,從不同的樣本開始抽樣,比照幾次樣本的 特點(diǎn)。 如果有明顯差異, 說明樣本在總體中的分布承某種循環(huán)性規(guī)律, 且這種循環(huán)和抽樣距 離重合。2系統(tǒng)抽樣, 即等距抽樣是實(shí)際中最為常用的抽樣方法之一。因?yàn)樗鼘Τ闃涌虻囊筝^低,實(shí)施也比擬簡單。 更為重要的是, 如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用, 總體單 元按輔助變量的大小順序排隊(duì)的話,使用系統(tǒng)抽樣可以大大提高估計(jì)精度。2.1.3 分層抽樣1分層抽樣類型抽樣 :先將總體中的所有單位按照某種特征或標(biāo)志性別、年齡等劃分成假設(shè)干類型或?qū)?次,然后再在各

4、個類型或?qū)哟沃胁捎煤唵坞S機(jī)抽樣或系用抽樣的方法抽取一個子樣本, 最后, 將這些子樣本合起來構(gòu)成總體的樣本。兩種方法:1先以分層變量將總體劃分為假設(shè)干層,再按照各層在總體中的比例從各層中抽取。2先以分層變量將總體劃分為假設(shè)干層,再將各層中的元素按分層的順序整齊排列, 最后用系統(tǒng)抽樣的方法抽取樣本。2分層抽樣是把異質(zhì)性較強(qiáng)的總體分成一個個同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體 中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):1以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。2以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分 層變量。3以那些有明顯分層區(qū)分

5、的變量作為分層變量。3分層的比例問題: 1按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取 子樣本的方法。 2不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采 用該方法, 主要是便于對不同層次的子總體進(jìn)行專門研究或進(jìn)行相互比擬。 如果要用樣本資 料推斷總體時, 那么需要先對各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理, 調(diào)整樣本中各層的比例, 使數(shù)據(jù) 恢復(fù)到總體中各層實(shí)際的比例結(jié)構(gòu)。三種抽樣方法的比擬類另U共同點(diǎn)各自特點(diǎn)聯(lián)系適用范圍簡單隨機(jī)抽樣1抽樣過程中每個 個體被抽到的可 能性相等2每次抽出個體后 不再將它放回,即 不放回抽樣從總體中逐個抽取總體個數(shù)較少將總體

6、均分成幾部 分,按預(yù)先制定的規(guī)那么 在各局部抽取在起始局部 樣時采用簡 隨機(jī)抽樣總體個數(shù)較多系統(tǒng)抽樣將總體分成幾層,分層進(jìn)行抽取分層抽樣時采用簡單隨機(jī)抽樣或系統(tǒng)抽樣總體由 差異明 顯的幾 局部組成分層抽樣頻率分布直方圖與莖葉圖1、我們把樣本抽取后,要對樣本進(jìn)行分析來研究總體的分布情況,對樣本進(jìn)行分析常采取兩種方式:列頻率分布表;頻率分布直方圖.頻率分布 是指一個樣本數(shù)據(jù)在各個小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布。畫頻率分布直方圖一般步驟為:求極差即樣本中的最大值與最小值的差;決定組距與組數(shù)組數(shù)極差組距將數(shù)據(jù)分組;列頻率分布表.5畫頻率分布直方圖根據(jù)頻率分布表做頻率分布

7、直方圖應(yīng)注意兩點(diǎn):縱軸的意義:頻率組距橫軸的意義:樣本內(nèi)容每個矩形下面是組距.頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點(diǎn),就得到頻率分布折線圖2. 莖葉圖:當(dāng)數(shù)據(jù)是兩位有效數(shù)字時,用中間的數(shù)字表示十位數(shù),即第一個有效數(shù)字,兩邊的數(shù)字表示個位數(shù), 即第二個有效數(shù)字,它的中間局部像植物的莖,兩邊局部像植物莖上長出來的葉子, 因此通常把這樣的圖叫做莖葉圖。見課本P61例子制作莖葉圖的方法是:先將數(shù)據(jù)按大小進(jìn)行排列,再將所有兩位數(shù)的十位數(shù)字作為“莖,個位數(shù)字作為“葉,莖相同者共用一個莖,莖按從小到大的順序從上向以下出,共莖的葉一般按從大到小或從小到大的順序同行列出注意:在制作莖葉圖時,重

8、復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏,特別是“葉局部;同一數(shù)據(jù)出現(xiàn)幾次,就要在圖中表達(dá)幾次莖葉圖的特征:1用莖葉圖表示數(shù)據(jù)有兩個優(yōu)點(diǎn):一是從統(tǒng)計(jì)圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉圖中的數(shù)據(jù)可以隨時記錄,隨時添加,方便記錄與表示。2莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù),而且莖葉圖只方便記錄兩組的數(shù)據(jù),兩個以上的數(shù)據(jù)雖然能夠記錄,但是沒有表示兩個記錄那么直觀,清晰??傮w分布指的是總體取值的頻率分布規(guī)律,由于總體分布不易知道,因此我們往往用樣本的頻率分布去估計(jì)總體的分布。4總體的分布分兩種情況:當(dāng)總體中的個體取值很少時,用莖葉圖估計(jì)總體的分布;當(dāng)總體 中的個體取值較多時

9、, 將樣本數(shù)據(jù)恰當(dāng)分組, 用各組的頻率分布描述總體的分布,方法是用頻率分布表或頻率分布直方圖。制作頻率分布表時,假設(shè)容量是n,可按公式將數(shù)據(jù)分成大約K=1+lg n段。這類的經(jīng)驗(yàn)公式只對分段起參考作用二、典例精析例1:下表給出了某校500名12歲男孩中用隨機(jī)抽樣得出的120人的身高(單位cm )區(qū)間界限122,126)126,130)130,134)134,138)138,142)142,146)人數(shù)5810P 223320區(qū)間界限146,150)150,154)154,158)人數(shù)1165(1) 列出樣本頻率分布表;(2) 一畫出頻率分布直方圖; 估計(jì)身高小于134cm的人數(shù)占總?cè)藬?shù)的百分比

10、。用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征1、眾數(shù)、中位數(shù)、平均數(shù):眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)。中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在中間位置的一個數(shù)據(jù)或中間兩個數(shù)據(jù)的平均數(shù)叫做這組數(shù)據(jù)的中位數(shù)。2、 樣本標(biāo)準(zhǔn)差:ss2(X1 x)2 (X22X)2(XnX)n3方差2 s-(X1nX)2(X2X)2(XnX)2在刻畫樣本數(shù)據(jù)的分散程度上,方差和標(biāo)準(zhǔn)差是-一樣的,但在解決實(shí)際問題時,平均數(shù):XX1X2nXn用標(biāo)準(zhǔn)差。用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征分兩類:a用樣本平均數(shù)估計(jì)總體平均數(shù)。b用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差。樣本容量越大,估計(jì)就越精確。 特點(diǎn):1平均數(shù)對數(shù)據(jù)有“取齊的作用,代表

11、一組數(shù)據(jù)的平均水平。2標(biāo)準(zhǔn)差描述一組數(shù)據(jù)圍繞平均數(shù)波動的大小,反映了一組數(shù)據(jù)變化的幅度。4 用樣本估計(jì)總體時,如果抽樣的方法比擬合理,那么樣本可以反映總體的信息,但從樣 本得到的信息會有偏差。在隨機(jī)抽樣中,這種偏差是不可防止的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值和標(biāo)準(zhǔn)差,而只是一個估計(jì),但這種估計(jì)是合理的,特別是當(dāng)樣本量很大時,它們確實(shí)反映了總體的信 息。4. 1如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標(biāo)準(zhǔn)差不變2如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉淼?k倍3一組數(shù)據(jù)中的最大值和最小值對標(biāo)準(zhǔn)差的影響,區(qū)間(x 3

12、s, x3s的應(yīng)用;“去掉一個最高分,去掉一個最低分中的科學(xué)道理兩個變量的線性相關(guān)1、概念:如果散點(diǎn)圖中點(diǎn)的分布從整體看大致分布在一條直線的附近 量之間具有線性相關(guān)關(guān)系,我們稱這兩個變,這條直線叫回歸直線.1回歸直線方程:? bx an(X x)(yii 1b n% X)y)nXy nxyi 12"2X nx , *i 1a y bx其中b是回歸方程的斜率,a是截距系數(shù)4.求線性回歸方程的步驟(i)計(jì)算平均數(shù)x, y ;計(jì)算人與y的積,求Xi yi ;2XiYii 1n2Xii 1n xy -y,求 b;2nx計(jì)算Xi ;(4)將結(jié)果代入公式b用a y bx ,求a;(6)寫出回歸方程 +2. 取小二乘法3. 直線回歸方程的應(yīng)用1描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關(guān)系2利用回歸方程進(jìn)行預(yù)測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論