![必修三第二章-----統(tǒng)計(jì)知識點(diǎn)_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/18/a2d10c52-36cd-4ae6-b4f0-126da757faf8/a2d10c52-36cd-4ae6-b4f0-126da757faf81.gif)
![必修三第二章-----統(tǒng)計(jì)知識點(diǎn)_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/18/a2d10c52-36cd-4ae6-b4f0-126da757faf8/a2d10c52-36cd-4ae6-b4f0-126da757faf82.gif)
![必修三第二章-----統(tǒng)計(jì)知識點(diǎn)_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/18/a2d10c52-36cd-4ae6-b4f0-126da757faf8/a2d10c52-36cd-4ae6-b4f0-126da757faf83.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第二章 統(tǒng)計(jì)簡單隨機(jī)抽樣1. 總體和樣本總體:在統(tǒng)計(jì)學(xué)中,把研究對象的全體叫做總體.個體:把每個研究對象叫做個體.總體容量:把總體中個體的總數(shù)叫做總體容量.為了研究總體的有關(guān)性質(zhì),一般從總體中隨機(jī)抽取一局部:I ,=,''研究,我們稱它為樣本其中個體的個數(shù)稱為樣本容量。2簡單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類、排隊(duì)等,完全隨機(jī)地抽取調(diào)查單位。特點(diǎn):每個樣本單位被抽中的可能性相同概率相等,樣本的每個單位完全獨(dú)立,彼此間無一定的關(guān)聯(lián)性和排斥性。簡單隨機(jī)抽樣是其它各種抽樣形式的根底。 通常只是在總體單位之間 差異程度較小 和數(shù)目較少時,才采用這種方法。3簡單隨機(jī)
2、抽樣常用的方法:1抽簽法;隨機(jī)數(shù)表法;電腦模擬法;使用統(tǒng)計(jì)軟件直接抽取。在簡單隨機(jī)抽樣的樣本容量設(shè)計(jì)中,主要考慮:總體變異情況;允許誤差范圍;概率保證程度。4 .抽簽法:1給調(diào)查對象群體中的每一個對象編號;2準(zhǔn)備抽簽的工具,實(shí)施抽簽3對樣本中的每一個個體進(jìn)行測量或調(diào)查例:請調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動情況。5.隨機(jī)數(shù)表法:例:利用隨機(jī)數(shù)表在所在的班級中抽取10位同學(xué)參加某項(xiàng)活動。系統(tǒng)抽樣1系統(tǒng)抽樣等距抽樣或機(jī)械抽樣:把總體的單位進(jìn)行排序,再計(jì)算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機(jī)抽樣的方法抽取。K抽樣距離=N總體規(guī)模/n樣本規(guī)模前提條件:總體中個體的
3、排列對于研究的變量來說,應(yīng)是隨機(jī)的,即不存在某種與研究 變量相關(guān)的規(guī)那么分布??梢栽谡{(diào)查允許的條件下,從不同的樣本開始抽樣,比照幾次樣本的 特點(diǎn)。 如果有明顯差異, 說明樣本在總體中的分布承某種循環(huán)性規(guī)律, 且這種循環(huán)和抽樣距 離重合。2系統(tǒng)抽樣, 即等距抽樣是實(shí)際中最為常用的抽樣方法之一。因?yàn)樗鼘Τ闃涌虻囊筝^低,實(shí)施也比擬簡單。 更為重要的是, 如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用, 總體單 元按輔助變量的大小順序排隊(duì)的話,使用系統(tǒng)抽樣可以大大提高估計(jì)精度。2.1.3 分層抽樣1分層抽樣類型抽樣 :先將總體中的所有單位按照某種特征或標(biāo)志性別、年齡等劃分成假設(shè)干類型或?qū)?次,然后再在各
4、個類型或?qū)哟沃胁捎煤唵坞S機(jī)抽樣或系用抽樣的方法抽取一個子樣本, 最后, 將這些子樣本合起來構(gòu)成總體的樣本。兩種方法:1先以分層變量將總體劃分為假設(shè)干層,再按照各層在總體中的比例從各層中抽取。2先以分層變量將總體劃分為假設(shè)干層,再將各層中的元素按分層的順序整齊排列, 最后用系統(tǒng)抽樣的方法抽取樣本。2分層抽樣是把異質(zhì)性較強(qiáng)的總體分成一個個同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體 中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):1以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。2以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分 層變量。3以那些有明顯分層區(qū)分
5、的變量作為分層變量。3分層的比例問題: 1按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取 子樣本的方法。 2不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采 用該方法, 主要是便于對不同層次的子總體進(jìn)行專門研究或進(jìn)行相互比擬。 如果要用樣本資 料推斷總體時, 那么需要先對各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理, 調(diào)整樣本中各層的比例, 使數(shù)據(jù) 恢復(fù)到總體中各層實(shí)際的比例結(jié)構(gòu)。三種抽樣方法的比擬類另U共同點(diǎn)各自特點(diǎn)聯(lián)系適用范圍簡單隨機(jī)抽樣1抽樣過程中每個 個體被抽到的可 能性相等2每次抽出個體后 不再將它放回,即 不放回抽樣從總體中逐個抽取總體個數(shù)較少將總體
6、均分成幾部 分,按預(yù)先制定的規(guī)那么 在各局部抽取在起始局部 樣時采用簡 隨機(jī)抽樣總體個數(shù)較多系統(tǒng)抽樣將總體分成幾層,分層進(jìn)行抽取分層抽樣時采用簡單隨機(jī)抽樣或系統(tǒng)抽樣總體由 差異明 顯的幾 局部組成分層抽樣頻率分布直方圖與莖葉圖1、我們把樣本抽取后,要對樣本進(jìn)行分析來研究總體的分布情況,對樣本進(jìn)行分析常采取兩種方式:列頻率分布表;頻率分布直方圖.頻率分布 是指一個樣本數(shù)據(jù)在各個小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布。畫頻率分布直方圖一般步驟為:求極差即樣本中的最大值與最小值的差;決定組距與組數(shù)組數(shù)極差組距將數(shù)據(jù)分組;列頻率分布表.5畫頻率分布直方圖根據(jù)頻率分布表做頻率分布
7、直方圖應(yīng)注意兩點(diǎn):縱軸的意義:頻率組距橫軸的意義:樣本內(nèi)容每個矩形下面是組距.頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點(diǎn),就得到頻率分布折線圖2. 莖葉圖:當(dāng)數(shù)據(jù)是兩位有效數(shù)字時,用中間的數(shù)字表示十位數(shù),即第一個有效數(shù)字,兩邊的數(shù)字表示個位數(shù), 即第二個有效數(shù)字,它的中間局部像植物的莖,兩邊局部像植物莖上長出來的葉子, 因此通常把這樣的圖叫做莖葉圖。見課本P61例子制作莖葉圖的方法是:先將數(shù)據(jù)按大小進(jìn)行排列,再將所有兩位數(shù)的十位數(shù)字作為“莖,個位數(shù)字作為“葉,莖相同者共用一個莖,莖按從小到大的順序從上向以下出,共莖的葉一般按從大到小或從小到大的順序同行列出注意:在制作莖葉圖時,重
8、復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏,特別是“葉局部;同一數(shù)據(jù)出現(xiàn)幾次,就要在圖中表達(dá)幾次莖葉圖的特征:1用莖葉圖表示數(shù)據(jù)有兩個優(yōu)點(diǎn):一是從統(tǒng)計(jì)圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉圖中的數(shù)據(jù)可以隨時記錄,隨時添加,方便記錄與表示。2莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù),而且莖葉圖只方便記錄兩組的數(shù)據(jù),兩個以上的數(shù)據(jù)雖然能夠記錄,但是沒有表示兩個記錄那么直觀,清晰??傮w分布指的是總體取值的頻率分布規(guī)律,由于總體分布不易知道,因此我們往往用樣本的頻率分布去估計(jì)總體的分布。4總體的分布分兩種情況:當(dāng)總體中的個體取值很少時,用莖葉圖估計(jì)總體的分布;當(dāng)總體 中的個體取值較多時
9、, 將樣本數(shù)據(jù)恰當(dāng)分組, 用各組的頻率分布描述總體的分布,方法是用頻率分布表或頻率分布直方圖。制作頻率分布表時,假設(shè)容量是n,可按公式將數(shù)據(jù)分成大約K=1+lg n段。這類的經(jīng)驗(yàn)公式只對分段起參考作用二、典例精析例1:下表給出了某校500名12歲男孩中用隨機(jī)抽樣得出的120人的身高(單位cm )區(qū)間界限122,126)126,130)130,134)134,138)138,142)142,146)人數(shù)5810P 223320區(qū)間界限146,150)150,154)154,158)人數(shù)1165(1) 列出樣本頻率分布表;(2) 一畫出頻率分布直方圖; 估計(jì)身高小于134cm的人數(shù)占總?cè)藬?shù)的百分比
10、。用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征1、眾數(shù)、中位數(shù)、平均數(shù):眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)。中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在中間位置的一個數(shù)據(jù)或中間兩個數(shù)據(jù)的平均數(shù)叫做這組數(shù)據(jù)的中位數(shù)。2、 樣本標(biāo)準(zhǔn)差:ss2(X1 x)2 (X22X)2(XnX)n3方差2 s-(X1nX)2(X2X)2(XnX)2在刻畫樣本數(shù)據(jù)的分散程度上,方差和標(biāo)準(zhǔn)差是-一樣的,但在解決實(shí)際問題時,平均數(shù):XX1X2nXn用標(biāo)準(zhǔn)差。用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征分兩類:a用樣本平均數(shù)估計(jì)總體平均數(shù)。b用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差。樣本容量越大,估計(jì)就越精確。 特點(diǎn):1平均數(shù)對數(shù)據(jù)有“取齊的作用,代表
11、一組數(shù)據(jù)的平均水平。2標(biāo)準(zhǔn)差描述一組數(shù)據(jù)圍繞平均數(shù)波動的大小,反映了一組數(shù)據(jù)變化的幅度。4 用樣本估計(jì)總體時,如果抽樣的方法比擬合理,那么樣本可以反映總體的信息,但從樣 本得到的信息會有偏差。在隨機(jī)抽樣中,這種偏差是不可防止的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值和標(biāo)準(zhǔn)差,而只是一個估計(jì),但這種估計(jì)是合理的,特別是當(dāng)樣本量很大時,它們確實(shí)反映了總體的信 息。4. 1如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標(biāo)準(zhǔn)差不變2如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉淼?k倍3一組數(shù)據(jù)中的最大值和最小值對標(biāo)準(zhǔn)差的影響,區(qū)間(x 3
12、s, x3s的應(yīng)用;“去掉一個最高分,去掉一個最低分中的科學(xué)道理兩個變量的線性相關(guān)1、概念:如果散點(diǎn)圖中點(diǎn)的分布從整體看大致分布在一條直線的附近 量之間具有線性相關(guān)關(guān)系,我們稱這兩個變,這條直線叫回歸直線.1回歸直線方程:? bx an(X x)(yii 1b n% X)y)nXy nxyi 12"2X nx , *i 1a y bx其中b是回歸方程的斜率,a是截距系數(shù)4.求線性回歸方程的步驟(i)計(jì)算平均數(shù)x, y ;計(jì)算人與y的積,求Xi yi ;2XiYii 1n2Xii 1n xy -y,求 b;2nx計(jì)算Xi ;(4)將結(jié)果代入公式b用a y bx ,求a;(6)寫出回歸方程 +2. 取小二乘法3. 直線回歸方程的應(yīng)用1描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關(guān)系2利用回歸方程進(jìn)行預(yù)測
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- LY/T 2777-2024林化類固體產(chǎn)品生產(chǎn)綜合能耗
- 湘師大版道德與法治九年級下冊4.1《感受時代洗禮》聽課評課記錄
- 招商引資項(xiàng)目合同(2篇)
- 理療按摩技術(shù)加盟合同(2篇)
- 新北師大版小學(xué)數(shù)學(xué)一年級上冊《有幾棵樹》聽評課記錄
- 岳麓版歷史七年級下冊第26課《唐代的社會風(fēng)尚與文化》聽課評課記錄2
- 蘇教版數(shù)學(xué)九年級上冊聽評課記錄《1-2一元二次方程的解法(1)》
- 湘教版數(shù)學(xué)七年級上冊5.2《復(fù)式統(tǒng)計(jì)圖及統(tǒng)計(jì)圖的選擇》聽評課記錄1
- 中華書局版歷史七年級上冊第17課《三國兩晉南北朝的文化》聽課評課記錄
- 新版湘教版秋八年級數(shù)學(xué)上冊第一章分式課題同分母分式的加法和減法聽評課記錄
- 體質(zhì)健康概論
- 檔案管理流程優(yōu)化與效率提升
- 顱腦損傷的生物標(biāo)志物
- 2023高考語文實(shí)用類文本閱讀-新聞、通訊、訪談(含答案)
- 人工智能在商場應(yīng)用
- (完整word版)大格子作文紙模板(帶字?jǐn)?shù)統(tǒng)計(jì))
- 高考語文復(fù)習(xí):小說閱讀主觀題題型探究-解讀《理水》
- 物流營銷(第四版) 課件 第一章 物流營銷概述
- 藍(lán)印花布鑒賞課件
- 血液灌流流程及注意事項(xiàng)詳細(xì)圖解
- 5A+Chapter+2+Turning+over+a+new+leaf 英語精講課件
評論
0/150
提交評論