




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2.1 隨機(jī)抽樣,2.1.2 簡單隨機(jī)抽樣,2.1.2 系統(tǒng)抽樣,2.1.3 分層抽樣,一、簡單隨機(jī)抽樣: 一般地,設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)不放回地抽取n個(gè)個(gè)體(nN)作為樣本,且每次抽取時(shí)各個(gè)個(gè)體被抽到的概率都相等的抽取樣本的方法,就稱為簡單隨機(jī)抽樣。,二、簡單隨機(jī)抽樣常用的方法:,(1)抽簽法,(2)隨機(jī)數(shù)表法,抽簽法的優(yōu)點(diǎn): 抽簽法簡單易行,當(dāng)總體中的個(gè)體不多時(shí),使總體處于“均勻攪拌”的狀態(tài)較容易,這時(shí),每個(gè)個(gè)體有均等的機(jī)會被抽出,從而能保證樣本的代表性。,抽簽法的缺點(diǎn): 當(dāng)總體的個(gè)體很多時(shí),將總體“均勻攪拌”就比較 困難,不能保證每個(gè)個(gè)體由均等的機(jī)會被抽出,從而 樣本的代表性就
2、差。,抽簽法的步驟為(從含有N個(gè)個(gè)體的總體中,抽取n個(gè) 個(gè)體(nN)作為樣本):,總體中的所有個(gè)體編號(號碼可以從1到N),把號碼寫在形狀、大小相同的號簽上(號簽可以 用小球、卡片、紙條等制作),將這些號簽放在同一個(gè)箱子里,進(jìn)行均勻攪拌。,每次從中抽出1個(gè)好錢,并記錄其編號,連續(xù)抽取幾次。,從總體中將與抽到的簽的編號相一致的個(gè)體去處,就得到一個(gè)容量為N的樣本。(當(dāng)總體的個(gè)體數(shù)不多時(shí)適宜采用這種方法),用隨機(jī)數(shù)表法來抽取樣本的一般步驟:,對總體的個(gè)體進(jìn)行編號(每個(gè)號碼位數(shù)盡量一致),在隨機(jī)數(shù)表中任選一個(gè)數(shù)作為開始。,從選定的數(shù)開始按一定的方向讀下去,得到的數(shù)碼若不在編號內(nèi),則跳過去,若在內(nèi),則取
3、出;如果得到的號碼前面已經(jīng)取出,也跳過去。如此繼續(xù)下去,直到取滿為止。,根據(jù)選定的號碼抽取樣本。,2.2 用樣本估計(jì)總體,1、求極差(即一組數(shù)據(jù)中最大值與最小值的差),2、決定組距與組數(shù)(將數(shù)據(jù)分組),3、 將數(shù)據(jù)分組,畫頻率分布直方圖的步驟:,4、列出頻率分布表.,5、畫出頻率分布直方圖。,組距:指每個(gè)小組的兩個(gè)端點(diǎn)的距離,組距 組數(shù):將數(shù)據(jù)分組,當(dāng)數(shù)據(jù)在100個(gè)以內(nèi)時(shí), 按數(shù)據(jù)多少常分5-12組。,頻率分布直方圖如下:,連接頻率分布直方圖中各小長方形上端的中點(diǎn),得到頻率分布折線圖,當(dāng)樣本容量無限增大,組距無限縮小,那么頻率分布直方圖就會無限接近于一條光滑曲線總體密度曲線。,總體密度曲線,月
4、均用水量/t,a,b,(圖中陰影部分的面積,表示總體在某個(gè)區(qū)間 (a, b) 內(nèi)取值的百分比)。,莖葉圖,甲,乙,0 1 2 3 4 5,2 5 5 4 1 6 1 6 7 9 4 9 0,8 4 6 3 6 8 3 8 9 1,畫莖葉圖的步驟如下:,(1)將每個(gè)數(shù)據(jù)分為莖(高位)和葉(低位)兩部分;,(2)將最小莖和最大莖之間的數(shù)按大小次序排成一列,寫在一側(cè);,(3)將各個(gè)數(shù)據(jù)的葉按大小次序?qū)懺谄淝o的另一側(cè)。,幾種表示頻率分布的方法的優(yōu)點(diǎn)與不足:,(1)頻率分布表在數(shù)量表示上比較確切,但不夠直觀、形象,分析數(shù)據(jù)分 布的總體態(tài)勢不太方便。 (2)頻率分布直方圖能夠很容易地表示大量數(shù)據(jù),非常直觀
5、地表明分布的 形狀,使我們能夠看到在分布表中看不清楚的數(shù)據(jù)模式。但是從直方圖本身 得不出原始的數(shù)據(jù)內(nèi)容,也就是說,把數(shù)據(jù)表示成直方圖后,原有的具體數(shù) 據(jù)信息就被抹掉了。 (3)頻率分布折線圖的優(yōu)點(diǎn)是它反映了數(shù)據(jù)的變化趨勢。如果樣本容量不 斷增大,分組的組距不斷縮小,那么折線圖就趨向于總體分布的密度曲線。 (4)用莖葉圖刻畫數(shù)據(jù)有兩個(gè)優(yōu)點(diǎn):一是所有的信息都可以從這個(gè)莖葉圖 中得到;二是莖葉圖便于記錄和表示,能夠展示數(shù)據(jù)的分布情況。但當(dāng)樣本 數(shù)據(jù)較多或數(shù)據(jù)位數(shù)較多時(shí),莖葉圖就顯得不太方便了。,一 、眾數(shù)、中位數(shù)、平均數(shù)的概念,2、中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個(gè)數(shù)據(jù)(或最中
6、間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù),1、眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù),眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應(yīng)用最為廣泛.,3、平均數(shù): 一般地,如果n個(gè)數(shù) ,那 么, 叫做這n個(gè)數(shù)的平均數(shù)。,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,2.25,歸納總結(jié)得: 因?yàn)樵陬l率分布直方圖中,各小長方形的面積表示相應(yīng)各組的頻率,也顯示出樣本數(shù)據(jù)落在各小組的比例的大小,所以從圖中可以看到,在區(qū)間2,2.5)的小長方形的面積最大,
7、即這組的頻率是最大的,也就是說月均用水量在區(qū)間2,2.5)內(nèi)的居民最多,即眾數(shù)就是在區(qū)間2,2.5)內(nèi)。 眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中, 就是最高矩形的中點(diǎn)的橫坐標(biāo)。,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:中位數(shù)左邊的數(shù)據(jù)個(gè)數(shù)與右邊的數(shù)據(jù)個(gè)數(shù)是相等的。,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四個(gè)小矩形的面積和=0.49,后四個(gè)小矩形的面積和=0.
8、26,2.02,歸納總結(jié)得: 在樣本中,有50的個(gè)體小于或等于中位數(shù),也有50的個(gè)體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可以估計(jì)中位數(shù)的值。在這個(gè)頻率分布直方圖中,左邊的直方圖的面積代表50個(gè)單位,右邊的直方圖也是代表50個(gè)單位,它們的分界線與x軸交點(diǎn)的橫坐標(biāo)就是中位數(shù)。 中位數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中, 就是把頻率分布直方圖劃分左右兩個(gè)面積 相等的分界線與x軸交點(diǎn)的橫坐標(biāo)。,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,提示:
9、在頻率分布直方圖中,各個(gè)組的平均數(shù)如何找?,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,.,.,.,.,.,.,.,.,.,0.75,1.75,2.25,2.75,3.25,3.75,4.25,1.25,0.5,提示:與小長方形面積的比例有關(guān)嗎?,0.5,2.5,2,1.5,1,4,3.5,3,4.5,頻率 組距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,2.02,.,.,.,.,.,.,.,.,.,0.75,1.75,2.25,2.
10、75,3.25,3.75,4.25,1.25,0.5,總結(jié)歸納得: 平均數(shù)是頻率分布直方圖的“重心”,是直方圖的平衡點(diǎn)。 先找出每個(gè)小長方形的“重心”,即每小組的平均數(shù),再按比例算出直方圖的平均數(shù)。 平均數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,等于頻率分布圖中每個(gè)小長方形面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和。,三種數(shù)字特征的優(yōu)缺點(diǎn):,(1)眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點(diǎn),但它顯然對其他 數(shù)據(jù)信息的忽視了使得無法客觀地反映總體特征,(2)中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù) 幾個(gè)極端值的影響,這在某些情況下是優(yōu)點(diǎn),但它對極端 值的不敏感有時(shí)也會成為缺點(diǎn)。,(3)平均數(shù)與每一個(gè)樣本的數(shù)據(jù)有關(guān),與眾數(shù)、中位 數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù) 據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響 較大,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥物靶點(diǎn)鑒定-洞察闡釋
- 神經(jīng)性嘔吐的社會管理態(tài)度與文化因素-洞察闡釋
- 情感計(jì)算在AR交互中的應(yīng)用探索-洞察闡釋
- 2025至2030中國登記柜臺行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢及投資規(guī)劃深度研究報(bào)告
- 2025至2030中國電子門鎖行業(yè)深度研究及發(fā)展前景投資評估分析
- 2025至2030中國瑜珈褲行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢及投資規(guī)劃深度研究報(bào)告
- 非遺研學(xué)旅游的可持續(xù)發(fā)展與生態(tài)保護(hù)路徑研究
- 教育機(jī)器人引領(lǐng)未來學(xué)習(xí)新體驗(yàn)
- 游戲化學(xué)習(xí)在教育科技領(lǐng)域的應(yīng)用與前景
- 商業(yè)環(huán)境中教育心理學(xué)的價(jià)值體現(xiàn)
- 廣州市藝術(shù)中學(xué)招聘教師考試真題2024
- 工業(yè)自動(dòng)化設(shè)備保修及維修管理措施
- 期末作文預(yù)測外研版七年級英語下冊
- 2025-2030中國兒童魚油行業(yè)銷售動(dòng)態(tài)及競爭策略分析報(bào)告
- GB/T 4153-2008混合稀土金屬
- 《一粒種子》課件
- 弘揚(yáng)錢學(xué)森精神PPT忠誠擔(dān)當(dāng)踐行科學(xué)報(bào)國之志PPT課件(帶內(nèi)容)
- 上半年我國經(jīng)濟(jì)形勢分析與公司應(yīng)對策略
- 小學(xué)語文人教五年級下冊(統(tǒng)編)第六單元-15、自相矛盾學(xué)歷案
- 中國教育學(xué)會會員申請表
- 黃大年式教師團(tuán)隊(duì)申報(bào)
評論
0/150
提交評論