數(shù)據(jù)整理及數(shù)據(jù)的描述_第1頁(yè)
數(shù)據(jù)整理及數(shù)據(jù)的描述_第2頁(yè)
數(shù)據(jù)整理及數(shù)據(jù)的描述_第3頁(yè)
數(shù)據(jù)整理及數(shù)據(jù)的描述_第4頁(yè)
數(shù)據(jù)整理及數(shù)據(jù)的描述_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)整理及數(shù)據(jù)的描述1統(tǒng)計(jì)數(shù)據(jù) 來(lái)源:統(tǒng)計(jì)報(bào)表(制度)頻數(shù)(率)分布 直方圖-適當(dāng)分組,確定組限、組中值-編織頻數(shù)分布表重點(diǎn)調(diào)查典型調(diào)查抽樣調(diào)查非全面調(diào)查:全面調(diào)查:如第五次人口普查專(zhuān)門(mén)調(diào)查2例 共50人 5060 5人 6070 11人 7080 17人 8090 11人 90100 6人 成績(jī)(分)頻數(shù)(次)頻率(%)累計(jì)頻率(%)5060510.010.060701122.032.070801734.066.080901122.088.090100612.0100.0合計(jì)50100-3直方圖頻率(%)頻數(shù)(人)112251055657585954分布特征 從直方圖到分布曲線直方圖給出一種

2、“分布”的直觀形式鐘型分布 如身高、體重、成績(jī) U型分布 如人群健康(生?。┱碕型5勞倫茲曲線 本世紀(jì)初 將兩種累計(jì)頻率對(duì)應(yīng)圖示 前例50人 總分3770分010326688100100856026.57.36基尼系數(shù) A/(A+B) 越小越均勻(公平)思考:與ABC分類(lèi)法的關(guān)系?例 6,9,12,15,18 寬度定為1時(shí),所繪圖形上 可以面積表示頻率大小 任何一個(gè)關(guān)于頻率的直方圖,可以經(jīng)適當(dāng)度量變換,以分布形狀的面積大小來(lái)度量頻率大小。 如某地區(qū)2010075%0.31.642.17分布的數(shù)字特征均值:X(Xi)/n離散趨勢(shì)方差:S2 (XiX)2(n-1)例:6,9,12,15,18均值

3、:X(6+9+12+15+18)/5 12 方差:S2 36+9+0+9+364=22.58從直方圖描述到分布描述9隨機(jī)變量及其概率分布 前例6,9,12,15,18可以看作一種客觀存在的分布 從另一個(gè)觀點(diǎn),如果5個(gè)數(shù)中每次取一個(gè),則有P(X=6)=1/5, P(X=9)= 1/5,P(X=18)=1/5. 由6,9,12,15,18等可能的隨機(jī)產(chǎn)生的性質(zhì),我們得到了概率分布圖。若適當(dāng)選取度量單位,如使每個(gè)直方條的寬度為1,則可以用面積大小表示概率大小,如P(9=X=15)=0.6,即途中三個(gè)直方條的面積總和。于是現(xiàn)在我們可以用函數(shù)描述與處理隨機(jī)現(xiàn)象。 概率意義上的平均值,稱(chēng)數(shù)學(xué)期望 (有時(shí)我

4、們不再區(qū)分兩者,其意自明)10伯努利分布拋硬幣正面X=1,P(X=1)=1/2 反面X=0,P(X=0)=1/210個(gè)產(chǎn)品中2個(gè)次品,取一件,得正品為1,次品為0。有P(X=1)=8/10,P(X=0)=1/5,一般設(shè)P(X=1)=p P(X=0)=q=1-p(0p1)可以計(jì)算E(X)=1*p+0*q=p Var(X) =(1-p)2p+(1-p)2q=q2p+p2q=pq11二項(xiàng)分布(N重伯努利分布)設(shè)產(chǎn)品中正品率位p,次品率為q=1-p,抽后放回,重復(fù)n此,以k表示n池中得到正品的次數(shù),則有重要結(jié)果 E(X)=np Var(X)=npq12正態(tài)分布前例,某地區(qū)身高分布 同樣可做兩種理解:

5、大量數(shù)據(jù)整理后的頻率直方圖 任取一人,其身高的概率分布圖 身高、體重、成績(jī)、加工零件的尺寸等均服從這種分布,稱(chēng)“正態(tài)分布”。 總體兩大,分組越細(xì)越近于曲線,為便于用數(shù)學(xué)手段進(jìn)行分析,有其“理論模式”13抽樣分布與抽樣定理14抽樣與抽樣分布總體與樣本 總體:所論全體,大集合樣本:抽取部分,子集目的:以樣本去反映,“代表” 總體??傮w分布是最全面的信息,往往不知道;通過(guò)抽樣,取得數(shù)據(jù),如樣本均值、方差得去看主題。重要的是分析 的分布與總體分布之間或與總體參數(shù) 、 等的關(guān)系。 215抽樣分布就是抽樣均值 所遵循的分布。如 抽樣一次,但 理論上應(yīng)付從某種與總體參數(shù)有關(guān)的分布P910111213141516樣本均值與樣本方差 = = n2n - 117抽樣定理總體為正態(tài)時(shí)成立,均值不變,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論