社會統(tǒng)計(jì)學(xué):第4章 正態(tài)分布_第1頁
社會統(tǒng)計(jì)學(xué):第4章 正態(tài)分布_第2頁
社會統(tǒng)計(jì)學(xué):第4章 正態(tài)分布_第3頁
社會統(tǒng)計(jì)學(xué):第4章 正態(tài)分布_第4頁
社會統(tǒng)計(jì)學(xué):第4章 正態(tài)分布_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第4章正態(tài)分布4.1概率4.2二項(xiàng)分布及其它離散型隨機(jī)變量的分布(選讀)4.3正態(tài)分布描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系反映客觀現(xiàn)象的數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(jì)(利用樣本信息和概率論對總體的數(shù)量特征進(jìn)行估計(jì)和檢驗(yàn)等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(jì)(統(tǒng)計(jì)數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)4.1概率一、隨機(jī)現(xiàn)象隨機(jī)性、統(tǒng)計(jì)規(guī)律性二、隨機(jī)事件隨機(jī)事件(簡稱事件):隨機(jī)現(xiàn)象的每一個(gè)可能結(jié)果及其集合。擲一顆骰子出現(xiàn)的點(diǎn)數(shù)為3誕生的嬰兒將是男孩某人將活到90歲三、概率是隨機(jī)事件發(fā)生可能性的大小的數(shù)量表示。4.1.1隨機(jī)事件與概率四、概率和頻率的關(guān)系☆頻率是試驗(yàn)值,具有隨機(jī)性;概率是理論值,具有唯一性?!町?dāng)N趨近于無窮大(或充分大)時(shí),某隨機(jī)事件出現(xiàn)的概率可以用其頻率來近似。(頻率亦具有統(tǒng)計(jì)規(guī)律性)

見p67表3-1和圖3-1一、隨機(jī)變量隨機(jī)變量是以“量”的形式來描述隨機(jī)現(xiàn)象。比較隨機(jī)變量與普通變量(固定變量)“圓的面積”與“擲一枚硬幣出現(xiàn)的結(jié)果”二、概率分布隨機(jī)變量每一種可能的取值及每一種取值所對應(yīng)的概率是多少。4.1.2隨機(jī)變量與概率分布概率分布概率分布的一般形式為:(X1,P1)(X2,P2)

(Xn,Pn)

離散型隨機(jī)變量

(discreterandomvariables)隨機(jī)變量只能取有限個(gè)數(shù)值或可列無窮多個(gè)數(shù)值,即所有取值都可以逐個(gè)列舉出來x1,x2,…這些取值都有確定的概率;包括所有的變量層次;3.試驗(yàn)隨機(jī)變量可能的取值抽查100個(gè)人一家餐館營業(yè)一天銷售一輛汽車不贊同改革的人數(shù)顧客數(shù)顧客性別0,1,2,…,1000,1,2,…男性,女性連續(xù)型隨機(jī)變量

(continuousrandomvariables)指它的可能取值是連續(xù)的充滿某個(gè)區(qū)間,即可以取一個(gè)或多個(gè)區(qū)間中任何值;所有可能取值不可以逐個(gè)列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)。(x)xab3.變量的層次包括定距以上的變量試驗(yàn)隨機(jī)變量可能的取值統(tǒng)計(jì)一批工人的工資測量一個(gè)學(xué)生的身高工資數(shù)(元)測量誤差(cm)X

0X

04.2二項(xiàng)分布及其它離散型隨機(jī)變量的分布

(選讀)兩點(diǎn)分布一個(gè)離散型隨機(jī)變量只有兩個(gè)可能的取值習(xí)慣上用0和1兩個(gè)代碼來表示;2.它們的概率分布為

也稱0-1分布二項(xiàng)分布重復(fù)進(jìn)行n

次試驗(yàn),每次試驗(yàn)只有兩種可能結(jié)果。出現(xiàn)“成功”的次數(shù)的概率分布稱為二項(xiàng)分布,記為~B(n,p)注:要求滿足隨機(jī)試驗(yàn)的條件,即各次的試驗(yàn)都是獨(dú)立的。適合大群體的研究。例見124頁【例8】泊松分布

(Poissondistribution二項(xiàng)分布當(dāng)n很大,p很小時(shí),設(shè),則將二項(xiàng)分布的極限分布稱為泊松分布,記作

適合稀少事件的研究,即概率值很小的情況。超幾何分布小組有10名成員,其中男性7名?,F(xiàn)從中任抽3名,問男性人數(shù)的概率分布。超幾何分布設(shè)總體性質(zhì)共分為兩類:A類與非A類。總體總數(shù)為N,A類共有M個(gè)。從中任抽n個(gè),則n中含有A類個(gè)數(shù)的概率分布為:適合小群體的研究智商的分布圖4.3正態(tài)分布

(normaldistribution)由德國數(shù)學(xué)家C.F.高斯(CarlFriedrichGauss,1777—1855)提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來描述經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的任意一個(gè)值;它取任何一個(gè)特定的值的概率都等于0;不能列出每一個(gè)值及其相應(yīng)的概率;通常研究它取某一區(qū)間值的概率;用概率密度函數(shù)來描述。概率密度函數(shù)

(probabilitydensityfunction)設(shè)

為一連續(xù)型隨機(jī)變量,x

為任意實(shí)數(shù),的概率密度函數(shù)記為,它滿足條件(1)(2)(3)(4)-2020.00.10.20.30.4概率密度的性質(zhì)概率密度函數(shù)

對于任何實(shí)數(shù)a<b,P(a<b)是該曲線下從a到的b面積(x)xab概率是曲線下的面積正態(tài)分布的概率密度函數(shù)

=正態(tài)隨機(jī)變量的均值

=正態(tài)隨機(jī)變量的方差

=3.1415926;e=2.71828x=隨機(jī)變量的取值(-

<x<

)正態(tài)分布函數(shù)的性質(zhì)

圖形是關(guān)于x=

對稱鐘形曲線,且峰值在x=

處(一個(gè)高峰、一個(gè)對稱軸)均值

和標(biāo)準(zhǔn)差

一旦確定,分布的具體形式也惟一確定(兩個(gè)參數(shù))x(x)

對正態(tài)曲線的影響x(x)CAB

=1/2

1

2

=1正態(tài)分布函數(shù)的性質(zhì)3.均值為實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。

越大,正態(tài)曲線扁平;

越小,正態(tài)曲線越高陡峭4.當(dāng)X的取值向橫軸左右兩個(gè)方向無限延伸時(shí),曲線的兩個(gè)尾端也無限漸近橫軸,理論上永遠(yuǎn)不會與之相交(以橫軸為漸近線)正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1

總體均值是,方差是7、正態(tài)曲線下面積的分布規(guī)律

通過對密度函數(shù)積分我們可以知道正態(tài)曲線下,橫軸上所夾的面積為1。而每一部分的面積也是可以計(jì)算出來的。范圍內(nèi)曲線下的面積占總面積的68.27%;

±2

范圍內(nèi)曲線下的面積占總面積的95.45%;

±3

范圍內(nèi)曲線下的面積占總面%積的99.73%。思考:為什么用

計(jì)算的單位,而不用原來的度量單位呢??因?yàn)?,不同的變量會有不同的度量單位(如工資用“元”,年齡用“歲”),即使同一變量也可能用不同的度量單位(如工資用“元”,或“十元”、“百元”等),結(jié)果形成不同大小和不同形狀的分布曲線,他們的均值和標(biāo)準(zhǔn)差也各不相同。如果分別計(jì)算每一正態(tài)曲線下的面積就非常麻煩。?以標(biāo)準(zhǔn)差為單位,可以使正態(tài)分布標(biāo)準(zhǔn)化,不受變量度量單位的影響,簡化計(jì)算。即無論何種變量及度量單位,在一定標(biāo)準(zhǔn)差范圍內(nèi),個(gè)案的比例是一定的。標(biāo)準(zhǔn)正態(tài)分布

(standardizethenormaldistribution)隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布任何一個(gè)一般的正態(tài)分布,可通過下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布

標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)標(biāo)準(zhǔn)正態(tài)分布

(page150)Xms一般正態(tài)分布

=1Z標(biāo)準(zhǔn)正態(tài)分布

標(biāo)準(zhǔn)分的意義某地家庭的月平均娛樂費(fèi)用為90元,標(biāo)準(zhǔn)差是5。假定某個(gè)家庭的娛樂費(fèi)是102元。該家庭娛樂費(fèi)的標(biāo)準(zhǔn)值是2.4,表示該值與均值(0)的距離是2.4個(gè)標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)分的實(shí)際意義用于不同總體間取值的比較還可以用于不同總體間綜合指標(biāo)的比較(page153)標(biāo)準(zhǔn)正態(tài)分布表的使用

(附表4)對于標(biāo)準(zhǔn)正態(tài)分布,即Z~N(0,1),有P(a

Z

b)

b

a

P(|Z|a)2

a

1對于負(fù)的z

,可由

(-z)

z

得到對于一般正態(tài)分布,即X~N(

,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論