版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
統(tǒng)計學(xué)─從數(shù)據(jù)到結(jié)論第五章總體參數(shù)的估計估計就是根據(jù)你擁有的信息來對現(xiàn)實世界進行某種判斷。你可以根據(jù)一個人的衣著、言談和舉止判斷其身份你可以根據(jù)一個人的臉色,猜出其心情和身體狀況統(tǒng)計中的估計也不例外,它是完全根據(jù)數(shù)據(jù)做出的。如果我們想知道北京人認可某飲料的比例,人們只有在北京人中進行抽樣調(diào)查以得到樣本,并用樣本中認可該飲料的比例來估計真實的比例。從不同的樣本得到的結(jié)論也不會完全一樣。雖然真實的比例在這種抽樣過程中永遠也不知道;但可以知道估計出來的比例和真實的比例大致差多少。從數(shù)據(jù)得到關(guān)于現(xiàn)實世界的結(jié)論的過程就叫做統(tǒng)計推斷(statisticalinference)。上面調(diào)查例子是估計總體參數(shù)(某種意見的比例)的一個過程。估計(estimation)是統(tǒng)計推斷的重要內(nèi)容之一。統(tǒng)計推斷的另一個主要內(nèi)容是下一章要引進的假設(shè)檢驗(hypothesistesting)。§5.1用估計量估計總體參數(shù)人們往往先假定某數(shù)據(jù)來自一個特定的總體族(比如正態(tài)分布族)。而要確定是總體族的哪個成員則需要知道總體參數(shù)值(比如總體均值和總體方差)。人們于是可以用相應(yīng)的樣本統(tǒng)計量(比如樣本均值和樣本方差)來估計相應(yīng)的總體參數(shù)§5.1用估計量估計總體參數(shù)一些常見的涉及總體的參數(shù)包括總體均值(m)、總體標準差(s)或方差(s2)和(Bernoulli試驗中)成功概率p等(總體中含有某種特征的個體之比例)。正態(tài)分布族中的成員被(總體)均值和標準差完全確定;Bernoulli分布族的成員被概率(或比例)p完全決定。因此如果能夠?qū)@些參數(shù)進行估計,總體分布也就估計出來了?!?.1用估計量估計總體參數(shù)估計的根據(jù)為總體抽取的樣本。樣本的(不包含未知總體參數(shù)的)函數(shù)稱為統(tǒng)計量;而用于估計的統(tǒng)計量稱為估計量(estimator)。由于一個統(tǒng)計量對于不同的樣本取值不同,所以,估計量也是隨機變量,并有其分布。如果樣本已經(jīng)得到,把數(shù)據(jù)帶入之后,估計量就有了一個數(shù)值,稱為該估計量的一個實現(xiàn)(realization)或取值,也稱為一個估計值(estimate)。§5.1用估計量估計總體參數(shù)這里介紹兩種估計,一種是點估計(pointestimation),即用估計量的實現(xiàn)值來近似相應(yīng)的總體參數(shù)。另一種是區(qū)間估計(intervalestimation);它是包括估計量在內(nèi)(有時是以估計量為中心)的一個區(qū)間;該區(qū)間被認為很可能包含總體參數(shù)。點估計給出一個數(shù)字,用起來很方便;而區(qū)間估計給出一個區(qū)間,說起來留有余地;不像點估計那么絕對?!?.2點估計用什么樣的估計量來估計參數(shù)呢?實際上沒有硬性限制。任何統(tǒng)計量,只要人們覺得合適就可以當(dāng)成估計量。當(dāng)然,統(tǒng)計學(xué)家想出了許多標準來衡量一個估計量的好壞。每個標準一般都僅反映估計量的某個方面。這樣就出現(xiàn)了按照這些標準定義的各種名目的估計量(如無偏估計量等)。另一些估計量則是由它們的計算方式來命名的(如最大似然估計和矩估計等)?!?.2點點估估計最常用用的估估計量量就是是我們們熟悉悉的樣樣本均均值、、樣本本標準準差(s)和(Bernoulli試試驗的的)成成功比比例(x/n);人們用用它們們來分分別估估計總總體均均值(m)、總總體標標準差差(s)和成成功概概率(或總總體中中的比比例)p。這些些在前前面都都已經(jīng)經(jīng)介紹紹過,,大家家也知知道如如何通通過計計算機機(或或公式式)來來計算算它們們。§5.2點點估估計那么,,什么么是好好估計計量的的標準準呢??一種統(tǒng)統(tǒng)計量量稱為為無偏估估計量量(unbiasedestimator)。所謂的的無偏性性(unbiasedness)就是::雖然然每個個樣本本產(chǎn)生生的估估計量量的取取值不不一定定等于于參數(shù)數(shù),但但當(dāng)抽抽取大大量樣樣本時時,那那些樣樣本產(chǎn)產(chǎn)生的的估計計量的的均值值會接接近真真正要要估計計的參參數(shù)。。§5.2點點估估計由于一一般僅僅僅抽抽取一一個樣樣本,,并且且用該該樣本本的這這個估估計量量的實實現(xiàn)來來估計計對應(yīng)應(yīng)的參參數(shù),,人們們并不不知道道這個個估計計值和和要估估計的的參數(shù)數(shù)差多多少。。因此,,無偏偏性僅僅僅是是非常常多次次重復(fù)復(fù)抽樣樣時的的一個個漸近近概念念。隨機樣樣本產(chǎn)產(chǎn)生的的樣本本均值值、樣樣本標標準差差和Bernoulli試驗驗的成成功比比例分分別都都是相相應(yīng)的的總體體均值值、總總體標標準差差和總總體比比例的的無偏偏估計計?!?.2點點估估計在無偏偏估計計量的的類中中,人人們還還希望望尋找找方差差最小小的估估計量量,稱稱為最最小方方差無無偏估估計量量。此因為為方差差小說說明反反復(fù)抽抽樣產(chǎn)產(chǎn)生的的許多多估計計量差差別不不大,,因此此更加加精確確。評價一一個統(tǒng)統(tǒng)計量量好壞壞的標標準很很多;;而且且許多多都涉涉及一一些大大樣本本的極極限性性質(zhì)。。我們們不想想在這這里涉涉及太太多此此方面面的細細節(jié)。。§5.3區(qū)區(qū)間估計計當(dāng)描述一個個人的體重重時,你一一般可能不不會說這個個人是76.35公公斤你會說這個個人是七八八十公斤,,或者是在在70公斤斤到80公公斤之間。。這個范圍圍就是區(qū)間間估計的例例子?!?.3區(qū)區(qū)間估計計在抽樣調(diào)查查例子中也也常用點估估計加區(qū)間間估計的說說法。比如,為了了估計某電電視節(jié)目在在觀眾中的的支持率((即總體比比例p),某調(diào)查查結(jié)果會顯顯示,該節(jié)節(jié)目的“收收視率為90%,誤誤差是±3%,置信信度為95%”云云云。這這種種說法意味味著下面三三點§5.3區(qū)區(qū)間估計計1. 樣本本中的支持持率為90%,即用用樣本比例例作為對總總體比例的的點估計2. 估計計范圍為90%±3%(±3%的誤差差),即區(qū)區(qū)間(93%,87%)。3. 如用用類似的方方式,重復(fù)復(fù)抽取大量量(樣本量量相同的))樣本時,,產(chǎn)生的大大量類似區(qū)區(qū)間中有些些會覆蓋真真正的p,而有些不不會;但其其中大約有有95%會會覆蓋真正正的總體比比例。§5.3區(qū)區(qū)間估計計這樣得到的的區(qū)間被稱稱為總體比比例p的置信度(confidencelevel)為95%的置信信區(qū)間(confidenceinterval)。。這里的置信信度又稱置信水平或置信系數(shù)。。顯然置信度度的概念又又是大量重重復(fù)抽樣時時的一個漸漸近概念。?!?.3區(qū)區(qū)間估計計因此說“我我們目前得得到的區(qū)間間(比如上上面的90%±3%)以概率率0.95覆蓋真正正的比例p”是個錯誤的的說法。這里的區(qū)間間(93%,,87%)是固定的,,而總體比比例p也是是固定的值值。因此只只有兩種可可能:或者者該區(qū)間包包含總體比比例,或者者不包含;;在固定數(shù)值值之間沒有有任何概率率可言。§5.3區(qū)區(qū)間估計計例5.1(noodle.txt)某某廠家生產(chǎn)產(chǎn)的掛面包包裝上寫明明“凈含量量450克克”。在用用天平稱量量了商場中中的48包包掛面之后后,得到樣樣本量為48的關(guān)于于掛面重量量(單位::克)的一一個樣本::用計算機可可以很容易易地得到掛掛面重量的的樣本均值值、總體均均值的置信信區(qū)間等等等。下面是是SPSS的輸出::該輸出給出出了許多第第三章引進進的描述統(tǒng)統(tǒng)計量。和和估計有關(guān)關(guān)的是作為為總體均點點估計的樣樣本均值,,它等于449.01;而總總體均值的的95%置置信區(qū)間為為(447.41,,450.61)§5.3區(qū)區(qū)間估計計我們還可以以構(gòu)造兩個個總體的均均值(或比比例)之差差的置信區(qū)區(qū)間。如想知道兩兩個地區(qū)學(xué)學(xué)生成績的的差異,可可以建造兩兩個地區(qū)成成績均值之之差m1-m2的置信區(qū)間間。如想比較一一個候選人人在不同階階段支持率率的差異,,那就可構(gòu)構(gòu)造比例之之差p1-p2的置信區(qū)間間?!?.3區(qū)區(qū)間估計計例5.2有有兩個地區(qū)區(qū)大學(xué)生的的高度數(shù)據(jù)據(jù)(height2.txt)(a)我們們想要分別別得到這兩兩個總體均均值和標準準差的點估估計(即樣樣本均值和和樣本標準準差)和各各總體均值值的95%置信區(qū)間間。(b)求兩兩個均值差差m1-m2的點估計和和95%置置信區(qū)間。。利用軟件件很容易得得到下面結(jié)結(jié)果:§5.3區(qū)區(qū)間估計兩個總體均值值估計量的樣樣本均值分別別為170.56和165.60,,樣本標準差差分別為6.97857和7.55659;還還得到均值的的置信區(qū)間分分別是(168.5767,172.5433),(163.4524,167.7476)??梢缘玫絻蓚€個樣本均值的的差(4.9600),,另外還給出出了兩總體均均值差的95%置信區(qū)間間(2.073,7.847)?!?.4關(guān)關(guān)于置信區(qū)間間的注意點前面提到,不不要認為由某一樣本數(shù)據(jù)得到總體體參數(shù)的某一個95%置信區(qū)區(qū)間,就以為為該區(qū)間以0.95的概率覆覆蓋總體參數(shù)數(shù)。置信度95%僅僅描述用用來構(gòu)造該區(qū)區(qū)間上下界的的統(tǒng)計量(是隨隨機的)覆蓋總體參數(shù)數(shù)的概率;也就是說,無無窮次重復(fù)抽抽樣所得到的的所有區(qū)間中中有95%包包含參數(shù)。§5.4關(guān)關(guān)于置信區(qū)間間的注意點但是把一個樣樣本數(shù)據(jù)帶入入統(tǒng)計量的公公式所得到的的一個區(qū)間,,只是這些區(qū)區(qū)間中的一個個。這個非隨機的的區(qū)間是否包包含那個非隨隨機的總體參參數(shù),誰也不不可能知道。。非隨機的數(shù)數(shù)目之間沒有有概率可言。?!?.4關(guān)關(guān)于置信區(qū)間間的注意點置信區(qū)間的論論述是由區(qū)間間和置信度兩兩部分組成。。有些新聞媒體體報道一些調(diào)調(diào)查結(jié)果只給給出百分比和和誤差(即置置信區(qū)間),,并不說明置置信度,也不不給出被調(diào)查查的人數(shù),這這是不負責(zé)的的表現(xiàn)。因為降低置信信度可以使置置信區(qū)間變窄窄(顯得“精精確”),有有誤導(dǎo)讀者之之嫌。在公布布調(diào)查結(jié)果時時給出被調(diào)查查人數(shù)是負責(zé)責(zé)任的表現(xiàn)。。這樣則可以以由此推算出出置信度(由由后面給出的的公式),反反之亦然?!?.4關(guān)關(guān)于置信區(qū)間間的注意點一個描述性例例子:有10000個人人回答的調(diào)查查顯示,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人心理咨詢與輔導(dǎo)服務(wù)合同3篇
- 2025年度林業(yè)權(quán)屬林權(quán)登記與林業(yè)碳匯項目實施合同4篇
- 2025年福建貨運從業(yè)資格證新政
- 二零二五年度高速鐵路鋁合金門窗安全檢測與安裝合同4篇
- 二零二五年度0號柴油環(huán)保油品居間服務(wù)合同3篇
- 2025年度個人房產(chǎn)交易過戶手續(xù)辦理協(xié)議3篇
- 二零二五年度土地租賃及經(jīng)營權(quán)轉(zhuǎn)讓合同樣本-@-1
- 二零二五年度離婚房產(chǎn)分割與子女醫(yī)療費用承擔(dān)合同3篇
- 二零二五年度企業(yè)員工培訓(xùn)課程版權(quán)購買協(xié)議4篇
- 2025年度個人網(wǎng)絡(luò)推廣傭金協(xié)議書4篇
- 2024年社區(qū)警務(wù)規(guī)范考試題庫
- 2024年食用牛脂項目可行性研究報告
- 2024-2030年中國戶外音箱行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 家務(wù)分工與責(zé)任保證書
- 消防安全隱患等級
- (新版)國民經(jīng)濟行業(yè)分類代碼表(八大行業(yè))
- 北京地鐵13號線
- 2023山東春季高考數(shù)學(xué)真題(含答案)
- 為加入燒火佬協(xié)會致辭(7篇)
- 職業(yè)衛(wèi)生法律法規(guī)和標準培訓(xùn)課件
- 高二下學(xué)期英語閱讀提升練習(xí)(二)
評論
0/150
提交評論