版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
應(yīng)用統(tǒng)計學(xué)(第三版)首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社應(yīng)用統(tǒng)計學(xué)首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社目錄CONTENTS第一章統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)第二章統(tǒng)計數(shù)據(jù)收集的方法與數(shù)據(jù)質(zhì)量第三章數(shù)據(jù)的圖表展示第四章數(shù)據(jù)的統(tǒng)計量描述第五章概率抽樣與抽樣分布第六章參數(shù)統(tǒng)計第七章參數(shù)的假設(shè)檢驗第八章方差分析第九章非參數(shù)的假設(shè)檢驗第十章相關(guān)分析與回歸分析第十一章主成分與因子分析第十二章列聯(lián)分析與對應(yīng)分析第十三章聚類分析與判別分析第十四章時間數(shù)列分析與預(yù)測目錄CONTENTS第一章統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)第八章方第一章統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)第一節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展第二節(jié)統(tǒng)計學(xué)的性質(zhì)與特點第三節(jié)統(tǒng)計數(shù)據(jù)與統(tǒng)計規(guī)律第四節(jié)經(jīng)濟(jì)管理實踐中的統(tǒng)計——統(tǒng)計應(yīng)用的領(lǐng)域之一1第一章統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)第一節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展1第一節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展一、統(tǒng)計學(xué)的產(chǎn)生17世紀(jì)中葉,西方社會首次出現(xiàn)了有意識地用數(shù)字語言說明問題,從數(shù)量的角度探索客觀事物變化規(guī)律的研究活動。當(dāng)時,最具有代表性的主要有政治算術(shù)學(xué)派和國勢學(xué)派。政治算術(shù)學(xué)派的代表人物是英國的學(xué)者威廉·配第(W.Petty),著作《政治算術(shù)》。在統(tǒng)計史的研究中,一般把以威廉·配第為代表的關(guān)于社會經(jīng)濟(jì)現(xiàn)象“算術(shù)”式的研究,稱為“政治算術(shù)”。政治算術(shù)學(xué)派還有一位重要的人物———約翰·格朗特(J.Graunt)—《關(guān)于死亡表的自然觀察與政治觀察》。“國勢學(xué)”主要研究有關(guān)國家興衰強(qiáng)弱的重大問題以及治理國家必備的方法。統(tǒng)計學(xué)的另一個重要起源是概率論。真正意義上的概率論是從17世紀(jì)開始的。拉普拉斯是古典概率論的集大成者。第一節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展一、統(tǒng)計學(xué)的產(chǎn)生17世紀(jì)中葉,西方社第一節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展二、統(tǒng)計學(xué)的發(fā)展凱特勒(A.Quetelet)是統(tǒng)計學(xué)發(fā)展史上承前啟后的重要人物。把概率論全面引進(jìn)“政治算術(shù)”、“國勢學(xué)”以及其他社會問題的研究。19世紀(jì)后半期,統(tǒng)計學(xué)在生物遺傳學(xué)、農(nóng)業(yè)田間試驗等領(lǐng)域取得了創(chuàng)新性的成果。進(jìn)入20世紀(jì),新的統(tǒng)計思想和統(tǒng)計方法大量涌現(xiàn),帶有歸納性質(zhì)的統(tǒng)計推斷逐漸占據(jù)了主流地位??傮w上說,20世紀(jì)以來,傳統(tǒng)意義上的統(tǒng)計學(xué)的發(fā)展有三個明顯的趨勢:首先,隨著數(shù)學(xué)的發(fā)展,統(tǒng)計學(xué)依賴和吸收數(shù)學(xué)方法的程度越來越深;其次,統(tǒng)計學(xué)方法向其他學(xué)科領(lǐng)域廣泛滲透,以統(tǒng)計學(xué)為基礎(chǔ)的邊緣學(xué)科不斷形成;最后,隨著統(tǒng)計學(xué)應(yīng)用的日益廣泛和深入,特別是隨著計算機(jī)的發(fā)展和大數(shù)據(jù)的形成,統(tǒng)計學(xué)正發(fā)揮著越來越大的作用。第一節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展二、統(tǒng)計學(xué)的發(fā)展凱特勒(A.Quet第一節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展三、統(tǒng)計學(xué)科體系(一)理論統(tǒng)計學(xué)1.統(tǒng)計估計。2.假設(shè)檢驗。3.抽樣調(diào)查。4.試驗設(shè)計。5.非參數(shù)統(tǒng)計。6.時間序列。7.統(tǒng)計決策。8.序貫分析。9.多元統(tǒng)計。10.統(tǒng)計診斷。11.穩(wěn)健統(tǒng)計。12.探索性分析。(二)應(yīng)用統(tǒng)計學(xué)1.統(tǒng)計計算方法。2.應(yīng)用統(tǒng)計學(xué)的理論基礎(chǔ)。3.應(yīng)用統(tǒng)計學(xué)。4.其他。統(tǒng)計學(xué)與其他應(yīng)用數(shù)學(xué)學(xué)科結(jié)合,形成新的應(yīng)用數(shù)學(xué)方法的基礎(chǔ)學(xué)科,如博弈論、多目標(biāo)決策、隨機(jī)規(guī)劃等。第一節(jié)統(tǒng)計學(xué)的產(chǎn)生與發(fā)展三、統(tǒng)計學(xué)科體系(一)理論統(tǒng)計學(xué)(二第二節(jié)統(tǒng)計學(xué)的性質(zhì)與特點一、什么是統(tǒng)計學(xué)“統(tǒng)計學(xué)是收集、分析、表述和解釋數(shù)據(jù)的科學(xué)。”——《不列顛百科全書》統(tǒng)計學(xué)研究的是客觀現(xiàn)象的數(shù)量方面,統(tǒng)計離不開數(shù)據(jù)。1、收集數(shù)據(jù)2、加工和整理數(shù)據(jù)3、分析數(shù)據(jù)4、解釋數(shù)據(jù)第二節(jié)統(tǒng)計學(xué)的性質(zhì)與特點一、什么是統(tǒng)計學(xué)“統(tǒng)計學(xué)是收集、分析第二節(jié)統(tǒng)計學(xué)的性質(zhì)與特點二、統(tǒng)計學(xué)的研究方法(一)大量觀察法大量觀察法是指在客觀事物的研究中,從總體出發(fā),對其全部單位或足夠多的單位進(jìn)行觀察和分析研究的方法。(二)綜合指標(biāo)法綜合指標(biāo)法是表明事物總體數(shù)量特征的數(shù)據(jù),它是統(tǒng)計學(xué)研究事物總體數(shù)量方面的基本手段或工具。(三)歸納推斷法歸納推斷法是指以一定的置信標(biāo)準(zhǔn),根據(jù)樣本數(shù)據(jù)來判斷總體數(shù)量特征的歸納方法。第二節(jié)統(tǒng)計學(xué)的性質(zhì)與特點二、統(tǒng)計學(xué)的研究方法(一)大量觀察法第二節(jié)統(tǒng)計學(xué)的性質(zhì)與特點三、統(tǒng)計學(xué)的性質(zhì)與研究對象第一,統(tǒng)計學(xué)是一門關(guān)于數(shù)據(jù)的科學(xué),統(tǒng)計研究的是客觀事物的數(shù)量特征,包括數(shù)量狀態(tài)、數(shù)量關(guān)系和數(shù)量變化規(guī)律,統(tǒng)計的基本語言是數(shù)據(jù)。第二,統(tǒng)計學(xué)對大量同類現(xiàn)象的數(shù)量方面進(jìn)行綜合反映與研究,也就是說,統(tǒng)計學(xué)的研究對象是客觀現(xiàn)象總體的數(shù)量,單個數(shù)據(jù)的分析與研究不是統(tǒng)計學(xué)的研究對象。第三,統(tǒng)計學(xué)的研究對象是不確定的現(xiàn)象,即隨機(jī)性的變量。第四,統(tǒng)計的基本方法是歸納推斷。第二節(jié)統(tǒng)計學(xué)的性質(zhì)與特點三、統(tǒng)計學(xué)的性質(zhì)與研究對象第一,統(tǒng)計第三節(jié)統(tǒng)計數(shù)據(jù)與統(tǒng)計規(guī)律一、數(shù)據(jù)的計量尺度(一)定類尺度定類尺度是最粗略、計量層次最低的計量尺度。它的主要特征是采用文字、數(shù)字代碼和其他符號對事物進(jìn)行簡單的分類或分組。建立在對事物進(jìn)行分類分組的基礎(chǔ)上的計量尺度稱為定類尺度。只能區(qū)分事物是同類或非同類,必須符合窮盡和互斥的要求。(二)定序尺度定序尺度又稱順序尺度,它是對事物之間的等級差或順序差進(jìn)行的一種測度。該尺度不僅可以將事物分成不同的類別,而且還可以確定這些類別的優(yōu)劣和順序。(三)定距尺度定距尺度也稱間隔尺度,它不僅具有定序尺度的所有特征,即能將事物區(qū)分為不同類型并進(jìn)行排序,而且可以準(zhǔn)確地指出類別之間的差距是多少。(四)定比尺度定比尺度是最高級別的測量尺度,其計量結(jié)果和定距尺度一樣也表示為數(shù)值。但是與定距尺度不同的是,定比尺度擁有一個絕對零點的測量原點,而定距尺度卻沒有這樣的原點。第三節(jié)統(tǒng)計數(shù)據(jù)與統(tǒng)計規(guī)律一、數(shù)據(jù)的計量尺度(一)定類尺度定類第三節(jié)統(tǒng)計數(shù)據(jù)與統(tǒng)計規(guī)律二、數(shù)據(jù)的類型(一)分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)(二)截面數(shù)據(jù)、時間序列數(shù)據(jù)和平行數(shù)據(jù)(三)觀測數(shù)據(jù)與實驗數(shù)據(jù)(四)初級資料和次級資料第三節(jié)統(tǒng)計數(shù)據(jù)與統(tǒng)計規(guī)律二、數(shù)據(jù)的類型(一)分類數(shù)據(jù)、順序數(shù)第三節(jié)統(tǒng)計數(shù)據(jù)與統(tǒng)計規(guī)律三、統(tǒng)計規(guī)律統(tǒng)計學(xué)是收集、分析、表述和解釋數(shù)據(jù)的科學(xué)。通過對大量現(xiàn)象的觀察或重復(fù)進(jìn)行多次相同的實驗并獲取大量的數(shù)據(jù)后,我們就可以利用統(tǒng)計方法找到其內(nèi)在的數(shù)量上的規(guī)律性。之所以可以通過大量的數(shù)據(jù)認(rèn)識事物變化的規(guī)律性,是因為客觀事物本身是必然性與偶然性的對立統(tǒng)一,必然性反映了事物的本質(zhì)特征和規(guī)律,而偶然性則反映了事物之間具體表現(xiàn)上的差異。第三節(jié)統(tǒng)計數(shù)據(jù)與統(tǒng)計規(guī)律三、統(tǒng)計規(guī)律統(tǒng)計學(xué)是收集、分析、表述第四節(jié)經(jīng)濟(jì)管理實踐中的統(tǒng)計——統(tǒng)計應(yīng)用的領(lǐng)域之一經(jīng)濟(jì)管理統(tǒng)計應(yīng)用中既包括宏觀領(lǐng)域的經(jīng)濟(jì)統(tǒng)計分析;也包括微觀領(lǐng)域中的企業(yè)商務(wù)管理統(tǒng)計的應(yīng)用,即管理統(tǒng)計學(xué)等。此外,還有經(jīng)濟(jì)學(xué)家常被要求對未來的經(jīng)濟(jì)或?qū)ξ磥斫?jīng)濟(jì)的某一方面提供預(yù)測,他們在進(jìn)行這種預(yù)測時,要使用各種統(tǒng)計信息。其一,統(tǒng)計方法在管理工作中的應(yīng)用。其二,統(tǒng)計方法在會計工作中的應(yīng)用。其三,統(tǒng)計方法在理財中的應(yīng)用。其四,統(tǒng)計方法在市場分析中的應(yīng)用。其五,統(tǒng)計方法還可以在產(chǎn)品質(zhì)量控制中發(fā)揮作用,用于監(jiān)測生產(chǎn)過程的產(chǎn)出。第四節(jié)經(jīng)濟(jì)管理實踐中的統(tǒng)計——統(tǒng)計應(yīng)用的領(lǐng)域之一經(jīng)濟(jì)管理統(tǒng)計第二章統(tǒng)計數(shù)據(jù)收集的方法與數(shù)據(jù)質(zhì)量第一節(jié)統(tǒng)計數(shù)據(jù)的來源第二節(jié)數(shù)據(jù)收集的方法第三節(jié)問卷的設(shè)計第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量2第二章統(tǒng)計數(shù)據(jù)收集的方法與數(shù)據(jù)質(zhì)量第一節(jié)統(tǒng)計數(shù)據(jù)第一節(jié)統(tǒng)計數(shù)據(jù)的來源一、數(shù)據(jù)的間接來源二手?jǐn)?shù)據(jù)主要是公開出版或公開報道的數(shù)據(jù)。有些是尚未公開出版的數(shù)據(jù),這類數(shù)據(jù)的收集一般稱作文案調(diào)查。文案調(diào)查通常按以下幾個步驟進(jìn)行:第一,根據(jù)研究項目的內(nèi)容判別所需資料的類型。第二,尋找資料來源。第三,對次級資料的查找。第四,對查找的數(shù)據(jù)、資料進(jìn)行加工、整理和補(bǔ)充。第一節(jié)統(tǒng)計數(shù)據(jù)的來源一、數(shù)據(jù)的間接來源二手?jǐn)?shù)據(jù)主要是公開出版第二節(jié)統(tǒng)計數(shù)據(jù)的來源二、數(shù)據(jù)的直接來源數(shù)據(jù)的直接來源主要有兩個渠道:一是統(tǒng)計調(diào)查或觀察,二是基于實驗設(shè)計基礎(chǔ)上的實驗。(一)統(tǒng)計調(diào)查方式1.普查2.抽樣調(diào)查(1)主觀抽樣調(diào)查(2)概率抽樣調(diào)查(二)實驗設(shè)計方式實驗設(shè)計一般包括五個相互關(guān)聯(lián)的環(huán)節(jié):一、根據(jù)實驗的目的,設(shè)計實驗方案,以保證每一個非被實驗因素對被實驗因素的作用相同,以突出被實驗因素的效應(yīng),合理優(yōu)化實驗的次數(shù);二、方案的實施;三、對實驗結(jié)果進(jìn)行測量,取得實驗數(shù)據(jù)資料;四、運用統(tǒng)計方法,對實驗數(shù)據(jù)進(jìn)行分析,形成相應(yīng)的結(jié)論;五、根據(jù)數(shù)據(jù)分析的結(jié)果,得出實驗的結(jié)論。第二節(jié)統(tǒng)計數(shù)據(jù)的來源二、數(shù)據(jù)的直接來源數(shù)據(jù)的直接來源主要有兩第二節(jié)數(shù)據(jù)收集的方法一、訪問法(一)面談訪問(二)電話訪問(三)電腦輔助調(diào)查(四)座談會法(五)個別深訪第二節(jié)數(shù)據(jù)收集的方法一、訪問法(一)(二)(三)(四)(五)第二節(jié)數(shù)據(jù)收集的方法二、報告法(一)郵寄調(diào)查(二)日記調(diào)查(三)留置調(diào)查第二節(jié)數(shù)據(jù)收集的方法二、報告法(一)(二)(三)第二節(jié)數(shù)據(jù)收集的方法三、觀察法觀察法是指調(diào)查者通過直接觀察、跟蹤和記錄被調(diào)查者的情況來收集資料的一種調(diào)查方法。觀察法不同于日常生活中的觀察,它具有目的性、計劃性和系統(tǒng)性,而且要求觀察者對所觀察到的事實作出實質(zhì)性的結(jié)論。選擇具體的方法時,需要綜合比較各種方法的調(diào)查范圍、調(diào)查對象的可控性、影響回答的因素、回收率、回答速度、回答質(zhì)量和費用等,從而選擇最適合的方法。第二節(jié)數(shù)據(jù)收集的方法三、觀察法觀察法是指調(diào)查者通過直接觀察、第三節(jié)問卷的設(shè)計一、問卷的概念和作用問卷是現(xiàn)代調(diào)查中使用最為普遍的用于收集數(shù)據(jù)的一種表述調(diào)查項目的形式。問卷是指按詢問提綱及要求填選答案的調(diào)查表。問卷不但有利于調(diào)查內(nèi)容的系統(tǒng)化、標(biāo)準(zhǔn)化,便于對所取得的數(shù)據(jù)進(jìn)行統(tǒng)計處理和定量分析,而且還可以節(jié)省調(diào)查時間,提高工作效率。設(shè)計一份科學(xué)、完善的問卷,是調(diào)查得以成功的重要保證。第三節(jié)問卷的設(shè)計一、問卷的概念和作用問卷是現(xiàn)代調(diào)查中使用最為第三節(jié)問卷的設(shè)計二、問卷的基本內(nèi)容與格式第二,問卷說明(前言)第四,調(diào)查的主題內(nèi)容第六,作業(yè)證明的記載第一,問卷的標(biāo)題第三,被調(diào)查者基本情況第五,編碼第三節(jié)問卷的設(shè)計二、問卷的基本內(nèi)容與格式第二,問卷說明(前言第三節(jié)問卷的設(shè)計三、問卷設(shè)計中的詢問技術(shù)(一)問題的主要類型及詢問方式1.根據(jù)所提問題性質(zhì)的不同,可將問題分為直接性問題、間接性問題和假設(shè)性問題。2.根據(jù)對問題的作答方式不同,問卷中的問題可分為開放性問題、封閉性問題等。封閉性問題例如:您的家庭目前收支情況總體上是()。A.有較多的節(jié)余B.略有節(jié)余C.收支基本平衡D.入不敷出半開放、半封閉性的問題例如:您目前最迫切需要解決的問題是()。A.購買住房B.子女入學(xué)及教育C.提高收入D.醫(yī)療保障E.就業(yè)F.帶薪休假G.其他(請寫出)3.根據(jù)所提問題內(nèi)容的不同,問卷中的問題可分為事實性問題、行為性問題、動機(jī)性問題和態(tài)度性問題。行為性問題例如:以下社區(qū)文化設(shè)施中,您最經(jīng)常去的是()(限選三項)。A.圖書館B.文化站C.社區(qū)文化室D.文化廣場E.影劇院F.博物館G.健身運動場所H.其他(請注明)第三節(jié)問卷的設(shè)計三、問卷設(shè)計中的詢問技術(shù)(一)問題的主要類型第三節(jié)問卷的設(shè)計三、問卷設(shè)計中的詢問技術(shù)(二)設(shè)計問句時應(yīng)注意的幾個問題避免提籠統(tǒng)、抽象的問題避免用不確切的詞語,如“普通”“經(jīng)?!币约耙恍┬稳菰~等避免使用含糊不清的句子避免引導(dǎo)性的提問避免引導(dǎo)性的提問避免提出令被調(diào)查者感到難堪的屬于個人忌諱或敏感的問題避免提出復(fù)合問題第三節(jié)問卷的設(shè)計三、問卷設(shè)計中的詢問技術(shù)(二)設(shè)計問句時應(yīng)注第三節(jié)問卷的設(shè)計四、封閉性問題答案的設(shè)計技術(shù)(一)答案選項設(shè)計的基本方法1.二選一。2.多項選擇。第一,由于所設(shè)答案選項不一定能表達(dá)出被調(diào)查者所有的看法,所以,在問題的最后通??稍O(shè)“其他”選項,以便使被調(diào)查者表達(dá)自己的看法;第二,多項選擇中,由于選項較多,選項的順序可能會影響被調(diào)查者的選擇,從而使調(diào)查結(jié)果發(fā)生偏差,因而選項的順序既可以隨機(jī)排列,也可以按字?jǐn)?shù)的多少順序排列。3.排序法。例如:您認(rèn)為目前對北京城市環(huán)境威脅最大的因素是()(請按程度大小順序排列)。A.塑料包裝等白色污染物B.廢電池等電子垃圾C.噪聲污染D.機(jī)動車污染物排放E.工地?fù)P塵F.水污染G.生活垃圾H.其他(請注明)4.兩兩比較法。例如:請比較下列每一對文化產(chǎn)業(yè)園區(qū),哪一個是您更喜歡的?(每一對中只選一個劃√)A.□中國(懷柔)影視基地□798藝術(shù)區(qū)B.□798藝術(shù)區(qū)□潘家園古玩藝術(shù)品交易園區(qū)C.□潘家園古玩藝術(shù)品交易園區(qū)□宋莊原創(chuàng)藝術(shù)與卡通產(chǎn)業(yè)區(qū)D.□宋莊原創(chuàng)藝術(shù)與卡通產(chǎn)業(yè)區(qū)□琉璃廠歷史文化產(chǎn)業(yè)園區(qū)E.□琉璃廠歷史文化產(chǎn)業(yè)園區(qū)□北京(房山)歷史文化旅游區(qū)F.□北京(房山)歷史文化旅游區(qū)□前門傳統(tǒng)產(chǎn)業(yè)區(qū)……(二)答案選項設(shè)計的要求例如:您經(jīng)??茨膫€欄目的電視節(jié)目?A.經(jīng)濟(jì)生活B.道德觀察C.新聞聯(lián)播D.其他(請注明)E.經(jīng)常看F.偶爾看G.根本不看第三節(jié)問卷的設(shè)計四、封閉性問題答案的設(shè)計技術(shù)(一)答案選項設(shè)第三節(jié)問卷的設(shè)計五、問卷的編排設(shè)計和要求(一)問卷的順序1.容易回答的問題放在前面,較難回答的問題放在中間,敏感性的問題放在后面。2.封閉性的問題放在前面,開放性的問題放在后面。這是由于封閉性的問題有現(xiàn)成的答案,較易回答;
而開放性的問題需要被調(diào)查者花費一些時間考慮并填寫,放在前面容易讓人產(chǎn)生畏難情緒,從而不利于調(diào)查的順利進(jìn)行。
3.要注意問題之間的邏輯順序,如可按時間順序、類別順序等進(jìn)行排列。(二)問題的銜接例如:“您家有汽車嗎?”()A.有□如果有,您家的汽車是:(a)國產(chǎn)(b)進(jìn)口(c)合資B.無□例如:Q11.您看過《××導(dǎo)報》這份報紙嗎?()
A.經(jīng)???/p>
B.偶爾看C.從沒看過(跳轉(zhuǎn)到Q22)Q12.您對《××導(dǎo)報》的總體評價是()。
A.滿意
B.一般
C.不滿意Q13.……第三節(jié)問卷的設(shè)計五、問卷的編排設(shè)計和要求(一)問卷的順序第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量一、統(tǒng)計數(shù)據(jù)的質(zhì)量調(diào)查階段的數(shù)據(jù)質(zhì)量最為重要。評價數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn)或?qū)?shù)據(jù)的基本要求是準(zhǔn)確、及時、全面、系統(tǒng)。其中,對數(shù)據(jù)準(zhǔn)確性的評價,往往可以從統(tǒng)計數(shù)據(jù)誤差的角度進(jìn)行。為使數(shù)據(jù)質(zhì)量檢查有一個定量的描述依據(jù),我們把統(tǒng)計數(shù)據(jù)質(zhì)量的準(zhǔn)確性解釋為獲得的觀察值與客觀現(xiàn)象實際數(shù)量水平之間的離差。離差大,說明數(shù)據(jù)的準(zhǔn)確性即數(shù)據(jù)的質(zhì)量較差;離差小,說明數(shù)據(jù)的準(zhǔn)確性即數(shù)據(jù)的質(zhì)量較好。第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量一、統(tǒng)計數(shù)據(jù)的質(zhì)量調(diào)查階段的數(shù)據(jù)質(zhì)量最為第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量二、統(tǒng)計數(shù)據(jù)的誤差(一)抽樣誤差即使所收集的樣本數(shù)據(jù)完全正確可靠,它和總體真值之間也往往會存在差異,這種差異是由樣本對總體的代表性所導(dǎo)致的,所以稱為抽樣誤差。如果我們用μ表示總體的均值,隨機(jī)抽樣得到樣本的均值為x,則x
-μ就定義為抽樣誤差。采用計算標(biāo)準(zhǔn)差的方法來計算平均誤差,并因而稱其為抽樣標(biāo)準(zhǔn)誤差(后面簡稱為抽樣誤差),其定義用公式表示,則為。(二)非抽樣誤差1.未響應(yīng)導(dǎo)致的誤差,也稱為無回答誤差。有意無回答現(xiàn)象對總體數(shù)據(jù)估計推斷可能產(chǎn)生的影響有:第一,由于無回答而使有效的樣本量減少,從而使抽樣誤差增大,達(dá)不到原抽樣設(shè)計時調(diào)查精度的要求。第二,由于無回答而帶來估計量的偏誤,而且這種偏誤并不會由于樣本量的增大而減少。2.抽樣框?qū)е碌恼`差。所謂抽樣框,就是在抽樣時,用以從中抽取樣本單位的包括全部總體單位的一個名單或框架。根據(jù)研究目的所確定的理想總體稱為目標(biāo)總體,抽樣框所代表的總體通常稱為抽樣總體。第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量二、統(tǒng)計數(shù)據(jù)的誤差(一)抽樣誤差第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量二、統(tǒng)計數(shù)據(jù)的誤差抽樣誤差:屬于代表性誤差,在隨機(jī)抽樣中有時抽中偏小的單位,有時則抽中偏大的單位,這種誤差沒有系統(tǒng)性的方向。隨著樣本量的增大,其抽樣誤差會由于相互抵消而縮小。非抽樣誤差:有系統(tǒng)性,根據(jù)不同的情況會偏向于某一方向,不會因樣本量的增大而減少。第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量二、統(tǒng)計數(shù)據(jù)的誤差抽樣誤差:非抽樣誤差:第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量三、統(tǒng)計數(shù)據(jù)質(zhì)量的檢查與要求(一)后驗方法后驗方法是在調(diào)查工作已經(jīng)完成后,不用親臨調(diào)查現(xiàn)場,而是通過對數(shù)據(jù)進(jìn)行邏輯關(guān)系分析和計算比較,以及將調(diào)查數(shù)據(jù)與獨立來源的資料加以對比,以確定調(diào)查數(shù)據(jù)的質(zhì)量。后驗方法僅適用于對最后調(diào)查結(jié)果的檢查,不能用于單項數(shù)據(jù)誤差的評估。(二)抽樣檢查抽樣檢查是指在一次調(diào)查之后,在盡量短的時間內(nèi)再從這些被調(diào)查單位中隨機(jī)抽取一定數(shù)量的單位組成樣本進(jìn)行重新調(diào)查,將兩次調(diào)查結(jié)果進(jìn)行比較,以分析調(diào)查數(shù)據(jù)的質(zhì)量,并對所收集的數(shù)據(jù)進(jìn)行修正。抽樣檢查,必須是在一次調(diào)查之后不久就要進(jìn)行,以免調(diào)查對象及調(diào)查環(huán)境已發(fā)生較大的變化而導(dǎo)致評估無效。由于樣本數(shù)據(jù)是檢查的標(biāo)準(zhǔn),因而樣本數(shù)據(jù)的抽取、收集與核查,需要安排專業(yè)的統(tǒng)計人員進(jìn)行。此外,樣本單位的確定要考慮到隨機(jī)性的要求,而且,在考慮預(yù)算費用約束的條件下,要保證有合理的樣本量。第四節(jié)統(tǒng)計數(shù)據(jù)的質(zhì)量三、統(tǒng)計數(shù)據(jù)質(zhì)量的檢查與要求(一)后驗方第三章數(shù)據(jù)的圖表展示第一節(jié)定性數(shù)據(jù)的圖表展示第二節(jié)定量數(shù)據(jù)的圖表展示第三節(jié)統(tǒng)計圖表應(yīng)用中的幾個問題3第三章數(shù)據(jù)的圖表展示第一節(jié)定性數(shù)據(jù)的圖表展示3第一節(jié)定性數(shù)據(jù)的圖表展示一、統(tǒng)計分組(一)平行分組體系(二)復(fù)合分組體系第一節(jié)定性數(shù)據(jù)的圖表展示一、統(tǒng)計分組(一)平行分組體系(二)第一節(jié)定性數(shù)據(jù)的圖表展示二、定性數(shù)據(jù)的頻數(shù)分布表定性數(shù)據(jù)包括分類數(shù)據(jù)和順序數(shù)據(jù)。定性數(shù)據(jù)本身就是對事物的一種分組,因此,只要先把所有的類別都列出來,然后統(tǒng)計出每一類別的數(shù)據(jù)個數(shù)(即頻數(shù)),就可以進(jìn)一步形成分組列表,也稱頻數(shù)分布表?!纠?-1】我們將2018年某地區(qū)城鎮(zhèn)從業(yè)人員按其所在企業(yè)的登記注冊類型分組,并進(jìn)行統(tǒng)計,形成下面的頻數(shù)分布表。第一節(jié)定性數(shù)據(jù)的圖表展示二、定性數(shù)據(jù)的頻數(shù)分布表定性數(shù)據(jù)包括第一節(jié)定性數(shù)據(jù)的圖表展示三、定性數(shù)據(jù)的統(tǒng)計圖示(一)條形圖與柱形圖條形圖是用寬度相同的條形來表示數(shù)據(jù)多少的圖形,主要用于觀察不同類別數(shù)據(jù)的多少和進(jìn)行各項信息的比較等。反映數(shù)據(jù)分布特征多用柱形圖,而用數(shù)量觀察各項信息的大小可以采用條形圖。第一節(jié)定性數(shù)據(jù)的圖表展示三、定性數(shù)據(jù)的統(tǒng)計圖示(一)條形圖與第一節(jié)定性數(shù)據(jù)的圖表展示三、定性數(shù)據(jù)的統(tǒng)計圖示(二)帕累托圖帕累托圖是按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)的多少排序后繪制的條形圖。(三)餅圖餅圖一般用來描述和表現(xiàn)各類數(shù)據(jù)或某一類數(shù)據(jù)占全部的百分比。第一節(jié)定性數(shù)據(jù)的圖表展示三、定性數(shù)據(jù)的統(tǒng)計圖示(二)帕累托圖第一節(jié)定性數(shù)據(jù)的圖表展示三、定性數(shù)據(jù)的統(tǒng)計圖示(四)環(huán)形圖餅圖只能顯示數(shù)據(jù)集合中各類數(shù)據(jù)所占的比例。環(huán)形圖與餅圖類似,但又有區(qū)別。環(huán)形圖可顯示多個數(shù)據(jù)集合各部分所占的相應(yīng)的比例,有利于對各數(shù)據(jù)集合構(gòu)成的比較。第一節(jié)定性數(shù)據(jù)的圖表展示三、定性數(shù)據(jù)的統(tǒng)計圖示(四)環(huán)形圖餅第二節(jié)定量數(shù)據(jù)的圖表展示一、定量數(shù)據(jù)的頻數(shù)分布表定量數(shù)據(jù)(包括定距數(shù)據(jù)和定比數(shù)據(jù))在生成頻數(shù)分布表時,需要先將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)分成不同的組別,然后再統(tǒng)計出各組別的數(shù)據(jù)頻數(shù),形成頻數(shù)分布表。需要如下三個步驟:(一)確定組數(shù)組數(shù)的確定方法有兩種。一種是首先確定總體各單位在所選定的數(shù)量分組標(biāo)志下的差別,有幾種質(zhì)的差別就分幾組,要盡量保證組間數(shù)據(jù)資料的差異性與組內(nèi)數(shù)據(jù)資料的同質(zhì)性。另一種方法是根據(jù)數(shù)據(jù)的多少、數(shù)據(jù)差異的大小來確定,一般數(shù)據(jù)越多,差異越大,組數(shù)就越多;而數(shù)據(jù)越少,差異越小,則組數(shù)就越少。(二)確定組距(三)確定組限組限是組與組之間的界限,組限包括上組限和下組限,其中各個組的起點值為下組限,終點值為上組限。確定組限時,一般要求:①第1組的下限應(yīng)小于或等于所有數(shù)據(jù)中的最小值,最后一組上限應(yīng)大于或等于所有數(shù)據(jù)中的最大值。②組限值應(yīng)盡量取整數(shù);③對于連續(xù)型變量,相鄰兩組的組的上下限要重疊,避免出現(xiàn)遺漏的現(xiàn)象。第二節(jié)定量數(shù)據(jù)的圖表展示一、定量數(shù)據(jù)的頻數(shù)分布表定量數(shù)據(jù)(包第二節(jié)定量數(shù)據(jù)的圖表展示二、定量數(shù)據(jù)的統(tǒng)計圖示(一)直方圖直方圖是用矩形的寬度和高度來表示頻數(shù)分布。(二)折線圖折線圖又稱為多邊形圖,是把直方圖中各長方形頂端的中點順次用線段連接起來,得到的表示頻數(shù)(或頻率)分布情況的一種統(tǒng)計圖。第二節(jié)定量數(shù)據(jù)的圖表展示二、定量數(shù)據(jù)的統(tǒng)計圖示(一)直方圖(第二節(jié)定量數(shù)據(jù)的圖表展示二、定量數(shù)據(jù)的統(tǒng)計圖示(三)曲線圖曲線圖用一條光滑的曲線近似地描繪頻數(shù)分布折線圖,得到頻數(shù)分布圖。(四)莖葉圖莖葉圖,是指把每個觀察數(shù)據(jù)劃分為兩個部分,并分別用莖或葉表示,然后把數(shù)據(jù)的莖按從小到大的順序排列,再在每個莖的后面列出數(shù)據(jù)的葉的部分,由此所得到的圖形稱為莖葉圖。利用Excel無法繪制出莖葉圖。如果使用莖葉圖,可以借助于SPSS軟件。第二節(jié)定量數(shù)據(jù)的圖表展示二、定量數(shù)據(jù)的統(tǒng)計圖示(三)曲線圖(第二節(jié)定量數(shù)據(jù)的圖表展示二、定量數(shù)據(jù)的統(tǒng)計圖示(五)箱線圖(六)雷達(dá)圖雷達(dá)圖是從一個點出發(fā),用每一條射線代表一個變量;將多個變量的數(shù)據(jù)點連接成線,即圍成一個區(qū)域;多個數(shù)據(jù)集合圍成多個區(qū)域,即形成雷達(dá)圖。是由一組數(shù)據(jù)的最大值、最小值、中位數(shù)、兩個四分位數(shù)等5個值繪制而成的。第二節(jié)定量數(shù)據(jù)的圖表展示二、定量數(shù)據(jù)的統(tǒng)計圖示(五)箱線圖(第二節(jié)定量數(shù)據(jù)的圖表展示二、定量數(shù)據(jù)的統(tǒng)計圖示(七)散點圖散點圖一般用來表現(xiàn)兩個變量之間的相互關(guān)系。兩個變量的任何一對取值都在平面直角坐標(biāo)系上代表一個點。在平面坐標(biāo)系上將所有這樣的點繪制出來,便形成了散點圖。第二節(jié)定量數(shù)據(jù)的圖表展示二、定量數(shù)據(jù)的統(tǒng)計圖示(七)散點圖散第三節(jié)統(tǒng)計圖表應(yīng)用中的幾個問題一、合理使用統(tǒng)計圖第一,要畫什么樣的圖,首先要看數(shù)據(jù)的類型。第二,注意統(tǒng)計圖坐標(biāo)軸的刻度。第三,繪制統(tǒng)計圖時,要在標(biāo)志和說明里表示清楚圖里面畫的是什么、單位是什么等信息,要讓數(shù)據(jù)很醒目。第四,注意不同類型統(tǒng)計圖的作用,選用恰當(dāng)?shù)慕y(tǒng)計圖。第五,我們眼睛所看到的,除了高度之外還有面積。當(dāng)所有長條的寬度一樣時,面積(高度乘寬度)和高度成正比,所以,我們眼睛接收到的信息是正確的印象,因而我們畫柱形圖時,每個長條都要一樣寬。第三節(jié)統(tǒng)計圖表應(yīng)用中的幾個問題一、合理使用統(tǒng)計圖第一,要畫什第三節(jié)統(tǒng)計圖表應(yīng)用中的幾個問題二、統(tǒng)計圖的繪制(一)利用Excel繪制統(tǒng)計圖第三節(jié)統(tǒng)計圖表應(yīng)用中的幾個問題二、統(tǒng)計圖的繪制(一)利用Ex第三節(jié)統(tǒng)計圖表應(yīng)用中的幾個問題二、統(tǒng)計圖的繪制(二)利用SPSS軟件繪制統(tǒng)計圖第三節(jié)統(tǒng)計圖表應(yīng)用中的幾個問題二、統(tǒng)計圖的繪制(二)利用SP第四章數(shù)據(jù)的統(tǒng)計量描述第一節(jié)數(shù)據(jù)集中趨勢的測度第二節(jié)數(shù)據(jù)離散程度的測度第三節(jié)數(shù)據(jù)分布形狀的度量第四節(jié)描述數(shù)據(jù)特征的統(tǒng)計量的計算與應(yīng)用4第四章數(shù)據(jù)的統(tǒng)計量描述第一節(jié)數(shù)據(jù)集中趨勢的測度4第一節(jié)數(shù)據(jù)集中趨勢的測度一、平均數(shù)反映一組數(shù)據(jù)集中趨勢水平的指標(biāo)包括平均數(shù)、中位數(shù)和眾數(shù)等。(一)算術(shù)平均數(shù)1.簡單算術(shù)平均數(shù)。若有n個數(shù)據(jù)x1,x2,…,xn,則該組數(shù)據(jù)的平均數(shù)為:2.加權(quán)算術(shù)平均數(shù)。加權(quán)算術(shù)平均數(shù)受兩個因素的影響:一是各組變量值的大小,二是各變量值出現(xiàn)的頻數(shù)的多少。當(dāng)各組頻數(shù)都相等,即在f1=f2=…=fn的情況下,加權(quán)算術(shù)平均數(shù)與簡單算術(shù)平均數(shù)存在下面的關(guān)系:簡單算術(shù)平均數(shù)是加權(quán)算術(shù)平均數(shù)的一個特例,即簡單算術(shù)平均數(shù)是權(quán)數(shù)相等條件下的加權(quán)算術(shù)平均數(shù)。將各組變量值乘以相應(yīng)的頻率后求和,即得到加權(quán)算術(shù)平均數(shù),其計算公式為:第一節(jié)數(shù)據(jù)集中趨勢的測度一、平均數(shù)反映一組數(shù)據(jù)集中趨勢水平的第一節(jié)數(shù)據(jù)集中趨勢的測度一、平均數(shù)計算算術(shù)平均數(shù)的權(quán)數(shù)主要有兩類:客觀權(quán)數(shù)和主觀權(quán)數(shù)。(1)客觀權(quán)數(shù)。客觀權(quán)數(shù)是指與被平均的變量存在客觀聯(lián)系的指標(biāo)??陀^權(quán)數(shù)的確定可以從以下兩個方面考慮:一是在頻數(shù)分布中,以各變量值出現(xiàn)的頻數(shù)或頻率為權(quán)數(shù);二是根據(jù)事物之間的相互聯(lián)系,選擇與變量存在直接數(shù)量關(guān)系的指標(biāo)為權(quán)數(shù)。(2)主觀權(quán)數(shù)。在有些情況下,缺少或不存在客觀權(quán)數(shù)的資料,但又需要體現(xiàn)被平均對象在總體中的重要程度。這時,需要根據(jù)人們的經(jīng)驗設(shè)定權(quán)數(shù)。這種權(quán)數(shù)稱為主觀權(quán)數(shù)。一般來講,在總體中作用較大的賦予較大的權(quán)數(shù),作用較小的賦予較小的權(quán)數(shù)。(二)幾何平均數(shù)幾何平均數(shù)是n個數(shù)值乘積的n次方根。1.簡單幾何平均數(shù)。2.加權(quán)幾何平均數(shù)。第一節(jié)數(shù)據(jù)集中趨勢的測度一、平均數(shù)計算算術(shù)平均數(shù)的權(quán)數(shù)主要有第一節(jié)數(shù)據(jù)集中趨勢的測度二、中位數(shù)中位數(shù)是指將數(shù)據(jù)集合中所有數(shù)據(jù)按大小順序排列,處于中點位置數(shù)據(jù)的統(tǒng)計量描述的數(shù)據(jù)。中位數(shù)的確定方法有以下三種:第一,根據(jù)未分組的原始數(shù)據(jù)確定中位數(shù)。當(dāng)數(shù)據(jù)的個數(shù)為奇數(shù)時,中位數(shù)所在的位置為,該位置上的數(shù)值為中位數(shù);當(dāng)數(shù)據(jù)的個數(shù)為偶數(shù)時,中位數(shù)的位置有兩個,一個是,另一個是,這兩個位置上的數(shù)值的平均數(shù)則為中位數(shù)。第二,根據(jù)單項式變量分布數(shù)列確定中位數(shù)。首先要確定中位數(shù)所在的位置找到中位數(shù)所在的具體位置上的值,即計算累計頻數(shù)162的組所對應(yīng)的數(shù)據(jù),本例中為第3組的數(shù)據(jù)3。故家庭人口數(shù)的中位數(shù)為3人。第一節(jié)數(shù)據(jù)集中趨勢的測度二、中位數(shù)中位數(shù)是指將數(shù)據(jù)集合中所有第一節(jié)數(shù)據(jù)集中趨勢的測度三、眾數(shù)(一)根據(jù)單項式變量數(shù)列確定眾數(shù)
找出次數(shù)最多的數(shù)據(jù)。(二)根據(jù)組距分布數(shù)列估計眾數(shù)下限公式:上限公式:眾數(shù)是根據(jù)數(shù)據(jù)出現(xiàn)的頻數(shù)的多少確定的,因此不受極端值的影響。第一節(jié)數(shù)據(jù)集中趨勢的測度三、眾數(shù)(一)根據(jù)單項式變量數(shù)列確定第一節(jié)數(shù)據(jù)集中趨勢的測度四、算術(shù)平均數(shù)、中位數(shù)和眾數(shù)的關(guān)系平均數(shù)、中位數(shù)和眾數(shù)的特點:均值(即平均數(shù)):容易受少數(shù)極端值的影響。中位數(shù):是數(shù)據(jù)按照大小排列之后位于中間的那個數(shù),不易受極端值影響。第一節(jié)數(shù)據(jù)集中趨勢的測度四、算術(shù)平均數(shù)、中位數(shù)和眾數(shù)的關(guān)系平第二節(jié)數(shù)據(jù)離散程度的測度一、極差與四分位差(一)極差極差是數(shù)據(jù)集合中最大值與最小值之差:極差說明了總體中所有數(shù)據(jù)值的變動范圍。極差越大,說明數(shù)據(jù)的變動范圍大,從而說明數(shù)據(jù)的差異大,反之則小。當(dāng)兩個極端值差異較大,而其他數(shù)據(jù)卻集中于較小區(qū)間內(nèi)或均勻分布在兩個極端數(shù)值之間時,極差就不能確切地反映全部數(shù)據(jù)之間的差異。(二)四分位差四分位差是一組數(shù)據(jù)75%位置上的四分位數(shù)與25%位置上的四分位數(shù)之差,也稱為內(nèi)距或四分位差。通常所說的四分位數(shù)是指處在25%位置上的數(shù)值和處在75%位置上的數(shù)值,見圖4-4。25%和75%位置上的四分位數(shù)位置的確定方法為:25%分位數(shù)位置:75%分位數(shù)位置:第二節(jié)數(shù)據(jù)離散程度的測度一、極差與四分位差(一)極差25%和第二節(jié)數(shù)據(jù)離散程度的測度二、方差與標(biāo)準(zhǔn)差方差是一組數(shù)據(jù)中各數(shù)值與其算術(shù)平均數(shù)離差平方的平均數(shù),標(biāo)準(zhǔn)差是方差的平方根。σ2表示總體方差,用σ表示總體標(biāo)準(zhǔn)差,代表樣本方差,代表樣本標(biāo)準(zhǔn)差。(一)總體方差和標(biāo)準(zhǔn)差1.簡單平均法。標(biāo)準(zhǔn)差計算公式:2.加權(quán)平均法。第二節(jié)數(shù)據(jù)離散程度的測度二、方差與標(biāo)準(zhǔn)差方差是一組數(shù)據(jù)中各第二節(jié)數(shù)據(jù)離散程度的測度二、方差與標(biāo)準(zhǔn)差(二)樣本方差與標(biāo)準(zhǔn)差未分組數(shù)據(jù)的方差:未分組數(shù)據(jù)的標(biāo)準(zhǔn)差:分組數(shù)據(jù)的方差:分組數(shù)據(jù)的標(biāo)準(zhǔn)差:第二節(jié)數(shù)據(jù)離散程度的測度二、方差與標(biāo)準(zhǔn)差(二)樣本方差與標(biāo)準(zhǔn)第二節(jié)數(shù)據(jù)離散程度的測度三、離散系數(shù)離散系數(shù)是測定變量值離散程度的相對指標(biāo),可以用數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比來表示。離散系數(shù)與平均數(shù)代表性的優(yōu)劣呈反方向關(guān)系:離散系數(shù)大,說明變量值的差異程度大,數(shù)據(jù)的穩(wěn)定性差,平均數(shù)的代表性差;離散系數(shù)小,說明變量值的差異程度小,數(shù)據(jù)的穩(wěn)定性強(qiáng),平均數(shù)的代表性強(qiáng)。第二節(jié)數(shù)據(jù)離散程度的測度三、離散系數(shù)離散系數(shù)是測定變量值離散第三節(jié)數(shù)據(jù)分布形狀的度量一、偏態(tài)系數(shù)偏態(tài)系數(shù)是用來反映數(shù)據(jù)分布偏斜程度的統(tǒng)計量。(一)Pearson偏度系數(shù)Pearson偏度系數(shù)是以標(biāo)準(zhǔn)差為度量單位計算的眾數(shù)與算數(shù)平均數(shù)的離差,其計算公式是:SK通常取值為-3至+3之間,其絕對值越大,表明偏斜程度越大;反之,則表明偏斜程度越小。當(dāng)SK=0時,分布為對稱分布;當(dāng)SK<0時,分布呈左偏分布,或稱負(fù)偏態(tài);當(dāng)SK>0時,分布呈右偏分布,或稱正偏態(tài)。(二)矩法偏度系數(shù)矩法偏度系數(shù)就是三階矩與標(biāo)準(zhǔn)差的三次方之比。當(dāng)SK=0時,分布為對稱分布;當(dāng)SK<0時,分布呈左偏分布,或稱負(fù)偏態(tài);當(dāng)SK>0時,分布呈右偏斜分布,或稱正偏態(tài)。第三節(jié)數(shù)據(jù)分布形狀的度量一、偏態(tài)系數(shù)偏態(tài)系數(shù)是用來反映數(shù)據(jù)分第三節(jié)數(shù)據(jù)分布形狀的度量二、峰態(tài)系數(shù)峰態(tài)系數(shù)就是用來反映數(shù)據(jù)分布峰值的高低,說明數(shù)據(jù)分布曲線的頂端尖削或扁平程度的系數(shù)。計算公式是:當(dāng)β=3時,數(shù)據(jù)的分布峰度表現(xiàn)為與正態(tài)相同;當(dāng)β>3時,為尖峰分布,表明數(shù)據(jù)分布曲線的頂部較正態(tài)分布曲線更為陡峭,且β越大,頂部就越陡峭;當(dāng)β<3時,為平頂分布,表明數(shù)據(jù)分布在眾數(shù)附近,比較分散,使得頻數(shù)分布曲線的峰頂較正態(tài)分布曲線平緩,且β值越小,頂部就越平坦。第三節(jié)數(shù)據(jù)分布形狀的度量二、峰態(tài)系數(shù)峰態(tài)系數(shù)就是用來反映數(shù)據(jù)第四節(jié)描述數(shù)據(jù)特征的統(tǒng)計量的計算與應(yīng)用一、用Excel計算第四節(jié)描述數(shù)據(jù)特征的統(tǒng)計量的計算與應(yīng)用一、用Excel計算第四節(jié)描述數(shù)據(jù)特征的統(tǒng)計量的計算與應(yīng)用二、用SPSS軟件計算第四節(jié)描述數(shù)據(jù)特征的統(tǒng)計量的計算與應(yīng)用二、用SPSS軟件計算第五章概率抽樣與抽樣分布第一節(jié)隨機(jī)變量的概率分布第二節(jié)概率抽樣方法第三節(jié)抽樣分布與中心極限定理第四節(jié)常用的抽樣分布第五節(jié)幾個重要的小樣本抽樣分布5第五章概率抽樣與抽樣分布第一節(jié)隨機(jī)變量的概率分布第一節(jié)隨機(jī)變量的概率分布一、隨機(jī)變量用于描述試驗結(jié)果的變量稱為隨機(jī)變量。隨機(jī)變量連續(xù)型隨機(jī)變量離散型隨機(jī)變量若隨機(jī)變量X的所有可能取值可以列舉,即所有可能取值為有限個或無限可列個,則稱X為離散型隨機(jī)變量;而如果隨機(jī)變量X的所有可能取值不能逐個列舉出來,而其所有可能值為某一區(qū)間(例如,一批電子元件的壽命就是在某一區(qū)間范圍內(nèi)),這時稱X為連續(xù)型隨機(jī)變量。第一節(jié)隨機(jī)變量的概率分布一、隨機(jī)變量用于描述試驗結(jié)果的變量稱第一節(jié)隨機(jī)變量的概率分布二、離散型隨機(jī)變量的概率分布(一)離散型隨機(jī)變量概率分布的表示方法兩個基本條件:第一,每個變量值的概率均為非負(fù);第二,所有可能取值的概率之和必須等于1(100%)。對于離散型隨機(jī)變量X,設(shè)其所有可能取值為x1,x2,…,xk,…,取這些值的概率依次為p1,p2,…,pk,…,其概率分布的表示方法主要有以下三種:1.公式法。2.列表法3.圖示法。第一節(jié)隨機(jī)變量的概率分布二、離散型隨機(jī)變量的概率分布(一)離第一節(jié)隨機(jī)變量的概率分布二、離散型隨機(jī)變量的概率分布(二)離散型隨機(jī)變量的期望值與方差1.離散型隨機(jī)變量的期望值。隨機(jī)變量的期望值記為E(X),其計算公式是:一個隨機(jī)變量的數(shù)學(xué)期望是對該隨機(jī)變量概率分布中心位置的度量,它反映了隨機(jī)變量的平均取值。2.離散型隨機(jī)變量的方差。第一節(jié)隨機(jī)變量的概率分布二、離散型隨機(jī)變量的概率分布(二)離第一節(jié)隨機(jī)變量的概率分布二、離散型隨機(jī)變量的概率分布(三)常用的離散型隨機(jī)變量的概率分布1.兩點分布或0-1分布。設(shè)隨機(jī)變量X只可能?。芭c1兩個值,它們的概率分布是:2.二項分布。服從二項分布的隨機(jī)變量的期望值和方差分別為:標(biāo)準(zhǔn)差為:3.泊松分布。泊松分布常用來描述在一指定時間范圍內(nèi)或者在指定的面積、體積之內(nèi),某一事件出現(xiàn)的個數(shù)的分布。設(shè)隨機(jī)變量X可取無窮多個值0,1,2,…,其概率分布為:第一節(jié)隨機(jī)變量的概率分布二、離散型隨機(jī)變量的概率分布(三)常第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布(一)概率密度函數(shù)與分布函數(shù)1.概率密度函數(shù)。概率密度函數(shù)應(yīng)滿足這兩個條件:當(dāng)連續(xù)型隨機(jī)變量分布曲線可以用數(shù)學(xué)函數(shù)形式f(x)表示時,我們稱f(x)為概率密度函數(shù)。連續(xù)型隨機(jī)變量X在a與b之間的概率可以表示為概率密度函數(shù)f(x)在[a,b]區(qū)間上的曲線下方的面積,如下所示:第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布(一)概第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布(一)概率密度函數(shù)與分布函數(shù)2.分布函數(shù)。連續(xù)型隨機(jī)變量也可以用分布函數(shù)F(x)來表示,函數(shù)定義為:P(a<X<b)也可以寫成:分布函數(shù)與概率密度函數(shù)的關(guān)系是:分布函數(shù)對x的導(dǎo)數(shù)為概率密度,即:分布函數(shù)具有以下基本性質(zhì):(1)0≤F(x)≤1;(2)F(x)是一個單調(diào)非減的函數(shù)。
第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布(一)概第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布(二)連續(xù)型隨機(jī)變量的期望值與方差已知連續(xù)型隨機(jī)變量X的概率密度為f(x),若絕對收斂,則稱其為X的數(shù)學(xué)期望,記作方差D(X)如下:第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布(二)連第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布1.均勻分布。如果隨機(jī)變量x的概率密度函數(shù)為:則稱x
服從區(qū)間[a,b]上的均勻分布,如圖在區(qū)間[a,b]上均勻分布的隨機(jī)變量x的數(shù)學(xué)期望和方差分別為:第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布1.均勻第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布2.正態(tài)分布。(1)一般正態(tài)分布。如果隨機(jī)變量
x的概率密度是:則稱x
服從一般的正態(tài)分布,簡稱正態(tài)分布,記作正態(tài)分布的概率密度f(x)具有以下性質(zhì):第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布2.正態(tài)第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布2.正態(tài)分布。(1)標(biāo)準(zhǔn)正態(tài)分布。如果正態(tài)分布的期望值為0,方差為1,則稱:為標(biāo)準(zhǔn)正態(tài)分布,記作標(biāo)準(zhǔn)正態(tài)分布的概率密度圖形如右所示:標(biāo)準(zhǔn)正態(tài)分布的重要意義:任何一個一般的正態(tài)分布,都可以通過線性變換(即標(biāo)準(zhǔn)化變換)轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布。如果要直接計算一般正態(tài)分布曲線下的面積,需要采用積分的方法。可以將服從一般正態(tài)分布的變量x轉(zhuǎn)化為服從標(biāo)準(zhǔn)正態(tài)分布的變量z,然后利用標(biāo)準(zhǔn)正態(tài)分布表得到相應(yīng)的結(jié)果。第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布2.正態(tài)第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布【例5-6】設(shè)X~N(5,32),求以下概率:
(1)P(X≤10);(2)P(2<X<10)。解:第一節(jié)隨機(jī)變量的概率分布三、連續(xù)型隨機(jī)變量的概率分布【例5第二節(jié)概率抽樣方法一、基本概念(一)總體與樣本總體是指研究對象的全體。總體是一個具有確切分布的隨機(jī)變量X,組成總體的每一個單位稱為個體、元素或總體單位。樣本是指按照一定的抽樣原則從總體中抽取一部分單位的集合.抽取樣本的目的是通過對樣本的觀察、研究,達(dá)到對總體的認(rèn)識。(二)概率抽樣概率抽樣,是指按照隨機(jī)原則在總體中抽取樣本的方法,這樣抽取的樣本稱作隨機(jī)樣本。是指總體中包含的總體單位數(shù)是無限多的??傮w有限總體無限總體是指總體單位能夠明確確定范圍,而且單位的數(shù)目是有限可數(shù)的。第二節(jié)概率抽樣方法一、基本概念(一)總體與樣本是指總體中包含第二節(jié)概率抽樣方法二、簡單隨機(jī)抽樣簡單隨機(jī)抽樣是指對總體不作任何處理,完全按照隨機(jī)原則,直接從總體全部單位中抽選出樣本單位加以觀察。(一)直接抽選法直接抽選法就是直接從調(diào)查對象中隨機(jī)抽選。一般適用于小型總體。(二)抽簽法抽簽法是給總體的每個單位進(jìn)行編碼,然后從中抽選,直到抽夠規(guī)定的數(shù)量為止。(三)隨機(jī)數(shù)字表法隨機(jī)數(shù)字表法是將0,1,2,...,9這10個數(shù)字,按照隨機(jī)原則編排成數(shù)字表,再利用隨機(jī)數(shù)字表抽選樣本單位。
若總體中單位數(shù)目為N,從中抽?。顐€單位為樣本,從排列組合的方式看,采用重復(fù)抽樣的方法共有
個可能的樣本;而采用不重復(fù)抽樣的方法則有簡單隨機(jī)抽樣的特點是:總體中每一個單位被抽中的機(jī)會均等,且方便簡單,易于掌握。簡單隨機(jī)抽樣重復(fù)抽樣不重復(fù)抽樣是指從總體中抽取一個單位后,把這個單位放回總體再抽取第二個單位,直至抽取第n個單位為止。是每次抽取一個單位后,不再將其放回總體,而在所有未入樣的單位中等概率抽樣,因此,每個總體單位不可能被重復(fù)抽中,故稱為不重復(fù)抽樣。第二節(jié)概率抽樣方法二、簡單隨機(jī)抽樣簡單隨機(jī)抽樣是指對總體不作第二節(jié)概率抽樣方法三、分層抽樣分層抽樣又稱類型抽樣或分類抽樣。這種抽樣方法是先將總體各單位按某一主要標(biāo)志分層(組),而后在各層中按隨機(jī)原則抽取若干個樣本單位,由各層的樣本單位組成一個樣本。若總體中有單位數(shù)N個,將總體劃分為K層,第i層總體單位數(shù)為個(i=1,2,3,…,k),再從各層中隨機(jī)抽取樣本單位個,構(gòu)成樣本。優(yōu)點:第一,能夠保證樣本的代表性。第二,適當(dāng)?shù)胤峙涓鲗訕颖?,可以較大地提高抽樣的精度。第三,分層抽樣可以按自然的地區(qū)或行政系統(tǒng)分層。除了可以估計總體的水平外,還可對每一層的水平進(jìn)行估計。第二節(jié)概率抽樣方法三、分層抽樣分層抽樣又稱類型抽樣或分類抽樣第二節(jié)概率抽樣方法四、等距抽樣等距抽樣又稱機(jī)械抽樣或系統(tǒng)抽樣,它是將總體全部單位按某一標(biāo)志特征排序,并在該序列中的前N/n個單元中隨機(jī)抽取第一個樣本單元,而后按固定的順序和相等間隔在總體中抽取若干樣本單位,構(gòu)成樣本。優(yōu)點:組織形式簡便,易于實施。等距抽樣要計算抽樣間隔。間隔d等于總體單位數(shù)N除以樣本單位數(shù)n,即等距抽樣按樣本單位抽選的方法不同,可分為隨機(jī)起點等距抽樣、半距起點等距抽樣和對稱等距抽樣等。第二節(jié)概率抽樣方法四、等距抽樣等距抽樣又稱機(jī)械抽樣或系統(tǒng)抽樣第二節(jié)概率抽樣方法四、等距抽樣(一)隨機(jī)起點等距抽樣(二)半距起點等距抽樣(三)對稱等距抽樣當(dāng)抽樣間隔d確定以后,在第一組(即前d個單位)隨機(jī)抽選第一個樣本單位,設(shè)順序號為a,則第二個樣本單位的順序號為,其余類推,第n個樣本單位的順序號為。這種抽樣方法要求各樣本單位都選在各組的中點。各樣本單位的順序號是:第一個樣本單位的順序號是,第二個樣本單位的順序號是,第n個樣本單位的順序號是這種抽樣方法要求在前d個單位中隨機(jī)抽取第一個樣本單位,假設(shè)該單位的順序號為a,然后在第二組與第一個樣本單位對稱的位置抽取第二個樣本單位,它的序號為2d-a。在第三組與第二組樣本單位對的位置抽取第三個樣本單位,它的序號是2d+a,以后抽出的樣本單位序號依次為4d-a,4d+a,6d-a,6d+a,…。第二節(jié)概率抽樣方法四、等距抽樣(一)隨機(jī)起點等距抽樣(二)半第二節(jié)概率抽樣方法五、整群抽樣整群抽樣是將總體各單位劃分為若干群,然后以群為單位,從總體中隨機(jī)抽取一部分群,對被抽中群內(nèi)的所有單位進(jìn)行全面調(diào)查。整群抽樣對總體劃分群的基本要求:群與群之間不重疊,即總體中的任何一個單位只能屬于某個群;全部總體單位毫無遺漏,即總體內(nèi)的任一單位必屬于某個群。總體中各群內(nèi)所包含的單位數(shù)可以相同,也可以不相同。整群抽樣劃分群的目的:擴(kuò)大總體“單位”,抽取的單位不是總體的基本單位,而是總體的群單元。分層抽樣劃分層的目的:是將數(shù)據(jù)相近的總體單位劃歸同一層,從而減少層內(nèi)單位的差異;分層抽樣抽取的單位仍是總體的基本單位。整群抽樣的優(yōu)點:主要是設(shè)計和組織抽樣比較方便,能節(jié)省人力、財力、物力和時間。整群抽樣的缺點:相對于簡單隨機(jī)抽樣,在相同的調(diào)查單位下,用整群抽樣估計總體時,其估計精度相對較低。第二節(jié)概率抽樣方法五、整群抽樣整群抽樣是將總體各單位劃分為若第二節(jié)概率抽樣方法六、多階段抽樣當(dāng)總體很大時,可以把抽樣過程分為幾個過渡階段,到最后才具體抽到樣本單位,這樣的組織形式稱為多階段抽樣。多階段抽樣的主要優(yōu)點是有利于抽樣的組織和實施,可以提高抽樣估計精度并滿足各階段對調(diào)查數(shù)據(jù)的需求。多階段抽樣還特別適用于大批量生產(chǎn)的產(chǎn)品檢驗,可以節(jié)約人力、物力和財力。第二節(jié)概率抽樣方法六、多階段抽樣當(dāng)總體很大時,可以把抽樣過程第三節(jié)抽樣分布與中心極限定理一、總體分布總體分布是指研究對象這一總體的各單位標(biāo)志變量的分布狀況,即總體各單位數(shù)據(jù)分布狀況的一種概括。第三節(jié)抽樣分布與中心極限定理一、總體分布總體分布是指研究對象第三節(jié)抽樣分布與中心極限定理二、樣本分布若從總體中抽取一個樣本容量為n的樣本,那么這個樣本中所有單位的數(shù)據(jù)也是有差異的,并且形成一個分布,稱之為樣本分布。由于樣本是從總體中抽取的,其中就包括總體的一些信息,所以,樣本分布也稱為經(jīng)驗分布。隨機(jī)抽取的樣本,一方面要受總體分布的制約,受總體分布的影響,一般應(yīng)與總體分布相近似。另一方面,由于樣本的抽取是隨機(jī)的,樣本分布不可能與總體分布完全一致,當(dāng)抽取的單位數(shù)即樣本容量比較小時,這種差別會更大。樣本容量如果增大,樣本的分布就會逐漸接近總體分布。第三節(jié)抽樣分布與中心極限定理二、樣本分布第三節(jié)抽樣分布與中心極限定理三、抽樣分布為了用樣本統(tǒng)計量估計總體指標(biāo),我們需要研究樣本指標(biāo)圍繞總體指標(biāo)變動的規(guī)律性,研究樣本統(tǒng)計量的分布,即抽樣分布。所謂抽樣分布,是指抽取的總體單位數(shù)即樣本容量n一定時,從總體中按隨機(jī)抽樣的原則,所有可能抽取的樣本的統(tǒng)計量的分布,也稱為樣本統(tǒng)計量的概率分布。與樣本分布是經(jīng)驗分布不同,抽樣分布是理論分布。如果總體單位數(shù)為N,抽取樣本的容量為n,采用不重復(fù)抽樣的方式,就有(不考慮順序)或(考慮順序)個可能的樣本,每一個樣本都可以計算一個樣本的均值
、樣本比例p和樣本方差,這個,p或所形成的分布就是抽樣分布。第三節(jié)抽樣分布與中心極限定理三、抽樣分布為了用樣本統(tǒng)計量估計第三節(jié)抽樣分布與中心極限定理四、中心極限定理中心極限定理證明了隨著樣本容量n的不斷增大,無論原來的總體是否是正態(tài)分布,其樣本均值將趨向于正態(tài)分布。實際應(yīng)用中,究竟樣本容量多大才能使樣本均值趨向于正態(tài)分布?這一方面取決于樣本總體分布的形狀和偏離正態(tài)分布的程度,另一方面取決于樣本統(tǒng)計量的性質(zhì)。大量的實踐和模擬證明:隨著n的增大,樣本均值趨向于正態(tài)的速度是相當(dāng)快的,當(dāng)n≥30時,均值就可以近似地服從正態(tài)分布。第三節(jié)抽樣分布與中心極限定理四、中心極限定理中心極限定理證明第四節(jié)常用的抽樣分布一、樣本均值x
的抽樣分布(一)樣本均值x抽樣分布形式1.若原總體分布是正態(tài)分布,則不論樣本容量大小,樣本均值x的抽樣分布都服從正態(tài)分布。2.若原總體分布是非正態(tài)分布,當(dāng)從總體中抽取的是一個大樣本,即一般認(rèn)為n≥30時,由中心極限定理可知,其樣本均值x的抽樣分布也近似服從正態(tài)分布。當(dāng)從總體中抽取的是小樣本,則樣本均值x的抽樣分布不一定近似正態(tài)分布,不能按正態(tài)分布去推斷總體的均值。(二)樣本均值x分布的主要數(shù)量特征1.無論是重復(fù)抽樣還是不重復(fù)抽樣,樣本均值的x數(shù)學(xué)期望始終等于總體均值,即2.樣本均值x的抽樣分布的方差與抽樣的方式有關(guān):第一,在重復(fù)抽樣的條件下,樣本均值x的抽樣分布的方差為總體方差的1/n,即第二,若為不重復(fù)抽樣,則,其中稱為有限總體不重復(fù)抽樣的修正系數(shù)。第四節(jié)常用的抽樣分布一、樣本均值x的抽樣分布(一)樣本第四節(jié)常用的抽樣分布二、樣本比例p
的抽樣分布樣本比例是在n個樣本單位中具有某種特征的單位所占的比例:其一,若采用重復(fù)抽樣,其數(shù)學(xué)期望和方差分別為:p的抽樣分布為:其二,若采用不重復(fù)抽樣,其數(shù)學(xué)期望和方差分別為:p的抽樣分布為:第四節(jié)常用的抽樣分布二、樣本比例p的抽樣分布樣本比例是在n第五節(jié)幾個重要的小樣本抽樣分布一、x2分布第五節(jié)幾個重要的小樣本抽樣分布一、x2分布第五節(jié)幾個重要的小樣本抽樣分布二、t
分布第五節(jié)幾個重要的小樣本抽樣分布二、t分布第五節(jié)幾個重要的小樣本抽樣分布二、F分布第五節(jié)幾個重要的小樣本抽樣分布二、F分布第六章參數(shù)估計第一節(jié)參數(shù)估計的基本問題第二節(jié)一個總體參數(shù)的區(qū)間估計第三節(jié)兩個總體參數(shù)的區(qū)間估計第四節(jié)樣本容量的確定6第六章參數(shù)估計第一節(jié)參數(shù)估計的基本問題6第一節(jié)參數(shù)估計的基本問題一、抽樣推斷及其基本概念抽樣推斷就是從研究對象的全部單元中抽取一部分單元進(jìn)行調(diào)查,從中取得數(shù)據(jù),并從這些數(shù)據(jù)中獲取信息,以此來推斷全體,包括參數(shù)估計與假設(shè)檢驗。所謂參數(shù),從狹義上講,是指決定某一理論分布的分布函數(shù)中一個或若干個數(shù)值,如正態(tài)分布的期望值μ和方差σ2,它決定了變量分布的形狀、重心位置和離散程度。從廣義上講,參數(shù)反映的是總體數(shù)據(jù)特征和決定有關(guān)模型的數(shù)值,除數(shù)據(jù)分布的期望值和方差、總體數(shù)據(jù)的平均數(shù)、比例外,還包括諸如兩個變量中回歸模型的回歸系數(shù)、相關(guān)模型中的相關(guān)系數(shù)等。在對總體參數(shù)進(jìn)行估計時,需要利用樣本的統(tǒng)計量,這些統(tǒng)計量的具體值是根據(jù)樣本數(shù)據(jù)計算得到的。樣本的隨機(jī)性決定了樣本統(tǒng)計量是一個隨機(jī)變量。這些用于估計總體參數(shù)的樣本統(tǒng)計量即樣本函數(shù)的名稱,稱為估計量。抽取一個樣本并計算這個樣本估計量所得到的數(shù)值,稱為估計值,它是估計量的具體表現(xiàn)。第一節(jié)參數(shù)估計的基本問題一、抽樣推斷及其基本概念抽樣推斷就是第一節(jié)參數(shù)估計的基本問題二、評價估計量的標(biāo)準(zhǔn)第一,估計量是隨機(jī)變量,但是性質(zhì)優(yōu)良的估計量,即使它的取值會隨著樣本的隨機(jī)性而隨機(jī)波動,在總體上卻應(yīng)集中在參數(shù)真值的附近,圍繞著參數(shù)的實際值而對稱地變化,即估計量應(yīng)不存在系統(tǒng)偏差。第二,估計量數(shù)值的隨機(jī)變化程度小,估計的效果比較好。第三,當(dāng)樣本容量不斷增大時,估計量的值要能穩(wěn)步地趨向總體參數(shù)的實際值。第四,樣本數(shù)據(jù)來自于總體數(shù)據(jù),它當(dāng)然包含了總體的信息,這些信息構(gòu)成了樣本推斷總體參數(shù)的依據(jù)。為了提高估計的精度,估計量要能充分地吸收樣本中所包含的關(guān)于參數(shù)的信息。第五,當(dāng)假定的理論分布與總體數(shù)據(jù)的實際分布存在差距時,估計量的估計值不應(yīng)受到太大的影響。第一節(jié)參數(shù)估計的基本問題二、評價估計量的標(biāo)準(zhǔn)第一,估計量是隨第一節(jié)參數(shù)估計的基本問題二、評價估計量的標(biāo)準(zhǔn)性質(zhì):(一)無偏性無偏性是指估計量抽樣分布的數(shù)學(xué)期望等于總體的參數(shù)的值。第一節(jié)參數(shù)估計的基本問題二、評價估計量的標(biāo)準(zhǔn)性質(zhì):第一節(jié)參數(shù)估計的基本問題二、評價估計量的標(biāo)準(zhǔn)性質(zhì):(二)有效性有效性是指估計量的方差盡可能小。第一節(jié)參數(shù)估計的基本問題二、評價估計量的標(biāo)準(zhǔn)性質(zhì):第一節(jié)參數(shù)估計的基本問題二、評價估計量的標(biāo)準(zhǔn)性質(zhì):(三)一致性一致性是指隨著樣本容量的增大,即隨著抽取的樣本單元數(shù)的增多,估計量的估計值越來越接近于總體參數(shù)的真值。如果一個估計量是一致估計量,那么樣本越大就越精確。第一節(jié)參數(shù)估計的基本問題二、評價估計量的標(biāo)準(zhǔn)性質(zhì):第一節(jié)參數(shù)估計的基本問題三、點估計與區(qū)間估計(一)點估計點估計就是用估計量的某個取值直接作為總體數(shù)據(jù)參數(shù)的估計值。點估計的缺陷是沒有辦法給出估計的可靠性,也無法確定點估計值與總體參數(shù)真值接近的程度,因為一個點估計量的可靠性是由其抽樣分布的標(biāo)準(zhǔn)誤差來衡量的。對總體參數(shù)真值進(jìn)行估計時,往往不能完全依賴于一個點估計值,而應(yīng)圍繞點估計值構(gòu)造出總體參數(shù)的一個區(qū)間。(二)區(qū)間估計區(qū)間估計是在點估計的基礎(chǔ)上給出總體參數(shù)估計的一個區(qū)間,該區(qū)間通常是由樣本估計量的值即點估計值加減估計誤差得到的。區(qū)間估計是指根據(jù)樣本資料給總體參數(shù)劃出一個大致的范圍,以期該范圍能夠覆蓋參數(shù)的真實值,在給出這一范圍的同時,給出相應(yīng)的概率,作為估計置信度的一個度量。把估計區(qū)間與概率保證程度(置信度)聯(lián)系起來的區(qū)間,稱為置信區(qū)間。置信度:如果抽取100個樣本,做100個置信區(qū)間,則將有100(1-α)個區(qū)間包含總體參數(shù)的真值,而不包含參數(shù)真值的將平均有100α個區(qū)間。第一節(jié)參數(shù)估計的基本問題三、點估計與區(qū)間估計(一)點估計第一節(jié)參數(shù)估計的基本問題四、參數(shù)估計的原理置信區(qū)間的大小與置信水平的高低存在著正向變動關(guān)系。第一節(jié)參數(shù)估計的基本問題四、參數(shù)估計的原理置信區(qū)間的大小與置第二節(jié)一個總體參數(shù)的區(qū)間估計一、一個總體均值的區(qū)間估計(一)樣本來自于總體方差σ2已知的正態(tài)分布總體如果總體是正態(tài)分布,且總體方差σ2已知,按上節(jié)區(qū)間估計原理所得到的區(qū)間估計公式,可知置信度1-α下的區(qū)間為:第二節(jié)一個總體參數(shù)的區(qū)間估計一、一個總體均值的區(qū)間估計(一)第二節(jié)一個總體參數(shù)的區(qū)間估計一、一個總體均值的區(qū)間估計(二)從非正態(tài)分布的總體中抽取一大樣本,且總體方差σ2已知可以用近似地計算出總體均值μ的置信區(qū)間。(三)從非正態(tài)分布的總體中抽取一大樣本,且總體方差未知可以用樣本的方差S2作為總體方差的估計量,這時總體均值的置信區(qū)間為(四)樣本來自于總體方差σ2未知的正態(tài)分布的總體1.大樣本下,置信度1-α下的區(qū)間為:2.小樣本下,置信度1-α下的區(qū)間為:第二節(jié)一個總體參數(shù)的區(qū)間估計一、一個總體均值的區(qū)間估計(二)第二節(jié)一個總體參數(shù)的區(qū)間估計二、一個總體比例的區(qū)間估計總體比例是指總體中具有某種特征的單元所占的比例,它也是實際工作中常見的要估計的參數(shù)之一。實際工作中總體比例P是未知的,但我們所要估計的也正是總體比例P,所以,區(qū)間估計時就需要用樣本p來代替總體比例P。如果nP和n(1-p)兩者皆大于5,并且n相對總體來說很小,則在置信度1-α下的總體比例的區(qū)間估計公式為【例】質(zhì)檢部門為檢查某企業(yè)產(chǎn)品的合格率,在其所生產(chǎn)的產(chǎn)品中隨機(jī)抽取了120個產(chǎn)品進(jìn)行檢驗,檢驗結(jié)果為120個產(chǎn)品中有114個合格產(chǎn)品,樣本合格率為95%。用95%的置信度估計該企業(yè)產(chǎn)品合格率的置信區(qū)間。第二節(jié)一個總體參數(shù)的區(qū)間估計二、一個總體比例的區(qū)間估計總體比第二節(jié)一個總體參數(shù)的區(qū)間估計三、一個總體方差的區(qū)間估計總體方差
σ2
通常是未知的,需要我們通過樣本數(shù)據(jù)對其進(jìn)估計。在總體正態(tài)分布的條件下,統(tǒng)計量近似地服從
n-1的
χ2分布,記作
χ2(n-1)。1-α的置信水平下,通過不等式的變換,得到σ2的置信區(qū)間如下:【例】電子元件廠從企業(yè)生產(chǎn)的產(chǎn)品中隨機(jī)抽取了31個產(chǎn)品并進(jìn)行了測試,根據(jù)樣本數(shù)據(jù)計算的使用壽命的方差為300小時,要求:(1)構(gòu)造σ2的95%的置信區(qū)間;(2)構(gòu)造σ的95%的置信區(qū)間;(3)回答構(gòu)造上述區(qū)間時作了何種假設(shè)。第二節(jié)一個總體參數(shù)的區(qū)間估計三、一個總體方差的區(qū)間估計總體方第三節(jié)兩個總體參數(shù)的區(qū)間估計一、兩個總體均值的區(qū)間估計(一)兩個總體服從正態(tài)分布且方差已知當(dāng)兩個總體均服從正態(tài)分布,也服從正態(tài)分布,或者不管兩個總體是否服從正態(tài)分布,只要被抽出的兩個隨機(jī)樣本相互獨立,而且樣本容量足夠大,那么,根據(jù)中心極限定理,樣本平均數(shù)之差的抽樣分布就逼近正態(tài)分布,即:這樣:那么,1-α置信水平下兩總體均值之差的置信區(qū)間為:
第三節(jié)兩個總體參數(shù)的區(qū)間估計一、兩個總體均值的區(qū)間估計(一)第三節(jié)兩個總體參數(shù)的區(qū)間估計一、兩個總體均值的區(qū)間估計
(二)兩個總體服從正態(tài)分布,總體方差未知但相等如果兩個總體均服從正態(tài)分布,總體方差未知但已知它們相等,從這兩個總體中各隨機(jī)抽取一個獨立的隨機(jī)樣本時,要構(gòu)造的置信區(qū)間,首先要利用樣本數(shù)據(jù)計算出它們的共同方差的估計值。對此,通??梢圆捎脙蓚€樣本方差的加權(quán)平均數(shù),權(quán)數(shù)則是它們的自由度,即:的標(biāo)準(zhǔn)差為:第三節(jié)兩個總體參數(shù)的區(qū)間估計一、兩個總體均值的區(qū)間估計(二第三節(jié)兩個總體參數(shù)的區(qū)間估計一、兩個總體均值的區(qū)間估計
(三)兩個總體服從正態(tài)分布,總體方差未知且不等第三節(jié)兩個總體參數(shù)的區(qū)間估計一、兩個總體均值的區(qū)間估計(第三節(jié)兩個總體參數(shù)的區(qū)間估計一、兩個總體均值的區(qū)間估計
(四)兩個總體不服從正態(tài)分布且總體方差未知第三節(jié)兩個總體參數(shù)的區(qū)間估計一、兩個總體均值的區(qū)間估計(四第三節(jié)兩個總體參數(shù)的區(qū)間估計二、兩個總體比例的區(qū)間估計第三節(jié)兩個總體參數(shù)的區(qū)間估計二、兩個總體比例的區(qū)間估計第三節(jié)兩個總體參數(shù)的區(qū)間估計三、兩個正態(tài)總體方差比的區(qū)間估計第三節(jié)兩個總體參數(shù)的區(qū)間估計三、兩個正態(tài)總體方差比的區(qū)間估計第四節(jié)樣本容量的確定一、影響樣本容量的主要因素第一,對估計精度的要求,即希望得到的估計值與總體真值之間的離差在什么樣的范圍以內(nèi),或想構(gòu)造多寬的置信區(qū)間。第二,對置信度的要求,即對于規(guī)定的置信區(qū)間來說想要多大的置信度。置信度與樣本容量成正比,當(dāng)其他條件相同時,置信度越高,樣本容量也要越大;而置信度越低,對樣本容量的要求也就越小。第三,總體方差的大小??傮w方差是說明總體內(nèi)部各單位之間差異大小的,其與樣本容量成正比關(guān)系,總體的方差越大,要求的樣本容量越大;反之,如果總體方差越小,對樣本容量的要求也越小。第四節(jié)樣本容量的確定一、影響樣本容量的主要因素第一,對估計精第四節(jié)樣本容量的確定二、估計總體均值時樣本容量的確定(一)估計一個總體均值時樣本容量的確定總體均值的置信區(qū)間由樣本均值和估計誤差兩部分組成。對于給定的的值和總體標(biāo)準(zhǔn)差σ,可以確定任一允許的估計誤差所需要的樣本容量,其計算公式是:(二)估計兩個總體均值之差時樣本容量的確定對于給定的估計誤差Δ和置信水平1-α,估計兩個總體均值之差所需要的樣本量為:
第四節(jié)樣本容量的確定二、估計總體均值時樣本容量的確定(一)估第四節(jié)樣本容量的確定三、估計總體比例時樣本容量的確定
(一)估計一個總體比例時樣本容量的確定在重復(fù)抽樣或無限總體抽樣條件下,總體比例置信區(qū)間的估計誤差為從估計誤差的角度,我們可以推導(dǎo)出估計總體比例時所需要的樣本容量,其計算公式為:
(二)估計兩個總體比例之差時樣本容量的確定對于給定的估計誤差Δ和置信水平1-α,估計兩個總體比例之差時所需的樣本容量的計算公式為:第四節(jié)樣本容量的確定三、估計總體比例時樣本容量的確定(一)第七章參數(shù)的假設(shè)檢驗第一節(jié)假設(shè)檢驗的基本問題第二節(jié)一個總體參數(shù)的假設(shè)檢驗第三節(jié)兩個總體參數(shù)的假設(shè)檢驗7第七章參數(shù)的假設(shè)檢驗第一節(jié)假設(shè)檢驗的基本問題7第一節(jié)假設(shè)檢驗的基本問題一、假設(shè)檢驗的基本概念
(一)假設(shè)檢驗的思想假設(shè)檢驗的基本思想是依據(jù)概率論中的小概率原理,應(yīng)用反證法,通過觀察樣本的出現(xiàn)是否屬于小概率事件來判別關(guān)于總體假設(shè)的真?zhèn)巍?/p>
(二)原假設(shè)與備擇假設(shè)假設(shè)包括原假設(shè)和備擇假設(shè)。其中,原假設(shè)是待檢驗的假設(shè),而假設(shè)檢驗就是檢驗原假設(shè)的真?zhèn)危瑐鋼窦僭O(shè)則是原假設(shè)被拒絕后替換的假設(shè)。
(三)檢驗統(tǒng)計量對樣本數(shù)據(jù)進(jìn)行加工并用來判斷是否拒絕原假設(shè)的統(tǒng)計量稱為檢驗統(tǒng)計量。
(四)顯著性水平假設(shè)檢驗的基本原理是小概率原理,小概率原理,若要在試驗中發(fā)生,則檢驗統(tǒng)計量就會落入小概率發(fā)生的范圍即拒絕域中,就要拒絕原假設(shè)。拒絕域的大小取決于小概率的大小,通常用α表示,檢驗時通常要先確定顯著性水平α。(五)拒絕域和接受域假設(shè)檢驗根據(jù)檢驗統(tǒng)計量的具體計算結(jié)果來判斷是否拒絕原假設(shè)H0,因此,在H0假設(shè)為真的情況下,將抽樣所有可能結(jié)果組成的樣本空間劃分為兩部分:一部分是原假設(shè)為真時允許范圍內(nèi)的變動,稱為接受域;另一部分是超過了一定的界限,即樣本均值與假設(shè)的總體均值之間的差異過大,大過我們能接受的范圍,即當(dāng)原假設(shè)為真時只有很小的概率才能出現(xiàn)的范圍,因而當(dāng)統(tǒng)計量落入這一范圍時便應(yīng)拒絕原假設(shè),這一區(qū)域稱為拒絕域。接受域和拒絕域之間的分割點通常稱作臨界值。第一節(jié)假設(shè)檢驗的基本問題一、假設(shè)檢驗的基本概念(一)假設(shè)檢第一節(jié)假設(shè)檢驗的基本問題二、假設(shè)檢驗的基本步驟(一)提出原假設(shè)和備擇假設(shè)(二)確定檢驗統(tǒng)計量(三)確定顯著性水平和相應(yīng)的拒絕域(四)作出決策第一節(jié)假設(shè)檢驗的基本問題二、假設(shè)檢驗的基本步驟(一)(二)(第一節(jié)假設(shè)檢驗的基本問題三、假設(shè)檢驗中的兩類錯誤第一類錯誤是原假設(shè)H0為真而被拒絕的錯誤,這是犯了棄真的錯誤,犯此種錯誤的概率是α,所以也叫α錯誤或第一類錯誤;第二類錯誤是指原假設(shè)H0為偽而檢驗的結(jié)果不予以拒絕,這類錯誤稱為取偽錯誤,發(fā)生這種錯誤的概率通常用β表示,故也稱為β錯誤或第二類錯誤。在假設(shè)檢驗中,犯上述兩類錯誤的可能性的大小是一對矛盾。在樣本容量一定的條件下,降低犯棄真錯誤的可能性(α降低),必然會增大犯取偽錯誤的可能性(β增大);反之亦然。第一節(jié)假設(shè)檢驗的基本問題三、假設(shè)檢驗中的兩類錯誤第一類錯誤是第一節(jié)假設(shè)檢驗的基本問題四、假設(shè)檢驗結(jié)論的解讀在對假設(shè)檢驗結(jié)果的表述中,應(yīng)盡量避免使用接受的肯定語氣。隨著顯著性水平取值的減小,拒絕假設(shè)的理由將變得更加充分。因為,拒絕一個說法,只要找到反例即可,即當(dāng)前樣本就可以說明假設(shè)不可靠;而要接受某種說法,只是表明依據(jù)現(xiàn)有的抽取出來的樣本,還不足以判斷假設(shè)不成立,只是暫時找不到充分的理由拒絕假設(shè),但這并不等于以后的觀察或試驗還找不到證據(jù)。第一節(jié)假設(shè)檢驗的基本問題四、假設(shè)檢驗結(jié)論的解讀在對假設(shè)檢驗結(jié)第二節(jié)一個總體參數(shù)的假設(shè)檢驗一、關(guān)于總體均值μ
的假設(shè)檢驗
(一)大樣本檢驗按照中心極限定理,在大樣本情況下,無論總體是否服從正態(tài)分布,樣本均值的抽樣分布均近似服從正態(tài)分布。樣本均值經(jīng)標(biāo)準(zhǔn)化后得到的服從標(biāo)準(zhǔn)正態(tài)分布。
(二)小樣本檢驗當(dāng)總體方差σ2已知時,由于總體服從正態(tài)分布,因而,即使在小樣本情況下,樣本均值標(biāo)準(zhǔn)化后標(biāo)準(zhǔn)正態(tài)分布,此時,可采用服從標(biāo)準(zhǔn)正態(tài)分布的Z檢驗統(tǒng)計量進(jìn)行檢驗。檢驗統(tǒng)計量為當(dāng)總體方差σ2未知時,可以用樣本方差S2代替總體方差σ2。如果總體服從正態(tài)分布,但在小樣本情況下,樣本均值標(biāo)準(zhǔn)化后服從不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從自由度為n-1的t分布,則檢驗統(tǒng)計量為第二節(jié)一個總體參數(shù)的假設(shè)檢驗一、關(guān)于總體均值μ的假設(shè)檢驗第二節(jié)一個總體參數(shù)的假設(shè)檢驗一、關(guān)于總體均值μ
的假設(shè)檢驗
(三)總體均值μ
的假設(shè)檢驗在SPSS中的實現(xiàn)使用SPSS軟件,點擊“Analyze”下面“CompareMeans”中的“One-SampleTTest”。然后將要檢驗的變量選入“TestVariable”中,在“TestVariable”中輸入原假設(shè)中總體均值μ0的值,再點擊“OK”即可。第二節(jié)一個總體參數(shù)的假設(shè)檢驗一、關(guān)于總體均值μ的假設(shè)檢驗第二節(jié)一個總體參數(shù)的假設(shè)檢驗二、關(guān)于總體比例P的假設(shè)檢驗在大樣本情況下樣本比例p近似服從正態(tài)分布,因而檢驗統(tǒng)計量樣本比例p與總體比例P之間的距離與標(biāo)準(zhǔn)差之比即Z=則近似地服從標(biāo)準(zhǔn)正態(tài)分布。利用SPSS軟件操作的方法是:在“Aalyze”下拉菜單中,選擇“NonparamitricTests”中的“Binomial”,然后在“DefineDichotomy”的“Cutpoint”中輸入計算比例時的數(shù)據(jù)劃分的標(biāo)準(zhǔn)(如計算大于120的比例,則輸入120即可),在“TestPrortion”中輸入原假設(shè)中的總體比例P0,如0.5,最好點擊“OK”,即可得到計算結(jié)果。第二節(jié)一個總體參數(shù)的假設(shè)檢驗二、關(guān)于總體比例P的假設(shè)檢驗第二節(jié)一個總體參數(shù)的假設(shè)檢驗三、關(guān)于總體方差σ2
的假設(shè)檢驗進(jìn)行總體方差σ2的檢驗時,不論樣本量的規(guī)模多大,都要求總體服從正態(tài)分布,其中,檢驗的統(tǒng)計量為:在給定顯著性水平α?xí)r,雙側(cè)檢驗的拒絕域如下圖所示:第二節(jié)一個總體參數(shù)的假設(shè)檢驗三、關(guān)于總體方差σ2的假設(shè)檢第三節(jié)兩個總體參數(shù)的假設(shè)檢驗一、兩個總體均值之差的假設(shè)檢驗
(一)獨立大樣本條件下的總體均值差的假設(shè)檢驗根據(jù)中心極限定理,在大樣本情況下,兩個樣本均值均近似地服從正態(tài)分布,這樣,兩個樣本的均值之差也近似地服從正態(tài)分布:則:第三節(jié)兩個總體參數(shù)的假設(shè)檢驗一、兩個總體均值之差的假設(shè)檢驗第三節(jié)兩個總體參數(shù)的假設(shè)檢驗一、兩個總體均值之差的假設(shè)檢驗
(二)獨立小樣本條件下的兩個正態(tài)總體均值差的假設(shè)檢驗1.兩個總體方差已知時,無論樣本量的大小,從兩個正態(tài)分布的總體中隨機(jī)抽取的兩個樣本均值之差的抽樣分布都服從正態(tài)分布,這時,用于假設(shè)檢驗的檢驗統(tǒng)計量為:2.兩個總體的方差未知但相等時,即,則需要用來自兩個總體的隨機(jī)樣本的樣本方差估計總體方差,其估計公式是:檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東科學(xué)技術(shù)職業(yè)學(xué)院《園林規(guī)劃設(shè)計原理Ⅲ》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東科技學(xué)院《國家預(yù)算》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東機(jī)電職業(yè)技術(shù)學(xué)院《安裝工程識圖》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東行政職業(yè)學(xué)院《計算機(jī)電子電路基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東東軟學(xué)院《現(xiàn)代信號處理專題》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東財經(jīng)大學(xué)《倉儲與配送管理實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東財經(jīng)大學(xué)《基礎(chǔ)俄語三》2023-2024學(xué)年第一學(xué)期期末試卷
- 砂鍋菜培訓(xùn)課件
- 贛西科技職業(yè)學(xué)院《互聯(lián)網(wǎng)發(fā)展歷程》2023-2024學(xué)年第一學(xué)期期末試卷
- 贛南醫(yī)學(xué)院《企業(yè)仿真綜合實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 《皮膚病中成藥導(dǎo)引》課件
- 2024-2030年中國除顫儀行業(yè)市場分析報告
- 2023-2024學(xué)年廣東省廣州市越秀區(qū)九年級(上)期末物理試卷(含答案)
- 廣東省廣州市天河區(qū)2023-2024學(xué)年八年級上學(xué)期期末考試物理試題(含答案)
- 2024年高一上學(xué)期期末數(shù)學(xué)考點《壓軸題》含答案解析
- 2024年山東省公務(wù)員錄用考試《行測》真題及答案解析
- 眼鏡學(xué)智慧樹知到答案2024年溫州醫(yī)科大學(xué)
- 2025屆高考政治一輪復(fù)習(xí):統(tǒng)編版必修4《哲學(xué)與文化》必背知識點考點提綱
- 施工電梯基礎(chǔ)(地下室頂板加固圖文并茂)施工方案
- 小學(xué)科學(xué)自我課堂教學(xué)診斷分析報告
- 線束維修工具挑針退針挑端子工具對照表
評論
0/150
提交評論