




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、統(tǒng)計(jì)學(xué)講義第1章 導(dǎo) 論第1節(jié)統(tǒng)計(jì)學(xué)的發(fā)展 一、統(tǒng)計(jì)活動(dòng)的產(chǎn)生和發(fā)展自從有了國(guó)家,便有了統(tǒng)計(jì)實(shí)踐活動(dòng)。我國(guó)在原始社會(huì)末期,在奴隸制形成的過(guò)程中,就已經(jīng)出現(xiàn)了統(tǒng)計(jì)的萌芽。 二、統(tǒng)計(jì)學(xué)的產(chǎn)生和發(fā)展1、國(guó)勢(shì)學(xué)派或記述學(xué)派:創(chuàng)始人是德國(guó)的康令 。17世紀(jì)中葉。文字記述為主。2、政治算術(shù)學(xué)派:代表人是英國(guó)的威廉. 配第 。17世紀(jì)中葉。用數(shù)量說(shuō)話。3、數(shù)理統(tǒng)計(jì)學(xué)派:創(chuàng)始人是比利時(shí)的統(tǒng)計(jì)學(xué)家凱特勒。19世紀(jì)中葉。把概率論引入統(tǒng)計(jì)學(xué)。第2節(jié) 統(tǒng)計(jì)和統(tǒng)計(jì)學(xué)一、統(tǒng)計(jì)的涵義統(tǒng)計(jì)工作統(tǒng)計(jì)數(shù)據(jù)的收集活動(dòng) 統(tǒng)計(jì)數(shù)據(jù)統(tǒng)計(jì)活動(dòng)的結(jié)果統(tǒng)計(jì)學(xué)分析統(tǒng)計(jì)數(shù)據(jù)的方法和技術(shù)二、統(tǒng)計(jì)學(xué)的分科1、描述統(tǒng)計(jì)學(xué)(descriptive sta
2、tistics)和推斷統(tǒng)計(jì)學(xué) (inferential statistics)描述統(tǒng)計(jì)學(xué):是研究如何取得反映客觀現(xiàn)象的數(shù)據(jù),并通過(guò)圖表形式對(duì)所搜集的數(shù)據(jù)進(jìn)行加工處理和顯示,進(jìn)而概括并分析得出反映客觀事物的規(guī)律性數(shù)量特征。推斷統(tǒng)計(jì)學(xué):是研究如何根據(jù)樣本(sample)數(shù)據(jù)去推斷總體(population)數(shù)量特征的方法,它是在對(duì)樣本數(shù)據(jù)進(jìn)行描述的基礎(chǔ)上,對(duì)統(tǒng)計(jì)總體的未知數(shù)量特征作出以概率形式表述的推斷。2、理論統(tǒng)計(jì)學(xué)(theoretical statistics)和應(yīng)用統(tǒng)計(jì)學(xué)(applied statistics) 理論統(tǒng)計(jì)學(xué):是指研究統(tǒng)計(jì)學(xué)的一般理論和統(tǒng)計(jì)方法的數(shù)學(xué)原理的學(xué)科,它的立足點(diǎn)是統(tǒng)計(jì)
3、方法的研究。理論統(tǒng)計(jì)學(xué)是統(tǒng)計(jì)方法的理論基礎(chǔ)。應(yīng)用統(tǒng)計(jì)學(xué):是指研究如何應(yīng)用統(tǒng)計(jì)方法去解決實(shí)際問(wèn)題的科學(xué)。第3節(jié) 統(tǒng)計(jì)研究的基本方法一、統(tǒng)計(jì)學(xué)在經(jīng)濟(jì)管理中的應(yīng)用 在經(jīng)濟(jì)全球化的今天,衡量成功的管理者和決策者的標(biāo)準(zhǔn),就是看他是否能夠充分理解并有效利用統(tǒng)計(jì)信息。因?yàn)榻y(tǒng)計(jì)信息的作用越來(lái)越重要,它的應(yīng)用范圍已經(jīng)涉及到會(huì)計(jì)、金融、生產(chǎn)、營(yíng)銷及經(jīng)濟(jì)各個(gè)領(lǐng)域。 二、統(tǒng)計(jì)學(xué)與其他學(xué)科的關(guān)系1、統(tǒng)計(jì)學(xué)與數(shù)學(xué)的關(guān)系統(tǒng)計(jì)學(xué)與數(shù)學(xué)有密切的關(guān)系,但又有本質(zhì)的區(qū)別。數(shù)學(xué)研究的是抽象的數(shù)量規(guī)律,而統(tǒng)計(jì)學(xué)則是研究具體的數(shù)量規(guī)律;數(shù)學(xué)研究所使用的是純粹的演繹,而統(tǒng)計(jì)學(xué)則主要是歸納 。2、統(tǒng)計(jì)學(xué)與其他學(xué)科的關(guān)系統(tǒng)計(jì)方法是其他學(xué)科借以
4、探索學(xué)科內(nèi)現(xiàn)象的數(shù)量規(guī)律性的有效手段,而對(duì)這種數(shù)量規(guī)律性的解釋并進(jìn)而研究各學(xué)科內(nèi)在的規(guī)律,只能由各學(xué)科的深入研究來(lái)完成。三、統(tǒng)計(jì)研究的基本方法 大量觀察法、綜合指標(biāo)法、統(tǒng)計(jì)分組法第4節(jié) 統(tǒng)計(jì)學(xué)中的若干基本概念一、總體 :總體是一定目的下研究的整體,是由客觀存在的具有相同性質(zhì)的許多個(gè)別元素組成的集合。 1、特點(diǎn):同質(zhì)性、差異性、大量性 2、 有限總體 無(wú)限總體二 、總體單位:構(gòu)成總體的個(gè)別元素(或單位)就是總體單位,也稱個(gè)體。三、標(biāo)志:標(biāo)志是說(shuō)明總體單位所具有的特征的名稱。 品質(zhì)標(biāo)志 數(shù)量標(biāo)志 四、 指標(biāo):指標(biāo)是綜合反映總體數(shù)量特征的范疇,由指標(biāo)名稱和指標(biāo)數(shù)值組成。 1、特點(diǎn):綜合性、具體性、數(shù)
5、量性 2、分類:(1)絕對(duì)數(shù)指標(biāo) 相對(duì)數(shù)指標(biāo) 平均數(shù)指標(biāo) (2)數(shù)量指標(biāo) 質(zhì)量指標(biāo) 3、標(biāo)志與指標(biāo)的區(qū)別和聯(lián)系區(qū)別:(1)說(shuō)明對(duì)象不同。指標(biāo)是說(shuō)明總體的, 標(biāo)志是說(shuō)明總體單位的; (2)表現(xiàn)形式不同。指標(biāo)都能用數(shù)值表示,標(biāo)志分為可以用數(shù)值表示的 數(shù)量標(biāo)志和不可以用數(shù)值表示的品質(zhì)標(biāo)志。聯(lián)系:(1)許多指標(biāo)都是由數(shù)量標(biāo)志匯總而來(lái); (2)指標(biāo)和標(biāo)志可以變換。五、變量:說(shuō)明現(xiàn)象某種特征的概念稱為變量。變量的特點(diǎn)是從一次觀察到下一次觀察會(huì)呈現(xiàn)出差別或變化。如“商品銷售額”、“受教育程度”、“產(chǎn)品質(zhì)量等級(jí)”等都是變量。變量的具體表現(xiàn)稱為變量值。比如商品銷售額可以是20萬(wàn)元、30萬(wàn)元等等,這些數(shù)字就是變量
6、值。統(tǒng)計(jì)數(shù)據(jù)就是統(tǒng)計(jì)變量的具體表現(xiàn)。變量可以分為以下幾種類型。1 說(shuō)明事物類別的一個(gè)名稱,稱為分類變量。分類變量的數(shù)值表現(xiàn)就是分類數(shù)據(jù)。如“性別”就是分類變量,其變量值表現(xiàn)為“男“或“女”。2 說(shuō)明事物有序類別的一個(gè)名稱,稱為順序變量。順序變量的數(shù)值表現(xiàn)就是順序數(shù)據(jù)。如“產(chǎn)品等級(jí)”就是順序變量,其變量值可以表現(xiàn)為“一等品”、“二等品”等。3說(shuō)明事物數(shù)字特征的一個(gè)名稱,稱為數(shù)值型變量。數(shù)值型變量的數(shù)值表現(xiàn)就是數(shù)值型數(shù)據(jù)。如“產(chǎn)品產(chǎn)量“、”年齡“等。它們的變量值可以表現(xiàn)為不同的數(shù)值。數(shù)值型變量根據(jù)其取值的不同,又可以分為離散型變量和連續(xù)型變量。4 只能取可數(shù)值的變量,成為離散型變量。離散型變量只能
7、取有限個(gè)值,而且其取值都以整數(shù)位斷開(kāi),可以一一例舉,如“企業(yè)數(shù)”、“員工數(shù)”等等。5可以取直線上或區(qū)間中任何值的變量,稱為連續(xù)型變量。連續(xù)型變量的取值是連續(xù)不斷的,不能一一例舉,如“年齡”、“溫度”等都是連續(xù)變量。在對(duì)社會(huì)和經(jīng)濟(jì)問(wèn)題的研究中,當(dāng)離散變量的取值很多時(shí),我們也可以將離散變量當(dāng)作連續(xù)來(lái)處理。六、變異:指標(biāo)的不同表現(xiàn)及標(biāo)志的不同表現(xiàn),是一種差異。沒(méi)有變異就沒(méi)有統(tǒng)計(jì),變異是普遍存在的。七、參數(shù):用來(lái)描述總體特征的概括性數(shù)字度量,稱為參數(shù)。我們所關(guān)心的參數(shù)有總體參數(shù)、標(biāo)準(zhǔn)差、總體比例等。在統(tǒng)計(jì)中,總體參數(shù)通常用希臘字母表示。比如,總體平均數(shù)用(讀作mu)表示,總體標(biāo)準(zhǔn)差用(讀作sigma)
8、表示,總體比例用(讀作pai)表示,等等。由于總體數(shù)據(jù)通常是不知道的,所以參數(shù)通常是一個(gè)未知的常數(shù)。比如,我們不知道一個(gè)城市所有家庭的收入差異,不知道一批產(chǎn)品的合格率,等等。正因?yàn)槿绱?,我們才進(jìn)行抽樣,根據(jù)樣本計(jì)算出某些值去估計(jì)總體參數(shù)。八、統(tǒng)計(jì)量:用來(lái)描述樣本特征的概括性數(shù)字度量,稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量是根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的一個(gè)量。通常我們所關(guān)心的樣本統(tǒng)計(jì)量有樣本平均數(shù)、樣本標(biāo)準(zhǔn)差、樣本比例等。由于樣本是已經(jīng)抽出來(lái)的,所以統(tǒng)計(jì)量總是知道的。抽樣的目的就是要根據(jù)樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)。比如,用樣本平均數(shù)去估計(jì)總體平均數(shù),用樣本標(biāo)準(zhǔn)差去估計(jì)總體標(biāo)準(zhǔn)差等等。第2章 統(tǒng)計(jì)數(shù)據(jù)的收集第1節(jié) 統(tǒng)計(jì)數(shù)據(jù)及
9、其類型一、數(shù)據(jù)的特征 1、定義:數(shù)據(jù)(data)是經(jīng)過(guò)收集、分析和概括用以表達(dá)和說(shuō)明的事實(shí)和數(shù)字,它是進(jìn)行統(tǒng)計(jì)工作和統(tǒng)計(jì)研究的基礎(chǔ)。2、特征:數(shù)據(jù)作為客觀事物的一種數(shù)量表現(xiàn),是事物必然性與偶然性共同作用的結(jié)果。偶然性使得對(duì)同一事物的多次觀察得到不同的統(tǒng)計(jì)數(shù)據(jù),而必然性則隱含在統(tǒng)計(jì)數(shù)據(jù)背后,這正是我們要利用統(tǒng)計(jì)方法去尋找的。 只有通過(guò)多次觀察或試驗(yàn)得到大量的統(tǒng)計(jì)數(shù)據(jù),才可以探索出其內(nèi)在的數(shù)量規(guī)律性 。二、數(shù)據(jù)的類型1、定性數(shù)據(jù)(qualitative data)說(shuō)明的是事物的品質(zhì)特征,是不能用數(shù)值表示的,通常表現(xiàn)為類別。定量數(shù)據(jù)(quantitative data) 說(shuō)明的是現(xiàn)象的數(shù)量特征,是必
10、須用數(shù)值來(lái)表現(xiàn)的。 分為:離散數(shù)據(jù)(discrete data)連續(xù)數(shù)據(jù) (continuous numerical data) 。2、 定類計(jì)量(nominal level of measurement)數(shù)據(jù) 定序計(jì)量(ordinal level measurement)數(shù)據(jù) 定距計(jì)量(interval level of measurement)數(shù)據(jù) 定比計(jì)量(ratio level of measurement)數(shù)據(jù)(1)定義:定類計(jì)量數(shù)據(jù)指將統(tǒng)計(jì)數(shù)據(jù)按照客觀事物的某種屬性進(jìn)行無(wú)順序的分類或分組。定序計(jì)量數(shù)據(jù)指將統(tǒng)計(jì)數(shù)據(jù)按客觀事物的某種無(wú)須確認(rèn)的順序進(jìn)行排列,它是在分類基礎(chǔ)之上的排序。 定
11、距計(jì)量數(shù)據(jù)是對(duì)事物類別和次序之間的差距的確認(rèn),這是在排序基礎(chǔ)上進(jìn)行的。定比計(jì)量數(shù)據(jù)就是有固定起點(diǎn)的定距計(jì)量。 (2)四種數(shù)據(jù)的比較區(qū)別:定類數(shù)據(jù):表現(xiàn)為類別,但不區(qū)分順序,是由定類尺度計(jì)量形成的。定序數(shù)據(jù):表現(xiàn)為類別,但有順序,是由定序尺度計(jì)量形成的。定距數(shù)據(jù):表現(xiàn)為數(shù)值,可進(jìn)行加減運(yùn)算,由定距尺度計(jì)量形成的。定比數(shù)據(jù):表現(xiàn)為數(shù)值,可進(jìn)行加、減、乘、除運(yùn)算,是由定比尺度計(jì)量形成的。聯(lián)系:前兩類數(shù)據(jù)說(shuō)明的是事物的品質(zhì)特征,不能用數(shù)值表示,其結(jié)果均表現(xiàn)為類別,也叫品質(zhì)數(shù)據(jù)。后兩類數(shù)據(jù)說(shuō)明的是現(xiàn)象的數(shù)量特征,能夠用數(shù)值來(lái)表現(xiàn),也叫數(shù)量數(shù)據(jù)。3、橫截面數(shù)據(jù)(cross-sectional data)和
12、時(shí)間序列數(shù)據(jù)(time series data)橫截面數(shù)據(jù) 在幾乎同一時(shí)刻所收集的數(shù)據(jù)。時(shí)間序列數(shù)據(jù)在不同時(shí)間所收集的數(shù)據(jù)。第2節(jié)統(tǒng)計(jì)數(shù)據(jù)的來(lái)源一、直接渠道:通過(guò)統(tǒng)計(jì)研究來(lái)獲得。對(duì)于使用者來(lái)說(shuō),這是第一手?jǐn)?shù)據(jù)。這種統(tǒng)計(jì)研究被稱為科學(xué)試驗(yàn)或統(tǒng)計(jì)調(diào)查??茖W(xué)試驗(yàn)是取得自然現(xiàn)象數(shù)據(jù)的主要渠道,統(tǒng)計(jì)調(diào)查是取得社會(huì)經(jīng)濟(jì)現(xiàn)象數(shù)據(jù)的重要渠道。 二、 間接渠道:通過(guò)現(xiàn)成的數(shù)據(jù)渠道獲得有關(guān)信息,對(duì)于使用者來(lái)說(shuō),這是數(shù)據(jù)的間接來(lái)源,因?yàn)檫@是使用者所獲取的別人調(diào)查或試驗(yàn)的第二手?jǐn)?shù)據(jù)。第3節(jié)調(diào)查方案設(shè)計(jì)一、統(tǒng)計(jì)調(diào)查的種類 1、全面調(diào)查和非全面調(diào)查全面調(diào)查:是對(duì)調(diào)查對(duì)象的全部單位進(jìn)行調(diào)查登記的方式方法。如,全國(guó)人口普查。
13、非全面調(diào)查:是對(duì)調(diào)查對(duì)象的部分單位進(jìn)行調(diào)查登記的方式方法。如,對(duì)一部分職工家庭進(jìn)行調(diào)查,可以了解全部職工家庭的生活狀況。 2、經(jīng)常性調(diào)查和一次性調(diào)查 經(jīng)常性調(diào)查:是隨著調(diào)查對(duì)象的不斷變化,隨時(shí)進(jìn)行連續(xù)不斷的登記的方式方法。一次性調(diào)查:是間隔一段時(shí)間,對(duì)調(diào)查對(duì)象在某一時(shí)刻的狀況進(jìn)行登記的方式方法。 3、采訪調(diào)查、問(wèn)卷調(diào)查、電話調(diào)查和座談?wù){(diào)查采訪調(diào)查:是由調(diào)查人員向被調(diào)查人員提問(wèn),根據(jù)訪問(wèn)者的答復(fù)搜集統(tǒng)計(jì)資料的方法。問(wèn)卷調(diào)查:是以問(wèn)卷的形式發(fā)給被調(diào)查者,由被調(diào)查者自愿回答的一種搜集統(tǒng)計(jì)資料的方法。問(wèn)卷的發(fā)放有郵寄、媒體傳送和專門(mén)分發(fā)三種形式。電話調(diào)查:是調(diào)查者利用電話與被調(diào)查人員進(jìn)行交流,從而獲得
14、統(tǒng)計(jì)信息的調(diào)查方法。座談?wù){(diào)查:是將被調(diào)查者集中在現(xiàn)場(chǎng),從他們對(duì)調(diào)查主題發(fā)表的意見(jiàn)獲取調(diào)查資料的方法。二、統(tǒng)計(jì)調(diào)查方式 1、統(tǒng)計(jì)報(bào)表:是依照國(guó)家有關(guān)法規(guī)的規(guī)定,自上而下地統(tǒng)一布置、自下而上地逐級(jí)提供基本統(tǒng)計(jì)數(shù)據(jù)的一種調(diào)查方式。統(tǒng)計(jì)報(bào)表要以一定的原始記錄為基礎(chǔ),按照統(tǒng)一的表式、統(tǒng)一的指標(biāo)項(xiàng)目、統(tǒng)一的報(bào)送時(shí)間和報(bào)送程序進(jìn)行填報(bào)。分類:按填報(bào)范圍不同可分:全面報(bào)表、非全面報(bào)表, 按報(bào)送周期不同可分:日?qǐng)?bào)、月報(bào)、季報(bào)、年報(bào)等。 按填報(bào)內(nèi)容和實(shí)施范圍不同可分:國(guó)家、部門(mén)和地方統(tǒng)計(jì)報(bào)表 2、抽樣調(diào)查 :是實(shí)際中應(yīng)用最廣泛的一種調(diào)查方式,它是從調(diào)查對(duì)象的總體中,按隨機(jī)原則抽取部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣
15、本調(diào)查結(jié)果來(lái)推斷總體綜合數(shù)量特征的一種非全面調(diào)查方式。優(yōu)越性:第一,經(jīng)濟(jì)性強(qiáng)。第二,時(shí)效性高。第三,適應(yīng)性好。第四,準(zhǔn)確性大。 3、普查:是為某一特定目的而專門(mén)組織的一次性全面調(diào)查,以便掌握有關(guān)國(guó)情、國(guó)力的基本統(tǒng)計(jì)數(shù)據(jù)。特點(diǎn):第一,一般需要間隔較長(zhǎng)的時(shí)間進(jìn)行一次;第二,一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)時(shí)間;第三,普查的適用范圍比較狹窄。 4、重點(diǎn)調(diào)查:是從調(diào)查對(duì)象的全部單位中選擇一部分重點(diǎn)單位所進(jìn)行的調(diào)查。重點(diǎn)單位:是指在總體中舉足輕重的單位,即所要調(diào)查的數(shù)量特征占較大比重的少數(shù)單位。 適用:當(dāng)統(tǒng)計(jì)調(diào)查的任務(wù)只要求了解調(diào)查對(duì)象的基本情況,而調(diào)查對(duì)象中確實(shí)存在重點(diǎn)單位時(shí),比較適宜進(jìn)行重點(diǎn)調(diào)查。 5、典型調(diào)
16、查:是根據(jù)調(diào)查目的,有意識(shí)的從調(diào)查對(duì)象的全部單位中選擇少數(shù)有代表性的單位進(jìn)行全面深入的調(diào)查。典型的選擇:劃類選典三、統(tǒng)計(jì)調(diào)查方案設(shè)計(jì) 1、調(diào)查目的:明確調(diào)查目的和任務(wù),即回答“為什么調(diào)查”的問(wèn)題。 2、調(diào)查對(duì)象和調(diào)查單位:確定調(diào)查對(duì)象和調(diào)查單位所解決的是“向誰(shuí)調(diào)查”,由誰(shuí)來(lái)提供所需數(shù)據(jù)的問(wèn)題。 3、調(diào)查項(xiàng)目和調(diào)查表:調(diào)查中所要登記的調(diào)查單位的具體內(nèi)容。確定調(diào)查項(xiàng)目所要回答的是“調(diào)查什么”的問(wèn)題。4、調(diào)查時(shí)間和調(diào)查方法等:調(diào)查時(shí)間,包括調(diào)查數(shù)據(jù)的所屬時(shí)間和調(diào)查工作期限。調(diào)查方法是搜集數(shù)據(jù)的具體方式。第4節(jié)調(diào)查問(wèn)卷的設(shè)計(jì)一、問(wèn)卷設(shè)計(jì)的原則1、主題明確。根據(jù)調(diào)查目的,從實(shí)際出發(fā)擬題,重點(diǎn)要突出,避免
17、可有可無(wú)的問(wèn)題。2、結(jié)構(gòu)合理。問(wèn)題的排列順序要有邏輯性,符合人的思維程序,由易到難,由簡(jiǎn)到繁,由具體到抽象。3、通俗易懂。語(yǔ)氣要親切,使應(yīng)答者容易理解不愿意回答,避免使用專業(yè)術(shù)語(yǔ),避免主觀性和暗示性。4、長(zhǎng)度適中。問(wèn)卷回答的時(shí)間控制在20分鐘左右。5、便于整理。二、問(wèn)卷設(shè)計(jì)的程序1、確定主題。根據(jù)調(diào)查調(diào)查目的,將所需數(shù)據(jù)一一列出,分析哪些要通過(guò)問(wèn)卷取得,然后依據(jù)調(diào)查內(nèi)容確定調(diào)查對(duì)象和問(wèn)卷主題。2、分析樣本。了解調(diào)查單位的有關(guān)特征,如社會(huì)階層、行為規(guī)范、觀念習(xí)俗等社會(huì)特征,需求動(dòng)機(jī)、潛在欲望等心理特征,文化程度、知識(shí)水平等學(xué)識(shí)特征,以便有針對(duì)性地?cái)M題。3、擬定問(wèn)題。根據(jù)調(diào)查對(duì)象的特點(diǎn),首先盡量詳
18、盡的列出問(wèn)題,然后檢查有無(wú)重復(fù)、遺漏或不恰當(dāng)問(wèn)句,同時(shí)進(jìn)行篩選、編排。4、試問(wèn)試答。設(shè)身處地提問(wèn)、回答,檢驗(yàn)問(wèn)題是否明了、排序是否合理、時(shí)間是否適中、應(yīng)答者是否能答并愿意回答全部問(wèn)題。必要的話,可進(jìn)行小范圍實(shí)地試答。5、修改付印。根據(jù)試答情況進(jìn)行修改,然后再試問(wèn)試答,再修改,至完全合格方可定稿付印,形成正式問(wèn)卷。三、問(wèn)卷問(wèn)題的形式1、自由式。問(wèn)卷沒(méi)有擬定的備選答案,回答者可以自由發(fā)表意見(jiàn)。2、封閉式。問(wèn)卷已事先擬定備選答案。第5節(jié)統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量一、 統(tǒng)計(jì)數(shù)據(jù)的誤差登記性誤差:可以消除的。代表性誤差:無(wú)法消除的,但事先可以進(jìn)行控制和計(jì)算。二、 統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量要求質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn):1)精度2)準(zhǔn)確性3
19、)關(guān)聯(lián)性4)及時(shí)性5)一致性第3章 數(shù)據(jù)的整理與顯示第1節(jié) 數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理包括:數(shù)據(jù)的審核、篩選、排序等一、 數(shù)據(jù)的審核與篩選1、 審核:保證數(shù)據(jù)的質(zhì)量1)直接來(lái)源數(shù)據(jù)的審核:a) 完整性:是否有遺漏,是否填寫(xiě)齊全b) 準(zhǔn)確性:數(shù)據(jù)是否真實(shí)反映客觀實(shí)際情況;數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是 否正確2)間接來(lái)源數(shù)據(jù)的審核:完整性、準(zhǔn)確性、適用性、時(shí)效性2、 篩選:當(dāng)數(shù)據(jù)有錯(cuò)誤但不能糾正、不符合調(diào)查要求又無(wú)法彌補(bǔ)時(shí)二、 數(shù)據(jù)的排序第2節(jié) 定性數(shù)據(jù)的整理與顯示一、 分類數(shù)據(jù)的整理1、 列出所分的類別2、 計(jì)算每一類別的頻數(shù)、頻率或比例、比率1) 頻數(shù):各組內(nèi)的數(shù)據(jù)個(gè)數(shù)稱為次數(shù)或頻數(shù)。2) 頻率:各組
20、次數(shù)與全部次數(shù)之和的比值稱為頻率和比重。3) 頻數(shù)分布:全部數(shù)據(jù)在各組內(nèi)的分布狀況稱為次數(shù)分布或頻數(shù)分布。4) 比例:總體中個(gè)部分的數(shù)量占總體數(shù)量的比重。5) 比率:各不同類別的數(shù)量的比值。二、 順序數(shù)據(jù)的整理除了使用分類數(shù)據(jù)整理與顯示技術(shù)外,還可以計(jì)算累積頻數(shù)和累積頻率1、 累積頻數(shù):將各類別的頻數(shù)逐級(jí)累加起來(lái)。向上累加、向下累積2、 累積頻率或百分比:將各類別的百分比逐級(jí)累加起來(lái)。三、 分類和順序數(shù)據(jù)的圖形顯示選擇適當(dāng)圖形:1、條形圖(bar graph):在平面直角坐標(biāo)系中,我們指定橫坐標(biāo)為各組變量,縱坐標(biāo)表示各組的頻數(shù)、相對(duì)頻數(shù)或百分比頻數(shù),然后使各組條形的寬度相同,條形的高度等于該組
21、的頻數(shù)、相對(duì)頻數(shù)或百分比頻數(shù)。橫置條形圖 、縱置條形圖 例:某商店顧客購(gòu)買(mǎi)計(jì)算機(jī)頻數(shù)分布表、條形圖購(gòu)買(mǎi)計(jì)算機(jī)數(shù)據(jù)的頻數(shù)分布表公司頻數(shù)比重(%)蘋(píng)果機(jī)康柏機(jī)貝爾蓋特威2000ibm131259112624101822合計(jì)501002、餅形圖(pie chart):首先繪制一個(gè)圓形(餅形),然后利用相對(duì)頻數(shù)或百分比頻數(shù),按各組在圓形360度中的比重,將圓形劃分成對(duì)應(yīng)的幾個(gè)部分。例:某商店顧客購(gòu)買(mǎi)計(jì)算機(jī)餅形圖第3節(jié) 定量數(shù)據(jù)的整理與顯示一、 數(shù)據(jù)的分組:?jiǎn)雾?xiàng)式分組、組距式分組1、 單項(xiàng)式分組:是把每一個(gè)變量值作為一組,這種分組方法通常只適合于離散變量,且變量值較少的情況下使用。2、組距式分組,是將全
22、部變量值依次劃分為若干個(gè)區(qū)間,并將每一區(qū)間的變量值作為一組。它適用于連續(xù)變量或變量值較多的情況。1)組距式分組需要經(jīng)過(guò)以下幾個(gè)步驟:第一,確定組數(shù)。斯特格斯(sturges)經(jīng)驗(yàn)公式:k=1+3.322lgn第二,確定組距。組距=(最大值-最小值)/組數(shù)等距分組與不等距分組第三,確定組限。一個(gè)組的最小值叫下限;一個(gè)組的最大值叫上限例:某車間50名工人日加工零件數(shù)分組并編制頻數(shù)分布表2)分組的原則: 不重復(fù)不遺漏 上組限不在內(nèi)組中值=開(kāi)口組:缺上限或缺下限的組,其組距按鄰組計(jì)算缺上限開(kāi)口組的組中值=缺下限開(kāi)口組的組中值=二、數(shù)值型數(shù)據(jù)的顯示1、直方圖(histogram)和折線圖 1)直方圖:在
23、平面直角坐標(biāo)系中,通常用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,這樣,每組與其相應(yīng)的頻數(shù),就形成了一個(gè)寬度為組距高度為頻數(shù)或頻率的矩形,即直方圖。2)折線圖:是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)用直線連接起來(lái)所形成的圖形。例:根據(jù)表3.3數(shù)據(jù)繪制直方圖和折線圖 圖3.3 3) 直方圖與條形圖的區(qū)別(1)條形圖的長(zhǎng)度(橫置)或高度(縱置)表示各類別的頻數(shù),其寬度則無(wú)實(shí)際意義,僅僅是類別的代表;直方圖的頻數(shù)用每一矩形的面積表示,其高度為各組頻數(shù)或頻率,寬度為各組組距。(2)條形圖各矩形分離排列;直方圖各矩形連續(xù)排列。2、莖葉圖(stem-and-leaf display):1)莖葉圖:由“莖”和“
24、葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的。通常先將每一數(shù)據(jù)的第一個(gè)或前兩個(gè)數(shù)字列在垂直線的左邊,然后將每個(gè)數(shù)據(jù)的最后一個(gè)數(shù)字按從小到大的順序記在垂直線的右邊。每個(gè)數(shù)據(jù)的最后一個(gè)數(shù)字所在的行與其第一個(gè)或前兩個(gè)數(shù)字所在的行相對(duì)應(yīng)。例:對(duì)20名成人進(jìn)行智力測(cè)試的數(shù)據(jù)如下:114 99 131 124 117 102 106 127 119 11598 104 144 151 132 106 125 122 118 118試根據(jù)以上數(shù)據(jù)繪制莖葉圖。 解:以前兩位數(shù)字為莖,最后一位數(shù)字為葉作莖葉圖如下(圖3.4)。 9 8 9 10 2 4 6 6 11 4 5 7 8 8 9 12 2 4 5 7 13
25、1 2 14 4 15 1圖3.42)優(yōu)點(diǎn):(1)繪制簡(jiǎn)易,(2)是因?yàn)轱@示具體數(shù)值,所以提供了比直方圖更多的信息。第4節(jié) 統(tǒng)計(jì)表一、統(tǒng)計(jì)表的構(gòu)成1、形式:總標(biāo)題、橫行標(biāo)題、縱欄標(biāo)題和指標(biāo)數(shù)值2、內(nèi)容:主詞和賓詞 1)主詞:是指統(tǒng)計(jì)表所要說(shuō)明的總體,它可以是各總體單位的名稱、總體的各個(gè)組,或者是總體的單位的全部。 2)賓詞:是說(shuō)明總體的統(tǒng)計(jì)指標(biāo)包括指標(biāo)名稱和數(shù)值。二、統(tǒng)計(jì)表的設(shè)計(jì)1、合理安排統(tǒng)計(jì)表的結(jié)構(gòu)2、正確設(shè)計(jì)表頭3、正確畫(huà)出表中的橫豎線、正確填列表中數(shù)據(jù)4、必要時(shí)在表下方加注釋第4章 數(shù)據(jù)分布特征的測(cè)度第1節(jié) 集中趨勢(shì)的測(cè)度集中趨勢(shì):是一個(gè)數(shù)據(jù)集向某一中心靠攏的傾向,它可以代表這些數(shù)據(jù)的
26、一般水平。一、算術(shù)平均數(shù)(arithmetic mean)1、定義:將所有數(shù)據(jù)值加起來(lái)除以數(shù)據(jù)的個(gè)數(shù)就得到算術(shù)平均數(shù)。2、計(jì)算公式:1)簡(jiǎn)單算術(shù)平均數(shù): 其中, 表示算術(shù)平均數(shù)x表示各個(gè)變量值n 表示變量值的個(gè)數(shù) 是求和符號(hào)。2)加權(quán)算術(shù)平均數(shù) 其中,x代表各組的變量值f 代表各組的頻數(shù)影響加權(quán)算術(shù)平均數(shù)的因素:變量值和權(quán)數(shù)選擇權(quán)數(shù)的原則:變量值與其乘積是具有實(shí)際經(jīng)濟(jì)意義的標(biāo)志總量。3)加權(quán)算術(shù)平均數(shù)與簡(jiǎn)單算術(shù)平均數(shù)的關(guān)系當(dāng) 時(shí),二、調(diào)和平均數(shù) (倒數(shù)平均數(shù) harmonic mean) 1、定義:調(diào)和平均數(shù)是變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),故又稱倒數(shù)平均數(shù)。2、計(jì)算公式: 1)簡(jiǎn)單調(diào)和平均數(shù):
27、 式中: 表示變量值; 表示變量值個(gè)數(shù)。2)加權(quán)調(diào)和平均數(shù) 式中: 表示調(diào)和平均數(shù); 表示權(quán)數(shù); 表示變量值。3、平均數(shù)計(jì)算方法的選擇設(shè)則 (已知m、f) (已知x、f) (已知x、m)三、幾何平均數(shù)(geometric mean)1、定義:幾何平均數(shù)是n個(gè)變量值乘積的n次方根,它適用于平均比率的計(jì)算。2、計(jì)算公式:1)簡(jiǎn)單幾何平均數(shù) 式中:表示變量值; 表示連乘符號(hào)。 2)加權(quán)幾何平均數(shù) 式中:表示變量值出現(xiàn)的次數(shù)。3、算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)之間的關(guān)系算術(shù)平均數(shù)幾何平均數(shù)調(diào)和平均數(shù)四、眾數(shù)(mode)1、定義:眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值復(fù)眾數(shù):如果數(shù)據(jù)中的眾數(shù)超過(guò)兩個(gè),
28、則數(shù)據(jù)是多峰的,這時(shí)指出眾數(shù)毫無(wú)意義。2、眾數(shù)的確定:1)未分組數(shù)據(jù)和單項(xiàng)式分組數(shù)據(jù):眾數(shù)位置確定之后便找到了眾數(shù)。2)對(duì)于組距數(shù)列:若眾數(shù)組相鄰兩組次數(shù)相等,則眾數(shù)組的組中值就是眾數(shù);若眾數(shù)組上一組的次數(shù)較多,則眾數(shù)在眾數(shù)組內(nèi)靠近上限;若眾數(shù)組下一組的次數(shù)較多,則眾數(shù)在眾數(shù)組內(nèi)靠近下限。 計(jì)算公式:mo= 式中,l 為眾數(shù)組下限1為眾數(shù)組與下一組頻數(shù)之差2為眾數(shù)組與上一組頻數(shù)之差i 為眾數(shù)組的組距五、中位數(shù)(median)1、定義:中位數(shù)是一組數(shù)據(jù)按一定順序排列后,處于中間位置上的變量值。2、中位數(shù)的計(jì)算:未分組數(shù)據(jù):中位數(shù)位置=(n+1)/2單項(xiàng)式分組數(shù)據(jù):中位數(shù)位置=f/2組距數(shù)列:確定
29、中位數(shù)組之后,可按以下公式計(jì)算中位數(shù):me= 其中,l 為中位數(shù)組的下限f為各組的頻數(shù)sm-1 為中位數(shù)組以下的累積頻數(shù)fm 為中位數(shù)組的頻數(shù) i為中位數(shù)組的組距六、中位數(shù)、眾數(shù)、算術(shù)平均數(shù)之間的關(guān)系1、在同一變量數(shù)據(jù)集合中如果變量值分布呈對(duì)稱型,則算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者相等;2、若不對(duì)稱,則中位數(shù)必居中,算術(shù)平均數(shù)和眾數(shù)分列兩側(cè)。第2節(jié) 離散程度的測(cè)度(標(biāo)志變異指標(biāo))離散程度:變量值之間的差異程度,即數(shù)據(jù)的離散程度是數(shù)據(jù)分布的另一個(gè)重要特征,它所反映的是各變量值遠(yuǎn)離其中心值的程度,因此,也稱為離中趨勢(shì)。標(biāo)志變異指標(biāo)的作用: 衡量平均數(shù)代表性的大小 反映社會(huì)經(jīng)活動(dòng)過(guò)程的均衡性和節(jié)奏性一、
30、極差(全距range)1、定義:全距是一組數(shù)據(jù)的最大值與最小值之差。2、計(jì)算公式:極差(r)=最大標(biāo)志值-最小標(biāo)志值 對(duì)于組距數(shù)列極差也可以近似表示為: r=最高組上限值-最低組下限值二、平均差1、定義:極差的均值。2、計(jì)算公式:1)簡(jiǎn)單平均式2)加權(quán)平均式三、方差(variance)及標(biāo)準(zhǔn)差(standard deviation)1、定義:方差是各變量值與其均值離差平方的平均數(shù)。標(biāo)準(zhǔn)差方差的平方根即為標(biāo)準(zhǔn)差。2、計(jì)算公式:1)簡(jiǎn)單平均式2)加權(quán)平均式式中,為總體方差 為各變量值為總體均值n 為數(shù)據(jù)個(gè)數(shù) 為各組頻數(shù)。 四、離散系數(shù)(變異系數(shù)或標(biāo)準(zhǔn)差系數(shù))(coefficient of vari
31、ation)1、定義:也稱離散系數(shù),通常是就標(biāo)準(zhǔn)差來(lái)計(jì)算的,因此,也稱為標(biāo)準(zhǔn)差系數(shù),它是標(biāo)準(zhǔn)差與均值的比率。2、計(jì)算公式: 四、 標(biāo)準(zhǔn)化數(shù)值(z-score)1、定義:也稱為z分?jǐn)?shù)或z值,它是一個(gè)數(shù)據(jù)在數(shù)據(jù)集中相對(duì)位置的測(cè)度。2、計(jì)算公式: 式中,x表示觀察值 表示樣本平均數(shù) s表示樣本標(biāo)準(zhǔn)差3、 標(biāo)準(zhǔn)化數(shù)值就是數(shù)據(jù)值偏離平均數(shù)標(biāo)準(zhǔn)差的個(gè)數(shù)。正的z值表示觀察值位于平均數(shù)右側(cè),負(fù)的z值表示觀察值位于平均數(shù)左側(cè)。 4、 異常值:根據(jù)經(jīng)驗(yàn)法則,對(duì)于鐘形分布,幾乎所有的數(shù)據(jù)都在偏離平均數(shù)3個(gè)標(biāo)準(zhǔn)差范圍之內(nèi)。因此,標(biāo)準(zhǔn)化數(shù)值低于-3或高于3的數(shù)據(jù)值就是異常值,也稱為離群點(diǎn)。第3節(jié) 偏態(tài)與峰度的測(cè)度集中趨
32、勢(shì)和離散程度是數(shù)據(jù)分布的兩個(gè)重要特征,但要全面了解數(shù)據(jù)分布的特點(diǎn),還需要知道數(shù)據(jù)分布的形狀是否對(duì)稱、偏斜的程度以及分布的扁平程度等。偏態(tài)和峰度就是對(duì)這些分布特征的近一步描述一、 偏度及其測(cè)定1、定義:就是指次數(shù)分布的非對(duì)稱程度,以偏態(tài)系數(shù)來(lái)表示。2、計(jì)算公式:=0表示數(shù)據(jù)正態(tài)分布或?qū)ΨQ;0表示正偏或右偏0表示負(fù)偏或左偏的絕對(duì)值越大,表示偏斜的程度就越大。二、 峰度及其測(cè)定1、定義:峰度:數(shù)據(jù)分布集中趨勢(shì)高峰的形狀,亦即分布曲線的尖峭程度,通常以峰度系數(shù)來(lái)表示。尖峰分布:若分布形狀比正態(tài)分布更瘦更高。平頂分布:若分布形狀比正態(tài)分布更矮更胖。峰度系數(shù):測(cè)定峰度的指標(biāo)。2、計(jì)算公式: =3表示正態(tài)分
33、布峰度;3表示尖態(tài)峰,說(shuō)明頻數(shù)分布集中趨勢(shì)顯著,離散度低;3表示平坦峰,說(shuō)明頻數(shù)分布離散度高第5章 概率與概率分布基礎(chǔ)第1節(jié) 隨機(jī)事件一、相關(guān)概念1、隨機(jī)現(xiàn)象:在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象。2、隨機(jī)試驗(yàn):對(duì)隨機(jī)現(xiàn)象進(jìn)行大量觀察以便掌握其規(guī)律性的過(guò)程。3、隨機(jī)事件:隨機(jī)試驗(yàn)中每一個(gè)可能出現(xiàn)的結(jié)果,簡(jiǎn)稱事件。 基本事件(樣本點(diǎn)):不可能再分的事件。 樣本空間:基本事件的全體。s 復(fù)合事件:由兩個(gè)或兩個(gè)以上基本事件組成的事件。4、互斥事件(互不相容事件):不能同時(shí)發(fā)生的事件。5、對(duì)立事件(逆事件):由兩個(gè)互斥事件組成樣本空間,這兩個(gè)事件即為對(duì)立事件。二、事件的運(yùn)算1、交換律:ab= ba,
34、ab=ba2、分配律:(ab)c=acbc3、結(jié)合律:(ab)c=a(bc)=abc4、德摩根定律:,第2節(jié) 隨機(jī)事件的概率一、概率的分配(計(jì)算)方法古典方法頻率方法主觀方法二、概率的分配(計(jì)算)方法加法定理:p(ab)=p(a)+p(b)-p(ab) 對(duì)于獨(dú)立事件:p(ab)=p(a)+p(b)乘法定理:p(ab)=p(a)p(ba)=p(b)p(ab)對(duì)于互斥事件: p(ab)=p(a) p(b)三、全概率公式與逆概率公式1、全概率公式: 2、逆概率公式:第3節(jié) 離散型概率分布一、隨機(jī)變量(random variable)隨機(jī)變量(random variable)就是試驗(yàn)結(jié)果的數(shù)值描述。根
35、據(jù)隨機(jī)變量的取值不同,可以將其分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量。二、離散型隨機(jī)變量的概率分布1、二項(xiàng)分布(binomial probability distribution) 在n次試驗(yàn)中成功次數(shù)為x的試驗(yàn)結(jié)果的二項(xiàng)分布概率值的計(jì)算如下:式中,n為試驗(yàn)次數(shù)(樣本容量)x為n次試驗(yàn)中成功的次數(shù)p為一次子試驗(yàn)成功的概率f(x)為n次試驗(yàn)中成功x次的概率=2、泊松分布 (poisson probability distribution) p(x)=式中,p(x)為在某一間隔內(nèi)某事件發(fā)生x次的概率 為x的均值 e為自然對(duì)數(shù)的底2.718283、當(dāng)p0.05,n20時(shí),泊松分布為二項(xiàng)分布的近似效果較好
36、。泊松分布可作為稀有事件(小概率事件)發(fā)生次數(shù)的概率分布模型。第4節(jié) 連續(xù)型概率分布一、正態(tài)概率分布(normal probability distribution)1、正態(tài)分布xn(,2)。其分布函數(shù)為:f(x)=正態(tài)分布的期望值=,方差=2,標(biāo)準(zhǔn)差=。2、標(biāo)準(zhǔn)正態(tài)分布若xn(,2),設(shè)z=,則zn(0,1),即z服從均值為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布:f(x)=()式中,為標(biāo)準(zhǔn)正態(tài)分布函數(shù),即:(x)二、指數(shù)分布指數(shù)分布函數(shù)為f(x)=pxx=1- x0 指數(shù)分布的期望值=,方差=2,標(biāo)準(zhǔn)差=。第6章 抽樣與參數(shù)估計(jì) 第1節(jié) 抽樣與抽樣分布一、抽樣1、抽樣法的特點(diǎn):隨機(jī)原則 部分估計(jì)總體 存
37、在誤差并可以控制2、適用: 對(duì)某些不可能進(jìn)行全面調(diào)查而又需要了解其全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象,必須應(yīng)用抽樣法。(破壞性試驗(yàn)、總體過(guò)大、單位過(guò)于分散,實(shí)際調(diào)查不可能的)3、抽樣法的作用1) 對(duì)某些社會(huì)經(jīng)濟(jì)現(xiàn)象雖然可以進(jìn)行全面調(diào)查,但抽樣法仍然有其獨(dú)到的作用。2) 可以節(jié)省人力、費(fèi)用,提高調(diào)查的經(jīng)濟(jì)效果。3) 可以節(jié)省時(shí)間,提高調(diào)查的時(shí)效性4) 可以增加調(diào)查項(xiàng)目,提高資料的準(zhǔn)確性5) 抽樣調(diào)查和全面調(diào)查同時(shí)進(jìn)行,可以發(fā)揮相互補(bǔ)充和檢查質(zhì)量的作用。6) 可用于工業(yè)生產(chǎn)過(guò)程的質(zhì)量控制。7) 可以對(duì)某些總體的假設(shè)進(jìn)行檢驗(yàn),來(lái)判斷這種假設(shè)的真?zhèn)巍6?、總體和樣本1、總體(population):也叫母體,是指所
38、要認(rèn)識(shí)對(duì)象的全體。是由具有某種共同性質(zhì)的許多單位組成的,因此總體也就是具有同一性質(zhì)的許多單位的集合體??傮w中單位數(shù)用n來(lái)表示。1) 變量總體、 屬性總體2) 有限總體、 無(wú)限總體2、樣本(sample):也叫子樣,它是從總體隨機(jī)抽取出來(lái),代表總體的那部分單位的集合體。樣本的單位數(shù)稱為樣本容量,用n來(lái)表示。1) 以很小的樣本來(lái)推斷很大的總體是抽樣法的重要特點(diǎn)。2) 一個(gè)總體可以有多個(gè)樣本。3) 大樣本(n30)小樣本(n30)三、總體指標(biāo)和樣本指標(biāo)1、總體指標(biāo):也稱總體參數(shù)(population parameter) ??傮w參數(shù)的數(shù)值是客觀存在的、確定的,但又是未知的。1) 總體均值2) 總體標(biāo)
39、準(zhǔn)差3) 總體比例 =p2、樣本指標(biāo)即樣本統(tǒng)計(jì)量(sample statistic)。統(tǒng)計(jì)量是總體參數(shù)的估計(jì)量 。1) 樣本平均數(shù)2) 樣本標(biāo)準(zhǔn)差s=3) 樣本比例 p四、抽樣方法 1、重置抽樣(重復(fù)抽樣)(sampling with replacement): 要從總體n個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次從總體中抽取一個(gè)單位,把順序號(hào)登記下來(lái)之后,重新放回參加下一次抽選,連續(xù)反復(fù)抽取n次組成所要求容量的樣本。 2、不重置抽樣(不重復(fù)抽樣)(sampling without replacement): 要從總體n個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每 次從總體中抽取一個(gè)單位,被抽中的單位
40、不再放回參加下一次抽選,連續(xù)進(jìn)行次便組成樣本。注意:不重復(fù)抽樣所得樣本對(duì)總體的代表性較大,抽樣誤差較小,所以實(shí)踐中通常采用不重復(fù)抽樣。 五、 抽樣分布1、抽樣分布:對(duì)統(tǒng)計(jì)量的所有可能取值及其對(duì)應(yīng)概率的描述,就是統(tǒng)計(jì)量的抽樣分布,即。抽樣分布反映樣本統(tǒng)計(jì)量的分布特征,根據(jù)抽樣分布的規(guī)律,可揭示樣本統(tǒng)計(jì)量與總體參數(shù)之間的關(guān)系,計(jì)算抽樣誤差,并說(shuō)明抽樣推斷的可靠程度。 2、簡(jiǎn)單隨機(jī)抽樣:是從總體中抽取樣本最常用的方法。從容量為n的總體中進(jìn)行抽樣,如果容量為n 的每個(gè)可能樣本被抽到的可能性相等,則稱容量為n的樣本為簡(jiǎn)單隨機(jī)樣本。 六、極限定理1、大數(shù)定律:當(dāng)n足夠大時(shí),獨(dú)立同分布的隨機(jī)變量的算術(shù)平均數(shù)
41、趨近于數(shù)學(xué)期望;事件發(fā)生的頻率接近于其發(fā)生的概率。 即樣本統(tǒng)計(jì)量接近于總體參數(shù)。 2、中心極限定理:中心極限定理是說(shuō)明:當(dāng)n充分大時(shí),大量的起微小作用的相互獨(dú)立的隨機(jī)變量之和趨于正態(tài)分布。七、簡(jiǎn)單隨機(jī)樣本的抽樣分布1. 樣本平均數(shù)的抽樣分布1) 抽樣平均誤差:或抽樣標(biāo)準(zhǔn)差,樣本平均數(shù)的標(biāo)準(zhǔn)差反映了樣本平均數(shù)與總體平均數(shù)的平均誤差。2) 計(jì)算公式: 重復(fù)抽樣 不重復(fù)抽樣3) 注: 抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比變化,與樣本容量 的平方根成反比變化。 當(dāng)總體為正態(tài)分布時(shí),對(duì)于任何樣本容量,樣本平均數(shù)的抽樣分布是正態(tài)分布。若總體方差2未知,則可用樣本方差s2取而代之 。 樣本容量很大,無(wú)論總體分布如
42、何,樣本平均數(shù)近似服從正態(tài)分布。2. 樣本比例的抽樣分布 1) 當(dāng)從總體中抽出一個(gè)容量為n的樣本時(shí),樣本比例服從二項(xiàng)分布。 當(dāng)n時(shí),二項(xiàng)分布趨近于正態(tài)分布。所以,在大樣本下,若np5且n(1-p) 5,樣本比例p近似服從正態(tài)分布。2) 計(jì)算公式: 重復(fù)抽樣 非重復(fù)抽樣 注:式中,p為總體比例,實(shí)際計(jì)算時(shí)通常采用以往經(jīng)驗(yàn)數(shù)據(jù)或樣本比例 。第2節(jié) 參數(shù)估計(jì)的基本方法總體參數(shù)估計(jì):就是以實(shí)際觀察的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量作為未知總體參數(shù)的估計(jì)值。 一、 總體參數(shù)的點(diǎn)估計(jì)(point estimate) 1. 含義:也稱定值估計(jì),就是直接以樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值。樣本均值是總體均值的點(diǎn)估計(jì)量,樣
43、本方差s2是總體方差2的點(diǎn)估計(jì)量,樣本比例p是總體比例p的點(diǎn)估計(jì)量。2. 優(yōu)缺點(diǎn):優(yōu)點(diǎn):它提供了總體參數(shù)的具體估計(jì)值,可作為決策的依據(jù),缺點(diǎn):不能提供有關(guān)抽樣誤差的信息。3. 優(yōu)良估計(jì)量的標(biāo)準(zhǔn)1) 無(wú)偏性 2) 有效性 3) 一致性二、 抽樣誤差1. 統(tǒng)計(jì)調(diào)查的誤差:是指調(diào)查所得結(jié)果與總體真值之間的差異。2. 來(lái)源:登記性誤差代表性誤差:系統(tǒng)性誤差偶然性誤差:抽樣估計(jì)中所謂的抽樣誤差,就是指這種偶然性誤差或隨機(jī)誤差。3. 實(shí)際抽樣誤差。指某一特定樣本的樣本估計(jì)值與總體參數(shù)真值之間的離差。 4. 抽樣平均誤差。統(tǒng)計(jì)學(xué)中常用標(biāo)準(zhǔn)差來(lái)衡量均值的代表性,所以抽樣平均誤差可以衡量樣本對(duì)總體的代表性大小。
44、 5. 抽樣極限誤差。指一定概率條件下抽樣誤差的可能范圍,也稱允許誤差。抽樣極限誤差的可能范圍與抽樣估計(jì)的可能性即概率緊密相聯(lián)。 1) 樣本平均數(shù)的抽樣極限誤差 2) 樣本比例的抽樣極限誤差 3) 抽樣誤差與抽樣可靠性的關(guān)系 6. 影響抽樣誤差的主要因素1) 抽樣單位數(shù)的多少:在其它條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差愈小;反之抽樣單位數(shù)愈少,抽樣誤差就愈大。顯然,要想縮小抽樣誤差,必須擴(kuò)大樣本容量,這時(shí)的樣本更能反映總體的特征,如果樣本容量接近總體容量,那么抽樣調(diào)查就近于全面調(diào)查,抽樣誤差也就縮小到幾乎為0了。2) 總體離散程度的高低:當(dāng)其它條件不變時(shí),總體離散程度愈低,抽樣誤差愈小;
45、反之總體離散程度愈高,抽樣誤差愈大??梢?jiàn),抽樣誤差與總體離散程度成正比變化??傮w離散程度愈低,表明總體各單位之間的差異愈小,則樣本指標(biāo)與總體指標(biāo)間的差異就愈小,如果總體各單位之間沒(méi)有差異,則此時(shí)離散程度為0,樣本指標(biāo)等于總體指標(biāo),抽樣誤差也就不存在了。3) 不同的抽樣方法及組織方式三、 總體參數(shù)的區(qū)間估計(jì)1. 區(qū)間估計(jì):就是根據(jù)樣本求出總體未知參數(shù)的估計(jì)區(qū)間,并使其可靠程度達(dá)到預(yù)定要求。2. 置信度、置信區(qū)間設(shè)總體分布中有未知參數(shù),由樣本x1,x2,xn確定兩個(gè)統(tǒng)計(jì)量和,如果對(duì)于給定的01,有p=1-則稱區(qū)間(,)為的(1-)置信區(qū)間。式中,(1-)是置信度,是置信下限,是置信上限。可見(jiàn),區(qū)間
46、估計(jì)就是求出置信區(qū)間。第3節(jié) 總體均值的區(qū)間估計(jì)一、大樣本(n30)下總體均值的區(qū)間估計(jì)1. 總體方差2已知時(shí)置信區(qū)間為 例:基礎(chǔ)p98 6.12. 總體方差2未知時(shí)在大樣本下,置信區(qū)間為 例:基礎(chǔ)p99 6.2二、小樣本下(n30)總體均值的區(qū)間估計(jì)在小樣本條件下,樣本平均數(shù)的分布依賴于總體的概率分布。若總體服從正態(tài)分布,無(wú)論樣本容量如何,樣本平均數(shù)都服從正態(tài)概率分布。 1. 總體方差已知時(shí) 置信區(qū)間為 2. 總體方差2未知時(shí)置信區(qū)間為 注:若總體不服從正態(tài)分布,必須擴(kuò)大樣本容量。例:基礎(chǔ)p100 6.3第4節(jié) 總體比例的區(qū)間估計(jì)一、在大樣本條件下,若np5,n(1-p)5,則樣本比例趨近于
47、正態(tài)分布??傮w比例的置信區(qū)間為例:基礎(chǔ)p101 6.4第5節(jié) 樣本容量的確定一、樣本容量的確定 1. 重置抽樣 所以,必要抽樣單位數(shù)2. 不重置抽樣,必要抽樣單位數(shù) 例:基礎(chǔ)p101 6.5 6.6 6.7二、影響必要抽樣數(shù)目的因素1. 允許誤差范圍。當(dāng)其它條件不變時(shí),允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。2. 總體方差2。其他條件不變的情況下,總體方差2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。3. 抽樣估計(jì)的可靠程度1-。當(dāng)其他條件不變時(shí),抽樣估計(jì)的可靠程度愈高,z/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計(jì)
48、的可靠程度愈低,抽樣數(shù)目就可以愈少。4. 抽樣方法。相同條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。5. 除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個(gè)原因 。第7章 假設(shè)檢驗(yàn)第1節(jié) 假設(shè)檢驗(yàn)的基本問(wèn)題一、 假設(shè)的陳述:1、 假設(shè):對(duì)總體參數(shù)的具體數(shù)值所做的陳述,叫假設(shè)或稱統(tǒng)計(jì)假設(shè)。2、 假設(shè)檢驗(yàn):先對(duì)總體參數(shù)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過(guò)程,成為假設(shè)檢驗(yàn)。3、 原假設(shè):通常將研究者想收集證據(jù)予以反對(duì)的假設(shè)稱為原假設(shè),或稱零假設(shè),用h0表示。4、 備擇假設(shè):通常將研究者想收集證據(jù)予以支持的假設(shè)稱為備擇假設(shè)或稱研究假設(shè),用h1或 ha表示。二、 兩類錯(cuò)誤與顯著水平1、 第類錯(cuò)誤:當(dāng)原假設(shè)為真時(shí)拒絕原假設(shè),所犯的錯(cuò)誤稱為第類錯(cuò)誤,又稱棄真錯(cuò)誤。犯第類錯(cuò)誤的概率通常記為。2、 第類錯(cuò)誤:當(dāng)原假設(shè)為假時(shí)沒(méi)有拒絕原假設(shè),所犯的錯(cuò)誤稱為第類錯(cuò)誤,又稱取偽錯(cuò)誤。犯第類錯(cuò)誤的概率通常記為。三、 檢驗(yàn)統(tǒng)計(jì)量與拒絕域1、 標(biāo)準(zhǔn)化檢驗(yàn)統(tǒng)計(jì)量=(點(diǎn)估計(jì)量假設(shè)值)/點(diǎn)估計(jì)量的抽樣標(biāo)準(zhǔn)值2、 拒絕域:能夠拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的所有可能取值的集合,稱為拒絕域。四、 p值決策1、 p值:在原假設(shè)為真的條件下,檢驗(yàn)統(tǒng)計(jì)量的觀察值大于或等于其計(jì)算值的概率,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度技術(shù)合作項(xiàng)目終止及解除合同書(shū)
- 2025年度農(nóng)村水井承包合同與農(nóng)業(yè)灌溉用水權(quán)流轉(zhuǎn)及監(jiān)管協(xié)議
- 2025年度特殊年齡段勞動(dòng)者用工協(xié)議及權(quán)益保障
- 2025年度個(gè)體商戶勞動(dòng)合同(家政服務(wù)行業(yè)合作)
- 5G通信借款居間合同模板
- 2025年度分紅股收益確認(rèn)與分配協(xié)議
- 2025年度影視作品著作權(quán)許可及廣告植入合作合同
- 2025年度分手協(xié)議書(shū)模板:分手后共同債務(wù)承擔(dān)協(xié)議
- 2025年度房屋拆除與建筑垃圾清運(yùn)一體化服務(wù)合同
- 2025年度企業(yè)導(dǎo)師帶徒技能傳承服務(wù)協(xié)議
- (中職)電子技術(shù)基礎(chǔ)與技能(電子信息類)教案
- 汪小蘭有機(jī)化學(xué)課件(第四版)3
- 減少電力監(jiān)控系統(tǒng)告警信息上傳方法的研究(QC成果)
- 如何發(fā)揮好辦公室協(xié)調(diào)、督導(dǎo)、服務(wù)職能
- 交易商協(xié)會(huì)非金融企業(yè)債務(wù)融資工具發(fā)行注冊(cè)工作介紹
- 《人與環(huán)境》課程教學(xué)大綱
- 班組長(zhǎng)管理能力提升培訓(xùn)(PPT96張)課件
- 深圳市城市用地分類表
- 內(nèi)蒙古自治區(qū)小額貸款公司試點(diǎn)管理實(shí)施細(xì)則
- 勞務(wù)分包入住生活區(qū)承諾書(shū)
- 直系親屬關(guān)系證明(存根)(共1頁(yè))
評(píng)論
0/150
提交評(píng)論