已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
統(tǒng)計學第一章 數(shù)據(jù)與統(tǒng)計學1.1統(tǒng)計數(shù)據(jù)與統(tǒng)計學(1)統(tǒng)計學是一門收集、整理、顯示和分析統(tǒng)計數(shù)據(jù)的科學,其目的是探究數(shù)據(jù)內(nèi)在的數(shù)據(jù)量規(guī)律性,為決策提供參考(含義)(2)應(yīng)用統(tǒng)計研究過程:實際問題收集數(shù)據(jù)(取得數(shù)據(jù))整理數(shù)據(jù)(處理數(shù)據(jù))顯示數(shù)據(jù)分析數(shù)據(jù)解釋數(shù)據(jù)實際問題(3)例子:新生嬰兒的性別、擲硬幣和骰子、農(nóng)作物試驗、商品廣告、汽車合格的統(tǒng)計、化妝品試用的抽樣。1.2 統(tǒng)計學的產(chǎn)生和發(fā)展(1)三個源頭:英國經(jīng)濟學家威廉配第英國約翰格朗特 布萊斯帕斯卡、皮埃爾德費馬。 1.3 統(tǒng)計學的分類(1)描述統(tǒng)計:是用圖形、表格和概括性的數(shù)字對數(shù)據(jù)進行描述的統(tǒng)計方法。(2)推斷統(tǒng)計:是根據(jù)樣本信息對總體進行估計、假設(shè)檢驗、預測或其他推斷的統(tǒng)計方法。(3)統(tǒng)計學分為描述統(tǒng)計和推斷統(tǒng)計,一方面反映了統(tǒng)計發(fā)展的前后兩個階段。另一方面夜反映了統(tǒng)計方法研究和探索客觀事物內(nèi)在數(shù)量規(guī)律性的先后過程。(4)反映客觀的數(shù)據(jù)(包括自然現(xiàn)象與社會經(jīng)濟現(xiàn)象)樣本數(shù)據(jù)總體數(shù)據(jù) 描述統(tǒng)計(包括收集、整理、顯示和分析數(shù)據(jù))推斷統(tǒng)計(利用樣本信息和概率論對總體數(shù)據(jù)規(guī)律性進行估計檢驗等推斷)概率論(包括分布理論、大數(shù)定律和中心極限定理等) 圖 統(tǒng)計學探究客觀現(xiàn)象數(shù)量規(guī)律性過程的款圖(5)統(tǒng)計研究過程的起點是數(shù)據(jù),終點是探索到客觀事件總體內(nèi)在的數(shù)據(jù)規(guī)律性。描述統(tǒng)計是整個統(tǒng)計學的基礎(chǔ)和統(tǒng)計研究工作的第一步,推斷統(tǒng)計是現(xiàn)代統(tǒng)計學的核心和統(tǒng)計研究工作的關(guān)鍵環(huán)節(jié)。(6)理論統(tǒng)計和應(yīng)用統(tǒng)計1.4 統(tǒng)計數(shù)據(jù)的來源(1)統(tǒng)計數(shù)據(jù)的來源:按直接獲取和間接獲取分類。(2)直接獲取的數(shù)據(jù):普查:應(yīng)用面窄、費時費力、反映總體數(shù)據(jù)的手段、實效性差。 抽樣調(diào)查:節(jié)省人力物力、實效性強、有誤差。1.5 統(tǒng)計數(shù)據(jù)的質(zhì)量(1)統(tǒng)計調(diào)查階段是統(tǒng)計研究的第一步,是直接收集統(tǒng)計數(shù)據(jù)的階段??煞譃榉浅闃诱`差和抽樣誤差。1.6 統(tǒng)計學的基本概念(1)總體:是人們研究的所有基本單位的總和。(2)變量:在研究總體時,重點關(guān)注的是總體單位具有哪些特征和屬性,指這些特征。(3)參數(shù):概括性的數(shù)學度量。(主體)(4)統(tǒng)計量:概括樣本的數(shù)學度量。(樣本)(5)樣本:是總體的一部分單位。1.7 數(shù)據(jù)的有關(guān)知識一、數(shù)據(jù)的計量尺度 1.列名尺度(定類尺度):層次最低、平行分類、列名時要窮盡所有的。“ ”2.順序尺度(定序尺度):在分類的基礎(chǔ)上給出類別的順序。 “”3.間隔尺度(定距尺度):更加準備的測量,沒有絕對的零點。 “”4.比例尺度(定比尺度):有絕對的零點。 “”四種計量尺度的比較定類定序定距定比分類排序間距比值二、數(shù)據(jù)類型1.數(shù)據(jù)的類型分為定性(品質(zhì))和定量(數(shù)量)。2.變量:品質(zhì)變量和數(shù)量變量。三、數(shù)據(jù)的表現(xiàn)形式 1.分絕對數(shù)(總量的時期數(shù)和相對數(shù))和相對數(shù)(兩個絕對值的比值) 2.單位:實物單位、價值單位、復合單位。第二章 統(tǒng)計數(shù)據(jù)的描述2.1數(shù)據(jù)統(tǒng)計的整理一、 數(shù)據(jù)的預處理 審核:原始資料(完整性、準確性) 第二手資料(適用性、實效性) 篩選 排序:按照一定的順序?qū)?shù)據(jù)進行排序。二、 統(tǒng)計數(shù)據(jù)的分組1.分組的定義:將數(shù)據(jù)按照一定的特征標準分組。2.品質(zhì)標志分組:按照性別、質(zhì)量、民族等定性指標分組(定類、定序)數(shù)量標志分組:按照數(shù)量或數(shù)值等定量指標分組。(定距、定比)三、 次數(shù)(頻率)分配四、 數(shù)量標志分組方法:單變量分組-只適合離散型變量 組距分組五、 組距分組:將其分為若干個區(qū)間。步驟:確認組數(shù)(斯特格斯公式 K=1+N/2)基本為奇數(shù)(5-15) 組距:上限值-下限值 公式:組距=(最大值-最小值)組數(shù) 整理成頻率分布表 原則:不重不漏 等距分組、不等距分組 選擇分組的標志原則:反映數(shù)據(jù)的本質(zhì)特征;符合統(tǒng)計研究需要;結(jié)合現(xiàn)實歷史條件。六、 次數(shù)分布的圖示 直方圖-等距分組 折線圖(次數(shù)多變形圖)-曲線圖 莖葉圖四種常見曲線:1.正態(tài)分布曲線-鐘形曲線 例:所有的試驗、測量和觀測誤差都服從正態(tài)分布。 2.偏態(tài)曲線:正偏(右偏)、負偏(左偏)。 例:人均收入。 3.J形曲線:正J形曲線、供給曲線-倒J形曲線、需求曲線。4.U形曲線:死亡率曲線、產(chǎn)品故障率曲線或浴盆曲線。2.2分布集中趨勢的測度一、眾數(shù)1.含義:出現(xiàn)次數(shù)最多的變量數(shù)2.特點:不受極限的影響;一個眾數(shù)、多個眾數(shù)也有可能。3.近似公式: M。=L+1(1+2)iL表示眾數(shù)所在組的下組限;1表示眾數(shù)組次數(shù)與前一組次數(shù)之差;2表示眾數(shù)組次數(shù)與后一組次數(shù)之差;i表示眾數(shù)組的組距。二、中位數(shù)1.含義:數(shù)據(jù)排列后,位置在中間的數(shù)據(jù)。 2.特點:不受極限值的影響(穩(wěn)健性);U型分布、資料缺失Me失去代表性;xi-Me=min (最小) 數(shù)據(jù)值與中位數(shù)之差得絕對值之和最小。 3.N:奇數(shù)-(N+1)2 偶數(shù)-(N2)+(N2+1)2 4.近似公式: Me=L+(N2-Sm-1)fmiN2表示中位數(shù)所在的位置;L表示中位數(shù)所在組的下組限;Sm-1表示中位數(shù)所在組以下各組的累積次數(shù);fm表示中位數(shù)所在組的次數(shù);i表示中位數(shù)所在組的組距。三、分位數(shù) 將統(tǒng)計分布從中間分成面積相等的兩部分,同樣也有四分位數(shù)、十分位數(shù)、百分位數(shù)。四、均值 1.含義:就是算數(shù)平均數(shù),是數(shù)據(jù)集中趨勢的最主要測度值。 2.公式:X的均值是(x1+x2+x3+xn)n (對于已經(jīng)分組的數(shù)據(jù)) X的均值是xififi xi是次數(shù)分配中變量分組的組中值(上限+下限2);fi是各組次數(shù),也稱權(quán)數(shù)。 3.五、幾何平均數(shù)公式:(把基數(shù)考慮進去)Gn(1+%)(1+%)七、 切尾均值去掉最大值、最小值取平均數(shù)。八、 眾數(shù)、中位數(shù)、均值的關(guān)系1. 結(jié)論:對于對稱、正態(tài)的數(shù)據(jù)用均值比較好偏態(tài)較大時用 M。Me 比較好均值比較適用于定距和定比M。Me 可用于任何尺度 2. 右偏(正偏)分布 左偏(負偏)分布 M。 Me XX Me M。2.3分布離散程度的測度1.極差:也稱全距,是數(shù)據(jù)最大值減去最小值之差,是數(shù)據(jù)離散或差異程度的最簡單的測量值。 弊: 收到極端值影響。 只考慮兩個數(shù)值。公式: R=max(xi)-min(xi)2.內(nèi)距:兩個四分位數(shù)之差,即 內(nèi)距= 上四分位數(shù)-下四分位數(shù)=Q3-Q1 優(yōu)點:極端值的影響不大,考慮了更多的因素。3.方差和標準差 樣本方差的公式: 注意:對于樣本分組數(shù)據(jù),求方差,公式:4.離散系數(shù):用來對兩組數(shù)據(jù)的差異程度進行相對比較的。 公式: 優(yōu)點:離散系數(shù)是從相對的角度觀察差異和離散程度的,在比較相關(guān)事物的差異程度時,較之直接比較標準差要好些。2.4分布偏態(tài)與峰度的測度1.偏態(tài)及其測量 偏態(tài)是對分布偏斜方向及程度的測量。記為SK SK0 正偏、右偏SK=0 對稱SK0 負偏、左偏2.峰度及其測量 峰度是對數(shù)據(jù)分布平峰或程度的測量。記為 K K0 尖峰分布K=0 標準正態(tài)分布K0 尖峰分布2.5統(tǒng)計表與統(tǒng)計圖一、統(tǒng)計表與統(tǒng)計圖是顯示統(tǒng)計數(shù)據(jù)的兩種方式。二、統(tǒng)計表結(jié)構(gòu)與內(nèi)容:統(tǒng)計表一般由四個主要部分組成:表頭、行標題、列標題、數(shù)值資料。注意要點:合理安排統(tǒng)計表的結(jié)構(gòu) 表頭一般包括表號、總標題和表中數(shù)據(jù)的單位等內(nèi)容。 表中的上下橫線一般用粗線,中間的其他線要用細線。兩邊不封口,列標題之間用豎線分開,行標題之間通常不必用橫線隔開。 表中數(shù)據(jù)右對齊,對于沒有數(shù)據(jù)的表格單位,一般用“”表示。 表的下方加上注釋,特別要注意注明資料來源。三、統(tǒng)計圖1.統(tǒng)計圖是統(tǒng)計數(shù)據(jù)的表現(xiàn)形式。2.莖葉圖、箱線圖。3.注意:圖的表號在圖的下方。第三章 概率、概率分布與抽樣分布3.3常用的抽樣方法概率分布:是根據(jù)一個已知的概率來抽取樣本單位。非概率分布:是研究人員有意識地選取樣本單位。一、 簡單隨機抽樣概念:在從總體中抽取n個單位作為樣本時,要使得每一個總體單位都有相同的機會。簡單隨機抽樣有兩種抽取單位的具體方法: 重復抽樣 和 不重復抽樣。二、 分層抽樣(1) 概念:在抽樣之前將總體的單位分為若干層,然后從各個層中抽取一定數(shù)量的單位組成一個樣本,也稱分類抽樣。(2) 要求:層各單位的差異盡可能的小,而使層與層之間的差異盡可能大。(3) 優(yōu)點:除了對總體估計,還可以對各層的子總體進行估計;可以按自然區(qū)域或行政區(qū)域進行劃分;總體分布比較均勻;精度高。三、 系統(tǒng)分布(1) 概念:在抽樣中先將總體各單位按某種順序排列,并按某種規(guī)律確定一個隨機起點,然后每隔一定的間隔抽取一個單位,直至抽取n個單位形成一個樣本。也稱等距樣本或機械抽樣。(2)優(yōu)點:一、簡便易行。二、樣本在總體的分布均勻,誤差小于簡單隨機抽樣。(3)要求:先排序,后抽樣。四、整群抽樣(1)概念:先將總體劃分為若干群,然后再以群作為調(diào)查單位從中抽取部分群,進而對個體單位進行調(diào)查。(2)優(yōu)點:不需要有總體單位的具體名額。五、階段抽樣3.3樣本分布一、抽樣分布:有樣本n個觀察值計算的統(tǒng)計量的概率分布。推斷統(tǒng)計:根據(jù)樣本數(shù)據(jù)推斷參數(shù)。二、X樣本分布的形式 樣本總體的分布 正態(tài)分布 非正態(tài)分布 無論樣本量的大小 N30 N30 正態(tài)分布 正態(tài)分布 非正態(tài)分布三、X樣本分布的特征 第四章 參數(shù)估計4.1參數(shù)估計的基本原理1.參數(shù)估計(隨機原則)可靠性 概念:1)參數(shù)估計就是用樣本統(tǒng)計量去估計總體的參數(shù)。 2)估計量是用來估計總體參數(shù)的統(tǒng)計量的名稱。是樣本的數(shù)字特征。 3)估計值是用來估計總體參數(shù)時計算出來的估計量的具體數(shù)據(jù)。 作用:1)用于無限總體研究;2)不可能進行全面調(diào)查,又要了解其全面情況;3)對報表和普查進行修正。2點估計與區(qū)間估計 概念:1)點估計就是用樣本量 的值直接作為總體參數(shù) 的估計值。 2)區(qū)間估計是在用點估計值代表總體參數(shù)的同時,還必須給出一個用于衡量點估計可靠性的度量。規(guī)律:1)由樣本均值的抽樣分布可知,在重復抽樣或無限抽樣的情況下,樣本均值的期望值等于總體均值 ,樣本均值的標準誤差為 。2)由樣本統(tǒng)計量所構(gòu)造總體參數(shù)的估計區(qū)間,成為置信區(qū)間。區(qū)間最小值為置信下限,區(qū)間最大值為置信上限。置信區(qū)間的寬度隨著置信系數(shù)的增大而增大。3評價估計量的標準 1)無偏性:是指估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)。 2)有效性(最小方差性):估計量的方差越小,估計也就越有效。 3)一致性:是指隨著樣本量的增大,點估計量的值越來越接近總體的參數(shù)。4.2 一個總體參數(shù)的區(qū)間估計1. 總體均值的區(qū)間估計總體分布樣本容量 已知 未知正態(tài)分布大樣本小樣本非正態(tài)分布大樣本2.總體比率的區(qū)間估計這里只討論大樣本情況下總體比率的估計問題。當樣本足夠大時,P的數(shù)學期望等于總體的比率 。 即得總體比率在(1- )置信水平下地置信區(qū)間:4.3 樣本量的確定1.估計總體均值時樣本量的確定總體均值的置信區(qū)間是由樣本均值 和允許誤差兩部分組成的。在重復抽樣或無限總體抽樣條件下,允許誤差為 。 的值和樣本量 共同確定了允許誤差的大小。一旦確定了置信水平為 , 的值就確定了。對于給定的 值和總體標準差 ,就可以確定任意希望的允許誤差所需要的樣本量。令E=確定樣本量的公式:2.估計總體比率時樣本量的確定 令E=確定樣本量的公式:第五章 假設(shè)檢驗5.1假設(shè)檢驗的基本原理1.假設(shè)的陳述 概念:1)假設(shè):對總體參數(shù)的具體數(shù)值所作的陳述。 2)假設(shè)檢驗:利用樣本信息判斷假設(shè)是否成立的過程。 3)原假設(shè):通常是研究者想收集證據(jù)予以反對的假設(shè),也稱零假設(shè),用Ho表示。 4)備擇假設(shè):通常是研究者想收集證據(jù)予以反對的假設(shè),也稱研究假設(shè),用H1表示。 建立假設(shè)需要注意:1) Ho H1 是完備事件組,相互對立的。2) 先確定備擇假設(shè)。3) “=”在原假設(shè)中。4) Ho H1 有很強的主觀色彩。 分類:參數(shù)假設(shè)檢驗、非參數(shù)假設(shè)檢驗。 假設(shè)檢驗的基本形式假設(shè)雙側(cè)檢驗單側(cè)檢驗左側(cè)檢驗右側(cè)檢驗原假設(shè)備擇假設(shè) 2.兩類錯誤與顯著性水平 (1)當原假設(shè)為真時拒絕原假設(shè),所犯的錯誤稱為第一類錯誤,又稱棄真錯誤,概率記為 。 (2)當原假設(shè)為假時沒有拒絕原假設(shè),所犯的錯誤稱為第二類錯誤,又稱取偽錯誤,概率記為 。 (3)發(fā)生第一類錯誤概率也常被用于檢驗結(jié)論的可靠性度量,假設(shè)檢驗中犯的第一類錯誤的概率被稱為顯著水平(指原假設(shè)實際是正確的時,檢驗統(tǒng)計量落在拒絕域的概率),記為 。3.檢驗統(tǒng)計量與拒絕域 (1)檢驗統(tǒng)計量:根據(jù)樣本觀測結(jié)果得到的、并據(jù)以對原假設(shè)和備擇假設(shè)做出決策的某個樣本統(tǒng)計量。 (2)標準化的檢驗統(tǒng)計量= (3)拒絕域:由顯著性水平a所圍成的區(qū)域. 可以根據(jù)a值的大小確定出拒絕域的具體邊界值,稱為臨界值。 樣本固定時,拒絕域的面積隨a的減小而減小。 (4)雙側(cè)檢驗 左側(cè)檢驗 右側(cè)檢驗4.利用P值進行決策 (1)P值:就是當原假設(shè)正確時,得到所觀測的數(shù)據(jù)的概率。是反映實際觀測到的數(shù)據(jù)與原假設(shè)Ho之間不一致的一個概率值。 (2)用P值進行決策的準則:無論是大呢檢驗還是雙側(cè)檢驗,如果P值a值,不拒絕原假設(shè)。5.2一個總體參數(shù)的檢驗1.總體均值的檢驗(1)解決步驟:陳述Ho H1; 抽樣;確定檢驗統(tǒng)計量; 計算具體值。確定a、臨界值、拒絕域; 標準化統(tǒng)計量與臨界值比較,判斷假設(shè)假設(shè)是否成立。(2)大樣本情況下一個總體均值的檢驗方法雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式檢驗統(tǒng)計量a與拒絕域P值決策準則 (3)小樣本情況下一個總體均值的檢驗方法雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式檢驗統(tǒng)計量a與拒絕域P值決策準則2. 總體比率的檢驗(1)通常用字母表示總體比率,表示對總體比率的某個假設(shè)值。P鄙視樣本比率。(2)大樣本情況下一個總體比率的檢驗方法雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式檢驗統(tǒng)計量a與拒絕域P值決策準則3.總體方差的檢驗(1)一個總體方差檢驗的方法雙側(cè)檢驗左側(cè)檢驗右側(cè)檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 房屋買賣合同英文版深入解析3篇
- 房屋買賣合同面積確認3篇
- 安徽食品行業(yè)質(zhì)檢員勞動合同模板3篇
- 施工勞務(wù)簡易版合同范本2篇
- 新版民間小額企業(yè)借款合同3篇
- 工程外包合同模板3篇
- 安居房建設(shè)施工合同樣本3篇
- 旅店服務(wù)合同的性質(zhì)及其法律適用2篇
- 政府委托采購合同解讀3篇
- 改正保證書校園犯錯誤3篇
- 沉降計算表格計算表格
- 初中地理課堂教學評價量表
- TSG 81-2022 場(廠)內(nèi)專用機動車輛安全技術(shù)規(guī)程
- 大學社團迎新晚會文藝匯演ppt模板
- 2013東風日產(chǎn)新驪威原廠維修手冊esm-livina驪威ma
- 2019年北京外國語大學博士生英語入學考試試題
- 2022年軟件項目實施方案書模板(投標版)(完整版)
- L波段高空氣象探測系統(tǒng)原理及維護
- 墜積性肺炎的護理體會論文
- 國家開放大學《水利水電工程造價管理》章節(jié)測試參考答案
- 地基承載力與擊數(shù)對照表(輕)
評論
0/150
提交評論