生活統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第1頁
生活統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第2頁
生活統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第3頁
生活統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第4頁
生活統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

[生活]統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度統(tǒng)計(jì)學(xué)依據(jù)數(shù)據(jù)的計(jì)量尺度將數(shù)據(jù)劃分為三類 :定距型數(shù)據(jù)(Scale)、定序型數(shù)據(jù)(Ordinal)、定類型數(shù)據(jù)(Nominal)。定距型數(shù)據(jù)通常是指諸如身高、體重、血壓等的連續(xù)型數(shù)據(jù),也包括諸如人數(shù)、商品件數(shù)等離散型數(shù)據(jù) ;定序型數(shù)據(jù)具有內(nèi)在固有大小或高低順序,但它又不同于定距型數(shù)據(jù),一般可以數(shù)值或字符表示。如職稱變量可以有低級(jí)、中級(jí)、高級(jí)三個(gè)取值,可以分別用1、2、3等表示,年齡段變量可以有老、中、青三個(gè)取值,分別用

ABC

表示等。這里,無論是數(shù)值型的 1、2、3還是字符型的ABC,都是有大小或高低順序的,但數(shù)據(jù)之間卻是不等距的。因?yàn)?,低?jí)和中級(jí)職稱之間的差距與中級(jí)和高級(jí)職稱之間的差距是不相等的 ;定類型數(shù)據(jù)是指沒有內(nèi)在固有大小或高低順序,一般以數(shù)值或字符表示的分類數(shù)據(jù)。如性別變量中的男、女取值,可以分別用 1、2表示,民族變量中的各個(gè)民族,可以用‘漢’‘回’‘滿’等字符表示等。這里,無論是數(shù)值型的 1、2 還是字符型的‘漢’‘回’‘滿’,都不存在內(nèi)部固有的大小或高低順序,而只是一種名義上的指代。我覺得教育年限應(yīng)該設(shè)置成定距型數(shù)據(jù)(Scale)吧。因?yàn)?,教育年限?yīng)該是一個(gè)連續(xù)的變量,它不存在內(nèi)在的大小或高低順序問題。將可變的數(shù)量標(biāo)志抽象化就稱其為變量,其取值稱為變量值或標(biāo)志值。變量分為確定性變量和隨機(jī)變量。確定性變量是指受必然性因素的作用,各變量值呈現(xiàn)出上升或下降惟一方向性變動(dòng)的變量;隨機(jī)變量是指受偶然性因素的作用,變量值呈現(xiàn)出隨機(jī)的混沌狀態(tài)變動(dòng)的變量。。根據(jù)變量的取值是否連續(xù)劃分,有連續(xù)型變量和離散型變量。連續(xù)型變量是指在一個(gè)取值區(qū)間內(nèi)可取無窮多個(gè)值。連續(xù)型變量值要用測(cè)量或計(jì)算的方法取得;離散型變量是指在一個(gè)取值區(qū)間內(nèi)變量?jī)H可取有限個(gè)可列值。離散型變量值只能用計(jì)數(shù)的方法取得。離散變量是指其數(shù)值只能用自然數(shù)或整數(shù)單位計(jì)算的則為離散變量.例如,企業(yè)個(gè)數(shù),職工人數(shù),設(shè)備臺(tái)數(shù)等,只能按計(jì)量單位數(shù)計(jì)數(shù),這種變量的數(shù)值一般用計(jì)數(shù)方法取得.反之,在一定區(qū)間內(nèi)可以任意取值的變量叫連續(xù)變量,其數(shù)值是連續(xù)不斷的,相鄰兩個(gè)數(shù)值可作無限分割,即可取無限個(gè)數(shù)值.例如,生產(chǎn)零件的規(guī)格尺寸,人體測(cè)量的身高,體重,胸圍等為連續(xù)變量,其數(shù)值只能用測(cè)量或計(jì)量的方法取得.如果變量可以在某個(gè)區(qū)間內(nèi)取任一實(shí)數(shù),即變量的取值可以是連續(xù)的,這隨機(jī)變量就稱為連續(xù)型隨機(jī)變量,無偏性。無偏性是指估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。設(shè)總體參數(shù)為θ,所選擇的估計(jì)量為θ?,如果E(θ?)=θ,稱θ?為θ的無偏估計(jì)量。有效性。一個(gè)無偏的估計(jì)量并不意味著它就非常接近被估計(jì)的參數(shù),它還必須與總體參數(shù)的離散程度比較小。假定有兩個(gè)用于估計(jì)總體參數(shù)的無偏估計(jì)量,分別用m1和m2表示,它們的抽樣分布的方差分別用D(m1)和D(m2)表示,如果m1的方差小于m2的方差,即D(m1)<D(m2),我們就稱m1是比m2更有效的一個(gè)估計(jì)量。在無偏估計(jì)的條件下,估計(jì)量方差越小估計(jì)也就越有效。 (3)一致性,是指隨著樣本量的增大,點(diǎn)估計(jì)量的值越來越接近被估總體的參數(shù)。9統(tǒng)計(jì)量定義:設(shè)X1,X2,X3...,Xn為取自某總體的樣本,若樣本函數(shù)T=T(X1,X2,X3...,Xn)中不含有任何未知參數(shù),則稱T為統(tǒng)計(jì)量。從統(tǒng)計(jì)量的定義可知,任何統(tǒng)計(jì)量都是不含參數(shù)的,統(tǒng)計(jì)量的取值只與樣本有關(guān)。一旦樣本確定,統(tǒng)計(jì)量的值也就確定。從目前企業(yè)市場(chǎng)調(diào)查所得到的資料看大致可分為原始資料或稱為一手資料和二手資料兩大類。原始資料是由企業(yè)市場(chǎng)調(diào)查活動(dòng)在市場(chǎng)直接獲得,沒有經(jīng)過任何的處理的大量個(gè)體資料組成。二手資料則是在調(diào)查中透過其他媒介組織而獲得的,經(jīng)過他人整理加工后反映某一類事物的資料數(shù)據(jù)。二手資料通常不需要直接對(duì)調(diào)查個(gè)體進(jìn)行登記,而是從有關(guān)媒介或政府部門公開發(fā)表的資訊中獲得,也可以是從專業(yè)的市場(chǎng)調(diào)查機(jī)構(gòu)定期或不定期的發(fā)表的資料中獲取,且資料獲取的費(fèi)用要大大低于企業(yè)專門組織的市場(chǎng)調(diào)查,通過對(duì)二手資料的獲得,可以方便快捷取得所需的市場(chǎng)信息。經(jīng)常性收集市場(chǎng)二手資料可以幫助企業(yè)建立起自己的市場(chǎng)資源數(shù)據(jù)庫(kù),為企業(yè)建立起現(xiàn)代經(jīng)營(yíng)模式,從事市場(chǎng)營(yíng)運(yùn),適應(yīng)數(shù)字化時(shí)代生存法則的要求。但是也應(yīng)引起企業(yè)界注意的是二手資料由于來自不同的部門和機(jī)構(gòu),其最初的調(diào)查目的和調(diào)查方案方法的設(shè)計(jì)是不一致的,其資料的內(nèi)涵和口徑是不一樣的。所以對(duì)二手資料的引用要特別謹(jǐn)慎。首先,對(duì)二手資料的設(shè)計(jì)口徑和計(jì)算方法要有充分的了解。只有這樣才有可能根據(jù)自身的市場(chǎng)調(diào)查目的二手資料進(jìn)行再整理和再分組,以使其符合企業(yè)市場(chǎng)調(diào)查的需要。其次,要對(duì)二手資料的調(diào)查對(duì)象有著充分的了解和認(rèn)識(shí)。不同的調(diào)查對(duì)象對(duì)同一問題的回答是不一樣的,企業(yè)在不同的時(shí)期有不同的調(diào)查任務(wù),在不同的市場(chǎng)上目標(biāo)消費(fèi)者是不一樣的,市場(chǎng)調(diào)查的對(duì)象自然也不可能是一樣的。沒有弄清楚二手資料的調(diào)查對(duì)象絕對(duì)不可隨意引用。再其次,要了解二手資料原來的調(diào)查過程。不同調(diào)查過程會(huì)樣本的選取過程和選取方法,最終影響調(diào)查資料的誤差大小以及調(diào)查誤差的控制方法。第四,對(duì)于來自商業(yè)性的市場(chǎng)調(diào)查的數(shù)據(jù),要有高度的警惕和充分的認(rèn)識(shí)。目前,我國(guó)市場(chǎng)調(diào)查行業(yè)還十分不規(guī)范,這些機(jī)構(gòu)中還有許多企業(yè)未能擺脫生存的威脅,其公布的調(diào)查資料往往無法真正做到公平公正,更有甚者在公布的資料中明顯帶有人為的痕跡,誰出資贊助調(diào)查的結(jié)果就偏向誰,誰贊助多誰的排名就有利。對(duì)于這類資料,企業(yè)在引用時(shí)要足夠的警惕,否則就會(huì)誤導(dǎo)企業(yè)作出錯(cuò)誤的調(diào)查結(jié)論,給企業(yè)帶來不可估量的損失。在原始資料與二手資料之間,如果時(shí)間和財(cái)力物力條件許可,當(dāng)然應(yīng)以原始資料為主。但是二手資料因其經(jīng)濟(jì)快捷也是企業(yè)市場(chǎng)調(diào)查的一個(gè)重要部分??茖W(xué)合理地善用二手資料,可以幫助企業(yè)提高市場(chǎng)調(diào)查的效益。特別是在中小企業(yè)中對(duì)二手資料的應(yīng)用更是應(yīng)引起特別的重視。與此同時(shí),我們?cè)谶€應(yīng)看到雖然二手資料有可能不符合企業(yè)市場(chǎng)調(diào)查的需要,但在目前我國(guó)企業(yè)界尚缺乏市場(chǎng)調(diào)查能力,合格的市場(chǎng)調(diào)查人員嚴(yán)重匱乏的情形下,在某種條件上,利用他人調(diào)查的二手資料可能是唯一正確的選擇。變量的特點(diǎn)是從一次觀察到下一次觀察會(huì)呈現(xiàn)出差別或變化,如“居民收入”、“居民支出”、“受教育程度”、“性別”等都是變量。變量的具體取值稱為變量值。統(tǒng)計(jì)數(shù)據(jù)就是統(tǒng)計(jì)變量的某些取值。變量可以分為以下幾種類型。分類變量(categoricalvariable):說明事物類別的一個(gè)名稱。分類變量的取值就是分類數(shù)據(jù)。例如,“性別”就是一個(gè)分類變量,其變量值為“男”或“女”;“所有制”也是一個(gè)分類變量,其變量值可以為“國(guó)有”、“集體”、“合資”、“私營(yíng)”等。順序變量(rankvariable):說明事物有序類別的一個(gè)名稱。順序變量的取值就是順序數(shù)據(jù)。例如,“產(chǎn)品等級(jí)”就是一個(gè)順序變量,其取值可以是“一等品”、“二等品”、“三等品”、“次品” ;“受教育程度”是另一個(gè)順序變量的例子,其取值可以是“大學(xué)及以上”、“高中”、“初中”、“小學(xué)”及以下。數(shù)值型變量(metricvariable):說明事物某種數(shù)字特征的一個(gè)名稱。數(shù)值型變量取值就是數(shù)值型數(shù)據(jù),如“居民收入”、“居民支出”、“企業(yè)數(shù)”等都是數(shù)值型變量,這些變量可以取不同的數(shù)值。數(shù)值型變量根據(jù)其取值是否連續(xù),又可分為離散型變量(discretevariable) 和連續(xù)型變量(continuousvariable) 。.簡(jiǎn)述眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用場(chǎng)合。答:(1)眾數(shù)是將數(shù)據(jù)按大小順序排隊(duì)形成次數(shù)分配后,在統(tǒng)計(jì)分布中具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,是數(shù)據(jù)一般水平代表性的一種。特點(diǎn):可能沒有眾或有多個(gè)眾數(shù),最容易計(jì)算,但不是永遠(yuǎn)存在,同時(shí)作為集中趨勢(shì)代表值應(yīng)用的場(chǎng)合很少,一般在農(nóng)貿(mào)市場(chǎng)上。 (2)中位數(shù)是數(shù)據(jù)排序后,位置在最中間的數(shù)值。特點(diǎn) :很容易理解、很直觀,它不受極端值的影響。(3)均值是算術(shù)平均數(shù),是數(shù)據(jù)集中趨勢(shì)的最主要測(cè)度值。特點(diǎn) :數(shù)據(jù)信息提取得最充分,在整個(gè)統(tǒng)計(jì)方法中應(yīng)用最廣,對(duì)經(jīng)濟(jì)管理和工程等實(shí)際工作也是最重要的方法之一。 簡(jiǎn)述眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用場(chǎng)合。答:眾數(shù)是一種位置代表值,它的應(yīng)用場(chǎng)合比較有限;中位數(shù)具有穩(wěn)健性,數(shù)據(jù)值與中位數(shù)之差的絕對(duì)值之和最小;均值就是算術(shù)平均數(shù),是數(shù)據(jù)集中趨勢(shì)的最主要測(cè)度值。眾數(shù)最容易計(jì)算,但不是永遠(yuǎn)存在,同時(shí)作為集中趨勢(shì)代表值應(yīng)用的場(chǎng)合很少;中位數(shù)很容易理解、很直觀,它不受極端值的影響,這既是它有價(jià)值的方面,也是它數(shù)據(jù)信息利用不夠充分的地方;均值是對(duì)所有數(shù)據(jù)平均后計(jì)算的一般水平代表值,數(shù)據(jù)信息提取得最充分。1(簡(jiǎn)述眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用場(chǎng)合。答:眾數(shù)是一組數(shù)據(jù)中出現(xiàn)數(shù)據(jù)最多的標(biāo)志值,它主要是對(duì)分類數(shù)據(jù)的概括性度量,其特點(diǎn)是不受極端值影響,但它沒有利用全部數(shù)據(jù)的信息;中位數(shù)是一組數(shù)據(jù)排序后處于中間位置的變量值,它主要用于對(duì)順序數(shù)據(jù)的概括性度量。中位數(shù)的特點(diǎn)是不受極端值的影響,但它沒有利用原始數(shù)據(jù)的全部信息。均值是一組數(shù)據(jù)的算術(shù)平均,它利用了全部數(shù)據(jù)的信息,是概括一組數(shù)據(jù)最常用的一個(gè)值。但均值的缺點(diǎn)是容易受極端值的影響。當(dāng)一組數(shù)據(jù)有極端值時(shí),均值的代表性最差。就數(shù)據(jù)型數(shù)值而言,當(dāng)一組數(shù)據(jù)為對(duì)稱分布時(shí),眾數(shù)、中位數(shù)、均值相等,這是最好用均值做數(shù)據(jù)的概括性度量;當(dāng)一組數(shù)據(jù)的分布為偏態(tài)時(shí),尤其是當(dāng)偏斜程度較大時(shí),最好用中位數(shù)或眾數(shù)為該組數(shù)據(jù)的概括性度量。一組數(shù)據(jù)的分布特征可以從哪幾個(gè)方面進(jìn)行測(cè)度,答:一組數(shù)據(jù)的分布特征可以從以下3個(gè)方面進(jìn)行測(cè)度:(1)集中趨勢(shì)的測(cè)度(眾數(shù)、中位數(shù)、分位數(shù)、均值、幾何平均數(shù)、切尾均值)。(2)離散程度的測(cè)度(極差、內(nèi)距、方差和標(biāo)準(zhǔn)差、離散系數(shù))。(3)偏態(tài)與峰度的測(cè)度(偏態(tài)及其測(cè)度、峰度及其測(cè)度)解釋中心極限定理的含義。答:中心極限定理就是對(duì)于一個(gè)抽自任意總體(均值為μ,標(biāo)準(zhǔn)差為б),樣本容量為n的隨機(jī)樣本。當(dāng)n充分大時(shí),樣本均值的抽樣分布將近似于一個(gè)具有均值和標(biāo)準(zhǔn)差的正太分布。解釋置信水平為95%的置信區(qū)間的含義。答:含義:如果用某種方法構(gòu)造的所有區(qū)間中,有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間,稱為置信水平為95%的置信區(qū)間;而置信區(qū)間是指在某以置信水平下,樣本統(tǒng)計(jì)值與總體參數(shù)值的誤差范圍。二、試述正態(tài)分布、F分布、卡方分布和t分布的特性答:正態(tài)分布特性:1、正態(tài)分布曲線是以 y=μ為對(duì)稱軸,向左右兩側(cè)作對(duì)稱分布,所以它是一個(gè)對(duì)稱曲線。2、正態(tài)分布曲線以參數(shù) μ和б的不同而表現(xiàn)為一系列曲線,所以它是一個(gè)曲線簇而不僅是一個(gè)曲線。 3、正態(tài)分布資料的次數(shù)分布表現(xiàn)為多數(shù)次數(shù)集中于算術(shù)平均數(shù)附近,離平均數(shù)越遠(yuǎn),其相應(yīng)的次數(shù)越少。 4、正態(tài)曲線在|y- μ|=1б處有“拐點(diǎn)”。5、正態(tài)曲線與橫軸之間的總面積等于 1。F分布特性:F分布乃具有平均數(shù)μ=1和取值區(qū)間為[0,?]的一組曲線;而某一特定曲F線的開關(guān)則僅決定于參數(shù)v和v。在v=1或v=2時(shí),F(xiàn)分布曲線是嚴(yán)重傾斜成1212反向J型;當(dāng)v?3時(shí),曲線轉(zhuǎn)為偏態(tài)。 1卡方分布特性:卡方分布的自由度為獨(dú)立的正態(tài)離差的個(gè)數(shù),此處 v=n,其分布圖形為一組具不同自由度v值的曲線。X2值最小為0,最大為+?,因而在坐標(biāo)軸的右面。自由度小時(shí)呈偏態(tài),隨著自由度增加,偏度降低,至 +?時(shí),呈對(duì)稱分布。分布特性:t分布特性:t 分布曲線是對(duì)稱的,圍繞其平均數(shù) μ=0向兩側(cè)遞降。自由度 t較小的t分布比之自由度較大的 t分布具有較大的變異度。它和正態(tài)曲線比較,t分布曲線稍為扁平,峰頂略低,尾部稍高。 t分布是一組隨自由度 v而改變的曲線,但當(dāng)v>30時(shí)接近正態(tài)曲線,當(dāng) v=?時(shí)和正態(tài)曲線合一,由于分布受自由度制約,所以t值與其相應(yīng)的概率也隨自由度而不同。二、評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)1(無偏性(unbiased) 由于估計(jì)量是樣本的函數(shù),是隨機(jī)變量,它對(duì)于不同樣本觀測(cè)值會(huì)得到不同的估計(jì)值。我們自然希望這些估計(jì)值的平均值與參數(shù)的真值相等,也就是一個(gè)好的估計(jì)量的期望等于未知參數(shù)的真實(shí)值,具有這種性質(zhì)的估計(jì)量,稱為無偏估計(jì)量???,,,(unb

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論