統(tǒng)計學名詞解釋匯總 袁衛(wèi)版_第1頁
統(tǒng)計學名詞解釋匯總 袁衛(wèi)版_第2頁
統(tǒng)計學名詞解釋匯總 袁衛(wèi)版_第3頁
統(tǒng)計學名詞解釋匯總 袁衛(wèi)版_第4頁
統(tǒng)計學名詞解釋匯總 袁衛(wèi)版_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、統(tǒng)計學名詞解釋統(tǒng)計學:是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學。統(tǒng)計學方法:描述統(tǒng)計和推斷統(tǒng)計;理論統(tǒng)計和應用統(tǒng)計。統(tǒng)計數(shù)據(jù)的來源:第一手數(shù)據(jù)(直接數(shù)據(jù));第二手數(shù)據(jù)(間接數(shù)據(jù))?;靖拍睿嚎傮w(人們研究的所有基本單位總和)變量(總體中個體單位所具有的特征)樣本(總體的一部分)統(tǒng)計數(shù)據(jù)類型:按采取計量尺度,分類數(shù)據(jù)(定性)、順序數(shù)據(jù)(定性)、數(shù)值型數(shù)據(jù)(定量);按統(tǒng)計數(shù)據(jù)收集方法,觀測數(shù)據(jù)、實驗數(shù)據(jù);按被描述對象與時間關(guān)系,截面數(shù)據(jù)、時間序列數(shù)據(jù)(動態(tài)數(shù)據(jù))變量分類:分類變量,順序變量,數(shù)值型變量;隨機變量(某次試驗結(jié)果的數(shù)值性描述),非隨機變量;經(jīng)驗變量,理論變量。離散型變量和連

2、續(xù)型變量離散型變量,只能取有限個數(shù)值;連續(xù)型變量,取一個或多個區(qū)間中任何值 ;均值:亦數(shù)學期望,是隨機變量所有可能取值的一個加權(quán)平均參數(shù)估計:用樣本統(tǒng)計量去估計總體的參數(shù)估計量:用來估計總體參數(shù)的統(tǒng)計量的名稱點估計:用樣本估計量的值作為總體參數(shù)的估計值區(qū)間估計:在點估計的基礎上,給出總體參數(shù)估計的一個范圍置信區(qū)間:在區(qū)間估計中,由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間;置信系數(shù):置信區(qū)間中包含總體參數(shù)真值的次數(shù)所占的比率評價估計量的標準:無偏性、有效性、一致性;假設:對總體參數(shù)的具體數(shù)值所作的陳述;假設檢驗:先對總體參數(shù)提出某種假設,然后利用樣本信息判斷假設假設是否成立的過程。方差分析:檢驗多個

3、總體均值是否相等的統(tǒng)計方法數(shù)據(jù)的預處理包括哪些內(nèi)容?數(shù)據(jù)審核(完整性和準確性;適用性和實效性),數(shù)據(jù)篩選和數(shù)據(jù)排序。直方圖和條形圖有什么區(qū)別? 條形圖使用圖形的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距, 直方圖各矩形連續(xù)排列,條形圖分開排列, 條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。 莖葉圖和直方圖相比有什么優(yōu)點?莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。一組數(shù)據(jù)的分布特征可以從哪幾方面進行測度:一是分布的集中趨勢,

4、反映數(shù)據(jù)向其中心靠攏或聚集的程度;二是分布的離散程度,反映各數(shù)據(jù)遠離其中心值的趨勢;三是分布的形狀,反映數(shù)據(jù)分布偏斜程度和峰度。簡述眾數(shù)、中位數(shù)、平均數(shù)的特點和應用場合。眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響,缺點是具有不唯一性。眾數(shù)主要作為分類數(shù)據(jù)的集中趨勢測度值。中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)極端值的影響。中位數(shù)以及其他分位數(shù)主要適合于作為順序數(shù)據(jù)的集中趨勢測度值。均值是就數(shù)值型數(shù)據(jù)計算的,具有優(yōu)良的數(shù)學性質(zhì),缺點是易受數(shù)據(jù)極端值的影響。均值主要適合于作為數(shù)值型數(shù)據(jù)的集中趨勢測度值。為什么要計算離散系數(shù)。第一,極差、平均差、方差和標準差等都是反映數(shù)據(jù)分散程度的絕對值,其數(shù)

5、值的大小取決于原變量值本身水平高低的影響。第二,它們與原變量值的計量單位相同,采用不同計量單位計量的變量值,其離散程度的測度值也就不同。因此,為消除變量值水平高低和計量單位不同對離散程度的測度值的影響,需要計算離散系數(shù)。簡述異眾比率、四分位差、方差或標準差的適用場合對于順序數(shù)據(jù),但主要使用四分位差來測量其離散程度;對于數(shù)值型數(shù)據(jù),雖然可以計算異眾比率和四分位差,但主要使用方差或標準差來測量其離散程度。標準分數(shù)有哪些用途?標準分數(shù)給出了一組數(shù)據(jù)中各數(shù)值的相對位置。在對多個具有不同量綱的變量進行處理時,常需要對各變量進行標準化處理。它還可以用來判斷一組數(shù)據(jù)是否有離群數(shù)據(jù)。1.抽樣推斷的含義:是在根

6、據(jù)隨機原則從總體中抽取部分實際數(shù)據(jù)的基礎上,運用數(shù)理統(tǒng)計方法,對總體某一現(xiàn)象的數(shù)量性作出具有一定可靠程度的估計判斷。2.簡單隨機抽樣:含義:從含有N個元素的總體中,抽取n個元素作為樣本,使得每一個容量為n的樣本都有相同的機會被抽中,這樣的方式稱為簡單隨機抽樣。特點:簡單隨機抽樣是其他抽樣方法的基礎。有兩種抽取元素的方式:重復臭氧和不重復抽樣。3.分層抽樣:含義:在抽樣之前先將總體的元素劃分為若干層,然后從各個層中抽取一定數(shù)量的元素組成一個樣本,這樣的樣本抽樣方式稱為分層抽樣,也成分類抽樣。特點:除了可以對總體進行評估外,還可以對各層的子總體進行評估??梢园醋匀粎^(qū)域或行政區(qū)域進行分層,使抽樣的組

7、織和實施都比較方便。分層抽樣的樣本分布在各個層內(nèi),從而使樣本在總體中的分布比較均勻??梢蕴岣吖烙嫷木?。4.系統(tǒng)抽樣:含義:先將總體個元素按照某種順序排列,并按某種規(guī)則確定一個隨機起點,然后,每隔一定的間隔抽取一個元素,直至抽取n個元素形成一個樣本。特點:簡單易行在總體中的分布一般也比較均勻,由此估計的誤差通常要小于簡單隨機抽樣。5.整群抽樣: 含義:先將總體劃分成若干群,然后以群作為抽樣單位從中抽取部分群,再對抽中的各個群中所包含的所有元素進行觀察。特點:不需要有總體元素的具體名單而只要有群的名單就可以進行抽樣。整群抽樣時群內(nèi)各元素比較集中,對樣本進行調(diào)查比較方便,節(jié)約費用。在群內(nèi)各元素存在

8、差異時,整群抽樣可以提供較好的結(jié)果,理想的情況是每一群都是整個總體的一個縮影。3.重復抽樣:從總體中抽取一個元素后,把這個元素放回到總體中再抽取第二個元素,直至抽取n個元素為止。不重復抽樣:一個元素被抽中后不再放回總體,然后再從所剩下的元素中抽取第二個元素,直到抽取n個元素為止。4.抽樣分布:重復選取容量為n的樣本時,由每一個樣本算出的統(tǒng)計量數(shù)值的相對頻數(shù)分布或概率分布,稱為樣本統(tǒng)計量的抽樣分布。5.樣本統(tǒng)計量的分布與總體分布的關(guān)系?由于現(xiàn)實中我們不可能將所有的樣本都抽出來,因此,統(tǒng)計量的抽樣分布實際上是一種理論分布,但它與總體分布存在著密切的關(guān)系,以均值x的抽樣分布為例,其抽樣分布與原有總體

9、的分布有關(guān),如果原有總體是正態(tài)分布,那么,無論樣本容量的大小,樣本均值也服從正態(tài)分布。其分布的數(shù)學期望為總體均值,方差為總體方差的1/n,即00。如果原有總體的分布不是正態(tài)分布,就要看樣本容量的大小了,當n為大樣本時(n30),根據(jù)統(tǒng)計上的中心極限定理可知,當樣本容量n增大時,不論原來的總體是否服從正態(tài)分布,樣本均值的抽樣分布都將趨于服從正態(tài)分布。其分布的數(shù)學期望為總體均值,方差為總體方差的1/n。6. Z/2的含義:是估計誤差。Z/2的值和樣本量n共同確定了估計誤差的大小,一旦確定了置信水平1-,Z/2的值就確定了。對于給定的Z/2的值和總體標準差??梢源_定任一允許的估計誤差所需要的樣本量。

10、7.樣本均值抽樣分布的兩個主要特征值:與總體參數(shù)的關(guān)系:1.理解原假設與備擇假設的含義:原假設:通常將研究者想收集證據(jù)予以反對的假設稱為原假設或零假設,用H0表示;備擇假設:通常將研究者想收集證據(jù)予以支持的假設稱為備擇假設或研究假設,用H1表示。2.統(tǒng)計檢驗量:根據(jù)樣本觀測結(jié)果計算得到的,并據(jù)以對原假設和備擇假設作出決策的某個樣本統(tǒng)計量,稱為檢驗統(tǒng)計量。標準化檢驗統(tǒng)計量:是將統(tǒng)計檢驗量標準化,標準化的統(tǒng)計檢驗量=(點估計量-假設值)/點估計量的抽樣標準差。3.第類錯誤:當原假設為真時拒絕原假設,所犯的錯誤稱為類錯誤。犯第類錯誤的概率通常記為。第類錯誤:當原假設為假時沒有拒絕原假設,所犯的錯誤稱

11、為第類錯誤,又稱取偽錯誤。犯第類錯誤的概率通常記為。它們發(fā)生概率之間的關(guān)系:在樣本量不變的情況下,要減小就會使增大,而要增大就會使減小,這兩類錯誤此消彼長。4.顯著性水平:假設檢驗中犯的第類錯誤的概率,稱為顯著性水平,記為。它對于假設檢驗決策的意義:顯著性水平是人們事先制定的犯第類錯誤的概率的最大允許值,在實際應用中,顯著性水平往往是人們事先給出的一個值。5.P值:在原假設為真的條件下,檢驗統(tǒng)計量的觀察值大于或等于其計算值的概率,稱為P值,也稱為觀察到的顯著性水平。利用P值決策的準則:如果P值,拒絕H0;如果P值,不拒絕H0.6.單側(cè)檢驗與雙側(cè)檢驗的區(qū)別:單側(cè)檢驗中,P值位于抽樣分布的一側(cè),而

12、雙側(cè)檢驗P值位于分布的兩側(cè),每一側(cè)的P值為1/2.7.大樣本情形下總體均值左側(cè)檢驗的拒絕域:ZZ;右側(cè)檢驗的拒絕域:ZZ;雙側(cè)檢驗的拒絕域:|Z|Z/2。8.小樣本情形下總體均值檢驗應該構(gòu)造的檢驗統(tǒng)計量t 應用前提:服從正態(tài)分布9.小樣本情形下總體均值左側(cè)檢驗拒絕域:tt(n-1);右側(cè)檢驗拒絕域: tt(n-1);雙側(cè)檢驗的拒絕域:|t|t/2(n-1)10.假設檢驗的一般步驟:依照題意建立原假設H0與備擇假設H1判斷樣本大小并計算檢驗統(tǒng)計量根據(jù)顯著水平進行判斷原假設是否成立。1、相關(guān)關(guān)系:變量之間存在的不確定的數(shù)量關(guān)系。相關(guān)關(guān)系的特點:一個變量的取值不能由另一個變量唯一確定,當變量x取某個

13、值時,變量y的取值可能有幾個2、相關(guān)系數(shù)的取值和意義:取值范圍:1r1。若0r1,x、y之間存在正線性相關(guān)關(guān)系;1r0,負線性相關(guān)關(guān)系;若r=+1,x、y之間為完全正相關(guān)關(guān)系;r= 1,為完全負線性相關(guān)關(guān)系。當|r|=1時,y的取值完全依賴于x,二者之間即為函數(shù)關(guān)系;當r=0時,說明y的取值和x無關(guān),即二者之間不存在線性關(guān)系(并不說明變量之間沒有任何關(guān)系)。若|r|1,說明變量之間線性關(guān)系越密切,|r|0,越不密切。|r|0.8,高度相關(guān);0.5|r|0.8,中度相關(guān);0.3|r|0.5,低度相關(guān);|r|F,拒絕H0,表明兩個變量之間的線性關(guān)系是顯著的;若Ft/2,拒絕H0,回歸系數(shù)等于0的可

14、能性小于,表明自變量x對因變量y的影響是顯著的(兩個變量之間存在著顯著的線性關(guān)系);若|t|t/2,則不能拒絕H0,表明x對y的影響是不顯著的,二者之間不存在線性關(guān)系。10. 置信區(qū)間估計:對x的一個給定值x0,求出y的平均值的區(qū)間估計。預測區(qū)間估計:對x的一個給定值x0,求出y的一個個別值的區(qū)間估計。區(qū)別:1簡述時間序列的各構(gòu)成要素構(gòu)成要素分為四種,即趨勢(T)、季節(jié)性or季節(jié)變動(S)、周期性或循環(huán)波動(C)、隨機性或不規(guī)則波動(I).趨勢是指時間序列在長時期內(nèi)呈現(xiàn)出來的某種持續(xù)向上或持續(xù)下降的變動。它是由某種固定性的因素作用于序列而形成的。可以是線性,也可以是非線性。季節(jié)變動是指時間序列

15、在一年內(nèi)重復出現(xiàn)的周期性波動。循環(huán)波動或周期性波動是指時間序列中呈現(xiàn)出來的圍繞長期趨勢的一種波浪形或振蕩式變動。不同于趨勢變動,季節(jié)變動有比較固定的規(guī)律,周期為一年,而循環(huán)波動則無固定的規(guī)律,變動周期多為一年以上,且周期長短不一。周期性通常是由于經(jīng)濟環(huán)境的變化而引起的。隨機性或不規(guī)則波動是由于一些偶然性的因素產(chǎn)生的。2利用增長率分析時間序列時應注意哪些問題(1)當時間序列中的觀察值出現(xiàn)0或負數(shù)時,不宜計算增長率;(2)不能單純就增長率論增長率,要注意增長率與絕對水平的綜合分析;大的增長率背后,其隱含的絕對值可能很小,小的增長率背后其隱含的絕對值可能很大。3簡述平穩(wěn)序列和非平穩(wěn)序列的含義平穩(wěn)序列:基本上不存在趨勢的序列。各觀察值基本上在某個固定的水平上波動,雖然在不同的時間段波動的程度不同,但并不存在某種規(guī)律,而其波動可以看成是隨機的。非平穩(wěn)序列:包含趨勢性、季節(jié)性或周期性的序列。它可能只含有其中的一種成分,也可能是幾種成分的組合。4指數(shù)平滑法的基本含義:是加權(quán)平均的一種特殊形式對過去的觀察值加權(quán)平均進行預測的一種方法觀察值時間越遠,其權(quán)數(shù)也跟著呈現(xiàn)指數(shù)的下降,因而稱為指數(shù)平滑有一次指數(shù)平滑、二次指數(shù)平滑、三次

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論