統(tǒng)計學(xué)復(fù)習(xí)資料整理_第1頁
統(tǒng)計學(xué)復(fù)習(xí)資料整理_第2頁
統(tǒng)計學(xué)復(fù)習(xí)資料整理_第3頁
統(tǒng)計學(xué)復(fù)習(xí)資料整理_第4頁
統(tǒng)計學(xué)復(fù)習(xí)資料整理_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、極差:數(shù)據(jù)集的最大值和最小值之間的差值稱為極差或總距離,用r表示。計算方式為R=max (Xi)-min (Xi)方差系數(shù):也稱為變異系數(shù),是資料集相對于其平均值的標(biāo)準(zhǔn)差比率。方程式為V=S/X。離散系數(shù)是測量測量數(shù)據(jù)離散度的相對統(tǒng)計,主要用于比較徐璐不同樣本數(shù)據(jù)的離散度。離散系數(shù)大表示數(shù)據(jù)的方差也很大。表示離散系數(shù)小,數(shù)據(jù)的離散度也小。三大統(tǒng)計分布:金鐘仁平方分布、t分布、f分布卡方分布(2)清理:N個徐璐獨立且全部遵循正態(tài)N(0,1)分布的隨機變量X1,X2,Xn,記住隨機變量2遵循自由度為n的2分布。統(tǒng)計變量遵循卡方分布,其含義是在給定概率的條件下滿足或者說表達的概率是。t分布清理:使隨

2、機變量X,Y獨立于徐璐XN(0,1),Y2(n)機。隨機變量t遵循具有n個自由度的t分布。對于設(shè)置Tt(n),0 45),可以使用標(biāo)準(zhǔn)正態(tài)分布的上分位數(shù)ua作為t(n)分布的上分位數(shù)f分布定理:如果隨機變量X,Y是徐璐獨立的,并且記錄了X2(n1),Y2(n2),那么隨機變量F的第一個自由度為n1,第二個自由度遵循n2的F分布,并記錄為FF(n1,N2)FF(n1,N2),如果很容易知道郵報統(tǒng)計:描述范例性質(zhì)的一般數(shù)值測量。完全由樣品決定的量稱為統(tǒng)計?;驔]有其他未知樣本量的函數(shù)稱為統(tǒng)計。統(tǒng)計可以看作是樣品加工之一,集中了樣品所包含的整體方面的信息。最常用的統(tǒng)計信息是樣本平均值和樣本方差S2。自

3、由度:隨機變量中包含的獨立變量數(shù)。參數(shù)估計:使用樣本統(tǒng)計信息估計整體參數(shù)。在參數(shù)估計中,用于估計整體參數(shù)的統(tǒng)計信息的名稱稱為估計,并顯示為符號??梢怨烙嫎悠菲骄?、樣品率、樣品方差等。根據(jù)特定樣本計算的估計值稱為估計值。參數(shù)估計方法有若干估計和區(qū)間估計兩種。點估計:直接使用樣例統(tǒng)計信息的值作為整個參數(shù)的估計值。區(qū)間估計:根據(jù)點估計(通常由樣本統(tǒng)計中的加法和減法估計誤差得出),給出了整個參數(shù)估計的區(qū)間范圍。與點估計不同,間隔估計可以根據(jù)采樣統(tǒng)計信息的樣本分布提供采樣統(tǒng)計信息與總體參數(shù)的接近程度的概率測量。樣品數(shù)量:全局抽取的部分因素由樣品組成,構(gòu)成樣品的因素數(shù)量為樣品數(shù)量。樣本金額的大小是選擇檢

4、驗統(tǒng)計數(shù)據(jù)的一個因素。置信區(qū)間:在區(qū)間估計中,由樣本統(tǒng)計組成的整個參數(shù)的估計區(qū)間稱為置信區(qū)間。信任級別:配置信任級別的步驟重復(fù)多次,信任級別包含整個參數(shù)true值的次數(shù)稱為信任級別。用(1-)% %表示,是總參數(shù)不在區(qū)間內(nèi)的比例。也稱為可信度或信任系數(shù)。假設(shè)檢驗:利用樣本信息驗證所提出命題的一系列程序和方法。事先假定整個參數(shù)或分布形式,利用樣本信息判斷假設(shè)是否成立。有參數(shù)假設(shè)檢驗和非參數(shù)假設(shè)檢驗。采用邏輯反證法,根據(jù)統(tǒng)計上的小概率原則。單側(cè)檢查:拒絕右側(cè)域或左側(cè)的假設(shè)檢查,而左側(cè)的單側(cè)檢查拒絕右側(cè)的單側(cè)檢查雙方檢驗:雙方拒絕域的假設(shè)檢驗原始假設(shè):創(chuàng)建一個或兩個參數(shù)是否大于或小于特定值的命題。H

5、0:收集反對證據(jù)的假設(shè)(總是有等號)選擇假設(shè):H1:也稱為研究假設(shè),是收集和支持證據(jù)的假設(shè)。與原始假設(shè)相反的假設(shè)(不總是相同)方差分析:作為縮寫,ANOVA是一種統(tǒng)計方法,它檢查每個總體平均值是否相等,以確定子類型對數(shù)值變量是否有顯著影響。因子和處理:在方差分析中檢查的對象稱為因子或因子,是正在研究的子類型變量的另一個名稱。因素的其他成果稱為處理或水平??偲椒胶停阂許ST形式記錄。所有觀測xij和總平均x的誤差平方和。組之間的平方和:SSA,它是每個組的平均Xi和總平均x的誤差平方,反映每個值的差異程度,因此也稱為元素平方和。組內(nèi)平方和:以每個水平或組的不同本數(shù)據(jù)和該組平均值的誤差平方和SSE

6、記錄,反映了每個采樣觀測的方差,因此稱為組內(nèi)平方和。平方和反映了隨機誤差的大小。SST、SSA和SSE之間的關(guān)系:組之間的方差:SSA的平均值,也稱為組之間的平均值,以MSA記錄,計算方法如下:MSA=組之間的平方和/自由度=SSA/k-1組內(nèi)方差:SSE的平均值,也稱為組內(nèi)平均值,記錄為MSE,計算方法如下:MSE=群組中的平方和/自由度=SSE/n-k通過比較MSA和MSE,可以獲得所需的檢查統(tǒng)計信息f。如果H0為真,則兩者的比例遵循分子自由度為k-1、分母自由度為n-k的f分布。單因素方差分析:研究子類型參數(shù)和數(shù)值因素變量之間關(guān)系的統(tǒng)計方法。雙因素方差分析:研究兩個子類型參數(shù)和相同數(shù)值因

7、素變量之間關(guān)系的統(tǒng)計方法。如果分布分析包含兩個子類型自變量,則這稱為雙元素分布分析。無重復(fù)雙因素分析重復(fù)雙因素分析相關(guān)性:變量之間存在的不確定數(shù)量關(guān)系,稱為相關(guān)性,一個變量的值不能由另一個變量唯一確定。相關(guān)系數(shù):基于樣本數(shù)據(jù)計算的度量中兩個變量之間線性關(guān)系強度的統(tǒng)計信息。如果相關(guān)系數(shù)是根據(jù)整體數(shù)據(jù)計算的,則稱為整體相關(guān)系數(shù),并記錄為?;谘鄹鶖?shù)據(jù)進行計算時,稱為采樣相關(guān)系數(shù),以r記錄。樣例相關(guān)系數(shù)計算如下:LSD:最小顯著差異法。有一定的缺陷。與比較相比,可以使用此方法。修正了測試兩個求和平均值是否相等的t測試方法的總體方差估計(替換為MSE)。其中t/2是t分布的極限值,通過調(diào)查t分布表獲得

8、。自由度是(n-k),其中k是因子的水平數(shù)目。MSE是組內(nèi)的超差。Ni和NJ分別是第I個和第j個采樣的采樣數(shù)。簡述評價估計量好壞的標(biāo)準(zhǔn)。1.偏轉(zhuǎn):估計樣本分布的數(shù)學(xué)期望值等于估計的整體參數(shù)。如果將整個參數(shù)設(shè)置為,選定的估計值為,e ()=,則稱為的無偏估計值。2.有效性:對同一整體參數(shù)的兩個偏轉(zhuǎn)點估計,具有較小標(biāo)準(zhǔn)差的估計更有效。在沒有偏轉(zhuǎn)估計的條件下,估計量的方差越小,估計量也越有效。3.一致性:隨著樣本容量的增加,估計值越來越接近估計的整體參數(shù)。也就是說,較大的樣本提供比較小的樣本更接近整體參數(shù)的估計值。如何理解信任區(qū)間?在區(qū)間估計中,由樣本統(tǒng)計組成的整個參數(shù)的估計區(qū)間稱為置信區(qū)間。其中,

9、間隔的最小值是信任下限,最大值是信任區(qū)間。統(tǒng)計學(xué)家在一定程度上確信這一區(qū)間將包含實際樣品的全部參數(shù),因此將其命名為置信區(qū)間。假設(shè)檢驗的兩種錯誤是什么?兩種類型的錯誤之間有什么類型的數(shù)量關(guān)系?一個錯誤是假定H0原來是真的,被我們拒絕了,因為犯這種錯誤的概率用表示,所以也稱為阿爾法錯誤或拋棄錯誤。另一個錯誤假定原來是假的,但沒有拒絕,犯這種錯誤的概率叫貝塔,也叫貝塔類或假錯誤。和在數(shù)量上是這種去除長度關(guān)系。簡述假設(shè)檢驗的基本步驟。1.提出假說2.確定適當(dāng)?shù)臋z查統(tǒng)計信息設(shè)定重要性層次4.計算檢驗統(tǒng)計信息的值5.統(tǒng)計決策方差分析包括哪些類型?區(qū)別是什么?1.單因素方差分析:研究子類型參數(shù)最大數(shù)值因素變

10、量的影響。2.雙因素方差分析:研究兩個子類型參數(shù)和相同數(shù)值因素變量之間關(guān)系的統(tǒng)計方法。如果分布分析包含兩個子類型自變量,則這稱為雙元素分布分析。沒有重復(fù)的雙因素分析:兩個影響因素是徐璐無關(guān)的??芍貜?fù)雙因素分析:兩個因素相互作用,結(jié)合后產(chǎn)生新的影響。簡述方差分析的基本思想。方差分析的基本假設(shè):1 .每個整體都必須遵循正態(tài)分布。2.每個整體的方差必須相同(同質(zhì)性)。3.觀測是獨立的方差分析的基本思路和原理:1 .判斷平均值是否有差異時,需要方差的幫助。2.通過對數(shù)據(jù)錯誤來源的分析,確定徐璐其他總體平均值是否相同。也就是說,需要判斷平均值之間是否存在差異的方差分析。說明R2的意義和作用。R2(稱為多

11、晶系數(shù))用于非迭代雙因素方差分析中關(guān)系強度的測量。行元素產(chǎn)生的誤差平方和記錄SSR,列元素產(chǎn)生的誤差平方和記錄SSC測量兩個參數(shù)對兩個平方和的結(jié)果變量的合并效果,聯(lián)合效果和總平方和的比率定義為R2,平方根r反映兩個參數(shù)之和與變量之間的關(guān)系強度。也就是說,R2=并集效果/總效果=SSR SSC/SST簡述相關(guān)系數(shù)的特性。1.r的范圍在-1到1之間,r=1時具有完全正線性相關(guān)性R=-1時完全負線性相關(guān)R=0時,線性無關(guān)0r=-1,負線性相關(guān)性如果為0F,則不接受H0雙因素方差分析:(1),像單個元素一樣,第一個假設(shè),h0,h1;H0,H1(因為是兩個因素,所以單獨假設(shè),最終結(jié)果也單獨檢查)(2),

12、求總誤差平方和SST,自由度為kr-1線誤差平方和SSR,自由度為k-1熱誤差平準(zhǔn)法和SSC,自由度為r-1隨機誤差項目平方和SSE,自由度為(k-1)(r-1)SST=SSR SSC SSE(3),根據(jù)每個誤差平方和和自由度查找每個區(qū)域、MST、MSE、MSR、MSC以下步驟類似于單個元素,根據(jù)行誤差平均值和隨機誤差平均值的比率MSR/MSE=Fr,根據(jù)列誤差平均值和隨機誤差平均值的比率MSC/MSE=Fc,對兩個元素之一的檢查根據(jù)自由度根據(jù)給定置信度查找Fa。分別查找和比較行和列回歸分析和相關(guān)分析之間的差異1.在相關(guān)分析中,變量x變量y處于等效位置。2.在回歸分析中,變量y稱為原因變量,位于解析的位置,x稱為參數(shù),用于預(yù)測原因變量的變化。3.相關(guān)分析主要說明兩個變量之間的線性關(guān)系有多密切;4.回歸分析不僅揭示了變量x對變量y的影響大小,還可以由回歸方程預(yù)測和調(diào)整?;貧w分析與相關(guān)分析的關(guān)系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論