統(tǒng)計學(xué)復(fù)習(xí)資料整理

上傳人：燈*** IP屬地：河北上傳時間：2020-07-08 格式：DOC 頁數(shù)：7 大小：239KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、極差：數(shù)據(jù)集的最大值和最小值之間的差值稱為極差或總距離，用r表示。計算方式為R=max (Xi)-min (Xi)方差系數(shù)：也稱為變異系數(shù)，是資料集相對于其平均值的標(biāo)準(zhǔn)差比率。方程式為V=S/X。離散系數(shù)是測量測量數(shù)據(jù)離散度的相對統(tǒng)計，主要用于比較徐璐不同樣本數(shù)據(jù)的離散度。離散系數(shù)大表示數(shù)據(jù)的方差也很大。表示離散系數(shù)小，數(shù)據(jù)的離散度也小。三大統(tǒng)計分布：金鐘仁平方分布、t分布、f分布卡方分布(2)清理：N個徐璐獨立且全部遵循正態(tài)N(0，1)分布的隨機變量X1，X2，Xn，記住隨機變量2遵循自由度為n的2分布。統(tǒng)計變量遵循卡方分布，其含義是在給定概率的條件下滿足或者說表達的概率是。t分布清理：使隨

2、機變量X，Y獨立于徐璐XN(0，1)，Y2(n)機。隨機變量t遵循具有n個自由度的t分布。對于設(shè)置Tt(n)，0 45)，可以使用標(biāo)準(zhǔn)正態(tài)分布的上分位數(shù)ua作為t(n)分布的上分位數(shù)f分布定理：如果隨機變量X，Y是徐璐獨立的，并且記錄了X2(n1)，Y2(n2)，那么隨機變量F的第一個自由度為n1，第二個自由度遵循n2的F分布，并記錄為FF(n1，N2)FF(n1，N2)，如果很容易知道郵報統(tǒng)計：描述范例性質(zhì)的一般數(shù)值測量。完全由樣品決定的量稱為統(tǒng)計?；驔]有其他未知樣本量的函數(shù)稱為統(tǒng)計。統(tǒng)計可以看作是樣品加工之一，集中了樣品所包含的整體方面的信息。最常用的統(tǒng)計信息是樣本平均值和樣本方差S2。自

3、由度：隨機變量中包含的獨立變量數(shù)。參數(shù)估計：使用樣本統(tǒng)計信息估計整體參數(shù)。在參數(shù)估計中，用于估計整體參數(shù)的統(tǒng)計信息的名稱稱為估計，并顯示為符號?？梢怨烙嫎悠菲骄?、樣品率、樣品方差等。根據(jù)特定樣本計算的估計值稱為估計值。參數(shù)估計方法有若干估計和區(qū)間估計兩種。點估計：直接使用樣例統(tǒng)計信息的值作為整個參數(shù)的估計值。區(qū)間估計：根據(jù)點估計(通常由樣本統(tǒng)計中的加法和減法估計誤差得出)，給出了整個參數(shù)估計的區(qū)間范圍。與點估計不同，間隔估計可以根據(jù)采樣統(tǒng)計信息的樣本分布提供采樣統(tǒng)計信息與總體參數(shù)的接近程度的概率測量。樣品數(shù)量：全局抽取的部分因素由樣品組成，構(gòu)成樣品的因素數(shù)量為樣品數(shù)量。樣本金額的大小是選擇檢

4、驗統(tǒng)計數(shù)據(jù)的一個因素。置信區(qū)間：在區(qū)間估計中，由樣本統(tǒng)計組成的整個參數(shù)的估計區(qū)間稱為置信區(qū)間。信任級別：配置信任級別的步驟重復(fù)多次，信任級別包含整個參數(shù)true值的次數(shù)稱為信任級別。用(1-)% %表示，是總參數(shù)不在區(qū)間內(nèi)的比例。也稱為可信度或信任系數(shù)。假設(shè)檢驗：利用樣本信息驗證所提出命題的一系列程序和方法。事先假定整個參數(shù)或分布形式，利用樣本信息判斷假設(shè)是否成立。有參數(shù)假設(shè)檢驗和非參數(shù)假設(shè)檢驗。采用邏輯反證法，根據(jù)統(tǒng)計上的小概率原則。單側(cè)檢查：拒絕右側(cè)域或左側(cè)的假設(shè)檢查，而左側(cè)的單側(cè)檢查拒絕右側(cè)的單側(cè)檢查雙方檢驗：雙方拒絕域的假設(shè)檢驗原始假設(shè)：創(chuàng)建一個或兩個參數(shù)是否大于或小于特定值的命題。H

5、0:收集反對證據(jù)的假設(shè)(總是有等號)選擇假設(shè)：H1:也稱為研究假設(shè)，是收集和支持證據(jù)的假設(shè)。與原始假設(shè)相反的假設(shè)(不總是相同)方差分析：作為縮寫，ANOVA是一種統(tǒng)計方法，它檢查每個總體平均值是否相等，以確定子類型對數(shù)值變量是否有顯著影響。因子和處理：在方差分析中檢查的對象稱為因子或因子，是正在研究的子類型變量的另一個名稱。因素的其他成果稱為處理或水平?？偲椒胶停阂許ST形式記錄。所有觀測xij和總平均x的誤差平方和。組之間的平方和：SSA，它是每個組的平均Xi和總平均x的誤差平方，反映每個值的差異程度，因此也稱為元素平方和。組內(nèi)平方和：以每個水平或組的不同本數(shù)據(jù)和該組平均值的誤差平方和SSE

6、記錄，反映了每個采樣觀測的方差，因此稱為組內(nèi)平方和。平方和反映了隨機誤差的大小。SST、SSA和SSE之間的關(guān)系：組之間的方差：SSA的平均值，也稱為組之間的平均值，以MSA記錄，計算方法如下：MSA=組之間的平方和/自由度=SSA/k-1組內(nèi)方差：SSE的平均值，也稱為組內(nèi)平均值，記錄為MSE，計算方法如下：MSE=群組中的平方和/自由度=SSE/n-k通過比較MSA和MSE，可以獲得所需的檢查統(tǒng)計信息f。如果H0為真，則兩者的比例遵循分子自由度為k-1、分母自由度為n-k的f分布。單因素方差分析：研究子類型參數(shù)和數(shù)值因素變量之間關(guān)系的統(tǒng)計方法。雙因素方差分析：研究兩個子類型參數(shù)和相同數(shù)值因

7、素變量之間關(guān)系的統(tǒng)計方法。如果分布分析包含兩個子類型自變量，則這稱為雙元素分布分析。無重復(fù)雙因素分析重復(fù)雙因素分析相關(guān)性：變量之間存在的不確定數(shù)量關(guān)系，稱為相關(guān)性，一個變量的值不能由另一個變量唯一確定。相關(guān)系數(shù)：基于樣本數(shù)據(jù)計算的度量中兩個變量之間線性關(guān)系強度的統(tǒng)計信息。如果相關(guān)系數(shù)是根據(jù)整體數(shù)據(jù)計算的，則稱為整體相關(guān)系數(shù)，并記錄為?；谘鄹鶖?shù)據(jù)進行計算時，稱為采樣相關(guān)系數(shù)，以r記錄。樣例相關(guān)系數(shù)計算如下：LSD:最小顯著差異法。有一定的缺陷。與比較相比，可以使用此方法。修正了測試兩個求和平均值是否相等的t測試方法的總體方差估計(替換為MSE)。其中t/2是t分布的極限值，通過調(diào)查t分布表獲得

8、。自由度是(n-k)，其中k是因子的水平數(shù)目。MSE是組內(nèi)的超差。Ni和NJ分別是第I個和第j個采樣的采樣數(shù)。簡述評價估計量好壞的標(biāo)準(zhǔn)。1.偏轉(zhuǎn)：估計樣本分布的數(shù)學(xué)期望值等于估計的整體參數(shù)。如果將整個參數(shù)設(shè)置為，選定的估計值為，e ()=，則稱為的無偏估計值。2.有效性：對同一整體參數(shù)的兩個偏轉(zhuǎn)點估計，具有較小標(biāo)準(zhǔn)差的估計更有效。在沒有偏轉(zhuǎn)估計的條件下，估計量的方差越小，估計量也越有效。3.一致性：隨著樣本容量的增加，估計值越來越接近估計的整體參數(shù)。也就是說，較大的樣本提供比較小的樣本更接近整體參數(shù)的估計值。如何理解信任區(qū)間？在區(qū)間估計中，由樣本統(tǒng)計組成的整個參數(shù)的估計區(qū)間稱為置信區(qū)間。其中，

9、間隔的最小值是信任下限，最大值是信任區(qū)間。統(tǒng)計學(xué)家在一定程度上確信這一區(qū)間將包含實際樣品的全部參數(shù)，因此將其命名為置信區(qū)間。假設(shè)檢驗的兩種錯誤是什么？兩種類型的錯誤之間有什么類型的數(shù)量關(guān)系？一個錯誤是假定H0原來是真的，被我們拒絕了，因為犯這種錯誤的概率用表示，所以也稱為阿爾法錯誤或拋棄錯誤。另一個錯誤假定原來是假的，但沒有拒絕，犯這種錯誤的概率叫貝塔，也叫貝塔類或假錯誤。和在數(shù)量上是這種去除長度關(guān)系。簡述假設(shè)檢驗的基本步驟。1.提出假說2.確定適當(dāng)?shù)臋z查統(tǒng)計信息設(shè)定重要性層次4.計算檢驗統(tǒng)計信息的值5.統(tǒng)計決策方差分析包括哪些類型？區(qū)別是什么？1.單因素方差分析：研究子類型參數(shù)最大數(shù)值因素變

10、量的影響。2.雙因素方差分析：研究兩個子類型參數(shù)和相同數(shù)值因素變量之間關(guān)系的統(tǒng)計方法。如果分布分析包含兩個子類型自變量，則這稱為雙元素分布分析。沒有重復(fù)的雙因素分析：兩個影響因素是徐璐無關(guān)的?？芍貜?fù)雙因素分析：兩個因素相互作用，結(jié)合后產(chǎn)生新的影響。簡述方差分析的基本思想。方差分析的基本假設(shè)：1 .每個整體都必須遵循正態(tài)分布。2.每個整體的方差必須相同(同質(zhì)性)。3.觀測是獨立的方差分析的基本思路和原理：1 .判斷平均值是否有差異時，需要方差的幫助。2.通過對數(shù)據(jù)錯誤來源的分析，確定徐璐其他總體平均值是否相同。也就是說，需要判斷平均值之間是否存在差異的方差分析。說明R2的意義和作用。R2(稱為多

11、晶系數(shù))用于非迭代雙因素方差分析中關(guān)系強度的測量。行元素產(chǎn)生的誤差平方和記錄SSR，列元素產(chǎn)生的誤差平方和記錄SSC測量兩個參數(shù)對兩個平方和的結(jié)果變量的合并效果，聯(lián)合效果和總平方和的比率定義為R2，平方根r反映兩個參數(shù)之和與變量之間的關(guān)系強度。也就是說，R2=并集效果/總效果=SSR SSC/SST簡述相關(guān)系數(shù)的特性。1.r的范圍在-1到1之間，r=1時具有完全正線性相關(guān)性R=-1時完全負線性相關(guān)R=0時，線性無關(guān)0r=-1，負線性相關(guān)性如果為0F，則不接受H0雙因素方差分析：(1)，像單個元素一樣，第一個假設(shè)，h0，h1；H0，H1(因為是兩個因素，所以單獨假設(shè)，最終結(jié)果也單獨檢查)(2)，

12、求總誤差平方和SST，自由度為kr-1線誤差平方和SSR，自由度為k-1熱誤差平準(zhǔn)法和SSC，自由度為r-1隨機誤差項目平方和SSE，自由度為(k-1)(r-1)SST=SSR SSC SSE(3)，根據(jù)每個誤差平方和和自由度查找每個區(qū)域、MST、MSE、MSR、MSC以下步驟類似于單個元素，根據(jù)行誤差平均值和隨機誤差平均值的比率MSR/MSE=Fr，根據(jù)列誤差平均值和隨機誤差平均值的比率MSC/MSE=Fc，對兩個元素之一的檢查根據(jù)自由度根據(jù)給定置信度查找Fa。分別查找和比較行和列回歸分析和相關(guān)分析之間的差異1.在相關(guān)分析中，變量x變量y處于等效位置。2.在回歸分析中，變量y稱為原因變量，位于解析的位置，x稱為參數(shù)，用于預(yù)測原因變量的變化。3.相關(guān)分析主要說明兩個變量之間的線性關(guān)系有多密切；4.回歸分析不僅揭示了變量x對變量y的影響大小，還可以由回歸方程預(yù)測和調(diào)整?；貧w分析與相關(guān)分析的關(guān)系

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

統(tǒng)計學(xué)復(fù)習(xí)資料整理

文檔簡介

溫馨提示

最新文檔

評論

統(tǒng)計學(xué)復(fù)習(xí)資料整理

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔