應用統(tǒng)計復習_第1頁
應用統(tǒng)計復習_第2頁
應用統(tǒng)計復習_第3頁
應用統(tǒng)計復習_第4頁
應用統(tǒng)計復習_第5頁
已閱讀5頁,還剩85頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2021-10-311復習2013年6月9日注:該注:該PPTPPT中紅色標注的內容為重點復習內容(必須中紅色標注的內容為重點復習內容(必須掌握)掌握)2021-10-312試題和分布試題和分布填空題填空題 20% 20% 5 5題題單選題單選題 14% 14% 7 7題題計算題計算題 48% 448% 4題題根據輸出結果回答問題根據輸出結果回答問題 18% 118% 1題題l分組數據平均數、中位數和眾數分組數據平均數、中位數和眾數 l單總體均值區(qū)間估計單總體均值區(qū)間估計l假設檢驗假設檢驗2 2題題( (單總體和兩個總體各單總體和兩個總體各1 1題題) )l一元回歸分析綜合題一元回歸分析綜合題

2、1 1題題2021-10-313第第1 1章和第章和第2 2章不考章不考第第3 3章重點:章重點:1.1.幾何平均數(幾何平均數(p.49p.49)2.2.分組數據的平均數、中位數、眾數計算分組數據的平均數、中位數、眾數計算(p.42-45)(p.42-45)3.3.算術平均數、中位數和眾數間的關系算術平均數、中位數和眾數間的關系(p.45)(p.45)4.p.334.p.33偏態(tài)曲線偏態(tài)曲線2021-10-314 (1)(1)簡單算術平均數簡單算術平均數niixnx11算術平均數的計算算術平均數的計算 n 總體單位總數;xi 第 i 個單位的標志值。 xi 第 i 組的代表值(組中值或該組變

3、量值); f i 第 i 組的頻數。 iiiffxx (2) (2)加權算術平均數加權算術平均數 2021-10-315幾何平均數幾何平均數當統(tǒng)計資料是各時期的發(fā)展速度等前后期的兩兩環(huán)比數據,要求每時期的平均發(fā)展速度時,就需要使用幾何平均數。幾何平均數是 n 個數連乘積的 n 次方根。1. 簡單幾何平均數簡單幾何平均數nnGxxxx 21 2. 加權幾何平均數加權幾何平均數 ffnffGnxxxx 2121f i 各比率出現的頻數 2021-10-316例例:某公司原料成本隨時間增長的情況如下表求原料成本的平均年增長率。 解一解一:1992199319941995成本200228239.424

4、4.2年增長率(%)1452302. 105. 114. 1Gx解二:解二:3200/2 .244Gx 年平均增長率 = 1.0688 - 1 = 6.88% 0688. 10688. 12021-10-317復習題復習題某公司原料成本隨時間增長的情況如下,1992年的原料成本為200萬元,1995年的原料成本為244.2萬元,則3年中該公司原料成本的年平均增長率為( )。(保留小數點后2位)。 19921993199419952021-10-318000,100$X000,50$X000,100$X32150% decrease 100% increase25.2) 1 ()5 .(X%01

5、11)2()50(.1)1 (1 ()5 .(1(1)1 ()1 ()1(2/12/12/1/121nnGRRRR算術平均數算術平均數:幾何平均數幾何平均數:2021-10-319位置平均數是根據總體標志值所處的特殊位置確定的一類平均指標。包括中位數和眾數兩種。( (一一) )中位數中位數(Median)將總體各單位標志值按由小到大的順序排列后處于中間位置的標志值稱為中位數,記為Me 。中位數是一種位置平均數,不受極端數據的影響。當統(tǒng)計資料中含有異常的或極端的數據時,中位數比算術平均數更具有代表性。比如有 5 筆付款:9元,10元,10元,11元,60元付款的均值為 20 元,顯然這并不是一個

6、很好的代表值,而中位數 Me = 10 元則更能代表平均每筆的付款數。二二. 位置平均數位置平均數2021-10-3110分組數據中位數的確定分組數據中位數的確定 對于分組數據的統(tǒng)計資料,中位數要用插值法來估算。 (1)計算各組的累計頻數; (2)確定中位數所在的組 是累計頻數首次包含中位數位次f /2的組。dfSfLMmme121其中:L 中位數所在組的下限; Sm-1 中位數所在組前一組的累計頻數; fm 中位數所在組的頻數; d 中位數所在組的組距。 2021-10-3111( (二二) )眾數眾數(Mode)是總體中出現次數最多的標志值,記為M 0。眾數明確反映了數據分布的集中趨勢,也

7、是一種位置平均數,不受極端數據的影響。但并非所有數據集合都有眾數,也可能存在多個眾數。在某些情況下,眾數是一個較好的代表值。例如在服裝行業(yè)中,生產商、批發(fā)商和零售商在進行生產和存貨決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。又如,當要了解大多數家庭的收入狀況時,也要用到眾數。 2021-10-3112未分組數據眾數的確定未分組數據眾數的確定在數據量很大的時候,可以使用 Excel 統(tǒng)計函數中的 MODE 函數返回眾數。格式:MODE(,)功能:返回所有參數中數據的眾數。 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mode = 92021-10-3113分組數據眾

8、數的確定分組數據眾數的確定對于分組數據的統(tǒng)計資料,眾數也要用插值法來估算。(1)確定眾數所在的組 對于等距分組,眾數組是頻數最高的組;(2)使用以下插值公式計算dLM2110其中:L 眾數組的下限1 眾數組與前一組的頻數之差2 眾數組與后一組的頻數之差 d 眾數組的組距12眾數Ld2021-10-3114三三. .算術平均數和位置平均數間的關系算術平均數和位置平均數間的關系1.頻數分布呈完全對稱的單峰分布,算術平均數、中位數和眾數三者相同0 xf(Me,M0)X0 xfMeXM00 xfMeXM02.頻數分布為右偏態(tài)時,眾數小于中位數,算術平均數大于中位數3.頻數分布為左偏態(tài)時,眾數大于中位數

9、,算術平均數小于中位數2021-10-3115復習例(必看)復習例(必看)補充題:某地區(qū)私營企業(yè)注冊資金分組資料如下,求該地區(qū)私營企業(yè)注冊資金的平均數、中位數和眾平均數、中位數和眾數,并判斷分布的形狀數,并判斷分布的形狀。注冊資金(萬元)50以下 50100 100150 150200 200250 250以上企業(yè)數203542261552021-10-3116 答案答案注冊資金(萬元) 企業(yè)數 累計企業(yè)數組中值50以下2020255010035557510015042971251502002612317520025015138225250以上5143275(萬元) 6 .123iiiffxx

10、(萬元) 64.1195042555 .711002/1dfSfLMmmef/2=143/2=71.5,中位數所在“100150”的組,眾數組為“100150”的組,)( 22.11550)2642()3542(35421002110萬元dLM2021-10-3117第四章 (2-5分)條件概率乘法公式全概率公式貝葉斯公式事件獨立性2021-10-3118某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于年齡不低于60歲的占歲的占80%,死亡年齡不低于,死亡年齡不低于80歲的歲的占占20%。問:該地區(qū)現年問:該地區(qū)現年60歲的人能活到歲的人能活到80

11、歲的概率是多歲的概率是多少?少?2021-10-3119某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的占80%,死亡年齡不低于80歲的占20%。問:該地區(qū)現年60歲的人能活到80歲的概率是多少?解解:設A=壽命60, B=壽命80, 求P(B|A)。B A, P(AB)=P(B)ABP(AB)=P(B)P(B|A)=P(AB)/P(A)=P(B)/P(A) =0.2/0.8=0.252021-10-3120復習重點復習重點1.貝葉斯公式2021-10-3121貝葉斯(Bayes)公式若A1,A2,A3,An 為樣本空間S的一個完備事件組,則對任一事件B,(P(B)0), 有)()

12、|()()|()()|()()|(1BPABPAPABPAPABPAPBAPiiniiiiiii=1,2,n (*) 貝葉斯公式在風險型決策中有非常重要的應用,詳見本章最后的案例。2021-10-3122貝葉斯公式的簡單應用某產品由甲、乙、丙三個班組生產,甲、乙、丙班的產量分別占全部產量的50%、30%和20%;次品率分別為2%、3%和1%?,F任取1件進行檢驗,求:(1) 抽到的是甲班生產,且是次品的概率; (2) 抽到次品的概率; (3) 若抽到的是次品,求該次品是丙班生產的概率。2021-10-3123解:記:記A1,A2,A3,分別為抽到的產品是甲班、乙班、丙班生產的,分別為抽到的產品是

13、甲班、乙班、丙班生產的,B=抽到的是次品抽到的是次品。(1) 由概率的乘法公式, P(A1B)= P(A1)P(B|A1)=0.500.02=0.01(2) 由全概率公式 P(B)=P(A1)P(B|A1)+ P(A2)P(B|A2)+ P(A3)P(B|A3) =0.50.02+0.30.03+0.20.01= 0.021(3) 由Bayes公式0952. 0021. 001. 02 . 0)()|()()|(333BPABPAPBAP2021-10-3124案例3解答 統(tǒng)計資料表明,某地癌癥發(fā)病率為千分之五,現該地區(qū)正進行癌癥普查。普查試驗的結果為陰性或陽性。以往的臨床資料表明,癌癥患者試

14、驗反應為陽性的概率是0.95,健康人試驗反應呈陽性的概率是0.04。問:(1)當某人試驗反應為陽性時他確患癌癥的概率; (2)試驗反應為陰性者患癌癥的概率。2021-10-3125記:記:A A1 1=癌癥患者癌癥患者 , A A2 2=健康人健康人 , B B1 1=反應陽性反應陽性 , B B2 2=反應陰性反應陰性 由題意可知,P(A1)=0.005,P(A2)=0.995,P(B1|A1)=0.95, P(B2|A1)=0.05,P(B1|A2)=0.04,P(B2|A2)=0.96, 由全概率公式:P(B1)= P(A1)P(B1|A1)+P(A2)P(B1|A2) = 0.0050

15、.95+0.9950.004 = 0.04455 P(B2)=1- P(B1)=1- 0.04455=0.95545。 由Bayes公式可得1066. 0045. 095. 0005. 0)()|()()|(111111BPABPAPBAP00026. 095545. 005. 0005. 0)()|()()|(212121BPABPAPBAP 即普查試驗反應為陽性者確患癌癥的概率是10.66%,而反應為陰性者患癌癥的概率為萬分之2.6。2021-10-3126第第5 5章章 抽樣與抽樣分布抽樣與抽樣分布復習重點:1.1.抽樣方法特點和關系(選擇題)抽樣方法特點和關系(選擇題)2.2.抽樣分布

16、抽樣分布3.3.會查標準正態(tài)分布表、會查標準正態(tài)分布表、t t分布表,卡方分布表,卡方,F,F分布分布表表2021-10-3127抽樣方法抽樣方法關系到抽樣調查的成本費用和抽樣誤差的大小,應根據調查的目的、和調查對象的特點采取不同的抽樣方法。主要有以下幾種抽樣方法。 2021-10-3128(simple random sampling)也稱純隨機抽樣純隨機抽樣,指不對總體作任何處理,直接按隨機原則抽取調查單位的抽樣方式。簡單隨機樣本(I.I.D)簡單隨機抽樣最能體現抽樣的隨機原則,抽樣誤差的計算就是以簡單隨機抽樣為基礎的。局限性局限性:當總體單位數很大時,就難以實現簡單隨機抽樣,且抽樣誤差較

17、大。1.簡單隨機抽樣2021-10-3129(1).分層隨機抽樣(stratified sampling)也稱類型抽樣抽樣,是將總體按某一主要標志進行分類(分組),分別從各類型組中隨機抽取一部分調查單位共同組成樣本。三種方法:三種方法:(1 1)等數分配法)等數分配法(2 2)等比分配法)等比分配法(3 3)最優(yōu)分配法)最優(yōu)分配法。2.其他抽樣方法例如,對企業(yè)進行調查時將企業(yè)劃分為特大型企業(yè)、大型企業(yè)、中型企業(yè)和小型企業(yè)四個類型組。對家庭收入進行調查時將居民家庭分為高收入、中等收入、低收入三個類型組等。2021-10-3130(2).機械抽樣(systematic sampling) 也稱等距

18、抽樣或系統(tǒng)抽樣,其步驟如下: (1)按某一標志值的大小將總體單位進行排隊并順序編號; (2)根據確定的抽樣比例確定抽樣間距; (3)隨機確定第一個樣本單位; (4)按順序從總體中等間距地抽取其余樣本單位。 系統(tǒng)抽樣的隨機性主要體現在第一個樣本單位的抽取上,因此一定要保證抽取第一個樣本單位的隨機性。2.其他抽樣方法(續(xù))2021-10-3131(3).整群抽樣(Cluster sampling )人們就將總體的各單位按一定的標志或要求,分成若干群,然后以群為單位,隨機抽取幾個群,對被抽中的群進行全部調查,這就是整群抽樣。如對人口普查資料進行復查,就采用整群抽樣的方式。當群中的元素差異性大時,整群

19、抽樣得到的結果比較好。在理想狀態(tài)下,每一群是整個總體小范圍內的代表。分層抽樣分層抽樣:層間差異盡可能大,層內差異盡可能小整群抽樣整群抽樣:群間差異盡可能小,群內差異盡可能大2.其他抽樣方法(續(xù))2021-10-3132(2)代表性誤差指由于隨機樣本內部結構與總體結構之間存在差異而引起的樣本指標與總體指標之間的差異。代表性誤差又可分為兩類: 系統(tǒng)性誤差系統(tǒng)性誤差指由于違反抽樣的隨機原則而產生的誤差。 隨機誤差隨機誤差也稱抽樣誤差抽樣誤差,指由于隨機抽樣本身導致的現樣本內部結構與總體結構不一致而產生的誤差。在抽樣調查中隨機誤差是不可避免的。如全部產品中有2%的次品,隨機抽取100件,其中恰好有2件

20、次品的可能性是很少的。 統(tǒng)計誤差和抽樣誤差(續(xù))統(tǒng)計誤差和抽樣誤差(續(xù))2021-10-3133影響抽樣誤差的主要因素(1)(1)總體標準差總體標準差越大,樣本結構就越難以接近總體結構,誤差也就越大。(2)(2)樣本容量樣本容量 越大,樣本結構就越接近總體結構,樣本對總體的代表性就越高,抽樣誤差就越小。(3)(3)抽樣方法抽樣方法不同抽樣的方法,將直接影響樣本內部結構與總體結構之間的差異。如分層抽樣就可以使樣本結構更接近于總體結構,因而其抽樣誤差是所有抽樣方法中最小的。(4)(4)抽樣方式抽樣方式不重復抽樣可以使樣本內部結構更接近總體結構。因此不重復抽樣的抽樣誤差小于重復抽樣。 2021-10

21、-3134抽樣分布抽樣分布(1 1)均值的抽樣分布)均值的抽樣分布(2 2)比例的抽樣分布)比例的抽樣分布2( ,)xN un2( ,)XN u2( ,)xN un2( ,)XN u(1)( ,)spppN pn5(1)5npnp2021-10-3135第六章第六章 置信區(qū)間估計置信區(qū)間估計1.1.允許誤差允許誤差d d2.2.區(qū)間估計(單總體方差未知時的均區(qū)間估計(單總體方差未知時的均值估計)值估計)3.3.樣本容量的確定(均值和比例)樣本容量的確定(均值和比例)2021-10-3136估計對象估計對象條件條件要求要求置信區(qū)間置信區(qū)間nZddxdx/ ), ,(2/nSntddxdx/) 1

22、( ), ,(2/nSntx/) 1( nSntx/) 1( , ) ,(dpdpnppZd/ )1 (2/)1()1( ,)1()1(22/1222/2nSnnSn)1()1(22nSn)1()1(212nSnP2 2已知 2未知未知雙側雙側雙側雙側雙側雙側單側上限單側上限單側上限單側上限單側下限單側下限單側下限單側下限第六章第六章 置信區(qū)間估計置信區(qū)間估計2021-10-3137設某種元件的壽命 XN(, 2),其中 , 2未知,現隨機測得10個元件的壽命如下(小時) 1502, 1453, 1367, 1108, 1650 1213, 1208, 1480, 1550, 1700試求元件

23、平均壽命 的95%置信區(qū)間。復習題復習題2021-10-3138 故所求 的 95% 置信區(qū)間為 解:解:已知x /2=0.025,10/5 .1962622. 2=1423.1, S=196.5, =1-0.95=0.05,n=10,查表得 t0.025(9)=2.26226 .140nSntd/) 1(2/) ,(dxdx 可用 Excel 的【工具】“數據分析”“描述統(tǒng)計”需要注意:只給出只給出d值值求解正態(tài)總體均值 的置信區(qū)間。)7 .1563 , 5 .1282(2021-10-3139復習題復習題 某車床加工的缸套外徑尺寸 XN( , 2 ),下面是隨機測得的10個加工后的缸套外徑

24、尺寸(mm), 90.01,90.01,90.02,90.03,89.99 89.98,89.97,90.00,90.01,89.99求 ( , ) 求 的置信度為95%的置信區(qū)間;001.90 x2201853. 0S2021-10-3140總體均值區(qū)間估計時樣本容量的確定總體均值區(qū)間估計時樣本容量的確定在給定置信度和允許誤差 d 的條件下,由nSntd/) 1(2/可得22/) 1(dSntn22/dz 其中總體標準差或樣本標準差也是未知的,通??梢韵韧ㄟ^小規(guī)模抽樣作出估計。 由于使用的是近似公式,可知實際采用的最低樣本容量應比計算結果稍大。 22/dSz2021-10-3141總體比例區(qū)

25、間估計時樣本容量的確定總體比例區(qū)間估計時樣本容量的確定國外民意調查機構在進行民意調查時,通常要求在95%的置信度下將調查的允許誤差(即置信區(qū)間的 d 值)控制在3%以內。問為滿足該調查精度要求,需要多大的樣本?如果要求置信度達到99%,調查誤差仍為3%,此時至少需要多大的樣本? 2021-10-3142案例思考題解答(1)本案例中,當沒有關于總體均值P先驗值和估計時,要用P=0.5確定樣本容量,這樣產生最大可能的樣本容量及成本最高的抽樣,可得由 / )1 ( 2/nppZd222/)1 (dppZn時,當5 . 0 p故需要的樣本容量為2203. 05 . 05 . 096. 1n1 .106

26、7(人) 1068 達到最大值, )1 (pp2021-10-3143案例思考題解答案例思考題解答(2)(2)如果要求置信度達到99%,則Z/2=Z0.005=2.575,2203. 05 . 05 . 0575. 2n8 .1841 (人) 18422021-10-3144第第6 6章作業(yè)題(尤其章作業(yè)題(尤其2,62,6必須掌握)必須掌握)2021-10-3145第第7 7章章 單個總體的假設檢驗單個總體的假設檢驗復習重點:1.兩類錯誤及其關系兩類錯誤及其關系(重點:選擇題)2.單總體假設檢驗必須掌握內容:單總體假設檢驗必須掌握內容: sigma未知情況下,總體均值假設檢驗 2021-10

27、-3146設設 t 為檢驗原假設為檢驗原假設 H0 所用的統(tǒng)計量,所用的統(tǒng)計量,t (n-1)為為檢驗的臨界值,由顯著性水平檢驗的臨界值,由顯著性水平 的定義的定義(右邊檢驗右邊檢驗) P t t(n-1) | H0 為真= 可知檢驗中可能出現以下兩類判斷錯誤:四.檢驗中可能犯的兩類錯誤第一類錯誤第一類錯誤當 H0 為真時拒絕 H0 的錯誤,即“棄真”錯誤,犯此類錯誤的概率為 。第二類錯誤第二類錯誤 當 H0 不真時接受 H0 的錯誤,即“取偽”錯誤, 記犯該類錯誤的概率為 ,即P tt(n-1)H0 不真= 由于 H0 不真時與 H0 為真時,統(tǒng)計量 t 的分布是不同的, 故 1-。 202

28、1-10-3147由圖可知,減少 會增大 ,反之也然。在樣本容量 n 不變時,不可能同時減小犯兩類錯誤的概率。應著重控制犯哪類錯誤的概率,這應由問題的實際背景決定。n當第一類錯誤造成的損失大時,就應控制犯第一類錯誤的概率 (通常取 0.05,0.01等);n反之,當第二類錯誤造成的損失大時,就應控制犯第二類錯誤的概率 。要同時減小須犯兩類錯誤的概率,必須增大樣本容量 n。 x0H0:=0t(n-1)H1:=1四.檢驗中可能犯的兩類錯誤(續(xù))2021-10-3148單個總體均值的檢驗單個總體均值的檢驗當樣本容量足夠大時,當樣本容量足夠大時,t t值可以用值可以用Z Z值近值近似確定似確定2021

29、-10-3149案例案例1. 1. 檢驗新工藝的效果檢驗新工藝的效果某廠生產的一種鋼絲抗拉強度服從均值為10560(kg/cm2)的正態(tài)分布,現采用新工藝生產了一種新鋼絲,隨機抽取10根測得抗拉強度為: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670問在顯著性水平 = 0.05下,新鋼絲的平均抗拉強度比原鋼絲是否有顯著提高? 2021-10-3150案例案例 1 解答:解答:, 4 .10631xnSxt/0 說明新工藝對提高鋼絲繩的抗拉強度是有顯著效果的。 本案例為右邊檢驗問題,設新鋼絲的平均抗拉強度為

30、, 2 未知,故使用t 檢驗。由題意,H0: =0,H1: 0由所給樣本數據,可求得:S = 81,n =10, =0.05,t0.05(9)=1.8331 t =2.7875 故拒絕 H0,即在水平 =0.05下, 顯著高于 0。10/81105604 .106317875. 2 t(n-1) = t0.05(9) =1.83312021-10-3151在案例1中,若取 = 0.01,問結論如何?【解】 t0.01(9) = 2.8214, t =2.7875 F0.001(a-1, N-a),稱因素 A 的作用極高度顯著;若 F F0.01(a-1, N-a),稱因素 A 的作用高度顯著高

31、度顯著;若 F0.01 (a-1, N-a) F F0.05(a-1, N-a),稱因素 A 的作用一般一般顯著顯著;若 F F0.05(a-1, N-a),則認為因素 A 的作用不顯著不顯著。 單因素方差分析2021-10-3160某大型連鎖超市為研究各種促銷方式的效果,選擇下屬4個門店,分別采用不同促銷方式,對包裝食品各進行了4個月的試驗。試驗結果如下:超市管理部門希望了解:不同促銷方式對銷售量是否有顯著影響?哪種促銷方式的效果最好? 【案例【案例1】哪種促銷方式效果最好】哪種促銷方式效果最好?可用 Excel 的【工具】“數據分析”“方差分析:單因素方差分析”求解單因素方差分析問題。 案

32、例 1 的方差分析表 其中:P-value P 值,為檢驗中達到的顯著性水平,其含義與 t 檢驗中“P(T=t)單尾”相同。 F crit 在水平 (默認0.05)下拒絕域的臨界值 F。 P-value = 0.00014 0.001 故不同的促銷方式對商品銷售額有極高度顯著影響。 差異源SSdfMSFP-valueF crit組間7925.43 2641.8 16.628 0.000143.4903組內1906.512 158.87總計9831.915案例案例 1 分析分析2021-10-3162進一步的分析進一步的分析對各 i 的 t 檢驗結果如下( =0.05): 1 2 4 (廣告宣傳

33、) 1(有獎銷售) 2(買一送一) 4 * * (特價銷售) 3 * * * ,875.1011x95.1062x175.1583x775.1294x由 Excel 或 SPSS 軟件的運行輸出結果還可得:2021-10-3163無交互作用的雙因素方差分析無交互作用的雙因素方差分析在無交互作用的雙因素方差分析中,要檢驗的原假設有以下兩個: H01:1 = 2 = = a = 0 H02:1= 2 = = b = 0若拒絕 H01,說明因素 A 的作用顯著;若拒絕 H02,說明因素 B 的作用顯著。 2021-10-3164 無交互作用的雙因素方差分析表來源 平方和 自由度 均方和 F 比 A

34、SA a-1 SA /(a-1) B SB b-1 SB /(b-1) 誤差 Se (a-1)(b-1) Se /(a-1)(b-1) 總和 ST ab-1 ) 1)(1/() 1/(baSaSeA) 1)(1/() 1/(baSbSeB2021-10-3165 考慮交互作用時的雙因素試驗重點,一定要掌握H01:1= 2 = = a = 0H02:1= 2 = = b = 0H03:( )ij = 0;對一切 i, j2021-10-3166來源 平方和 自由度 均方和 F 比 A SA a-1 SA /(a-1) B SB b-1 SB /(b-1) AB SAB (a-1)(b-1) SA

35、B /(a-1)(b-1) 誤差 Se ab(n-1) Se /ab(n-1) 總和 ST abn-1 ) 1(/) 1/(nabSaSeA) 1(/) 1/(nabSbSeB) 1(/) 1)(1/(nabSbaSeBA2021-10-3167給出一個雙因子試驗如下方差分析表,填入缺失(以“?”表示)的結果,并說明因子A和B所具有的水平數,和每個水平組合下進行重復試驗的次數。并在的顯著性水平下,判斷因素A、B和交互效應的效應是否顯著。(已知F0.05(2,30)=3.32,F0.05(8,30)=2.27,F0.05(4,30)=2.69)2021-10-3168在某種金屬材料的生產過程中,

36、對熱處理溫度(B)與時間(A)各取兩個水平,對產品強度具有交互作用的方差分析部分結果如下(且設各水平搭配下強度的總體服從正態(tài)分布且方差相同)問處理溫度、時間以及這兩者的交互作用對產品強度是否有顯著的影響(alpha=0.05)2021-10-3170線性回歸線性回歸作用:分析兩個變量之間或多個變量之間的因果關系或相關關系基本假設:隨機誤差項與自變量項獨立對因變量進行解釋(因此可以對總的偏差平方和進行分解),隨機誤差獨立、正態(tài)同方差分布基本思想:最小二乘法及其原理2021-10-3171分別是參數 0 和 1 的最小方差無偏估計。 可以證明,, )(1)(2220 xxxNDi221)()(xx

37、Di10 和 以上兩式說明,的方差分別為:2.2.10 和10 和 在滿足經典假設的條件下1 1回歸系數的估計精度不僅與 2 及樣本容量 N 有關,而且與各 xi 取值的分散程度有關。 在給定樣本容量下,xi 的取值越分散,的取值越分散, 則估則估計的方差就越小計的方差就越小,反之估計的精確就差。0123450123456789101112= 0+ 1Xyx以三口之家為單位,某種食品在某年各月的家庭平均月消費量 Y (kg)與其價格 X (元/kg) 間的調查數據如下,試分析該食品家庭平均月消費量與價格間的關系。價格 xi 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6

38、 8.0 9.0 10 消費量 yi 3.0 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 2021-10-3173,5240. 3401.X.Y3405245240. 來源 平方和 自由度 均方和 F 比 Significance F 回歸 4.589 1 4.589 剩余 1.608 10 0.1608 28.54 0.00032 總和 6.197 11 “Significance F”為達到的顯著性水平,含義與 P-value 相同。 Significance F = 0.00032 0.001 故回歸方程是極高度顯著的。 方差分析表故所求回歸方

39、程為:說明該食品價格每上漲一元,0.34kg, kg 為該食品的最大月平均消費量。2021-10-3174ExcelExcel結果說明補充結果說明補充R Square 為判定系數修正判定系數標準誤差TRSSr總平方和回歸平方和2()/2ERTSSSN(2)ESN 111bSt2021-10-3175 需要繼續(xù)研究的問題需要繼續(xù)研究的問題 1. 以 90% 的可信度預測當價格為5.6元/kg時,該食品的家庭平均月消費量。 2. 該食品的生產商和供應商希望該食品的家庭月平均消費量能以 90% 的把握達到 2.5kg 以上, 應將價格控制在什么水平之下? 2021-10-3176)2( )()(11

40、 )2( 2202N/SxxxxNNtdEi/) (00dyd,y可以證明,0100 xy預測和控制預測和控制1. 1. 預測預測就是對解釋變量 X 的某一給定值 x0,求被解釋變量 Y 的取值 y0 的類似于區(qū)間估計問題。對任一給定的 x0,由回歸方程可得 y0 的回歸值(點估計): y0 的置信度為 1- 的預測區(qū)間為置信度為 1- 的預測區(qū)間,2021-10-3177關于預測的精度關于預測的精度xx)(00 xdy )(00 xdy 01xy00 xx0oy允許誤差 d 的公式說明,預測區(qū)間的大小(預測精度)不僅與 、樣本容量 N 及各 xi 取值的分散程度有關, 而且和 x0 有關。當

41、 x0 靠近時,d 就較小,反之,x0 離越遠,d 就越大。 d 是 x0 的函數 d = d(x0)。 2021-10-3178預測區(qū)間的近似計算預測區(qū)間的近似計算 當樣本容量 N 足夠大時,)( )()(11 )(222202N/SxxxxNNtdEi/ 222)()(N/SNE/td 22)(N/SZE/d或中方括號內的部分就近似于 1。 因此 d 可以使用以下近似公式計算:其中)2/(NSE 就是回歸方程的標準誤差標準誤差。 2021-10-3179由所得回歸方程 XY0.344.526 . 534. 052. 40y4007. 0)2/(NSE由 Excel 或 SPSS 的輸出結果,可解得當 x0=5.6 時,案例案例 1 的預測問題分析的預測問題分析62. 2可得標準誤差為dt0.05(10)0.4007 = 1.81250.4007 = 0.73 故當價格為 5.6/kg 時,該食品的家庭月平均消費量的 90% 置信預測區(qū)間為:) ,(00dydykg )35. 3 ,89

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論