版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
...wd......wd......wd...第一章導(dǎo)論1.1.1〔1〕數(shù)值型變量?!?〕分類變量。〔3〕離散型變量。〔4〕順序變量。〔5〕分類變量。1.2〔1〕總體是該市所有職工家庭的集合;樣本是抽中的2000個(gè)職工家庭的集合?!?〕參數(shù)是該市所有職工家庭的年人均收入;統(tǒng)計(jì)量是抽中的2000個(gè)職工家庭的年人均收入。1.3〔1〕總體是所有IT從業(yè)者的集合。〔2〕數(shù)值型變量?!?〕分類變量。〔4〕截面數(shù)據(jù)。1.4〔1〕總體是所有在網(wǎng)上購(gòu)物的消費(fèi)者的集合?!?〕分類變量。〔3〕參數(shù)是所有在網(wǎng)上購(gòu)物者的月平均花費(fèi)。〔4〕參數(shù)〔5〕推斷統(tǒng)計(jì)方法。第二章數(shù)據(jù)的搜集1.什么是二手資料使用二手資料需要注意些什么與研究?jī)?nèi)容有關(guān)的原始信息已經(jīng)存在,是由別人調(diào)查和實(shí)驗(yàn)得來(lái)的,并會(huì)被我們利用的資料稱為“二手資料〞。使用二手資料時(shí)需要注意:資料的原始搜集人、搜集資料的目的、搜集資料的途徑、搜集資料的時(shí)間,要注意數(shù)據(jù)的定義、含義、計(jì)算口徑和計(jì)算方法,防止錯(cuò)用、誤用、濫用。在引用二手資料時(shí),要注明數(shù)據(jù)來(lái)源。2.比較概率抽樣和非概率抽樣的特點(diǎn),舉例說(shuō)明什么情況下適合采用概率抽樣,什么情況下適合采用非概率抽樣。概率抽樣是指抽樣時(shí)按一定概率以隨機(jī)原那么抽取樣本。每個(gè)單位被抽中的概率或可以計(jì)算,當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)展估計(jì)時(shí),要考慮到每個(gè)單位樣本被抽中的概率,概率抽樣的技術(shù)含量和成本都比較高。如果調(diào)查的目的在于掌握和研究總體的數(shù)量特征,得到總體參數(shù)的置信區(qū)間,就使用概率抽樣。非概率抽樣是指抽取樣本時(shí)不是依據(jù)隨機(jī)原那么,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體中抽出局部單位對(duì)其實(shí)施調(diào)查。非概率抽樣操作簡(jiǎn)單、實(shí)效快、成本低,而且對(duì)于抽樣中的專業(yè)技術(shù)要求不是很高。它適合探索性的研究,調(diào)查結(jié)果用于發(fā)現(xiàn)問題,為更深入的數(shù)量分析提供準(zhǔn)備。非概率抽樣也適合市場(chǎng)調(diào)查中的概念測(cè)試。3.調(diào)查中搜集數(shù)據(jù)的方法主要有自填式、面方式、式,除此之外,還有那些搜集數(shù)據(jù)的方法實(shí)驗(yàn)式、觀察式等。4.自填式、面方式、式調(diào)查個(gè)有什么利弊自填式優(yōu)點(diǎn):調(diào)查組織者管理容易,成本低,可以進(jìn)展較大規(guī)模調(diào)查,對(duì)被調(diào)查者可以刻選擇方便時(shí)間答卷,減少答復(fù)敏感問題的壓力。缺點(diǎn):返回率低,調(diào)查時(shí)間長(zhǎng),在數(shù)據(jù)搜集過(guò)程中遇到問題不能及時(shí)調(diào)整。面談式優(yōu)點(diǎn):答復(fù)率高,數(shù)據(jù)質(zhì)量高,在數(shù)據(jù)搜集過(guò)程中遇到問題可以及時(shí)調(diào)整可以充分發(fā)揮調(diào)查員的作用。缺點(diǎn):成本比較高,對(duì)調(diào)查過(guò)程的質(zhì)量控制有一定難度。對(duì)于敏感問題,被訪者會(huì)有壓力。式優(yōu)點(diǎn):速度快,對(duì)調(diào)查員比較安全,對(duì)訪問過(guò)程的控制比較容易,缺點(diǎn):實(shí)施地區(qū)有限,調(diào)查時(shí)間不宜過(guò)長(zhǎng),問卷要簡(jiǎn)單,被訪者不愿答復(fù)時(shí),不宜勸服。5.請(qǐng)舉出〔或設(shè)計(jì)〕幾個(gè)實(shí)驗(yàn)數(shù)據(jù)的例子。不同飼料對(duì)牲畜增重有無(wú)影響,新舊技術(shù)的機(jī)器對(duì)組裝同一產(chǎn)品所需時(shí)間的影響。6.你認(rèn)為應(yīng)當(dāng)如何控制調(diào)查中的答復(fù)誤差對(duì)于理解誤差,要注意表述中的措辭,學(xué)習(xí)一定的心里學(xué)知識(shí)。對(duì)于記憶誤差,盡量縮短所涉及問題的時(shí)間范圍。對(duì)于有意識(shí)誤差,調(diào)查人員要想法消除被調(diào)查者得思想顧慮,調(diào)查人員要遵守職業(yè)道德,為被調(diào)查者保密,盡量防止敏感問題。7.怎樣減少無(wú)答復(fù)請(qǐng)通過(guò)一個(gè)例子,說(shuō)明你所考慮到的減少無(wú)答復(fù)的具體措施。對(duì)于隨機(jī)誤差,可以通過(guò)增加樣本容量來(lái)控制。對(duì)于系統(tǒng)誤差,做好預(yù)防,在調(diào)查前做好各方面的準(zhǔn)備工作,盡量把無(wú)答復(fù)率降到最低程度。無(wú)答復(fù)出現(xiàn)后,分析武答復(fù)產(chǎn)生的原因,采取補(bǔ)救措施。比方要收回一百份,就要做好一百二十份或一百三十份問卷的準(zhǔn)備,當(dāng)被調(diào)查者不愿意答復(fù)時(shí),可以通過(guò)一定的方法勸服被訪者,還可以通過(guò)饋贈(zèng)小禮品等的方式提高回收率。第三章數(shù)據(jù)的圖表搜集一、思考題3.1數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容答:審核、篩選、排序等。3.2分類數(shù)據(jù)和順序數(shù)據(jù)的整理和顯示方法各有哪些答:分類數(shù)據(jù)在整理時(shí)候先列出所分的類別,計(jì)算各組的頻數(shù)、頻率,得到頻數(shù)分布表,如果是兩個(gè)或兩個(gè)以上變量可以制作穿插表。對(duì)于分類數(shù)據(jù)可以繪制條形圖、帕累托圖、餅圖、環(huán)形圖等。根據(jù)不同的資料或者目的選擇不同的圖。對(duì)于順序數(shù)據(jù),可以計(jì)算各種的頻數(shù)、頻率,以及累計(jì)頻數(shù)、累計(jì)頻率。可根據(jù)需要繪制條形圖、餅圖、環(huán)形圖等。3.3數(shù)值型數(shù)據(jù)的分組方法有哪些簡(jiǎn)述組距分組的步驟。答:?jiǎn)巫兞恐捣纸M和組距分組。其中組距分組:第一步,確定組數(shù),組數(shù)多少由數(shù)據(jù)的多少和特點(diǎn)等決定,一般5~15組;第二步,確定各組組距,宜取5或10的倍數(shù);第三步,根據(jù)分組整理出頻數(shù)分布表,注意遵循“不重不漏〞和“上限不在內(nèi)〞的原那么。3.4直方圖和條形圖有何區(qū)別答:1,條形圖使用圖形的長(zhǎng)度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距,高度與寬度都有意義;2直方圖各矩形連續(xù)排列,條形圖分開排列;3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。3.5繪制線圖應(yīng)注意問題答:時(shí)間在橫軸,觀測(cè)值繪在縱軸。一般是長(zhǎng)寬比例10:7的長(zhǎng)方形,縱軸下端一般從0開場(chǎng),數(shù)據(jù)與0距離過(guò)大的話用折斷符號(hào)折斷。3.6餅圖和環(huán)形圖的不同答:餅圖只能顯示一個(gè)樣本或總體各局部所占比例,環(huán)形圖可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,其圖形中間有個(gè)“空洞〞,每個(gè)樣本或總體的數(shù)據(jù)系類為一個(gè)環(huán)。3.7莖葉圖比直方圖的優(yōu)勢(shì),他們各自的應(yīng)用場(chǎng)合答:莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個(gè)原始數(shù)據(jù),即保存了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。3.8鑒別圖標(biāo)優(yōu)劣的準(zhǔn)那么答:P65明確有答案,我就不寫了。3.9制作統(tǒng)計(jì)表應(yīng)注意的問題答:1,合理安排統(tǒng)計(jì)表構(gòu)造;2表頭一般包括表號(hào),總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容;3表中的上下兩條橫線一般用粗線,中間的其他用細(xì)線,兩端開口,數(shù)字右對(duì)齊,不要有空白格;4在使用統(tǒng)計(jì)表時(shí),必要時(shí)可在下方加注釋,注明數(shù)據(jù)來(lái)源。二、練習(xí)題3.1答:〔1〕表中數(shù)據(jù)屬于順序數(shù)據(jù)。(2)用Excel制作一張頻數(shù)分布表。服務(wù)等級(jí)家庭數(shù)目〔個(gè)〕好14較好21一般32較差18差15(3)繪制一張條形圖,反映評(píng)價(jià)等級(jí)的分布。(4)繪制評(píng)價(jià)等級(jí)的帕累托圖。3.2某行業(yè)管理局所屬40個(gè)企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根據(jù)上面的數(shù)據(jù)進(jìn)展適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并計(jì)算出累積頻數(shù)和累積頻率。1、確定組數(shù):,取k=62、確定組距:組距=(最大值-最小值)÷組數(shù)=〔152-87〕÷6=10.83,取103、分組頻數(shù)表銷售收入頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%80–90252590–10037.5512.5100-110922.51435110–12012302665120–130717.53382.5130–1404103792.5140–15025.03997.5150以上12.540100合計(jì)40100.0——(2)按規(guī)定,銷售收入在125萬(wàn)元以上為先進(jìn)企業(yè),115~125萬(wàn)元為良好企業(yè),105~115萬(wàn)元為一般企業(yè),105萬(wàn)元以下為落后企業(yè),按先進(jìn)企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進(jìn)展分組。頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%先進(jìn)企業(yè)10251025良好企業(yè)12302255一般企業(yè)922.53177.5落后企業(yè)922.540100合計(jì)40100——3.3某百貨公司連續(xù)40天的商品銷售額如下:?jiǎn)挝唬喝f(wàn)元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根據(jù)上面的數(shù)據(jù)進(jìn)展適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。答:1、確定組數(shù):,取k=62、確定組距:組距=(最大值-最小值)÷組數(shù)=〔49-25〕÷6=4,取53、分組頻數(shù)表〔根據(jù)實(shí)際資料,調(diào)整成分5個(gè)組〕銷售收入〔萬(wàn)元〕頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%30以下41041030-35615102535-401537.52562.540-45922.5348545以上61540100合計(jì)40100.0——4、直方圖3.4利用下面的數(shù)據(jù)構(gòu)建莖葉圖和箱線圖。572929363123472328283551391846182650293321464152282143194220答:莖葉圖FrequencyStem&Leaf3.001.8895.002.011337.002.68889992.003.133.003.5693.004.1233.004.6673.005.0121.005.7箱線圖3.5答:頻數(shù)分布表燈泡壽命頻率向上累積頻率〔%〕660以下22%660-67057%670-680613%680-6901427%690-7002653%700-7101871%710-7201384%720-7301094%730-740397%740以上3100%合計(jì)100—直方圖從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.6答:頻數(shù)分布表,取k=72、確定組距:組距=(最大值-最小值)÷組數(shù)=〔61-40〕÷7=3,取33、分組頻數(shù)表〔根據(jù)實(shí)際資料,調(diào)整成分5個(gè)組〕食品重量〔g〕頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%43以下334343-4699121246-492424363649-521919555552-552424797955-581414939358以上77100100合計(jì)100100.0——從直方圖看,數(shù)據(jù)的分布呈雙峰分布。3.7頻數(shù)分布表重量誤差〔g〕頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%19-2951051029-39714122439-49816204049-591326336659-69918428469-79612489679-892450100合計(jì)50100——獲取完整版答案,請(qǐng)翻開微信掃一掃下方二維碼,關(guān)注微信公眾號(hào):幫幫ING如果無(wú)法掃碼關(guān)注,請(qǐng)按照下方提示操作:從直方圖看,數(shù)據(jù)的分布呈左偏分布3.8〔1〕數(shù)值型數(shù)據(jù)〔2〕頻數(shù)分布表,取k=72、確定組距:組距=(最大值-最小值)÷組數(shù)=〔9+25〕÷7=4.86,取5氣溫〔℃〕頻數(shù)頻率%向上累計(jì)頻數(shù)向上累計(jì)頻率%〔-25,-20〕610.00610.00〔-20,-15〕813.331423.33〔-15,-10〕1016.672440.00〔-10.-5〕1321.673761.67〔-5.0〕1220.004981.67〔0,5〕46.675388.33〔5,10〕711.6760100.00合計(jì)60100——從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.9自學(xué)考試人員年齡分布集中在20-24之間,分布圖呈右偏。3.103.113.12〔1〕復(fù)式條形圖〔2〕甲班成績(jī)分布圖近似正態(tài)分布,分布較均衡;乙班成績(jī)分布圖右偏?!?〕根據(jù)雷達(dá)圖,兩班成績(jī)分布不相似。3.133.14第四章習(xí)題答案4.1數(shù)據(jù)排列:2,4,7,10,10,10,12,12,14,15〔1〕眾數(shù):10;中位數(shù):10平均數(shù):9.6〔2〕四分位數(shù):Q位置==2.5.所以Q==5.5Q位置==7.5,所以Q==13〔3〕標(biāo)準(zhǔn)差:4.17〔4〕峰度—0.25,偏度—0.694.2〔1〕眾數(shù):19;23中位數(shù):23平均數(shù):24〔2〕四分位數(shù):Q位置==6.25.所以Q=19+0.25^0=19Q位置==18.75,所以Q=25+2^0.75=26.5〔3〕標(biāo)準(zhǔn)差:6.65〔4〕峰度0.77,偏度1.084.3(1)莖葉圖略(2)平均數(shù):7,標(biāo)準(zhǔn)差0.71〔3〕第一種方式的離散系數(shù)==0.28第二種方式的離散系數(shù)==0.10所以,第二種排隊(duì)方式等待時(shí)間更集中?!?〕選擇第二種,因?yàn)槠骄却臅r(shí)間短,而且等待時(shí)間的集中程度高4.4〔1〕平均數(shù):274.1,中位數(shù):272.5〔2〕Q位置==7.5.所以Q=258+0.25^3=258.75Q位置==22.5,所以Q=284+7^0.75=289.25〔3〕日銷售額的標(biāo)準(zhǔn)差:21.174.5.產(chǎn)品名稱單位成本〔元〕總成本/元產(chǎn)量甲企業(yè)乙企業(yè)甲企業(yè)乙企業(yè)A1521003255140217B203000150015075C30150015005050合計(jì)——66006255340342甲企業(yè)總平均成本==19.41〔元〕乙企業(yè)總平均成本=所以甲企業(yè)的總平均成本比乙企業(yè)的高,原因是甲企業(yè)高成本的產(chǎn)品B生產(chǎn)的產(chǎn)量比乙企業(yè)多,所以把總平均成本提高了。4.6計(jì)算數(shù)據(jù)如表:按利潤(rùn)額分組〔萬(wàn)元〕組中值企業(yè)數(shù)〔個(gè)〕利潤(rùn)額200~300250194750593033300~4003503010500176349400~500450421890022860500~600550189900273785600以上650117150548639合計(jì)-120512001614666利潤(rùn)總額的平均數(shù)=利潤(rùn)總額標(biāo)準(zhǔn)差=峰態(tài)系數(shù)偏態(tài)系數(shù)=4.7〔1〕不同。1000名的平均身高較高;〔2〕不同。100名的樣本容量的標(biāo)準(zhǔn)差更大;〔3〕不同,調(diào)查1000名的樣本容量得到最高和最低者的時(shí)機(jī)較大。4.8對(duì)于不同的總體的差異程度的比較采用標(biāo)準(zhǔn)差系數(shù),計(jì)算如下:;〔1〕女生的體重差異大,因?yàn)殡x散系數(shù)大;〔2〕以磅為單位,男生的平均體重為132.6磅,標(biāo)準(zhǔn)差為11.05磅;女生的平均體重為110.5磅,標(biāo)準(zhǔn)差為11.05磅〔3〕,所以大約有68%的人體重在55kg~65kg之間;〔4〕,所以大約有95%的女生體重在40kg~60kg之間。4.9;;由此可以判斷第二項(xiàng)測(cè)試更理想。4.10時(shí)間周一周二周三周四周五周六周日產(chǎn)量3850367036903720361035903700z值30.60.20.41.82.20可以看出,周一和周六兩天生產(chǎn)線失去了控制。4.11〔1〕采用離散系數(shù),因?yàn)槿绻容^身高差異,兒童和成年人屬于不同的總體;〔2〕,所以,兒童的身高差異更大。4.12〔1〕對(duì)集中程度和離散程度分別評(píng)價(jià),選擇集中趨勢(shì)數(shù)值大的,而且離散程度數(shù)值小的方式〔2〕選擇方法A,因?yàn)锳方法下,工人的平均組裝數(shù)量為165.6,而且該方法下,工人組裝數(shù)量的離散系數(shù)只有0.012,所以選擇A方法。4.13〔1〕用離散系數(shù)〔2〕商業(yè)類〔3〕高科技第六章統(tǒng)計(jì)量與抽樣分布由樣本構(gòu)建具體的統(tǒng)計(jì)量,實(shí)際上是對(duì)樣本所含的總體信息按某種要求進(jìn)展加工處理,把分散在樣本中的信息集中到統(tǒng)計(jì)量的取值上,不同的統(tǒng)計(jì)推斷問題要求構(gòu)造不同的統(tǒng)計(jì)量。構(gòu)造統(tǒng)計(jì)量的主要目的就是對(duì)總體的未知參數(shù)進(jìn)展推斷,如果統(tǒng)計(jì)量中含有總體的未知參數(shù)就沒方法再對(duì)參數(shù)進(jìn)展統(tǒng)計(jì)推斷。2、是統(tǒng)計(jì)量,在不是統(tǒng)計(jì)量。4、假假設(shè)一個(gè)統(tǒng)計(jì)量能把含在樣本中有關(guān)總體的信息一點(diǎn)都不損失地提取出來(lái),這樣的統(tǒng)計(jì)量稱充分統(tǒng)計(jì)量。5、統(tǒng)計(jì)學(xué)上的自由度指當(dāng)以樣本的統(tǒng)計(jì)量來(lái)估計(jì)總體的參數(shù)時(shí),樣本中獨(dú)立或能自由變化的資料的個(gè)數(shù)。6、7、在重復(fù)選取容量為n的樣本時(shí),由樣本統(tǒng)計(jì)量的所有取值形成的相對(duì)頻數(shù)分布為統(tǒng)計(jì)量的抽樣分布。二、練習(xí)1、易知由這臺(tái)機(jī)器灌裝的9個(gè)瓶子形成的樣本,其平均灌裝量服從正態(tài)分布,均值為標(biāo)準(zhǔn)差為,故2、假設(shè),那么,即,又知,故。3、易知服從自由度為6的卡方分布,得〔左側(cè)分位數(shù)〕4、因?yàn)榉姆植?,我們,故服?〕分布,,我們假設(shè)取,那么可以得到,,故?!差}中均為左側(cè)分位數(shù)〕第七章參數(shù)估計(jì)7.1〔1〕〔2〕由于1-α=95%α=5%所以估計(jì)誤差7.2〔1〕〔2〕因?yàn)樗浴?〕μ的置信區(qū)間為7.3由于n=100所以μ的95%置信區(qū)間為7.4〔1〕μ的90%置信區(qū)間為〔2〕μ的95%置信區(qū)間為〔3〕μ的99%置信區(qū)間為7.5〔1〕〔2〕〔3〕7.6〔1〕〔2〕〔3〕〔4〕7.790%置信區(qū)間為95%置信區(qū)間為99%置信區(qū)間為7.8所以95%置信區(qū)間為7.9由于所以95%置信區(qū)間為7.10〔1〕〔2〕中心極限定理7.11〔1〕〔2〕由于所以合格率的95%置信區(qū)間為7.12由于所以99%置信區(qū)間為7.13所以90%置信區(qū)間為7.14〔1〕〔2〕〔3〕7.15〔1〕90%置信區(qū)間為〔2〕95%置信區(qū)間為7.16所以n為1667.17〔1〕所以n為254〔2〕所以n為151〔3〕所以n為2687.18〔1〕〔2〕所以n為627.19〔1〕所以〔2〕〔3〕7.20〔1〕〔2〕7.21=〔1〕的90%置信區(qū)間為:==〔2〕的95%置信區(qū)間為:==〔3〕的99%置信區(qū)間為:=7.22〔1〕==〔2〕==18==〔3〕=17.78==〔4〕=18.714==〔5〕=20.05==7.23〔1〕==〔2〕=7.24,的置信區(qū)間為:==7.25〔1〕==〔2〕==7.26==2.464=0.405767.27==47.06所以n=487.28==138.30所以n=139第8章假設(shè)檢驗(yàn)二、練習(xí)題〔說(shuō)明:為了便于查找書后正態(tài)分布表,本答案中,正態(tài)分布的分位點(diǎn)均采用了下側(cè)分位點(diǎn)。其他分位點(diǎn)也可。為了便于查找書后t分布表方便,本答案中,正態(tài)分布的分位點(diǎn)均采用了上側(cè)分位點(diǎn)?!?.1解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。:總體方差當(dāng),查表得。拒絕域W={}因?yàn)椋圆荒芫芙^H0,認(rèn)為現(xiàn)在生產(chǎn)的鐵水平均含碳量為4.55?!沧ⅲ簽檎龖B(tài)分布的1-α/2下側(cè)分位點(diǎn)〕8.2解:根據(jù)題意,這是左單側(cè)檢驗(yàn)問題。:總體方差當(dāng),查表得。拒絕域W={}因?yàn)?,所以拒絕H0,認(rèn)為該元件的使用壽命低于700小時(shí)?!沧ⅲ簽檎龖B(tài)分布的1-α下側(cè)分位點(diǎn)〕8.3解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。:總體方差當(dāng),查表得。拒絕域W={}因?yàn)?,所以拒絕H0,認(rèn)為這種化肥能使小麥明顯增產(chǎn)?!沧ⅲ簽檎龖B(tài)分布的1-α下側(cè)分位點(diǎn)〕8.4解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。方差未知。:總體根據(jù)樣本計(jì)算得:當(dāng),查表得。拒絕域W={}因?yàn)?,所以不能拒絕H0,認(rèn)為該日打包機(jī)工作正常?!沧ⅲ簽閠分布的α/2上側(cè)分位點(diǎn)〕8.5解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。:當(dāng),查表得。拒絕域W={}因?yàn)椋跃芙^H0,認(rèn)為不符合標(biāo)準(zhǔn)的比例超過(guò)5%,該批食品不能出廠。〔注:為正態(tài)分布的1-α下側(cè)分位點(diǎn)〕8.6解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。:當(dāng),查表得。拒絕域W={}因?yàn)?,所以不能拒絕H0,認(rèn)為該廠家的廣告不真實(shí)?!沧ⅲ簽閠分布的α上側(cè)分位點(diǎn)〕8.7解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。:當(dāng),查表得。拒絕域W={}因?yàn)?,所以不能拒絕H0,認(rèn)為元件的平均壽命不大于225小時(shí)?!沧ⅲ簽閠分布的α上側(cè)分位點(diǎn)〕8.8解:根據(jù)題意,這是右側(cè)檢驗(yàn)問題。:當(dāng),查表得。拒絕域W={}因?yàn)?,所以拒絕H0,認(rèn)為成立。〔注:為-分布的α上側(cè)分位點(diǎn)〕8.9解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。:總體方差當(dāng),查表得。拒絕域W={}因?yàn)?,所以拒絕H0,可以認(rèn)為A,B兩廠生產(chǎn)的材料平均抗壓強(qiáng)度不一樣?!沧ⅲ簽檎龖B(tài)分布的1-α/2下側(cè)分位點(diǎn)〕8.10解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。:總體方差,但未知2.3579當(dāng),查表得。拒絕域W={}因?yàn)?,所以拒絕H0,認(rèn)為兩種方法的裝配時(shí)間有顯著差異?!沧ⅲ簽閠分布的α上側(cè)分位點(diǎn)〕8.11解:根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。:在大樣本條件下當(dāng),查表得。拒絕域W={}因?yàn)?,所以拒絕H0,認(rèn)為調(diào)查數(shù)據(jù)支持“吸煙者容易患慢性氣管炎〞這種觀點(diǎn)。〔注:為正態(tài)分布的1-α/2下側(cè)分位點(diǎn)〕8.12解:根據(jù)題意,這是右單側(cè)檢驗(yàn)問題?!?〕等同于〔2〕:在n=144情況下,〔2〕中的H0成立時(shí),t近似服從標(biāo)準(zhǔn)正態(tài)分布。因此P=P(t>2.16)=1-0.9846=0.0154。所以在α=0.01的顯著水平,不能拒絕H0,認(rèn)為貸款的平均規(guī)模沒有明顯超過(guò)60萬(wàn)元。8.13解:根據(jù)題意,這是左單側(cè)檢驗(yàn)問題。:在大樣本條件下當(dāng),查表得。拒絕域W={}因?yàn)椋跃芙^H0,認(rèn)為阿司匹林可以降低心臟病發(fā)生率?!沧ⅲ簽檎龖B(tài)分布的1-α下側(cè)分位點(diǎn)〕8.14解:〔1〕根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。:當(dāng),利用EXCEL提供的統(tǒng)計(jì)函數(shù)“CHIINV〞,得。拒絕域W={}因?yàn)?,所以不能拒絕H0,認(rèn)為成立?!沧ⅲ簽?分布的α上側(cè)分位點(diǎn)〕〔2〕根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。:總體方差當(dāng),查表得。拒絕域W={}因?yàn)?,所以不能拒絕H0,認(rèn)為螺栓口徑為7.0cm?!沧ⅲ簽檎龖B(tài)分布的1-α/2下側(cè)分位點(diǎn)〕因此,由〔1〕和〔2〕可得:這批螺栓到達(dá)了規(guī)定的要求。8.15〔1〕根據(jù)題意,這是雙側(cè)檢驗(yàn)問題。:當(dāng),利用EXCEL提供的統(tǒng)計(jì)函數(shù)“FINV〞,得。拒絕域W={}因?yàn)?,所以不能拒絕H0,認(rèn)為成立。〔注:為F-分布的α/2上側(cè)分位點(diǎn)〕〔2〕根據(jù)題意,這是右單側(cè)檢驗(yàn)問題。由〔1〕的分析可知:總體方差,但未知當(dāng),查表得。拒絕域W={}因?yàn)?,所以拒絕H0,認(rèn)為有顯著大學(xué)中男生學(xué)習(xí)成績(jī)比女生好?!沧ⅲ簽閠分布的α上側(cè)分位點(diǎn)〕第十章方差分析一、思考題10.1什么是方差分析它研究的是什么答:方差分析就是通過(guò)檢驗(yàn)各總體的均值是否相等來(lái)判斷分類型自變量對(duì)數(shù)值型因變量是否有顯著影響。它所研究的是分類型自變量對(duì)數(shù)值型因變量的影響。10.2要檢驗(yàn)多個(gè)總體均值是否相等時(shí),為什么不作兩兩比較,而用方差分析方法答:做兩兩比較十分繁瑣,進(jìn)展檢驗(yàn)的次數(shù)較多,會(huì)使得犯第I類錯(cuò)誤的概率相應(yīng)增加,而且隨著增加個(gè)體顯著性檢驗(yàn)的次數(shù),偶然因素導(dǎo)致差異的可能性也會(huì)增加。而方差分析方法是同時(shí)考慮所有的樣本,因此排除了錯(cuò)誤累積的概率,從而防止一個(gè)真實(shí)的原假設(shè)。10.3方差分析包括哪些類型它們有何區(qū)別答:方差分析可分為單因素方差分析和雙因素方差分析。區(qū)別:?jiǎn)我蛩胤讲罘治鲅芯康氖且粋€(gè)分類自變量對(duì)一個(gè)數(shù)值型因變量的影響,而雙因素涉及兩個(gè)分類型自變量。10.4方差分析中有哪些基本假定答:〔1〕每個(gè)總體都應(yīng)服從正態(tài)分布〔2〕各個(gè)總體的方差σ2〔3〕觀測(cè)值是獨(dú)立的10.5簡(jiǎn)述方差分析的基本思想答:它是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析來(lái)判斷不同總體的均值是否相等,進(jìn)而分析自變量對(duì)因變量是否有顯著影響。10.6解釋因子和處理的含義答:在方差分析中,所要檢驗(yàn)的對(duì)象稱為因素或因子,因素的不同表現(xiàn)稱為水平或處理。10.7解釋組內(nèi)誤差和組間誤差的含義答:組內(nèi)平均值誤差的誤差〔SSE〕是指每個(gè)水平或組的各個(gè)樣本數(shù)據(jù)與其組平均值誤差平方和,反映了每個(gè)樣本個(gè)觀測(cè)值的離散狀況;組間誤差〔SSA〕是指各組平均值與總平均值的誤差平方和,反映了各樣本均值之間的差異程度。10.8解釋組內(nèi)方差和組間方差的含義答:組內(nèi)方差指因素的同一個(gè)水平下樣本數(shù)據(jù)的方差;組間方差指因素的不同水平下各個(gè)樣本之間的方差。10.9簡(jiǎn)述方差分析的基本步驟答:〔1〕提出假設(shè)〔2〕構(gòu)造檢驗(yàn)統(tǒng)計(jì)量〔3〕統(tǒng)計(jì)決策10.10方差分析中多重比較的作用是什么答:通過(guò)對(duì)總體均值之間的配比照擬來(lái)進(jìn)一步檢驗(yàn)?zāi)男┚抵g存在差異。二、練習(xí)題10.1解:方差分析差異源SSdfMSFP-value組間618.91672309.45834.65740.04087724組內(nèi)598966.44444總計(jì)1216.91711一樣10.2解:方差分析差異源SSdfMSFP-value組間93.76812423.4420315.823371.02431E-05組內(nèi)26.66667181.481481總計(jì)120.434822不一樣10.3解:ANOVA每桶容量〔L〕平方和df均方F顯著性組間0.00730.0028.7210.001組內(nèi)0.004150.000總數(shù)0.01118不一樣。10.4解:方差分析差異源SSdfMSFP-value組間29.60952214.8047611.755730.000849組內(nèi)18.89048151.259365總計(jì)48.517有顯著性差異。10.5解:方差分析差異源SSdfMSFP-value組間615.62307.817.068390.00031組內(nèi)216.41218.03333總計(jì)83214有顯著差異。LSD檢驗(yàn):計(jì)算得,,,有因?yàn)?,那么決策:〔1〕,所以A生產(chǎn)企業(yè)生產(chǎn)的電池與B生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;〔2〕,所以不能認(rèn)為A生產(chǎn)企業(yè)生產(chǎn)的電池與C生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;〔3〕,所以B生產(chǎn)企業(yè)生產(chǎn)的電池與C生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異。10.6解:方差分析差異源SSdfMSFP-value組間5.34915622.6745788.2745180.001962組內(nèi)7.434306230.323231總計(jì)12.7834625有顯著性差異10.7〔1〕方差分析表差異源SSDfMSFP-valueFcrit組間42022101.478102190.2459463.354131組內(nèi)383627142.0740741———總計(jì)425629————〔2〕假設(shè)顯著性水平a=0.05,檢驗(yàn)三種方法組裝的產(chǎn)品數(shù)量之間是否有顯著差異?P=0.025>a=0.05,沒有顯著差異。10.8解:方差分析差異源SSdfMSFP-valueFcrit行1.54933340.38733321.719630.0002367.006077列3.48421.74297.682242.39E-068.649111誤差0.14266780.017833總計(jì)5.17614〔1〕或p=0.000236<,所以不同車速對(duì)磨損程度有顯著性差異;〔2〕或p=2.39E-06<,所以不同供應(yīng)商生產(chǎn)的輪胎的磨損程度有顯著性差異。10.9解:方差分析差異源SSdfMSFP-valueFcrit行19.06744.766757.2397160.0033153.259167列18.181536.06059.2046580.0019493.490295誤差7.901120.658417總計(jì)45.149519結(jié)果說(shuō)明施肥方法和品種都對(duì)收獲量有顯著影響。10.10解:方差分析差異源SSdfMSFP-valueFcrit行22.22222211.111110.0727270.9310566.944272列955.55562477.77783.1272730.1521556.944272誤差611.11114152.7778總計(jì)1588.8898〔1〕或p=0.931056>,所以不同銷售地區(qū)對(duì)食品的銷售量無(wú)顯著性差異;〔2〕或p=0.152>,所以不同包裝對(duì)食品的銷售量無(wú)顯著性差異。10.11解:方差分析差異源SSdfMSFP-valueFcrit樣本1752287648.666675.49E-086.012905列798239922.166671.4E-056.012905交互182.6667445.666672.5370370.0759024.579036內(nèi)部3241818總計(jì)3056.66726競(jìng)爭(zhēng)者的數(shù)量對(duì)銷售額有顯著影響超市位置對(duì)銷售額有顯著影響無(wú)交互作用10.12解:方差分析差異源SSdfMSFP-valueFcrit樣本344217210.750.0103865.143253列4814830.1339755.987378交互562281.750.2519325.143253內(nèi)部96616總計(jì)54411廣告方案對(duì)銷售量有顯著影響廣告媒體形式對(duì)銷售量無(wú)顯著影響無(wú)交互作用第11章一元線性回歸一、思考題11.1.變量之間存在的互相依存的不確定的數(shù)量關(guān)系,稱為相關(guān)關(guān)系。相關(guān)關(guān)系的特點(diǎn):⑴變量之間確實(shí)存在著數(shù)量上的依存關(guān)系;⑵變量之間數(shù)量上的關(guān)系是不確定、不嚴(yán)格的依存關(guān)系。11.2.相關(guān)分析通過(guò)對(duì)兩個(gè)變量之間的線性關(guān)系的描述與度量,主要解決的問題包括:⑴變量之間是否存在關(guān)系⑵如果存在關(guān)系,它們之間是什么樣的關(guān)系⑶變量之間的關(guān)系強(qiáng)度如何⑷樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系11.3.在進(jìn)展相關(guān)分析時(shí),對(duì)總體主要有以下兩個(gè)假定:⑴兩個(gè)變量之間是線性關(guān)系;⑵兩個(gè)變量都是隨機(jī)變量。11.4.相關(guān)系數(shù)的性質(zhì):⑴r的取值范圍是[-1,1],r為正表示正相關(guān),r為負(fù)表示負(fù)相關(guān),r絕對(duì)值的大小表示相關(guān)程度的上下;⑵對(duì)稱性:X與Y的相關(guān)系數(shù)和Y與X之間的相關(guān)系數(shù)相等;⑶相關(guān)系數(shù)與原點(diǎn)和尺度無(wú)關(guān);⑷相關(guān)系數(shù)是線性關(guān)聯(lián)或線性相依的一個(gè)度量,它不能用于描述非線性關(guān)系;⑸相關(guān)系數(shù)只是兩個(gè)變量之間線性關(guān)聯(lián)的一個(gè)度量,卻不一定意味兩個(gè)變量之間有因果關(guān)系;⑹假設(shè)X與Y統(tǒng)計(jì)上獨(dú)立,那么它們之間的相關(guān)系數(shù)為零;但r=0不等于說(shuō)兩個(gè)變量是獨(dú)立的。即零相關(guān)并不一定意味著獨(dú)立性。11.5.在實(shí)際的客觀現(xiàn)象分析研究中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計(jì)算的,因而帶有一定的隨機(jī)性。樣本容量越小,其可信程度就越差,抽取的樣本不同,r的取值也會(huì)不同,因此r是一個(gè)隨機(jī)變量。能否用樣本相關(guān)系數(shù)來(lái)反映總體的相關(guān)程度,需要考察樣本相關(guān)系數(shù)的可靠性,因此要進(jìn)展顯著性檢驗(yàn)。11.6.相關(guān)系數(shù)顯著性檢驗(yàn)的步驟:⑴提出假設(shè);⑵計(jì)算檢驗(yàn)統(tǒng)計(jì)量t值;⑶在給定的顯著性水平和自由度,查t分布表中相應(yīng)的臨界值,作出決策。11.7.回歸模型是對(duì)統(tǒng)計(jì)關(guān)系進(jìn)展定量描述的一種數(shù)學(xué)模型,例如:對(duì)于具有線性關(guān)系的兩個(gè)變量,可以有一元線性方程來(lái)描述它們之間的關(guān)系,描述因變量y如何依賴自變量x和誤差項(xiàng)的方程稱為回歸模型?;貧w方程是對(duì)變量之間統(tǒng)計(jì)關(guān)系進(jìn)展定量描述的一種數(shù)學(xué)表達(dá)式。指具有相關(guān)的隨機(jī)變量和固定變量之間關(guān)系的方程。當(dāng)總體回歸系數(shù)未知時(shí),必須用樣本數(shù)據(jù)去估計(jì),用樣本統(tǒng)計(jì)量代替回歸方程中的未知參數(shù),就得到了估計(jì)的回歸方程。11.8.一元線性回歸模型通常有以下幾條基本的假定:⑴變量之間存在線性關(guān)系;⑵在重復(fù)抽樣中,自變量x的取值是固定的;⑶誤差項(xiàng)ε是一個(gè)期望為零的隨機(jī)變量;⑷)對(duì)于所有的x值,誤差項(xiàng)的方差都一樣;⑸誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即。11.9.參數(shù)最小二乘法的基本原理是:因變量的觀測(cè)值與估計(jì)值之間的離差平方和最小。11.10.總平方和指n次觀測(cè)值的的離差平方和,衡量的是被解釋變量y波動(dòng)的程度或不確定性的程度?;貧w平方和反映y的總變差中由于x與y之間的線性關(guān)系引起的y的變化局部,這是可以由回歸直線來(lái)解釋的局部,衡量的是被解釋變量y不確定性程度中能被解釋變量x解釋的局部。殘差平方和是除了x對(duì)y的線性影響之外的其他因素引起的y的變化局部,是不能由回歸直線來(lái)解釋的局部。它們之間的關(guān)系是:總平方和=回歸平方和+殘差平方和。11.11.回歸平方和占總平方和的比例稱為判定系數(shù)。判定系數(shù)測(cè)量了回歸直線對(duì)觀測(cè)數(shù)據(jù)的擬合程度。11.12.在回歸分析中,F(xiàn)檢驗(yàn)是為檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著,通過(guò)均方回歸與均方殘差之比,構(gòu)造F檢驗(yàn)統(tǒng)計(jì)量,提出假設(shè),根據(jù)顯著性水平,作出判斷。t檢驗(yàn)是回歸系數(shù)的顯著性檢驗(yàn),要檢驗(yàn)自變量對(duì)因變量的影響是否顯著,通過(guò)構(gòu)造t檢驗(yàn)統(tǒng)計(jì)量,提出假設(shè),根據(jù)顯著性水平,作出判斷。11.13.線性關(guān)系檢驗(yàn)的步驟:⑴提出假設(shè);;⑵構(gòu)造F檢驗(yàn)統(tǒng)計(jì)量;;⑶根據(jù)顯著性水平,作出判斷?;貧w系數(shù)檢驗(yàn)的步驟:⑴提出假設(shè);;⑵構(gòu)造t檢驗(yàn)統(tǒng)計(jì)量;;⑶根據(jù)顯著性水平,作出判斷。11.14.回歸分析結(jié)果的評(píng)價(jià)可以從以下幾個(gè)方面:⑴回歸系數(shù)的符號(hào)是否與理論或事先預(yù)期相一致;⑵自變量與因變量之間的線性關(guān)系,在統(tǒng)計(jì)上是否顯著;⑶根據(jù)判定系數(shù)的大小,判斷回歸模型解釋因變量取值差異的程度;⑷誤差項(xiàng)的正態(tài)假定是否成立。11.15.置信區(qū)間估計(jì)是對(duì)x的一個(gè)給定值,求出y的平均值的區(qū)間估計(jì)。預(yù)測(cè)區(qū)間估計(jì)是對(duì)x的一個(gè)給定值,求出y的一個(gè)個(gè)別值的區(qū)間估計(jì)。二者的區(qū)別是:置信區(qū)間估計(jì)的區(qū)間長(zhǎng)度通常較短,而預(yù)測(cè)區(qū)間估計(jì)的區(qū)間長(zhǎng)度要長(zhǎng),也就是說(shuō),估計(jì)y的平均值比預(yù)測(cè)y的一個(gè)特定值或個(gè)別值更準(zhǔn)確。11.16.殘差分析在回歸分析中的作用:回歸分析是確定兩種或兩種以上變量間的定量關(guān)系的一種統(tǒng)計(jì)分析方法.判斷回歸模型的擬合效果是回歸分析的重要內(nèi)容,在回歸分析中,通常用殘差分析來(lái)判斷回歸模型的擬合效果,并判定關(guān)于誤差項(xiàng)的正態(tài)假設(shè)是否成立。二、練習(xí)題11.1.〔1〕散點(diǎn)圖如下:從散點(diǎn)圖可以看出,產(chǎn)量與生產(chǎn)費(fèi)用之間為正的線性相關(guān)關(guān)系?!?〕利用Excel的“CORREL〞函數(shù)計(jì)算的相關(guān)系數(shù)為?!?〕首先提出如下假設(shè):,。計(jì)算檢驗(yàn)的統(tǒng)計(jì)量當(dāng)時(shí),。由于檢驗(yàn)統(tǒng)計(jì)量,拒絕原假設(shè)。說(shuō)明產(chǎn)量與生產(chǎn)費(fèi)用之間的線性關(guān)系顯著。11.2〔1〕散點(diǎn)圖如下:從散點(diǎn)圖可以看出,復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)之間為正的線性相關(guān)關(guān)系?!?〕利用Excel的“CORREL〞函數(shù)計(jì)算的相關(guān)系數(shù)為。相關(guān)系數(shù),說(shuō)明復(fù)習(xí)時(shí)間與考試分?jǐn)?shù)之間有較強(qiáng)的正線性相關(guān)關(guān)系。11.3.(1)表示當(dāng)時(shí)的期望值為10。〔2〕表示每增加一個(gè)單位,平均下降0.5個(gè)單位?!?〕時(shí),。1.4.〔1〕表示,在因變量取值的變差中,有90%可以由與之間的線性關(guān)系來(lái)解釋?!?〕表示,當(dāng)用來(lái)預(yù)測(cè)時(shí),平均的預(yù)測(cè)誤差為0.5。11.5.〔1〕散點(diǎn)圖如下:從散點(diǎn)圖可以看出,運(yùn)送距離與運(yùn)送時(shí)間之間為正的線性相關(guān)關(guān)系?!?〕利用Excel的“CORREL〞函數(shù)計(jì)算的相關(guān)系數(shù)為。相關(guān)系數(shù),說(shuō)明運(yùn)送距離與運(yùn)送時(shí)間之間有較強(qiáng)的正線性相關(guān)關(guān)系。〔3〕由Excel輸出的回歸結(jié)果如下表:回歸統(tǒng)計(jì)MultipleR0.948943RSquare0.900492AdjustedRSquare0.888054標(biāo)準(zhǔn)誤差0.480023觀測(cè)值10方差dfSSMSFSignificanceF回歸分析116.6816216.6816272.395852.79E-05殘差81.8433790.230422總計(jì)918.525Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept0.1181290.3551480.332620.74797XVariable10.0035850.0004218.5085752.79E-050.002613得到的回歸方程為:回歸系數(shù)表示運(yùn)送距離每增加1公里,運(yùn)送時(shí)間平均增加0.003585天。11.6.〔1〕散點(diǎn)圖如下:從散點(diǎn)圖可以看出,人均GDP與人均消費(fèi)水平為正的線性相關(guān)關(guān)系。〔2〕利用Excel的“CORREL〞函數(shù)計(jì)算的相關(guān)系數(shù)為。相關(guān)系數(shù)接近于1,說(shuō)明人均GDP與人均消費(fèi)水平之間有非常強(qiáng)的正線性相關(guān)關(guān)系?!?〕Excel輸出的回歸結(jié)果如下表:回歸統(tǒng)計(jì)MultipleR0.998128RSquare0.996259AdjustedRSquare0.995511標(biāo)準(zhǔn)誤差247.3035觀測(cè)值7方差分析dfSSMSFSignificanceF回歸181444969814449691331.6922.91E-07殘差530579561159.01總計(jì)681750764Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept734.6928139.54035.2650940.003285XVariable10.3086830.00845936.492362.91E-07得到的回歸方程為:?;貧w系數(shù)表示人均GDP每增加1元,人均消費(fèi)水平平均增加0.308683元。〔4〕判定系數(shù)。說(shuō)明在人均消費(fèi)水平的變差中,有99.6259%是由人均GDP決定的。〔5〕首先提出如下假設(shè):,由于SignificanceF<,拒絕原假設(shè),說(shuō)明人均GDP與人均消費(fèi)水平之間的線性關(guān)系顯著。〔6〕〔元〕?!?〕當(dāng)時(shí),,。置信區(qū)間為:即〔1990.7,2565.5〕。預(yù)測(cè)區(qū)間為:即〔1580.3,2975.9〕11.7.〔1〕散點(diǎn)圖如下:從散點(diǎn)圖可以看出,航班正點(diǎn)率與被投訴次數(shù)之間為負(fù)的線性相關(guān)關(guān)系?!?〕由Excel輸出的回歸結(jié)果如下表:回歸統(tǒng)計(jì)MultipleR0.868643RSquare0.75454AdjustedRSquare0.723858標(biāo)準(zhǔn)誤差18.88722觀測(cè)值10方差分析dfSSMSFSignificanceF回歸分析18772.5848772.58424.591870.001108殘差82853.816356.727總計(jì)911626.4Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept430.189272.154835.9620290.000337XVariable1-4.700620.947894-4.959020.001108得到的回歸方程為:?;貧w系數(shù)表示航班正點(diǎn)率每增加1%,顧客投訴次數(shù)平均下降4.7次。〔3〕回歸系數(shù)檢驗(yàn)的P-Value=0.001108<〕,拒絕原假設(shè),回歸系數(shù)顯著?!?〕〔次〕〔5〕當(dāng)時(shí),,置信區(qū)間為:即〔37.7,70.7〕預(yù)測(cè)區(qū)間為:即〔7.6,100.8〕11.8.Excel輸出的回歸結(jié)果如下:MultipleR0.7951RSquare0.6322AdjustedRSquare0.6117標(biāo)準(zhǔn)誤差2.6858觀測(cè)值20方差分析dfSSMSFSignificanceF回歸1223.1403223.140330.93322.79889E-05殘差18129.84527.2136總計(jì)19352.9855Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept49.31773.805012.96120.0000XVariable10.24920.04485.56180.0000由上表結(jié)果可知,出租率與月租金之間的線性回歸方程為:?;貧w系數(shù)表示:月租金每增加1元,出租率平均增加0.2492%。,說(shuō)明在出租率的變差中被出租率與租金之間的線性關(guān)系所解釋的比例為63.22%,回歸方程的擬合程度一般。估計(jì)標(biāo)準(zhǔn)誤差表示,當(dāng)用月租金來(lái)預(yù)測(cè)出租率時(shí),平均的預(yù)測(cè)誤差為2.6858%,說(shuō)明預(yù)測(cè)誤差并不大。由方差分析表可知,SignificanceF=2.79889E-05<回歸方程的線性關(guān)系顯著?;貧w系數(shù)檢驗(yàn)的P-value=0.0000<,說(shuō)明回歸系數(shù)顯著,即月租金是影響出租率的顯著性因素。11.9.〔1〕方差分析表中所缺的數(shù)值如下方差分析表如下:變差來(lái)源dfSSMSFSignificanceF回歸11422708.61422708.6354.2772.17E-09殘差1040158.074015.807——總計(jì)111642866.67———〔2〕根據(jù)方差分析表計(jì)算的判定系數(shù)說(shuō)明汽車銷售量的變差中有86.60%是由于廣告費(fèi)用的變動(dòng)引起的?!?〕相關(guān)系數(shù)可由判定系數(shù)的平方根求得:〔4〕回歸方程為:?;貧w系數(shù)表示廣告費(fèi)用每增加一個(gè)單位,銷售量平均增加1.420xx1個(gè)單位?!?〕由于SignificanceF=2.17E-09<,說(shuō)明廣告費(fèi)用與銷售量之間的線性關(guān)系顯著。11.10.Excel輸出的回歸結(jié)果如下:回歸統(tǒng)計(jì)MultipleR0.968167RSquare0.937348AdjustedRSquare0.916463標(biāo)準(zhǔn)誤差3.809241觀測(cè)值5方差分析dfSSMSFSignificanceF回歸分析1651.2691651.269144.883180.006785殘差343.5309414.51031總計(jì)4694.8Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept13.625414.3994283.0970860.053417XVariable12.3029320.3437476.6994910.006785由上述結(jié)果可知:回歸方程為,回歸系數(shù)說(shuō)明,每增加一個(gè)單位平均增加2.3029個(gè)單位;判定系數(shù),說(shuō)明回歸方程的擬合程度較高;估計(jì)標(biāo)準(zhǔn)誤差,說(shuō)明用來(lái)預(yù)測(cè)時(shí)平均的預(yù)測(cè)誤差為3.8092。11.11.〔1〕檢驗(yàn)統(tǒng)計(jì)量:〔2〕〔3〕由于,所以拒絕原假設(shè)〔4〕根據(jù)相關(guān)系數(shù)與判定系數(shù)之間的關(guān)系可知,〔5〕提出假設(shè):,由于,拒絕,線性關(guān)系顯著。11.12.〔1〕當(dāng)時(shí),。當(dāng),。的平均值的95%的置信區(qū)間為:即〔15.95,18.05〕〔2〕預(yù)測(cè)區(qū)間為:即〔14.65,19.35〕11.13.Excel輸出的回歸結(jié)果如下:回歸統(tǒng)計(jì)MultipleR0.947663RSquare0.898064AdjustedRSquare0.881075標(biāo)準(zhǔn)誤差108.7575觀測(cè)值8方差分析dfSSMSFSignificanceF回歸分析1625246.3625246.352.860650.000344殘差670969.211828.2總計(jì)7696215.5Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept-46.291864.89096-0.713380.502402XVariable115.239772.0961017.2705330.000344得到的線性回歸方程為:當(dāng)時(shí),。當(dāng),?!?〕銷售收入95%的置信區(qū)間為:即〔270.65,685.04〕。。11.14.回歸1殘差圖:回歸2殘差圖:結(jié)論:回歸1的殘差基本上位于一條水平帶中間,說(shuō)明變量之間的線性假設(shè)以及對(duì)誤差項(xiàng)正態(tài)假設(shè)是成立,用一元線性回歸方程描述變量間的關(guān)系是適宜的?;貧w2的殘差表示,變量之間用一元線性回歸模型不合理,應(yīng)考慮曲線回歸或多元回歸。11.15.〔1〕估計(jì)的回歸方程為:〔2〕由于SignificanceF=0.020<,說(shuō)明廣告費(fèi)支出與銷售額之間的線性關(guān)系顯著?!?〕殘差圖從圖上看,關(guān)于誤差項(xiàng)的假定不滿足?!?〕廣告費(fèi)支出x與銷售額y關(guān)系的散點(diǎn)圖:從廣告費(fèi)支出x與銷售額y關(guān)系的散點(diǎn)圖上看,用二次函數(shù)或其它曲線模型會(huì)更好。第十二章多元線性回歸解釋多元回歸模型、多元回歸方程、估計(jì)的多元回歸方程的含義。答:設(shè)因變量為,個(gè)自變量分別為,,…,,描述因變量如何依賴于自變量,,…,和誤差項(xiàng)的方程稱為多元回歸模型。其中,,,…,是模型的參數(shù);為誤差項(xiàng)。在多元回歸模型的基本假定下,因變量的期望,該式被稱為多元回歸方程。回歸方程中的參數(shù),,…,是未知的,需要利用樣本數(shù)據(jù)去估計(jì)它們。當(dāng)用樣本統(tǒng)計(jì)量,,…,去估計(jì)回歸方程中的未知參數(shù),,…,時(shí),就得到了估計(jì)的多元回歸方程。12.2多元線性回歸模型中有哪些基本假定答:〔1〕誤差項(xiàng)是一個(gè)期望值為0的隨機(jī)變量,即。〔2〕對(duì)于自變量,,…,的所有值,的方差都一樣。〔3〕誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立,即。12.3解釋多重判定系數(shù)和調(diào)整的多重判定系數(shù)的含義和作用。答:多重判定系數(shù)是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個(gè)統(tǒng)計(jì)量,反映了在因變量的變差中被估計(jì)的回歸方程所解釋的比例。為防止增加自變量而高估,統(tǒng)計(jì)學(xué)家提出用樣本量和自變量的個(gè)數(shù)去調(diào)整,計(jì)算出調(diào)整的多重判定系數(shù),其意義與類似,表示在用樣本量和模型中自變量的個(gè)數(shù)進(jìn)展調(diào)整后,在因變量的變差中被估計(jì)的回歸方程所解釋的比例。12.4解釋多重共線性的含義。答:當(dāng)回歸模型中兩個(gè)或兩個(gè)以上的自變量彼此相關(guān)時(shí),那么稱回歸模型中存在多重共線性。12.5多重共線性對(duì)回歸分析有哪些影響答:首先,變量之間高度相關(guān)時(shí),可能會(huì)使回歸的結(jié)果混亂,甚至?xí)逊治鲆肫缤荆黄浯?,多重共線性可能對(duì)參數(shù)估計(jì)值的正負(fù)號(hào)產(chǎn)生影響,特別是的正負(fù)號(hào)有可能同預(yù)期的正負(fù)號(hào)相反。12.6多重共線性的判別方法主要有哪些答:〔1〕模型中各對(duì)自變量之間顯著相關(guān)?!?〕當(dāng)模型的線性關(guān)系檢驗(yàn)〔F檢驗(yàn)〕顯著時(shí),幾乎所有回歸系數(shù)的檢驗(yàn)卻不顯著?!?〕回歸系數(shù)的正負(fù)號(hào)與預(yù)期的相反?!?〕容忍度越小,也即方差擴(kuò)大因子VIF越大,多重共線性越嚴(yán)重。通常容忍度小于0.1,也即VIF大于10時(shí),存在嚴(yán)重的多重共線性。12.7多重共線性的處理方法有哪些答:〔1〕將一個(gè)或多個(gè)相關(guān)的自變量從模型中剔除,使保存的自變量盡可能不相關(guān)?!?〕如果要在模型中保存所有的自變量,那就應(yīng)該:防止根據(jù)統(tǒng)計(jì)量對(duì)單個(gè)參數(shù)進(jìn)展檢驗(yàn);對(duì)因變量值的推斷〔估計(jì)或預(yù)測(cè)〕限定在自變量樣本值的范圍內(nèi)。12.8在多元線性回歸中,選擇自變量的方法有哪些答:向前選擇、向后剔除、逐步回歸、最優(yōu)子集等。二、練習(xí)題12.1表示,在不變的條件下,每增加1個(gè)單位,會(huì)使平均減少0.049714個(gè)單位;表示,在不變的條件下,每增加1個(gè)單位,會(huì)使平均增加1.928169個(gè)單位。多重判定系數(shù)和調(diào)整的多重判定系數(shù)顯示:該多元回歸方程的擬合效果較差,在因變量的變差中,能被估計(jì)的回歸方程所解釋的比例很少。檢驗(yàn)說(shuō)明,與、之間的線性關(guān)系不顯著。檢驗(yàn)說(shuō)明,自變量、對(duì)因變量的影響均不顯著。12.2模型中涉及3個(gè)自變量,15個(gè)觀測(cè)值。多重判定系數(shù)和調(diào)整的多重判定系數(shù)顯示:該多元回歸方程的擬合效果較好,在用樣本量和模型中自變量的個(gè)數(shù)進(jìn)展調(diào)整后,在因變量的變差中,能被估計(jì)的回歸方程所解釋的比例為63.0463%。檢驗(yàn)說(shuō)明,與、、之間的線性關(guān)系顯著。檢驗(yàn)說(shuō)明,自變量、對(duì)因變量的影響均顯著,但對(duì)因變量的影響不顯著。12.3(1)故與、、之間的線性關(guān)系顯著。〔2〕,故顯著?!?〕,故顯著。12.4〔1〕〔2〕〔3〕上述〔1〕和〔2〕所建設(shè)的估計(jì)的回歸方程,電視廣告費(fèi)用的系數(shù)符號(hào)一樣但數(shù)值大小不同。其中,〔1〕中表示,電視廣告費(fèi)用每增加1萬(wàn)元,會(huì)使月銷售收入平均增加1.603865萬(wàn)元;〔2〕中表示,在報(bào)紙廣告費(fèi)用不變的條件下,電視廣告費(fèi)用每增加1萬(wàn)元,會(huì)使月銷售收入平均增加2.290184萬(wàn)元?!?〕根據(jù)問題〔2〕所建設(shè)的估計(jì)的回歸方程,在月銷售收入的總變差中,被估計(jì)的回歸方程所解釋的比例是88.6650%?!?〕根據(jù)問題〔2〕所建設(shè)的估計(jì)的回歸方程,,故顯著。,故顯著。12.5〔1〕〔2〕表示,春季降雨量每增加1mm,會(huì)使早稻收獲量平均增加22.386461kg/hm2;表示,春季溫度每增加1。C,會(huì)使早稻收獲量平均增加327.671713kg/hm2?!?〕可能存在。因?yàn)樽宰兞看杭窘涤炅颗c春季溫度的簡(jiǎn)單線性相關(guān)系數(shù)為0.965067。且模型的線性關(guān)系檢驗(yàn)〔F檢驗(yàn)〕顯著,但回歸系數(shù)的t檢驗(yàn)不顯著。12.6〔1〕〔2〕在銷售價(jià)格的總變差中,被估計(jì)的回歸方程所解釋的比例是87.83%?!?〕故回歸方程的線性關(guān)系顯著。〔4〕,故回歸系數(shù)不顯著。,故回歸系數(shù)顯著。,故回歸系數(shù)不顯著。12.7〔1〕,故二元回歸模型的線性關(guān)系顯著?!?〕,故顯著,不應(yīng)從模型中剔除?!?〕,故顯著,不應(yīng)從模型中剔除。。12.8〔1〕故無(wú)證據(jù)說(shuō)明二者之間存在線性關(guān)系?!?〕,,故無(wú)證據(jù)說(shuō)明二者之間存在線性關(guān)系?!?〕對(duì)預(yù)測(cè)無(wú)用。〔4〕檢驗(yàn)說(shuō)明,與、之間的線性關(guān)系顯著。檢驗(yàn)說(shuō)明,自變量、對(duì)因變量的影響均顯著。這與〔3〕所得結(jié)論不一樣?!?〕,說(shuō)明模型存在多重共線性。12.9〔1〕,,故無(wú)證據(jù)說(shuō)明銷售價(jià)格與購(gòu)進(jìn)價(jià)格之間存在線性關(guān)系。,,故無(wú)證據(jù)說(shuō)明銷售價(jià)格與銷售費(fèi)用之間存在線性關(guān)系?!?〕根據(jù)〔1〕中結(jié)果,用購(gòu)進(jìn)價(jià)格和銷售費(fèi)用來(lái)預(yù)測(cè)銷售價(jià)格無(wú)用。〔3〕檢驗(yàn)說(shuō)明,與、之間的線性關(guān)系不顯著。檢驗(yàn)說(shuō)明,自變量、對(duì)因變量的影響均顯著?!?〕調(diào)整的多重判定系數(shù)顯示:在用樣本量和模型中自變量的個(gè)數(shù)進(jìn)展調(diào)整后,在因變量的變差中,能被估計(jì)的回歸方程所解釋的比例僅為24.4537%。這與〔2〕中的判斷是一致的?!?〕,說(shuō)明模型存在多重共線性?!?〕模型中存在多重共線性。第十四章統(tǒng)計(jì)指數(shù)1.某企業(yè)生產(chǎn)甲、乙兩種產(chǎn)品,資料如下:產(chǎn)品名稱計(jì)量產(chǎn)量單位成本〔元〕單位基期報(bào)告期基期報(bào)告期甲乙臺(tái)噸2000500022006000126.212.56要求:〔1〕計(jì)算產(chǎn)量與單位成本個(gè)體指數(shù)?!?〕計(jì)算兩種產(chǎn)品產(chǎn)量總指數(shù)以及由于產(chǎn)量增加而增加的生產(chǎn)費(fèi)用?!?〕計(jì)算兩種產(chǎn)品單位成本總指數(shù)以及由于成本降低而節(jié)約的生產(chǎn)費(fèi)用。解:產(chǎn)品名稱計(jì)量產(chǎn)量單位成本〔元〕指數(shù)〔%〕單位q0q1z0z1產(chǎn)量單位成本甲乙臺(tái)噸2000500022006000126.212.56110120104.296.8〔2〕產(chǎn)量指數(shù):〔3〕單位成本指數(shù):2.某商場(chǎng)銷售的三種商品資料如下:商品名稱計(jì)量單位銷售數(shù)量單價(jià)〔元〕基期報(bào)告期基期報(bào)告期甲乙丙千克臺(tái)件10020030011522031510050201005525要求:〔1〕計(jì)算三種商品的銷售額總指數(shù)?!?〕分析銷售量和價(jià)格變動(dòng)對(duì)銷售額影響的絕對(duì)值和相對(duì)值。解:商品名稱銷售量單價(jià)〔元〕銷售額〔元〕q0q1p0p1p0q0p1q1p0q1甲乙丙100200300115220315100502010055251000010000600011500121007875115
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年雙音盆形電喇叭公司技術(shù)改造及擴(kuò)產(chǎn)項(xiàng)目可行性研究報(bào)告
- 2024-2030年北京市能源公司技術(shù)改造及擴(kuò)產(chǎn)項(xiàng)目可行性研究報(bào)告
- 2024-2030年冶金工業(yè)廢渣搬遷改造項(xiàng)目可行性研究報(bào)告
- 2024-2030年全球蠶絲行業(yè)產(chǎn)銷需求及未來(lái)營(yíng)銷趨勢(shì)預(yù)測(cè)報(bào)告
- 2024-2030年全球及中國(guó)運(yùn)動(dòng)纖維復(fù)合材料行業(yè)發(fā)展動(dòng)態(tài)及供需前景預(yù)測(cè)報(bào)告
- 2024-2030年全球及中國(guó)等離子表達(dá)機(jī)行業(yè)銷售趨勢(shì)及供需前景預(yù)測(cè)報(bào)告
- 2024-2030年全球及中國(guó)無(wú)水冷卻液行業(yè)需求動(dòng)態(tài)及前景戰(zhàn)略分析報(bào)告
- 2024-2030年全球及中國(guó)先進(jìn)鉛酸電池行業(yè)產(chǎn)銷規(guī)模及供需形勢(shì)分析報(bào)告
- 2024-2030年全球及中國(guó)丙烯酸酯、C1222烷基甲基丙烯酸酯共聚物行業(yè)運(yùn)行動(dòng)態(tài)及前景趨勢(shì)預(yù)測(cè)報(bào)告
- 2024-2030年全球及中國(guó)3D植入物行業(yè)需求態(tài)勢(shì)及運(yùn)營(yíng)前景預(yù)測(cè)報(bào)告
- 《標(biāo)準(zhǔn)工時(shí)培訓(xùn)》課件
- 射擊館建設(shè)方案
- 應(yīng)用寫作-消息和通訊
- 華為公司客戶滿意度管理
- 四年級(jí)綜合實(shí)踐活動(dòng)上三:學(xué)校中遵守規(guī)則情況調(diào)查教學(xué)課件
- 2023-2024學(xué)年江蘇省淮安市數(shù)學(xué)高一上期末復(fù)習(xí)檢測(cè)試題含解析
- 中學(xué)首席名師、名師、骨干教師、教壇新秀評(píng)選方案
- 國(guó)際物流運(yùn)輸管理智慧樹知到課后章節(jié)答案2023年下上海海事大學(xué)
- 犯罪學(xué)智慧樹知到課后章節(jié)答案2023年下山東警察學(xué)院
- 03K132 風(fēng)管支吊架圖集
- 西鐵計(jì)202119號(hào) 中國(guó)鐵路西安局集團(tuán)有限公司關(guān)于印發(fā)《西安局集團(tuán)公司地方涉鐵工程建設(shè)管理辦法》的通知2021-01-25
評(píng)論
0/150
提交評(píng)論