




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一部分第思考題課后思考題和練習題答案(最終完整版)第一章思考題1。1什么是統計學統計學是關于數據的一門學科,它收集,處理,分析,解釋來自各個領域的數據并從中得出結論。1。2解釋描述統計和推斷統計描述統計;它研究的是數據收集,處理,匯總,圖表描述,概括與分析等統計方法。推斷統計;它是研究如何利用樣本數據來推斷總體特征的統計方法。1。3統計學的類型和不同類型的特點統計數據;按所采用的計量尺度不同分;(定性數據)分類數據:只能歸于某一類別的非數字型數據,它是對事物進行分類的結果,數據表現為類別,用文字來表述;(定性數據)順序數據:只能歸于某一有序類別的非數字型數據.它也是有類別的,但這些類別是有序的。(定量數據)數值型數據:按數字尺度測量的觀察值,其結果表現為具體的數值。統計數據;按統計數據都收集方法分;觀測數據:是通過調查或觀測而收集到的數據,這類數據是在沒有對事物人為控制的條件下得到的.實驗數據:在實驗中控制實驗對象而收集到的數據。統計數據;按被描述的現象與實踐的關系分;截面數據:在相同或相似的時間點收集到的數據,也叫靜態(tài)數據。時間序列數據:按時間順序收集到的,用于描述現象隨時間變化的情況,也叫動態(tài)數據。1.4解釋分類數據,順序數據和數值型數據答案同1.31.5舉例說明總體,樣本,參數,統計量,變量這幾個概念對一千燈泡進行壽命測試,那么這千個燈泡就是總體,從中抽取一百個進行檢測,這一百個燈泡的集合就是樣本,這一千個燈泡的壽命的平均值和標準差還有合格率等描述特征的數值就是參數,這一百個燈泡的壽命的平均值和標準差還有合格率等描述特征的數值就是統計量,變量就是說明現象某種特征的概念,比如說燈泡的壽命。變量的分類變量可以分為分類變量,順序變量,數值型變量。變量也可以分為隨機變量和非隨機變量。經驗變量和理論變量。1。7舉例說明離散型變量和連續(xù)性變量離散型變量,只能取有限個值,取值以整數位斷開,比如“企業(yè)數”連續(xù)型變量,取之連續(xù)不斷,不能一一列舉,比如“溫度”。統計應用實例人口普查,商場的名意調查等。1.9統計應用的領域經濟分析和政府分析還有物理,生物等等各個領域.第二章思考題2。1什么是二手資料?使用二手資料應注意什么問題與研究內容有關,由別人調查和試驗而來已經存在,并會被我們利用的資料為“二手資料”.使用時要進行評估,要考慮到資料的原始收集人,收集目的,收集途徑,收集時間使用時要注明數據來源。2。2比較概率抽樣和非概率抽樣的特點,指出各自適用情況概率抽樣:抽樣時按一定的概率以隨機原則抽取樣本.每個單位別抽中的概率已知或可以計算,當用樣本對總體目標量進行估計時,要考慮到每個單位樣本被抽到的概率。技術含量和成本都比較高。如果調查目的在于掌握和研究對象總體的數量特征,得到總體參數的置信區(qū)間,就使用概率抽樣。非概率抽樣:操作簡單,時效快,成本低,而且對于抽樣中的統計學專業(yè)技術要求不是很高。它適合探索性的研究,調查結果用于發(fā)現問題,為更深入的數量分析提供準備。它同樣使用市場調查中的概念測試(不需要調查結果投影到總體的情況)。2。3除了自填式,面訪式和電話式還有什么搜集數據的辦法試驗式和觀察式等2。4自填式,面訪式和電話式各自的長處和弱點自填式;優(yōu)點:1調查組織者管理容易2成本低,可進行大規(guī)模調查3對被調查者,可選擇方便時間答卷,減少回答敏感問題壓力。缺點:1返回率低2不適合結構復雜的問卷,調查內容有限3調查周期長4在數據搜集過程中遇見問題不能及時調整.面訪式;優(yōu)點:1回答率高2數據質量高3在調查過程中遇見問題可以及時調整.缺點:1成本比較高2搜集數據的方式對調查過程的質量控制有一定難度3對于敏感問題,被訪者會有壓力。電話式;優(yōu)點:1速度快2對調查員比較安全3對訪問過程的控制比較容易。缺點:1實施地區(qū)有限2調查時間不能過長3使用的問卷要簡單4被訪者不愿回答時,不易勸服。2.5老師說這個內容不講,應該不會考實驗數據的2.6如何控制調查中的回答誤差對于理解誤差,我會去學習一定的心理學知識,對于記憶誤差,我會盡量去縮短所涉及的時間范圍,對于有意識的誤差,我要做好被調查者的心理工作,要遵守職業(yè)道德,為被調查者保密,盡量在問卷中不涉及敏感問題。2。7怎么減少無回答對于隨機誤差,要提高樣本容量,對于系統誤差,只有做好準備工作并做好補救措施。比如說要一百份的問卷回復,就要做好一百二十到一百三十的問卷準備,進行面訪式的時候要盡量的勸服不愿意回答的被訪者,以小物品的饋贈提高回復率。第三章思考題3。1數據預處理內容數據審核(完整性和準確性;適用性和實效性),數據篩選和數據排序.3.2分類數據和順序數據的整理和圖示方法各有哪些分類數據:制作頻數分布表,用比例,百分比,比率等進行描述性分析.可用條形圖,帕累托圖和餅圖進行圖示分析.順序數據:制作頻數分布表,用比例,百分比,比率。累計頻數和累計頻率等進行描述性分析??捎脳l形圖,帕累托圖和餅圖,累計頻數分布圖和環(huán)形圖進行圖示分析。3。3數據型數據的分組方法和步驟分組方法:單變量值分組和組距分組,組距分組又分為等距分組和異距分組。分組步驟:1確定組數2確定各組組距3根據分組整理成頻數分布表3.4直方圖和條形圖的區(qū)別1條形圖使用圖形的長度表示各類別頻數的多少,其寬度固定,直方圖用面積表示各組頻數,矩形的高度表示每一組的頻數或頻率,寬度表示組距,2直方圖各矩形連續(xù)排列,條形圖分開排列,3條形圖主要展示分類數據,直方圖主要展示數值型數據。3。5繪制線圖應注意問題時間在橫軸,觀測值繪在縱軸。一般是長寬比例10:7的長方形,縱軸下端一般從0開始,數據與0距離過大的話用折斷符號折斷。餅圖和環(huán)形圖的不同餅圖只能顯示一個樣本或總體各部分所占比例,環(huán)形圖可以同時繪制多個樣本或總體的數據系列,其圖形中間有個“空洞”,每個樣本或總體的數據系類為一個環(huán).3。7莖葉圖比直方圖的優(yōu)勢,他們各自的應用場合莖葉圖既能給出數據的分布情況,又能給出每一個原始數據,即保留了原始數據的信息。在應用方面,直方圖通常適用于大批量數據,莖葉圖適用于小批量數據.3。8鑒別圖標優(yōu)劣的準則P75明確有答案,我就不寫了.3。9制作統計表應注意的問題1,合理安排統計表結構2表頭一般包括表號,總標題和表中數據的單位等內容3表中的上下兩條橫線一般用粗線,中間的其他用細線4在使用統計表時,必要時可在下方加注釋,注明數據來源。公式:組中值=(上限+下限)/2第4章數據的概括性度量4.1一組數據的分布特征可以從哪幾個方面進行測度?數據分布特征可以從三個方面進行測度和描述:一是分布的集中趨勢,反映各數據向其中心值靠攏或集中的程度;二是分布的離散程度,反映各數據遠離其中心值的趨勢;三是分布的形狀,反映數據分布的偏態(tài)和峰態(tài)。4.2怎樣理解平均數在統計學中的地位?平均數在統計學中具有重要的地位,是集中趨勢的最主要的測度,主要適用于數值型數據,而不適用于分類數據和順序數據。4.3簡述四分位數的計算方法。四分位數是一組數據排序后處于25%和75%位置上的值。根據未分組數據計算四分位數時,首先對數據進行排序,然后確定四分位數所在的位置,該位置上的數值就是四分位數。4。4對于比率數據的平均為什么采用幾何平均?在實際應用中,對于比率數據的平均采用幾何平均要比算數平均更合理。從公式中也可看出,G就是平均增長率.4。5簡述眾數、中位數和平均數的特點和應用場合.眾數是一組數據分布的峰值,不受極端值的影響,缺點是具有不唯一性。眾數只有在數據量較多時才有意義,數據量較少時不宜使用.主要適合作為分類數據的集中趨勢測度值.中位數是一組數據中間位置上的代表值,不受極端值的影響。當數據的分布偏斜較大時,使用中位數也許不錯。主要適合作為順序數據的集中趨勢測度值。平均數對數值型數據計算的,而且利用了全部數據信息,在實際應用中最廣泛。當數據呈對稱分布或近似對稱分布時,三個代表值相等或相近,此時應選擇平均數。但平均數易受極端值的影響,對于偏態(tài)分布的數據,平均數的代表性較差,此時應考慮中位數或眾數.簡述異眾比率、四分位差、方差或標準差的適用場合對于分類數據,主要用異眾比率來測量其離散程度;對于順序數據,雖然也可以計算異眾比率,但主要使用四分位差來測量其離散程度;對于數值型數據,雖然可以計算異眾比率和四分位差,但主要使用方差或標準差來測量其離散程度。4.7標準分數有哪些用途?標準分數給出了一組數據中各數值的相對位置。在對多個具有不同量綱的變量進行處理時,常需要對各變量進行標準化處理.它還可以用來判斷一組數據是否有離群數據。4。8為什么要計算離散系數?方差和標準差是反映數據分散程度的絕對值,一方面其數值大小受原變量值本身水平高低的影響,也就是與變量的平均數大小有關;另一方面,它們與原變量的計量單位相同,采用不同計量單位的變量值,其離散程度的測度值也就不同。因此,為消除變量值水平高低和計量單位不同對離散程度測度值的影響,需要計算離散系數.4.9測度數據分布形狀的統計量有哪些?對分布形狀的測度有偏態(tài)和峰態(tài),測度偏態(tài)的統計量是偏態(tài)系數,測度峰態(tài)的統計量是峰態(tài)系數。第五章概率與概率分布5。1頻率與概率有什么關系?在相同條件下隨機試驗n次,某事件A出現m次,則比值m/n稱為事件A發(fā)生的頻率。隨著n的增大,該頻率圍繞某一常數p波動,且波動幅度逐漸減小,趨于穩(wěn)定,這個頻率的穩(wěn)定值即為該事件的概率。5.2獨立性與互斥性有什么關系?互斥事件一定是相互依賴(不獨立)的,但相互依賴的事件不一定是互斥的.不互斥事件可能是獨立的,也可能是不獨立的,但獨立事件不可能是互斥的。5.3根據自己的經驗體會舉幾個服從泊松分布的隨機變量的實例.如某種儀器每月出現故障的次數、一本書一頁中的印刷錯誤、某一醫(yī)院在某一天內的急診病人數等5.4根據自己的經驗體會舉幾個服從正態(tài)分布的隨機變量的實例.如某班某次的考試成績、某地區(qū)成年男性的身高、某公司年銷售量、同一車間產品的質量等第六章思考題6.1統計量:設XI,X2…,Xn是從總體X中抽取的容量為n的一個樣本,如果由此樣本構造一個函數T(X1,X2…,Xn),不依賴于任何未知參數,則稱函數T(X1,X2…,Xn)是一個統計量.原因:為了使統計推斷成為可能.T1和T2是P159統計量加工過程中一點信息都不損失的統計量為充分統計量6。5自由度:獨立變量的個數6.6尬分布:設,則F分布:設若U為服從自由度為氣的%2分布,即U?咒2(氣),V為服從自由度為氣的左分布,即V~X2(n),且U和V相互獨立,則2稱F為服從自由度q和氣的F分布,記為12抽樣分布:樣本統計量的概率分布是一種理論概率分布隨機變量是樣本統計量6.8中心極限定理:設從均值為叢方差為b2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為u、方差為。2/n的正態(tài)分布第七章思考題7.1估計量:用于估計總體參數的隨機變量估計值:估計參數時計算出來的統計量的具體值7.2評價估計量的標準:無偏性:估計量抽樣分布的數學期望等于被估計的總體參數有效性:對同一總體參數的兩個無偏點估計量,有更小標準差的估計量更有效一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數7。3置信區(qū)間:由樣本統計量所構造的總體參數的估計區(qū)間7。495%的置信區(qū)間指用某種方法構造的所有區(qū)間中有95%的區(qū)間包含總體參數的真值。7.5含義:Za/2是標準正態(tài)分布上側面積為a/2的z值,公式是統計總體均值時的邊際誤差。7.6獨立樣本:如果兩個樣本是從兩個總體中獨立抽取的,即一個樣本中的元素與另一個樣本中的元素相互獨立。匹配樣本:一個樣本中的數據與另一個樣本中的數據相對應.(1)、兩個總體都服從正態(tài)分布、兩個隨即樣本獨立地分別抽自兩個總體7.8樣本量越大置信水平越高,總體方差和邊際誤差越小第8章思考題8。1假設檢驗和參數估計有什么相同點和不同點?答:參數估計和假設檢驗是統計推斷的兩個組成部分,它們都是利用樣本對總體進行某種推斷,然而推斷的角度不同。參數估計討論的是用樣本統計量估計總體參數的方法,總體參數卩在估計前是未知的。而在參數假設檢驗中,則是先對卩的值提出一個假設然后利用樣本信息去檢驗這個假設是否成立。8。2什么是假設檢驗中的顯著性水平?統計顯著是什么意思?答:顯著性水平是一個統計專有名詞,在假設檢驗中,它的含義是當原假設正確時卻被拒絕的概率和風險。統計顯著等價拒絕H。,指求出的值落在小概率的區(qū)間上,一般是落在0。05或比0。05更小的顯著水平上.8。3什么是假設檢驗中的兩類錯誤?答:假設檢驗的結果可能是錯誤的,所犯的錯誤有兩種類型,一類錯誤是原假設H。為真卻被我們拒絕了,犯這種錯誤的概率用a表示,所以也稱a錯誤或棄真錯誤;另一類錯誤是原假設為偽我們卻沒有拒絕,犯這種錯誤的概論用B表示,所以也稱B錯誤或取偽錯誤。8.4兩類錯誤之間存在什么樣的數量關系?答:在假設檢驗中,a與B是此消彼長的關系。如果減小a錯誤,就會增大犯B錯誤的機會,若減小B錯誤,也會增大犯a錯誤的機會。8。5解釋假設檢驗中的P值答:P值就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率.(它的大小取決于三個因素,一個是樣本數據與原假設之間的差異,一個是樣本量,再一個是被假設參數的總體分布。)8。6顯著性水平與P值有何區(qū)別答:顯著性水平是原假設為真時,拒絕原假設的概率,是一個概率值,被稱為抽樣分布的拒絕域,大小由研究者事先確定,一般為0。05。而P只是原假設為真時所得到的樣本觀察結果或更極端結果出現的概率,被稱為觀察到的(或實測的)顯著性水平8.7假設檢驗依據的基本原理是什么?答:假設檢驗依據的基本原理是“小概率原理”,即發(fā)生概率很小的隨機事件在一次試驗中是幾乎不可能發(fā)生的。根據這一原理,可以作出是否拒絕原假設的決定。8。8你認為單側檢驗中原假設與備擇假設的方向如何確定?答:將研究者想收集證據予以支持的假設作為備擇假設H1,將研究者想收集證據證明其不正確的假設作為原假設屯先確立備擇假設斗,備擇假設的方向與想要證明其正確性的方向一0,1致,原假設與備擇假設是互斥的,等號總在原假設上。(舉例說明,如下:“一項研究表明,采用新技術生產后,將會使產品的使用壽命明顯延長到1500小時以上.檢驗這一結論是否成立",則備擇假設的方向為'〉”壽命延長),建立的原假設與備擇假設應為H0:卩01500,斗:u>1500.又例,“一項研究表明,改進生產工藝后,會使產品的廢品率降低到2%以下.檢驗這一結論是否成立”,則備擇假設的方向為“<”(廢品率降低),建立的原假設與備擇假設應為Ho:u^2%,H1:u<2%.)第10章思考題1什么是方差分析?它研究的是什么?答:方差分析就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。它所研究的是非類型自變量對數值型因變量的影響。10.2要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分析方法?答:作兩兩比較十分繁瑣,進行檢驗的次數較多,隨著增加個體顯著性檢驗的次數,偶然因素導致差別的可能性也會增加。而方差分析方法則是同時考慮所有的樣本,因此排除了錯誤累積的概率,從而避免拒絕一個真實的原假設。3方差分析包括哪些類型?它們有何區(qū)別?答:方差分析可分為單因素方差分析和雙因素方差分析。區(qū)別:單因素方差分析研究的是一個分類型自變量對一個數值型因變量的影響,而雙因素涉及兩個分類型自變量。10。4方差分析中有哪些基本假定?答:方差分析中有三個基本假定:(1)每個總體都應服從正態(tài)分布(2)各個總體的方差02必須相同(3)觀測值是獨立的10。5簡述方差分析的基本思想。答:它是通過對數據誤差來源的分析來判斷不同總體的均值是否相等,進而分析自變量對因變量是否有顯著影響.10。6解釋因子與處理的含義。答:在方差分析中,所要檢驗的對象稱為因素或因子,因素的不同表現稱為水平或處理。10。7解釋組內誤差和組間誤差的含義。答:組內誤差(SSE,是指每個水平或組的個樣本數據與其組平均值誤差的平方和,反映了每個樣本各觀測值的離散狀況;組間誤差(SSA)是指各組平均值.與總平均值的誤差平方i和,反映各樣本均值之間的差異程度。10。8解釋組內方差和組間方差的含義。答:組內方差指因素的同一水平(同一個總體)下樣本數據的方差,組間方差指因素的不同水平(不同總體)下各樣本之間的方差。10.9簡述方差分析的基本步驟。答:(1)提出假設(一般提法形式如下:耳:比=匕=匕=???=?=???。嘰,自變量對因變量沒0123ik有顯著影響,Hi:ui(i=1,2,3???..,k)不全相等,自變量對因變量有顯著影響)1i(2)構造檢驗統計量(包括:計算各樣本的均值,計算全部觀測值的總均值,計算各誤差平方和,計算統計量)(3)統計決策.(將統計量的值F與給定的顯著性水平a的臨界值行比較,作出對原假設H°的決策)10。10方差分析中多重比較的作用是什么?答:通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異.10。11什么是交互作用?答:交互作用是指幾個因素搭配在一起會對因變量產生一種新的效應的作用。10。12解釋無交互作用和有交互作用的雙因素方差分析.答:在雙因素方差分析中,如果兩個因素對試驗結果的影響是相互獨立的,分別判斷行因素和列因素對試驗數據的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復雙因素方差分析;如果除了行因素和列因素對試驗數據的單獨影響外,兩個因素的搭配還會對結果產生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復雙因素方差分析。10.13解釋R2的含義和作用。答:自變量平方和占總平方和的比例記為R2,即作用:其平方根R就可以用來測量兩個變量之間的關系強度。10。14解釋試驗、試驗設計、試驗單元的含義。答:試驗是指收集樣本數據的過程。試驗設計是指收集樣本數據的計劃。試驗單元是指接受“處理"的對象或實體(“處理”指可控制的因素的各個水平)10.15簡述完全隨機化設計、隨機化區(qū)組設計、因子設計的含義和區(qū)別。答:完全隨機化設計是將k種“處理”隨機地指派給試驗單元的設計。隨機化區(qū)組設計是先按一定規(guī)則將試驗單元劃分為若干同質組,稱為“區(qū)組",然后再將各種處理隨機地指派給各個區(qū)組。因子設計指考慮兩個因素(可推廣到多個因素)的搭配試驗設計。第13章思考題13。1簡述時間序列的構成要素。時間序列的構成要素:趨勢,季節(jié)性,周期性,隨機性13.2利用增長率分析時間序列時應注意哪些問題.(1)當時間序列中的觀察值出現0或負數時,不宜計算增長率;(2)不能單純就增長率論增長率,要注意增長率與絕對水平的綜合分析;大的增長率背后,其隱含的絕對值可能很小,小的增長率背后其隱含的絕對值可能很大。13.3簡述平穩(wěn)序列和非平穩(wěn)序列的含義。平穩(wěn)序列(stationaryseries)基本上不存在趨勢的序列,各觀察值基本上在某個固定的水平上波動或雖有波動,但并不存在某種規(guī)律,而其波動可以看成是隨機的非平穩(wěn)序列(non-stationaryseries)是包含趨勢、季節(jié)性或周期性的序列,它可能只含有其中的一種成分,也可能是幾種成分的組合.因此,非平穩(wěn)序列又可以分為有趨勢的序列、有趨勢和季節(jié)性的序列、幾種成分混合而成的復合型序列.13。4簡述時間序列的預測程序。第一步:確定時間序列所包含的成分,也就是確定時間序列的類型。第二步:找出適合此類時間序列的預測方法.第三步:對可能的預測方法進行評估,以確定最佳預測方案。第四步:利用最佳預測方案進行預測。13.5簡述指數平滑法的含義。1。是加權平均的一種特殊形式2。對過去的觀察值加權平均進行預測的一種方法觀察值時間越遠,其權數也跟著呈現指數的下降,因而稱為指數平滑4。有一次指數平滑、二次指數平滑、三次指數平滑等該方法使用第T+1期的預測值等于T期的實際觀測值與第T期預測值的加權平均值一次指數平滑法也可用于對時間序列進行修勻,以消除隨機波動,找出序列的變化趨勢13.6簡述復合型序列預測的步驟第一步:確定并分離季節(jié)成分,計算季節(jié)指數,以確定時間序列中的季節(jié)成分。然后將季節(jié)性因素從時間序列中分離出去,以便觀察和分析時間序列的其他特征。第二步:對消除了季節(jié)成分的時間序列建立適當預測模型,并進行預測。第三步:計算出最后的預測值。用預測值乘以相應的季節(jié)指數,得到最終的預測值7簡述季節(jié)指數的計算步驟1。計算移動平均值(季度數據采用4項移動平均,月份數據采用12項移動平均),并將其結果進行“中心化”處理(將移動平均的結果再進行一次二項的移動平均,即得出“中心化移動平均值"(CMA))2。計算移動平均的比值,也成為季節(jié)比率(即將序列的各觀察值除以相應的中心化移動平均值,然后再計算出各比值的季度(或月份)平均值,即季節(jié)指數)3。季節(jié)指數調整(各季節(jié)指數的平均數應等于1或100%,若根據第二步計算的季節(jié)比率的平均值不等于1時,則需要進行調整。具體方法是:將第二步計算的每個季節(jié)比率的平均值除以它們的總平均值)第14章思考題14.1解釋指數的含義。答:指數最早起源于測量物價的變動。廣義上,是指任何兩個數值對比形成的相對數;狹義上,是指用于測定多個項目在不同場合下綜合變動的一種特殊相對數.實際應用中使用的主要是狹義的指數。14.2加權綜合指數和加權平均指數有何區(qū)別與聯系?加權綜合指數:通過加權來測定一組項目的綜合變動,有加權數量指數和加權質量指數。使用條件:必須掌握全面數據(數量指數,測定一組項目的數量變動,如產品產量指數,商品銷售量指數等)(質量指數,測定一組項目的質量變動,如價格指數、產品成本指數等)拉式公式:將權數的各變量值固定在基期。帕式公式:把作為權數的變量值固定在報告期.加權平均指數:以某一時期的總量為權數對個體指數加權平均.使用條件:可以是全面數據不完全數據.因權數所屬時期的不同,有不同的計算形式。有:算術平均形式、調和平均形3解釋零售價格指數、消費價格指數、生產價格指數、股票價格指數。答:零售價格指數:反映城鄉(xiāng)商品零售價格變動趨勢的一種經濟指數.消費價格指數:反映一定時期內消費者所購買的生活消費品價格和服務項目價格的變動趨勢和程度的一種相對數。生產價格指數:測量在初級市場上出售的貨物(即在非零售市場上首次購買某種商品時)的價格變動的一種價格指數。股票價格指數:反映某一股票市場上多種股票價格變動趨勢的一種相對數,簡稱股價指數.其單位一般用“點”(point)表示,即將基期指數作為100,每上升或下降一個單位稱為“1點”。EE1614.4消費價格指數有哪些作用?答:消費價格指數除了能反映城鄉(xiāng)居民所購買的生活消費品價格和服務項目價格的變動趨勢和程度外,還具有以下幾個方面的作用:用于反映通貨膨脹狀況用于反映貨幣購買力變動用于反映對職工實際工資的影響用于縮減經濟序列14。5在構建多指標綜合評價指數時,指標的轉換方法有哪幾種形式?答:有以下3種形式:統計標準化。極值標準化。定基與環(huán)比轉換.具體公式見書上P440。補充:什么是指數體系?答:指數體系是指由總量指數及其若干個因素指數構成的數量關系式??偭恐笖档扔诟饕蛩刂笖档某朔e總量的變動差額等于各因素指數變動差額之和兩個因素指數中通常一個為數量指數,另一個為質量指數各因素指數的權數必須是不同時期的2。什么是加權綜合指數體系?答:由加權綜合指數及其各因素指數構成的等式。比較第二部分:練習題告期權數加權的質量指數形成的指數體系。3.1為評價家電行業(yè)售后服務的質量,隨機抽取了由100個家庭構成的一個樣本。服務質量的等級分別表示為:A.好;B.較好;C一般;D.較差;E.差。調查結果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC要求:(1)指出上面的數據屬于什么類型順序數據(2)用Excel制作一張頻數分布表。
用數據分析——直方圖制作:接收頻率
接收頻率D17CD17C32用數據分析——直方圖制作:21(4)繪制評價等級的帕累托圖。14逆序排序后,制作累計頻數分布表:接收頻數頻率(%)累計2頁率(%)C323232B212153D171770E161686A14141003.2某行業(yè)管理局所屬40個企業(yè)2002年的產品銷售收入數據如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:根據上面的數據進行適當的分組,編制頻數分布表,并計算出累積頻數和累積頻率1、確定組數:,取k=62、確定組距:組距=(最大值-最小值)三組數=(152—87)三6=10.83,取103、分組頻數表銷售收入頻數頻率%累計頻數累計頻率%80。00-89。0025.025.090.00-99.0037。5512.5100.00—109.00922。51435.0110。00—119.001230.02665。0120.00-129.00717.53382.5130。00-139.00410。03792。5140。00-149.0025。03997.5150.00+12。540100.0總和40100.0(2)按規(guī)定,銷售收入在125萬元以上為先進企業(yè),115?125萬元為良好企業(yè),105?115萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進行分組。頻數頻率%累計頻數累計頻率%先進企業(yè)1025.01025。0良好企業(yè)1230。02255。0一般企業(yè)922.53177。5落后企業(yè)922。540100.0總和40100。03.3某百貨公司連續(xù)40天的商品銷售額如下:
單位:萬元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根據上面的數據進行適當的分組,編制頻數分布表,并繪制直方圖。1、確定組數:,取k=62、確定組距:組距=(最大值—最小值)三組數=(49—25)三6=4,取53、分組頻數表銷售收入(萬元)頻數頻率%累計頻數累計頻率%<=2512.512.526—30512。5615。031—35615.01230。036-401435.02665.041—451025.03690。046+410.040100。0總和40100。03.4利用下面的數據構建莖葉圖和箱線圖。572929363123472328283551391846182650293321464152282143194220dataStem—and-LeafPlotFrequencyStem&Leaf3.001.8895.002。011337.002.68889992。003。133.003。5693。004。1233。004。6673。005.0121.005.7Stemwidth:10Eachleaf:1case(s)6—種袋裝食品用生產線自動裝填,每袋重量大約為50g,但由于某些原因,每袋重量不會恰好是50g。下面是隨機抽取的100袋食品,測得的重量數據如下:單位:g57464954555849615149516052545155605647475351485350524045575352514648475347534447505253474548545248464952595350435346574949445752424943474648515945454652554749505447484457475358524855535749565657534148要求:構建這些數據的頻數分布表.繪制頻數分布的直方圖。說明數據分布的特征.解:(1)根據上面的數據進行適當的分組,編制頻數分布表,并計算出累積頻數和累積頻率.1、確定組數:,取k=6或72、確定組距:組距=(最大值一最小值)三組數=(61—40)三6=3.5,取3或者4、5組距=(最大值一最小值)三組數=(61-40)三7=3,3、分組頻數表組距3,上限為小于頻數百分比累計頻數累積百分比有效40.00—33.033o042.0043。00-45.0099.01212.046。00-48。2424o03636.00049。00—1919。05555o051.0052.00-54.002424.07979o055。00—57。1414o09393.00058。00+77.0100100.0合計100100.0直方圖:組距4,上限為小于等于頻數百分比累計頻數累積百分比有效〈=40.0011o011o041o00-44o77o088o00045o00-48o2828.03636.00049.00-52.002828o06464o053o00—56o2222o08686.000
直方圖:組距5,上限為小于等于頻數百分比累計頻數累積百分比有效〈=45.001212.012o012.046.00-50。003737o049o049.051.00-55。003434o083.083o056.00-60。001616o099o099o061o00+11o0100o0100o0合計100100o057.00-57.00-60.0061.00+合計1313。09999。011。0100100。0100100。0直方圖:分布特征:左偏鐘型。3。8下面是北方某城市1――2月份各天氣溫的記錄數據:-32-4-7―11-1789―614―18-15-9-6―105―4―96―8-12―16―19-15-22―25-24-19-8-6―15-11-12-19―25―24-18-1714-22―13―9-60―15―4-9-32-4-4-16―175-6-5要求:指出上面的數據屬于什么類型。數值型數據對上面的數據進行適當的分組1、確定組數:,取k=72、確定組距:組距=(最大值一最小值)三組數=(14—(-25))三7=5.57,取53、分組頻數表溫度頻數頻率%累計頻數累計頻率%-25—-21610.0610o0—2016813。31423o3-15-—11915.02338o3-1061220。03558。3-5--11220。04778o30—446.75185o05-9813.35998。310+11.760100.0合計60100.0繪制直方圖,說明該城市氣溫分布的特點。3。11對于下面的數據繪制散點圖。X234187
y252520301618解:3.12甲乙兩個班各有40名學生,期末統計學考試成績的分布如下:考試成績人數甲班乙班優(yōu)36良615中189及格98不及格42要求:(1)根據上面的數據,畫出兩個班考試成績的對比條形圖和環(huán)形圖。(2)比較兩個班考試成績分布的特點。甲班成績中的人數較多,高分和低分人數比乙班多,乙班學習成績較甲班好,高分較多,而低分較少。畫出雷達圖,比較兩個班考試成績的分布是否相似。分布不相似.3。14已知1995—2004年我國的國內生產總值數據如下(按當年價格計算):單位:億元年份國內生產總值第一產業(yè)第二產業(yè)第三產業(yè)199558478。1119932853817947199667884.613844.23361320428199774462.614211.23722323029199878345.214552.43861925174199982067.514471.964055827038200089468.114628.24493529905200197314.815411.848750331532002105172。316117.352980360752003117390.216928.161274391882004136875.920768.077238743721要求:(1)用Excel繪制國內生產總值的線圖?(2)繪制第一、二、三產業(yè)國內生產總值的線圖.(3)根據2004年的國內生產總值及其構成數據繪制餅圖
第四章統計數據的概括性描述4.1一家汽車零售店的10名銷售人員5月份銷售的汽車數量(單位:臺)排序后如下24710101012121415要求:計算汽車銷售量的眾數、中位數和平均數.根據定義公式計算四分位數。計算銷售量的標準差。說明汽車銷售量分布的特征。解:Statistics汽車銷售數量NValid10Missing0Mean9.60Median10。00Mode10Std.Deviation4.169Percentiles256.255010。007512。504.2隨機抽取25個網絡用戶,得到他們的年齡數據如下:單位:周歲19152925242321382218302019191623272234244120311723要求;(1)計算眾數、中位數:1、排序形成單變量分值的頻數分布和累計頻數分布網絡用戶的年齡FrequencyPercentCumulativeFrequencyCumulativePercentValid1514.014.01614.028。01714。0312.01814。0416。019312。072&02028。0936.02114.01040.022&01222&01248。011224227293031343841Total12。08。04。04.04.04。0224227293031343841Total12。08。04。04.04.04。04。04.04.04.025100。01517181920212223242560。068.072。076.080。084.088.092.096。0100.0從頻數看出,眾數Mo有兩個:19、23;從累計頻數看,中位數Me=23。根據定義公式計算四分位數。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3X25/4=18。75,因此Q3=27,或者,由于25和27都只有一個,因此Q3也可等于25+0.75X2=26o5。計算平均數和標準差;Mean=24.00;Std。Deviation=6.652計算偏態(tài)系數和峰態(tài)系數:Skewness=1。080;Kurtosis=0.773對網民年齡的分布特征進行綜合分析:分布,均值=24、標準差=6.652、呈右偏分布。如需看清楚分布形態(tài),需要進行分組為分組情況下的直方圖:為分組情況下的概率密度曲線:分組:1、確定組數:,取k=62、確定組距:組距=(最大值一最小值)三組數=(41—15)三6=4。3,取53、分組頻數表網絡用戶的年齡(Binned)FrequencyPercentCumulativeFrequencyCumulativePercent<=1514.014o016—20832。0936。021-25936.01872o0Valid26—30312o02184o031—352&02392o036—4014o02496o041+14.025100o0Total25100o0分組后的均值與方差:Mean23。3000Std.Deviation7o02377Variance49。333Skewness1。163Kurtosis1。302分組后的直方圖:4.3某銀行為縮短顧客到銀行辦理業(yè)務等待的時間.準備采用兩種排隊方式進行試驗:一種是所有頤客都進入一個等待隊列:另—種是顧客在三千業(yè)務窗口處列隊3排等待.為比較哪種排隊方式使顧客等待的時間更短.兩種排隊方式各隨機抽取9名顧客。得到第一種排隊方式的平均等待時間為7.2分鐘,標準差為1.97分鐘.第二種排隊方式的等待時間(單位:分鐘)如下:5.56.66.76.87.17.37.47.87.8要求:(1)畫出第二種排隊方式等待時間的莖葉圖.第二種排隊方式的等待時間(單位:分鐘)Stem-and-LeafPlotFrequencyStem&Leaf1。00Extremes(=〈5.5)3。006。6783。007。1342。007。88Stemwidth:1.00Eachleaf:1case(s)(2)計算第二種排隊時間的平均數和標準差。Mean7Std.Deviation0。714143Variance0。51(3)比較兩種排隊方式等待時間的離散程度。
第二種排隊方式的離散程度小。(4)如果讓你選擇一種排隊方式,你會選擇哪-種?試說明理由選擇第二種,均值小,離散程度小.4.4某百貨公司6月份各天的銷售額數據如下:單位:萬元257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295要求:(1)計算該百貨公司日銷售額的平均數和中位數.(2)按定義公式計算四分位數。(3)計算日銷售額的標準差。解:Statistics百貨公司每天的銷售額(萬元)30Valid30MissingMean274.1000MeanMedianMedian272.5000Std。Deviation21.17472Percentiles25260。250050272.500075291。25004.5甲乙兩個企業(yè)生產三種產品的單位成本和總成本資料如下:產品名稱單位成本(元)總成本(元)甲企業(yè)乙企業(yè)A1521003255B2030001500C3015001500要求:比較兩個企業(yè)的總平均成本,哪個高,并分析其原因。產品名稱單位成本(元)甲企業(yè)乙企業(yè)總成本(元)產品數總成本(元)產品數A1521001403255217B203000150150075C30150050150050平均成本(兀)19。4117647118。28947368調和平均數計算,得到甲的平均成本為19.41;乙的平均成本為18.29.甲的中間成本的產品多,乙的低成本的產品多。4.6在某地區(qū)抽取120家企業(yè),按利潤額進行分組,結果如下:按利潤額分組(萬元)企業(yè)數(個)200~30019300?40030400?50042500?60018600以上11合計120要求:(1)計算120家企業(yè)利潤額的平均數和標準差.(2)計算分布的偏態(tài)系數和峰態(tài)系數.解:企業(yè)利潤組中值Mi(萬元)StatisticsNValid120Missing0Mean426.6667Std.Deviation116.48445Skewness0.208Std。ErrorofSkewness0。221Kurtosis—0.625Std。ErrorofKurtosis0.4387為研究少年兒童的成長發(fā)育狀況,某研究所的一位調查人員在某城市抽取100名7?17歲的少年兒童作為樣本,另一位調查人員則抽取了1000名7?17歲的少年兒童作為樣本。請回答下面的問題,并解釋其原因。兩位調查人員所得到的樣本的平均身高是否相同?如果不同,哪組樣本的平均身高較大?兩位調查人員所得到的樣本的標準差是否相同?如果不同,哪組樣本的標準差較大?兩位調查人員得到這l100名少年兒童身高的最高者或最低者的機會是否相同?如果不同,哪位調查研究人員的機會較大?解:(1)不一定相同,無法判斷哪一個更高,但可以判斷,樣本量大的更接近于總體平均身高。不一定相同,樣本量少的標準差大的可能性大。機會不相同,樣本量大的得到最高者和最低者的身高的機會大。4.8一項關于大學生體重狀況的研究發(fā)現.男生的平均體重為60kg,標準差為5kg;女生的平均體重為50kg,標準差為5kg.請回答下面的問題:是男生的體重差異大還是女生的體重差異大?為什么?女生,因為標準差一樣,而均值男生大,所以,離散系數是男生的小,離散程度是男生的小。以磅為單位(1ks=2.21b),求體重的平均數和標準差.都是各乘以2。21,男生的平均體重為60kgX2.21=132。6磅,標準差為5kgX2.21=11.05磅;女生的平均體重為50kgX2.21=110.5磅,標準差為5kgX2。21=11。05磅.(3)粗略地估計一下,男生中有百分之幾的人體重在55kg一65kg之間?計算標準分數:Z1===-1;Z2===1,根據經驗規(guī)則,男生大約有68%的人體重在55kg一65kg之間.粗略地估計一下,女生中有百分之幾的人體重在40kg?60kg之間?計算標準分數:Z1===-2;Z2===2,根據經驗規(guī)則,女生大約有95%的人體重在40kg一60kg之間。9一家公司在招收職員時,首先要通過兩項能力測試。在A項測試中,其平均分數是100分,標準差是15分;在B項測試中,其平均分數是400分,標準差是50分。一位應試者在A項測試中得了115分,在B項測試中得了425分。與平均分數相比,該應試者哪一項測試更為理想?解:應用標準分數來考慮問題,該應試者標準分數高的測試理想。ZA===1;ZB===0.5因此,A項測試結果理想。4.10一條產品生產線平均每天的產量為3700件,標準差為50件。如果某一天的產量低于或高于平均產量,并落人士2個標準差的范圍之外,就認為該生產線“失去控制”.面是一周各天的產量,該生產線哪幾天失去了控制?時間周一周二周三周四周五周六周日產量(件)3850367036903720361035903700時間周一周二周三周四周五周六周日產量(件)3850367036903720361035903700日平均產量3700日產量標準差50標準分數Z3-0.6-0.20。4—1.8-2.20
—2-2—2—2—2-2—22222222標準分數界限周六超出界限,失去控制。4.11對10名成年人和10名幼兒的身高進行抽樣調查,結果如下:成年組166169l72177180170172174168173幼兒組686968707l7372737475要求:如果比較成年組和幼兒組的身高差異,你會采用什么樣的統計量?為什么?均值不相等,用離散系數衡量身高差異。比較分析哪一組的身高差異大?成年組幼兒組平均172.1平均71。3標準差4.201851標準差2.496664離散系數0。024415離散系數0.035016幼兒組的身高差異大.4.12一種產品需要人工組裝,現有三種可供選擇的組裝方法。為檢驗哪種方法更好,隨機抽取15個工人,讓他們分別用三種方法組裝。下面是15個工人分別用三種方法在相同的時間內組裝的產品數量:單位:個方法A方法B方法C164129125167130126168129126165130127170131126165]30128164129127168127126164128127162128127163127125166128126167128116166125126165132125要求:你準備采用什么方法來評價組裝方法的優(yōu)劣?如果讓你選擇一種方法,你會作出怎樣的選擇?試說明理由解:對比均值和離散系數的方法,選擇均值大,離散程度小的.平均方法A方法B方法C平均165。6平均128.7333333平均125.53333332。標準差標準差1.751190072標準差2.774029217131397932離散系數:VA=O。01287076,VB=0.013603237,VC=0.022097949ABC均值A方法最大,同時A的離散系數也最小,因此選擇A方法。4.13在金融證券領域,一項投資的預期收益率的變化通常用該項投資的風險來衡量。預期收益率的變化越小,投資風險越低;預期收益率的變化越大,投資風險就越高。下面的兩個直方圖,分別反映了200種商業(yè)類股票和200種高科技類股票的收益率分布。在股票市場上,高收益率往往伴隨著高風險。但投資于哪類股票,往往與投資者的類型有一定關系。(1)你認為該用什么樣的統計量來反映投資的風險?標準差或者離散系數。(2)如果選擇風險小的股票進行投資,應該選擇商業(yè)類股票還是高科技類股票?選擇離散系數小的股票,則選擇商業(yè)股票.(3)如果進行股票投資,你會選擇商業(yè)類股票還是高科技類股票?
考慮高收益,則選擇高科技股票;考慮風險,則選擇商業(yè)股票。6。1調節(jié)一個裝瓶機使其對每個瓶子的灌裝量均值為盎司,通過觀察這臺裝瓶機對每個瓶子的灌裝量服從標準差盎司的正態(tài)分布。隨機抽取由這臺機器灌裝的9個瓶子形成一個樣本,并測定每個瓶子的灌裝量。試確定樣本均值偏離總體均值不超過0.3盎司的概率。解:總體方差知道的情況下,均值的抽樣分布服從的正態(tài)分布,由正態(tài)分布,標準化得到標準正態(tài)分布:Z=?,因此,樣本均值不超過總體均值的概率P為:==2—1,查標準正態(tài)分布表得=0.8159因此,=0.63186。3,,……,表示從標準正態(tài)總體中隨機抽取的容量,n=6的一個樣本,試確定常數b,使得解:由于卡方分布是由標準正態(tài)分布的平方和構成的:設z1,z2,......,ZN是來自總體N(0,1)的樣本,則統計量服從自由度為n的X2分布,記為X2?X2(n)因此,令,則,那么由概率,可知:b=,查概率表得:b=12.596。4在習題6.1中,假定裝瓶機對瓶子的灌裝量服從方差的標準正態(tài)分布。假定我們計劃隨機抽取10個瓶子組成樣本,觀測每個瓶子的灌裝量,得到10個觀測值,用這10個觀測值我們可以求出樣本方差,確定一個合適的范圍使得有較大的概率保證S2落入其中是有用的,試求b1,b2,使得解:更加樣本方差的抽樣分布知識可知,樣本統計量:此處,n=10,,所以統計量根據卡方分布的可知:又因為:因此:則:查概率表:=3。325,=19。919,則=0。369,=1.88第四章抽樣分布與參數估計7。2某快餐店想要估計每位顧客午餐的平均花費金額。在為期3周的時間里選取49名顧客組成了一個簡單隨機樣本。(1)假定總體標準差為15元,求樣本均值的抽樣標準誤差。=2。143在95%的置信水平下,求邊際誤差.,由于是大樣本抽樣,因此樣本均值服從正態(tài)分布,因此概率度t=因此,=1。96X2。143=4.2如果樣本均值為120元,求總體均值的95%的置信區(qū)間。置信區(qū)間為:==(115.8,124.2)7。4從總體中抽取一個n=100的簡單隨機樣本,得到=81,s=12.要求:大樣本,樣本均值服從正態(tài)分布:或置信區(qū)間為:,==1.2構建的90%的置信區(qū)間。==1.645,置信區(qū)間為:=(79。03,82。97)構建的95%的置信區(qū)間。==1。96,置信區(qū)間為:=(78.65,83.35)構建的99%的置信區(qū)間.==2.576,置信區(qū)間為:=(77.91,84.09)某大學為了解學生每天上網的時間,在全校7500名學生中采取重復抽樣方法隨機抽取36人,調查他們每天上網的時間,得到下面的數據(單位:小時):3.33.16。25.82。34.15.44。53。24。42.05。42.66.41。83.55.72.32。11。91。25。14。34.23。60。81。54。71。41.22。93。52。40。53.62。5求該校大學生平均上網時間的置信區(qū)間,置信水平分別為90%,95%和99%。解:樣本均值=3。32,樣本標準差s=1。61;抽樣平均誤差:重復抽樣:==1。61/6=0.268不重復抽樣:===0。268X=0。268X0.998=0。267置信水平下的概率度:=0。9,t===1.645=0。95,t===1.96=0.99,t===2。576邊際誤差(極限誤差):=0.9,=重復抽樣:==1。645X0。268=0.441不重復抽樣:==1。645X0。267=0.439=0。95,=重復抽樣:==1。96X0.268=0.525不重復抽樣:==1.96X0.267=0.523=0.99,=重復抽樣:==2.576X0.268=0。69不重復抽樣:==2.576X0.267=0.688(5)置信區(qū)間:=0。9,重復抽樣:==(2。88,3.76)不重復抽樣:==(2.88,3。76)=0.95,重復抽樣:==(2.79,3。85)不重復抽樣:==(2.80,3。84)=0。99,重復抽樣:==(2。63,4。01)不重復抽樣:==(2。63,4.01)某居民小區(qū)為研究職工上班從家里到單位的距離,抽取了由16個人組成的一個隨機樣本,他們到單位的距離(單位:km)分別是:103148691211751015916132假定總體服從正態(tài)分布,求職工上班從家里到單位平均距離的95%的置信區(qū)間.解:小樣本,總體方差未知,用t統計量均值=9.375,樣本標準差s=4。11置信區(qū)間:=0.95,n=16,==2.13==(7。18,11。57)11某企業(yè)生產的袋裝食品采用自動打包機包裝,每袋標準重量為l00g?,F從某天生產的一批產品中按重復抽樣隨機抽取50包進行檢查,測得每包重量(單位:g)如下:每包重量(g)包數96?98298~1003100~10234102~1047104?1064合計50已知食品包重量服從正態(tài)分布,要求:(1)確定該種食品平均重量的95%的置信區(qū)間.解:大樣本,總體方差未知,用z統計量樣本均值=101。4,樣本標準差s=1。829置信區(qū)間:=0.95,==1。96==(100.89,101.91)(2)如果規(guī)定食品重量低于l00g屬于不合格,確定該批食品合格率的95%的置信區(qū)間。解:總體比率的估計大樣本,總體方差未知,用z統計量樣本比率=(50-5)/50=0。9置信區(qū)間:=0.95,==1.96==(0.8168,0.9832)7.13一家研究機構想估計在網絡公司工作的員工每周加班的平均時間,為此隨機抽取了18個員工。得到他們每周加班的時間數據如下(單位:小時):62117207081629381211921251516假定員工每周加班的時間服從正態(tài)分布。估計網絡公司員工平均每周加班時間的90%的置信區(qū)間。解:小樣本,總體方差未知,用t統計量均值=13.56,樣本標準差s=7。801置信區(qū)間:=0。90,n=18,==1.7369==(10.36,16。75)7.15在一項家電市場調查中.隨機抽取了200個居民戶,調查他們是否擁有某一品牌的電視機。其中擁有該品牌電視機的家庭占23%。求總體比例的置信區(qū)間,置信水平分別為90%和95%。解:總體比率的估計大樣本,總體方差未知,用z統計量樣本比率=0.23置信區(qū)間:=0。90,==1。645=(0.1811,0。2789)=0.95,==1.96==(0.1717,0.2883)7.20顧客到銀行辦理業(yè)務時往往需要等待一段時間,而等待時間的長短與許多因素有關,比如,銀行業(yè)務員辦理業(yè)務的速度,顧客等待排隊的方式等。為此,某銀行準備采取兩種排隊方式進行試驗,第一種排隊方式是:所有顧客都進入一個等待隊列;第二種排隊方式是:顧客在三個業(yè)務窗口處列隊三排等待。為比較哪種排隊方式使顧客等待的時間更短,銀行各隨機抽取10名顧客,他們在辦理業(yè)務時所等待的時間(單位:分鐘)如下:方式16。56.66.76.87。17.37。47.77。77.7方式24.25.45.86。26.77.77。78。59.310要求:(1)構建第一種排隊方式等待時間標準差的95%的置信區(qū)間。解:估計統計量經計算得樣本標準差=3。318置信區(qū)間:=0.95,n=10,==19.02,==2.7==(0。1075,0.7574)因此,標準差的置信區(qū)間為(0。3279,0.8703)(2)構建第二種排隊方式等待時間標準差的95%的置信區(qū)間解:估計統計量經計算得樣本標準差=0.2272置信區(qū)間:=0.95,n=10,==19.02,==2。7==(1.57,11。06)因此,標準差的置信區(qū)間為(1。25,3。33)(3)根據(1)和(2)的結果,你認為哪種排隊方式更好?第一種方式好,標準差小!7.23下表是由4對觀察值組成的隨機樣本。配對號來自總體A的樣本來自總體B的樣本1202573106485(1)計算A與B各對觀察值之差,再利用得出的差值計算和。=1.75,=2。62996(2)設分別為總體A和總體B的均值,構造的95%的置信區(qū)間.解:小樣本,配對樣本,總體方差未知,用t統計量均值=1.75,樣本標準差s=2.62996置信區(qū)間:=0.95,n=4,==3.182==(—2。43,5。93)25從兩個總體中各抽取一個=250的獨立隨機樣本,來自總體1的樣本比例為=40%,來自總體2的樣本比例為=30%.要求:(1)構造的90%的置信區(qū)間。(2)構造的95%的置信區(qū)間。解:總體比率差的估計大樣本,總體方差未知,用z統計量樣本比率p1=0.4,p2=0。3置信區(qū)間:=0。90,==1.645=(3.02%,16.98%)=0.95,==1。96=(1.68%,18。32%)7.26生產工序的方差是工序質量的一個重要度量。當方差較大時,需要對序進行改進以減小方差。下面是兩部機器生產的袋茶重量(單位:g)的數據:機器1機器23。453.223.93。223.283。353。22.983.73。383.193。33.223。753。283。33。23.053.53.383。353。33。293。332。953。453.23.343。353.273。163。483.123。283.163。283。23.183。253。33。343.25要求:構造兩個總體方差比/的95%的置信區(qū)間.解:統計量:置信區(qū)間:=0.058,=0.006n1=n2=21=0。95,==2。4645,===0。4058=(4.05,24.6)7.27根據以往的生產數據,某種產品的廢品率為2%。如果要求95%的置信區(qū)間,若要求邊際誤差不超過4%,應抽取多大的樣本?解:=0.95,==1.96==47.06,取n=48或者50.7.28某超市想要估計每個顧客平均每次購物花費的金額.根據過去的經驗,標準差大約為120元,現要求以95%的置信水平估計每個顧客平均購物金額的置信區(qū)間,并要求邊際誤差不超過20元,應抽取多少個顧客作為樣本?解:,=0。95,==1。96,=138。3,取n=139或者140,或者150。7.29假定兩個總體的標準差分別為:,,若要求誤差范圍不超過5,相應的置信水平為95%,假定,估計兩個總體均值之差時所需的樣本量為多大?解:nl=n2=,=0。95,==1。96,n1=n2===56。7,取n=58,或者60。30假定,邊際誤差E=0.05,相應的置信水平為95%,估計兩個總體比例之差時所需的樣本量為多大?解:n1=n2=,=0。95,==1.96,取p1=p2=0。5,n1=n2===768.3,取n=769,或者780或800。2一種元件,要求其使用壽命不得低于700小時?,F從一批這種元件中隨機抽取36件,測得其平均壽命為680小時。已知該元件壽命服從正態(tài)分布,=60小時,試在顯著性水平0.05下確定這批元件是否合格。解:H0:〃三700;H1:“V700已知:=680=60由于n=36>30,大樣本,因此檢驗統計量:==-2當?=0.05,查表得=1。645.因為zV—,故拒絕原假設,接受備擇假設說明這批產品不合格.4糖廠用自動打包機打包,每包標準重量是100千克.每天開工后需要檢驗一次打包機工作是否正常。某日開工后測得9包重量(單位:千克)如下:99.398.7100.5101.298.399.799.5102.1100.5已知包重服從正態(tài)分布,試檢驗該日打包機工作是否正常(a=0.05)?解:H0:〃=100;H1:〃工100經計算得:=99。9778S=1.21221檢驗統計量:==—0。055==3當a=0。05,自由度n—1=9時,查表得=2。262。因為V,樣本統計量洛在接受區(qū)域,故接受原假設,拒絕備擇假設,說明打包機工作正常。8.5某種大量生產的袋裝食品,按規(guī)定不得少于250克.今從一批該食品中任意抽取50袋,發(fā)現有6袋低于250克。若規(guī)定不符合標準的比例超過5%就不得出廠,問該批食品能否出廠(a=0.05)?解:解:H0:nW0.05;H1:n>0。05已知:p=6/50=0。12檢驗統計量:==2。271當?=0.05,查表得=1.645。因為〉,樣本統計量落在拒絕區(qū)域,故拒絕原假設,接受備擇假設,說明該批食品不能出廠.7某種電子元件的壽命x(單位:小時)服從正態(tài)分布?,F測得16只元件的壽命如下:159280101212224379179264222362168250149260485170問是否有理由認為元件的平均壽命顯著地大于225小時(a=0.05)?解:H0:“W225;H1:卩>225經計算知:=241.5s=98。726檢驗統計量:==0。669當?=0.05,自由度n—1=15時,查表得=1。753。因為tV,樣本統計量落在接受區(qū)域,故接受原假設,拒絕備擇假設,說明元件壽命沒有顯著大于225小時。10裝配一個部件時可以采用不同的方法,所關心的問題是哪一個方法的效率更高。勞動效率可以用平均裝配時間反映?,F從不同的裝配方法中各抽取12件產品,記錄各自的裝配時間(單位:分鐘)如下:甲方法:313429323538343029323126乙方法:262428293029322631293228兩總體為正態(tài)總體,且方差相同。問兩種方法的裝配時間有無顯著不同(a=0.05)?解:建立假設H0:〃]—“2=0H]:“]—〃2工0總體正態(tài),小樣本抽樣,方差未知,方差相等,檢驗統計量根據樣本數據計算,得=12,=12,=31.75,=3.19446,=28。6667,=2。46183。==8。1326=2。648?=0o05時,臨界點為==2.074,此題中〉,故拒絕原假設,認為兩種方法的裝配時間有顯著差異。8.11調查了339名50歲以上的人,其中205名吸煙者中有43個患慢性氣管炎,在134名不吸煙者中有13人患慢性氣管炎。調查數據能否支持“吸煙者容易患慢性氣管炎”這種觀點(a=0.05)?解:建立假設H0:n1^n2;H1:n1>n2p1=43/205=0.2097n1=205p2=13/134=0.097n2=134檢驗統計量當?=0.05,查表得=1。645。因為〉,拒絕原假設,說明吸煙者容易患慢性氣管炎。8.12為了控制貸款規(guī)模,某商業(yè)銀行有個內部要求,平均每項貸款數額不能超過60萬元。隨著經濟的發(fā)展,貸款規(guī)模有增大的趨勢。銀行經理想了解在同樣項目條件下,貸款的平均規(guī)模是否明顯地超過60萬元,故一個n=144的隨機樣本被抽出,測得=68.1萬元,s=45.用a=0.01的顯著性水平,采用p值進行檢驗。解:H0:〃W6O;H1:〃>60已知:=68。1s=45由于n=144>30,大樣本,因此檢驗統計量:==2。16由于>卩,因此P值=卩(z±2。16)=1—,查表的=0.9846,P值=0.0154由于P>?=0o01,故不能拒絕原假設,說明貸款的平均規(guī)模沒有明顯地超過60萬元。8.13有一種理論認為服用阿司匹林有助于減少心臟病的發(fā)生,為了進行驗證,研究人員把自愿參與實驗的22000人隨機平均分成兩組,一組人員每星期服用三次阿司匹林(樣本1),另一組人員在相同的時間服用安慰劑(樣本2)持續(xù)3年之后進行檢測,樣本1中有104人患心臟病,樣本2中有189人患心臟病.以a=0.05的顯著性水平檢驗服用阿司匹林是否可以降低心臟病發(fā)生率。解:建立假設HQ:n1^n2;H1:n1<n2p1=104/11000=0.00945n1=11000p2=189/11000=0。01718n2=11000檢驗統計量=-5當?=0o05,查表得=1.645。因為<—,拒絕原假設,說明用阿司匹林可以降低心臟病發(fā)生率。8.15有人說在大學中男生的學習成績比女生的學習成績好?,F從一個學校中隨機抽取了25名男生和16名女生,對他們進行了同樣題目的測試。測試結果表明,男生的平均成績?yōu)?2分,方差為56分,女生的平均成績?yōu)?8分,方差為49分。假設顯著性水平a=0.02,從上述數據中能得到什么結論?解:首先進行方差是否相等的檢驗:建立假設H0:=;比:工n1=25,=56,n2=16,=49==1.143當?=0o02時,=3。294,=0o346o由于<F<,檢驗統計量的值落在接受域中,所以接受原假設,說明總體方差無顯著差異。檢驗均值差:建立假設仇:竹―"2W°H1:竹—〃2>0總體正態(tài),小樣本抽樣,方差未知,方差相等,檢驗統計量根據樣本數據計算,得=25,=16,=82,=56,=78,=49=53o308=1.711?=0o02時,臨界點為==2。125,t<,故不能拒絕原假設,不能認為大學中男生的學習成績比女生的學習成績好。
10.3一家牛奶公司有4臺機器裝填牛奶,每桶的容量為4L.下面是從4臺機器中抽取的樣本數據:機器1機器2機器3機器44.053.993.974。004。014.023.984。024.024。013。973。994.043.993.954.014。004。004.00取顯著性水平a=0.01,檢驗4臺機器的裝填量是否相同?解:ANOVA每桶容量(L)平方和df均方F顯著性組間0。00730.0028。7210.001組內0。004150.000總數0。01118不相同。10.7某企業(yè)準備用三種方法組裝一種新的產品,為確定哪種方法每小時生產的產品數量最多,隨機抽取了30名工人,并指定每個人使用其中的一種方法。通過對每個工人生產的產品數進行方差分析得到下面的結果;方差分析表差異源SSdfMSFP-valueFcrit組間42022101.478102190.2459463。354131組內383627142。0740741-——總計425629-——-——要求:(1)完成上面的方差分析表.若顯著性水平a=0.05,檢驗三種方法組裝的產品數量之間是否有顯著差異?解:(2)P=0.025>a=0.05,沒有顯著差異。有5種不同品種的種子和4種不同的施肥方案,在20塊同樣面積的土地上,分別采用5種種子和4種施肥方案搭配進行試驗,取得的收獲量數據如下表:品種施肥方案1234112.09.510.49.7213.711.512.49.6314.312.311.411.1414.214.012.512.0513.014.013.111.4檢驗種子的不同品種對收獲量的影響是否有顯著差異?不同的施肥方案對收獲量的影響是否有顯著差異(a=0。05)?
解:這線圖:似乎交互作用不明顯:(1)考慮無交互作用下的方差分析:主體間效應的檢驗因變量:收獲量源III型平方和df均方FSig。校正模型37。249(a)75。3218。0820。001截距2,930.62112,930.6214,451。0120.000Fertilization_Methods18。18236。0619.2050。002Variety19.06744。7677。2400.003誤差7.901120.658總計2,975.77020校正的總計45。15019a.R方=。825(調整R方=.723)結果表明施肥方法和品種都對收獲量有顯著影響。(2)考慮有交互作用下的方差分析:主體間效應的檢驗因變量:收獲量源III型平方和df均方FSig.校正模型45.150(a)192.376.截距2,930.62112,930.621。Fertilization_Methods18.18236。061。Variety19。06744。767。Fertilization_Methods*Variety7。901120.658。誤差0.0000.總計2,975.77020校正的總計45.15019a.R方=1。000(調整R方=.)由于觀測數太少,得不到結果!10.11一家超市連鎖店進行一項研究,確定超市所在的位置和競爭者的數量對銷售額是否有顯著影響。下面是獲得的月銷售額數據(單位:萬元).超市位置競爭者數量0123個以h位于市內居民小區(qū)413859473031484045395139位于寫字樓252944433135484222305053位于郊區(qū)1872292429172827
33252632取顯著性水平a=0.01,檢驗:(1)競爭者的數量對銷售額是否有顯著影響?(2)超市的位置對銷售額是否有顯著影響?(3)競爭者的數量和超市的位置對銷售額是否有交互影響?解:畫折線圖:交互作用不十分明顯。(1)進行無交互方差分析:主體間效應的檢驗因變量:月銷售額(萬元)源III型平方和df均方FSig。校正模型2814.556(a)5562.91115。2050.000截距44,802.778144,802。7781,210。1590。000LocationSuperMaket1,736.2222868.11123.4480。000Amountcompetitors1,078.3333359.4449。7090.000誤差1,110。6673037.022總計48,728.00036校正的總計3,925.22235a.R方=.717(調整R方=.670)看到超市位置有顯著影響,而競爭者數量沒有顯著影響,且影響強度僅為0.327,因此考慮是否存在交互作用。(2)有交互方差分析:看到超市位置有顯著影響,而競爭者數量和交互作用均無顯著影響主體間效應的檢驗因變量:月銷售額(萬元)源III型平方和df均方FSig
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教學課題的申報書
- 合作購銷產品合同范例
- 商法學課題申報書
- 眼科課題申報書范文
- 江西省中醫(yī)課題申報書
- 【復習大串講】【中職專用】高二語文上學期期末綜合測試題(五)(職業(yè)模塊)(解析版)
- 做廣告物料合同范本
- 合作加工木炭合同范本
- 單位簽訂租賃合同范本
- 主播居間服務合同范本
- EPC總承包項目財務管理要點
- 一年級下學期開學家長會
- 發(fā)動機飛輪殼加工工藝及其夾具設計
- 中國控制會議論文模板英文
- 前廳羅盤系統操作細則
- 迅達扶梯9300AE故障代碼
- 二年級下冊數學課件-第三單元 對稱圖形 ppt(29張) 北京版(2021秋)
- 六十四卦爻象全圖(彩色)(共6頁)
- 《各種各樣的橋》ppt課件
- 5-VMware Workstation的基本使用
- 機動車維修經營備案表
評論
0/150
提交評論