




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第1章 緒論1什么是統(tǒng)計學?怎樣理解統(tǒng)計學與統(tǒng)計數據的關系?2試舉出日常生活或工作中統(tǒng)計數據及其規(guī)律性的例子。3一家大型油漆零售商收到了客戶關于油漆罐分量不足的許多抱怨。因此,他們開始檢查供貨商的集裝箱,有問題的將其退回。最近的一個集裝箱裝的是2 440加侖的油漆罐。這家零售商抽查了50罐油漆,每一罐的質量精確到4位小數。裝滿的油漆罐應為4.536 kg。要求: (1)描述總體; (2)描述研究變量; (3)描述樣本;(4)描述推斷。答:(1)總體:最近的一個集裝箱內的全部油漆;(2)研究變量:裝滿的油漆罐的質量;(3)樣本:最近的一個集裝箱內的50罐油漆;(4)推斷:50罐油漆的質量應為4.
2、536×50226.8 kg。4“可樂戰(zhàn)”是描述市場上“可口可樂”與“百事可樂”激烈競爭的一個流行術語。這場戰(zhàn)役因影視明星、運動員的參與以及消費者對品嘗試驗優(yōu)先權的抱怨而頗具特色。假定作為百事可樂營銷戰(zhàn)役的一部分,選擇了1000名消費者進行匿名性質的品嘗試驗(即在品嘗試驗中,兩個品牌不做外觀標記),請每一名被測試者說出A品牌或B品牌中哪個口味更好。要求: (1)描述總體;(2)描述研究變量;(3)描述樣本; (4)一描述推斷。答:(1)總體:市場上的“可口可樂”與“百事可樂”(2)研究變量:更好口味的品牌名稱;(3)樣本:1000名消費者品嘗的兩個品牌(4)推斷:兩個品牌中哪個口味更
3、好。第2章 統(tǒng)計數據的描述練習題1.為評價家電行業(yè)售后服務的質量,隨機抽取了由100家庭構成的一個樣本。服務質量的等級分別表示為:A.好;B.較好;C.一般;D.差;E.較差。調查結果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1) 指出上面的數據屬于什么類型;(2) 用Excel制作一張頻數分布表;(3) 繪制一張條形圖,反映評價等級的分布。解:(1)由于表2.21中的數據為服務質量的等級,可以進行優(yōu)劣等級比較,但不能計算差異大小
4、,屬于順序數據。(2)頻數分布表如下:服務質量等級評價的頻數分布服務質量等級家庭數(頻數)頻率%A1414B2121C3232D1818E1515合計100100 (3)條形圖的制作:將上表(包含總標題,去掉合計欄)復制到Excel表中,點擊:圖表向導條形圖選擇子圖表類型完成(見Excel練習題2.1)。即得到如下的條形圖:2.某行業(yè)管理局所屬40個企業(yè)2002年的產品銷售收入數據如下(單位:萬元):15212412911610010392951271041051191141158710311814213512511710810511010713712013611710897881231151
5、19138112146113126(1)根據上面的數據進行適當的分組,編制頻數分布表,并計算出累積頻數和累積頻率;(2)如果按規(guī)定:銷售收入在125萬元以上為先進企業(yè),115萬125萬元為良好企業(yè),105萬115萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進行分組。解:(1)要求對銷售收入的數據進行分組, 全部數據中,最大的為152,最小的為87,知數據全距為15287=65; 為便于計算和分析,確定將數據分為6組,各組組距為10,組限以整10劃分; 為使數據的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值87可能落在最小組之下,最大值152可
6、能落在最大組之上,將最小組和最大組設計成開口形式;按照“上限不在組內”的原則,用劃記法統(tǒng)計各組內數據的個數企業(yè)數,也可以用Excel進行排序統(tǒng)計(見Excel練習題2.2),將結果填入表內,得到頻數分布表如下表中的左兩列;將各組企業(yè)數除以企業(yè)總數40,得到各組頻率,填入表中第三列;在向上的數軸中標出頻數的分布,由下至上逐組計算企業(yè)數的向上累積及頻率的向上累積,由上至下逐組計算企業(yè)數的向下累積及頻率的向下累積。整理得到頻數分布表如下:40個企業(yè)按產品銷售收入分組表按銷售收入分組(萬元)企業(yè)數(個)頻率(%)向上累積向下累積企業(yè)數頻率企業(yè)數頻率100以下1001101101201201301301
7、40140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合計40100.0 (2)按題目要求分組并進行統(tǒng)計,得到分組表如下: 某管理局下屬40個企分組表按銷售收入分組(萬元)企業(yè)數(個)頻率(%)先進企業(yè)良好企業(yè)一般企業(yè)落后企業(yè)11119927.527.522.522.5合計40100.0 3.某百貨公司連續(xù)40天的商品銷售額如下(單位:萬元):41252947383430384340463645373736454333443528463
8、430374426384442363737493942323635 根據上面的數據進行適當的分組,編制頻數分布表,并繪制直方圖。解:全部數據中,最大的為49,最小的為25,知數據全距為4925=24; 為便于計算和分析,確定將數據分為5組,各組組距為5,組限以整5的倍數劃分; 為使數據的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值24已落在最小組之中,最大值49已落在最大組之中,故將各組均設計成閉口形式;按照“上限不在組內”的原則,用劃記法或用Excel統(tǒng)計各組內數據的個數天數,(見Excel練習題2.3)并填入表內,得到頻數分布表如下表中的左兩列;將各組天數除以總天數40,得到
9、各組頻率,填入表中第三列;得到頻數分布表如下:某百貨公司日商品銷售額分組表按銷售額分組(萬元)頻數(天)頻率(%)2530303535404045455046159610.015.037.522.515.0合計40100.0 直方圖:將上表(包含總標題,去掉合計欄)復制到Excel表中,點擊:圖表向導柱形圖選擇子圖表類型完成。即得到如下的直方圖:(見Excel練習題2.3).為了確定燈泡的使用壽命(小時),在一批燈泡中隨機抽取100只進行測試,所得結果如下:700716728719685709691684705718706715712722691708690692707701708729694
10、681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用計算機對上面的數據進行排序;(2)以組距為10進行等距分組,整理成頻數分布表,并繪制直方圖;(3)繪制莖葉圖,并與直方圖作比較。
11、解:(1)排序:將全部數據復制到Excel中,并移動到同一列,點擊:數據排序確定,即完成數據排序的工作。(見Excel練習題2.4)(2)按題目要求,利用已排序的Excel表數據進行分組及統(tǒng)計,得到頻數分布表如下:(見Excel練習題2.4) 100只燈泡使用壽命非頻數分布按使用壽命分組(小時)燈泡個數(只)頻率(%)650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合計100100 制作直方圖:將上表(包含總標題,去掉合計欄)復制到Excel表中,選擇全表后,點擊
12、:圖表向導柱形圖選擇子圖表類型完成。即得到如下的直方圖:(見Excel練習題2.4)(3)制作莖葉圖:以十位以上數作為莖,填入表格的首列,將百、十位數相同的數據的個位數按由小到大的順序填入相應行中,即成為葉,得到莖葉圖如下:651866145686713467968112333455588996900111122233445566677888899700011223456667788897100223356778897201225678997335674147將直方圖與莖葉圖對比,可見兩圖十分相似。.下面是北方某城市12月份各天氣溫的記錄數據:-32-4-7-11-1789-6-7-14-18
13、-15-9-6-105-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-60-15-4-9-3-32-4-4-16-175-6-5(1) 指出上面的數據屬于什么類型;(2) 對上面的數據進行適當的分組;(3) 繪制直方圖,說明該城市氣溫分布的特點。解:(1)由于各天氣溫的記錄數據屬于數值型數據,它們可以比較高低,且0不表示沒有,因此是定距數據。(2)分組如下: 由于全部數據中,最大的為9,最小的為25,知數據全距為9(25)=34; 為便于計算和分析,確定將數據分為7組,各組組距為5,
14、組限以整5的倍數劃分; 為使數據的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值25已落在最小組之中,最大值9已落在最大組之中,故將各組均設計成閉口形式;按照“上限不在組內”的原則,用劃記法(或Excel排序法,見Excel練習題2.5)統(tǒng)計各組內數據的個數天數,并填入表內,得到頻數分布表如下表;北方某城市12月份各天氣溫分組天數(天)-25-208-20-158-15-1010-10-514-50140545107合計65(3)制作直方圖:將上表(包含總標題,去掉合計欄)復制到Excel表中,點擊:圖表向導柱形圖選擇子圖表類型完成。即得到如下的直方圖:(見Excel練習題2.5)
15、.下面是某考試管理中心對2002年參加成人自學考試的12000名學生的年齡分組數據:年齡18192121222425293034353940444559%1.934.734.117.26.42.71.81.2(1) 對這個年齡分布作直方圖;(2) 從直方圖分析成人自學考試人員年齡分布的特點。解:(1)制作直方圖:將上表復制到Excel表中,點擊:圖表向導柱形圖選擇子圖表類型完成。即得到如下的直方圖:(見Excel練習題2.6)(2)年齡分布的特點:自學考試人員年齡的分布為右偏。.下面是A、B兩個班學生的數學考試成績數據:A班:4457596061616263636566666769707071
16、727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100(1) 將兩個班的考試成績用一個公共的莖制成莖葉圖;(2) 比較兩個班考試成績分布的特點。解:(1)將樹莖放置中間,A班樹葉向左生長,B班樹葉向右生長,得莖葉圖如下:A班樹莖B班數據個數樹 葉樹葉數據個數03592144044842975122456677
17、789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)比較可知:A班考試成績的分布比較集中,且平均分數較高;B班考試成績的分布比A班分散,且平均成績較A班低。8.1997年我國幾個主要城市各月份的平均相對濕度數據如下表,試繪制箱線圖,并分析各城市平均相對濕度的分布特征。月份北京長春南京鄭州武漢廣州成都昆明蘭州西安14970765777727965516724168715775808365416734750776881808158497445
18、0397267758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272資料來源:中國統(tǒng)計年鑒1998,中國統(tǒng)計出版社1998,第10頁。解:箱線圖如下:(特征請讀者自己分析)9.某百貨公司6月份各天的銷售額數據如下(單位:萬元):257276297252238310240236265278
19、271292261281301274267280291258272284268303273263322249269295 (1)計算該百貨公司日銷售額的均值、中位數和四分位數;(2)計算日銷售額的標準差。 解:(1)將全部30個數據輸入Excel表中同列,點擊列標,得到30個數據的總和為8223, 于是得該百貨公司日銷售額的均值:(見Excel練習題2.9) =274.1(萬元)或點選單元格后,點擊“自動求和”“平均值”,在函數EVERAGE()的空格中輸入“A1:A30”,回車,得到均值也為274.1。在Excel表中將30個數據重新排序,則中位數位于30個數據的中間位置,即靠中的第15、第
20、16兩個數272和273的平均數:Me=272.5(萬元)由于中位數位于第15個數靠上半位的位置上,所以前四分位數位于第1第15個數據的中間位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,從而:QL=261+=261.25(萬元) 同理,后四分位數位于第16第30個數據的中間位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,從而:QU=291=290.75(萬元)。(2)未分組數據的標準差計算公式為: s=利用上公式代入數據計算是個較為復雜的工作。手工計算時,須計算30個數據的離差平方,并將其
21、求和,()再代入公式計算其結果:得s=21.1742。(見Excel練習題2.9)我們可以利用Excel表直接計算標準差:點選數據列(A列)的最末空格,再點擊菜單欄中“”符號右邊的小三角“”,選擇“其它函數”選擇函數“STDEV” “確定”,在出現的函數參數窗口中的Number1右邊的空欄中輸入:A1:A30,“確定”,即在A列最末空格中出現數值:21.17412,即為這30個數據的標準差。于是:(萬元)。(見Excel練習題2.9)10.甲乙兩個企業(yè)生產三種產品的單位成本和總成本資料如下:產品名稱單位成本(元)總成本(元)甲企業(yè)乙企業(yè)ABC15203021003000150032551500
22、1500比較哪個企業(yè)的總平均成本高?并分析其原因。解:設產品單位成本為 x,產量為f,則總成本為xf,由于:平均成本=,而已知數據中缺產量f 的數據,又因個別產品產量f =從而 =,于是得:甲企業(yè)平均成本19.41(元),乙企業(yè)平均成本18.29(元),對比可見,甲企業(yè)的總平均成本較高。原因:盡管兩個企業(yè)的單位成本相同,但單位成本較低的產品在乙企業(yè)的產量中所占比重較大,因此拉低了總平均成本。11.在某地區(qū)抽取的120家企業(yè)按利潤額進行分組,結果如下:按利潤額分組(萬元)企業(yè)數(個)20030019300400304005004250060018600以上11合計120 計算120家企業(yè)利潤額的
23、均值和標準差。解:設各組平均利潤為 x,企業(yè)數為f,則組總利潤為xf, 由于數據按組距式分組,須計算組中值作為各組平均利潤,列表計算得:按利潤額分組(萬元)組中值企業(yè)數(個)總利潤xfxf20030025019475030040035030105004005004504218900500600550189900600以上650117150合計12051200于是,120家企業(yè)平均利潤為: = 426.67(萬元);分組數據的標準差計算公式為: s= 手動計算須列表計算各組數據離差平方和(x426.67)2f,并求和,再代入計算公式:列表計算如下組中值企業(yè)數(個)(x426.67)2fxf250
24、19593033.489135030176348.6674504222860.133855018273785.200265011548639.1779合計1201614666.668表格中(x426.67)2f的計算方法:方法一:將表格復制到Excel表中,點擊第三列的頂行單元格后,在輸入欄中輸入:=(a3426.67)* (a3426.67)*b3,回車,得到該行的計算結果;點選結果所在單元格,并將鼠標移動到該單元格的右下方,當鼠標變成黑“”字時,壓下左鍵并拉動鼠標到該列最后一組數據對應的單元格處放開,則各組數據的(x426.67)2f計算完畢;于是得標準差:(見Excel練習題2.11)s
25、 =116.48(萬元)。點擊第三列的合計單元格后,點擊菜單欄中的“”號,回車,即獲得第三列數據的和。方法二:將各組組中值x復制到Excel的A列中,并按各組次數f在同列中復制,使該列中共有f個x,120個數據生成后,點選A列的最末空格,再點擊菜單欄中“”符號右邊的小三角“”,選擇“其它函數”選擇函數“STDEV” “確定”,在出現的函數參數窗口中的Number1右邊的空欄中輸入:A1:A30,“確定”,即在A列最末空格中出現數值:116.4845,即為這120個數據的標準差。(見Excel練習題2.11)于是得標準差:s =116.4845(萬元)。12.為研究少年兒童的成長發(fā)育狀況,某研究
26、所的一位調查人員在某城市抽取100名717歲的少年兒童作為樣本,另一位調查人員則抽取了1000名717歲的少年兒童作為樣本。請回答下面的問題,并解釋其原因。 (1)哪一位調查研究人員在其所抽取的樣本中得到的少年兒童的平均身高較大?或者這兩組樣本的平均身高相同? (2)哪一位調查研究人員在其所抽取的樣本中得到的少年兒童身高的標準差較大?或者這兩組樣本的標準差相同?(3)哪一位調查研究人員有可能得到這1100名少年兒童的最高者或最低者?或者對兩位調查研究人員來說,這種機會是相同的?解:(1)(2)兩位調查人員所得到的平均身高和標準差應該差不多相同,因為均值和標準差的大小基本上不受樣本大小的影響。(
27、3)具有較大樣本的調查人員有更大的機會取到最高或最低者,因為樣本越大,變化的范圍就可能越大。 13.一項關于大學生體重狀況的研究發(fā)現,男生的平均體重為60公斤,標準差為5公斤;女生的平均體重為50公斤,標準差為5公斤。請回答下面的問題: (1)是男生的體重差異大還是女生的體重差異大?為什么? (2)以磅為單位(1公斤2.2磅),求體重的平均數和標準差。 (3)粗略地估計一下,男生中有百分之幾的人體重在55公斤到65公斤之間? (4)粗略地估計一下,女生中有百分之幾的人體重在40公斤到60公斤之間? 解:(1)由于兩組的平均體重不相等,應通過比較離散系數確定體重差異較大的組:因為女生的離散系數為
28、V=0.1男生體重的離散系數為V=0.08對比可知女生的體重差異較大。 (2) 男生:=27.27(磅),s =2.27(磅); 女生:=22.73(磅),s =2.27(磅); (3)68%;(4)95%。 14.對10名成年人和10名幼兒的身高(厘米)進行抽樣調查,結果如下:成年組166169172177180170172174168173幼兒組68696870717372737475 (1)要比較成年組和幼兒組的身高差異,你會采用什么樣的指標測度值?為什么?(2)比較分析哪一組的身高差異大?解:(1)應采用離散系數,因為成年人和幼兒的身高處于不同的水平,采用標準差比較不合適。離散系數消除了不同組數據水平高低的影響,采用離散系數就較為合理。(2)利用Excel進行計算,得成年組身高的平均數為172.1,標準差為4.202,從而得:成年組身高的離散系數:;又得幼兒組身高的平均數為71.3,標準差為2.497,從而得: 幼兒組身高的離散系數:; 由于幼兒組身高的離散系數大于成年組身高的離散系數,說明幼兒組身高的離散程度相對較大。15.一種產品需要人工組裝,現有三種可供選擇的組裝方法。為檢驗哪種方法更好,隨機抽取15個工人,讓他們分別用三種方法組裝。下面是15個工人分別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度智慧物流平臺股權投資合同協議
- 2025年度無社保派遣員工勞動合同
- 2025年度電子產品銷售兼職傭金結算合同
- 二零二五年度貓咪寵物美容學院加盟買賣協議
- 《物流系統(tǒng)分析》課件 6.3.1單節(jié)點選址模型1
- 高中家長會:家校攜手·共創(chuàng)明天課件-高一上學期家長會
- 常年聘請法律顧問的合同
- 2025年遼寧貨運從業(yè)資格證試題庫及答案
- 金秋助學發(fā)言稿
- 智能家居產品市場占有率表格
- 科普版小學英語六年級下冊全冊教案
- 腦梗合并心衰護理查房
- 婦聯普法知識競賽參考試題庫300題(含答案)
- T-NAHIEM 101-2023 急診科建設與設備配置標準
- 【綠色家園你我共建】約會春天擁抱綠色-2024年3月12日植樹節(jié)主題班會(小學通用版)
- 解分式方程50題八年級數學上冊
- 溶液鍍膜法完整版本
- 消化道出血應急預案
- 【溫州眼鏡出口遭遇技術貿易壁壘的現狀及對策(定量論文)15000字】
- AI技術在保險行業(yè)的應用
- 文華財經“麥語言”函數手冊
評論
0/150
提交評論