




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
2025年統(tǒng)計學(xué)專業(yè)期末考試:數(shù)據(jù)分析計算題庫與數(shù)據(jù)挖掘考試時間:______分鐘總分:______分姓名:______一、描述統(tǒng)計計算要求:請根據(jù)以下給出的數(shù)據(jù),完成以下描述統(tǒng)計計算。已知某班級學(xué)生的期末考試成績?nèi)缦拢▎挝唬悍郑?0,82,75,60,68,95,88,90,72,65,78,85,76,89,93,77,64,80,67,91。1.計算這組數(shù)據(jù)的平均數(shù)。2.計算這組數(shù)據(jù)的眾數(shù)。3.計算這組數(shù)據(jù)的極差。4.計算這組數(shù)據(jù)的中位數(shù)。5.計算這組數(shù)據(jù)的方差。6.計算這組數(shù)據(jù)的標準差。7.計算這組數(shù)據(jù)的四分位數(shù)Q1、Q2和Q3。8.計算這組數(shù)據(jù)的偏度。9.計算這組數(shù)據(jù)的峰度。10.將這組數(shù)據(jù)從小到大排序。二、概率論計算要求:請根據(jù)以下給出的條件,完成以下概率論計算。假設(shè)一個盒子里有5個紅球和3個藍球,隨機從中取出兩個球。1.計算取出的兩個球都是紅球的概率。2.計算取出的兩個球中至少有一個紅球的概率。3.計算取出的兩個球都是藍球的概率。4.計算取出的兩個球中至少有一個藍球的概率。5.計算取出的第一個球是紅球,第二個球是藍球的概率。6.計算取出的第一個球是紅球,第二個球是紅球的概率。7.計算取出的第一個球是藍球,第二個球是紅球的概率。8.計算取出的第一個球是藍球,第二個球是藍球的概率。9.計算取出的兩個球都是同一種顏色的概率。10.計算取出的兩個球中,紅球和藍球各取一個的概率。三、數(shù)據(jù)挖掘要求:請根據(jù)以下給出的數(shù)據(jù),完成以下數(shù)據(jù)挖掘任務(wù)。某公司收集了以下顧客購買記錄數(shù)據(jù):顧客ID|商品ID|購買數(shù)量|購買時間---|---|---|---1|101|2|2021-01-011|102|1|2021-01-022|103|3|2021-01-032|104|2|2021-01-043|105|1|2021-01-053|106|2|2021-01-064|107|3|2021-01-074|108|1|2021-01-085|109|2|2021-01-095|110|1|2021-01-101.根據(jù)購買時間,對顧客進行聚類分析。2.根據(jù)購買數(shù)量,對商品進行聚類分析。3.根據(jù)顧客ID,分析顧客的購買行為。4.根據(jù)商品ID,分析商品的受歡迎程度。5.根據(jù)購買時間,分析顧客的購買趨勢。6.根據(jù)購買數(shù)量,分析商品的銷量情況。7.根據(jù)顧客ID,分析顧客的購買頻率。8.根據(jù)商品ID,分析商品的購買概率。9.根據(jù)購買時間,分析顧客的購買習(xí)慣。10.根據(jù)購買數(shù)量,分析顧客的購買偏好。四、假設(shè)檢驗要求:根據(jù)以下假設(shè)檢驗問題,完成相應(yīng)的計算。假設(shè)某產(chǎn)品合格率為95%,現(xiàn)從該產(chǎn)品中隨機抽取10個產(chǎn)品進行檢驗,其中有2個不合格。請使用0.05的顯著性水平進行假設(shè)檢驗,判斷該產(chǎn)品合格率是否發(fā)生了顯著變化。1.提出原假設(shè)和備擇假設(shè)。2.計算檢驗統(tǒng)計量。3.確定拒絕域。4.計算p值。5.根據(jù)p值判斷是否拒絕原假設(shè)。6.如果拒絕原假設(shè),說明產(chǎn)品合格率發(fā)生了什么變化。7.如果不拒絕原假設(shè),說明產(chǎn)品合格率是否保持不變。8.計算樣本比例。9.計算樣本比例的標準誤差。10.計算置信區(qū)間。五、線性回歸分析要求:根據(jù)以下線性回歸數(shù)據(jù),完成相應(yīng)的分析。已知某地區(qū)居民收入(Y)與教育程度(X)的線性回歸方程為:Y=5000+200X。其中,樣本數(shù)據(jù)如下:居民收入(Y)|教育程度(X)---|---30000|1040000|1235000|1142000|1333000|101.計算回歸系數(shù)b。2.計算回歸系數(shù)a。3.計算R2值。4.計算F統(tǒng)計量。5.判斷回歸模型是否顯著。6.計算教育程度對居民收入的影響。7.計算居民收入的標準誤差。8.計算教育程度的預(yù)測值。9.計算預(yù)測值的標準誤差。10.計算預(yù)測值的置信區(qū)間。六、時間序列分析要求:根據(jù)以下時間序列數(shù)據(jù),完成相應(yīng)的分析。某城市近5年的居民消費支出(單位:萬元)如下:年份|居民消費支出---|---2016|8002017|8502018|9002019|9502020|10001.計算平均消費支出。2.計算消費支出的標準差。3.計算消費支出的自相關(guān)系數(shù)。4.計算消費支出的偏自相關(guān)系數(shù)。5.判斷消費支出是否存在趨勢。6.判斷消費支出是否存在季節(jié)性。7.判斷消費支出是否存在周期性。8.計算消費支出的移動平均。9.計算消費支出的指數(shù)平滑。10.預(yù)測2021年的居民消費支出。本次試卷答案如下:一、描述統(tǒng)計計算1.平均數(shù)=(70+82+75+60+68+95+88+90+72+65+78+85+76+89+93+77+64+80+67+91)/20=78.12.眾數(shù):由于每個數(shù)出現(xiàn)的次數(shù)都是1次,因此沒有眾數(shù)。3.極差=最大值-最小值=95-60=354.中位數(shù):將數(shù)據(jù)從小到大排序后,位于中間的數(shù)是第10和第11個數(shù)的平均值,即(72+78)/2=755.方差=[(70-78.1)^2+(82-78.1)^2+...+(91-78.1)^2]/20=197.696.標準差=√方差=√197.69≈14.057.四分位數(shù)Q1=數(shù)據(jù)排序后第5個數(shù)=68,Q2(中位數(shù))=75,Q3=數(shù)據(jù)排序后第15個數(shù)=898.偏度=(Σ[(xi-μ)^3]/n)/(σ^3)≈0.0169.峰度=(Σ[(xi-μ)^4]/n)/(σ^4)≈0.42810.排序后的數(shù)據(jù):60,64,65,67,68,67,70,72,75,76,78,80,82,85,88,89,90,91,93,95二、概率論計算1.P(兩個紅球)=(5/8)*(4/7)=5/142.P(至少一個紅球)=1-P(兩個藍球)=1-(3/8)*(2/7)=11/143.P(兩個藍球)=(3/8)*(2/7)=3/284.P(至少一個藍球)=1-P(兩個紅球)=1-(5/8)*(4/7)=9/145.P(第一個紅球,第二個藍球)=(5/8)*(3/7)=15/566.P(第一個紅球,第二個紅球)=(5/8)*(4/7)=5/147.P(第一個藍球,第二個紅球)=(3/8)*(5/7)=15/568.P(第一個藍球,第二個藍球)=(3/8)*(2/7)=3/289.P(同一種顏色)=P(兩個紅球)+P(兩個藍球)=5/14+3/28=13/2810.P(紅球和藍球各一個)=P(第一個紅球,第二個藍球)+P(第一個藍球,第二個紅球)=15/56+15/56=15/28三、數(shù)據(jù)挖掘1.聚類分析:根據(jù)購買時間進行時間序列聚類,將顧客分為不同的購買周期。2.聚類分析:根據(jù)購買數(shù)量進行聚類,將商品分為不同的銷量類別。3.購買行為分析:分析每個顧客的購買次數(shù)、購買頻率和購買偏好。4.受歡迎程度分析:分析每個商品的購買次數(shù)、購買頻率和購買偏好。5.購買趨勢分析:分析購買時間的分布,識別購買高峰和低谷。6.銷量情況分析:分析每個商品的購買數(shù)量,識別暢銷和滯銷商品。7.購買頻率分析:計算每個顧客的平均購買頻率,識別高頻購買顧客。8.購買概率分析:計算每個商品的購買概率,識別購買概率高的商品。9.購買習(xí)慣分析:分析顧客的購買時間分布,識別購買習(xí)慣。10.購買偏好分析:分析顧客的購買商品組合,識別購買偏好。四、假設(shè)檢驗1.原假設(shè)H0:產(chǎn)品合格率仍為95%備擇假設(shè)H1:產(chǎn)品合格率發(fā)生了變化2.檢驗統(tǒng)計量=(樣本比例-總體比例)/樣本比例的標準誤差3.拒絕域:p值<0.054.p值:根據(jù)樣本比例和標準誤差計算得到5.根據(jù)p值判斷是否拒絕原假設(shè)6.如果拒絕原假設(shè),說明產(chǎn)品合格率顯著下降7.如果不拒絕原假設(shè),說明產(chǎn)品合格率保持不變8.樣本比例=(樣本中不合格數(shù)量/樣本總數(shù))=2/10=0.29.樣本比例的標準誤差=√[(總體比例*(1-總體比例))/樣本總數(shù)]10.置信區(qū)間:根據(jù)樣本比例和標準誤差計算得到五、線性回歸分析1.回歸系數(shù)b=∑[(xi-x?)(yi-?)]/∑[(xi-x?)^2]2.回歸系數(shù)a=?-b*x?3.R2值=∑[(yi-?)^2]/∑[(yi-y?)^2]4.F統(tǒng)計量=(R2值*n-2)/(1-R2值)*(n-2)5.判斷回歸模型是否顯著:如果F統(tǒng)計量大于臨界值,則模型顯著6.教育程度對居民收入的影響=b7.居民收入的標準誤差=√[Σ[(yi-y?)^2]/(n-2)]8.教育程度的預(yù)測值=a+b*X9.預(yù)測值的標準誤差=√[Σ[(yi-y?)^2]/(n-2)]10.預(yù)測值的置信區(qū)間:根據(jù)預(yù)測值和標準誤差計算得到六、時間序列分析1.平均消費支出=(800+850+900+950+1000)/5=9102.消費支出的標準差=√[Σ[(xi-μ)^2]/(n-1)]3.消費支出的自相關(guān)系數(shù)=Σ[(xi-μ)(xi-k-μ)]/(n-k)/[Σ[(xi-μ)^2]/(n-1)]4.消費支出的偏自相關(guān)系數(shù)=Σ[(xi-μ)(xi-k-μ)*(xi-l-μ)]/[Σ[(xi-μ)^2]/(n-1)]*[Σ[(xi-l-μ)^2]/(n-l)]5.判斷消費支出是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 如何選擇2024年二手車評估師考試的復(fù)習(xí)資料及試題答案
- 食品生產(chǎn)環(huán)境衛(wèi)生要求試題及答案
- 汽車美容師團隊協(xié)作能力與任務(wù)分配試題及答案
- 2024年汽車維修工考試的知識體系
- 藥物與飲食的相互作用試題及答案
- 計算機基礎(chǔ)考試要點概述試題及答案2024
- 2025年小學(xué)一年級口語考試試題及答案
- 2024年統(tǒng)計學(xué)考試復(fù)習(xí)中應(yīng)避免的誤區(qū)試題及答案
- 2025年語文考試布置試題及答案
- 汽車維修工考試材料準備題目及答案
- 工業(yè)產(chǎn)品生產(chǎn)單位工業(yè)產(chǎn)品質(zhì)量安全日管控制度(包含記錄)
- 第4章-動車組列車餐飲服務(wù)操作技能《高速鐵路列車餐飲服務(wù)》
- 電子表格紅色方格紙A420X20
- 校長接待日登記表
- 望京SOHO中心工程標準化實施匯報圖文詳細
- 人工全髖關(guān)節(jié)置換術(shù)演示文稿
- 變壓器比率差動保護的校驗方法(圖文)
- 05價值觀探索-職業(yè)生涯規(guī)劃
- HY/T 075-2005海洋信息分類與代碼
- 全封閉聲屏障施工專項方案正文范本
- 頰癌病人的護理查房
評論
0/150
提交評論