南京工業(yè)大學(xué)《應(yīng)用統(tǒng)計學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷_第1頁
南京工業(yè)大學(xué)《應(yīng)用統(tǒng)計學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷_第2頁
南京工業(yè)大學(xué)《應(yīng)用統(tǒng)計學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷_第3頁
南京工業(yè)大學(xué)《應(yīng)用統(tǒng)計學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷_第4頁
南京工業(yè)大學(xué)《應(yīng)用統(tǒng)計學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

自覺遵守考場紀律如考試作弊此答卷無效密自覺遵守考場紀律如考試作弊此答卷無效密封線第1頁,共3頁南京工業(yè)大學(xué)《應(yīng)用統(tǒng)計學(xué)》

2022-2023學(xué)年第一學(xué)期期末試卷院(系)_______班級_______學(xué)號_______姓名_______題號一二三總分得分批閱人一、單選題(本大題共20個小題,每小題2分,共40分.在每小題給出的四個選項中,只有一項是符合題目要求的.)1、在統(tǒng)計推斷中,P值的含義是什么?()A.拒絕原假設(shè)的最小顯著性水平B.接受原假設(shè)的概率C.犯第一類錯誤的概率D.犯第二類錯誤的概率2、某商場記錄了每天的客流量,數(shù)據(jù)呈現(xiàn)明顯的季節(jié)性。若要進行預(yù)測,哪種時間序列預(yù)測方法較為合適?()A.簡單移動平均法B.指數(shù)平滑法C.季節(jié)性多元回歸D.自回歸移動平均模型3、某公司對員工的工作滿意度進行調(diào)查,結(jié)果分為非常滿意、滿意、一般、不滿意、非常不滿意。若要分析不同部門員工工作滿意度的分布是否相同,應(yīng)采用以下哪種檢驗方法?A.卡方擬合優(yōu)度檢驗B.卡方獨立性檢驗C.秩和檢驗D.方差分析4、對于一個存在多重共線性的回歸模型,使用嶺回歸方法進行修正,其原理是?A.增加變量B.減少變量C.對系數(shù)進行約束D.對數(shù)據(jù)進行標準化5、為檢驗兩個總體的方差是否相等,應(yīng)采用哪種檢驗方法?()A.F檢驗B.t檢驗C.卡方檢驗D.以上都不對6、某工廠生產(chǎn)的零件長度服從正態(tài)分布,均值為10cm,標準差為0.2cm?,F(xiàn)從生產(chǎn)線上隨機抽取一個零件,其長度大于10.4cm的概率為()A.0.0228B.0.1587C.0.3085D.0.47727、已知一組數(shù)據(jù)的偏態(tài)系數(shù)為-0.8,峰態(tài)系數(shù)為2.5,說明這組數(shù)據(jù)的分布形態(tài)是?A.左偏且尖峰B.右偏且尖峰C.左偏且平峰D.右偏且平峰8、為了研究某種疾病的發(fā)病率與年齡、性別、生活習(xí)慣等因素的關(guān)系,收集了大量病例數(shù)據(jù)。在建立統(tǒng)計模型時,以下哪種方法可以用于篩選重要的影響因素?A.逐步回歸B.嶺回歸C.Lasso回歸D.以上都是9、在一項關(guān)于城市居民消費習(xí)慣的調(diào)查中,隨機抽取了500個家庭,記錄了他們每月在食品、服裝、娛樂等方面的支出。以下哪種統(tǒng)計方法最適合用于分析不同收入水平家庭的消費結(jié)構(gòu)差異?()A.描述統(tǒng)計B.推斷統(tǒng)計C.參數(shù)估計D.假設(shè)檢驗10、在一個正態(tài)分布中,如果將數(shù)據(jù)進行標準化變換,那么變換后的數(shù)據(jù)服從什么分布?()A.正態(tài)分布B.t分布C.標準正態(tài)分布D.無法確定11、某超市為了解顧客的購買行為,對一周內(nèi)的銷售數(shù)據(jù)進行分析。已知某種商品的銷售額每天都在變化,這種變化屬于()A.長期趨勢B.季節(jié)變動C.循環(huán)變動D.不規(guī)則變動12、在一項關(guān)于城市居民出行方式的調(diào)查中,隨機抽取了800個樣本。其中選擇公交出行的有300人,選擇地鐵出行的有250人,選擇私家車出行的有150人,選擇其他方式出行的有100人。如果要檢驗不同出行方式的選擇比例是否相同,應(yīng)采用哪種檢驗方法?()A.卡方檢驗B.t檢驗C.F檢驗D.Z檢驗13、在一個樣本容量為100的數(shù)據(jù)集中,均值為50,標準差為10。如果將每個數(shù)據(jù)都乘以2,那么新數(shù)據(jù)集的均值和標準差將分別變?yōu)槎嗌伲浚ǎ〢.100和20B.100和10C.50和20D.50和1014、對于一組包含異常值的數(shù)據(jù),若要描述其集中趨勢,以下哪種統(tǒng)計量受異常值影響較???()A.算術(shù)平均數(shù)B.幾何平均數(shù)C.中位數(shù)D.眾數(shù)15、在構(gòu)建統(tǒng)計模型時,如果自變量之間存在高度的線性相關(guān),可能會導(dǎo)致什么問題?()A.欠擬合B.過擬合C.模型不穩(wěn)定D.以上都有可能16、已知兩個變量X和Y之間存在線性關(guān)系,通過樣本數(shù)據(jù)計算得到回歸方程為Y=2X+3。若X的取值范圍為[1,5],當(dāng)X=3時,Y的預(yù)測值的95%置信區(qū)間是多少?A.[7,11]B.[8,10]C.[9,11]D.[6,10]17、某市場調(diào)查公司想了解消費者對某品牌飲料口味的偏好,隨機抽取了500名消費者進行問卷調(diào)查。在分析數(shù)據(jù)時,發(fā)現(xiàn)有部分消費者未回答某些問題,對于這些缺失值,最合適的處理方法是?()A.直接刪除含缺失值的樣本B.用均值填充缺失值C.用中位數(shù)填充缺失值D.采用多重插補法18、在進行相關(guān)分析時,如果兩個變量之間的相關(guān)系數(shù)接近于0,能否說明它們之間沒有關(guān)系?A.能B.不能C.不一定D.以上都不對19、在進行方差分析時,如果發(fā)現(xiàn)組間差異顯著,接下來通常會進行什么操作?A.多重比較B.相關(guān)分析C.回歸分析D.以上都不是20、在對數(shù)據(jù)進行標準化處理時,標準化后的變量均值和標準差分別是多少?A.0和1B.1和0C.原變量的均值和標準差D.無法確定二、簡答題(本大題共4個小題,共40分)1、(本題10分)解釋功效分析在實驗設(shè)計中的作用。以一個心理學(xué)實驗為例,說明如何進行功效分析和確定合適的樣本量。2、(本題10分)對于一個包含大量缺失值的數(shù)據(jù)集合,在進行數(shù)據(jù)分析之前應(yīng)如何處理?請詳細說明可以采用的方法和策略,并討論每種方法的優(yōu)缺點。3、(本題10分)對于一個時間序列數(shù)據(jù),如何判斷其是否平穩(wěn)?如果不平穩(wěn),有哪些方法可以使其平穩(wěn)化?4、(本題10分)詳細說明如何使用主成分分析來降低數(shù)據(jù)維度,解釋主成分的提取原則和如何解釋主成分的含義,并舉例應(yīng)用。三、案例分析題(本大題共2個小題,共20分)1、(本題10分)某電商平臺想了解不同年齡段消費者的購買行為和消費偏好,收集了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論