已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一、 判斷題1.數(shù)據(jù)根據(jù)計量尺度不同可以分為分類數(shù)據(jù)和數(shù)值型數(shù)據(jù)。正確答案: 2.多次拋一枚硬幣,正面朝上的頻率是1/2。正確答案: 3.歸納法是一種從個別到一般的推理方法。正確答案: 4.datahoop中輸入的數(shù)據(jù)必須是數(shù)值型的。正確答案: 5.置信水平是假設(shè)檢驗中犯第一類錯誤的概率。正確答案: 6.當兩種產(chǎn)品為互補品時,其交叉彈性小于零。正確答案: 7.時間序列分解法可以有乘法模型和加法模型兩種表示方式,其中乘法模型都是相對值來表示預測值的,加法模型都是用絕對值來表示預測值的。正確答案: 8.需求定價法的核心思想是力求在需求高漲時收取較低價格,而當需求低落時則收取較高價格。正確答案: 9.盈虧平衡分析是靜態(tài)分析,不考慮資金的時間價值和項目壽命周期內(nèi)的現(xiàn)金流量的變化。正確答案: 10.決策樹算法易于理解好實現(xiàn),且對缺失值、異常值和共線性都不敏感,是做分類預測的首選算法。正確答案: 11.隨機森林中的每棵樹都不進行剪枝,因此過擬合的風險很高。正確答案: 12.當?shù)箓鬟f神經(jīng)網(wǎng)絡(BP神經(jīng)網(wǎng)絡)無隱藏層,輸出層個數(shù)只有一個的時候,也可以看做是邏輯回歸模型。正確答案: 13.維規(guī)約即事先規(guī)定所取模型的維數(shù),可以認為是降維的一種。正確答案: 14.標準差越小,表示離散程度越小,風險越大;反之離散程度越大,風險越小。正確答案: 15.離群點是一個實際觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機制產(chǎn)生的。正確答案: 二、 單選題1.SQL語言中,刪除一個表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是( )A、DELETEB、DROPC、CLEARD、REMORE正確答案: A 2.數(shù)據(jù)庫系統(tǒng)是由( )組成的A、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和用戶B、數(shù)據(jù)文件、命令文件和報表C、數(shù)據(jù)庫文件結(jié)構(gòu)和數(shù)據(jù)D、常量、變量和函數(shù)正確答案: A 3.假如學生考試成績以“優(yōu)”.“良”.“及格”和“不及格”來記錄,為了說明全班同學考試成績的水平高低,其集中趨勢的測度( )A、可以采用算術(shù)平均數(shù)B、可以采用眾數(shù)或中位數(shù)C、只能采用眾數(shù)D、只能采用四分位數(shù)正確答案: C 4.以下哪個變量可以反映客戶的忠誠度?( )A、購買頻次B、購買金額C、最后一次購買時間D、購買金額波動率正確答案: A 5.以下哪個類型的變量在作預測客戶流失的模型中最有解釋力度?A、人口基本數(shù)據(jù),比如年齡和性別B、基本社會狀態(tài)數(shù)據(jù),比如收入和職業(yè)C、業(yè)務數(shù)據(jù),比如消費頻次D、業(yè)務數(shù)據(jù)的衍生變量,比如最近3個月消費頻次的變化情況正確答案: D 6.下面關(guān)于聚類分析說法錯誤的是( )A、一定存在一個最優(yōu)的分類B、聚類分析是無監(jiān)督學習C、聚類分析可以用于判斷異常值D、聚類分析即:物以類聚,人以群分正確答案: A 7.某小區(qū)60居民訂晚報,45訂青年報,30兩報均訂,隨機抽一戶。則至少訂一種報的概率為( )A、0.82B、0.85C、0.80D、0.75正確答案: D 8.在 Excel 工作表中,在某單元格內(nèi)輸入數(shù)值 123 ,不正確的輸入形式是( )A、123B、=123C、+123D、*123正確答案: D 9.在對歷史數(shù)據(jù)集進行分區(qū)之前進行數(shù)據(jù)清洗(缺失值填補等)的缺點是什么A、違反了建模的假設(shè)條件B、加大了處理的難度C、無法針對分區(qū)后各個數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗D、無法對不同數(shù)據(jù)清理的方法進行比較,以選擇最優(yōu)方法正確答案: D 10.當一個連續(xù)變量的缺失值占比在85%左右時,以下哪種方式最合理( )A、直接使用該變量B、根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量C、使用多重插補的方法進行缺失值填補D、直接刪除該變量正確答案: B 11.Naive Bayes是屬于數(shù)據(jù)挖掘中的什么方法?A、聚類B、分類C、時間序列D、關(guān)聯(lián)規(guī)則正確答案: B 12.有一條關(guān)聯(lián)規(guī)則為A B,此規(guī)則的信心水平(confidence)為60%,則代表( )A、買B商品的顧客中,有60%的顧客會同時購買AB、同時購買A,B兩商品的顧客,占所有顧客的60%C、買A商品的顧客中,有60%的顧客會同時購買BD、兩商品A,B在交易數(shù)據(jù)庫中同時被購買的機率為60%正確答案: C 13.企業(yè)要建立預測模型,需準備建模數(shù)據(jù)集,以下四條描述建模數(shù)據(jù)集正確的是( )A、數(shù)據(jù)越多越好B、盡可能多的適合的數(shù)據(jù)C、數(shù)據(jù)越少越好D、以上三條都不正確正確答案: B 14.在有指導的數(shù)據(jù)挖掘中,有關(guān)測試集的說法錯誤的是( )A、測試集和訓練集是相互聯(lián)系的B、測試集是用以測試模型的數(shù)據(jù)集C、通常測試集大約占總樣本的三分之一D、K-次交叉驗證中,測試集只有 1 個,訓練集有K-1個正確答案: A 15.用簡單隨機重復抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%,則樣本容量需要擴大到原來的( )A、2倍B、3倍C、4倍D、5倍正確答案: C 16.回歸分析的第一步是( )A、確定解釋量和被解釋變量B、確定回歸模型C、建立回歸方程D、進行檢驗正確答案: A 17.關(guān)于主成分數(shù)目的選取,正確的是( )A、保留多少個主成分取決于累計方差在方差總和中所占百分比B、一般選擇50%以上C、選擇前兩個就可以D、選擇的數(shù)目和變量的個數(shù)一致正確答案: A 18.下列四項中,不屬于數(shù)據(jù)庫特點的是( )A、數(shù)據(jù)共享B、數(shù)據(jù)完整性C、數(shù)據(jù)冗余很高D、數(shù)據(jù)獨立性高正確答案: C 19.將復雜的地址簡化成北、中、南、東四區(qū),是在進行?A、數(shù)據(jù)正規(guī)化B、數(shù)據(jù)一般化C、數(shù)據(jù)離散化D、數(shù)據(jù)整合正確答案: B20.以下哪個指標不能用于線性回歸中的模型比較( )A、R方B、調(diào)整R方C、AICD、BIC正確答案: A 21.RFM方法中的F說明客戶的( )A、興趣度B、粘性C、當前價值D、未來價值正確答案: A 22.數(shù)據(jù)挖掘技術(shù)包括三個主要的部分 ( )A、數(shù)據(jù)、模型、技術(shù)B、算法、技術(shù)、領(lǐng)域知識C、數(shù)據(jù)、建模能力、算法與技術(shù)D、建模能力、算法與技術(shù)、領(lǐng)域知識正確答案: C 23.下面關(guān)于因子分析的說法正確的是( )A、因子分析就是主成分分析B、因子之間可相關(guān)也可不相關(guān)C、因子受量綱的影響D、可以對因子進行旋轉(zhuǎn),使其意義更明顯正確答案: D 24.以下敘述正確的是( )A、極差較少受異常值的影響B(tài)、四分位差較少受異常值的影響C、方差較少受異常值的影響D、標準差較少受異常值的影響正確答案: B 25.以下關(guān)于人工神經(jīng)網(wǎng)絡(ANN)的描述錯誤的有( )A、神經(jīng)網(wǎng)絡對訓練數(shù)據(jù)中的噪聲非常魯棒B、可以處理冗余特征C、訓練ANN是一個很耗時的過程D、至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡正確答案: A 26.當時間序列的環(huán)比增長速度大體相同時,適宜擬合( )A、指數(shù)曲線B、拋物線C、直線D、對數(shù)曲線正確答案: A 27.某家長為了使孩子在第3-6年上大學的4年中,每年年初得到10000元助學基金,他應在2年前在銀行存入多少錢?(年利率按5%計算)( )A、33771B、30291C、32163D、45256正確答案: A 28.蘋果公司對IPHONE的降價行為屬于( )A、地域性差別定價B、時間性差別定價C、非線性定價或數(shù)量折扣定價D、其他形式的定價正確答案: B 29.設(shè)X=1,2,3是頻繁項集,則可由X可產(chǎn)生( )個關(guān)聯(lián)規(guī)則。A、3B、4C、5D、6正確答案: D 30.以下哪些分類方法可以較好地避免樣本的不平衡問題?( )A、KNNB、SVMC、BayesD、神經(jīng)網(wǎng)絡正確答案: A 三、 多選題1.以下哪個聚類分析的方法是利用統(tǒng)計學定義的距離進行度量( )A、層次聚類法B、快速聚類法(K-Means)C、基于密度的聚類法D、基于網(wǎng)格的聚類法正確答案: AB 2.天貓分析人員希望通過聚類方法定位代商家刷信用級別的違規(guī)者,以下那種操作不應該進行 ( )A、對變量進行標準化B、對變量進行百分位秩或Turkey正態(tài)性轉(zhuǎn)換C、對變量進行因子分析或聚類分析D、對變量進行分箱處理正確答案: BD 3.如下表student中,如何篩選type為包含數(shù)學或語文的記錄?ID type score A01 數(shù)學 78A02 語文 76A03 英語 90A04 數(shù)學 68A05 英語 84A、select * from student where type=”數(shù)學” and type=”語文”B、select * from student where type=”數(shù)學” or type=”語文”C、select * from student where type in (”數(shù)學” , ”語文”)D、select * from student where type in (”數(shù)學” ”語文”) 正確答案: BC 4.以下哪個分布是右偏分布( )A、均勻分布B、卡方分布C、F分布D、對數(shù)正態(tài)分布正確答案: BCD 5.在假設(shè)檢驗中,當我們做出拒絕原假設(shè)而接受備擇假設(shè)的結(jié)論時,表示( )A、有充足的理由否定原假設(shè)B、原假設(shè)必定是錯誤的C、犯錯誤的概率不大于a D、犯錯誤的概率不大于bE、在H。成立的情況下發(fā)生了小概率事件正確答案: ACE 6.若檢驗統(tǒng)計量F近似等于1,說明( )A、組間方差中不包含系統(tǒng)因素的影響B(tài)、組內(nèi)方差中不包含系統(tǒng)因素的影響C、組間方差中包含系統(tǒng)因素的影響D、方差分析中不應拒絕原假設(shè)正確答案: AD 7.下列何種算法可以幫助我們做數(shù)值的預測(Prediction)?A、Apriori B、Decision TreeC、Naive BayesD、Linear Regression正確答案: BD 8.某種產(chǎn)品的生產(chǎn)總費用2003年為50萬元,比2002年多2萬元,而單位產(chǎn)品成本2003年比2002年降低5%,則( )A、生產(chǎn)費用總指數(shù)為104.17%B、生產(chǎn)費用指數(shù)為108.56%C、單位成本指數(shù)為95% D、產(chǎn)量指數(shù)為109.65%E、由于成本降低而節(jié)約的生產(chǎn)費用為2.63萬元正確答案: ACDE 9.配合一元線性回歸方程須具備下列前提條件( )A、現(xiàn)象間確實存在數(shù)量上的相互依存關(guān)系B、現(xiàn)象間的關(guān)系是直線關(guān)系,這種直線關(guān)系可用散點圖來表示C、具備一組自變量與因變量的對應資料,且能明確哪個是自變量,哪個是因變量D、兩個變量之間不是對等關(guān)系正確答案: ABCD 10.回歸變差(或回歸平方和)是指( )A、被解釋變量的實際值與平均值的離差平方和B、被解釋變量的回歸值與平均值的離差平方和C、被解釋變量的總變差與剩余變差之差D、解釋變量變動所引起的被解釋變量的變差正確答案: BCD 11.產(chǎn)品成本費用按其與產(chǎn)量變化的關(guān)系分為( )A、可變成本B、固定成本C、付現(xiàn)成本D、沉沒成本正確答案: AB 12.統(tǒng)計決策的基本原則是( )A、可行性B、發(fā)展性C、合理性D、經(jīng)濟性正確答案: ACD 13.隨機抽樣方法有( )A、等距隨機抽樣B、綜合隨機抽樣C、簡單隨機抽樣D、分群隨機抽樣正確答案: ACD 14.完全競爭性的市場具有( )等特點。A、任一企業(yè)無法操縱市場 B、少數(shù)企業(yè)可以影響交易數(shù)量C、多個競爭企業(yè)同時存在 D、企業(yè)必須采取隨行就市定價法 正確答案: ACD 15.在全面調(diào)查和抽樣調(diào)查中都存在的誤差是( )A、系統(tǒng)誤差B、登記性誤差C、責任心誤差D、技術(shù)性誤差正確答案: BCD 16.在作邏輯回歸時,如果區(qū)域這個變量,當Region=A時Y取值均為1,無法確定是否出現(xiàn)的是哪個問題?A、共線性B、異常值C、擬完全分離(Quasi-complete separation)D、缺失值正確答案: ABD 17.下面給出的t檢驗的結(jié)果,( )表明接受原假設(shè),顯著性水平
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度知識產(chǎn)權(quán)質(zhì)押融資合同原告代理詞4篇
- 2025年度珠寶行業(yè)專業(yè)展會組織與管理合同3篇
- 二零二五版木地板原材料采購與庫存管理合同8篇
- 二零二五版生態(tài)修復項目工程建議書編制合同2篇
- 2025年現(xiàn)代學徒制校企合作教學資源共享協(xié)議3篇
- 2025版小區(qū)快遞柜場地租賃與快遞配送服務協(xié)議3篇
- 二零二五年度彩鋼瓦屋頂安裝施工服務協(xié)議3篇
- 2025年度學校校園蟲害防治與環(huán)境衛(wèi)生合同4篇
- 2025年度個人工廠生產(chǎn)許可證及轉(zhuǎn)讓合同4篇
- 二零二五年度城市公共交通系統(tǒng)優(yōu)化承包合作協(xié)議4篇
- 四川省成都市武侯區(qū)2023-2024學年九年級上學期期末考試化學試題
- 初一到初三英語單詞表2182個帶音標打印版
- 2024年秋季人教版七年級上冊生物全冊教學課件(2024年秋季新版教材)
- 環(huán)境衛(wèi)生學及消毒滅菌效果監(jiān)測
- 2024年共青團入團積極分子考試題庫(含答案)
- 碎屑巖油藏注水水質(zhì)指標及分析方法
- 【S洲際酒店婚禮策劃方案設(shè)計6800字(論文)】
- 鐵路項目征地拆遷工作體會課件
- 醫(yī)院死亡報告年終分析報告
- 中國教育史(第四版)全套教學課件
- 2023年11月英語二級筆譯真題及答案(筆譯實務)
評論
0/150
提交評論