


版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、一、判斷題(題數(shù):15,共15.0分)定量屬性可以是整數(shù)值或者是連續(xù)值。()正確答案:V分類模型的誤差大致分為兩種:訓練誤差(trainingerror)和泛化誤差(generalizationerror)。()正確答案:V1. 在決策樹中,隨著樹中結點數(shù)變得太大,即使模型的訓練誤差還在繼續(xù)減低,但是檢驗誤差開始增大,這是出現(xiàn)了模型擬合不足的問題。()正確答案:x在聚類分析當中,簇內的相似性越大,簇間的差別越大,聚類的效果就越差。()正確答案:x聚類分析可以看作是一種非監(jiān)督的分類。()正確答案:V如果一個對象不強屬于任何簇,那么該對象是基于聚類的離群點。()正確答案:V2. 允許誤差應根據錯誤
2、記錄對整個系統(tǒng)可能帶來的破壞來確定,通常正是那些低使用率的產品或不常使用的產品為庫存誤差帶來很大麻煩,因此應結合數(shù)量方差百分比和絕對值方差來確定誤差。()正確答案:V3. 召回率反映的是預測為正中的樣本中正例的概率。()正確答案:X4. 支持度表示前項與后項在一個數(shù)據集中同時出現(xiàn)的頻率。()正確答案:V5. 最大最小值標準化法也叫極值法,該方法適用于已知數(shù)據集的最小值或最大值情況。()正確答案:V6. 波特五力模型中五個壓力來源是供應商議價能力、購買者的議價能力、行業(yè)新進入者的威脅、替代產品的威脅及企業(yè)內部的管理壓力。()(1.0分)1.0分正確答案:X異常值在數(shù)理統(tǒng)計里一般是指一組觀測值中與
3、平均值的偏差超過三倍標準差的測定值。()正確答案:X7. 數(shù)據可視化可以便于人們對數(shù)據的理解。()正確答案:V8. 大數(shù)據思維,是指一種意識,認為公開的數(shù)據一旦處理得當可以為人類急需解決的問題提供答案。()正確答案:V9. 資金本身具有時間價值。()正確答案:X二、單選題(題數(shù):30,共45.0分)某超市研究銷售記錄發(fā)現(xiàn),購買牛奶的人很大概率會購買面包,這種屬于數(shù)據挖掘的哪類問題?()A、聚類分析B、關聯(lián)規(guī)則C、分類分析D、自然語言處理正確答案:B以下兩種描述分別對應哪兩種對分類算法的評價標準?()(a)警察抓殺人犯,描述警察抓的人中有多少個是殺人犯的標準。(b)描述有多少比例的殺人犯給警察抓
4、了的標準。A、Precision,RecallB、Recall,PrecisionC、Precision,ROCD、Recall,ROC正確答案:A1. 將原始數(shù)據進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務?()A、數(shù)據獲取B、分類和預測C、數(shù)據預處理D、數(shù)據可視化正確答案:C當不知道數(shù)據所帶標簽時,可以使用哪種技術促使帶同類標簽的數(shù)據與帶其他標簽的數(shù)據相分離?()A、分類B、聚類C、關聯(lián)分析D、主成分分析正確答案:B下面哪種不屬于數(shù)據預處理的方法?()A、變量代換B、離散化C、聚集D、估計遺漏值正確答案:D假設12個銷售價格記錄組已經排序如下:5,10,11,13,15,35,
5、50,55,72,92,204,215使用等寬劃分(寬度為50)方法將它們劃分成四個箱,求15在哪個箱子里?()A、第一個B、第二個C、第三個D、第四個正確答案:A2. 以下哪些算法是分類算法?()A、DBSCANB、C4.5C、K-MeanD、K-medoids正確答案:B以下哪些分類方法可以較好地避免樣本的不平衡問題?()A、KNNB、SVMC、BayesD、神經網絡正確答案:A關于K均值和DBSCAN的比較,以下說法不正確的是()。A、K均值丟棄被它識別為噪聲的對象,而DBSCAN一般聚類所有對象B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C、K均值很難處理非球形的
6、簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會合并有重疊的簇下列不屬于關聯(lián)分析的關鍵要素的是(A、支持度B、置信度C、滿意度D、提升度正確答案:C因子分析的主要作用有()A、對變量進行降維B、對變量進行判別C、對變量進行聚類D、以上都不對正確答案:AROC曲線凸向哪個角,代表模型越理想?()A、左上角B、左下角C、右上角D、右下角正確答案:ASQL語句中刪除表的命令是()A、DROPTABLEB、DELETETABLEC、ERASETABLED、DELETEDBF正確答案:A在多元回歸模型的檢驗中,目的
7、是檢驗每一個自變量與因變量在指定顯著性水平上是否存在線性相關關系的檢驗是()A、r檢驗B、t檢驗C、f檢驗D、DW檢驗正確答案:B3. ()提供的支撐技術,有效解決了大數(shù)據分析、研發(fā)的問題,比如虛擬化技術、并行計算、海量存儲和海量管理A、點計算B、線計算C、云計算D、面計算)的數(shù)據采集技)的數(shù)據采集技4. 智能健康手環(huán)的應用開發(fā),體現(xiàn)了(術的應用。A、統(tǒng)計報表B、網絡爬蟲C、API接口D、傳感器正確答案:D下列關于數(shù)據重組的說法中,錯誤的是()A、數(shù)據重組是數(shù)據的重新生產和重新采集B、數(shù)據重組能夠使數(shù)據煥發(fā)新的光芒C、數(shù)據重組實現(xiàn)的關鍵在于多源數(shù)據融合和數(shù)據集成D、數(shù)據重組有利于實現(xiàn)新穎的數(shù)據
8、模式創(chuàng)新正確答案:A美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明了大風與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據分析理念中的()A、在數(shù)據基礎上傾向于全體數(shù)據而不是抽樣數(shù)據B、在分析方法上更注重相關分析而不是因果分析C、在分析效果上更追究效率而不是絕對精確D、在數(shù)據規(guī)模上強調相對數(shù)據而不是絕對數(shù)據5. 當前國內社會中,最為突出的大數(shù)據環(huán)境是(A、互聯(lián)網B、物聯(lián)網C、綜合國力D、自然資源正確答案:A6. 下列關于聚類挖掘技術的說法中,錯誤的是()A、不預先設定數(shù)據歸類類目,完全根據數(shù)據本身性質將數(shù)據聚合成不同類別B、要求同類數(shù)據的內容相似度盡可能小C、要求不同類數(shù)據的內容相似度
9、盡可能小D、與分類挖掘技術相似的是,都是要對數(shù)據進行分類處理正確答案:B下列關于大數(shù)據的分析理念的說法中,錯誤的是()A、在數(shù)據基礎上傾向于全體數(shù)據而不是抽樣數(shù)據B、在分析方法上更注重相關分析而不是因果分析C、在分析效果上更追究效率而不是絕對精確D、在數(shù)據規(guī)模上強調相對數(shù)據而不是絕對數(shù)據正確答案:D對于企業(yè)來說,數(shù)據使用的關鍵是()A、數(shù)據收集B、數(shù)據存儲C、數(shù)據分析D、數(shù)據再利用正確答案:D數(shù)據倉庫的最終目的是()A、收集業(yè)務需求B、建立數(shù)據倉庫邏輯模型C、開發(fā)數(shù)據倉庫的應用分析D、為用戶和業(yè)務部門提供決策支持正確答案:D大數(shù)據背景下,數(shù)據支撐業(yè)務的目的是()A、建立數(shù)據科學B、完成數(shù)據應用
10、C、配備數(shù)據硬件D、吸納數(shù)據人才正確答案:B在SQL中,創(chuàng)建數(shù)據庫用的命令是()A、CREATESCHEMAB、CREATETABLEC、CREATEVIEWD、CREATEDATABASE正確答案:D下列四項中,不屬于數(shù)據庫特點的是()A、數(shù)據共享B、數(shù)據完整性C、數(shù)據冗余很高D、數(shù)據獨立性高正確答案:C資金的時間價值是()A、同一資金在同一時點上價值量的差額B、同一資金在不同時點上價值量的差額C、不同資金在同一時點上價值量的差額D、不同資金在不同時點上價值量的差額正確答案:B下列選項中屬于現(xiàn)金流入的項目是()A、所得稅B、建設投資C、經營成本D、營業(yè)收入正確答案:D下列關于計算機存儲容量單
11、位的說法中,錯誤的是()A、1KB<1MB<1GBB、基本單位是字節(jié)(Byte)C、一個漢字需要一個字節(jié)的存儲空間D、一個字節(jié)能夠容納一個英文字符正確答案:C7. 按數(shù)據的結構程度來劃分,分為()A、結構化數(shù)據半結構化數(shù)據非結構化數(shù)據B、強結構化數(shù)據弱結構化數(shù)據C、截面數(shù)據面板數(shù)據D、一級數(shù)據二級數(shù)據三級數(shù)據正確答案:A三、多選題(題數(shù):20,共40.0分)1. 以下屬于數(shù)據預處理的是()A、缺失值填充B、噪聲數(shù)據剔除C、異常值識別D、數(shù)據可視化正確答案:ABC2. 缺失值的處理方法有哪些?()A、用平均值填充B、忽略缺失記錄C、以任意數(shù)據填充D、用默認值填充正確答案:ABD3.
12、以下屬于數(shù)據規(guī)約方法的是()A、數(shù)據離散化B、數(shù)據標準化C、噪聲數(shù)據識別D、數(shù)據壓縮正確答案:AD4. 數(shù)據挖掘的預測建模任務主要包括哪幾大類問題?()A、分類B、回歸C、模式發(fā)現(xiàn)D、模式匹配正確答案:AB以下說法正確的有哪些?()A、大數(shù)據僅僅是講數(shù)據的體量大B、大數(shù)據對傳統(tǒng)行業(yè)有幫助C、大數(shù)據會帶來機器智能D、大數(shù)據是一種思維方式正確答案:BCD5. 關于大數(shù)據的來源,以下理解正確的是()A、大數(shù)據是數(shù)據量變積累達到質變的結果B、數(shù)據的產生需要經歷很長時間C、我們每個人都是數(shù)據的制造者D、當今的世界,基本上一切都可以用數(shù)字表達,所以叫數(shù)字化的世界正確答案:ACD大數(shù)據在今天這個時間點上爆發(fā)
13、的原因有哪些?()A、各種傳感器無時無刻不在為我們提供大量的數(shù)據B、各種監(jiān)控設備無時無刻不在為我們提供大量的數(shù)據C、各種智能設備無時無刻不在為我們提供大量的數(shù)據D、互聯(lián)網的收集和積累正確答案:ABCD6. ()這些數(shù)據特性都是對聚類分析具有很強影響的A、高維性B、規(guī)模C、稀疏性D、噪聲和離群點正確答案:ABCD以下哪個分布是右偏分布?()A、均勻分布B、卡方分布C、F分布D、對數(shù)正態(tài)分布正確答案:BCD以下哪些變量使用RFM方法構造出來的?()A、最近3期境外消費金額B、最近6期網銀消費交易筆數(shù)C、信用額度D、距最近一次逾期的月數(shù)正確答案:ABD如下表student中,如何篩選type為包含數(shù)
14、學或語文的記錄?()A、select*fromstudentwheretype=“數(shù)學”andtype=“語文”B、select*fromstudentwheretype=“數(shù)學”ortype=“語文”C、select*fromstudentwheretypein(“數(shù)學”文”)D、select*fromstudentwheretypein(“數(shù)學”文”)正確答案:BC7. 主成分分析計算選擇相關系數(shù)計算法時,確定主成分個數(shù)的大致原則包括()A、特征根值大于1B、特征根值大于0.8C、累積特征根值加總占總特征根值的80%以上D、累積特征根值加總占總特征根值的90%以上正確答案:AC8. 在客戶
15、關系管理中,客戶的生命周期都包括()階段A、潛在客戶B、響應客戶C、即得客戶D、流失客戶正確答案:ABCD9. 分箱方法有哪些?()(2.0分)0.0分A、等深分箱B、等寬分箱C、數(shù)據標準化D、自定義區(qū)間法正確答案:ABD利用Apriori算法計算頻繁項集可以有效降低計算頻繁集的時間復雜度。在以下的購物籃中產生支持度不小于3的候選3-項集,在候選2-項集中需要剪枝的是()ID項集。1面包、牛奶2面包、尿布、啤酒、雞蛋3牛奶、尿布、啤酒、可樂4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可樂A、啤酒、尿布B、啤酒、面包C、面包、尿布D、啤酒、牛奶正確答案:BD10. 我們可以用哪種方式來避免決策樹過度擬合的問題?()A、利用修剪法來限制樹的深度B、利用盆栽法規(guī)定每個節(jié)點下的最小的記錄數(shù)目C、利用逐步回歸法來刪除部分數(shù)據D、目前并無適合的方法來處理這問題正確答案:AB11
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 質量知識培訓內容
- 農業(yè)綠色發(fā)展政策支持下的農業(yè)可持續(xù)發(fā)展與農業(yè)生態(tài)環(huán)境保護報告
- 閱讀活動配樂課件設計規(guī)范
- 數(shù)字簽名技術在工業(yè)互聯(lián)網平臺設備狀態(tài)監(jiān)測中的規(guī)范報告
- 2025年醫(yī)療美容行業(yè)美容整形行業(yè)投資分析與風險控制報告
- 休閑農業(yè)與鄉(xiāng)村旅游融合發(fā)展規(guī)劃報告-2025年鄉(xiāng)村旅游與城市旅游融合發(fā)展研究
- 仿制藥一致性評價政策對2025年醫(yī)藥市場醫(yī)藥企業(yè)市場機會挖掘的影響報告
- 餐飲行業(yè)2025年人才短缺問題及培養(yǎng)體系優(yōu)化研究報告
- 文化產業(yè)園產業(yè)集聚與服務體系構建中的文化產業(yè)園區(qū)文化傳承與創(chuàng)新研究報告
- 縱隔腫瘤疑難病例討論
- 仗鼓舞比賽活動方案
- 南昌職業(yè)大學《影視配音創(chuàng)作》2023-2024學年第二學期期末試卷
- 2024年湖南融通資源循環(huán)產業(yè)有限公司技能崗位招聘真題
- 樹木砍伐合同簡單協(xié)議書
- 2025年安徽省農業(yè)職業(yè)技能大賽(水生物病害防治員)備賽試題庫(含答案)
- 安全大講堂教學課件
- 城市更新中歷史文化街區(qū)非物質文化遺產保護與開發(fā)報告
- 家裝修泥水工合同協(xié)議
- 2023承壓設備產品焊接試件的力學性能檢驗
- ESG趨勢下企業(yè)財務管理新挑戰(zhàn)
- 2024年公安機關理論考試題庫500道(基礎題)
評論
0/150
提交評論