版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
計(jì)算機(jī)三級(jí)數(shù)據(jù)庫(kù)技術(shù)(數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘)機(jī)試模擬試卷1(共4套)(共109題)計(jì)算機(jī)三級(jí)數(shù)據(jù)庫(kù)技術(shù)(數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘)機(jī)試模擬試卷第1套一、選擇題(本題共15題,每題1.0分,共15分。)1、設(shè)有m個(gè)的用戶集合US={u1,…,um},現(xiàn)對(duì)他們的行為數(shù)據(jù)進(jìn)行處理,使得每個(gè)用戶ui對(duì)應(yīng)一個(gè)n維向量Vi=[vi1,…,vin],用于表示用戶ui的特征。設(shè)有函數(shù)sim(Vi,Vj)用于判定用戶ui與用戶uj之間的相似性。若有算法A,能根據(jù)用戶間的相似性,將US劃分成k個(gè)子集合,并使屬于同一子集合的客戶間的相似性盡可能大,不屬于同一子集合的客戶間的相似性盡可能小。則算法A屬于一種()A、聚類算法B、分類算法C、關(guān)聯(lián)分析算法D、回預(yù)測(cè)法標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:聚類將一個(gè)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能相似而不同組間的數(shù)據(jù)盡可能的不同。它與分類的一個(gè)不同點(diǎn)在于,它強(qiáng)調(diào)同一個(gè)組中的對(duì)象有較高的相似度,不同組中的對(duì)象之間差別很大。分類和聚類的區(qū)別在于,分類事先知道有哪些類別可以分。聚類,事先不知道將要分成哪些類,需有聚類算法來(lái)自動(dòng)確定。綜上可知,算法A屬于聚類算法。2、下面說(shuō)法正確的是()A、數(shù)據(jù)倉(cāng)庫(kù)是從數(shù)據(jù)庫(kù)中導(dǎo)入的大量數(shù)據(jù),并對(duì)結(jié)構(gòu)和存儲(chǔ)進(jìn)行組織以提高查詢效率B、使用數(shù)據(jù)倉(cāng)庫(kù)的目的在于對(duì)已有數(shù)據(jù)進(jìn)行高速的匯總和統(tǒng)計(jì)C、數(shù)據(jù)挖掘采用適當(dāng)?shù)乃惴?,從?shù)據(jù)倉(cāng)庫(kù)的海量數(shù)據(jù)中提取具有潛在價(jià)值的信息和知識(shí)D、OLAP技術(shù)為提高處理效率,必須繞過(guò)DBMS直接對(duì)物理數(shù)據(jù)進(jìn)行讀寫標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的,且隨時(shí)間變化的數(shù)據(jù)集合,用來(lái)支持管理人員的決策。建立數(shù)據(jù)倉(cāng)庫(kù)的主要目的:根據(jù)決策需求對(duì)企業(yè)的數(shù)據(jù)采取適當(dāng)?shù)氖侄芜M(jìn)行集成,形成一個(gè)綜合的、面向分析的數(shù)據(jù)環(huán)境,用于支持企業(yè)的信息型、決策型的分析應(yīng)用。數(shù)據(jù)挖掘采用適當(dāng)?shù)乃惴?,從?shù)據(jù)倉(cāng)庫(kù)的海量數(shù)據(jù)中提取具有潛在價(jià)值的信息和知識(shí)。因此A和B錯(cuò)誤,C正確。OLAP(on-lineanalyticalprocessing)是聯(lián)系分析處理的英文縮寫,它仍使用DBMS存取數(shù)據(jù),即D的描述錯(cuò)誤。3、現(xiàn)有一個(gè)基于SQLServer2008的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其數(shù)據(jù)均來(lái)源于生產(chǎn)系統(tǒng),生產(chǎn)系統(tǒng)每天將新數(shù)據(jù)導(dǎo)入倉(cāng)庫(kù)系統(tǒng),導(dǎo)入后的數(shù)據(jù)只讀。下列有關(guān)該數(shù)據(jù)倉(cāng)庫(kù)應(yīng)設(shè)置的恢復(fù)模式,最恰當(dāng)?shù)氖?)。A、完整恢復(fù)模式B、大容量日志恢復(fù)模式C、簡(jiǎn)單恢復(fù)模式D、關(guān)鍵日志恢復(fù)模式標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:SQLServer2008支持三種恢復(fù)模式:簡(jiǎn)單恢復(fù)模式、完整恢復(fù)模式和大容量日志恢復(fù)模式。其中,簡(jiǎn)單恢復(fù)模式只用于測(cè)試和開(kāi)發(fā)數(shù)據(jù)庫(kù),或用于主要包含只讀數(shù)據(jù)的數(shù)據(jù)庫(kù)(如數(shù)據(jù)倉(cāng)庫(kù))。因此選擇C選項(xiàng)。4、某電子商務(wù)平臺(tái)為實(shí)現(xiàn)精準(zhǔn)營(yíng)銷,提高向用戶推薦商品的成功率,欲建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),作為數(shù)據(jù)挖掘程序的數(shù)據(jù)源。假設(shè)業(yè)務(wù)型數(shù)據(jù)主要存放于銷售數(shù)據(jù)表T1中,用戶信息存放于用戶表T2中。數(shù)據(jù)倉(cāng)庫(kù)將近5年的銷售細(xì)節(jié)數(shù)據(jù)存放在數(shù)據(jù)表T3中,并在數(shù)據(jù)倉(cāng)庫(kù)中根據(jù)需要存放一些匯總數(shù)據(jù)。為達(dá)到這些要求,有如下一些方案:Ⅰ.T3與T1實(shí)時(shí)更新,即每產(chǎn)生一條銷售記錄,同時(shí)寫到T1和T3中,并觸發(fā)數(shù)據(jù)挖掘程序運(yùn)行,以增加數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性Ⅱ.用戶每次產(chǎn)生新的銷售記錄,觸發(fā)數(shù)據(jù)挖掘程序執(zhí)行并得到針對(duì)該用戶的推薦商品列表,然后寫回T2中。T3每天定時(shí)從T1進(jìn)行批量更新Ⅲ.T3與T1實(shí)時(shí)更新,每天定時(shí)運(yùn)行數(shù)據(jù)挖掘程序,將運(yùn)行結(jié)果,也就是針對(duì)用戶的推薦商品列表寫回?cái)?shù)據(jù)倉(cāng)庫(kù)的用戶商品推薦表中Ⅳ.T3每天做一次批量更新,并在數(shù)據(jù)倉(cāng)庫(kù)中生成相應(yīng)的匯總數(shù)據(jù),數(shù)據(jù)挖掘程序以細(xì)節(jié)數(shù)據(jù)或匯總數(shù)據(jù)作為數(shù)據(jù)源,將運(yùn)行結(jié)果即針對(duì)用戶的推薦商品列表寫回?cái)?shù)據(jù)倉(cāng)庫(kù)的用戶商品推薦表中上述方案中不合理的是()。A、僅Ⅰ和ⅣB、僅Ⅱ和ⅣC、僅Ⅰ、Ⅱ和ⅣD、僅Ⅰ、Ⅱ和Ⅲ標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)是為了構(gòu)建新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲(chǔ)和組織的新技術(shù)。它的建立能充分利用已有的數(shù)據(jù)資源,把數(shù)據(jù)轉(zhuǎn)換為信息,從中挖掘出知識(shí),最終創(chuàng)造出效益。數(shù)據(jù)倉(cāng)庫(kù)有若干基本特征,包括不可更新性和隨時(shí)間變化性。所謂不可更新性就是用戶在提取倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行分析時(shí)并不會(huì)同時(shí)對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行更新操作,而數(shù)據(jù)變化性是數(shù)據(jù)倉(cāng)庫(kù)每隔一段時(shí)間進(jìn)行數(shù)據(jù)的更新和處理。綜上可以看出,數(shù)據(jù)倉(cāng)庫(kù)的更新與時(shí)間間隔有關(guān),所以不會(huì)實(shí)時(shí)更新,即排除A、C,又因?yàn)閷?duì)用戶進(jìn)行推薦時(shí)要結(jié)合以往的歷史數(shù)據(jù)而不是僅通過(guò)當(dāng)前數(shù)據(jù)分析,即B錯(cuò)。故選擇D選項(xiàng)。5、關(guān)于商場(chǎng)的DBAS,設(shè)有如下數(shù)據(jù)內(nèi)容Ⅰ.?dāng)?shù)據(jù)庫(kù)結(jié)構(gòu)說(shuō)明Ⅱ.顧客名單Ⅲ.?dāng)?shù)據(jù)清洗規(guī)則Ⅳ.訂單細(xì)節(jié)數(shù)據(jù)Ⅴ.商品分類銷售匯總數(shù)據(jù)上述選項(xiàng)中是元數(shù)據(jù)的是()A、僅Ⅰ、Ⅱ、Ⅲ和ⅣB、僅Ⅰ、Ⅱ、Ⅲ和ⅤC、僅Ⅰ和ⅢD、全部都是標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項(xiàng)內(nèi)容。在關(guān)系數(shù)據(jù)中,這種描述就是對(duì)數(shù)據(jù)庫(kù)、表、列等其他對(duì)象的定義。因此可推出,Ⅰ、Ⅲ屬于元數(shù)據(jù)。選C。6、下列關(guān)于OLAP和OLTP的說(shuō)法,錯(cuò)誤的是()。A、OLAP系統(tǒng)一般需要處理大量事務(wù),且執(zhí)行的事務(wù)內(nèi)容比較簡(jiǎn)單且重復(fù)率高B、OLTP系統(tǒng)是生成數(shù)據(jù)的系統(tǒng),OLAP系統(tǒng)則是利用數(shù)據(jù)的系統(tǒng)C、OLTP系統(tǒng)一般面向企業(yè)外部人員和企業(yè)內(nèi)部基礎(chǔ)業(yè)務(wù)人員,而OLAP主要面向企業(yè)內(nèi)部各層次決策人員D、OLTP系統(tǒng)主要面向企業(yè)基礎(chǔ)業(yè)務(wù),OLAP主要面向企業(yè)的數(shù)據(jù)分析利用需求標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:OLTP系統(tǒng)一般需要處理大量事務(wù),且執(zhí)行的事務(wù)內(nèi)容比較簡(jiǎn)單且重復(fù)率高,而A選項(xiàng)敘述的是OLAP,錯(cuò)誤。故答案為A項(xiàng)。7、數(shù)據(jù)集成是數(shù)據(jù)倉(cāng)庫(kù)建立的重要環(huán)節(jié),下列關(guān)于數(shù)據(jù)集成的說(shuō)法,錯(cuò)誤的是()。A、數(shù)據(jù)集成就是把企業(yè)里的所有數(shù)據(jù)集成到數(shù)據(jù)倉(cāng)庫(kù)中B、數(shù)據(jù)集成不僅涉及技術(shù)問(wèn)題,也經(jīng)常涉及管理問(wèn)題C、集成時(shí)需要將來(lái)自不同數(shù)據(jù)源的數(shù)據(jù)按目標(biāo)要求進(jìn)行格式轉(zhuǎn)換D、數(shù)據(jù)集成的一個(gè)重要目的是合理地組織企業(yè)數(shù)據(jù),實(shí)現(xiàn)企業(yè)級(jí)數(shù)據(jù)視圖標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:數(shù)據(jù)集成是將源自不同數(shù)據(jù)源的數(shù)據(jù)經(jīng)過(guò)抽取、轉(zhuǎn)換、清理、裝載等操作載入數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程,用戶只有從數(shù)據(jù)源中抽取出所需數(shù)據(jù),再經(jīng)過(guò)數(shù)據(jù)清洗,并加載到按照先前所設(shè)計(jì)的數(shù)據(jù)倉(cāng)庫(kù)中以后,才能對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行報(bào)表分析、多維分析和數(shù)據(jù)挖掘等,而并不是把企業(yè)里的所有數(shù)據(jù)集成到數(shù)據(jù)倉(cāng)庫(kù)中。故答案為A項(xiàng)。8、關(guān)于數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘、決策支持系統(tǒng)和機(jī)器學(xué)習(xí)的相關(guān)概念或說(shuō)法,下列說(shuō)法一般情況下錯(cuò)誤的是()。A、數(shù)據(jù)倉(cāng)庫(kù)是服務(wù)于決策支持的數(shù)據(jù)集合B、決策支持系統(tǒng)是指輔助需要決策的人或系統(tǒng)進(jìn)行決策的系統(tǒng)C、數(shù)據(jù)挖掘一般是指數(shù)據(jù)分析師根據(jù)個(gè)人經(jīng)驗(yàn)針對(duì)細(xì)節(jié)數(shù)據(jù)進(jìn)行分析總結(jié),挖掘出有用的知識(shí)的過(guò)程D、機(jī)器學(xué)習(xí)是指機(jī)器采用一些方法或模型從數(shù)據(jù)中習(xí)得知識(shí)的過(guò)程標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題、集成的、非易失的、且隨時(shí)間變化的數(shù)據(jù)集合,用來(lái)支持管理人員決策。決策支持系統(tǒng)是輔助決策者通過(guò)數(shù)據(jù)、模型和知識(shí),以人機(jī)交互方式進(jìn)行半結(jié)構(gòu)化或非結(jié)構(gòu)化決策的計(jì)算機(jī)應(yīng)用系統(tǒng)。數(shù)據(jù)挖掘就是從數(shù)據(jù)庫(kù)中的所有數(shù)據(jù)記錄中歸納總結(jié)出知識(shí),讓人們從抽象復(fù)雜的數(shù)據(jù)中看到客觀規(guī)律,以便做出決策。數(shù)據(jù)挖掘是從人工智能機(jī)器學(xué)習(xí)中發(fā)展起來(lái)的。它研究各種方法和技術(shù),從大量的數(shù)據(jù)中挖掘出有用的信息和知識(shí)。機(jī)器學(xué)習(xí)是研究便計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,即讓計(jì)算機(jī)自動(dòng)獲取知識(shí)。故答案為C選項(xiàng)。9、在數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)概念中,有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)是常見(jiàn)的學(xué)習(xí)方法,下列學(xué)習(xí)任務(wù)屬于有監(jiān)督學(xué)習(xí)的是()。A、將未知類別的一組數(shù)據(jù),采用聚類方法,分成不同的組B、機(jī)器人在動(dòng)態(tài)環(huán)境中自主學(xué)習(xí)掌握行走方法C、根據(jù)樣本數(shù)據(jù),采用分類算法,訓(xùn)練分類器D、不基于人類歷史棋譜數(shù)據(jù),訓(xùn)練出下圍棋的智能軟件標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:監(jiān)督學(xué)習(xí)是指利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過(guò)程,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí)。常見(jiàn)應(yīng)用場(chǎng)景如分類問(wèn)題和回歸問(wèn)題。本題中A選項(xiàng)根據(jù)樣本數(shù)據(jù),采用分類算法,訓(xùn)練分類器屬于監(jiān)督學(xué)習(xí)。故答案為C選項(xiàng)。10、設(shè)有某電子商務(wù)平臺(tái),該平臺(tái)業(yè)務(wù)繁忙。為實(shí)現(xiàn)面向用戶的精確營(yíng)銷,提高向用戶推薦商品的成功率,需要建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),并將數(shù)據(jù)倉(cāng)庫(kù)作為數(shù)據(jù)挖掘應(yīng)用程序的數(shù)據(jù)源。設(shè)電子商務(wù)平臺(tái)的OLTP環(huán)境中有銷售數(shù)據(jù)表T1和用戶信息表T2。數(shù)據(jù)倉(cāng)庫(kù)用表T3保存近5年的銷售細(xì)節(jié)數(shù)據(jù),同時(shí)有用戶信息表T4和用戶商品推薦表T5。下列方案一般情況下最為合理的是()A、實(shí)時(shí)更新T3,即每產(chǎn)生一條銷售記錄,就將該記錄同時(shí)寫到T1和T3中,并觸發(fā)數(shù)據(jù)挖掘程序運(yùn)行,以增加數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性和實(shí)時(shí)性B、當(dāng)一個(gè)銷售事務(wù)完成并生成銷售記錄后,觸發(fā)數(shù)據(jù)挖掘程序在T1上執(zhí)行并得到針對(duì)該用戶的商品推薦列表,然后將商品推薦列表寫到T5中。每隔數(shù)小時(shí)從T1獲取新數(shù)據(jù)批量更新T3C、根據(jù)T1的變化實(shí)時(shí)更新T3,每天定時(shí)運(yùn)行數(shù)據(jù)挖掘程序,生成用戶商品推薦列表,并將其寫到T5中D、每天根據(jù)T1對(duì)T3做一次批量更新,數(shù)據(jù)挖掘程序根據(jù)新數(shù)據(jù)生成用戶商品推薦列表,并將其寫到T5中標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)是為了構(gòu)建新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲(chǔ)和組織的新技術(shù)。它的建立能充分利用已有的數(shù)據(jù)資源,把數(shù)據(jù)轉(zhuǎn)換為信息,從中挖掘出知識(shí),最終創(chuàng)造出效益。數(shù)據(jù)倉(cāng)庫(kù)有若干基本特征,包括不可更新性和隨時(shí)間變化性。所謂不可更新性就是用戶在提取倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行分析時(shí)并不會(huì)同時(shí)對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行更新操作,而數(shù)據(jù)變化性是數(shù)據(jù)倉(cāng)庫(kù)每隔一段時(shí)間進(jìn)行數(shù)據(jù)的更新和處理。綜上可以看出,數(shù)據(jù)倉(cāng)庫(kù)的更新與時(shí)間間隔有關(guān),所以不會(huì)實(shí)時(shí)更新,即排除A、C,又因?yàn)閷?duì)用戶進(jìn)行推薦時(shí)要結(jié)合以往的歷史數(shù)據(jù)而不是僅通過(guò)當(dāng)前數(shù)據(jù)分析,即B錯(cuò)。綜上可知,選項(xiàng)D正確。11、在超市所從事的信息活動(dòng)中,下列屬于挖掘時(shí)間序列模式的是()A、針對(duì)匿名客戶,記錄其購(gòu)買某種商品時(shí),與該商品有關(guān)的優(yōu)惠B、針對(duì)注冊(cè)用戶,分析他們的購(gòu)買,向他們?cè)O(shè)定下次可能購(gòu)買的優(yōu)惠規(guī)則C、針對(duì)所有客戶,對(duì)其籃子里的商品進(jìn)行分析D、針對(duì)注冊(cè)用戶,進(jìn)行客戶分類,確定重要客戶及服務(wù)對(duì)策標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:時(shí)間序列分析也可以稱為數(shù)據(jù)演變分析,描述行為對(duì)象隨時(shí)間變化的規(guī)律或趨勢(shì),并進(jìn)行建模的數(shù)據(jù)挖掘方法。B項(xiàng)中記錄客戶當(dāng)前的購(gòu)買,指定下次的優(yōu)惠規(guī)則,屬于描述對(duì)象隨著時(shí)間的變化規(guī)律。12、設(shè)某數(shù)據(jù)庫(kù)中一組客戶數(shù)據(jù),表示具有m個(gè)客戶的集合CS={c1,…,cm}??蛻魯?shù)據(jù)經(jīng)過(guò)處理后,每個(gè)客戶ci對(duì)應(yīng)有一個(gè)n維向量Vi=[vi1,…,vin],用于表示客戶ci的特征。設(shè)有函數(shù)sim(Vi,Vj)用于判定ci與cj之間的相似性。若有算法A,能根據(jù)客戶間的相似性,將CS劃分成k個(gè)子集合,并使屬于同一子集合的客戶間的相似性盡可能大,不屬于同一子集合的客戶間的相似性盡可能小。則算法A屬于()。A、分類算法B、回歸預(yù)測(cè)法C、關(guān)聯(lián)分析算法D、聚類算法標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:聚類就是將一個(gè)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能地相似而不同組間的數(shù)據(jù)盡可能地不同它強(qiáng)調(diào)同一個(gè)組中的對(duì)象之間具有較高的相似度,而在不同組中的對(duì)象之間有很大的差別。本題中算法A符合聚類算法的思想,故答案為D項(xiàng)。13、設(shè)某應(yīng)用環(huán)境有一組關(guān)于某設(shè)備的狀態(tài)樣本集S,其數(shù)據(jù)模式為(a1,a2,…,an,x),其中ai(i=1…n)為設(shè)備的基礎(chǔ)屬性,屬性x的取值范圍為{正常,不正常}。現(xiàn)有算法A,將s作為輸入,并最終得到一個(gè)程序c,C能根據(jù)實(shí)時(shí)檢測(cè)到的設(shè)備狀態(tài)數(shù)據(jù)的n個(gè)基礎(chǔ)屬性的取值,判定設(shè)備的狀態(tài)為正?;虿徽!tA和C分別是()。A、聚類算法、分類器B、分類算法、分類器C、聚類算法、聚類工具D、回歸分析算法、預(yù)測(cè)模型標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:分類的過(guò)程一般分為兩個(gè)步驟:首先是通過(guò)已知數(shù)據(jù)集(訓(xùn)練集),建立分類函數(shù),構(gòu)造分類器;其次是利用所獲得的分類函數(shù)對(duì)未知類別標(biāo)記的數(shù)據(jù)項(xiàng)進(jìn)行分類操作。在構(gòu)造分類器時(shí),需要一個(gè)訓(xùn)練樣本數(shù)據(jù)集作為輸入。訓(xùn)練集由一組數(shù)據(jù)庫(kù)記錄或元組構(gòu)成,每個(gè)元組是一個(gè)由有關(guān)字段(屬性或特征)值組成的特征向量。故答案為B項(xiàng)。14、在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)中,數(shù)據(jù)的粒度級(jí)設(shè)計(jì)是一個(gè)重要的問(wèn)題。在粒度級(jí)設(shè)計(jì)中,設(shè)有下列考慮因素:Ⅰ.用戶查詢所涉及數(shù)據(jù)的最低細(xì)節(jié)程度Ⅱ.高粒度數(shù)據(jù)所需的存儲(chǔ)空間Ⅲ.用戶查詢的平均性能需求Ⅳ.系統(tǒng)的可用存儲(chǔ)空間Ⅴ.低粒度級(jí)數(shù)據(jù)的規(guī)模Ⅵ.用戶查詢所涉及的數(shù)據(jù)的最高粒度級(jí)在以上因素中,屬于次要或不需要考慮的因素是()。A、僅Ⅰ和ⅢB、僅Ⅳ和ⅤC、僅Ⅰ和ⅥD、僅Ⅱ和Ⅵ標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,粒度是一個(gè)重要的設(shè)計(jì)問(wèn)題,它影響到數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量以及系統(tǒng)能回答的查詢的類型。在進(jìn)行粒度級(jí)設(shè)計(jì)時(shí),在可用的存儲(chǔ)空間中保存粗細(xì)程度不同的主題數(shù)據(jù),以盡可能滿足各種應(yīng)用的多角度、多層次數(shù)據(jù)查詢要求,同時(shí)在總體上提高查詢的設(shè)計(jì)效率。粒度越小,則細(xì)節(jié)程度越高,綜合程度就越低,回答查詢的類型也越多,數(shù)據(jù)量比較大,空間代價(jià)也大。用戶查詢所涉及的數(shù)據(jù)的最低細(xì)節(jié)程度、用戶查詢的平均性能需求、系統(tǒng)的可用存儲(chǔ)空間、低粒度級(jí)數(shù)據(jù)的規(guī)模都屬于主要考慮的因素。故答案為D選項(xiàng)。15、設(shè)有某網(wǎng)購(gòu)平臺(tái)業(yè)務(wù)系統(tǒng)與大數(shù)據(jù)平臺(tái),其中存在如下各種數(shù)據(jù)或文檔:Ⅰ.商品清單表Ⅱ.廠家清單表Ⅲ.業(yè)務(wù)系統(tǒng)與大數(shù)據(jù)平臺(tái)的ER圖及說(shuō)明文檔Ⅳ.業(yè)務(wù)系統(tǒng)中DBMS中的數(shù)據(jù)字典Ⅴ.銷售數(shù)據(jù)明細(xì)Ⅵ.業(yè)務(wù)系統(tǒng)數(shù)據(jù)與大數(shù)據(jù)平臺(tái)數(shù)據(jù)的對(duì)應(yīng)關(guān)系數(shù)據(jù)Ⅶ.客服聊天記錄以上各類數(shù)據(jù),屬于元數(shù)據(jù)的是()A、僅Ⅲ、Ⅳ和ⅥB、僅Ⅰ、Ⅱ和ⅥC、僅Ⅰ、Ⅱ、Ⅳ和ⅥD、僅Ⅳ、Ⅴ和Ⅶ標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項(xiàng)內(nèi)容。①在傳統(tǒng)的數(shù)據(jù)庫(kù)中,元數(shù)據(jù)描述了數(shù)據(jù)庫(kù)中的各個(gè)對(duì)象,如數(shù)據(jù)庫(kù)中的數(shù)據(jù)字典就是一種元數(shù)據(jù)。②在關(guān)系數(shù)據(jù)庫(kù)中,元數(shù)據(jù)描述對(duì)數(shù)據(jù)庫(kù)、表、列等其他對(duì)象的定義。③在數(shù)據(jù)倉(cāng)庫(kù)中,元數(shù)據(jù)定義了數(shù)據(jù)倉(cāng)庫(kù)中許多對(duì)象--表、列、查詢、商業(yè)規(guī)則及數(shù)據(jù)倉(cāng)庫(kù)內(nèi)部的數(shù)據(jù)轉(zhuǎn)移等。因此可推出Ⅲ、Ⅳ和Ⅵ屬于元數(shù)據(jù)。故答案為A項(xiàng)。二、應(yīng)用題(本題共12題,每題1.0分,共12分。)16、數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題、集成的、時(shí)變的、非易失的數(shù)據(jù)集合,支持管理部門的決策過(guò)程,數(shù)據(jù)倉(cāng)庫(kù)通過(guò)數(shù)據(jù)轉(zhuǎn)移從多個(gè)數(shù)據(jù)源提取數(shù)據(jù),為了解決不同數(shù)據(jù)源格式上的不統(tǒng)一,需要進(jìn)行的數(shù)據(jù)操作是________。標(biāo)準(zhǔn)答案:轉(zhuǎn)換知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)來(lái)自多種數(shù)據(jù)源。不同的數(shù)據(jù)源可能由不同的平臺(tái)開(kāi)發(fā),使用不同的數(shù)據(jù)庫(kù)管理系統(tǒng),數(shù)據(jù)格式也可能不同。源數(shù)據(jù)在被裝載到數(shù)據(jù)倉(cāng)庫(kù)之前,需要進(jìn)行一定的數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換的主要任務(wù)是對(duì)數(shù)據(jù)粒度以及不一致的數(shù)據(jù)進(jìn)行轉(zhuǎn)換。17、在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)和建設(shè)過(guò)程中,設(shè)計(jì)者需要調(diào)查用戶的決策或數(shù)據(jù)處理需求,并將功能相近且需要相關(guān)聯(lián)數(shù)據(jù)支持的需求進(jìn)行歸類,得到不同的需求集合,并在企業(yè)數(shù)據(jù)模型中尋找能夠滿足各個(gè)需求集合的數(shù)據(jù)集合,然后針對(duì)各個(gè)數(shù)據(jù)集合開(kāi)展數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型的設(shè)計(jì)。這種設(shè)計(jì)方法稱為_(kāi)_______的設(shè)計(jì)方法。標(biāo)準(zhǔn)答案:面向主題知識(shí)點(diǎn)解析:面向主題的數(shù)據(jù)組織方式,就是在較高層次上對(duì)分析對(duì)象數(shù)據(jù)的一個(gè)完整并且一致的描述,能刻畫各個(gè)分析對(duì)象所涉及的企業(yè)各項(xiàng)數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系。所謂較高層次是相對(duì)面向應(yīng)用的數(shù)據(jù)組織方式而言的,即按照主題進(jìn)行數(shù)據(jù)組織的方式具有更高的數(shù)據(jù)抽象級(jí)別。與傳統(tǒng)數(shù)據(jù)庫(kù)面向應(yīng)用進(jìn)行數(shù)據(jù)組織的特點(diǎn)相對(duì)應(yīng),數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)面向主題進(jìn)行組織。例如,一個(gè)生產(chǎn)企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)所組織的主題可能有產(chǎn)品訂貨分析和貨物發(fā)運(yùn)分析等。18、粒度是反映數(shù)據(jù)庫(kù)系統(tǒng)中綜合程度的指標(biāo)。設(shè)有表T1(商品標(biāo)識(shí),銷售時(shí)間,銷售量)、T2(商品標(biāo)識(shí),日期,總銷售量)和T3(商品類別,月份,總銷售量),其中粒度最大的表是________。標(biāo)準(zhǔn)答案:T3知識(shí)點(diǎn)解析:粒度問(wèn)題是設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)最重要方面。粒度是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別。細(xì)化程度越高,粒度級(jí)就越小;相反,細(xì)化程度越低,粒度級(jí)就越大。由題意可知,粒度最大的表應(yīng)是T3。19、數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型一般被劃分為概念模型、________模型和物理模型。標(biāo)準(zhǔn)答案:邏輯知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)采用三級(jí)數(shù)據(jù)模型的方式,具體如下:概念模型:也就是業(yè)務(wù)模型.由企業(yè)決策者、商務(wù)領(lǐng)域知識(shí)專家和IT專家共同企業(yè)級(jí)地跨領(lǐng)域業(yè)務(wù)系統(tǒng)需求分析的結(jié)果。邏輯模型:用來(lái)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)邏輯模型。根據(jù)分析系統(tǒng)的實(shí)際需求決策構(gòu)建數(shù)據(jù)庫(kù)邏輯關(guān)系模型.定義數(shù)據(jù)庫(kù)物理結(jié)構(gòu)及其關(guān)系。它關(guān)聯(lián)著數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型和物理模型這兩頭。物理模型:構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的物理分布模型,主要包含數(shù)據(jù)倉(cāng)庫(kù)的軟硬件配置,資源情況以及數(shù)據(jù)倉(cāng)庫(kù)模式。20、在數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織中,描述數(shù)據(jù)的綜合或細(xì)節(jié)程度的指標(biāo)稱為_(kāi)_______。標(biāo)準(zhǔn)答案:粒度知識(shí)點(diǎn)解析:在數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織中,描述數(shù)據(jù)的綜合或細(xì)節(jié)程度的指標(biāo)稱為粒度。粒度越大,表示綜合程度越高;粒度越小,表示綜合程度越低。21、在數(shù)據(jù)倉(cāng)庫(kù)中,元數(shù)據(jù)一般分成技術(shù)型元數(shù)據(jù)和________型元數(shù)據(jù)。標(biāo)準(zhǔn)答案:業(yè)務(wù)或business知識(shí)點(diǎn)解析:在數(shù)據(jù)倉(cāng)庫(kù)中,元數(shù)據(jù)分為技術(shù)型元數(shù)據(jù)和業(yè)務(wù)型元數(shù)據(jù)。技術(shù)元數(shù)據(jù)是存儲(chǔ)關(guān)于商業(yè)智能系統(tǒng)技術(shù)細(xì)節(jié)的數(shù)據(jù),是用于開(kāi)發(fā)和管理商業(yè)智能系統(tǒng)使用的數(shù)據(jù)。業(yè)務(wù)元數(shù)據(jù)從業(yè)務(wù)角度描述了商業(yè)智能系統(tǒng)中的數(shù)據(jù),是介于使用者和真實(shí)系統(tǒng)之間的語(yǔ)義層,使得不懂計(jì)算機(jī)技術(shù)的業(yè)務(wù)人員也能夠“理解”商業(yè)智能系統(tǒng)中的數(shù)據(jù)。故答案為業(yè)務(wù)或business。22、在企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中,操作型數(shù)據(jù)存儲(chǔ)層(ODS),一般用以支撐即時(shí)OLAP和________型OLTP應(yīng)用。標(biāo)準(zhǔn)答案:全局或跨專業(yè)或綜合知識(shí)點(diǎn)解析:在ODS上可實(shí)行的全局應(yīng)用大致可分為:實(shí)現(xiàn)企業(yè)全局的OLTP操作、實(shí)現(xiàn)即時(shí)的OLAP操作。故答案為全局或跨專業(yè)或綜合。23、在數(shù)據(jù)倉(cāng)庫(kù)中,元數(shù)據(jù)主要分為_(kāi)_______元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)兩類。標(biāo)準(zhǔn)答案:技術(shù)知識(shí)點(diǎn)解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,元數(shù)據(jù)可以幫助數(shù)據(jù)倉(cāng)庫(kù)管理員和數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)人員非常方便地找到他們所關(guān)心的數(shù)據(jù)。元數(shù)據(jù)是描述數(shù)據(jù)倉(cāng)庫(kù)內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù),可將其按用途的不同分為兩類:技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)。24、粒度是用于描述數(shù)據(jù)環(huán)境中數(shù)據(jù)綜合程度的概念。設(shè)某系統(tǒng)中有商品銷售表(商品號(hào),店鋪標(biāo)識(shí),銷售量,單價(jià),日期,時(shí)間)和商品周銷售表(商品號(hào),店鋪標(biāo)識(shí),周銷售量,周),則商品銷售表的粒度級(jí)________商品周銷售表的粒度級(jí)。標(biāo)準(zhǔn)答案:低于或小于或<知識(shí)點(diǎn)解析:粒度是用于描述數(shù)據(jù)環(huán)境中數(shù)據(jù)綜合程度的概念。粒度越大,綜合程度越高,細(xì)節(jié)程度越低,能回答的查詢就越少;粒度越小,綜合程度越低,細(xì)節(jié)程度越高,能回答的查詢就越多。25、在數(shù)據(jù)倉(cāng)庫(kù)的導(dǎo)出數(shù)據(jù)或物化視圖(實(shí)視圖)的維護(hù)策略中,只在用戶查詢時(shí)發(fā)現(xiàn)數(shù)據(jù)已經(jīng)過(guò)期才進(jìn)行更新的策略稱為_(kāi)_______維護(hù)策略。標(biāo)準(zhǔn)答案:延時(shí)或延期或推遲知識(shí)點(diǎn)解析:在數(shù)據(jù)倉(cāng)庫(kù)的導(dǎo)出數(shù)據(jù)或物化視圖(實(shí)視圖)的維護(hù)策略中,只在用戶查詢時(shí)發(fā)現(xiàn)數(shù)據(jù)已經(jīng)過(guò)期才進(jìn)行更新的策略稱為延時(shí)維護(hù)策略。26、在數(shù)據(jù)倉(cāng)庫(kù)中,根據(jù)數(shù)據(jù)源的變化量在維護(hù)對(duì)象原有數(shù)據(jù)的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行維護(hù)的方法稱為_(kāi)_______維護(hù)法。標(biāo)準(zhǔn)答案:增量或增長(zhǎng)知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)維護(hù)的基本思想是:根據(jù)某種維護(hù)策略,在一定條件下觸發(fā)維護(hù)操作;維護(hù)操作捕捉到數(shù)據(jù)源的數(shù)據(jù)變化;通過(guò)一定策略對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行相應(yīng)的更新操作,以保持兩者的一致性。增量式維護(hù)指的是根據(jù)數(shù)據(jù)源的變化量在維護(hù)對(duì)象原有數(shù)據(jù)和基礎(chǔ)上進(jìn)行數(shù)據(jù)添加和修改。故答案為增量或增長(zhǎng)。27、在企業(yè)數(shù)據(jù)環(huán)境中,關(guān)于數(shù)據(jù)的數(shù)據(jù)一般被稱為_(kāi)_______數(shù)據(jù)。標(biāo)準(zhǔn)答案:元或meta或metadata知識(shí)點(diǎn)解析:在企業(yè)數(shù)據(jù)環(huán)境中,關(guān)于數(shù)據(jù)的數(shù)據(jù)一般被稱為元數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行描述。故答案為元或meta或metadata。計(jì)算機(jī)三級(jí)數(shù)據(jù)庫(kù)技術(shù)(數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘)機(jī)試模擬試卷第2套一、選擇題(本題共16題,每題1.0分,共16分。)1、許多大中型企業(yè)處于多種原因建立了數(shù)據(jù)倉(cāng)庫(kù),以下哪項(xiàng)不是建立數(shù)據(jù)倉(cāng)庫(kù)的合理理由()A、將企業(yè)的各種應(yīng)用系統(tǒng)集中在一起B(yǎng)、充分利用企業(yè)信息系統(tǒng)生成的各種數(shù)據(jù)C、解決企業(yè)業(yè)務(wù)應(yīng)用和數(shù)據(jù)分析應(yīng)用的性能沖突D、以面向主題、集成的方式合理的組織數(shù)據(jù)標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:建立數(shù)據(jù)倉(cāng)庫(kù)不是簡(jiǎn)單的把企業(yè)的各種應(yīng)用集中在一起,而是利用企業(yè)信息系統(tǒng)生成的數(shù)據(jù)%以面向主題#集成的方式合理組織數(shù)據(jù),解決數(shù)據(jù)分析應(yīng)用和企業(yè)基本業(yè)務(wù)之間的性能沖突問(wèn)題。2、下列數(shù)據(jù)模式中,粒度級(jí)最高的是()A、(地區(qū),商品大類,月份,總銷售額)B、(地區(qū),商品小類,季度,總銷售額)C、(地區(qū),商品大類,季度,總銷售額)D、(商店,商品小類,月份,總銷售額)標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:粒度是系統(tǒng)中存在不同綜合級(jí)別的數(shù)據(jù),一般將綜合級(jí)別稱為粒度。粒度越大,表示綜合程度越高;粒度越小,表示綜合程度越低。故答案為C選項(xiàng)。3、下列哪一條不是數(shù)據(jù)倉(cāng)庫(kù)的基本特征()A、反映當(dāng)前準(zhǔn)確數(shù)據(jù)B、數(shù)據(jù)是相對(duì)穩(wěn)定的C、數(shù)據(jù)是集成的D、數(shù)據(jù)是面向主題的標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)有四個(gè)特點(diǎn):①面向主題,操作型數(shù)據(jù)庫(kù)的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各個(gè)業(yè)務(wù)系統(tǒng)之間各自分離,而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)按照一定的主題域進(jìn)行組織。主題是一個(gè)抽象概念,是指用戶使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行決策時(shí)所關(guān)心的重點(diǎn)方面,一個(gè)主題通常與多個(gè)操作型信息系統(tǒng)相關(guān);②集成的,面向事務(wù)處理的操作型數(shù)據(jù)庫(kù)通常與某些特定的應(yīng)用相關(guān),數(shù)據(jù)庫(kù)之間相互獨(dú)立,并且往往是異構(gòu)的。而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是在對(duì)原有分散的數(shù)據(jù)庫(kù)數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過(guò)系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息是關(guān)于整個(gè)企業(yè)的一致的全局信息;③穩(wěn)定的,操作型數(shù)據(jù)庫(kù)中的數(shù)據(jù)通常實(shí)時(shí)更新,數(shù)據(jù)根據(jù)需要及時(shí)發(fā)生變化。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新;④反映歷史變化,操作型數(shù)據(jù)庫(kù)主要關(guān)心當(dāng)前某一個(gè)時(shí)間段內(nèi)的數(shù)據(jù),而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過(guò)去某一時(shí)點(diǎn)(如開(kāi)始應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)的時(shí)點(diǎn))到目前的各個(gè)階段的信息,通過(guò)這些信息,可以對(duì)企業(yè)的發(fā)展歷程和未來(lái)趨勢(shì)做出定量分析和預(yù)測(cè)。4、在大型企業(yè)的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)中,聯(lián)機(jī)事務(wù)處理(OLTP)和聯(lián)機(jī)分析處理(OLAP)是常見(jiàn)的數(shù)據(jù)庫(kù)管理和數(shù)據(jù)分析形式。關(guān)于OLTP和OLAP,一般情況下,下列說(shuō)法正確的是()A、OLTP系統(tǒng)的安全性要求比OLAP系統(tǒng)的低,也比較容易實(shí)現(xiàn)B、OLTP系統(tǒng)在訪問(wèn)數(shù)據(jù)時(shí),一般以單條記錄訪問(wèn)為主,集合訪問(wèn)為輔,OLAP系統(tǒng)則相反C、OLTP系統(tǒng)要求系統(tǒng)必須具有很高的響應(yīng)速度,而OLAP對(duì)系統(tǒng)的響應(yīng)速度要求較為寬松D、OLTP系統(tǒng)一般由企業(yè)的中上層或決策使用,而OLAP系統(tǒng)一般由企業(yè)的中下層業(yè)務(wù)人員使用標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:聯(lián)機(jī)事務(wù)處理OLTP也稱面向交易的處理系統(tǒng),其基本特征是顧客的原始數(shù)據(jù)可以立即傳送到計(jì)算機(jī)中心進(jìn)行處理,并在很短的時(shí)間內(nèi)給出處理結(jié)果,可以即時(shí)的處理輸入的數(shù)據(jù),及時(shí)回答。因此系統(tǒng)要求必須具有很高的響應(yīng)速度。聯(lián)機(jī)分析處理OLAP是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。典型的應(yīng)用就是復(fù)雜的動(dòng)態(tài)的報(bào)表系統(tǒng)。OLAP的特點(diǎn)一般有:實(shí)時(shí)性要求不是很高、數(shù)據(jù)量大、決策支持,查詢動(dòng)態(tài),隨時(shí)提出查詢的要求。OLTP的安全性比OLAP要高,實(shí)施起來(lái)也比較困難。A和B都不正確。D項(xiàng)OLTP一般由企業(yè)中下層使用,OLAP由企業(yè)中上層使用。5、設(shè)有如下所示的某商場(chǎng)購(gòu)物記錄集合,每個(gè)購(gòu)物籃中包含若干商品現(xiàn)在要基于該數(shù)據(jù)集進(jìn)行關(guān)聯(lián)規(guī)則挖掘。如果設(shè)置最小支持度為60%,最小置信度為80%,則如下關(guān)聯(lián)規(guī)則中,符合條件的是()A、啤酒→尿布B、(面包,尿布)→牛奶C、面包→牛奶D、(面包,啤酒)→尿布標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:關(guān)聯(lián)規(guī)則是形如X->Y的蘊(yùn)涵表達(dá)式。關(guān)聯(lián)規(guī)則的強(qiáng)度可以用它的支持度(s)和置信度(c)度量。支持度確定規(guī)則可以用于給定數(shù)據(jù)集的頻繁程度,而置信度確定Y在包含X的事務(wù)中出現(xiàn)的頻繁程度。兩者可以用公式表示:從題目中可以看到事務(wù)總數(shù)是5,A的{啤酒、尿布}支持度計(jì)數(shù)是3,{啤酒}支持計(jì)數(shù)是3,所以s=0.6,c=1。同理可得B{面包、尿布}支持計(jì)數(shù)為3,{面包、尿布、牛奶}支持計(jì)數(shù)是2,所以s=0.4,c=2╱3。C中,{面包、牛奶}支持計(jì)數(shù)為3,{面包}支持計(jì)數(shù)為4,所以s=0.6,c=0.75。D中,{面包、啤酒}支持計(jì)數(shù)為2,{面包、啤酒、尿布}支持計(jì)數(shù)為2,所以s=0.4,c=1。綜上所述,結(jié)果選A。6、現(xiàn)在許多中大型企業(yè)建有企業(yè)數(shù)據(jù)倉(cāng)庫(kù)。關(guān)于數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的特點(diǎn),下列說(shuō)法一般情況下正確的是()。A、數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)主要服務(wù)于企業(yè)的基礎(chǔ)業(yè)務(wù)需求,其設(shè)計(jì)應(yīng)重點(diǎn)針對(duì)單點(diǎn)查詢進(jìn)行優(yōu)化B、數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一般源自企業(yè)的OLTP環(huán)境,因此,其中的數(shù)據(jù)與OLTP環(huán)境中的數(shù)據(jù)一樣,允許對(duì)數(shù)據(jù)做直接更改C、數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)集合具有集成性,實(shí)現(xiàn)企業(yè)數(shù)據(jù)的集成有助實(shí)現(xiàn)企業(yè)范圍的跨部門視圖D、數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)具有時(shí)變性,是指數(shù)據(jù)倉(cāng)庫(kù)一般對(duì)數(shù)據(jù)操作與訪問(wèn)的實(shí)時(shí)性要求很高標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:在傳統(tǒng)的OLTP(On-LineTransactionProcessing,聯(lián)機(jī)事務(wù)處理系統(tǒng))中,數(shù)據(jù)庫(kù)系統(tǒng)的數(shù)據(jù)一般是以面向企業(yè)基本業(yè)務(wù)需要的方式進(jìn)行組織的,而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是以面向主題的方式進(jìn)行組織的。故A選項(xiàng)錯(cuò)誤。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是一個(gè)集成的,易于訪問(wèn)的,一致的,包含大量歷史數(shù)據(jù)的和經(jīng)過(guò)優(yōu)化處理的數(shù)據(jù)。因此數(shù)據(jù)倉(cāng)庫(kù)具有面向主題性、集成性、不可更新性和時(shí)間特性。這里面的不可更新并不意味著不再向數(shù)據(jù)倉(cāng)庫(kù)中追加新的數(shù)據(jù),只是表示一般不在對(duì)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)中的原始數(shù)據(jù)進(jìn)行修改。選項(xiàng)B錯(cuò)。數(shù)據(jù)倉(cāng)庫(kù)的時(shí)變性是指數(shù)據(jù)倉(cāng)庫(kù)中的每個(gè)數(shù)據(jù)單元都有時(shí)間標(biāo)志,記錄一般都加有時(shí)間戳,有時(shí)記錄可能包含有事務(wù)的發(fā)生時(shí)間。同時(shí),數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化的特性還指數(shù)據(jù)倉(cāng)庫(kù)在運(yùn)行中必須不斷捕捉操作性環(huán)境中的數(shù)據(jù),并將新的數(shù)據(jù)集成后追加到其中。并不是指對(duì)數(shù)據(jù)操作與訪問(wèn)的實(shí)時(shí)性要求很高。故D選項(xiàng)錯(cuò)誤。7、下列關(guān)于建立數(shù)據(jù)倉(cāng)庫(kù)的目標(biāo)的描述,不恰當(dāng)?shù)氖?)。A、充分利用企業(yè)信息系統(tǒng)生成的數(shù)據(jù)B、把企業(yè)各種類型的應(yīng)用集中在一起C、解決數(shù)據(jù)分析應(yīng)用和企業(yè)基本業(yè)務(wù)應(yīng)用之間的性能沖突問(wèn)題,減輕OLTP系統(tǒng)的負(fù)擔(dān)D、以面向主題的方式合理組織數(shù)據(jù),實(shí)現(xiàn)跨部門視圖標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:建立數(shù)據(jù)倉(cāng)庫(kù)的主要目的在于根據(jù)決策需求對(duì)企業(yè)的數(shù)據(jù)采取適當(dāng)?shù)氖侄芜M(jìn)行集成,形成一個(gè)綜合的、面向分析的數(shù)據(jù)環(huán)境,用于支持企業(yè)的信息性、決策性的分析應(yīng)用。故答案為B項(xiàng)。8、設(shè)有某大型連鎖商場(chǎng),建立有面向基礎(chǔ)業(yè)務(wù)的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)和面向決策支持的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)每天夜間需要從數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的數(shù)據(jù)庫(kù)導(dǎo)入新數(shù)據(jù)。在下列數(shù)據(jù)表中,最不適合采用快照方式從數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)獲取數(shù)據(jù)的是()。A、各商品銷售明細(xì)表B、各商場(chǎng)員工表C、商品表和商品類別表D、各商場(chǎng)收銀點(diǎn)信息表標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:快照(Snapshot)是指定數(shù)據(jù)集合的一個(gè)完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個(gè)時(shí)間點(diǎn)(拷貝開(kāi)始的時(shí)間點(diǎn))的映像??煺湛梢允瞧渌硎镜臄?shù)據(jù)的一個(gè)副本,也可以是數(shù)據(jù)的一個(gè)復(fù)制品,適合更新變化量少的數(shù)據(jù)。各商品銷售明細(xì)表是屬于一個(gè)動(dòng)態(tài)信息表,每個(gè)時(shí)刻的信息都不一樣,因此各商品銷售明細(xì)表不適合用快照方式更新。故答案為A選項(xiàng)。9、在下面列出的每組描述特性中,均不屬于數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)特點(diǎn)的是()。A、面向主題、可直接修改、性能要求較為寬松B、集成的、可直接修改、相對(duì)OLTP環(huán)境性能要求高C、面向業(yè)務(wù)應(yīng)用、可直接修改、相對(duì)OLTP環(huán)境性能要求高D、面向業(yè)務(wù)應(yīng)用、集成的、批量訪問(wèn)標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)特點(diǎn)包括面向主題性、集成性、不可更新性和時(shí)間特性等。故答案為C選項(xiàng)。10、有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)是常見(jiàn)典型的機(jī)器學(xué)習(xí)方法,下列學(xué)習(xí)任務(wù)屬于無(wú)監(jiān)督學(xué)習(xí)的是()。A、將一組無(wú)標(biāo)簽數(shù)據(jù),采用一定的機(jī)器學(xué)習(xí)算法將數(shù)據(jù)分成不同的組B、根據(jù)一組小規(guī)模樣本數(shù)據(jù),采用某種小樣本學(xué)習(xí)算法,訓(xùn)練分類器C、根據(jù)專家標(biāo)定的一組有標(biāo)簽時(shí)間序列數(shù)據(jù),訓(xùn)練異常發(fā)現(xiàn)算法D、不基于人類歷史棋譜數(shù)據(jù),訓(xùn)練出下圍棋的智能軟件標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:監(jiān)督學(xué)習(xí)是指利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過(guò)程,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí)。無(wú)監(jiān)督學(xué)習(xí)是指對(duì)未知的標(biāo)簽數(shù)據(jù)進(jìn)行學(xué)習(xí)和分組。強(qiáng)化學(xué)習(xí)又稱再勵(lì)學(xué)習(xí)、評(píng)價(jià)學(xué)習(xí)或增強(qiáng)學(xué)習(xí),是機(jī)器學(xué)習(xí)的范式和方法論之一,用于描述和解決智能體在與環(huán)境的交互過(guò)程中通過(guò)學(xué)習(xí)策略達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)的問(wèn)題。故答案為A選項(xiàng)。11、以下是某商場(chǎng)的購(gòu)物記錄集合,每個(gè)購(gòu)物籃中包含若干商品?,F(xiàn)在要基于該數(shù)據(jù)集進(jìn)行關(guān)聯(lián)規(guī)則挖掘,如果設(shè)置最小支持度為60%,最小置信度為80%,則在以下列出的關(guān)聯(lián)規(guī)則中,符合條件的是()。A、A→BB、B→CC、C→BD、D→C標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:由關(guān)聯(lián)規(guī)則Q→D計(jì)算過(guò)程可知:支持度=事務(wù)中同時(shí)包含X、Y的百分比,置信度=在事務(wù)已經(jīng)包含X的情況下包含Y的百分比。則可以計(jì)算出事務(wù)同時(shí)包含C、D的支持度為:3╱5=60%,在包含D的情況下,包含c的百分比為:3╱3=100%,因此D選項(xiàng)滿足要求,其他選項(xiàng)均不滿足最小支持度或者最小置信度。12、對(duì)對(duì)象進(jìn)行分類是數(shù)據(jù)挖掘的一項(xiàng)非常重要的任務(wù),下列算法模型無(wú)法直接用于分類的是()A、邏輯回歸B、K-meansC、神經(jīng)網(wǎng)絡(luò)D、決策樹標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:K-means算法是很典型的基于距離的聚類<http:╱╱baike.baidu.com╱view╱31801.htm>算法,采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)對(duì)象的距離越近,其相似度就越大。故答案為B項(xiàng)。13、設(shè)有某通信公司的業(yè)務(wù)支撐系統(tǒng),該系統(tǒng)中存在如下各種數(shù)據(jù)或文檔Ⅰ.通話詳單Ⅱ.短信數(shù)據(jù)Ⅲ.系統(tǒng)ER圖及說(shuō)明文檔Ⅳ.物理平臺(tái)的數(shù)據(jù)字典及其說(shuō)明文檔Ⅴ.用戶名單Ⅵ.用戶每月費(fèi)用支出分類匯總數(shù)據(jù)Ⅶ.用戶繳費(fèi)記錄以上各類數(shù)據(jù),屬于元數(shù)據(jù)的是()。A、僅Ⅰ、Ⅱ和ⅤB、僅Ⅲ、Ⅳ、Ⅴ和ⅦC、僅Ⅳ、Ⅵ和ⅦD、僅Ⅲ和Ⅳ標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項(xiàng)的內(nèi)容。題干中只有Ⅲ和Ⅳ符合定義,其余的內(nèi)容都是用戶數(shù)據(jù)。故答案為D項(xiàng)。14、ETL工具是指從OLTP系統(tǒng)或其他數(shù)據(jù)環(huán)境中抽取數(shù)據(jù)的工具。在實(shí)踐中,人們采用ETL工具從OLTP系統(tǒng)抽取出數(shù)據(jù)再進(jìn)行分析利用,而不是在OLTP系統(tǒng)中直接進(jìn)行數(shù)據(jù)分析利用的最主要原因是()。A、解決企業(yè)中的數(shù)據(jù)共享問(wèn)題B、解決企業(yè)中的數(shù)據(jù)孤島問(wèn)題C、解決蜘蛛網(wǎng)式的企業(yè)信息系統(tǒng)架構(gòu)帶來(lái)的各種問(wèn)題D、解決分析型應(yīng)用程序與OLTP應(yīng)用程序之間的性能沖突問(wèn)題標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:ETL是英文Extract-Transform-Load的縮寫,用來(lái)描述將數(shù)據(jù)從來(lái)源端經(jīng)過(guò)抽取(extract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過(guò)程。采用數(shù)據(jù)抽取程序從OLTP系統(tǒng)中抽取數(shù)據(jù)的主要原因是解決不同類型應(yīng)用程序之間的性能沖突問(wèn)題。故答案為D選項(xiàng)。15、設(shè)有某移動(dòng)通信公司的業(yè)務(wù)支撐系統(tǒng),該系統(tǒng)中存在如下各種數(shù)據(jù)或文檔Ⅰ.用戶通話詳單Ⅱ.用戶短信記錄Ⅲ.系統(tǒng)ER圖及說(shuō)明文檔Ⅳ.DBMS中的數(shù)據(jù)字典Ⅴ.用戶名單數(shù)據(jù)Ⅵ.用戶每月費(fèi)用支出分類匯總數(shù)據(jù)Ⅶ.用戶繳費(fèi)記錄以上各類數(shù)據(jù),屬于元數(shù)據(jù)的是()。A、僅Ⅲ和ⅣB、僅Ⅰ、Ⅱ和ⅤC、僅Ⅲ、Ⅳ、Ⅴ和ⅦD、僅Ⅳ、Ⅵ和Ⅶ標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項(xiàng)內(nèi)容。①在傳統(tǒng)的數(shù)據(jù)庫(kù)中,元數(shù)據(jù)描述了數(shù)據(jù)庫(kù)中的各個(gè)對(duì)象,如數(shù)據(jù)庫(kù)中的數(shù)據(jù)字典就是一種元數(shù)據(jù)。②在關(guān)系數(shù)據(jù)庫(kù)中,元數(shù)據(jù)描述對(duì)數(shù)據(jù)庫(kù)、表、列等其他對(duì)象的定義。③在數(shù)據(jù)倉(cāng)庫(kù)中,元數(shù)據(jù)定義了數(shù)據(jù)倉(cāng)庫(kù)中許多對(duì)象——表、列、查詢、商業(yè)規(guī)則及數(shù)據(jù)倉(cāng)庫(kù)內(nèi)部的數(shù)據(jù)轉(zhuǎn)移等。因此可推出Ⅰ、Ⅱ、Ⅴ、Ⅵ、Ⅶ不屬于元數(shù)據(jù)。故答案為A項(xiàng)。16、在企業(yè)的信息系統(tǒng)環(huán)境中,設(shè)有下列類別的數(shù)據(jù):Ⅰ.交易數(shù)據(jù)Ⅱ.關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)字典內(nèi)容Ⅲ.?dāng)?shù)據(jù)模型設(shè)計(jì)文檔Ⅳ.建庫(kù)腳本Ⅴ.HDFS的命名結(jié)點(diǎn)中保存的主要數(shù)據(jù)Ⅵ.客戶數(shù)據(jù)以上類別數(shù)據(jù)中,不屬于元數(shù)據(jù)的是()。A、僅Ⅳ和ⅤB、僅Ⅱ和ⅣC、僅Ⅰ和ⅥD、僅Ⅲ和Ⅳ標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項(xiàng)內(nèi)容。在關(guān)系數(shù)據(jù)中,這種描述就是對(duì)數(shù)據(jù)庫(kù)、表、列等其他對(duì)象的定義。因此可推出,Ⅰ和Ⅵ不屬于元數(shù)據(jù)。故答案為C項(xiàng)。二、應(yīng)用題(本題共12題,每題1.0分,共12分。)17、在數(shù)據(jù)庫(kù)并發(fā)控制中,鎖的粒度越________,事務(wù)并發(fā)執(zhí)行程度就越小,數(shù)據(jù)庫(kù)系統(tǒng)開(kāi)銷也越小。標(biāo)準(zhǔn)答案:大或粗知識(shí)點(diǎn)解析:數(shù)據(jù)庫(kù)管理系統(tǒng)對(duì)事務(wù)的并發(fā)執(zhí)行進(jìn)行控制,以保證數(shù)據(jù)庫(kù)一致性,最常用的方法是封鎖的方法。封鎖粒度與系統(tǒng)的并發(fā)度和并發(fā)控制的開(kāi)銷密切相關(guān)。封鎖的粒度越大,并發(fā)度就越小,同時(shí)系統(tǒng)的開(kāi)銷就越小。封鎖的粒度越小,并發(fā)度就越大,同時(shí)系統(tǒng)的開(kāi)銷就越大。故答案為大或粗。18、OLAP主要用于支持復(fù)雜的分析操作,側(cè)重對(duì)決策人員和高層管理人員的數(shù)據(jù)支持。OLAP的實(shí)現(xiàn)方式主要有三種:MOLAP、________和HOLAP。標(biāo)準(zhǔn)答案:ROLAP知識(shí)點(diǎn)解析:OLAP的實(shí)現(xiàn)技術(shù)主要分為以下三類:①基于關(guān)系型數(shù)據(jù)庫(kù)的OLAP(ROLAP,RelationalOLAP);②基于多維數(shù)據(jù)庫(kù)的OLAP(MOLAP,Multi-DimensionalOLAP);③混合型OLAP(HOLAP,HybridOLAP)19、在OLAP的實(shí)現(xiàn)方式中,以多維數(shù)組作為存儲(chǔ)結(jié)構(gòu)的被稱作________OLAP。標(biāo)準(zhǔn)答案:M知識(shí)點(diǎn)解析:MOLAP稱為基于多維數(shù)據(jù)庫(kù)的OLAP,這種OLAP的核心是多維數(shù)據(jù)庫(kù)技術(shù)。MOLAP工具以多維數(shù)據(jù)庫(kù)的形式將元數(shù)據(jù)、基礎(chǔ)事實(shí)數(shù)據(jù)和導(dǎo)出數(shù)據(jù)存儲(chǔ)在以多維數(shù)組為基本存儲(chǔ)結(jié)構(gòu)的多維數(shù)據(jù)庫(kù)中。20、給定一個(gè)銷售交易數(shù)據(jù)庫(kù),從中找出這些交易中的某些物品和其他物品之間的關(guān)系,這種數(shù)據(jù)挖掘一般稱為_(kāi)_______挖掘。標(biāo)準(zhǔn)答案:關(guān)聯(lián)或關(guān)聯(lián)分析或關(guān)聯(lián)規(guī)則知識(shí)點(diǎn)解析:給定一個(gè)銷售交易數(shù)據(jù)庫(kù),從中找出這些交易中的某些物品和其他物品之間的關(guān)系,這種數(shù)據(jù)挖掘一般稱為關(guān)聯(lián)(或關(guān)聯(lián)分析、關(guān)聯(lián)規(guī)則)挖掘。21、對(duì)一個(gè)數(shù)據(jù)集的數(shù)據(jù)進(jìn)行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能相似而不同組間的數(shù)據(jù)盡可能的不同,這樣數(shù)據(jù)挖掘方法稱為_(kāi)_______算法。標(biāo)準(zhǔn)答案:聚類或clustering知識(shí)點(diǎn)解析:本題考查的是聚類算法的定義。對(duì)一個(gè)數(shù)據(jù)集的數(shù)據(jù)進(jìn)行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能相似而不同組間的數(shù)據(jù)盡可能的不同,這樣數(shù)據(jù)挖掘方法稱為聚類算法。22、在多維數(shù)據(jù)分析中,從高粒度級(jí)數(shù)據(jù)視圖切換到低粒度級(jí)數(shù)據(jù)視圖的分析操作稱為_(kāi)_______操作。標(biāo)準(zhǔn)答案:鉆取或下鉆或drilldown知識(shí)點(diǎn)解析:所謂鉆取(drilldown)是指對(duì)應(yīng)于某一維逐步向更細(xì)節(jié)層方向觀察數(shù)據(jù),鉆取是改變展現(xiàn)數(shù)據(jù)維度的層次,變換分析的粒度,它包括向上鉆取和向下鉆取。故答案為鉆取或下鉆或drilldown。23、在企業(yè)信息系統(tǒng)的應(yīng)用類型中,OLAP應(yīng)用是指聯(lián)機(jī)________處理應(yīng)用。標(biāo)準(zhǔn)答案:分析知識(shí)點(diǎn)解析:在企業(yè)信息系統(tǒng)的應(yīng)用類型中,OLAP應(yīng)用(OnlineAnalyticalProcessing)是指聯(lián)機(jī)分析處理應(yīng)用。故答案是分析。24、在數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)的________越小,表明數(shù)據(jù)的細(xì)節(jié)程度越高,可以回答查詢的種類就越多。標(biāo)準(zhǔn)答案:粒度或granularity知識(shí)點(diǎn)解析:在數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)的粒度越小,表明數(shù)據(jù)的細(xì)節(jié)程度越高,可以回答查詢的種類就越多。25、在關(guān)聯(lián)規(guī)則挖掘中,關(guān)聯(lián)規(guī)則的成立與否一般用________度和置信度兩個(gè)指標(biāo)進(jìn)行描述。標(biāo)準(zhǔn)答案:支持知識(shí)點(diǎn)解析:在關(guān)聯(lián)規(guī)則挖掘中,關(guān)聯(lián)規(guī)則的成立與否一般用支持度和置信度兩個(gè)指標(biāo)進(jìn)行描述。26、在企業(yè)數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)中,操作型數(shù)據(jù)存儲(chǔ)ODS一般情況下主要用來(lái)支持即時(shí)OLAP和全局型________兩類應(yīng)用。標(biāo)準(zhǔn)答案:OLTP或事務(wù)處理知識(shí)點(diǎn)解析:在ODS上可實(shí)行的全局應(yīng)用大致可分為:實(shí)現(xiàn)企業(yè)全局的OLTP操作、實(shí)現(xiàn)即時(shí)的OLAP操作。27、根據(jù)事物發(fā)展的延續(xù)性和規(guī)律性,基于變量歷史時(shí)間點(diǎn)上的順序數(shù)據(jù),推測(cè)變量未來(lái)后續(xù)時(shí)間點(diǎn)的發(fā)展趨勢(shì)的任務(wù)稱為_(kāi)_______分析。標(biāo)準(zhǔn)答案:時(shí)間序列或預(yù)測(cè)或時(shí)序知識(shí)點(diǎn)解析:時(shí)間序列分析也可以稱為數(shù)據(jù)演變分析,它能描述行為隨時(shí)間變化的對(duì)象的規(guī)律或趨勢(shì),并對(duì)其進(jìn)行建模,用時(shí)間序列分析方法可以推測(cè)變量未來(lái)后續(xù)時(shí)間點(diǎn)的發(fā)展趨勢(shì)。故答案為時(shí)間序列或預(yù)測(cè)或時(shí)序。28、在數(shù)據(jù)分析方法中,將一組數(shù)據(jù)對(duì)象采取一定方法劃分成若干個(gè)組,并使組內(nèi)數(shù)據(jù)對(duì)象盡可能相似,組間對(duì)象盡可能不同的過(guò)程稱為_(kāi)_______。標(biāo)準(zhǔn)答案:聚類知識(shí)點(diǎn)解析:聚類就是將一組數(shù)據(jù)對(duì)象采取一定方法劃分成若干個(gè)組,并使組內(nèi)數(shù)據(jù)對(duì)象盡可能相似,組間對(duì)象盡可能不同,故答案是聚類。計(jì)算機(jī)三級(jí)數(shù)據(jù)庫(kù)技術(shù)(數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘)機(jī)試模擬試卷第3套一、選擇題(本題共15題,每題1.0分,共15分。)1、某網(wǎng)上書店根據(jù)用戶的歷史購(gòu)書記錄,采用某種數(shù)據(jù)挖掘算法分析出用戶最可能屬于某一類書的愛(ài)好者,應(yīng)該采用()A、關(guān)聯(lián)分析B、分類分析C、時(shí)間序列分析D、回歸分析標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:常見(jiàn)的數(shù)據(jù)挖掘任務(wù)包括分類、估計(jì)、預(yù)測(cè)、相關(guān)性分組或關(guān)聯(lián)規(guī)則、聚類和描述、可視化以及復(fù)雜數(shù)據(jù)類型挖掘(Text、Web、圖形圖像、視頻和音頻等)等。分類分析首先從數(shù)據(jù)中選出已經(jīng)分好類的訓(xùn)練集,在該訓(xùn)練集上運(yùn)用數(shù)據(jù)挖掘分類的技術(shù),建立分類模型,對(duì)于沒(méi)有分類的數(shù)據(jù)進(jìn)行分類。該需求要求根據(jù)購(gòu)書記錄將用戶映射到傾向于喜歡某種書的顧客特性中,而分類挖掘模型能把數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到給定類別的某一個(gè)中。2、某大型超市的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)中,設(shè)有下列數(shù)據(jù):Ⅰ.商品清單Ⅱ.商品銷售細(xì)節(jié)數(shù)據(jù)Ⅲ.DBMS中的數(shù)據(jù)字典Ⅳ.?dāng)?shù)據(jù)庫(kù)結(jié)構(gòu)說(shuō)明文檔Ⅴ.前端應(yīng)用程序表中數(shù)據(jù)項(xiàng)的定義及說(shuō)明文檔Ⅵ.商品分類銷售匯總數(shù)據(jù)以上數(shù)據(jù)中,一般不屬于元數(shù)據(jù)的是()A、僅Ⅰ、Ⅲ和ⅥB、僅Ⅱ、Ⅴ和ⅥC、僅Ⅰ、Ⅱ和ⅥD、僅Ⅱ、Ⅳ和Ⅴ標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:元數(shù)據(jù)被定義為描述數(shù)據(jù)及其環(huán)境的數(shù)據(jù),是關(guān)于數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)用于描述數(shù)據(jù)倉(cāng)庫(kù)內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法,可將其按用途的不同分為技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)。一般來(lái)說(shuō),它有兩個(gè)主要的用途:首先能夠提供基于用戶的信息,其次能支持系統(tǒng)對(duì)數(shù)據(jù)的管理和維護(hù)。在傳統(tǒng)的數(shù)據(jù)庫(kù)中,元數(shù)據(jù)描述了數(shù)據(jù)庫(kù)中的各個(gè)對(duì)象,如數(shù)據(jù)庫(kù)中數(shù)據(jù)字典就是一種元數(shù)據(jù),在關(guān)系數(shù)據(jù)庫(kù)中,這種描述就是對(duì)數(shù)據(jù)庫(kù)、表、列等對(duì)象的定義。DBMS數(shù)據(jù)字典、數(shù)據(jù)庫(kù)結(jié)構(gòu)證明文檔、前端應(yīng)用程序表中數(shù)據(jù)庫(kù)的定義及說(shuō)明文檔都是元數(shù)據(jù)。而Ⅰ、Ⅱ和Ⅵ都是提供了基于用戶數(shù)據(jù)的信息,與元數(shù)據(jù)的定義不符,因此Ⅰ、Ⅱ、Ⅵ不屬于元數(shù)據(jù)。3、現(xiàn)有一個(gè)具有多個(gè)分店的大型連鎖超市,該連鎖超市使用統(tǒng)一的連鎖業(yè)務(wù)經(jīng)營(yíng)管理系統(tǒng)管理其日常業(yè)務(wù)。已知其中的銷售數(shù)據(jù)明細(xì)表結(jié)構(gòu)為(銷售記錄ID,商品ID,價(jià)格,數(shù)量,總金額,銷售時(shí)間,分店ID),該表數(shù)據(jù)量很大。為了提高數(shù)據(jù)訪問(wèn)效率,系統(tǒng)將每年每個(gè)分店的銷售數(shù)據(jù)劃分成獨(dú)立的數(shù)據(jù)表,這種劃分方式被稱為()A、輪轉(zhuǎn)劃分B、范圍劃分C、散列劃分D、多維劃分標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:輪轉(zhuǎn)法:對(duì)關(guān)系順序掃描,將第i個(gè)元組存儲(chǔ)到標(biāo)號(hào)為Dimod的磁盤上,該方式保證了元組在多個(gè)磁盤上均勻分布。散列劃分:選定一個(gè)值域?yàn)閧0,1,…,n-1}的散列函數(shù),對(duì)關(guān)系中的元組基于劃分屬性進(jìn)行散列,如果散列函數(shù)返回i,則將其存儲(chǔ)到第i個(gè)磁盤。范圍劃分:根據(jù)表中某個(gè)屬性取值區(qū)間劃分成不同的子區(qū)間,然后根據(jù)表中的屬性值屬于的不同區(qū)間將表分成不同的子表。多維劃分:維是人們觀察事物的角度,同樣的數(shù)據(jù)從不同的維進(jìn)行觀察可能會(huì)得到不同的結(jié)果,如從各個(gè)分店的角度、各種商品的角度(商品ID)等,而每個(gè)維度又可按粒度的不同劃分成多個(gè)層次,稱為維度成員。本題中將總表按分店號(hào)與時(shí)間劃分成不同的子表,屬于多維劃分,所以選D。4、數(shù)據(jù)挖掘可以簡(jiǎn)單地理解為從大量的數(shù)據(jù)中發(fā)現(xiàn)或挖掘知識(shí)。設(shè)某公司的客戶關(guān)系管理系統(tǒng)中有客戶表A(CID,v1,v2,…,vn)。給定一個(gè)訓(xùn)練集S(v1,v2,…,vn,c),其中c為客戶類別、vi(i=1…n)為客戶其他屬性。若對(duì)表A中任一客戶x,要使系統(tǒng)能判定x所屬的客戶類別,較合理的方案是()A、將x對(duì)應(yīng)的元組中的特征向量(v1,v2,…,vn)與訓(xùn)練集S中的元組進(jìn)行匹配,從而判定x所屬的客戶類別B、對(duì)訓(xùn)練集S設(shè)計(jì)適當(dāng)?shù)乃惴?,?gòu)造一個(gè)分類器M,將x對(duì)應(yīng)的特征向量(v1,v2,…,vn)作為M的輸入,用M判定x所屬的客戶類別C、采用關(guān)聯(lián)規(guī)則挖掘算法構(gòu)成一個(gè)關(guān)聯(lián)式分類器M,用M判定x所屬的類別D、采用適當(dāng)?shù)木垲愃惴?,?duì)表A中的所有元組進(jìn)行聚類,將每個(gè)元組歸入訓(xùn)練集S各元組的c列所給出的客戶類別中,從而實(shí)現(xiàn)x所屬客戶類別的判定標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:對(duì)于訓(xùn)練集S,測(cè)試集A利用數(shù)據(jù)挖掘中的分類算法,通過(guò)訓(xùn)練集構(gòu)建一個(gè)分類器,將測(cè)試集A作為分類器輸入,經(jīng)過(guò)分類器后會(huì)得到相應(yīng)的類別號(hào)。即使相同的類別編號(hào)的訓(xùn)練集也可能對(duì)應(yīng)不同的屬性集,所以單純的通過(guò)對(duì)屬性集差別的比較來(lái)識(shí)別類別不準(zhǔn)確,故A錯(cuò)。關(guān)聯(lián)規(guī)則挖掘是發(fā)現(xiàn)交易數(shù)據(jù)庫(kù)中不同商品之間的聯(lián)系,而本題是對(duì)數(shù)據(jù)進(jìn)行分類,與題意不符,故C錯(cuò)。D項(xiàng)屬于無(wú)監(jiān)督學(xué)習(xí)算法,對(duì)類別并沒(méi)有規(guī)定明確的前提條件,與本題所給的條件無(wú)關(guān)。綜上可知,選項(xiàng)B正確。5、給定如下三個(gè)關(guān)系表:銷售明細(xì)表(商品標(biāo)識(shí),銷售時(shí)間,單價(jià),數(shù)量,金額)日銷售表(商品標(biāo)識(shí),銷售日,總數(shù)量,總金額)月銷售額(商品標(biāo)識(shí),銷售月份,總數(shù)量,總金額)下列說(shuō)法正確的是()A、銷售明細(xì)表的數(shù)據(jù)粒度最大,數(shù)據(jù)量最大B、日銷售表的數(shù)據(jù)粒度最大,數(shù)據(jù)量最小C、月銷售表的數(shù)據(jù)粒度最大,數(shù)據(jù)量最小D、月銷售表的數(shù)據(jù)粒度最小,數(shù)據(jù)量最小標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:數(shù)據(jù)粒度劃分標(biāo)準(zhǔn)可以將數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)劃分為詳細(xì)數(shù)據(jù)、輕度總結(jié)、高度總結(jié)三級(jí)或更多級(jí)。確立粒度的原則:細(xì)化程度越高,粒度越小;細(xì)化程度越低,粒度越大,綜合程度越高。如果數(shù)據(jù)倉(cāng)庫(kù)不保存低粒度的數(shù)據(jù)而只有粗粒度的數(shù)據(jù),則需要存儲(chǔ)的數(shù)據(jù)量就較少。所以A、D錯(cuò)。B項(xiàng)中已是最小粒度,所以沒(méi)有最大、最小之分。C中月銷售表可以分成粒度更小的日銷售表。6、下列關(guān)于數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)與決策支持系統(tǒng)中的相關(guān)概念或說(shuō)法,錯(cuò)誤的是()。A、數(shù)據(jù)倉(cāng)庫(kù)是服務(wù)于決策支持的數(shù)據(jù)集合B、數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識(shí)的方法或過(guò)程C、機(jī)器學(xué)習(xí)是指機(jī)器采用一些方法或模型根據(jù)數(shù)據(jù)去習(xí)得知識(shí)的過(guò)程D、決策支持系統(tǒng)一般是指企業(yè)中以數(shù)據(jù)為基礎(chǔ)對(duì)重要業(yè)務(wù)或事務(wù)實(shí)施決策的信息系統(tǒng)標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:決策支持系統(tǒng)一般是指企業(yè)中以數(shù)據(jù)為基礎(chǔ)對(duì)重要業(yè)務(wù)或事務(wù)實(shí)施輔助決策的信息系統(tǒng)。故答案為D項(xiàng)。7、在建立數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)集成工作中,需要采用適當(dāng)?shù)牟呗詮臄?shù)據(jù)源獲取變化數(shù)據(jù)。下列數(shù)據(jù)表中,一般情況下不適宜采用快照方式從業(yè)務(wù)系統(tǒng)獲取數(shù)據(jù)的是()。A、顧客表、商品類別表B、門店表、銷售人員表C、商場(chǎng)商品銷售表、電信公司通話詳單D、商品清單、商品類別表標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:快照是關(guān)于指定數(shù)據(jù)集合的一個(gè)完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個(gè)時(shí)間點(diǎn)(拷貝開(kāi)始的時(shí)間點(diǎn))的映像??煺湛梢允瞧渌硎镜臄?shù)據(jù)的一個(gè)副本,也可以是數(shù)據(jù)的一個(gè)復(fù)制品。它反映的是某個(gè)時(shí)間點(diǎn)內(nèi)的數(shù)據(jù),該數(shù)據(jù)具有不可以改變性。而商場(chǎng)商品銷售表、電信公司通話詳單屬于動(dòng)態(tài)數(shù)據(jù),不適合用快照的方式獲取數(shù)據(jù)。故答案為C項(xiàng)。8、下列關(guān)于企業(yè)數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中數(shù)據(jù)特點(diǎn)的說(shuō)法,錯(cuò)誤的是()。A、數(shù)據(jù)按面向決策支持應(yīng)用主題的方法進(jìn)行組織B、數(shù)據(jù)經(jīng)常以批量方式訪問(wèn)C、數(shù)據(jù)可以直接修改D、數(shù)據(jù)可用性要求相比OLTP環(huán)境較為寬松標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的,且隨時(shí)間變化的數(shù)據(jù)集合,用來(lái)支持管理人員的決策,有面向主題性、集成性、不可更新性和時(shí)間特性等幾個(gè)重要特性。不可更新并不意味著不向數(shù)據(jù)倉(cāng)庫(kù)中追加新的數(shù)據(jù),只是表示一般不再對(duì)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)中的原始數(shù)據(jù)進(jìn)行修改。故答案為C選項(xiàng)。9、數(shù)據(jù)倉(cāng)庫(kù)是服務(wù)于決策支持的數(shù)據(jù)集合,面向主題是其中的一個(gè)重要特征。下列關(guān)于面向主題的理解,一般情況下錯(cuò)誤的是()。A、面向主題要求進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型設(shè)計(jì)和組織時(shí)需要針對(duì)特定主題的決策支持需求集進(jìn)行B、面向主題是指進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用開(kāi)發(fā)和部署時(shí)要采用面向主題的開(kāi)發(fā)工具和實(shí)施平臺(tái)C、面向主題一般會(huì)要求數(shù)據(jù)倉(cāng)庫(kù)中必須集成企業(yè)或組織機(jī)構(gòu)中多個(gè)來(lái)源的數(shù)據(jù)集D、面向主題中的主題是指一組決策支持需求的集合標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:在傳統(tǒng)的OLTP環(huán)境下,數(shù)據(jù)庫(kù)系統(tǒng)的數(shù)據(jù)一般是以面向企業(yè)基本業(yè)務(wù)應(yīng)用的方式進(jìn)行組織的。在數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)是以面向主題的方式進(jìn)行組織的,主題是一個(gè)抽象的概念,主題也可以稱為分析主題或分析領(lǐng)域,用于表達(dá)某一宏觀的分析領(lǐng)域所涉及的對(duì)象,以及與對(duì)象有關(guān)的數(shù)據(jù)集合。故答案為B選項(xiàng)。10、在對(duì)某商場(chǎng)的顧客進(jìn)行流失預(yù)測(cè)分析時(shí),先取得一個(gè)顧客樣本集S,其模式為(id,a1,a2,…an,c),其中id為顧客的唯一標(biāo)識(shí),ai(i=1,2,…,n)為顧客的屬性,如年齡、性別、消費(fèi)時(shí)間間隔等,c的取值為{流失,未流失}?,F(xiàn)有算法A對(duì)樣本S進(jìn)行處理,輸出結(jié)果為P,P能根據(jù)該樣本集外的顧客u的n個(gè)屬性,確定u的c屬性值,以對(duì)顧客的流失作出預(yù)測(cè)。那么,A和P分別是()A、聚類算法,聚類工具B、分類算法,分類器C、關(guān)聯(lián)規(guī)則算法,規(guī)則集D、多維分析算法,OLAP工具標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:由于有樣本集和測(cè)試集之分,又有已有的類別標(biāo)簽,所以屬于監(jiān)督學(xué)習(xí)。分類:通過(guò)學(xué)習(xí)得到一個(gè)目標(biāo)函數(shù)f,把每個(gè)屬性集x映射到一個(gè)預(yù)先定義的類標(biāo)號(hào)y。分類屬于監(jiān)督學(xué)習(xí)。聚類:根據(jù)在數(shù)據(jù)中發(fā)現(xiàn)的描述對(duì)象及其關(guān)系的信息,將數(shù)據(jù)對(duì)象分組,組內(nèi)的對(duì)象相互之間是相似的,而不同組中的對(duì)象則不同。組內(nèi)的相似性越大,組間差別越大,聚類就越好,屬于無(wú)監(jiān)督學(xué)習(xí)。關(guān)聯(lián)規(guī)則挖掘:發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中的有意義的聯(lián)系。多維分析是指各級(jí)管理決策人員從木同的角度、快速靈活地對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行復(fù)雜查詢多維分析處理。根據(jù)題意顯然是符合分類。所以選B。11、設(shè)某企業(yè)的在線事務(wù)處理(OLTP)系統(tǒng)中有銷售記錄表T1,它每天約產(chǎn)生50萬(wàn)條新記錄,OLTP系統(tǒng)保存半年數(shù)據(jù)。在企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)中,用表T2保存近2年的銷售細(xì)節(jié)數(shù)據(jù),用表T3保存5年內(nèi)每日各個(gè)商品銷售匯總數(shù)據(jù)。為了實(shí)現(xiàn)從OLTP系統(tǒng)到數(shù)據(jù)倉(cāng)庫(kù)的銷售數(shù)據(jù)的集成,一般情況下,下列方案最為合理的是()。A、每天將表T1的數(shù)據(jù)全部復(fù)制到表T2中,并根據(jù)表T2的內(nèi)容重新計(jì)算表T3B、每天將表T1的數(shù)據(jù)全部復(fù)制到數(shù)據(jù)倉(cāng)庫(kù)中,根據(jù)復(fù)制的數(shù)據(jù)與表T2的區(qū)別,生成變化數(shù)據(jù),并根據(jù)變化數(shù)據(jù)重新計(jì)算表T3C、在OLTP系統(tǒng)中采用技術(shù)手段記錄表T1的所有新記錄NT,每天將NT復(fù)制到數(shù)據(jù)倉(cāng)庫(kù)中,將NT1合并到表T2中,根據(jù)表T2重新計(jì)算表T3D、在OLTP系統(tǒng)中采用技術(shù)手段記錄表T1的所有新記錄NT,每天將NT復(fù)制到數(shù)據(jù)倉(cāng)庫(kù)中,將NT合并到表T2中,根據(jù)NT和表T3重新計(jì)算表T3標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:聯(lián)機(jī)事務(wù)處理系統(tǒng)(OLTP)能對(duì)數(shù)據(jù)進(jìn)行即時(shí)更新或其他操作,系統(tǒng)內(nèi)的數(shù)據(jù)總是保持在最新?tīng)顟B(tài)。數(shù)據(jù)倉(cāng)庫(kù)主要功能仍是將組織透過(guò)資訊系統(tǒng)之聯(lián)機(jī)事務(wù)處理(OLTP)經(jīng)年累月所累積的大量資料,透過(guò)數(shù)據(jù)倉(cāng)庫(kù)理論所特有的資料儲(chǔ)存架構(gòu),做有系統(tǒng)的分析整理。根據(jù)題意,銷售記錄表T1每天產(chǎn)生50萬(wàn)條新記錄,而且都是最新產(chǎn)生的數(shù)據(jù),所以最適合存放在OLTP系統(tǒng)中用NT表保存。當(dāng)新記錄NT表中數(shù)據(jù)超過(guò)半年,就需要將表中數(shù)據(jù)復(fù)制到數(shù)據(jù)倉(cāng)庫(kù)中,也就是將NT表中的數(shù)據(jù)合并到T2(保存近2年的銷售細(xì)節(jié)數(shù)據(jù))。當(dāng)新記錄NT表中數(shù)據(jù)超過(guò)2年,那就需要存放到T3表中,T3表需要重新計(jì)算。故答案為D選項(xiàng)。12、為了進(jìn)行數(shù)據(jù)分析,將OLTP系統(tǒng)中數(shù)據(jù)利用抽取程序抽取出來(lái)的最主要原因是()。A、減輕OLTP系統(tǒng)的數(shù)據(jù)存儲(chǔ)負(fù)擔(dān),將數(shù)據(jù)轉(zhuǎn)移出OLTP系統(tǒng)B、通過(guò)建立數(shù)據(jù)的獨(dú)立性來(lái)確保數(shù)據(jù)分析應(yīng)用的安全性C、解決OLTP應(yīng)用與分析型應(yīng)用之間的性能沖突問(wèn)題D、解決企業(yè)整體信息系統(tǒng)的數(shù)據(jù)體系存在的蛾―網(wǎng)問(wèn)題標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:為了進(jìn)行數(shù)據(jù)分析,將OLTP系統(tǒng)中數(shù)據(jù)利用抽取程序抽取出來(lái)的最主要原因是解決OLTP應(yīng)用與分析型應(yīng)用之間的性能沖突問(wèn)題。故答案為C項(xiàng)。13、分類算法服務(wù)于數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)中分類任務(wù),下列算法中不屬于分類算法的是()。A、SVM算法B、BP神經(jīng)網(wǎng)絡(luò)算法C、決策樹算法D、K-means算法標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:分類器的構(gòu)造方法有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等。統(tǒng)計(jì)方法包括貝葉斯法和非參數(shù)法;機(jī)器學(xué)習(xí)方法包括決策樹法和規(guī)則歸納法;神經(jīng)網(wǎng)絡(luò)方法主要是BP算法。K-means屬于聚類算法。故答案為D選項(xiàng)。14、在企業(yè)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)中,數(shù)據(jù)的粒度級(jí)設(shè)計(jì)是一個(gè)重要的問(wèn)題,在粒度級(jí)設(shè)計(jì)中,設(shè)有下列考慮因素:Ⅰ.用戶查詢所涉及的數(shù)據(jù)的最低細(xì)節(jié)程度Ⅱ.高粒度級(jí)數(shù)據(jù)所需的存儲(chǔ)空間Ⅲ.用戶查詢的平均性能需求Ⅳ.系統(tǒng)的可用存儲(chǔ)空間Ⅴ.低粒度級(jí)數(shù)據(jù)的規(guī)模Ⅵ.用戶查詢所涉及的數(shù)據(jù)最高粒度級(jí)在以上因素中,屬于設(shè)計(jì)時(shí)需要考慮的主要因素是()A、僅Ⅰ和ⅢB、僅Ⅰ、Ⅲ、Ⅳ和ⅤC、僅Ⅳ和ⅤD、僅Ⅰ、Ⅲ和Ⅵ標(biāo)準(zhǔn)答案:B知識(shí)點(diǎn)解析:在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,粒度是一個(gè)重要的設(shè)計(jì)問(wèn)題,它影響到數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量以及系統(tǒng)能回答的查詢的類型。在進(jìn)行粒度級(jí)設(shè)計(jì)時(shí),在可用的存儲(chǔ)空間中保存粗細(xì)程度不同的主題數(shù)據(jù),以盡可能滿足各種應(yīng)用的多角度、多層次數(shù)據(jù)查詢要求,同時(shí)在總體上提高查詢的設(shè)計(jì)效率。粒度越小,則細(xì)節(jié)程度越高,綜合程度就越低,回答查詢的類型也越多,數(shù)據(jù)量比較大,空間代價(jià)也大。用戶查詢所涉及的數(shù)據(jù)的最低細(xì)節(jié)程度、用戶查詢的平均性能需求、系統(tǒng)的可用存儲(chǔ)空間、低粒度級(jí)數(shù)據(jù)的規(guī)模都屬于主要考慮的因素。故答案為B選項(xiàng)。15、設(shè)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)中有三個(gè)物化視圖(實(shí)體化視圖)V1、V2和V3,若有分別針對(duì)這三個(gè)視圖進(jìn)行的查詢Q1、Q2和Q3,查詢過(guò)程或結(jié)果有如下現(xiàn)象:Ⅰ.Q1查詢到的是V1視圖所對(duì)應(yīng)原始數(shù)據(jù)的4小時(shí)前的數(shù)據(jù)Ⅱ.Q2每次查詢到的都是V2視圖所對(duì)應(yīng)原始數(shù)據(jù)的1分鐘前的數(shù)據(jù)Ⅲ.Q3查詢V3時(shí),發(fā)現(xiàn)V3不是最新數(shù)據(jù),實(shí)時(shí)啟動(dòng)對(duì)V3的更新程序,刷新后得到最新數(shù)據(jù)有關(guān)V1、V2和V3所采用的物化視圖更新維護(hù)策略的說(shuō)法,正確的是()。A、對(duì)V1采用的是快照維護(hù)策略,V2是實(shí)時(shí)近實(shí)時(shí)維護(hù)策略,V3是延時(shí)維護(hù)策略B、對(duì)V1、V2和V3都采用的是延時(shí)維護(hù)策略C、對(duì)V1和V2采用的是快照維護(hù)策略,V3是延時(shí)維護(hù)策略D、對(duì)V1和V2采用的是延時(shí)維護(hù)策略,V3是實(shí)時(shí)近實(shí)時(shí)維護(hù)策略標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)維護(hù)策略分為3種:實(shí)時(shí)維護(hù)、延時(shí)維護(hù)和快照維護(hù)。實(shí)時(shí)維護(hù)在數(shù)據(jù)源發(fā)生變化時(shí),立即更新數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)。實(shí)時(shí)維護(hù)操作的觸發(fā)條件是數(shù)據(jù)源進(jìn)行了數(shù)據(jù)的更新操作。這種策略能夠保證用戶總查到最新的數(shù)據(jù)(V2)。延時(shí)維護(hù)工作并不是在數(shù)據(jù)源的更新事務(wù)中完成,而是在數(shù)據(jù)倉(cāng)庫(kù)中的視圖被查詢時(shí)完成更新(V3)。延時(shí)維護(hù)操作的觸發(fā)條件是用戶在數(shù)據(jù)源發(fā)生變化后首次對(duì)數(shù)據(jù)倉(cāng)庫(kù)執(zhí)行查詢操作。快照維護(hù)策略定期對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行維護(hù),維護(hù)操作的觸發(fā)條件是時(shí)間。這種策略不會(huì)給源數(shù)據(jù)的更新事務(wù)或者數(shù)據(jù)倉(cāng)庫(kù)的查詢事務(wù)增加任何負(fù)擔(dān),但通常無(wú)法提供最新的數(shù)據(jù)(V1)。故答案為A選項(xiàng)。二、應(yīng)用題(本題共12題,每題1.0分,共12分。)16、知識(shí)發(fā)現(xiàn)主要由三個(gè)步驟組成,它們是________、數(shù)據(jù)挖掘、結(jié)果的解釋評(píng)估。標(biāo)準(zhǔn)答案:數(shù)據(jù)準(zhǔn)備知識(shí)點(diǎn)解析:知識(shí)發(fā)現(xiàn)指的是從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在有用的以及最終可理解的模式的非平凡過(guò)程。知識(shí)發(fā)現(xiàn)將信息變?yōu)橹R(shí),從數(shù)據(jù)礦山中找到蘊(yùn)藏的知識(shí)金塊,將為知識(shí)創(chuàng)新和知識(shí)經(jīng)濟(jì)的發(fā)展作出貢獻(xiàn),也是所謂“數(shù)據(jù)挖掘”的一種更廣義的說(shuō)法。知識(shí)發(fā)現(xiàn)過(guò)程由以下三個(gè)階段組成:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果的解釋評(píng)估。17、數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向________的、集成的、非易失的、且隨時(shí)間變化的數(shù)據(jù)集合。標(biāo)準(zhǔn)答案:主題知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)是為了構(gòu)建新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲(chǔ)和組織技術(shù),基本特征包括:數(shù)據(jù)是面向主題的、集成的、非易失的、隨時(shí)間不斷變化的。主題是一個(gè)在較高層次上對(duì)數(shù)據(jù)的抽象,這使得面向主題的數(shù)據(jù)組織可以獨(dú)立于數(shù)據(jù)的處理邏輯,因而可以在這種數(shù)據(jù)環(huán)境上方便地開(kāi)發(fā)新的分析型應(yīng)用。18、在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)和建設(shè)過(guò)程中,設(shè)計(jì)者需要調(diào)查用戶的決策或數(shù)據(jù)處理需求,并將功能相近且需要相關(guān)聯(lián)數(shù)據(jù)支持的需求進(jìn)行歸類,得到不同的需求集合,并在企業(yè)數(shù)據(jù)模型中尋找能夠滿足各個(gè)需求集合的數(shù)據(jù)集合,然后針對(duì)各個(gè)數(shù)據(jù)集合開(kāi)展數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型的設(shè)計(jì)。這種設(shè)計(jì)方法稱為_(kāi)_______的設(shè)計(jì)方法。標(biāo)準(zhǔn)答案:面向主題知識(shí)點(diǎn)解析:面向主題的數(shù)據(jù)組織方式,就是在較高層次上對(duì)分析對(duì)象數(shù)據(jù)的一個(gè)完整并且一致的描述,能刻畫各個(gè)分析對(duì)象所涉及的企業(yè)各項(xiàng)數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系。所謂較高層次是相對(duì)面向應(yīng)用的數(shù)據(jù)組織方式而言的,即按照主題進(jìn)行數(shù)據(jù)組織的方式具有更高的數(shù)據(jù)抽象級(jí)別。與傳統(tǒng)數(shù)據(jù)庫(kù)面向應(yīng)用進(jìn)行數(shù)據(jù)組織的特點(diǎn)相對(duì)應(yīng),數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)面向主題進(jìn)行組織。例如,一個(gè)生產(chǎn)企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)所組織的主題可能有產(chǎn)品訂貨分析和貨物發(fā)運(yùn)分析等。19、數(shù)據(jù)從操作型環(huán)境轉(zhuǎn)移到數(shù)據(jù)倉(cāng)庫(kù)過(guò)程中所用到ETL工具通常需要完成的處理操作包括抽取、轉(zhuǎn)換和________。標(biāo)準(zhǔn)答案:裝載或裝入或加載知識(shí)點(diǎn)解析:ETL是實(shí)現(xiàn)數(shù)據(jù)集成的主要技術(shù),即填充更新數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)抽取、轉(zhuǎn)換、裝載的數(shù)據(jù)采集過(guò)程。20、時(shí)間序列分析也可以稱為數(shù)據(jù)演變分析,它能描述行為隨________變化的對(duì)象的規(guī)律或趨勢(shì),并對(duì)其進(jìn)行建模。標(biāo)準(zhǔn)答案:時(shí)間知識(shí)點(diǎn)解析:時(shí)間序列分析也可以稱為數(shù)據(jù)演變分析,它能描述行為隨時(shí)間變化的對(duì)象的規(guī)律或趨勢(shì),并對(duì)其進(jìn)行建模。21、在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,數(shù)據(jù)的________設(shè)計(jì)是一種重要的設(shè)計(jì)問(wèn)題,它會(huì)影響到數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)量以及系統(tǒng)能回答的查詢的類型。標(biāo)準(zhǔn)答案:粒度或granularity知識(shí)點(diǎn)解析:粒度是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別。細(xì)化程度越高,粒度級(jí)就越??;相反,細(xì)化程度越低,粒度級(jí)就越大。數(shù)據(jù)的粒度一直是一個(gè)設(shè)計(jì)問(wèn)題。在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中粒度之所以是主要的設(shè)計(jì)問(wèn)題,是因?yàn)樗钌畹赜绊懘娣旁跀?shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量的大小,同時(shí)影響向數(shù)據(jù)倉(cāng)庫(kù)所能回答的查詢類型。在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量大小與查詢的詳細(xì)程度之間要作出權(quán)衡。故答案為粒度。22、在企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中,操作型數(shù)據(jù)存儲(chǔ)層(ODS),一般用以支撐即時(shí)________和全局型OLTP應(yīng)用。標(biāo)準(zhǔn)答案:OLAP或分析知識(shí)點(diǎn)解析:在企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中,操作型數(shù)據(jù)存儲(chǔ)層(ODS),主要包括即時(shí)OLAP和全局型OLTP應(yīng)用。故答案為OLAP或分析。23、在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,粒度是一個(gè)重要的設(shè)計(jì)問(wèn)題。粒度越________,細(xì)節(jié)程度越高,能回答的查詢就越多,數(shù)據(jù)量就比較大。標(biāo)準(zhǔn)答案:小知識(shí)點(diǎn)解析:一般將綜合級(jí)別稱為粒度,粒度越大,表示綜合程度越高,粒度越小,表示細(xì)節(jié)程度越高。24、數(shù)據(jù)倉(cāng)庫(kù)共有四個(gè)特性,分別是面向主題、________、非易失和隨時(shí)間變化。標(biāo)準(zhǔn)答案:集成知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的,且隨時(shí)間變化的數(shù)據(jù)集合,用來(lái)支持管理人員的決策。這個(gè)概念指出了數(shù)據(jù)倉(cāng)庫(kù)的幾個(gè)重要的特性,即面向主題性、集成性、不可更新性和時(shí)間特性。25、數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、________的、非易失的,且隨時(shí)間變化的數(shù)據(jù)集合。標(biāo)準(zhǔn)答案:集成知識(shí)點(diǎn)解析:本題考查的是數(shù)據(jù)倉(cāng)庫(kù)的定義。數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的,且隨時(shí)間變化的數(shù)據(jù)集合。26、在關(guān)聯(lián)規(guī)則挖掘中,為了發(fā)現(xiàn)有意義的關(guān)聯(lián)規(guī)則,需要給定最小________度和最小可信度兩個(gè)閾值。標(biāo)準(zhǔn)答案:支持知識(shí)點(diǎn)解析:關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘的主要任務(wù)就是在事務(wù)數(shù)據(jù)庫(kù)中找出給定的具有最小支持度和最小置信度的關(guān)聯(lián)規(guī)則,同時(shí)滿足最小支持度閾值和最小置信度規(guī)閾值的規(guī)則成為強(qiáng)規(guī)則。故答案為支持。27、數(shù)據(jù)倉(cāng)庫(kù)與大數(shù)據(jù)平臺(tái)的前端需要有ETL工具,其中的E是指________。標(biāo)準(zhǔn)答案:抽取或提取或Extract知識(shí)點(diǎn)解析:ETL工具是(ExtractTransformLoad)的縮寫,是實(shí)現(xiàn)數(shù)據(jù)集成的主要技術(shù)。故答案為抽取或提取或Extract。計(jì)算機(jī)三級(jí)數(shù)據(jù)庫(kù)技術(shù)(數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘)機(jī)試模擬試卷第4套一、選擇題(本題共15題,每題1.0分,共15分。)1、對(duì)于ODS體系,有下列說(shuō)法:Ⅰ.ODSⅠ:第一類ODS數(shù)據(jù)更新頻率是天級(jí),一般隔夜后將數(shù)據(jù)更新到ODS中Ⅱ.ODSⅡ:第二類ODS的數(shù)據(jù)更新頻率是小時(shí)級(jí),如4小時(shí)更新一次Ⅲ.ODSⅢ:第三類ODS的數(shù)據(jù)更新頻率是秒級(jí),即操作型系統(tǒng)中的數(shù)據(jù)發(fā)生改變后,幾乎是立即傳送到ODS中,這類ODS建設(shè)難度大Ⅳ.ODSⅣ:第四類ODS是根據(jù)數(shù)據(jù)來(lái)源方向和類型劃分的,不僅包含來(lái)自操作型環(huán)境的數(shù)據(jù),也包含由數(shù)據(jù)倉(cāng)庫(kù)層和數(shù)據(jù)集市層的應(yīng)用反饋給ODs的一些決策結(jié)果或一些報(bào)表信息以上說(shuō)法正確的是()A、僅Ⅰ和ⅡB、僅Ⅰ和ⅢC、僅Ⅱ和ⅣD、Ⅰ、Ⅱ、Ⅲ和Ⅳ標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:ODS(OperationalDataStore)是數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)中的一個(gè)可選部分,ODS具備數(shù)據(jù)倉(cāng)庫(kù)的部分特征和OLTP系統(tǒng)的部分特征,它是“面向主題的、集成的、當(dāng)前或接近當(dāng)前的、不斷變化的”數(shù)據(jù)。第一類ODS數(shù)據(jù)更新頻率是秒級(jí),第二類ODS的數(shù)據(jù)更新頻率是小時(shí)級(jí),第三類ODS的數(shù)據(jù)更新頻率是天級(jí),上述三類是根據(jù)數(shù)據(jù)更新的速度劃分的,ODSⅣ:第四類ODS是根據(jù)數(shù)據(jù)來(lái)源方向和類型劃分的。2、關(guān)于操作型數(shù)據(jù)和DSS型數(shù)據(jù)特征有如下說(shuō)法Ⅰ.操作型數(shù)據(jù)更新頻率高,DSS型數(shù)據(jù)一般不更新Ⅱ.操作型數(shù)據(jù)對(duì)性能要求寬松,DSS型數(shù)據(jù)對(duì)性能要求高Ⅲ.操作型數(shù)據(jù)是詳細(xì)的,DSS型數(shù)據(jù)是綜合的Ⅳ.操作型數(shù)據(jù)有冗余,DSS型數(shù)據(jù)無(wú)冗余Ⅴ.操作型數(shù)據(jù)處理需求事先可知,DSS型數(shù)據(jù)處理需求事先不明確以上說(shuō)法正確的是()A、Ⅰ、Ⅱ、ⅤB、Ⅱ、Ⅲ、ⅣC、Ⅰ、Ⅲ、ⅤD、Ⅲ、Ⅳ、Ⅴ標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:操作型數(shù)據(jù)對(duì)性能要求較高、無(wú)冗余。操作型數(shù)據(jù)與分析型數(shù)據(jù)的區(qū)別如以下所示。3、一個(gè)在線書評(píng)、樂(lè)評(píng)分享網(wǎng)站,建有面向業(yè)務(wù)的數(shù)據(jù)庫(kù)系統(tǒng)和面向分析的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)需要每天從數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)的數(shù)據(jù)庫(kù)導(dǎo)入新數(shù)據(jù)。有下列數(shù)據(jù)表:Ⅰ.書籍表和書籍類別表Ⅱ.用戶表和好友關(guān)系表Ⅲ.書評(píng)表和樂(lè)評(píng)表Ⅳ.音樂(lè)專輯表和音樂(lè)分類表上述表中,適合采用快照方式從數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)獲取數(shù)據(jù)的是()。A、僅Ⅰ和ⅣB、僅Ⅱ和ⅣC、僅Ⅰ、Ⅱ和ⅣD、僅Ⅰ、Ⅱ和Ⅲ標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:快照:該方法通過(guò)對(duì)當(dāng)前數(shù)據(jù)表進(jìn)行“照相”,記錄當(dāng)前的數(shù)據(jù)表信息“相片”,然后將當(dāng)前的“相片”與以前的數(shù)據(jù)表“相片”進(jìn)行比較,如果不一致將通過(guò)一定的方式傳到數(shù)據(jù)倉(cāng)庫(kù),從而實(shí)現(xiàn)數(shù)據(jù)的一致性,這種方式適合于更新頻率較低的數(shù)據(jù)表。題目中的書評(píng)表和樂(lè)評(píng)表主要用于記載用戶的評(píng)論,里面的內(nèi)容更新頻率較高,而數(shù)據(jù)倉(cāng)庫(kù)的更新頻率較低,因此書評(píng)表和樂(lè)評(píng)表不適合用于快照的方法。而其它三個(gè)選項(xiàng)的更新頻率相對(duì)較低,比較適合快照模式,故選擇C選項(xiàng)。4、在大型企業(yè)的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)中,聯(lián)機(jī)事務(wù)處理(OLTP)和聯(lián)機(jī)分析處理(OLAP)是常見(jiàn)的數(shù)據(jù)管理與數(shù)據(jù)分析形式。關(guān)于OLTP和OLAP,一般情況下,下列說(shuō)法正確的是()A、OLTP系統(tǒng)的安全性要求比OLAP系統(tǒng)的低,也比較容易實(shí)現(xiàn)B、OLAP系統(tǒng)在訪問(wèn)數(shù)據(jù)時(shí),一般以訪問(wèn)少量記錄為主,OLTP系統(tǒng)則相反C、OLTP要求系統(tǒng)必須具有很高的響應(yīng)速度,而OLAP對(duì)系統(tǒng)響應(yīng)速度的要求較為寬松D、OLTP系統(tǒng)一般由企業(yè)的中上層或決策層使用,而OLAP系統(tǒng)一般由企業(yè)的中下層業(yè)務(wù)人員使用標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:OLTP是對(duì)數(shù)據(jù)庫(kù)聯(lián)機(jī)的日常操作,通常是對(duì)一條記錄的查詢和修改,要求快速響應(yīng)用戶的請(qǐng)求,對(duì)數(shù)據(jù)的安全性、完整性及事物吞吐量要求很高。而OLAP是對(duì)數(shù)據(jù)的查詢和分析操作,通常是對(duì)海量歷史數(shù)據(jù)的查詢和分析,要訪問(wèn)的數(shù)據(jù)量非常大,查詢和分析操作十分復(fù)雜。所以A、B錯(cuò)。又因?yàn)镺LAP為宏觀分析,OLTP為微現(xiàn)操作,所以前者面向中上層和決策者使用,而后者面向企業(yè)的中下層業(yè)務(wù)人員使用。所以D錯(cuò)。因此選C。5、下列關(guān)于數(shù)據(jù)倉(cāng)庫(kù)粒度的說(shuō)法,錯(cuò)誤的是()。A、在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,粒度是一個(gè)重要的設(shè)計(jì)問(wèn)題,它影響到數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量和系統(tǒng)能夠回答的查詢的類型B、一般在進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織時(shí),需要根據(jù)當(dāng)前應(yīng)用的需求來(lái)進(jìn)行多粒度級(jí)設(shè)計(jì)C、粒度越小,數(shù)據(jù)量越小,空間代價(jià)越小D、粒度越大,綜合程度越高標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,粒度是一個(gè)重要的設(shè)計(jì)問(wèn)題,它影響到數(shù)據(jù)倉(cāng)庫(kù)的數(shù)量以及系統(tǒng)能夠回答的查詢的類型。粒度越小,則詳細(xì)程度越高,綜合程度就越低,回答詢問(wèn)的種類也越多,數(shù)據(jù)量比較大,空間代價(jià)也大;粒度越大,綜合程度就越高。綜上所述可知C選項(xiàng)錯(cuò)誤。故選擇C選項(xiàng)。6、下列關(guān)于數(shù)據(jù)倉(cāng)庫(kù)粒度的說(shuō)法,錯(cuò)誤的是()。A、在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,粒度是一個(gè)重要的設(shè)計(jì)問(wèn)題,它影響到數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量和系統(tǒng)能夠回答的查詢的類型B、一般在進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織時(shí),需要根據(jù)當(dāng)前應(yīng)用的需求來(lái)進(jìn)行多粒度級(jí)設(shè)計(jì)C、數(shù)據(jù)粒度越小,說(shuō)明數(shù)據(jù)綜合程度越低D、數(shù)據(jù)粒度越大,數(shù)據(jù)量越大,空間代價(jià)越大標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:粒度越大,表示綜合程度越高;粒度越小,表示綜合程度越低。粒度越小,細(xì)節(jié)程度越高,數(shù)據(jù)量就比較大,空間代價(jià)也大。故答案為D項(xiàng)。7、數(shù)據(jù)倉(cāng)庫(kù)是服務(wù)于企業(yè)決策支持的數(shù)據(jù)集合。下列選項(xiàng)中,一般情況下不屬于數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)特征的是()。A、可修改B、面向主題C、集成的D、隨時(shí)間變化標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)特征包括面向主題性,集成性,不可更新性,時(shí)間特性。故答案為A項(xiàng)。8、在具有數(shù)據(jù)倉(cāng)庫(kù)的企業(yè)數(shù)據(jù)環(huán)境中,數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)一般都具有許多特點(diǎn),下列都屬于其特點(diǎn)的是()。A、面向主題、不可直接修改、批量訪問(wèn)B、面向主題、可直接修改、性能要求較為寬松C、集成的、不可直接修改、性能要求高D、集成的、可直接修改、批量訪問(wèn)標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的,且隨時(shí)間變化的數(shù)據(jù)集合,用來(lái)支持管理人員的決策,有面向主題性、集成性、不可更新性和時(shí)間特性等幾個(gè)重要特性。故答案為A選項(xiàng)。9、設(shè)某數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中有下列數(shù)據(jù)表:Ⅰ.商品銷售表(商品號(hào),店鋪標(biāo)識(shí),銷售量,單價(jià),日期,時(shí)間)Ⅱ.各店商品周銷售表(商品號(hào),店鋪標(biāo)識(shí),周銷售量,周)Ⅲ.各店商品月銷售表(商品號(hào),店鋪標(biāo)識(shí),月銷售量,月)Ⅳ.各小類各店商品月銷售表(商品小類,店鋪標(biāo)識(shí),月銷售量,月)以上各個(gè)表中數(shù)據(jù),粒度級(jí)最低和最高的表分別是()。A、僅Ⅰ和ⅡB、僅Ⅱ和ⅢC、僅Ⅰ和ⅣD、僅Ⅲ和Ⅳ標(biāo)準(zhǔn)答案:C知識(shí)點(diǎn)解析:粒度是系統(tǒng)中存在不同綜合級(jí)別的數(shù)據(jù),一般將綜合級(jí)別稱為粒度。粒度越大,表示綜合程度越高,粒度越小,表示綜合程度越低。粒度級(jí)最低是各小類各店商品月銷售表,粒度級(jí)最高是商品銷售表。故答案為C選項(xiàng)。10、設(shè)某銀行有基于關(guān)系型數(shù)據(jù)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其中有下列數(shù)據(jù)Ⅰ.賬戶余額快照數(shù)據(jù)Ⅱ.DBMS的數(shù)據(jù)字典Ⅲ.賬戶存取明細(xì)數(shù)據(jù)Ⅳ.?dāng)?shù)據(jù)表結(jié)構(gòu)說(shuō)明文檔Ⅴ.?dāng)?shù)據(jù)抽取日志以上數(shù)據(jù)不屬于元數(shù)據(jù)的是()A、僅Ⅰ和ⅢB、僅Ⅳ和ⅤC、僅Ⅱ和ⅣD、僅Ⅰ、Ⅲ和Ⅴ標(biāo)準(zhǔn)答案:D知識(shí)點(diǎn)解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項(xiàng)內(nèi)容。在關(guān)系數(shù)據(jù)中,這種描述就是對(duì)數(shù)據(jù)庫(kù)、表、列等其他對(duì)象的定義。因此可推出,Ⅰ、Ⅲ和Ⅴ不屬于元數(shù)據(jù)。所以選D。11、下列關(guān)于數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)方法特點(diǎn)的描述,錯(cuò)誤的是()。A、數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析需求一般在設(shè)計(jì)初期就能夠并需要完全整理出來(lái)B、數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)方法一般是一種數(shù)據(jù)驅(qū)動(dòng)的方法,以數(shù)據(jù)源系統(tǒng)分析和企業(yè)主題數(shù)據(jù)模型的設(shè)計(jì)作為起點(diǎn)C、企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)一般是一個(gè)不斷循環(huán)、迭代完善的過(guò)程D、在進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)粒度設(shè)計(jì)時(shí)需要綜合考慮數(shù)據(jù)規(guī)模、查詢需求、硬件和運(yùn)維成本等因素標(biāo)準(zhǔn)答案:A知識(shí)點(diǎn)解析:數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析需求
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 達(dá)英-35對(duì)未育女性人工流產(chǎn)術(shù)后子宮內(nèi)膜的影響
- 初級(jí)會(huì)計(jì)實(shí)務(wù)-初級(jí)會(huì)計(jì)《初級(jí)會(huì)計(jì)實(shí)務(wù)》模擬試卷681
- 初級(jí)會(huì)計(jì)實(shí)務(wù)-《初級(jí)會(huì)計(jì)實(shí)務(wù)》模考試卷247
- 城市復(fù)雜環(huán)境低成本北斗-GNSS高精度單車定位技術(shù)研究
- 補(bǔ)陽(yáng)還五湯聯(lián)合杵針治療腰椎術(shù)后殘留神經(jīng)根癥狀的臨床療效觀察
- 建筑物消防安全巡查
- 二零二五版研發(fā)成果專利代理全流程服務(wù)協(xié)議3篇
- 二零二五版污泥運(yùn)輸合同范本(含污泥深度處理及資源化)3篇
- 二零二五年度大型商場(chǎng)消防系統(tǒng)維護(hù)管理合同2篇
- 水泥溝清淤施工方案
- 醫(yī)院消防安全培訓(xùn)課件
- 湖北省黃石市陽(yáng)新縣2024-2025學(xué)年八年級(jí)上學(xué)期數(shù)學(xué)期末考試題 含答案
- 硝化棉是天然纖維素硝化棉制造行業(yè)分析報(bào)告
- 央視網(wǎng)2025亞冬會(huì)營(yíng)銷方案
- 《00541語(yǔ)言學(xué)概論》自考復(fù)習(xí)題庫(kù)(含答案)
- 2025年機(jī)關(guān)工會(huì)個(gè)人工作計(jì)劃
- 《無(wú)砟軌道施工與組織》 課件 第十講雙塊式無(wú)砟軌道施工工藝
- 江蘇省南京市、鹽城市2023-2024學(xué)年高三上學(xué)期期末調(diào)研測(cè)試+英語(yǔ)+ 含答案
- 2024護(hù)理不良事件分析
- 光伏項(xiàng)目的投資估算設(shè)計(jì)概算以及財(cái)務(wù)評(píng)價(jià)介紹
- 2024新版《藥品管理法》培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論