




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大數(shù)據(jù)分析根底一、根底學(xué)問局部習(xí)題〔共29題,67分〕1、大數(shù)據(jù)的最顯著特征是〔 〕。〔單項(xiàng)選擇題,此題2分〕A:數(shù)據(jù)規(guī)模大 B:數(shù)據(jù)類型多樣 C:數(shù)據(jù)處理速度快D:數(shù)據(jù)價(jià)值密度高2、美國(guó)海軍軍官莫里通過對(duì)前人航海日志的分析,繪制了的航海路線圖,標(biāo)明白大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這表達(dá)了大數(shù)據(jù)分析理念中的〔 〕。〔單項(xiàng)選擇題,此題2分〕A:在數(shù)據(jù)根底上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B:在分析方法上更留意相關(guān)分析而不是因果分析C:在分析效果上更追究效率而不是確定準(zhǔn)確D:在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是確定數(shù)據(jù)3、以下對(duì)大數(shù)據(jù)特點(diǎn)的說法中,錯(cuò)誤的選項(xiàng)是〔 〕?!矄雾?xiàng)選擇題,此題2分〕A:數(shù)據(jù)規(guī)模大 B:數(shù)據(jù)類型多樣 C:數(shù)據(jù)處理速度快 D:數(shù)據(jù)價(jià)值密度高4、當(dāng)前社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是〔 〕?!矄雾?xiàng)選擇題,此題2分〕A:互聯(lián)網(wǎng) B:物聯(lián)網(wǎng) C:綜合國(guó)力 D:自然資源5、以下關(guān)于計(jì)算機(jī)存儲(chǔ)容量單位的說法中,錯(cuò)誤的選項(xiàng)是〔 〕?!矄雾?xiàng)選擇題,此題2分〕A:1KB<1MB<1GB B:根本單位是字節(jié)〔Byte〕C:一個(gè)漢字需要一個(gè)字節(jié)的存儲(chǔ)空間 D:一個(gè)字節(jié)能夠容納一個(gè)英文字符,6、以下關(guān)于聚類挖掘技術(shù)的說法中,錯(cuò)誤的選項(xiàng)是〔〕?!矄雾?xiàng)選擇題,此題2分〕A:不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全依據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別B:要求同類數(shù)據(jù)的內(nèi)容相像度盡可能小C:要求不同類數(shù)據(jù)的內(nèi)容相像度盡可能小D:與分類挖掘技術(shù)相像的是,都是要對(duì)數(shù)據(jù)進(jìn)展分類處理7、以下關(guān)于大數(shù)據(jù)的分析理念的說法中,錯(cuò)誤的選項(xiàng)是〔 〕?!矄雾?xiàng)選擇題,此題2分〕A:在數(shù)據(jù)根底上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B:在分析方法上更留意相關(guān)分析而不是因果分析C:在分析效果上更追究效率而不是確定準(zhǔn)確D:在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是確定數(shù)據(jù)8、大數(shù)據(jù)時(shí)代,數(shù)據(jù)使用的關(guān)鍵是〔 〕?!矄雾?xiàng)選擇題,此題2分〕A:數(shù)據(jù)收集 B:數(shù)據(jù)存儲(chǔ) C:數(shù)據(jù)分析 D:數(shù)據(jù)再利用9、數(shù)據(jù)倉(cāng)庫(kù)的最終目的是〔 〕?!矄雾?xiàng)選擇題,此題2分〕A:收集業(yè)務(wù)需求 B:建立數(shù)據(jù)倉(cāng)庫(kù)規(guī)律模型C:開發(fā)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用分析 D:為用戶和業(yè)務(wù)部門供給決策支持10、支撐大數(shù)據(jù)業(yè)務(wù)的根底是〔 〕。〔單項(xiàng)選擇題,此題2分〕A:數(shù)據(jù)科學(xué) B:數(shù)據(jù)應(yīng)用 C:數(shù)據(jù)硬件 D:數(shù)據(jù)人才11、在網(wǎng)絡(luò)爬蟲的爬行策略中,應(yīng)用最為根底的是〔 〕?!捕囗?xiàng)選擇題,此題3分〕A:深度優(yōu)先遍歷策略 B:廣度優(yōu)先遍歷策略C:高度優(yōu)先遍歷策略 D:反向鏈接策略 E:大站優(yōu)先策略12、當(dāng)前,大數(shù)據(jù)產(chǎn)業(yè)進(jìn)展的特點(diǎn)是〔 〕?!捕囗?xiàng)選擇題,此題3分〕A:規(guī)模較大 B:規(guī)模較小 C:增速很快 D:增速緩慢 E:多產(chǎn)業(yè)穿插融合13、以下關(guān)于數(shù)據(jù)生命周期治理的核心生疏中,正確的選項(xiàng)是〔 〕?!捕囗?xiàng)選擇題,此題3分〕A:數(shù)據(jù)從產(chǎn)生到被刪除銷毀的過程中,具有多個(gè)不同的數(shù)據(jù)存在階段B:在不同的數(shù)據(jù)存在階段,數(shù)據(jù)的價(jià)值是不同的C:依據(jù)數(shù)據(jù)價(jià)值的不同應(yīng)當(dāng)對(duì)數(shù)據(jù)實(shí)行不同的治理策略D:數(shù)據(jù)生命周期治理旨在產(chǎn)生效益的同時(shí),降低生產(chǎn)本錢E:數(shù)據(jù)生命周期治理最終關(guān)注的是社會(huì)效益14、以下關(guān)于基于大數(shù)據(jù)的營(yíng)銷模式和傳統(tǒng)營(yíng)銷模式的說法中,錯(cuò)誤的選項(xiàng)是〔 〕?!捕囗?xiàng)選擇題,此題3分〕A:傳統(tǒng)營(yíng)銷模式比基于大數(shù)據(jù)的營(yíng)銷模式投入更小B:傳統(tǒng)營(yíng)銷模式比基于大數(shù)據(jù)的營(yíng)銷模式針對(duì)性更強(qiáng)C:傳統(tǒng)營(yíng)銷模式比基于大數(shù)據(jù)的營(yíng)銷模式轉(zhuǎn)化率低D:基于大數(shù)據(jù)的營(yíng)銷模式比傳統(tǒng)營(yíng)銷模式實(shí)時(shí)性更強(qiáng)E:基于大數(shù)據(jù)的營(yíng)銷模式比傳統(tǒng)營(yíng)銷模式精準(zhǔn)性更強(qiáng)15、以下關(guān)于臟數(shù)據(jù)的說法中,正確的選項(xiàng)是〔 〕?!捕囗?xiàng)選擇題,此題3分〕A:格式不標(biāo)準(zhǔn) B:編碼不統(tǒng)一 C:意義不明確 D:與實(shí)際業(yè)務(wù)關(guān)系不大E:數(shù)據(jù)不完整16、數(shù)據(jù)再利用的意義在于〔 〕?!捕囗?xiàng)選擇題,此題3分〕A:挖掘數(shù)據(jù)的潛在價(jià)值 B:實(shí)現(xiàn)數(shù)據(jù)重組的創(chuàng)價(jià)值C:利用數(shù)據(jù)可擴(kuò)展性拓寬業(yè)務(wù)領(lǐng)域 D:優(yōu)化存儲(chǔ)設(shè)備,降低設(shè)備本錢E:提高社會(huì)效益,優(yōu)化社會(huì)治理17、依據(jù)涉及自變量的多少,可以將回歸分析分為〔 〕?!捕囗?xiàng)選擇題,此題3分〕A:線性回歸分析 B:非線性回歸分析 C:一元回歸分析D:多元回歸分析 E:綜合回歸分析18、大數(shù)據(jù)人才整體上需要具備〔 〕等核心學(xué)問。〔多項(xiàng)選擇題,此題3分〕A:數(shù)學(xué)與統(tǒng)計(jì)學(xué)問 B:計(jì)算機(jī)相關(guān)學(xué)問C:馬克思主義哲學(xué)學(xué)問 D:市場(chǎng)運(yùn)營(yíng)治理學(xué)問E:在特定業(yè)務(wù)領(lǐng)域的學(xué)問19、以下關(guān)于大數(shù)據(jù)的說法中,錯(cuò)誤的選項(xiàng)是〔 〕。〔多項(xiàng)選擇題,此題3分〕A:大數(shù)據(jù)具有體量大、構(gòu)造單一、時(shí)效性強(qiáng)的特征B:處理大數(shù)據(jù)需承受型計(jì)算架構(gòu)和智能算法等技術(shù)C:大數(shù)據(jù)的應(yīng)用留意相關(guān)分析而不是因果分析D:大數(shù)據(jù)的應(yīng)用留意因果分析而不是相關(guān)分析E:大數(shù)據(jù)的目的在于覺察的學(xué)問與洞察并進(jìn)展科學(xué)決策20、在噪聲數(shù)據(jù)中,波動(dòng)數(shù)據(jù)比離群點(diǎn)數(shù)據(jù)偏離整體水平更大?!餐茢囝},此題2分〕是 否21、對(duì)于大數(shù)據(jù)而言,最根本、最重要的要求就是削減錯(cuò)誤、保證質(zhì)量。因此,大數(shù)據(jù)收集的信息量要盡量準(zhǔn)確?!餐茢囝},此題2分〕是 否22、一般而言,分布式數(shù)據(jù)庫(kù)是指物理上分散在不同地點(diǎn),但在規(guī)律上是統(tǒng)一的數(shù)據(jù)庫(kù)。因此分布式數(shù)據(jù)庫(kù)具有物理上的獨(dú)立性、規(guī)律上的一體性、性能上的可擴(kuò)展性等特點(diǎn)?!?分〕是 否23、具備很強(qiáng)的報(bào)告撰寫力量,可以把分析結(jié)果通過文字、圖表、可視化等多種方式清楚地呈現(xiàn)出來,能夠清楚地論述分析結(jié)果及可能產(chǎn)生的影響,從而說服決策者信服并承受其建議,是數(shù)據(jù)分析力量對(duì)大數(shù)據(jù)人才的根本要求?!餐茢囝},此題2分〕是 否24、谷歌流感趨勢(shì)充分表達(dá)了數(shù)據(jù)重組和擴(kuò)展對(duì)數(shù)據(jù)價(jià)值的重要意義。〔推斷題,此題2分〕是 否25、決策樹是一種基于樹形構(gòu)造的推測(cè)模型,每一個(gè)樹形分叉代表一個(gè)分類條件,葉子節(jié)點(diǎn)代表最終的分類結(jié)果,其優(yōu)點(diǎn)在于易于實(shí)現(xiàn),決策時(shí)間短,并且適合處理非數(shù)值型數(shù)據(jù)?!?分〕是 否26、信息生命周期治理是據(jù)生命周期治理的來源,最早由英國(guó)企業(yè)提出?!餐茢囝},此題2分〕是 否27、簡(jiǎn)潔隨機(jī)抽樣,是從總體N個(gè)對(duì)象中任意抽取n個(gè)對(duì)象作為樣本,最終以這些樣本作為調(diào)查對(duì)象。在抽取樣本時(shí),總體中每個(gè)對(duì)象被抽中為調(diào)查樣本的概率可能會(huì)有差異?!?分〕是 否28、啤酒與尿布的經(jīng)典案例,充分表達(dá)了試驗(yàn)思維在大數(shù)據(jù)分析理念中的重要性?!餐茢囝},此題2分〕是 否29、對(duì)于企業(yè)來說,給用戶進(jìn)展各種促銷或者實(shí)施運(yùn)營(yíng)策略的時(shí)機(jī)也比較重要,而且對(duì)不同興趣偏好的用戶最好集中處理?!餐茢囝},此題2分〕是 否二、數(shù)據(jù)挖掘局部單項(xiàng)選擇題〔共20題,20分〕( )的目的縮小數(shù)據(jù)的取值范圍,使其更適合于數(shù)據(jù)挖掘算法的需要,并且能夠得到和原始數(shù)據(jù)一樣的分析結(jié)果。數(shù)據(jù)清洗 B.數(shù)據(jù)集成C.數(shù)據(jù)變換 D.數(shù)據(jù)歸約某超市爭(zhēng)論銷售紀(jì)錄數(shù)據(jù)后覺察買啤酒的人很或許率也會(huì)購(gòu)置尿布這種屬于數(shù)據(jù)挖掘的哪類問題?( )關(guān)聯(lián)規(guī)章覺察 B.聚類C.分類 D.自然語(yǔ)言處理以下兩種描述分別對(duì)應(yīng)哪兩種對(duì)分類算法的評(píng)價(jià)標(biāo)準(zhǔn)?()(a)警察抓小偷,描述警察抓的人中有多少個(gè)是小偷的標(biāo)準(zhǔn)。(b)描述有多少比例的小偷給警察抓了的標(biāo)準(zhǔn)。Precision,RecallB.Recall,PrecisionA.Precision,ROCD.Recall,ROC將原始數(shù)據(jù)進(jìn)展集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?( )頻繁模式挖掘B.分類和推測(cè)C.數(shù)據(jù)預(yù)處理D.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分別?( )分類 B.聚類C.關(guān)聯(lián)分析 D.隱馬爾可夫鏈建立一個(gè)模型,通過這個(gè)模型依據(jù)的變量值來推測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)?( )依據(jù)內(nèi)容檢索 B.建模描述C.推測(cè)建模 D.查找模式和規(guī)章下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?( A.變量代換 B.離散化C.聚攏 D.估量遺漏值8)假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個(gè)箱。等頻〔等深〕劃分時(shí),15在第幾個(gè)箱子內(nèi)?( )A.第一個(gè) B.其次個(gè)C.第三個(gè) D.第四個(gè)以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法: ( A.嵌入 B.過濾C.包裝 D.抽樣下面不屬于創(chuàng)立屬性的相關(guān)方法的是:( A.特征提取 B.特征修改C.映射數(shù)據(jù)到的空間D.特征構(gòu)造假設(shè)屬性income的最大最小值分別是12023元和98000元。利用最大最小標(biāo)準(zhǔn)化的方法將屬性的值映射到0至1的范圍內(nèi)。對(duì)屬性income的73600元將被轉(zhuǎn)化為:( )A.0.821 B.1.224C.1.458 D.0.716一所大學(xué)內(nèi)的各年紀(jì)人數(shù)分別為:一年級(jí)200人,二年級(jí)160人,三年級(jí)130人,四年級(jí)110人。則年級(jí)屬性的眾數(shù)是:( )一年級(jí) B.二年級(jí)C.三年級(jí) D.四年級(jí)以下哪個(gè)不是特地用于可視化時(shí)間空間數(shù)據(jù)的技術(shù):( A.等高線圖 B.餅圖C.曲面圖 D.矢量場(chǎng)圖在抽樣方法中,當(dāng)適宜的樣本容量很難確定時(shí),可以使用的抽樣方法是:( A.有放回的簡(jiǎn)潔隨機(jī)抽樣B.無(wú)放回的簡(jiǎn)潔隨機(jī)抽樣C.分層抽樣D漸進(jìn)抽樣以下哪些算法是分類算法〔 〕A.DBSCAN B.C4.5 C.K-Mean D.EM決策樹中不包含一下哪種結(jié)點(diǎn)( )根結(jié)點(diǎn)〔rootnode)內(nèi)部結(jié)點(diǎn)〔internalnode〕外部結(jié)點(diǎn)〔externalnode〕葉結(jié)點(diǎn)〔leafnode〕以下哪項(xiàng)關(guān)于決策樹的說法是錯(cuò)誤的( )冗余屬性不會(huì)對(duì)決策樹的準(zhǔn)確率造成不利的影響子樹可能在決策樹中重復(fù)屢次決策樹算法對(duì)于噪聲的干擾格外敏感查找最正確決策樹是NP完全問題通過聚攏多個(gè)分類器的推測(cè)來提高分類準(zhǔn)確率的技術(shù)稱為( )A.組合(ensemble) B.聚攏(aggregate)C.合并(combination)D.投票(voting)在根本K均值算法里,當(dāng)鄰近度函數(shù)承受〔 〕的時(shí)候,適宜的質(zhì)心是簇中各點(diǎn)的中位數(shù)。A.曼哈頓距離 B.平方歐幾里德距離C.余弦距離 D.Bregman散度共性化推舉系統(tǒng)是建立在海量數(shù)據(jù)挖掘根底上的一種高級(jí)商務(wù)智能平,以幫助〔 〕為其顧客購(gòu)物供給完全共性化的決策支持和信息效勞。A.公司 B.各單位C.跨國(guó)企業(yè)三、計(jì)算題〔共13分〕
D.電子商務(wù)網(wǎng)站1推斷(女性,年齡介于31~45之間,不具學(xué)生身份,收入中等)者會(huì)不會(huì)辦理信用卡。請(qǐng)自選兩種方法進(jìn)展計(jì)算。信用卡。請(qǐng)自選兩種方法進(jìn)展計(jì)算。工程性別年齡學(xué)生身分收入辦卡工程性別年齡學(xué)生身分收入辦卡1男>45否高會(huì)2女31~45否高會(huì)3女20~30是低會(huì)4男<20是低不會(huì)5女20~306女20~307女31~458男31~459男31~45否中會(huì)10女<20是低會(huì)是中不會(huì)否中會(huì)否高會(huì)是中不會(huì)此題可以使用多種方法,沒有固定答案。解題方式合理,計(jì)算步驟無(wú)誤即可。首先依據(jù)訓(xùn)練樣本計(jì)算各屬性相對(duì)于不同分類結(jié)果的條件機(jī)率:P(性別=女|辦卡=會(huì))=5/7 P(性別=女|辦卡=不會(huì))=1/3P(年齡=31~45|辦卡=會(huì))=3/7P(年齡=31~45|辦卡=不會(huì))=1/3 P(學(xué)生=否|辦卡=會(huì))=5/7 P(學(xué)生=否|辦卡=不會(huì))=0/3 P(收入=中|辦卡=會(huì))=2/7 P(收入=中|辦卡=不會(huì))=2/3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東跑道膠黏劑施工方案
- 道路碎石基層施工方案
- 福田窗臺(tái)防水施工方案
- 中天服務(wù):2024年年度審計(jì)報(bào)告
- 2025北京大興八年級(jí)(上)期末生物(教師版)
- 數(shù)控加工工藝與編程技術(shù)基礎(chǔ) 教案 模塊二 項(xiàng)目一 任務(wù)2 圓弧的加工(1-2)
- 實(shí)施甘蔗豐產(chǎn)栽培技術(shù)與病蟲害綜合防控的探討分析
- 山東省泰安市泰山區(qū)2024-2025學(xué)年上學(xué)期七年級(jí)(五四制)數(shù)學(xué)期末試題(原卷版+解析版)
- 2025年中國(guó)垃圾發(fā)電設(shè)備行業(yè)市場(chǎng)現(xiàn)狀及投資態(tài)勢(shì)分析報(bào)告(智研咨詢)
- 食品加工企業(yè)食品安全監(jiān)測(cè)與檢測(cè)技術(shù)
- 2025年哈爾濱幼兒師范高等??茖W(xué)校單招職業(yè)技能測(cè)試題庫(kù)1套
- 2025年湖南城建職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)及答案一套
- 2025廣東省安全員A證考試題庫(kù)
- 2025年廣東深圳高三一模高考英語(yǔ)試卷試題(含答案詳解)
- 《酒店服務(wù)禮儀細(xì)節(jié)》課件
- 《建筑工程混凝土施工質(zhì)量控制課件》
- 2025-2030年中國(guó)煤炭行業(yè)發(fā)展動(dòng)態(tài)及前景趨勢(shì)分析報(bào)告
- 工程機(jī)械租賃服務(wù)方案及保障措施投標(biāo)方案文件
- 2025年人工智能(AI)訓(xùn)練師職業(yè)技能鑒定考試題(附答案)
- 《稀土冶金技術(shù)史》課件-中國(guó)的稀土資源與分布
- 2025屆湖北省高三T8聯(lián)盟模擬考數(shù)學(xué)試卷(解析版)
評(píng)論
0/150
提交評(píng)論