涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級(jí)培訓(xùn)考試_第1頁
涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級(jí)培訓(xùn)考試_第2頁
涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級(jí)培訓(xùn)考試_第3頁
涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級(jí)培訓(xùn)考試_第4頁
涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級(jí)培訓(xùn)考試_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

98分,標(biāo)綠為正確,標(biāo)紅為錯(cuò)誤2020年中國電信云南公司涅槃?dòng)?jì)劃云及大數(shù)據(jù)技術(shù)初級(jí)培訓(xùn)考試-大數(shù)據(jù)技術(shù)單選題1.數(shù)據(jù)倉庫的最終目的是()單選題/2分收集業(yè)務(wù)需求為用戶和業(yè)務(wù)部門提供決策支持建立數(shù)據(jù)倉庫邏輯模型開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析待檢查2.數(shù)據(jù)清洗的方法不包括()單選題/2分一致性檢查重復(fù)數(shù)據(jù)記錄處理噪聲數(shù)據(jù)清除缺失值處理待檢查3.大數(shù)據(jù)的合理利用將成為提高核心競爭力的關(guān)鍵因素,各行各業(yè)的決策正在從“業(yè)務(wù)驅(qū)動(dòng)”轉(zhuǎn)變?yōu)椋ǎ﹩芜x題/2分市場驅(qū)動(dòng)產(chǎn)品驅(qū)動(dòng)數(shù)據(jù)驅(qū)動(dòng)需求驅(qū)動(dòng)待檢查4.當(dāng)前社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是()單選題/2分物聯(lián)網(wǎng)互聯(lián)網(wǎng)綜合國力自然資源待檢查5.通常,在訓(xùn)練有監(jiān)督的機(jī)器學(xué)習(xí)模型的時(shí)候,會(huì)將數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測試集,劃分比例一般為()單選題/2分7:2:15:3:26:2:28:1:1待檢查6.從大量數(shù)據(jù)中提取知識(shí)的過程通常稱為()單選題/2分?jǐn)?shù)據(jù)挖掘數(shù)據(jù)倉庫人工智能數(shù)據(jù)清洗待檢查7.特征選擇是自動(dòng)地選擇出對(duì)于問題最重要的那些的過程。()單選題/2分?jǐn)?shù)據(jù)特征子集字段信息待檢查8.大數(shù)據(jù)時(shí)代,數(shù)據(jù)使用的關(guān)鍵是()單選題/2分?jǐn)?shù)據(jù)存儲(chǔ)數(shù)據(jù)再利用數(shù)據(jù)收集數(shù)據(jù)分析待檢查9.K-means算法是一種()單選題/2分迭代算法關(guān)聯(lián)算法聚類算法分類算法待檢查10.大數(shù)據(jù)模型評(píng)估是關(guān)鍵工作,假設(shè),TP:樣本為正,預(yù)測結(jié)果為正;FP:樣本為負(fù),預(yù)測結(jié)果為正;TN:樣本為負(fù),預(yù)測結(jié)果為負(fù);FN:樣本為正,預(yù)測結(jié)果為負(fù)。精確率(precision)計(jì)算正確的公式為()單選題/2分precision和recall調(diào)和平均值,2PR/(P+R)TP/(TP+FP),正確預(yù)測為正占全部預(yù)測為正的比例(TP+TN)/(TP+FP+TN+FN)TP/(TP+FN),正確預(yù)測為正占全部正樣本的比例待檢查11.下列對(duì)數(shù)據(jù)挖掘描述正確的是()。單選題/2分?jǐn)?shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過電腦獲取隱藏于其中信息的過程數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過人工分析隱藏于其中信息的過程數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過人工發(fā)現(xiàn)隱藏于其中信息的過程待檢查12.Hadoop的三大核心組件是()單選題/2分Hbase、Sqoop、YARNHive、Pig、ZookeeperFlume、Hbase、HiveYARN、HDFS、MapReduce待檢查13.數(shù)據(jù)的最小的基本單位是bit,按順序給出所有單位,正確的是()單選題/2分bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB、BBbit、Byte、KB、MB、GB、TB、DB、EB、ZB、YB、BB、NB、PBbit、Byte、KB、MB、GB、TB、PB、DB、ZB、YB、BB、NB、EBbit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB待檢查14.經(jīng)過一系列處理,在基本保持原始數(shù)據(jù)完整性的基礎(chǔ)上,減小數(shù)據(jù)規(guī)模的是()單選題/2分?jǐn)?shù)據(jù)挖掘數(shù)據(jù)規(guī)約數(shù)據(jù)融合數(shù)據(jù)清洗待檢查15.以下對(duì)過擬合(over-fitting)描述正確的是()單選題/2分所謂過擬合(over-fitting)其實(shí)就是所建的機(jī)器學(xué)習(xí)模型或者是深度學(xué)習(xí)模型在驗(yàn)證樣本中表現(xiàn)得過于優(yōu)越,導(dǎo)致在驗(yàn)證數(shù)據(jù)集以及測試數(shù)據(jù)集中表現(xiàn)不佳。所謂過擬合(over-fitting)其實(shí)就是所建的機(jī)器學(xué)習(xí)模型或者是深度學(xué)習(xí)模型在驗(yàn)證樣本中表現(xiàn)較差,模型無法正常運(yùn)行,無法輸出結(jié)果。所謂過擬合(over-fitting)其實(shí)就是所建的機(jī)器學(xué)習(xí)模型或者是深度學(xué)習(xí)模型在測試樣本中表現(xiàn)較差,導(dǎo)致在驗(yàn)證數(shù)據(jù)集以及訓(xùn)練數(shù)據(jù)集中表現(xiàn)不佳。所謂過擬合(over-fitting)其實(shí)就是所建的機(jī)器學(xué)習(xí)模型或者是深度學(xué)習(xí)模型在訓(xùn)練樣本中表現(xiàn)得過于優(yōu)越,導(dǎo)致在驗(yàn)證數(shù)據(jù)集以及測試數(shù)據(jù)集中表現(xiàn)不佳。待檢查16.Python中在程序運(yùn)行時(shí)不會(huì)被更改的量稱之為()單選題/2分固定參數(shù)固定值常量定量待檢查17.有監(jiān)督學(xué)習(xí)的結(jié)果可分為兩類,分別是()單選題/2分關(guān)系分析、趨勢預(yù)測分類、聚類回歸、分類關(guān)聯(lián)、預(yù)測待檢查18.面向用戶提供大數(shù)據(jù)一站式部署方案,包括數(shù)據(jù)中心和服務(wù)器等硬件、數(shù)據(jù)分析應(yīng)用軟件及技術(shù)運(yùn)維支持等多方面內(nèi)容的大數(shù)據(jù)商業(yè)模式是()單選題/2分大數(shù)據(jù)資源提供模式大數(shù)據(jù)解決方案模式大數(shù)據(jù)處理服務(wù)模式大數(shù)據(jù)信息分類模式待檢查19.人工智能與大數(shù)據(jù)關(guān)系的描述正確的是()單選題/2分人工智能與大數(shù)據(jù)無交集,人工智能比大數(shù)據(jù)更加先進(jìn)。人工智能與大數(shù)據(jù)密不可分,可以將很多大數(shù)據(jù)的應(yīng)用(云計(jì)算平臺(tái)等)歸結(jié)為人工智現(xiàn)在興起的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和人工智能技術(shù),永遠(yuǎn)不可能改變數(shù)據(jù)世界里的算法和基礎(chǔ)理論。人工智能與大數(shù)據(jù)是不同領(lǐng)域,無關(guān)聯(lián)關(guān)系。待檢查20.大數(shù)據(jù)環(huán)境下的隱私擔(dān)憂,主要表現(xiàn)為()單選題/2分病毒入侵惡意廣告的推送個(gè)人信息的被識(shí)別與暴露用戶畫像的生成待檢查多選題21.在黨的十九大報(bào)告中,數(shù)字中國是中國的國家信息化范疇,數(shù)字中國的內(nèi)容包括()多選題/3分A.寬帶中國B.大數(shù)據(jù)C.互聯(lián)網(wǎng)D.云計(jì)算待檢查22.以下哪些是有監(jiān)督學(xué)習(xí)的算法()多選題/3分支持向量機(jī)決策樹線性回歸社交網(wǎng)絡(luò)分析算法待檢查23.數(shù)據(jù)資產(chǎn)管理(Dataassetmanagement簡稱DAM)是指()多選題/3分包括開發(fā)、執(zhí)行和監(jiān)督有關(guān)數(shù)據(jù)的計(jì)劃、政策、方案、項(xiàng)目、流程、方法和程序,從而控制、保護(hù)、交付和提高數(shù)據(jù)資產(chǎn)的價(jià)值。包括測試有關(guān)數(shù)據(jù)的計(jì)劃、政策、方案、項(xiàng)目、流程、方法和程序,從而減小數(shù)據(jù)資產(chǎn)的應(yīng)用面。規(guī)劃、控制和提供數(shù)據(jù)及信息資產(chǎn)的一組業(yè)務(wù)職能管理、策劃和使用數(shù)據(jù)及信息資產(chǎn)的一組業(yè)務(wù)職能待檢查24.特征選擇必須確保不丟失重要信息,若重要信息缺失則學(xué)習(xí)效果會(huì)大打折扣。常見的特征選擇方法大致分為()多選題/3分包裹式(wrapper)過濾式(filter)留出法(leaveoneout)嵌入式(embedding)待檢查25.Python中的絕大部分?jǐn)?shù)據(jù)結(jié)構(gòu)可以被最終分解為三種類型:()多選題/3分序列(Sequence)標(biāo)量(Scaler)字符串(String)映射(Mapping)待檢查26.分類挖掘所獲的分類模型可以采用多種形式加以描述輸出,其中主要的表示方法有()多選題/3分決策樹數(shù)學(xué)公式神經(jīng)網(wǎng)絡(luò)分類規(guī)則待檢查27.Python的優(yōu)點(diǎn)包括()多選題/3分開發(fā)效率非常高可嵌入性強(qiáng)運(yùn)行速度快,Python的運(yùn)行速度比C語言快很多。豐富的擴(kuò)展庫待檢查28.評(píng)價(jià)大數(shù)據(jù)模型的常用方法有()多選題/3分過擬合隨機(jī)性精確率召回率欠擬合F值待檢查29.數(shù)據(jù)挖掘在電信行業(yè)的應(yīng)用包括()多選題/3分對(duì)欠費(fèi)/壞賬進(jìn)行預(yù)測和控制發(fā)掘潛在客戶預(yù)測哪些即將流失的客戶判斷客戶的欺詐行為特征待檢查30.大數(shù)據(jù)通常具有的特征為()多選題/3分?jǐn)?shù)據(jù)價(jià)值密度低(Value)數(shù)據(jù)規(guī)模大(Volume)數(shù)據(jù)處理速度快(Velocity)數(shù)據(jù)種類繁多(Variety)待檢查31.Hadoop是一個(gè)能夠讓用戶輕松架構(gòu)和使用的分布式計(jì)算平臺(tái)。用戶可以輕松地在Hadoop上開發(fā)和運(yùn)行處理海量數(shù)據(jù)的應(yīng)用程序。它主要的優(yōu)點(diǎn)為()多選題/3分高效性。Hadoop能夠在節(jié)點(diǎn)之間動(dòng)態(tài)地移動(dòng)數(shù)據(jù),并保證各個(gè)節(jié)點(diǎn)的動(dòng)態(tài)平衡,因此處理速度非???。低成本。與一體機(jī)、商用數(shù)據(jù)倉庫以及QlikView、YonghongZ-Suite等數(shù)據(jù)集市相比,hadoop是開源的,項(xiàng)目的軟件成本因此會(huì)大大降低。高容錯(cuò)性。Hadoop能夠自動(dòng)保存數(shù)據(jù)的多個(gè)副本,并且能夠自動(dòng)將失敗的任務(wù)重新分配。高可靠性。Hadoop按位存儲(chǔ)和處理數(shù)據(jù)的能力值得人們信賴。高擴(kuò)展性。Hadoop是在可用的計(jì)算機(jī)集簇間分配數(shù)據(jù)并完成計(jì)算任務(wù)的,這些集簇可以方便地?cái)U(kuò)展到數(shù)以千計(jì)的節(jié)點(diǎn)中。待檢查32.數(shù)據(jù)挖掘流程包括()多選題/3分評(píng)估(evaluation)數(shù)據(jù)準(zhǔn)備(datapreparation)建模(modeling)部署(deployment)業(yè)務(wù)理解(businessunderstanding)數(shù)據(jù)理解(dataunderstanding)待檢查33.數(shù)據(jù)挖掘利用了來自如下一些領(lǐng)域的思想()多選題/3分來自統(tǒng)計(jì)學(xué)的抽樣、估計(jì)和假設(shè)檢驗(yàn)。生命自然科學(xué)分布式存儲(chǔ)理論人工智能、模式識(shí)別和機(jī)器學(xué)習(xí)的搜索算法、建模技術(shù)和學(xué)習(xí)理論。待檢查34.HDFS的缺點(diǎn)是()多選題/3分不適合小文件儲(chǔ)存高容錯(cuò)構(gòu)建在廉價(jià)的機(jī)構(gòu)上低延遲的數(shù)據(jù)訪問待檢查35.以下哪些是機(jī)器學(xué)習(xí)的算法()多選題/3分決策樹神經(jīng)網(wǎng)絡(luò)隨機(jī)森林邏輯回歸待檢查判斷題36.大數(shù)據(jù)分析與挖掘只能使用Python實(shí)現(xiàn)判斷題/1分正確錯(cuò)誤待檢查37.Tez是Apache開源的支持DAG作業(yè)的計(jì)算框架,通過DAG作業(yè)的方式運(yùn)行MapReduce作業(yè),提供了程序運(yùn)行的整體處理邏輯,就可以去除工作流當(dāng)中多余的Map階段,減少不必要的操作,提升數(shù)據(jù)處理的性能。判斷題/1分正確錯(cuò)誤待檢查38.Hadoop的核心組件是Spark和Hive判斷題/1分正確錯(cuò)誤待檢查39.HDFS是Hadoop技術(shù)框架中的分布式文件系統(tǒng),對(duì)部署在多臺(tái)獨(dú)立物理機(jī)器上的文件進(jìn)行管理。判斷題/1分正確錯(cuò)誤待檢查40.聚類、關(guān)聯(lián)分析算法是有監(jiān)督學(xué)習(xí)判斷題/1分正確錯(cuò)誤待檢查41.數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,而模型和算法只是逼近這個(gè)上限而已。判斷題/1分錯(cuò)誤待檢查42.FlumeNG有三種角色的節(jié)點(diǎn):代理節(jié)點(diǎn)agent、收集節(jié)點(diǎn)collector、主節(jié)點(diǎn)master判斷題/1分正確錯(cuò)誤待檢查43.在進(jìn)行大數(shù)據(jù)分析挖掘過程中,對(duì)數(shù)據(jù)樣本進(jìn)行處理時(shí)必須要保持樣本的原始性,補(bǔ)全缺失的數(shù)據(jù)必然導(dǎo)致最終分析的結(jié)果錯(cuò)誤。判斷題/1分正確錯(cuò)誤待檢查44.數(shù)據(jù)挖掘過程前期的數(shù)據(jù)準(zhǔn)備工作量超過整個(gè)過程的一半判斷題/1分正確錯(cuò)誤待檢查45.MapReduce的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論