下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
【MOOC】大數(shù)據(jù)基礎與應用-北京理工大學中國大學慕課MOOC答案【第一周】單元測試1、【單選題】大數(shù)據(jù)的特性不包括本題答案:【分布地域廣】2、【單選題】如下關于大數(shù)據(jù)分析流程的哪一項是正確的?本題答案:【數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)】3、【多選題】大數(shù)據(jù)分析與傳統(tǒng)的數(shù)據(jù)分析的區(qū)別主要在于:本題答案:【傳統(tǒng)數(shù)據(jù)分析主要是描述性分析和診斷性分析,而大數(shù)據(jù)分析主要是預測性分析。#大數(shù)據(jù)分析的對象是大規(guī)模類型多樣的海量數(shù)據(jù),使用的模型較為復雜;而傳統(tǒng)數(shù)據(jù)分析則作用在有限的小規(guī)模數(shù)據(jù)集上,模型較為簡單。#大數(shù)據(jù)分析主要是為了發(fā)現(xiàn)新的規(guī)律和知識,而傳統(tǒng)數(shù)據(jù)分析主要是為了了解正在發(fā)生的事件及其原因?!?、【判斷題】1、大數(shù)據(jù)主要是由于數(shù)據(jù)規(guī)模巨大、來源分散、格式多樣,所以需要新的體系架構、技術、算法和分析方法來對這些數(shù)據(jù)進行采集、存儲和關聯(lián)分析,以期望能夠從中抽取出隱藏的有價值的信息。本題答案:【正確】5、【判斷題】數(shù)據(jù)科學家主要負責開發(fā)、構建、測試和維護系統(tǒng),比如數(shù)據(jù)庫和大規(guī)模處理系統(tǒng)本題答案:【錯誤】6、【判斷題】大數(shù)據(jù)分析的目的是從類型多樣的海量數(shù)據(jù)中挖掘出隱藏的有價值的信息。本題答案:【正確】7、【填空題】大數(shù)據(jù)分析能夠應用在哪些領域?本題答案:【交通醫(yī)療足球零售天文政治】【第二周】單元測試1、【單選題】Python代碼:r=5+"5"的執(zhí)行結果是本題答案:【報錯】2、【單選題】1.m=[1,2,[3]]2.n=m[:]3.n[1]=44.n[2][0]=55.print(m)代碼的執(zhí)行結果是?本題答案:【[1,2,[5]]】3、【單選題】1.n1={'a':1,'b':2}2.n2=n13.n1['a']=54.s=n1['a']+n2['a']5.print(s)代碼的結果是?本題答案:【10】4、【單選題】用python處理本機文件時,可以使用glob完成文件查找功能。下列有關glob的說法中,錯誤的是本題答案:【glob為內置庫,無需import即可使用】5、【單選題】1.importsqlite32.fromfakerimportFaker3.f=Faker("zh_cn")4.conn=sqlite3.connect(":memory:")5.c=conn.cursor()6.c.execute("createtableuser(idvarchar(10)primarykey,namevarchar(20))")7.foriinrange(0,100):8.c.execute("insertintouser(id,name)values('{}','{}')".format(i,()))9.c.execute("select*fromuser")10.result=c.fetchall()11.print(len(result))上述代碼執(zhí)行的結果是?本題答案:【100】6、【單選題】用戶處理numpy的ndarray對象時,可以改變數(shù)組維度。下列描述中錯誤的是本題答案:【resize方法不能修改原andarray數(shù)組】7、【判斷題】Numpy的Series對象在進行運算時,其默認索引值是0到n-1可以參與運算,而自定義索引值不會參與運算。本題答案:【錯誤】8、【判斷題】DataFrame結構為一個二維結構,每一列可以為不同的值類型,但一列之內的類型必須相同。本題答案:【正確】9、【判斷題】由于Python的list列表足夠強大,完全可以代替ndarry這種數(shù)組。本題答案:【錯誤】10、【判斷題】使用文件打開命令時,即使使用withas語句也應該調用close()方法顯式關閉文件,以保證文件安全。本題答案:【錯誤】【第3周】單元測試1、【單選題】使用json庫進行Python的內置數(shù)據(jù)類型與Json類型轉換時,字典dict將被轉換為本題答案:【object】2、【單選題】某網(wǎng)站提供形式多樣的財經(jīng)大數(shù)據(jù)服務:①提供一個第三方python庫,調用庫中方法可以直接返回DataFrame對象;②提供一個網(wǎng)站api,可以返回json格式字符串;③提供靜態(tài)頁面,內含表格數(shù)據(jù);④提供查詢功能,使用JavaScript動態(tài)腳本生成查詢結果。假設上述各種服務樣式均可返回所需數(shù)據(jù),則從減少編程工作量的角度看,用戶應選擇的方案編號是本題答案:【①】3、【單選題】對于matplotlib的plot方法原型:pyplot.plot([x],y,[format],…),下列說法錯誤的是本題答案:【x軸數(shù)據(jù)必須提供】4、【單選題】matplotlib提供了圖形文本顯示,下列函數(shù)可以在圖像中任意位置顯示文字的是本題答案:【text()】5、【單選題】使用Pandas處理數(shù)據(jù)的時候,經(jīng)常會遇到重復值。下列說法中錯誤的是本題答案:【duplicated()返回值中用1表示重復,0表示不重復】6、【單選題】排序在數(shù)據(jù)處理中具有重要的作用。若df為一個DataFrame對象,則對其描述中錯誤的是本題答案:【排序時無論是升序還是降序,NaN統(tǒng)一排到序列的開頭部分】7、【判斷題】語句json.dumps({'name':'David','age':20})將一個Python對象轉為一個JSON字符串。本題答案:【正確】8、【判斷題】使用requests庫爬取回來的字符串數(shù)據(jù),可以加載到BeautifulSoup庫中,形成一個樹狀的HTML頁面結構,供用戶檢索使用。本題答案:【正確】9、【判斷題】當在DataFrame中試圖補全空值時,可以使用fillna,但該方法只能為整個DataFrame設置相同的補全值。本題答案:【錯誤】10、【判斷題】使用matplotlib繪制多圖時,可以使用subplots和subplot方法。如:1.fig,ax=subplot(rows,cols)本題答案:【錯誤】【第4周】單元測試1、【單選題】如下關于數(shù)據(jù)分析框架的流程,哪一項是正確的?本題答案:【業(yè)務理解、數(shù)據(jù)理解、數(shù)據(jù)準備、建立模型、模型評估】2、【判斷題】偏度是數(shù)據(jù)分布扁平程度的測度。本題答案:【錯誤】3、【判斷題】中位數(shù)指的是任意一組數(shù)據(jù)中的中間位置的數(shù)。本題答案:【錯誤】4、【判斷題】某組數(shù)據(jù)的峰態(tài)系數(shù)小于0,則并表明該組數(shù)據(jù)為扁平分布或者平峰分布。本題答案:【正確】5、【判斷題】預測降雨量屬于機器學習中的回歸任務的應用場景。本題答案:【正確】6、【填空題】已知10個家庭的人均月收入數(shù)據(jù)分別為:660、750、780、850、960、1080、1250、1500、1630、2000,請計算該組數(shù)據(jù)的中位數(shù)。本題答案:【1020】7、【填空題】已知9個家庭的人均月收入數(shù)據(jù)分別為:1500、750、780、1080、850、960、2000、1250、1630,請計算該組數(shù)據(jù)的四分位數(shù)。(請使用較準確的位置確定方法。)本題答案:【8151565】8、【填空題】請計算下列數(shù)據(jù){10,12,13,14,25,30,40,50,90,100}的p=40%的截斷均值。(保留2位小數(shù))本題答案:【28.67】9、【填空題】請計算下列數(shù)據(jù){1,3,7,9,0,3,5}的中列數(shù)。本題答案:【4.5】10、【填空題】依據(jù)下面兩組數(shù)據(jù),分別計算兩組年收入數(shù)據(jù)的方差。第一組:99個年收入10萬的人和1個年收入1000萬的人,第二組:60個年收入10萬的人和40個年收入34.75萬的人。本題答案:【9801148.5】【第5周】單元測試1、【單選題】“二手車價格預測”場景屬于哪種機器學習的典型任務?本題答案:【回歸】2、【單選題】“垃圾郵件的處理”場景屬于哪種機器學習的典型任務?本題答案:【分類】3、【單選題】“推薦系統(tǒng)”場景屬于哪種機器學習的典型任務?本題答案:【聚類】4、【單選題】“尿布與啤酒”案例屬于哪種機器學習的典型任務?本題答案:【關聯(lián)】5、【判斷題】過擬合是指模型不能在訓練集上獲得足夠低的誤差本題答案:【錯誤】6、【判斷題】有監(jiān)督算法和無監(jiān)督算法的區(qū)別在于數(shù)據(jù)是否進行標注。本題答案:【正確】7、【判斷題】K-means算法屬于分類算法。本題答案:【錯誤】8、【判斷題】KNN算法的優(yōu)點在于不需要指定K的個數(shù)。本題答案:【錯誤】9、【填空題】決策樹的生成由兩個階段組成:_____、______本題答案:【判定樹構建樹剪枝】10、【填空題】假設有四個樣本分布在坐標系中,已知A區(qū)兩點分別(2,5)和(1,4),B區(qū)(8,1)和(9,2),若使用KNN算法(距離使用歐氏距離),求M(4,3)屬于哪一區(qū)?本題答案:【A】【第七周】單元測試1、【單選題】以下關于日志采集工具Flume的說法不正確的是:本題答案:【Flume適用于大量數(shù)據(jù)的實時數(shù)據(jù)采集】2、【單選題】以下關于數(shù)據(jù)分發(fā)中間件Kafka的說法不正確的是:本題答案:【Kafka主要是使用c++、Java語言實現(xiàn)的】3、【單選題】以下關于分布式文件系統(tǒng)HDFS的說法不正確的是:本題答案:【HDFS支持多用戶寫入,任意修改文件】4、【單選題】HDFS集群中管理文件系統(tǒng)的元數(shù)據(jù)、負責客戶端請求響應的節(jié)點是:本題答案:【NameNode】5、【單選題】HDFS(Hadoop1.X版本中)默認的塊大小是:本題答案:【64MB】6、【單選題】以下關于分布式數(shù)據(jù)庫HBase的說法不正確的是:本題答案:【HBase比傳統(tǒng)關系數(shù)據(jù)庫系統(tǒng)具有更加豐富的數(shù)據(jù)類型】7、【單選題】HBase中分布式存儲和負載均衡的最小單元是:本題答案:【Region】8、【單選題】以下關于數(shù)據(jù)倉庫Hive的說法不正確的是:本題答案:【Hive能夠在大規(guī)模數(shù)據(jù)集上實現(xiàn)低延遲快速的查詢】9、【多選題】Hive的數(shù)據(jù)模型主要包括:本題答案:【表(Tables)#分區(qū)(Partitions)#桶(Buckets)】10、【多選題】NoSQL數(shù)據(jù)庫的主要類型包括:本題答案:【圖形數(shù)據(jù)庫#文檔數(shù)據(jù)庫#鍵值數(shù)據(jù)庫#列族數(shù)據(jù)庫】MOOC期末測試1、【單選題】下列數(shù)據(jù)類型中,不屬于Python內置數(shù)據(jù)類型的是:本題答案:【dtype】2、【單選題】假設d是一個DataFrame類型對象,其中包含name和age兩列100行數(shù)據(jù)。則下列表達式中,錯誤的是.本題答案:【d[2,’name’]】3、【單選題】以下不屬于高維數(shù)據(jù)可視化技術的是.本題答案:【詞云】4、【單選題】以下哪個是常見的大數(shù)據(jù)處理流程.本題答案:【數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化】5、【單選題】大數(shù)據(jù)分析技術可以應用于哪些行業(yè).本題答案:【其他全是】6、【單選題】測得一組身高(cm)數(shù)據(jù)如下:176、165、173、168、176、180、177、168、174、176,則其眾數(shù)和中位數(shù)分別是:本題答案:【176,175】7、【單選題】數(shù)據(jù)清洗的方法不包括本題答案:【數(shù)據(jù)可視化】8、【單選題】以下哪個不屬于分布式文件系統(tǒng)HDFS的特有特性本題答案:【隨機讀寫】9、【單選題】以下哪種方法不屬于預測性(有監(jiān)督學習)模型本題答案:【關聯(lián)分析】10、【單選題】Apriori算法的加速過程依賴于以下哪個策略本題答案:【剪枝】11、【單選題】Spark是使用以下哪種編程語言實現(xiàn)的?本題答案:【Scala】12、【判斷題】詞典中的key不能是字典類型,但value可以是字典類型。本題答案:【正確】13、【判斷題】傳統(tǒng)數(shù)據(jù)分析主要是完成描述性分析和診斷性分析,而大數(shù)據(jù)分析主要目的是預測性分析。本題答案:【正確】14、【判斷題】峰度是數(shù)據(jù)分布偏斜程度的測度。本題答案:【錯誤】15、【判斷題】偏度系數(shù)在0.5~1或-1~-0.5之間被稱為高度偏態(tài)分布。本題答案:【錯誤】16、【判斷題】數(shù)據(jù)工程師的主要工作職責是整理和組織數(shù)據(jù),進行描述性統(tǒng)計,分析開發(fā)潛在的價值,構建模型解決商業(yè)問題。本題答案:【錯誤】1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025武漢市微型計算機的買賣合同
- 農(nóng)村土地流轉合同標準(2025年度):土地規(guī)模經(jīng)營與效益提升
- 2025年度農(nóng)產(chǎn)品電商平臺入駐合作合同2篇
- 2025北京市室內裝修合同
- 二零二五年度風力發(fā)電工程款結算與環(huán)境保護合同3篇
- 二零二五年度旅游公司整體轉讓合同3篇
- 2025年度年度公司終止職工勞動合同補償方案合同3篇
- 2025年度工業(yè)用地租賃合同書(含環(huán)保標準)3篇
- 2025年度農(nóng)村房屋土地租賃與農(nóng)村環(huán)境治理合作協(xié)議
- 二零二五年度智能停車場租賃管理服務合同3篇
- 2024年國網(wǎng)公司企業(yè)文化與職業(yè)道德試考試題庫(含答案)
- 房地產(chǎn)中介公司業(yè)務管理制度
- 電大《生產(chǎn)與運作管理》2023-2024期末試題及答案(試卷代號2617)
- 中國腫瘤藥物治療相關惡心嘔吐防治專家共識(2022年版)解讀
- PLC應用技術(三菱機型)三菱大中型PLC
- GB 21258-2024燃煤發(fā)電機組單位產(chǎn)品能源消耗限額
- 《用戶體驗設計導論》
- 美團外賣運營知識試題
- 航空概論學習通超星期末考試答案章節(jié)答案2024年
- 業(yè)務流程可視化改善
- 期末復(知識清單)2024-2025學年人教PEP版(2024)英語三年級上冊
評論
0/150
提交評論