網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第1頁(yè)
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第2頁(yè)
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第3頁(yè)
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第4頁(yè)
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院上海商學(xué)院

第一章測(cè)試

以下描述錯(cuò)誤的是()。

A:Jupyternotebook是一個(gè)基于網(wǎng)頁(yè)交互的編程環(huán)境B:Jupyternotebook可通過(guò)Markdown語(yǔ)法編寫(xiě)說(shuō)明文檔C:Anaconda只提供了Jupyternotebook編程環(huán)境D:Anaconda是一個(gè)開(kāi)源的Python發(fā)行版本

答案:Anaconda只提供了Jupyternotebook編程環(huán)境

以下描述錯(cuò)誤的是(C)。

以下哪一項(xiàng)不屬于數(shù)據(jù)科學(xué)的基本任務(wù)()。

A:分析數(shù)據(jù)B:獲取數(shù)據(jù)C:處理數(shù)據(jù)D:存儲(chǔ)數(shù)據(jù)

答案:存儲(chǔ)數(shù)據(jù)

以下關(guān)于數(shù)據(jù)科學(xué)的說(shuō)法中,正確的是()。

A:對(duì)大數(shù)據(jù)的采集就是數(shù)據(jù)科學(xué)B:計(jì)算工具的革新,數(shù)據(jù)量的持續(xù)增長(zhǎng)推動(dòng)了數(shù)據(jù)科學(xué)的發(fā)展。C:數(shù)據(jù)科學(xué)只適用于科學(xué)研究,對(duì)我們?nèi)粘I顩](méi)有關(guān)系D:數(shù)據(jù)科學(xué)就是研究數(shù)學(xué)的科學(xué)

答案:計(jì)算工具的革新,數(shù)據(jù)量的持續(xù)增長(zhǎng)推動(dòng)了數(shù)據(jù)科學(xué)的發(fā)展。

智能健康手環(huán)的運(yùn)用了以下哪一項(xiàng)數(shù)據(jù)采集技術(shù)()。

A:網(wǎng)絡(luò)爬蟲(chóng)B:傳感器C:統(tǒng)計(jì)報(bào)表D:API接口

答案:傳感器

下列關(guān)于大數(shù)據(jù)特點(diǎn)的說(shuō)法中,錯(cuò)誤的是().

A:數(shù)據(jù)類(lèi)型多樣B:數(shù)據(jù)生成和處理速度快C:數(shù)據(jù)價(jià)值密度高。D:數(shù)據(jù)規(guī)模大

答案:數(shù)據(jù)價(jià)值密度高。

第二章測(cè)試

下列選項(xiàng)哪不是爬蟲(chóng)程序的常見(jiàn)類(lèi)型()。

A:聚焦網(wǎng)絡(luò)爬蟲(chóng)B:增量式網(wǎng)絡(luò)爬蟲(chóng)C:深層式網(wǎng)絡(luò)爬蟲(chóng)D:通用網(wǎng)絡(luò)爬蟲(chóng)

答案:深層式網(wǎng)絡(luò)爬蟲(chóng)

以下關(guān)于實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲(chóng)程序的描述中,錯(cuò)誤的是()。

A:通過(guò)Python編寫(xiě)網(wǎng)絡(luò)爬蟲(chóng)程序,本質(zhì)上是模擬人類(lèi)瀏覽網(wǎng)頁(yè)的行為B:通過(guò)爬蟲(chóng)程序獲取的數(shù)據(jù)文件均為HTML文件C:網(wǎng)絡(luò)爬蟲(chóng)是自動(dòng)獲取互聯(lián)網(wǎng)上公開(kāi)數(shù)據(jù)的程序D:編寫(xiě)爬蟲(chóng)程序前,可以使用瀏覽器自帶的開(kāi)發(fā)者工具,對(duì)我們發(fā)出的請(qǐng)求和接受到的響應(yīng)進(jìn)行分析

答案:通過(guò)爬蟲(chóng)程序獲取的數(shù)據(jù)文件均為HTML文件

通過(guò)瀏覽器訪問(wèn)網(wǎng)站服務(wù)器的過(guò)程,描述錯(cuò)誤的是()。

A:HTTP協(xié)議規(guī)范了請(qǐng)求與響應(yīng)的過(guò)程B:參與對(duì)象包:括瀏覽器、域名解析服務(wù)器、網(wǎng)站服務(wù)器C:TCP協(xié)議規(guī)范了超文本標(biāo)記語(yǔ)言的語(yǔ)法格式D:互聯(lián)網(wǎng)上公開(kāi)數(shù)據(jù)的地址是由URL協(xié)議規(guī)范

答案:TCP協(xié)議規(guī)范了超文本標(biāo)記語(yǔ)言的語(yǔ)法格式

下列不屬于常用反爬蟲(chóng)手段的是()。

A:限制訪問(wèn)頻率B:人工篩查C:對(duì)請(qǐng)求頭的檢測(cè)D:驗(yàn)證碼校驗(yàn)

答案:人工篩查

以下關(guān)于爬蟲(chóng)程序的描述中,正確的是()。

A:通過(guò)爬蟲(chóng)程序獲取的數(shù)據(jù)可在互聯(lián)網(wǎng)上公開(kāi)B:爬蟲(chóng)程序可以爬取互聯(lián)網(wǎng)上任意數(shù)據(jù)C:通過(guò)爬蟲(chóng)程序獲取的數(shù)據(jù)可用于商業(yè)用途D:爬蟲(chóng)程序執(zhí)行時(shí)應(yīng)避免對(duì)服務(wù)器造成過(guò)載

答案:爬蟲(chóng)程序執(zhí)行時(shí)應(yīng)避免對(duì)服務(wù)器造成過(guò)載

第三章測(cè)試

以下關(guān)于re庫(kù)的描述中,錯(cuò)誤的是()。

A:re庫(kù)是Python的第三方庫(kù)B:可通過(guò)re庫(kù)實(shí)現(xiàn)字符串的正則表達(dá)式匹配C:可re庫(kù)提取HTML文檔中的數(shù)據(jù)D:re.findall()方法返回的數(shù)據(jù)類(lèi)型為列表

答案:re庫(kù)是Python的第三方庫(kù)

?正則表達(dá)式中能夠匹前面的字符或子表達(dá)式1次或多次的符號(hào)是()。

A:|B:*C:?D:+

答案:+

?以下不能夠匹配任意數(shù)字字符的正則表達(dá)式的是()。

A:dB:[0123456789]C:[0-9]D:{0123456789}

答案:{0123456789}

第四章測(cè)試

HTML是整個(gè)網(wǎng)頁(yè)的結(jié)構(gòu),相當(dāng)于整個(gè)網(wǎng)站的框架。帶“<”、“>”符號(hào)的都是屬于HTML的標(biāo)簽,并且標(biāo)簽都是成對(duì)出現(xiàn)的。下列說(shuō)法中,錯(cuò)誤的是()。

A:<html>..</html>表示標(biāo)記中間的元素是網(wǎng)頁(yè)B:有的標(biāo)記附標(biāo)簽是可以帶有屬性參數(shù),表示為<標(biāo)記屬性="參數(shù)值">C:表示超鏈接標(biāo)簽D:<img>..</img>表示該標(biāo)簽是標(biāo)題

答案:<img>..</img>表示該標(biāo)簽是標(biāo)題

下列關(guān)于BeautifulSoup中對(duì)象類(lèi)型描述錯(cuò)誤的是()。

A:attrs屬性可獲取標(biāo)簽的屬性B:string屬性可獲取標(biāo)簽的id屬性C:name屬性可獲取標(biāo)簽名D:NavigableString屬性可獲取標(biāo)簽內(nèi)非屬性字符串

答案:string屬性可獲取標(biāo)簽的id屬性

執(zhí)行以下程序輸出的結(jié)果是()。

frombs4importBeautifulSoup

html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'

soup=BeautifulSoup(html,'html.parser')

print(soup.a.string)

A:AliceAmyB:ssC:AliceD:Amy

答案:Alice

執(zhí)行以下程序輸出的結(jié)果是()。

frombs4importBeautifulSoup

html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'

soup=BeautifulSoup(html,'html.parser')

soup.find_all(name='a',id='name2')

A:[<pclass="story">ss<aid="name1">Alice</a></p>]B:[<aid="name1">Alice</a>,<aid="name2">Amy</a>]C:[<aid="name1">Alice</a>]D:[<aid="name2">Amy</a>]

答案:[<aid="name2">Amy</a>]

執(zhí)行以下程序輸出的結(jié)果是()。

frombs4importBeautifulSoup

html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'

soup=BeautifulSoup(html,'html.parser')

soup.select('p~a')

A:[<pclass="story">ss<aid="name1">Alice</a></p>]B:[<aid="name2">Amy</a>]C:[<aid="name1">Alice</a>,<aid="name2">Amy</a>]D:[<aid="name1">Alice</a>]

答案:[<aid="name2">Amy</a>]

第五章測(cè)試

以下關(guān)于JSON模塊描述錯(cuò)誤的是()。

A:json.loads()能夠?qū)son字符串解析為Python數(shù)據(jù)類(lèi)型B:JSON模塊可對(duì)JSON數(shù)據(jù)進(jìn)行解析與編碼C:json.loads()只只能將json字符串解析為字典D:json.dumps()能夠?qū)⒁粋€(gè)Python數(shù)據(jù)類(lèi)型編碼為json字符串

答案:json.loads()只只能將json字符串解析為字典

以下關(guān)于json數(shù)據(jù)的描述中,錯(cuò)誤的是()

A:JSON數(shù)據(jù)非常簡(jiǎn)潔,層次結(jié)構(gòu)非常清晰B:JSON是非常利于人閱讀,但是不太利于機(jī)器解析和生成的。C:JSON是一種輕量級(jí)的數(shù)據(jù)交換格式D:JSON是以文本格式來(lái)存儲(chǔ)和表示

答案:JSON是非常利于人閱讀,但是不太利于機(jī)器解析和生成的。

表單登陸需要使用的請(qǐng)求方法是()

A:GETB:DELETEC:POSTD:PUT

答案:POST

以下關(guān)于Ajax技術(shù)描述錯(cuò)誤的是()

A:Ajax通過(guò)JavaScript發(fā)送請(qǐng)求、解析數(shù)據(jù)、渲染網(wǎng)頁(yè)B:瀏覽器通過(guò)Ajax向服務(wù)器發(fā)送請(qǐng)求的類(lèi)型為XMLHttpC:Ajax可以在不刷新整個(gè)頁(yè)面的情況下,對(duì)網(wǎng)頁(yè)進(jìn)行部分更新D:網(wǎng)絡(luò)爬蟲(chóng)程序不能從采用Ajax技術(shù)的網(wǎng)頁(yè)中爬取數(shù)據(jù)

答案:網(wǎng)絡(luò)爬蟲(chóng)程序不能從采用Ajax技術(shù)的網(wǎng)頁(yè)中爬取數(shù)據(jù)

以下描述錯(cuò)誤的是()

A:可通過(guò)javascript可控制網(wǎng)頁(yè)的動(dòng)態(tài)功能B:可通過(guò)HTML語(yǔ)言定義網(wǎng)頁(yè)結(jié)構(gòu)C:可通過(guò)CSS設(shè)置網(wǎng)頁(yè)的樣式D:可通過(guò)Ajax可實(shí)現(xiàn)網(wǎng)頁(yè)的靜態(tài)加載

答案:可通過(guò)Ajax可實(shí)現(xiàn)網(wǎng)頁(yè)的靜態(tài)加載

第六章測(cè)試

Pandas提供的數(shù)據(jù)類(lèi)型中,以下哪一項(xiàng)是帶索引的一維數(shù)組()。

A:PanelB:ArrayC:SeriesD:DataFrame

答案:Series

執(zhí)行以下程序輸出的結(jié)果是()。

importpandasaspd

s=pd.Series([3,5,6,7,9],index=['a','b','c','d','e'])

print(list(s[2:4]))

A:[5,6]B:[6,7]C:[5,6,7]D:[6,7,9]

答案:[6,7]

執(zhí)行以下程序輸出的結(jié)果是()。

importpandasaspd

s1=pd.Series([3,5,6,7,9])

s2=pd.Series([1,2,3,4,1])

print((s1+s2).sum())

A:[4,7,9,11,10]B:41C:[3,5,6,7,9,1,2,3,4,1]D:4

答案:41

執(zhí)行以下程序輸出的結(jié)果是(A)。

importpandasaspd

d={'one':[1,3,5,7],'two':[2,4,6,8]}

df=pd.DataFrame()

df['three']=df['two']-df['one']

df.drop(2)

print(df)

A:B:C:D:

答案:

執(zhí)行以下程序輸出的結(jié)果是(A)。

importpandasaspd

d={'one':[1,3,5,7],'two':[2,4,6,8]}

df=pd.DataFrame()

df['three']=df['two']-df['one']

print(df[(df.one>3)&(df.two<8)])

A:B:C:D:

答案:

第七章測(cè)試

關(guān)于pandas的merge方法描述錯(cuò)誤的是()。

A:merge方法可以將兩個(gè)dataframe在任意列上對(duì)齊連接B:merge方法可以將兩個(gè)dataframe在行索引上對(duì)齊連接C:merge方法可以將兩個(gè)dataframe在名稱(chēng)不同的列上對(duì)齊連接D:merge方法默認(rèn)執(zhí)行內(nèi)連接

答案:merge方法可以將兩個(gè)dataframe在行索引上對(duì)齊連接

關(guān)于pandas的concat方法描述錯(cuò)誤的是()。

A:concat方法可以將兩個(gè)dataframe在行索引上對(duì)齊連接B:concat方法可以將兩個(gè)dataframe在任意列上對(duì)齊連接C:concat方法可以將兩個(gè)dataframe在列索引上對(duì)齊連接D:concat方法可以將兩個(gè)series在行索引上對(duì)齊連接

答案:concat方法可以將兩個(gè)dataframe在任意列上對(duì)齊連接

變量df1與df3的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。

df=pd.concat([df1,df3],axis=1,join='inner')

A:B:C:D:報(bào)錯(cuò)

答案:

變量df1與df2的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。

df=pd.merge(df1,df2,on=['key1','key2'],how='left')

A:B:C:D:

答案:

變量df1與df2的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。

df=pd.merge(df1,df2,on=['key1','key2'],how='right')

A:B:C:D:

答案:

第八章測(cè)試

以下描述錯(cuò)誤的是()。

A:可通過(guò)groupby方法對(duì)dataframe進(jìn)行分組聚合變換B:apply方法可將函數(shù)功能應(yīng)用到dataframe上的每一個(gè)元素C:可通過(guò)pandas庫(kù)的to_csv方法將dataframe寫(xiě)入文本文件D:可通過(guò)pandas庫(kù)的read_csv方法將文本文件讀入dataframe

答案:apply方法可將函數(shù)功能應(yīng)用到dataframe上的每一個(gè)元素

以下關(guān)于缺失值的處理描述錯(cuò)誤的是()。

A:對(duì)于dataframe中具有缺失值的行可以進(jìn)行刪除或填充處理B:通過(guò)dataframe的isnull()方法可直接查詢到每一列缺失值的個(gè)數(shù)C:通過(guò)dataframe的fillna()方法可填充缺失值D:通過(guò)dataframe的dropna(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論