![網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第1頁(yè)](http://file4.renrendoc.com/view/e6e356a70e8cfcf14140dacc22e392b0/e6e356a70e8cfcf14140dacc22e392b01.gif)
![網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第2頁(yè)](http://file4.renrendoc.com/view/e6e356a70e8cfcf14140dacc22e392b0/e6e356a70e8cfcf14140dacc22e392b02.gif)
![網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第3頁(yè)](http://file4.renrendoc.com/view/e6e356a70e8cfcf14140dacc22e392b0/e6e356a70e8cfcf14140dacc22e392b03.gif)
![網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第4頁(yè)](http://file4.renrendoc.com/view/e6e356a70e8cfcf14140dacc22e392b0/e6e356a70e8cfcf14140dacc22e392b04.gif)
![網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院_第5頁(yè)](http://file4.renrendoc.com/view/e6e356a70e8cfcf14140dacc22e392b0/e6e356a70e8cfcf14140dacc22e392b05.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
網(wǎng)絡(luò)數(shù)據(jù)爬取與處理智慧樹(shù)知到課后章節(jié)答案2023年下上海商學(xué)院上海商學(xué)院
第一章測(cè)試
以下描述錯(cuò)誤的是()。
A:Jupyternotebook是一個(gè)基于網(wǎng)頁(yè)交互的編程環(huán)境B:Jupyternotebook可通過(guò)Markdown語(yǔ)法編寫(xiě)說(shuō)明文檔C:Anaconda只提供了Jupyternotebook編程環(huán)境D:Anaconda是一個(gè)開(kāi)源的Python發(fā)行版本
答案:Anaconda只提供了Jupyternotebook編程環(huán)境
以下描述錯(cuò)誤的是(C)。
以下哪一項(xiàng)不屬于數(shù)據(jù)科學(xué)的基本任務(wù)()。
A:分析數(shù)據(jù)B:獲取數(shù)據(jù)C:處理數(shù)據(jù)D:存儲(chǔ)數(shù)據(jù)
答案:存儲(chǔ)數(shù)據(jù)
以下關(guān)于數(shù)據(jù)科學(xué)的說(shuō)法中,正確的是()。
A:對(duì)大數(shù)據(jù)的采集就是數(shù)據(jù)科學(xué)B:計(jì)算工具的革新,數(shù)據(jù)量的持續(xù)增長(zhǎng)推動(dòng)了數(shù)據(jù)科學(xué)的發(fā)展。C:數(shù)據(jù)科學(xué)只適用于科學(xué)研究,對(duì)我們?nèi)粘I顩](méi)有關(guān)系D:數(shù)據(jù)科學(xué)就是研究數(shù)學(xué)的科學(xué)
答案:計(jì)算工具的革新,數(shù)據(jù)量的持續(xù)增長(zhǎng)推動(dòng)了數(shù)據(jù)科學(xué)的發(fā)展。
智能健康手環(huán)的運(yùn)用了以下哪一項(xiàng)數(shù)據(jù)采集技術(shù)()。
A:網(wǎng)絡(luò)爬蟲(chóng)B:傳感器C:統(tǒng)計(jì)報(bào)表D:API接口
答案:傳感器
下列關(guān)于大數(shù)據(jù)特點(diǎn)的說(shuō)法中,錯(cuò)誤的是().
A:數(shù)據(jù)類(lèi)型多樣B:數(shù)據(jù)生成和處理速度快C:數(shù)據(jù)價(jià)值密度高。D:數(shù)據(jù)規(guī)模大
答案:數(shù)據(jù)價(jià)值密度高。
第二章測(cè)試
下列選項(xiàng)哪不是爬蟲(chóng)程序的常見(jiàn)類(lèi)型()。
A:聚焦網(wǎng)絡(luò)爬蟲(chóng)B:增量式網(wǎng)絡(luò)爬蟲(chóng)C:深層式網(wǎng)絡(luò)爬蟲(chóng)D:通用網(wǎng)絡(luò)爬蟲(chóng)
答案:深層式網(wǎng)絡(luò)爬蟲(chóng)
以下關(guān)于實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲(chóng)程序的描述中,錯(cuò)誤的是()。
A:通過(guò)Python編寫(xiě)網(wǎng)絡(luò)爬蟲(chóng)程序,本質(zhì)上是模擬人類(lèi)瀏覽網(wǎng)頁(yè)的行為B:通過(guò)爬蟲(chóng)程序獲取的數(shù)據(jù)文件均為HTML文件C:網(wǎng)絡(luò)爬蟲(chóng)是自動(dòng)獲取互聯(lián)網(wǎng)上公開(kāi)數(shù)據(jù)的程序D:編寫(xiě)爬蟲(chóng)程序前,可以使用瀏覽器自帶的開(kāi)發(fā)者工具,對(duì)我們發(fā)出的請(qǐng)求和接受到的響應(yīng)進(jìn)行分析
答案:通過(guò)爬蟲(chóng)程序獲取的數(shù)據(jù)文件均為HTML文件
通過(guò)瀏覽器訪問(wèn)網(wǎng)站服務(wù)器的過(guò)程,描述錯(cuò)誤的是()。
A:HTTP協(xié)議規(guī)范了請(qǐng)求與響應(yīng)的過(guò)程B:參與對(duì)象包:括瀏覽器、域名解析服務(wù)器、網(wǎng)站服務(wù)器C:TCP協(xié)議規(guī)范了超文本標(biāo)記語(yǔ)言的語(yǔ)法格式D:互聯(lián)網(wǎng)上公開(kāi)數(shù)據(jù)的地址是由URL協(xié)議規(guī)范
答案:TCP協(xié)議規(guī)范了超文本標(biāo)記語(yǔ)言的語(yǔ)法格式
下列不屬于常用反爬蟲(chóng)手段的是()。
A:限制訪問(wèn)頻率B:人工篩查C:對(duì)請(qǐng)求頭的檢測(cè)D:驗(yàn)證碼校驗(yàn)
答案:人工篩查
以下關(guān)于爬蟲(chóng)程序的描述中,正確的是()。
A:通過(guò)爬蟲(chóng)程序獲取的數(shù)據(jù)可在互聯(lián)網(wǎng)上公開(kāi)B:爬蟲(chóng)程序可以爬取互聯(lián)網(wǎng)上任意數(shù)據(jù)C:通過(guò)爬蟲(chóng)程序獲取的數(shù)據(jù)可用于商業(yè)用途D:爬蟲(chóng)程序執(zhí)行時(shí)應(yīng)避免對(duì)服務(wù)器造成過(guò)載
答案:爬蟲(chóng)程序執(zhí)行時(shí)應(yīng)避免對(duì)服務(wù)器造成過(guò)載
第三章測(cè)試
以下關(guān)于re庫(kù)的描述中,錯(cuò)誤的是()。
A:re庫(kù)是Python的第三方庫(kù)B:可通過(guò)re庫(kù)實(shí)現(xiàn)字符串的正則表達(dá)式匹配C:可re庫(kù)提取HTML文檔中的數(shù)據(jù)D:re.findall()方法返回的數(shù)據(jù)類(lèi)型為列表
答案:re庫(kù)是Python的第三方庫(kù)
?正則表達(dá)式中能夠匹前面的字符或子表達(dá)式1次或多次的符號(hào)是()。
A:|B:*C:?D:+
答案:+
?以下不能夠匹配任意數(shù)字字符的正則表達(dá)式的是()。
A:dB:[0123456789]C:[0-9]D:{0123456789}
答案:{0123456789}
第四章測(cè)試
HTML是整個(gè)網(wǎng)頁(yè)的結(jié)構(gòu),相當(dāng)于整個(gè)網(wǎng)站的框架。帶“<”、“>”符號(hào)的都是屬于HTML的標(biāo)簽,并且標(biāo)簽都是成對(duì)出現(xiàn)的。下列說(shuō)法中,錯(cuò)誤的是()。
A:<html>..</html>表示標(biāo)記中間的元素是網(wǎng)頁(yè)B:有的標(biāo)記附標(biāo)簽是可以帶有屬性參數(shù),表示為<標(biāo)記屬性="參數(shù)值">C:表示超鏈接標(biāo)簽D:<img>..</img>表示該標(biāo)簽是標(biāo)題
答案:<img>..</img>表示該標(biāo)簽是標(biāo)題
下列關(guān)于BeautifulSoup中對(duì)象類(lèi)型描述錯(cuò)誤的是()。
A:attrs屬性可獲取標(biāo)簽的屬性B:string屬性可獲取標(biāo)簽的id屬性C:name屬性可獲取標(biāo)簽名D:NavigableString屬性可獲取標(biāo)簽內(nèi)非屬性字符串
答案:string屬性可獲取標(biāo)簽的id屬性
執(zhí)行以下程序輸出的結(jié)果是()。
frombs4importBeautifulSoup
html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'
soup=BeautifulSoup(html,'html.parser')
print(soup.a.string)
A:AliceAmyB:ssC:AliceD:Amy
答案:Alice
執(zhí)行以下程序輸出的結(jié)果是()。
frombs4importBeautifulSoup
html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'
soup=BeautifulSoup(html,'html.parser')
soup.find_all(name='a',id='name2')
A:[<pclass="story">ss<aid="name1">Alice</a></p>]B:[<aid="name1">Alice</a>,<aid="name2">Amy</a>]C:[<aid="name1">Alice</a>]D:[<aid="name2">Amy</a>]
答案:[<aid="name2">Amy</a>]
執(zhí)行以下程序輸出的結(jié)果是()。
frombs4importBeautifulSoup
html='<html><pclass="story">ss<aid="name1">Alice</a></p><aid="name2">Amy</a></html>'
soup=BeautifulSoup(html,'html.parser')
soup.select('p~a')
A:[<pclass="story">ss<aid="name1">Alice</a></p>]B:[<aid="name2">Amy</a>]C:[<aid="name1">Alice</a>,<aid="name2">Amy</a>]D:[<aid="name1">Alice</a>]
答案:[<aid="name2">Amy</a>]
第五章測(cè)試
以下關(guān)于JSON模塊描述錯(cuò)誤的是()。
A:json.loads()能夠?qū)son字符串解析為Python數(shù)據(jù)類(lèi)型B:JSON模塊可對(duì)JSON數(shù)據(jù)進(jìn)行解析與編碼C:json.loads()只只能將json字符串解析為字典D:json.dumps()能夠?qū)⒁粋€(gè)Python數(shù)據(jù)類(lèi)型編碼為json字符串
答案:json.loads()只只能將json字符串解析為字典
以下關(guān)于json數(shù)據(jù)的描述中,錯(cuò)誤的是()
A:JSON數(shù)據(jù)非常簡(jiǎn)潔,層次結(jié)構(gòu)非常清晰B:JSON是非常利于人閱讀,但是不太利于機(jī)器解析和生成的。C:JSON是一種輕量級(jí)的數(shù)據(jù)交換格式D:JSON是以文本格式來(lái)存儲(chǔ)和表示
答案:JSON是非常利于人閱讀,但是不太利于機(jī)器解析和生成的。
表單登陸需要使用的請(qǐng)求方法是()
A:GETB:DELETEC:POSTD:PUT
答案:POST
以下關(guān)于Ajax技術(shù)描述錯(cuò)誤的是()
A:Ajax通過(guò)JavaScript發(fā)送請(qǐng)求、解析數(shù)據(jù)、渲染網(wǎng)頁(yè)B:瀏覽器通過(guò)Ajax向服務(wù)器發(fā)送請(qǐng)求的類(lèi)型為XMLHttpC:Ajax可以在不刷新整個(gè)頁(yè)面的情況下,對(duì)網(wǎng)頁(yè)進(jìn)行部分更新D:網(wǎng)絡(luò)爬蟲(chóng)程序不能從采用Ajax技術(shù)的網(wǎng)頁(yè)中爬取數(shù)據(jù)
答案:網(wǎng)絡(luò)爬蟲(chóng)程序不能從采用Ajax技術(shù)的網(wǎng)頁(yè)中爬取數(shù)據(jù)
以下描述錯(cuò)誤的是()
A:可通過(guò)javascript可控制網(wǎng)頁(yè)的動(dòng)態(tài)功能B:可通過(guò)HTML語(yǔ)言定義網(wǎng)頁(yè)結(jié)構(gòu)C:可通過(guò)CSS設(shè)置網(wǎng)頁(yè)的樣式D:可通過(guò)Ajax可實(shí)現(xiàn)網(wǎng)頁(yè)的靜態(tài)加載
答案:可通過(guò)Ajax可實(shí)現(xiàn)網(wǎng)頁(yè)的靜態(tài)加載
第六章測(cè)試
Pandas提供的數(shù)據(jù)類(lèi)型中,以下哪一項(xiàng)是帶索引的一維數(shù)組()。
A:PanelB:ArrayC:SeriesD:DataFrame
答案:Series
執(zhí)行以下程序輸出的結(jié)果是()。
importpandasaspd
s=pd.Series([3,5,6,7,9],index=['a','b','c','d','e'])
print(list(s[2:4]))
A:[5,6]B:[6,7]C:[5,6,7]D:[6,7,9]
答案:[6,7]
執(zhí)行以下程序輸出的結(jié)果是()。
importpandasaspd
s1=pd.Series([3,5,6,7,9])
s2=pd.Series([1,2,3,4,1])
print((s1+s2).sum())
A:[4,7,9,11,10]B:41C:[3,5,6,7,9,1,2,3,4,1]D:4
答案:41
執(zhí)行以下程序輸出的結(jié)果是(A)。
importpandasaspd
d={'one':[1,3,5,7],'two':[2,4,6,8]}
df=pd.DataFrame()
df['three']=df['two']-df['one']
df.drop(2)
print(df)
A:B:C:D:
答案:
執(zhí)行以下程序輸出的結(jié)果是(A)。
importpandasaspd
d={'one':[1,3,5,7],'two':[2,4,6,8]}
df=pd.DataFrame()
df['three']=df['two']-df['one']
print(df[(df.one>3)&(df.two<8)])
A:B:C:D:
答案:
第七章測(cè)試
關(guān)于pandas的merge方法描述錯(cuò)誤的是()。
A:merge方法可以將兩個(gè)dataframe在任意列上對(duì)齊連接B:merge方法可以將兩個(gè)dataframe在行索引上對(duì)齊連接C:merge方法可以將兩個(gè)dataframe在名稱(chēng)不同的列上對(duì)齊連接D:merge方法默認(rèn)執(zhí)行內(nèi)連接
答案:merge方法可以將兩個(gè)dataframe在行索引上對(duì)齊連接
關(guān)于pandas的concat方法描述錯(cuò)誤的是()。
A:concat方法可以將兩個(gè)dataframe在行索引上對(duì)齊連接B:concat方法可以將兩個(gè)dataframe在任意列上對(duì)齊連接C:concat方法可以將兩個(gè)dataframe在列索引上對(duì)齊連接D:concat方法可以將兩個(gè)series在行索引上對(duì)齊連接
答案:concat方法可以將兩個(gè)dataframe在任意列上對(duì)齊連接
變量df1與df3的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。
df=pd.concat([df1,df3],axis=1,join='inner')
A:B:C:D:報(bào)錯(cuò)
答案:
變量df1與df2的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。
df=pd.merge(df1,df2,on=['key1','key2'],how='left')
A:B:C:D:
答案:
變量df1與df2的值如下圖所示,執(zhí)行以下程序后,變量df的值為()。
df=pd.merge(df1,df2,on=['key1','key2'],how='right')
A:B:C:D:
答案:
第八章測(cè)試
以下描述錯(cuò)誤的是()。
A:可通過(guò)groupby方法對(duì)dataframe進(jìn)行分組聚合變換B:apply方法可將函數(shù)功能應(yīng)用到dataframe上的每一個(gè)元素C:可通過(guò)pandas庫(kù)的to_csv方法將dataframe寫(xiě)入文本文件D:可通過(guò)pandas庫(kù)的read_csv方法將文本文件讀入dataframe
答案:apply方法可將函數(shù)功能應(yīng)用到dataframe上的每一個(gè)元素
以下關(guān)于缺失值的處理描述錯(cuò)誤的是()。
A:對(duì)于dataframe中具有缺失值的行可以進(jìn)行刪除或填充處理B:通過(guò)dataframe的isnull()方法可直接查詢到每一列缺失值的個(gè)數(shù)C:通過(guò)dataframe的fillna()方法可填充缺失值D:通過(guò)dataframe的dropna(
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- PQA-18-生命科學(xué)試劑-MCE-3779
- Filiformine-生命科學(xué)試劑-MCE-8234
- 11-Hydroxy-9-R-hexahydrocannabinol-生命科學(xué)試劑-MCE-8544
- 4-Iso-THC-4-Iso-tetrahydrocannabinol-生命科學(xué)試劑-MCE-2807
- 2025年度磚廠承包與市場(chǎng)拓展合作協(xié)議
- 2025年新推出門(mén)面房出租管理服務(wù)合同
- 二零二五年度企業(yè)自愿離職合同解除范本及離職補(bǔ)償金計(jì)算標(biāo)準(zhǔn)
- 二零二五年度數(shù)字音樂(lè)版權(quán)互惠合作合同
- 二零二五年度洗煤廠煤炭洗選技術(shù)租賃合同
- 智能科技與家庭旅游的融合探索
- 2025年中國(guó)南方航空股份有限公司招聘筆試參考題庫(kù)含答案解析
- 商務(wù)部發(fā)布《中國(guó)再生資源回收行業(yè)發(fā)展報(bào)告(2024)》
- 山東省濟(jì)南市2024-2024學(xué)年高三上學(xué)期1月期末考試 地理 含答案
- 2025年福建新華發(fā)行(集團(tuán))限責(zé)任公司校園招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 實(shí)施彈性退休制度暫行辦法解讀課件
- 江蘇省駕校考試科目一考試題庫(kù)
- 四川省成都市青羊區(qū)成都市石室聯(lián)合中學(xué)2023-2024學(xué)年七上期末數(shù)學(xué)試題(解析版)
- 2024-2030年中國(guó)自動(dòng)光學(xué)檢測(cè)儀(AOI)市場(chǎng)競(jìng)爭(zhēng)格局與前景發(fā)展策略分析報(bào)告
- 咨詢公司績(jī)效工資分配實(shí)施方案
- 2025新人教版英語(yǔ)七年級(jí)下單詞表
- 中華護(hù)理學(xué)會(huì)團(tuán)體標(biāo)準(zhǔn)-氣管切開(kāi)非機(jī)械通氣患者氣道護(hù)理
評(píng)論
0/150
提交評(píng)論