




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)智慧樹(shù)知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院楊凌職業(yè)技術(shù)學(xué)院
項(xiàng)目一測(cè)試
下列不屬于常見(jiàn)爬蟲(chóng)類(lèi)型的是()。
A:淺層網(wǎng)絡(luò)爬蟲(chóng)
B:通用網(wǎng)絡(luò)爬蟲(chóng)
C:聚焦網(wǎng)絡(luò)爬蟲(chóng)
D:增量式網(wǎng)絡(luò)爬蟲(chóng)
答案:淺層網(wǎng)絡(luò)爬蟲(chóng)
下列不屬于聚焦網(wǎng)絡(luò)爬蟲(chóng)的常用策略的是()。
A:基于深度優(yōu)先的爬取策略
B:基于語(yǔ)境圖的爬取策略
C:基于內(nèi)容評(píng)價(jià)的爬取策略
D:基于鏈接結(jié)構(gòu)評(píng)價(jià)的爬取策略
答案:基于深度優(yōu)先的爬取策略
下列不屬于常用反爬手段的是()。
A:驗(yàn)證碼校驗(yàn)
B:人工篩選
C:賬號(hào)權(quán)限
D:反爬頻度
答案:人工篩選
下列屬于反爬蟲(chóng)目的的是()。
A:變換網(wǎng)頁(yè)結(jié)構(gòu)
B:限制用戶訪問(wèn)權(quán)限
C:防止網(wǎng)站信息被競(jìng)爭(zhēng)對(duì)手隨意獲取
D:限制訪問(wèn)人數(shù)
答案:防止網(wǎng)站信息被競(jìng)爭(zhēng)對(duì)手隨意獲取
下列屬關(guān)于Python爬蟲(chóng)庫(kù)的功能描述不正確的是()。
A:通用爬蟲(chóng)庫(kù)urllib3
B:HTML/XML解析器pycurl`
C:通用爬蟲(chóng)庫(kù)Requests
D:爬蟲(chóng)框架Scrapy
答案:HTML/XML解析器pycurl`
搜索引擎使用了網(wǎng)絡(luò)爬蟲(chóng)不停地從互聯(lián)網(wǎng)抓取網(wǎng)站數(shù)據(jù),并將網(wǎng)站鏡像保存在本地。()
A:錯(cuò)B:對(duì)
答案:對(duì)
robots.txt文件中,User-agent后面跟的是爬蟲(chóng)的名稱,Disallow后面跟著的是可以爬蟲(chóng)的網(wǎng)頁(yè)。()
A:對(duì)B:錯(cuò)
答案:錯(cuò)
爬蟲(chóng)是手動(dòng)請(qǐng)求萬(wàn)維網(wǎng)網(wǎng)站且提取網(wǎng)頁(yè)數(shù)據(jù)的程序。()
A:錯(cuò)B:對(duì)
答案:錯(cuò)
每個(gè)網(wǎng)站都有robots.txt文件。()
A:錯(cuò)B:對(duì)
答案:錯(cuò)
爬蟲(chóng)爬取的是網(wǎng)站后臺(tái)的數(shù)據(jù)。()
A:錯(cuò)B:對(duì)
答案:錯(cuò)
項(xiàng)目二測(cè)試
吉多設(shè)計(jì)Python的靈感來(lái)源于()。
A:Unixshell
B:ABC語(yǔ)言
C:C語(yǔ)言
D:Java語(yǔ)言
答案:ABC語(yǔ)言
下列關(guān)于Python語(yǔ)言的特點(diǎn)說(shuō)法中,錯(cuò)誤的是()。
A:Python語(yǔ)言是跨平臺(tái)語(yǔ)言
B:ANSIC
C:Python語(yǔ)言是非開(kāi)源語(yǔ)言
D:Go
答案:Python語(yǔ)言是非開(kāi)源語(yǔ)言
Python源代碼文件的后綴名是()
A:doc
B:py
C:png
D:pdf
答案:py
列表list=[1,2,3,4,5],下列選項(xiàng)中為空的是()
A:list[:-2]
B:list[1:]
C:list[1:-1]
D:ist[1:1]
答案:ist[1:1]
Python語(yǔ)言中用來(lái)定義函數(shù)的關(guān)鍵字是()
A:function
B:return
C:def
D:class
答案:def
在安裝Python時(shí),需要根據(jù)已有的系統(tǒng)來(lái)選擇相應(yīng)的安裝程序。安裝后,也需要配置環(huán)境變量。()
A:對(duì)B:錯(cuò)
答案:對(duì)
elif語(yǔ)句可以單獨(dú)使用。()
A:錯(cuò)B:對(duì)
答案:錯(cuò)
元組的元素不能修改。()
A:對(duì)B:錯(cuò)
答案:對(duì)
下列選項(xiàng)中,不能創(chuàng)建元組的語(yǔ)句是()。
A:tup=(1,2,98)
B:tup=(2)
C:tup=[1,2,3]
D:tup=tuple([1,2,3])
答案:tup=(2)
;tup=[1,2,3]
項(xiàng)目三測(cè)試
如果站點(diǎn)服務(wù)器支持安全套接層(SSL),那么連接到安全站點(diǎn)上的所有URL開(kāi)頭是()。
A:HTTPS
B:SHTTP
C:HTTP
D:SSL
答案:HTTPS
body元素用于背景顏色的屬性是()。
A:background-color
B:vlink
C:color
D:alink
答案:background-color
為了標(biāo)識(shí)一個(gè)HTML文件開(kāi)始應(yīng)該使用的HTML標(biāo)記是()。
A:
<table>
B:<html>
C:<body>
D:<a>
答案:<html>
在HTML中,單元格的標(biāo)記是()。
A:<span>
B:<td>
C:<tr>
D:<body>
答案:<td>
CSS中的選擇器不包括包括()
A:ID選擇器
B:元素選擇器
C:超文本標(biāo)記選擇器
D:類(lèi)選擇器
答案:超文本標(biāo)記選擇器
()是網(wǎng)頁(yè)與網(wǎng)頁(yè)之間聯(lián)系的紐帶,也是網(wǎng)頁(yè)的重要特色。
A:導(dǎo)航條
B:框架
C:表格
D:超鏈接
答案:超鏈接
在HTML中,下面是段落標(biāo)簽的是:()。
A:<html></html>
B:<body></body>
C:<head></head>
D:<p></p>
答案:<p></p>
()標(biāo)簽可以應(yīng)用于〈head〉中。
A:<image>
B:<html>
C:<title>
D:<body>
答案:<title>
下列哪一項(xiàng)是css添加背景圖片的正確語(yǔ)法構(gòu)成?()
A:background-image
B:background-position
C:background-color
D:background-size
答案:background-image
在HTML開(kāi)發(fā)中,制作網(wǎng)站時(shí)首先需要考慮內(nèi)容是()
A:頁(yè)面布局
B:圖片色彩
C:文字字體
第四章
D:頁(yè)面內(nèi)容
答案:頁(yè)面布局
項(xiàng)目四測(cè)試
HTTPError是URLError的子類(lèi),專門(mén)用來(lái)處理HTTP請(qǐng)求錯(cuò)誤,比如認(rèn)證請(qǐng)求失敗等。它有3個(gè)屬性,下列選項(xiàng)哪一個(gè)不是它的屬性()。
A:code
B:headers
C:Response
D:reason
答案:Response
下列屬于HTTP必須實(shí)現(xiàn)的請(qǐng)求方法的是()。
A:POST與DELE
B:TRACE和OPTIONS
C:GET與HEAD
D:OPTIONS和CONNECT
答案:GET與HEAD
下列關(guān)于HTTP狀態(tài)碼類(lèi)型描述錯(cuò)誤的是()。
A:3XX表示客戶端的請(qǐng)求需采取進(jìn)一步操作
B:4XX表示客戶端可能發(fā)生錯(cuò)誤
C:1XX表示請(qǐng)求已被服務(wù)器接受,無(wú)須后續(xù)處理
D:5XX表示服務(wù)器可能發(fā)生錯(cuò)誤
答案:1XX表示請(qǐng)求已被服務(wù)器接受,無(wú)須后續(xù)處理
通過(guò)加入特定的____,可以將爬蟲(chóng)發(fā)出的請(qǐng)求偽裝成瀏覽器。()
A:Headers
B:opener
C:User_Agent
D:Request
答案:User_Agent
urlopen方法中的data參數(shù)可以不是bytes類(lèi)型。()
A:對(duì)B:錯(cuò)
答案:錯(cuò)
requests庫(kù)中的requests.get(url)方法是請(qǐng)求目標(biāo)網(wǎng)站,類(lèi)型是一個(gè)HTTPresponse類(lèi)型。()
A:錯(cuò)B:對(duì)
答案:對(duì)
如果訪問(wèn)某網(wǎng)站的頻率太高,則這個(gè)網(wǎng)站可能會(huì)禁止訪問(wèn)。()
A:錯(cuò)B:對(duì)
答案:對(duì)
requests庫(kù)中的requests.get(url)方法中包括兩個(gè)(對(duì)象)請(qǐng)求,其中一個(gè)為Request請(qǐng)求,即向服務(wù)器請(qǐng)求資源的request對(duì)象,第二個(gè)是Response請(qǐng)求,即包含從服務(wù)器返回的所有資源。()
A:錯(cuò)B:對(duì)
答案:對(duì)
Response類(lèi)用于動(dòng)態(tài)地響應(yīng)客戶端的請(qǐng)求,控制發(fā)送給用戶的信息,并且將動(dòng)態(tài)地生成響應(yīng),包括狀態(tài)碼、網(wǎng)頁(yè)的內(nèi)容等。()
A:對(duì)B:錯(cuò)
答案:對(duì)
項(xiàng)目五測(cè)試
下列不屬于HTTP請(qǐng)求過(guò)程的是()。
A:生成請(qǐng)求
B:搜索文檔
C:超時(shí)設(shè)置
D:請(qǐng)求重定向
答案:搜索文檔
下列關(guān)于Chrome開(kāi)發(fā)者工具描述錯(cuò)誤的是()
A:網(wǎng)絡(luò)面板無(wú)法查看HTML源碼
B:源代碼面板可查看HTML源碼
C:網(wǎng)絡(luò)面板可查看HTTP頭部信息
D:元素面板可查看元素在頁(yè)面的對(duì)應(yīng)位置
答案:網(wǎng)絡(luò)面板無(wú)法查看HTML源碼
下列關(guān)于Xpah中功能函數(shù)描述錯(cuò)誤的是()
A:and方法可用于選取同時(shí)包含兩種指定值的節(jié)點(diǎn)
B:text函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點(diǎn)
C:text函數(shù)可提取節(jié)點(diǎn)文本內(nèi)容
D:contains方法可用于選取以指定值開(kāi)頭的節(jié)點(diǎn)
答案:contains方法可用于選取以指定值開(kāi)頭的節(jié)點(diǎn)
下列關(guān)于Beautifulsoup中對(duì)象類(lèi)型描述錯(cuò)誤的是()
A:name方法可以獲取及修改Tag對(duì)象名稱
B:NavigableString對(duì)象無(wú)法被編輯,但可以進(jìn)行替換
C:string方法可獲取Tag對(duì)象中的文本字符串內(nèi)容
D:attrs方法可獲取Tag對(duì)象的HTML屬性,返回值為列表形式
答案:attrs方法可獲取Tag對(duì)象的HTML屬性,返回值為列表形式
下列選項(xiàng)中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是:()
A:圖像
B:XML
C:HTML
D:JSON
答案:圖像
對(duì)服務(wù)器端來(lái)說(shuō),它返回給客戶端的數(shù)據(jù)格式可分為非結(jié)構(gòu)化和結(jié)構(gòu)化兩種。()
A:對(duì)B:錯(cuò)
答案:對(duì)
網(wǎng)頁(yè)中的非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒(méi)有預(yù)定義的數(shù)據(jù)模型,不方便使用數(shù)據(jù)庫(kù)二維邏輯來(lái)表現(xiàn)的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖像等。()
A:對(duì)B:錯(cuò)
答案:對(duì)
結(jié)構(gòu)化數(shù)據(jù)就是能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,具有模式的數(shù)據(jù),包括HTML、XML和JSON等。()
A:錯(cuò)B:對(duì)
答案:對(duì)
正則表達(dá)式、XPath和BeautifulSoup都是基于HTML/XML文檔的層次結(jié)構(gòu)來(lái)確定到達(dá)指定節(jié)點(diǎn)的路徑。()
A:對(duì)B:錯(cuò)
答案:錯(cuò)
XPath是一門(mén)在XML文檔中查找信息的語(yǔ)言。XPath可用來(lái)在XML文檔中對(duì)元素和屬性進(jìn)行遍歷。()
A:錯(cuò)B:對(duì)
答案:對(duì)
項(xiàng)目六測(cè)試
使用以下哪個(gè)函數(shù)可以打開(kāi)一個(gè)已經(jīng)存在的文件?()
A:file
B:close
C:open
D:read
答案:open
文件訪問(wèn)的默認(rèn)模式為()。
A:r
B:a
C:ab
D:w
答案:r
以二進(jìn)制格式打開(kāi)一個(gè)文件用于追加的訪問(wèn)模式為()。
A:r+
B:ab
C:r
D:w
答案:ab
改變文件目錄所用的方法是()。
A:read()
B:remove()
C:rename()
D:chdir()
答案:chdir()
文件刪除所用的方法是()
A:read()
B:rename()
C:readlines()
D:remove()
答案:remove()
使用withas語(yǔ)法。在with控制塊結(jié)束時(shí),文件會(huì)自動(dòng)關(guān)閉()。
A:對(duì)B:錯(cuò)
答案:對(duì)
JSON也就是JavaScript對(duì)象標(biāo)記()。
A:對(duì)B:錯(cuò)
答案:對(duì)
使調(diào)用dumps()方法將JSON字符串轉(zhuǎn)化為對(duì)象()。
A:對(duì)B:錯(cuò)
答案:錯(cuò)
使用readines()方法不可以把整個(gè)文件中的內(nèi)容進(jìn)行一次性讀?。ǎ?。
A:錯(cuò)B:對(duì)
答案:錯(cuò)
向文件中寫(xiě)入數(shù)據(jù),需要使用write方法()。
A:對(duì)B:錯(cuò)
答案:對(duì)
項(xiàng)目七測(cè)試
以下哪個(gè)技術(shù)不是Ajax技術(shù)體系的組成部分?()
A:CSS
B:DOM
C:XMLHttpRequest
D:DHTML
答案:DHTML
下列哪些方法或?qū)傩允荳eb標(biāo)準(zhǔn)中規(guī)定的?()
A:getElementsByTagName()
B:all()
C:innerHTML
D:innerText
答案:getElementsByTagName()
下列selenium庫(kù)的方法中,通過(guò)元素名稱定位的是()。
A:find_element_by_class_name
B:find_element_by_name
C:find_element_by_tag_name
D:find_element_by_id
答案:find_element_by_name
下面方法中,進(jìn)行瀏覽器頁(yè)面前進(jìn)的方法是()。
A:driver.go()
B:driver.back()
C:driver.refresh()
D:driver.forward()
答案:driver.forward()
關(guān)閉當(dāng)前頁(yè)面的方法是()
A:driver.back()
B:driver.close()
C:driver.forward()
D:driver.quit()
答案:driver.close()
Ajax不能實(shí)現(xiàn)頁(yè)面的交互()。
A:對(duì)B:錯(cuò)
答案:錯(cuò)
可以使用request向服務(wù)器發(fā)送請(qǐng)求,然后得到響應(yīng)()。
A:錯(cuò)B:對(duì)
答案:對(duì)
使用driver.get()方法可以得到網(wǎng)頁(yè)窗口的位置()。
A:對(duì)B:錯(cuò)
答案:錯(cuò)
使用Ajax解析內(nèi)容時(shí),得到響應(yīng)后,觸發(fā)onreadystatechange屬性對(duì)應(yīng)的方法()。
A:錯(cuò)B:對(duì)
答案:對(duì)
DOM操作,即對(duì)Document網(wǎng)頁(yè)文檔進(jìn)行操作,如更改、刪除等()。
A:錯(cuò)B:對(duì)
答案:對(duì)
項(xiàng)目八測(cè)試
下列不屬于Scrapy框架的基本組成部分的是()
A:ItemPipelines
B:引擎與調(diào)度器
C:下載器與Spiders
D:解析中間件
答案:引擎與調(diào)度器
下列對(duì)于Scrapy數(shù)據(jù)流向描述錯(cuò)誤的是()
A:調(diào)度器返回下一個(gè)要爬取的URL給引擎,引擎將URL通過(guò)下載器中間件(請(qǐng)求方向)轉(zhuǎn)發(fā)給下載器Download
B:一旦網(wǎng)頁(yè)下載完畢,下載器會(huì)生成一個(gè)該網(wǎng)頁(yè)的響應(yīng),并將其通過(guò)下載器中間件(返回響應(yīng)方向)發(fā)送給引擎
C:引擎僅負(fù)責(zé)打開(kāi)一個(gè)網(wǎng)站,并找到該網(wǎng)站的Spiders,并向該Spiders請(qǐng)求第一個(gè)要爬取的URL
D:Spiders處理響應(yīng)并返同爬取到的Items及(跟進(jìn)的)新的請(qǐng)求給引擎解析中間件
答案:Spiders處理響應(yīng)并返同爬取到的Items及(跟進(jìn)的)新的請(qǐng)求給引擎解析中間件
下列對(duì)于Scrapy常用命令及其作用描述正確的是()
A:startproject是一個(gè)全局命令,主要用于運(yùn)行一個(gè)獨(dú)立的爬蟲(chóng)
B:crawl是一個(gè)項(xiàng)目命令,主要用于啟動(dòng)限蟲(chóng)
C:genspider是一個(gè)項(xiàng)目命令,主要用于創(chuàng)建爬蟲(chóng)模板
D:List是一個(gè)全局命令,主要用于列出項(xiàng)目中所有可用的爬蟲(chóng)
答案:startproject是一個(gè)全局命令,主要用于運(yùn)行一個(gè)獨(dú)立的爬蟲(chóng)
下列對(duì)于Scrapy蟲(chóng)項(xiàng)目目錄說(shuō)法錯(cuò)誤的是()。
A:items腳本定義了一個(gè)Item類(lèi),能夠存儲(chǔ)爬取的數(shù)據(jù)
B:settings腳本用于設(shè)置參數(shù)
C:Spiders目錄用于
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國(guó)木材封邊熱熔膠市場(chǎng)調(diào)查研究報(bào)告
- 新疆工程學(xué)院《數(shù)學(xué)游戲與折紙》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年中國(guó)料斗秤數(shù)據(jù)監(jiān)測(cè)報(bào)告
- 2025年中國(guó)數(shù)字單相交流電流表數(shù)據(jù)監(jiān)測(cè)報(bào)告
- 2025-2030年中國(guó)一氧化碳行業(yè)運(yùn)行規(guī)劃及投資價(jià)值研究報(bào)告
- 新疆警察學(xué)院《地理信息科學(xué)專業(yè)英語(yǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 肇慶市實(shí)驗(yàn)中學(xué)高中歷史二教案:第課中國(guó)社會(huì)主義經(jīng)濟(jì)建設(shè)的曲折發(fā)展
- 2025-2030年中國(guó)PHA工業(yè)行業(yè)競(jìng)爭(zhēng)力發(fā)展研究及投資風(fēng)險(xiǎn)預(yù)測(cè)研究報(bào)告
- 新疆師范大學(xué)《中醫(yī)經(jīng)典臨床能力跟師實(shí)訓(xùn)(一)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年中國(guó)電腦程控全自動(dòng)壓線機(jī)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 保安服務(wù)標(biāo)準(zhǔn)及工作流程
- 2024年中考數(shù)學(xué)幾何模型歸納(全國(guó)通用):18 全等與相似模型之十字模型(學(xué)生版)
- 外科疾病分級(jí)目錄
- 國(guó)家級(jí)教學(xué)成果的培育提煉與申報(bào)
- 海南師范大學(xué)《高等數(shù)學(xué)》2020-2021期末試卷B
- 2023年09月黑龍江省大興安嶺地區(qū)“黑龍江人才周”校園引才活動(dòng)引進(jìn)90名人員筆試歷年難易錯(cuò)點(diǎn)考題薈萃附帶答案詳解
- 直播傭金直播合同帶貨
- 點(diǎn)凸焊操作工藝規(guī)程
- 跳頻通信系統(tǒng)課件
- 兼職駕駛員審批表
- 科學(xué)知識(shí)點(diǎn)(知識(shí)清單)五年級(jí)上冊(cè)科學(xué)粵教版
評(píng)論
0/150
提交評(píng)論