網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到期末考試答案章節(jié)答案2024年楊凌職業(yè)技術(shù)學(xué)院_第1頁
網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到期末考試答案章節(jié)答案2024年楊凌職業(yè)技術(shù)學(xué)院_第2頁
網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到期末考試答案章節(jié)答案2024年楊凌職業(yè)技術(shù)學(xué)院_第3頁
網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到期末考試答案章節(jié)答案2024年楊凌職業(yè)技術(shù)學(xué)院_第4頁
網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到期末考試答案章節(jié)答案2024年楊凌職業(yè)技術(shù)學(xué)院_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到期末考試答案+章節(jié)答案2024年楊凌職業(yè)技術(shù)學(xué)院mysql數(shù)據(jù)庫是非關(guān)系型數(shù)據(jù)庫。()

答案:錯(cuò)strong和b標(biāo)簽都可以實(shí)現(xiàn)加粗。()

答案:對在XPath中,“/bookstore/book/title|//price”該表達(dá)式用于選取屬于bookstore元素的book元素的所有title元素,以及文檔中所有的price元素。()

答案:對Selenium的webdriver的版本必須和瀏覽器的版本相對應(yīng)。()

答案:對Scrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)scrapy.cfg是Scrapy項(xiàng)目的配置文件,其內(nèi)定義了項(xiàng)目的配置文件路徑、部署相關(guān)信息等內(nèi)容。()

答案:對在HTTP超文本傳輸協(xié)議中規(guī)定了四種與服務(wù)器進(jìn)行交互的方式:GET、POST、PUT、DELETE。()

答案:對mysql數(shù)據(jù)庫是開源數(shù)據(jù)庫。()

答案:對Python關(guān)鍵字不可以作為變量名()

答案:對Session是以數(shù)組的形式通過Sessionid進(jìn)行檢索的在服務(wù)器端存儲(chǔ)的數(shù)據(jù)()

答案:錯(cuò)爬蟲是一種編程語言()

答案:錯(cuò)正則表達(dá)式使用的模塊名是re()

答案:對在HTTP超文本傳輸協(xié)議中規(guī)定了四種與服務(wù)器進(jìn)行交互的方式:GET,POST,?PUT和DELETE()

答案:對text-size屬性可以更改字體大小。()

答案:錯(cuò)錨點(diǎn)鏈接是超鏈接的一種。()

答案:對所有的HTML標(biāo)簽都包括開始標(biāo)簽和結(jié)束標(biāo)簽。()

答案:錯(cuò)分布式爬蟲則是將多臺(tái)主機(jī)組合起來,共同完成一個(gè)爬取任務(wù)()

答案:對requests庫中response.text與response.content方法使用功能相同。()

答案:錯(cuò)以下哪些是用Python語言編寫爬蟲腳本時(shí)可能會(huì)使用到的類庫()

答案:selenium###requests###re下列不屬于反爬蟲目的的是()。

答案:限制訪問人數(shù)###限制用戶訪問權(quán)限###變換網(wǎng)頁結(jié)構(gòu)下列屬于HTTP請求過程的是()。

答案:生成請求###超時(shí)設(shè)置###請求重定向下列關(guān)于函數(shù)調(diào)用的說法錯(cuò)誤的是()。

答案:函數(shù)調(diào)用可以出現(xiàn)在任意位置以下關(guān)于字典的說法,錯(cuò)誤的是()。

答案:字典的鍵允許重復(fù)下列選項(xiàng)中錯(cuò)誤的是()

答案:Python使用類似C語言中的大括號定義代碼塊以下哪項(xiàng)不屬于Python做爬蟲的優(yōu)勢()。

答案:代碼運(yùn)行效率高下列方法中,獲取網(wǎng)頁標(biāo)題的方法是()

答案:title可以正確引入matplotlib庫中的pyplot模塊的方式是()

答案:importmatplotlib.pyplotasplt關(guān)于open函數(shù)的操作模式,以下選項(xiàng)中哪一種既可以讀也可以寫()

答案:a+HTML的縮寫是()

答案:Hyper?Text?Markup?Languageprint(complex(2.5))的輸出結(jié)果是()。

答案:(2.5+0j)以下哪個(gè)不屬于HTTP協(xié)議的請求方式:()

答案:Push以下哪些是爬蟲技術(shù)可能存在風(fēng)險(xiǎn)()

答案:其他三項(xiàng)都是下列選項(xiàng)中,被稱為全網(wǎng)爬蟲的是()

答案:通用網(wǎng)絡(luò)爬蟲語句print(‘a(chǎn)’,1,2,“b”)的輸出結(jié)果是()。

答案:a12bCSS指的是()

答案:CascadingStyleSheets關(guān)于Python的控制結(jié)構(gòu)錯(cuò)誤的是()。

答案:只有在if語句中使用else子句才能實(shí)現(xiàn)2分支結(jié)構(gòu)下列選擇中錯(cuò)誤的是()。

答案:Python中字符采用單字節(jié)編碼下列選項(xiàng)中,不能創(chuàng)建元組的語句是()。

答案:tup=(2)###tup=[1,2,3]lxml的一個(gè)非常實(shí)用的功能就是自動(dòng)修正html代碼。()

答案:對Scrapy架構(gòu)中ItemPipeline項(xiàng)目管道,負(fù)責(zé)處理由蜘蛛從網(wǎng)頁中抽取的項(xiàng)目,它的主要任務(wù)是清洗、驗(yàn)證和存儲(chǔ)數(shù)據(jù)。()

答案:對Selenium中不支持使用xpath定位元素()

答案:錯(cuò)在XPath中,“//title[@lang]”該表達(dá)式用于選取所有擁有名為lang的屬性的title元素。()

答案:對在XPath中,“//book/title|//book/price”該表達(dá)式用于選取book元素的所有title和price元素。()

答案:對break語句只對最近的一層循環(huán)起作用。()

答案:對Scrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)middlewares.py:它定義SpiderMiddlewares和DownloaderMiddlewares的實(shí)現(xiàn)。()

答案:對在使用bs4庫調(diào)用find()方法查找節(jié)點(diǎn)時(shí),只能將字符串作為參數(shù)。()

答案:錯(cuò)color用于設(shè)置網(wǎng)頁的背景顏色。()

答案:錯(cuò)lxml庫中大部分的功能都位于lxml.etree模塊中,其中ElementTree可以理解為一個(gè)完整的XML文檔樹。()

答案:對lxml是一個(gè)基于ElementTree的python?API的XML解析庫()

答案:對狀態(tài)碼404代表“NOTFOUND”,認(rèn)為網(wǎng)頁已經(jīng)失效。()

答案:對縱向爬蟲主要面向大范圍精確信息的爬?。ǎ?/p>

答案:錯(cuò)Pyecharts可以繪制詞云圖()

答案:對以下關(guān)于API爬蟲哪些說法是正確的()

答案:使用爬蟲獲取豆瓣電影評分任務(wù)中,操作步驟一般是確定爬取鏈接讀取鏈接指向內(nèi)容抽取關(guān)鍵元素###基于API返回的結(jié)果通常會(huì)比較干凈下列關(guān)于Python的說法中,正確的是()

答案:Python是一門高級的計(jì)算機(jī)語言###Python是從ABC發(fā)展起來的###Python是一種代表簡單主義思想的計(jì)算機(jī)語言不符合Python變量命名規(guī)則的是()。

答案:5ab主要用于加密機(jī)制的協(xié)議是()

答案:SSLHTTP協(xié)議的服務(wù)端進(jìn)程的TCP端口號為()

答案:80在HTML上,將表單中input元素的type屬性值設(shè)置為()時(shí),用于創(chuàng)建重置按鈕。

答案:reset下列選取節(jié)點(diǎn)的表達(dá)式中,代表著從根節(jié)點(diǎn)開始選取的是()。

答案://使用matplotlib繪制散點(diǎn)圖,使用的函數(shù)是()

答案:scatter()表達(dá)式9%-2.0的計(jì)算結(jié)果是()。

答案:-1.0下列能夠設(shè)置文本加粗的CSS屬性值是()

答案:font-weight:bold下列關(guān)于JSON模塊描述錯(cuò)誤的是()。

答案:dump方法可生成一個(gè)字符串Scrapy架構(gòu)中DownloaderMiddlewares下載器中間件,位于引擎和下載器之間的鉤子框架,主要是處理引擎與下載器之間的請求及響應(yīng)。()

答案:對ajax的get請求和post請求基本無區(qū)別()

答案:錯(cuò)在一個(gè)字典中,不同鍵對應(yīng)的值是不重復(fù)的。()

答案:錯(cuò)訪問百度首頁必須使用post方法()

答案:錯(cuò)get方法比post方法快()

答案:對下列可用于python爬蟲開發(fā)的包有()

答案:Selenium###ScrapyPyQuery解析庫初始化有()形式

答案:字符串初始化###url初始化###文件初始化HTTPError是URLError的子類,專門用來處理HTTP請求錯(cuò)誤,比如認(rèn)證請求失敗等。它有3個(gè)屬性,下列選項(xiàng)都有哪些是它的屬性()。

答案:headers###reason###code網(wǎng)站的根目錄下有一個(gè)文件告訴爬蟲哪些內(nèi)容可以被爬取,這個(gè)文件叫做()

答案:robots.txt以下支持<select>多選的屬性是()

答案:multiple若要使表單數(shù)據(jù)以字符串的方式附加在網(wǎng)址的后面返回服務(wù)器端,必須將<form>標(biāo)簽的method屬性設(shè)置為()

答案:get下列哪一項(xiàng)不是標(biāo)準(zhǔn)的HTTP消息頭字段()

答案:Status下列哪種語言可以實(shí)現(xiàn)網(wǎng)頁交互功能()

答案:JavaScript在HTML中,()標(biāo)簽用于在網(wǎng)頁中創(chuàng)建表單。

答案:在插入圖片標(biāo)簽中,對插入的圖片進(jìn)行文字說明使用的屬性是()。

答案:alt開發(fā)爬蟲軟件最適合采用的語言是()

答案:Python關(guān)于session的使用,下列說法正確的是()

答案:不同的用戶窗口具有不同的session通過()屬性可以設(shè)置段落縮進(jìn)

答案:text-indentScrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)spiders:其內(nèi)包含一個(gè)個(gè)Spider的實(shí)現(xiàn),每個(gè)Spider都有一個(gè)文件。()

答案:對URL包含的信息指出文件的位置以及瀏覽器應(yīng)該怎么處理它,所有互聯(lián)網(wǎng)上的每個(gè)文件都有一個(gè)唯一的URL()

答案:對Open函數(shù)中a代表追加寫模式()

答案:對Matplotlib可以繪制柱狀圖()

答案:對Selenium中模擬鼠標(biāo)點(diǎn)擊的函數(shù)是send_keys()()

答案:錯(cuò)下列屬于常用反爬手段的是()。

答案:驗(yàn)證碼校驗(yàn)###賬號權(quán)限###反爬頻度下列屬于常見爬蟲類型的是()。

答案:增量式網(wǎng)絡(luò)爬蟲###通用網(wǎng)絡(luò)爬蟲###聚焦網(wǎng)絡(luò)爬蟲select語句的完整語法比較復(fù)雜,但至少包括的部分是()。

答案:select,from用()符號可以在段落的首行插入空格

答案:針對HTML/XML的解析庫,下列選項(xiàng)中不正確的是()。

答案:JSONPath向數(shù)據(jù)表中插入一條記錄用以下哪一項(xiàng)()。

答案:insert在JavaScript中,下列表示返回函數(shù)計(jì)算結(jié)果的語句是()

答案:document.write(number);網(wǎng)頁是由html代碼組成的,以下選項(xiàng)中哪一項(xiàng)是html代碼()

答案:不能作為Python變量的是()。

答案:5bit設(shè)置text-decoration屬性的刪除線的值是()

答案:underline瀏覽器開發(fā)者工具不能做到的是()

答案:模擬鼠標(biāo)點(diǎn)擊request.get(url)包括兩個(gè)(對象)請求,其中一個(gè)為Request請求,即向服務(wù)器請求資源的request對象,第二個(gè)是Response請求,即包含從服務(wù)器返回的所有資源()

答案:對Python3.x版本代碼不能兼容Python2.x。()

答案:對超鏈接目標(biāo)窗口默認(rèn)的打開方式為_self。()

答案:對下列關(guān)于Xpah中功能函數(shù)描述正確的是()

答案:text函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點(diǎn)###text函數(shù)可提取節(jié)點(diǎn)文本內(nèi)容###and方法可用于選取同時(shí)包含兩種指定值的節(jié)點(diǎn)Scrapy框架主要由五大組件組成,下列選項(xiàng)正確的是()

答案:Scrapy引擎(ScrapyEngine)###爬蟲(Spider)和實(shí)體管道(ItemPipeline)###下載器(Downloader)###調(diào)度器(Scheduler)以下選項(xiàng)中不是Python對文件的寫操作方法的是()

答案:writetext關(guān)于Python文件處理,以下選項(xiàng)描述錯(cuò)誤的是()

答案:Python不可以處理PDF文件針對不同的網(wǎng)頁解析技術(shù),Python分別提供了不同的模塊或者庫來支持,下列選項(xiàng)不正確的是()。

答案:正則表達(dá)式對應(yīng)requests庫下列關(guān)于Python語言特點(diǎn)的說法中,錯(cuò)誤的是()。

答案:Python語言是非開源語言下列關(guān)于列表的操作的說法錯(cuò)誤的是()。

答案:clear()方法刪除列表的最后一個(gè)元素下列關(guān)于Python函數(shù)的說法錯(cuò)誤的是()。

答案:每次調(diào)用函數(shù)提供參數(shù)的數(shù)據(jù)類型必須相同在HTML中,可以使用()標(biāo)記向網(wǎng)頁中插入GIF動(dòng)畫文件。

答案:requests庫中response.text與response.content方法都是來獲取response中的數(shù)據(jù)信息。()

答案:對使用BS庫提取網(wǎng)頁信息的方式為BS對象.節(jié)點(diǎn).屬性。()

答案:對爬蟲必須用python編寫()

答案:錯(cuò)在XPath中,“/bookstore/book[1]”該表達(dá)式用于選取屬于bookstore子元素的第一個(gè)book元素。()

答案:對GET請求和POST請求的區(qū)別有哪些()

答案:數(shù)據(jù)承載大小的不同###安全###信息獲取一致性以下選項(xiàng)中合法的是()

答案:爬取百度的搜索結(jié)果http狀態(tài)碼中表示訪問成功的是()

答案:200下列選項(xiàng)中、不能用于實(shí)現(xiàn)Python語言基本控制結(jié)構(gòu)的是()。

答案:goto語句下列不是浮點(diǎn)數(shù)常量的是()。

答案:1.0f25下列設(shè)置“上邊距:20px、下邊距:30px、左邊距:40px、右邊距:50px”邊距屬性正確的是()

答案:margin:20px50px30px40pxScrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)settings.py:它定義項(xiàng)目的全局配置。()

答案:對Scrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)pipelines.py:它定義ItemPipeline的實(shí)現(xiàn),所有的ItemPipeline的實(shí)現(xiàn)都可以放這里。()

答案:對在XPath中,“/bookstore/*”該表達(dá)式用于選取bookstore元素的所有子元素。()

答案:對使用matpltlib繪制柱狀圖,若希望柱子有兩種顏色,以下選項(xiàng)中正確是()

答案:color=[‘r’,‘y’]關(guān)于Python語言的變量,下列說法正確的是()。

答案:先賦值、后使用下列選項(xiàng)中,不是Python語言保留字的是()

答案:endforHTML使用()來描述網(wǎng)頁。()

答案:標(biāo)記標(biāo)簽Scrapy整個(gè)框架的核心是()

答案:引擎狀態(tài)碼403代表“Forbidden”,認(rèn)為網(wǎng)頁目前禁止訪問。()

答案:對Response類用于動(dòng)態(tài)地響應(yīng)客戶端的請求,屬性encoding和apparent_encoding是一樣的功能。()

答案:錯(cuò)http協(xié)議翻譯為中文是超文本傳輸協(xié)議()

答案:對下列selenium庫的定位方法中,通過元素id進(jìn)行定位的方法是()

答案:find_element_by_id()以下選項(xiàng)中屬于算法性質(zhì)的有()。

答案:可行性###有輸出###確定性###有窮性###有輸入Requests模塊不能做到()

答案:打開瀏覽器String類中的getBytes()方法的作用是()

答案:將字符串變成字節(jié)數(shù)組若要獲取節(jié)點(diǎn)的名稱,不可以通過tag屬性獲取。()

答案:錯(cuò)matplotlib中繪制圖形,通過更改繪圖框的尺寸來設(shè)置相等的縮放比例的參數(shù)是()

答案:'scaled'當(dāng)訪問web網(wǎng)站的某個(gè)頁面資源不存在時(shí),將會(huì)出現(xiàn)的狀態(tài)碼是()

答案:404通用爬蟲用于將互聯(lián)網(wǎng)上的網(wǎng)頁下載到本地,形成一個(gè)互聯(lián)網(wǎng)內(nèi)容的鏡像備份。()

答案:對Python的注釋有幾種?()

答案:2SQL語句中的條件用以下哪一項(xiàng)來表達(dá)()。

答案:where在HTML中,下列標(biāo)簽中的()標(biāo)簽在標(biāo)記的位置強(qiáng)制換行。

答案:關(guān)于Element類的相關(guān)操作,主要可分為三個(gè)部分,分別是節(jié)點(diǎn)操作、節(jié)點(diǎn)屬性的操作、節(jié)點(diǎn)內(nèi)文本的操作。()

答案:對HTML表格在默認(rèn)情況下沒有邊框。()

答案:對

答案:創(chuàng)建一個(gè)下拉菜單www服務(wù)中Web頁面應(yīng)符合()規(guī)范

答案:HTMLPython語言提供的3種基本數(shù)字類型是()。

答案:int、float、complexAjax的get請求和post請求基本無區(qū)別。()

答案:錯(cuò)Cookie存儲(chǔ)了客戶端的一些重要信息,例如身份標(biāo)識(shí)、所在地區(qū)等,通常是一個(gè)文本文件。在向服務(wù)器發(fā)送URL請求時(shí),可以將文件內(nèi)容讀出,附加在HTTP的請求頭中,可以免去用戶輸入信息的麻煩()

答案:對a:hover表示超鏈接文字在鼠標(biāo)按下時(shí)的狀態(tài)。()

答案:錯(cuò)http協(xié)議中有g(shù)et方法和post方法()

答案:對“參數(shù)說明”表示該API可以接收和發(fā)送的參數(shù)名稱和類型()

答案:對驗(yàn)證碼是一種用來區(qū)分計(jì)算機(jī)行為和人類行為的測試程序()

答案:對Matplotlib默認(rèn)支持中文()

答案:錯(cuò)在XPath中,“/bookstore/book[price>35.00]”該表達(dá)式用于選取bookstore元素的所有book元素,且其中的price元素的值須大于35.00。()

答案:對在列表中不能嵌套另一個(gè)列表。()

答案:錯(cuò)Python中使用open函數(shù)將圖片寫入硬盤,其操作模式為“wb”()

答案:對get方法相比post方法能攜帶更多信息()

答案:錯(cuò)Scrapy架構(gòu)中SpiderMiddlewares蜘蛛中間件,位于引擎和蜘蛛之間的鉤子框架,主要工作是處理蜘蛛輸入的響應(yīng)和輸出的結(jié)果及新的請求。()

答案:對requests庫中的requests.get(url,timeout=2)方法中,timeout參數(shù)可以實(shí)現(xiàn)超過該參數(shù)設(shè)定的秒數(shù)后,程序停止等待。()

答案:對Python循環(huán)結(jié)構(gòu)有while語句、for語句。()

答案:對在列表中不能嵌套另一個(gè)列表()

答案:錯(cuò)創(chuàng)建BeautifulSoup類實(shí)例時(shí),如果沒有明確指定解析器,那么該實(shí)例肯定會(huì)選擇Python標(biāo)準(zhǔn)庫。()

答案:錯(cuò)Python集合可以包含相同的元素()

答案:錯(cuò)raise_for_status()在方法內(nèi)部判斷狀態(tài)碼是否等于200,需要增加額外的if語句。()

答案:錯(cuò)網(wǎng)站中的robots.txt可以無視()

答案:錯(cuò)Scrapy架構(gòu)中Spiders蜘蛛,其內(nèi)定義了爬取的邏輯和網(wǎng)頁的解析規(guī)則,它主要負(fù)責(zé)解析響應(yīng)并生成提取結(jié)果和新的請求。()

答案:對BS庫中的解析器有()

答案:lxml###html5lib###html.parser###xml爬蟲分類可分為()

答案:通用爬蟲###聚焦爬蟲###增量式爬蟲下列關(guān)于HTTP狀態(tài)碼類型描述正確的是()。

答案:5XX表示服務(wù)器可能發(fā)生錯(cuò)誤###4XX表示客戶端可能發(fā)生錯(cuò)誤###3XX表示客戶端的請求需采取進(jìn)一步操作BS庫的基本元素包含下列選項(xiàng)中哪些選項(xiàng)()

答案:comment###name###tag下列屬于聚焦網(wǎng)絡(luò)爬蟲的常用策略的是()。

答案:基于內(nèi)容評價(jià)的爬取策略###基于鏈接結(jié)構(gòu)評價(jià)的爬取策略###基于語境圖的爬取策略以下哪個(gè)技術(shù)不是Ajax技術(shù)體系的組成部分()

答案:DHTML下列選項(xiàng)中,屬于結(jié)構(gòu)化數(shù)據(jù)的是()。

答案:JSON關(guān)于Python語言的浮點(diǎn)數(shù)類型的說法錯(cuò)誤的是()。

答案:小數(shù)部分不可以為0下列選項(xiàng)中為True的是()。

答案:‘a(chǎn)bcd’<‘a(chǎn)d’下列關(guān)于Python循環(huán)結(jié)構(gòu)的說法中,錯(cuò)誤的是()。

答案:continue語句可用于跳出當(dāng)前層次的循環(huán)以下標(biāo)記中用于設(shè)置內(nèi)部樣式表的標(biāo)簽是()

答案:<style>想要使用戶在單擊超鏈接時(shí),彈出一個(gè)新的網(wǎng)頁窗口,代碼是()。

答案:<ahref="right.html"target="_blank">新聞</a>

答案:解釋執(zhí)行JavaScript的是()

答案:瀏覽器以下關(guān)于列表標(biāo)簽說法錯(cuò)誤的是()

答案:<li>嵌套列表Ajax中基本請求方式是什么()

答案:getRequests模塊中,headers參數(shù)的作用是()

答案:模擬瀏覽器設(shè)有語句s=“HelloPython”,則可以輸出“Python”字符串的是()。

答案:print(s[6:])一個(gè)網(wǎng)址中的HOST實(shí)際上是一個(gè)()

答案:IP地址BeautifulSoup支持python標(biāo)準(zhǔn)庫的HTML解析器,還支持一些第三方解析器,下列哪個(gè)不是常用的解析器?()。

答案:URLPython語言是面向?qū)ο蟮膒rint(len(“Python”))的輸出結(jié)果是()。

答案:6在HTTP協(xié)議中,用于發(fā)送大量數(shù)據(jù)的方法是()

答案:post查詢表結(jié)構(gòu)用以下哪一項(xiàng)()。

答案:descScrapy架構(gòu)中Downloader下載器,用于下載網(wǎng)頁內(nèi)容,并將網(wǎng)頁內(nèi)容返回給蜘蛛。()

答案:對Scrapy架構(gòu)中Engine引擎,用來處理整個(gè)系統(tǒng)的數(shù)據(jù)流處理,觸發(fā)事務(wù),是整個(gè)框架的核心。()

答案:對Scrapy架構(gòu)中Item項(xiàng)目,它定義了爬取結(jié)果的數(shù)據(jù)結(jié)構(gòu),爬取的數(shù)據(jù)會(huì)被賦值成該對象。()

答案:對Scrapy架構(gòu)中Scheduler調(diào)度器,用來接受引擎發(fā)過來的請求并加入隊(duì)列中,并在引擎再次請求的時(shí)候提供給引擎。()

答案:對Scrapy是一個(gè)為了爬取網(wǎng)站數(shù)據(jù),提取結(jié)構(gòu)性數(shù)據(jù)而編寫的應(yīng)用框架,我們只需要實(shí)現(xiàn)少量的代碼,就能夠快速的抓取。()

答案:對下列對于Scrapy蟲項(xiàng)目目錄說法錯(cuò)誤的是()。

答案:items腳本定義了一個(gè)Item類,能夠存儲(chǔ)爬取的數(shù)據(jù)下列對于Scrapy的設(shè)置說法錯(cuò)誤的是()

答案:DOWNLOADER_MIDDLEWARES設(shè)置能夠激活用戶定制的下載器中間件下列對于Scrapy常用命令及其作用描述正確的是()

答案:startproject是一個(gè)全局命令,主要用于運(yùn)行一個(gè)獨(dú)立的爬蟲下列不屬于Scrapy框架的基本組成部分的是()

答案:引擎與調(diào)度器下列對于Scrapy數(shù)據(jù)流向描述錯(cuò)誤的是()

答案:Spiders處理響應(yīng)并返同爬取到的Items及(跟進(jìn)的)新的請求給引擎解析中間件下列selenium庫的方法中,通過元素名稱定位的是()。

答案:find_element_by_name使用Ajax解析內(nèi)容時(shí),得到響應(yīng)后,觸發(fā)onreadystatechange屬性對應(yīng)的方法()。

答案:對DOM操作,即對Document網(wǎng)頁文檔進(jìn)行操作,如更改、刪除等()。

答案:對下面方法中,進(jìn)行瀏覽器頁面前進(jìn)的方法是()。

答案:driver.forward()使用driver.get()方法可以得到網(wǎng)頁窗口的位置()。

答案:錯(cuò)可以使用request向服務(wù)器發(fā)送請求,然后得到響應(yīng)()。

答案:對Ajax不能實(shí)現(xiàn)頁面的交互()。

答案:錯(cuò)以下哪個(gè)技術(shù)不是Ajax技術(shù)體系的組成部分?()

答案:DHTML關(guān)閉當(dāng)前頁面的方法是()

答案:driver.close()下列哪些方法或?qū)傩允荳eb標(biāo)準(zhǔn)中規(guī)定的?()

答案:getElementsByTagName()改變文件目錄所用的方法是()。

答案:chdir()使用withas語法。在with控制塊結(jié)束時(shí),文件會(huì)自動(dòng)關(guān)閉()。

答案:對向文件中寫入數(shù)據(jù),需要使用write方法()。

答案:對使用readines()方法不可以把整個(gè)文件中的內(nèi)容進(jìn)行一次性讀?。ǎ?。

答案:錯(cuò)文件刪除所用的方法是()

答案:remove()使用以下哪個(gè)函數(shù)可以打開一個(gè)已經(jīng)存在的文件?()

答案:open使調(diào)用dumps()方法將JSON字符串轉(zhuǎn)化為對象()。

答案:錯(cuò)以二進(jìn)制格式打開一個(gè)文件用于追加的訪問模式為()。

答案:abJSON也就是JavaScript對象標(biāo)記()。

答案:對文件訪問的默認(rèn)模式為()。

答案:r下列不屬于HTTP請求過程的是()。

答案:搜索文檔對服務(wù)器端來說,它返回給客戶端的數(shù)據(jù)格式可分為非結(jié)構(gòu)化和結(jié)構(gòu)化兩種。()

答案:對XPath是一門在XML文檔中查找信息的語言。XPath可用來在XML文檔中對元素和屬性進(jìn)行遍歷。()

答案:對正則表達(dá)式、XPath和BeautifulSoup都是基于HTML/XML文檔的層次結(jié)構(gòu)來確定到達(dá)指定節(jié)點(diǎn)的路徑。()

答案:錯(cuò)下列關(guān)于Beautifulsoup中對象類型描述錯(cuò)誤的是()

答案:attrs方法可獲取Tag對象的HTML屬性,返回值為列表形式網(wǎng)頁中的非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型,不方便使用數(shù)據(jù)庫二維邏輯來表現(xiàn)的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖像等。()

答案:對下列選項(xiàng)中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是:()

答案:圖像結(jié)構(gòu)化數(shù)據(jù)就是能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,具有模式的數(shù)據(jù),包括HTML、XML和JSON等。()

答案:對下列關(guān)于Chrome開發(fā)者工具描述錯(cuò)誤的是()

答案:網(wǎng)絡(luò)面板無法查看HTML源碼下列關(guān)于Xpah中功能函數(shù)描述錯(cuò)誤的是()

答案:contains方法可用于選取以指定值開頭的節(jié)點(diǎn)HTTPError是URLError的子類,專門用來處理HTTP請求錯(cuò)誤,比如認(rèn)證請求失敗等。它有3個(gè)屬性,下列選項(xiàng)哪一個(gè)不是它的屬性()。

答案:Response下列屬于HTTP必須實(shí)現(xiàn)的請求方法的是()。

答案:GET與HEADResponse類用于動(dòng)態(tài)地響應(yīng)客戶端的請求,控制發(fā)送給用戶的信息,并且將動(dòng)態(tài)地生成響應(yīng),包括狀態(tài)碼、網(wǎng)頁的內(nèi)容等。()

答案:對通過加入特定的____,可以將爬蟲發(fā)出的請求偽裝成瀏覽器。()

答案:User_Agent如果訪問某網(wǎng)站的頻率太高,則這個(gè)網(wǎng)站可能會(huì)禁止訪問。()

答案:對requests庫中的requests.get(url)方法中包括兩個(gè)(對象)請求,其中一個(gè)為Request請求,即向服務(wù)器請求資源的request對象,第二個(gè)是R

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論