




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到期末考試答案+章節(jié)答案2024年楊凌職業(yè)技術(shù)學(xué)院mysql數(shù)據(jù)庫是非關(guān)系型數(shù)據(jù)庫。()
答案:錯(cuò)strong和b標(biāo)簽都可以實(shí)現(xiàn)加粗。()
答案:對在XPath中,“/bookstore/book/title|//price”該表達(dá)式用于選取屬于bookstore元素的book元素的所有title元素,以及文檔中所有的price元素。()
答案:對Selenium的webdriver的版本必須和瀏覽器的版本相對應(yīng)。()
答案:對Scrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)scrapy.cfg是Scrapy項(xiàng)目的配置文件,其內(nèi)定義了項(xiàng)目的配置文件路徑、部署相關(guān)信息等內(nèi)容。()
答案:對在HTTP超文本傳輸協(xié)議中規(guī)定了四種與服務(wù)器進(jìn)行交互的方式:GET、POST、PUT、DELETE。()
答案:對mysql數(shù)據(jù)庫是開源數(shù)據(jù)庫。()
答案:對Python關(guān)鍵字不可以作為變量名()
答案:對Session是以數(shù)組的形式通過Sessionid進(jìn)行檢索的在服務(wù)器端存儲(chǔ)的數(shù)據(jù)()
答案:錯(cuò)爬蟲是一種編程語言()
答案:錯(cuò)正則表達(dá)式使用的模塊名是re()
答案:對在HTTP超文本傳輸協(xié)議中規(guī)定了四種與服務(wù)器進(jìn)行交互的方式:GET,POST,?PUT和DELETE()
答案:對text-size屬性可以更改字體大小。()
答案:錯(cuò)錨點(diǎn)鏈接是超鏈接的一種。()
答案:對所有的HTML標(biāo)簽都包括開始標(biāo)簽和結(jié)束標(biāo)簽。()
答案:錯(cuò)分布式爬蟲則是將多臺(tái)主機(jī)組合起來,共同完成一個(gè)爬取任務(wù)()
答案:對requests庫中response.text與response.content方法使用功能相同。()
答案:錯(cuò)以下哪些是用Python語言編寫爬蟲腳本時(shí)可能會(huì)使用到的類庫()
答案:selenium###requests###re下列不屬于反爬蟲目的的是()。
答案:限制訪問人數(shù)###限制用戶訪問權(quán)限###變換網(wǎng)頁結(jié)構(gòu)下列屬于HTTP請求過程的是()。
答案:生成請求###超時(shí)設(shè)置###請求重定向下列關(guān)于函數(shù)調(diào)用的說法錯(cuò)誤的是()。
答案:函數(shù)調(diào)用可以出現(xiàn)在任意位置以下關(guān)于字典的說法,錯(cuò)誤的是()。
答案:字典的鍵允許重復(fù)下列選項(xiàng)中錯(cuò)誤的是()
答案:Python使用類似C語言中的大括號定義代碼塊以下哪項(xiàng)不屬于Python做爬蟲的優(yōu)勢()。
答案:代碼運(yùn)行效率高下列方法中,獲取網(wǎng)頁標(biāo)題的方法是()
答案:title可以正確引入matplotlib庫中的pyplot模塊的方式是()
答案:importmatplotlib.pyplotasplt關(guān)于open函數(shù)的操作模式,以下選項(xiàng)中哪一種既可以讀也可以寫()
答案:a+HTML的縮寫是()
答案:Hyper?Text?Markup?Languageprint(complex(2.5))的輸出結(jié)果是()。
答案:(2.5+0j)以下哪個(gè)不屬于HTTP協(xié)議的請求方式:()
答案:Push以下哪些是爬蟲技術(shù)可能存在風(fēng)險(xiǎn)()
答案:其他三項(xiàng)都是下列選項(xiàng)中,被稱為全網(wǎng)爬蟲的是()
答案:通用網(wǎng)絡(luò)爬蟲語句print(‘a(chǎn)’,1,2,“b”)的輸出結(jié)果是()。
答案:a12bCSS指的是()
答案:CascadingStyleSheets關(guān)于Python的控制結(jié)構(gòu)錯(cuò)誤的是()。
答案:只有在if語句中使用else子句才能實(shí)現(xiàn)2分支結(jié)構(gòu)下列選擇中錯(cuò)誤的是()。
答案:Python中字符采用單字節(jié)編碼下列選項(xiàng)中,不能創(chuàng)建元組的語句是()。
答案:tup=(2)###tup=[1,2,3]lxml的一個(gè)非常實(shí)用的功能就是自動(dòng)修正html代碼。()
答案:對Scrapy架構(gòu)中ItemPipeline項(xiàng)目管道,負(fù)責(zé)處理由蜘蛛從網(wǎng)頁中抽取的項(xiàng)目,它的主要任務(wù)是清洗、驗(yàn)證和存儲(chǔ)數(shù)據(jù)。()
答案:對Selenium中不支持使用xpath定位元素()
答案:錯(cuò)在XPath中,“//title[@lang]”該表達(dá)式用于選取所有擁有名為lang的屬性的title元素。()
答案:對在XPath中,“//book/title|//book/price”該表達(dá)式用于選取book元素的所有title和price元素。()
答案:對break語句只對最近的一層循環(huán)起作用。()
答案:對Scrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)middlewares.py:它定義SpiderMiddlewares和DownloaderMiddlewares的實(shí)現(xiàn)。()
答案:對在使用bs4庫調(diào)用find()方法查找節(jié)點(diǎn)時(shí),只能將字符串作為參數(shù)。()
答案:錯(cuò)color用于設(shè)置網(wǎng)頁的背景顏色。()
答案:錯(cuò)lxml庫中大部分的功能都位于lxml.etree模塊中,其中ElementTree可以理解為一個(gè)完整的XML文檔樹。()
答案:對lxml是一個(gè)基于ElementTree的python?API的XML解析庫()
答案:對狀態(tài)碼404代表“NOTFOUND”,認(rèn)為網(wǎng)頁已經(jīng)失效。()
答案:對縱向爬蟲主要面向大范圍精確信息的爬?。ǎ?/p>
答案:錯(cuò)Pyecharts可以繪制詞云圖()
答案:對以下關(guān)于API爬蟲哪些說法是正確的()
答案:使用爬蟲獲取豆瓣電影評分任務(wù)中,操作步驟一般是確定爬取鏈接讀取鏈接指向內(nèi)容抽取關(guān)鍵元素###基于API返回的結(jié)果通常會(huì)比較干凈下列關(guān)于Python的說法中,正確的是()
答案:Python是一門高級的計(jì)算機(jī)語言###Python是從ABC發(fā)展起來的###Python是一種代表簡單主義思想的計(jì)算機(jī)語言不符合Python變量命名規(guī)則的是()。
答案:5ab主要用于加密機(jī)制的協(xié)議是()
答案:SSLHTTP協(xié)議的服務(wù)端進(jìn)程的TCP端口號為()
答案:80在HTML上,將表單中input元素的type屬性值設(shè)置為()時(shí),用于創(chuàng)建重置按鈕。
答案:reset下列選取節(jié)點(diǎn)的表達(dá)式中,代表著從根節(jié)點(diǎn)開始選取的是()。
答案://使用matplotlib繪制散點(diǎn)圖,使用的函數(shù)是()
答案:scatter()表達(dá)式9%-2.0的計(jì)算結(jié)果是()。
答案:-1.0下列能夠設(shè)置文本加粗的CSS屬性值是()
答案:font-weight:bold下列關(guān)于JSON模塊描述錯(cuò)誤的是()。
答案:dump方法可生成一個(gè)字符串Scrapy架構(gòu)中DownloaderMiddlewares下載器中間件,位于引擎和下載器之間的鉤子框架,主要是處理引擎與下載器之間的請求及響應(yīng)。()
答案:對ajax的get請求和post請求基本無區(qū)別()
答案:錯(cuò)在一個(gè)字典中,不同鍵對應(yīng)的值是不重復(fù)的。()
答案:錯(cuò)訪問百度首頁必須使用post方法()
答案:錯(cuò)get方法比post方法快()
答案:對下列可用于python爬蟲開發(fā)的包有()
答案:Selenium###ScrapyPyQuery解析庫初始化有()形式
答案:字符串初始化###url初始化###文件初始化HTTPError是URLError的子類,專門用來處理HTTP請求錯(cuò)誤,比如認(rèn)證請求失敗等。它有3個(gè)屬性,下列選項(xiàng)都有哪些是它的屬性()。
答案:headers###reason###code網(wǎng)站的根目錄下有一個(gè)文件告訴爬蟲哪些內(nèi)容可以被爬取,這個(gè)文件叫做()
答案:robots.txt以下支持<select>多選的屬性是()
答案:multiple若要使表單數(shù)據(jù)以字符串的方式附加在網(wǎng)址的后面返回服務(wù)器端,必須將<form>標(biāo)簽的method屬性設(shè)置為()
答案:get下列哪一項(xiàng)不是標(biāo)準(zhǔn)的HTTP消息頭字段()
答案:Status下列哪種語言可以實(shí)現(xiàn)網(wǎng)頁交互功能()
答案:JavaScript在HTML中,()標(biāo)簽用于在網(wǎng)頁中創(chuàng)建表單。
答案:在插入圖片標(biāo)簽中,對插入的圖片進(jìn)行文字說明使用的屬性是()。
答案:alt開發(fā)爬蟲軟件最適合采用的語言是()
答案:Python關(guān)于session的使用,下列說法正確的是()
答案:不同的用戶窗口具有不同的session通過()屬性可以設(shè)置段落縮進(jìn)
答案:text-indentScrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)spiders:其內(nèi)包含一個(gè)個(gè)Spider的實(shí)現(xiàn),每個(gè)Spider都有一個(gè)文件。()
答案:對URL包含的信息指出文件的位置以及瀏覽器應(yīng)該怎么處理它,所有互聯(lián)網(wǎng)上的每個(gè)文件都有一個(gè)唯一的URL()
答案:對Open函數(shù)中a代表追加寫模式()
答案:對Matplotlib可以繪制柱狀圖()
答案:對Selenium中模擬鼠標(biāo)點(diǎn)擊的函數(shù)是send_keys()()
答案:錯(cuò)下列屬于常用反爬手段的是()。
答案:驗(yàn)證碼校驗(yàn)###賬號權(quán)限###反爬頻度下列屬于常見爬蟲類型的是()。
答案:增量式網(wǎng)絡(luò)爬蟲###通用網(wǎng)絡(luò)爬蟲###聚焦網(wǎng)絡(luò)爬蟲select語句的完整語法比較復(fù)雜,但至少包括的部分是()。
答案:select,from用()符號可以在段落的首行插入空格
答案:針對HTML/XML的解析庫,下列選項(xiàng)中不正確的是()。
答案:JSONPath向數(shù)據(jù)表中插入一條記錄用以下哪一項(xiàng)()。
答案:insert在JavaScript中,下列表示返回函數(shù)計(jì)算結(jié)果的語句是()
答案:document.write(number);網(wǎng)頁是由html代碼組成的,以下選項(xiàng)中哪一項(xiàng)是html代碼()
答案:不能作為Python變量的是()。
答案:5bit設(shè)置text-decoration屬性的刪除線的值是()
答案:underline瀏覽器開發(fā)者工具不能做到的是()
答案:模擬鼠標(biāo)點(diǎn)擊request.get(url)包括兩個(gè)(對象)請求,其中一個(gè)為Request請求,即向服務(wù)器請求資源的request對象,第二個(gè)是Response請求,即包含從服務(wù)器返回的所有資源()
答案:對Python3.x版本代碼不能兼容Python2.x。()
答案:對超鏈接目標(biāo)窗口默認(rèn)的打開方式為_self。()
答案:對下列關(guān)于Xpah中功能函數(shù)描述正確的是()
答案:text函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點(diǎn)###text函數(shù)可提取節(jié)點(diǎn)文本內(nèi)容###and方法可用于選取同時(shí)包含兩種指定值的節(jié)點(diǎn)Scrapy框架主要由五大組件組成,下列選項(xiàng)正確的是()
答案:Scrapy引擎(ScrapyEngine)###爬蟲(Spider)和實(shí)體管道(ItemPipeline)###下載器(Downloader)###調(diào)度器(Scheduler)以下選項(xiàng)中不是Python對文件的寫操作方法的是()
答案:writetext關(guān)于Python文件處理,以下選項(xiàng)描述錯(cuò)誤的是()
答案:Python不可以處理PDF文件針對不同的網(wǎng)頁解析技術(shù),Python分別提供了不同的模塊或者庫來支持,下列選項(xiàng)不正確的是()。
答案:正則表達(dá)式對應(yīng)requests庫下列關(guān)于Python語言特點(diǎn)的說法中,錯(cuò)誤的是()。
答案:Python語言是非開源語言下列關(guān)于列表的操作的說法錯(cuò)誤的是()。
答案:clear()方法刪除列表的最后一個(gè)元素下列關(guān)于Python函數(shù)的說法錯(cuò)誤的是()。
答案:每次調(diào)用函數(shù)提供參數(shù)的數(shù)據(jù)類型必須相同在HTML中,可以使用()標(biāo)記向網(wǎng)頁中插入GIF動(dòng)畫文件。
答案:requests庫中response.text與response.content方法都是來獲取response中的數(shù)據(jù)信息。()
答案:對使用BS庫提取網(wǎng)頁信息的方式為BS對象.節(jié)點(diǎn).屬性。()
答案:對爬蟲必須用python編寫()
答案:錯(cuò)在XPath中,“/bookstore/book[1]”該表達(dá)式用于選取屬于bookstore子元素的第一個(gè)book元素。()
答案:對GET請求和POST請求的區(qū)別有哪些()
答案:數(shù)據(jù)承載大小的不同###安全###信息獲取一致性以下選項(xiàng)中合法的是()
答案:爬取百度的搜索結(jié)果http狀態(tài)碼中表示訪問成功的是()
答案:200下列選項(xiàng)中、不能用于實(shí)現(xiàn)Python語言基本控制結(jié)構(gòu)的是()。
答案:goto語句下列不是浮點(diǎn)數(shù)常量的是()。
答案:1.0f25下列設(shè)置“上邊距:20px、下邊距:30px、左邊距:40px、右邊距:50px”邊距屬性正確的是()
答案:margin:20px50px30px40pxScrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)settings.py:它定義項(xiàng)目的全局配置。()
答案:對Scrapy框架是通過命令行來創(chuàng)建項(xiàng)目的,代碼的編寫還是需要IDE。項(xiàng)目創(chuàng)建之后,項(xiàng)目文件結(jié)構(gòu)pipelines.py:它定義ItemPipeline的實(shí)現(xiàn),所有的ItemPipeline的實(shí)現(xiàn)都可以放這里。()
答案:對在XPath中,“/bookstore/*”該表達(dá)式用于選取bookstore元素的所有子元素。()
答案:對使用matpltlib繪制柱狀圖,若希望柱子有兩種顏色,以下選項(xiàng)中正確是()
答案:color=[‘r’,‘y’]關(guān)于Python語言的變量,下列說法正確的是()。
答案:先賦值、后使用下列選項(xiàng)中,不是Python語言保留字的是()
答案:endforHTML使用()來描述網(wǎng)頁。()
答案:標(biāo)記標(biāo)簽Scrapy整個(gè)框架的核心是()
答案:引擎狀態(tài)碼403代表“Forbidden”,認(rèn)為網(wǎng)頁目前禁止訪問。()
答案:對Response類用于動(dòng)態(tài)地響應(yīng)客戶端的請求,屬性encoding和apparent_encoding是一樣的功能。()
答案:錯(cuò)http協(xié)議翻譯為中文是超文本傳輸協(xié)議()
答案:對下列selenium庫的定位方法中,通過元素id進(jìn)行定位的方法是()
答案:find_element_by_id()以下選項(xiàng)中屬于算法性質(zhì)的有()。
答案:可行性###有輸出###確定性###有窮性###有輸入Requests模塊不能做到()
答案:打開瀏覽器String類中的getBytes()方法的作用是()
答案:將字符串變成字節(jié)數(shù)組若要獲取節(jié)點(diǎn)的名稱,不可以通過tag屬性獲取。()
答案:錯(cuò)matplotlib中繪制圖形,通過更改繪圖框的尺寸來設(shè)置相等的縮放比例的參數(shù)是()
答案:'scaled'當(dāng)訪問web網(wǎng)站的某個(gè)頁面資源不存在時(shí),將會(huì)出現(xiàn)的狀態(tài)碼是()
答案:404通用爬蟲用于將互聯(lián)網(wǎng)上的網(wǎng)頁下載到本地,形成一個(gè)互聯(lián)網(wǎng)內(nèi)容的鏡像備份。()
答案:對Python的注釋有幾種?()
答案:2SQL語句中的條件用以下哪一項(xiàng)來表達(dá)()。
答案:where在HTML中,下列標(biāo)簽中的()標(biāo)簽在標(biāo)記的位置強(qiáng)制換行。
答案:關(guān)于Element類的相關(guān)操作,主要可分為三個(gè)部分,分別是節(jié)點(diǎn)操作、節(jié)點(diǎn)屬性的操作、節(jié)點(diǎn)內(nèi)文本的操作。()
答案:對HTML表格在默認(rèn)情況下沒有邊框。()
答案:對
答案:創(chuàng)建一個(gè)下拉菜單www服務(wù)中Web頁面應(yīng)符合()規(guī)范
答案:HTMLPython語言提供的3種基本數(shù)字類型是()。
答案:int、float、complexAjax的get請求和post請求基本無區(qū)別。()
答案:錯(cuò)Cookie存儲(chǔ)了客戶端的一些重要信息,例如身份標(biāo)識(shí)、所在地區(qū)等,通常是一個(gè)文本文件。在向服務(wù)器發(fā)送URL請求時(shí),可以將文件內(nèi)容讀出,附加在HTTP的請求頭中,可以免去用戶輸入信息的麻煩()
答案:對a:hover表示超鏈接文字在鼠標(biāo)按下時(shí)的狀態(tài)。()
答案:錯(cuò)http協(xié)議中有g(shù)et方法和post方法()
答案:對“參數(shù)說明”表示該API可以接收和發(fā)送的參數(shù)名稱和類型()
答案:對驗(yàn)證碼是一種用來區(qū)分計(jì)算機(jī)行為和人類行為的測試程序()
答案:對Matplotlib默認(rèn)支持中文()
答案:錯(cuò)在XPath中,“/bookstore/book[price>35.00]”該表達(dá)式用于選取bookstore元素的所有book元素,且其中的price元素的值須大于35.00。()
答案:對在列表中不能嵌套另一個(gè)列表。()
答案:錯(cuò)Python中使用open函數(shù)將圖片寫入硬盤,其操作模式為“wb”()
答案:對get方法相比post方法能攜帶更多信息()
答案:錯(cuò)Scrapy架構(gòu)中SpiderMiddlewares蜘蛛中間件,位于引擎和蜘蛛之間的鉤子框架,主要工作是處理蜘蛛輸入的響應(yīng)和輸出的結(jié)果及新的請求。()
答案:對requests庫中的requests.get(url,timeout=2)方法中,timeout參數(shù)可以實(shí)現(xiàn)超過該參數(shù)設(shè)定的秒數(shù)后,程序停止等待。()
答案:對Python循環(huán)結(jié)構(gòu)有while語句、for語句。()
答案:對在列表中不能嵌套另一個(gè)列表()
答案:錯(cuò)創(chuàng)建BeautifulSoup類實(shí)例時(shí),如果沒有明確指定解析器,那么該實(shí)例肯定會(huì)選擇Python標(biāo)準(zhǔn)庫。()
答案:錯(cuò)Python集合可以包含相同的元素()
答案:錯(cuò)raise_for_status()在方法內(nèi)部判斷狀態(tài)碼是否等于200,需要增加額外的if語句。()
答案:錯(cuò)網(wǎng)站中的robots.txt可以無視()
答案:錯(cuò)Scrapy架構(gòu)中Spiders蜘蛛,其內(nèi)定義了爬取的邏輯和網(wǎng)頁的解析規(guī)則,它主要負(fù)責(zé)解析響應(yīng)并生成提取結(jié)果和新的請求。()
答案:對BS庫中的解析器有()
答案:lxml###html5lib###html.parser###xml爬蟲分類可分為()
答案:通用爬蟲###聚焦爬蟲###增量式爬蟲下列關(guān)于HTTP狀態(tài)碼類型描述正確的是()。
答案:5XX表示服務(wù)器可能發(fā)生錯(cuò)誤###4XX表示客戶端可能發(fā)生錯(cuò)誤###3XX表示客戶端的請求需采取進(jìn)一步操作BS庫的基本元素包含下列選項(xiàng)中哪些選項(xiàng)()
答案:comment###name###tag下列屬于聚焦網(wǎng)絡(luò)爬蟲的常用策略的是()。
答案:基于內(nèi)容評價(jià)的爬取策略###基于鏈接結(jié)構(gòu)評價(jià)的爬取策略###基于語境圖的爬取策略以下哪個(gè)技術(shù)不是Ajax技術(shù)體系的組成部分()
答案:DHTML下列選項(xiàng)中,屬于結(jié)構(gòu)化數(shù)據(jù)的是()。
答案:JSON關(guān)于Python語言的浮點(diǎn)數(shù)類型的說法錯(cuò)誤的是()。
答案:小數(shù)部分不可以為0下列選項(xiàng)中為True的是()。
答案:‘a(chǎn)bcd’<‘a(chǎn)d’下列關(guān)于Python循環(huán)結(jié)構(gòu)的說法中,錯(cuò)誤的是()。
答案:continue語句可用于跳出當(dāng)前層次的循環(huán)以下標(biāo)記中用于設(shè)置內(nèi)部樣式表的標(biāo)簽是()
答案:<style>想要使用戶在單擊超鏈接時(shí),彈出一個(gè)新的網(wǎng)頁窗口,代碼是()。
答案:<ahref="right.html"target="_blank">新聞</a>
答案:解釋執(zhí)行JavaScript的是()
答案:瀏覽器以下關(guān)于列表標(biāo)簽說法錯(cuò)誤的是()
答案:<li>嵌套列表Ajax中基本請求方式是什么()
答案:getRequests模塊中,headers參數(shù)的作用是()
答案:模擬瀏覽器設(shè)有語句s=“HelloPython”,則可以輸出“Python”字符串的是()。
答案:print(s[6:])一個(gè)網(wǎng)址中的HOST實(shí)際上是一個(gè)()
答案:IP地址BeautifulSoup支持python標(biāo)準(zhǔn)庫的HTML解析器,還支持一些第三方解析器,下列哪個(gè)不是常用的解析器?()。
答案:URLPython語言是面向?qū)ο蟮膒rint(len(“Python”))的輸出結(jié)果是()。
答案:6在HTTP協(xié)議中,用于發(fā)送大量數(shù)據(jù)的方法是()
答案:post查詢表結(jié)構(gòu)用以下哪一項(xiàng)()。
答案:descScrapy架構(gòu)中Downloader下載器,用于下載網(wǎng)頁內(nèi)容,并將網(wǎng)頁內(nèi)容返回給蜘蛛。()
答案:對Scrapy架構(gòu)中Engine引擎,用來處理整個(gè)系統(tǒng)的數(shù)據(jù)流處理,觸發(fā)事務(wù),是整個(gè)框架的核心。()
答案:對Scrapy架構(gòu)中Item項(xiàng)目,它定義了爬取結(jié)果的數(shù)據(jù)結(jié)構(gòu),爬取的數(shù)據(jù)會(huì)被賦值成該對象。()
答案:對Scrapy架構(gòu)中Scheduler調(diào)度器,用來接受引擎發(fā)過來的請求并加入隊(duì)列中,并在引擎再次請求的時(shí)候提供給引擎。()
答案:對Scrapy是一個(gè)為了爬取網(wǎng)站數(shù)據(jù),提取結(jié)構(gòu)性數(shù)據(jù)而編寫的應(yīng)用框架,我們只需要實(shí)現(xiàn)少量的代碼,就能夠快速的抓取。()
答案:對下列對于Scrapy蟲項(xiàng)目目錄說法錯(cuò)誤的是()。
答案:items腳本定義了一個(gè)Item類,能夠存儲(chǔ)爬取的數(shù)據(jù)下列對于Scrapy的設(shè)置說法錯(cuò)誤的是()
答案:DOWNLOADER_MIDDLEWARES設(shè)置能夠激活用戶定制的下載器中間件下列對于Scrapy常用命令及其作用描述正確的是()
答案:startproject是一個(gè)全局命令,主要用于運(yùn)行一個(gè)獨(dú)立的爬蟲下列不屬于Scrapy框架的基本組成部分的是()
答案:引擎與調(diào)度器下列對于Scrapy數(shù)據(jù)流向描述錯(cuò)誤的是()
答案:Spiders處理響應(yīng)并返同爬取到的Items及(跟進(jìn)的)新的請求給引擎解析中間件下列selenium庫的方法中,通過元素名稱定位的是()。
答案:find_element_by_name使用Ajax解析內(nèi)容時(shí),得到響應(yīng)后,觸發(fā)onreadystatechange屬性對應(yīng)的方法()。
答案:對DOM操作,即對Document網(wǎng)頁文檔進(jìn)行操作,如更改、刪除等()。
答案:對下面方法中,進(jìn)行瀏覽器頁面前進(jìn)的方法是()。
答案:driver.forward()使用driver.get()方法可以得到網(wǎng)頁窗口的位置()。
答案:錯(cuò)可以使用request向服務(wù)器發(fā)送請求,然后得到響應(yīng)()。
答案:對Ajax不能實(shí)現(xiàn)頁面的交互()。
答案:錯(cuò)以下哪個(gè)技術(shù)不是Ajax技術(shù)體系的組成部分?()
答案:DHTML關(guān)閉當(dāng)前頁面的方法是()
答案:driver.close()下列哪些方法或?qū)傩允荳eb標(biāo)準(zhǔn)中規(guī)定的?()
答案:getElementsByTagName()改變文件目錄所用的方法是()。
答案:chdir()使用withas語法。在with控制塊結(jié)束時(shí),文件會(huì)自動(dòng)關(guān)閉()。
答案:對向文件中寫入數(shù)據(jù),需要使用write方法()。
答案:對使用readines()方法不可以把整個(gè)文件中的內(nèi)容進(jìn)行一次性讀?。ǎ?。
答案:錯(cuò)文件刪除所用的方法是()
答案:remove()使用以下哪個(gè)函數(shù)可以打開一個(gè)已經(jīng)存在的文件?()
答案:open使調(diào)用dumps()方法將JSON字符串轉(zhuǎn)化為對象()。
答案:錯(cuò)以二進(jìn)制格式打開一個(gè)文件用于追加的訪問模式為()。
答案:abJSON也就是JavaScript對象標(biāo)記()。
答案:對文件訪問的默認(rèn)模式為()。
答案:r下列不屬于HTTP請求過程的是()。
答案:搜索文檔對服務(wù)器端來說,它返回給客戶端的數(shù)據(jù)格式可分為非結(jié)構(gòu)化和結(jié)構(gòu)化兩種。()
答案:對XPath是一門在XML文檔中查找信息的語言。XPath可用來在XML文檔中對元素和屬性進(jìn)行遍歷。()
答案:對正則表達(dá)式、XPath和BeautifulSoup都是基于HTML/XML文檔的層次結(jié)構(gòu)來確定到達(dá)指定節(jié)點(diǎn)的路徑。()
答案:錯(cuò)下列關(guān)于Beautifulsoup中對象類型描述錯(cuò)誤的是()
答案:attrs方法可獲取Tag對象的HTML屬性,返回值為列表形式網(wǎng)頁中的非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型,不方便使用數(shù)據(jù)庫二維邏輯來表現(xiàn)的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖像等。()
答案:對下列選項(xiàng)中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是:()
答案:圖像結(jié)構(gòu)化數(shù)據(jù)就是能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,具有模式的數(shù)據(jù),包括HTML、XML和JSON等。()
答案:對下列關(guān)于Chrome開發(fā)者工具描述錯(cuò)誤的是()
答案:網(wǎng)絡(luò)面板無法查看HTML源碼下列關(guān)于Xpah中功能函數(shù)描述錯(cuò)誤的是()
答案:contains方法可用于選取以指定值開頭的節(jié)點(diǎn)HTTPError是URLError的子類,專門用來處理HTTP請求錯(cuò)誤,比如認(rèn)證請求失敗等。它有3個(gè)屬性,下列選項(xiàng)哪一個(gè)不是它的屬性()。
答案:Response下列屬于HTTP必須實(shí)現(xiàn)的請求方法的是()。
答案:GET與HEADResponse類用于動(dòng)態(tài)地響應(yīng)客戶端的請求,控制發(fā)送給用戶的信息,并且將動(dòng)態(tài)地生成響應(yīng),包括狀態(tài)碼、網(wǎng)頁的內(nèi)容等。()
答案:對通過加入特定的____,可以將爬蟲發(fā)出的請求偽裝成瀏覽器。()
答案:User_Agent如果訪問某網(wǎng)站的頻率太高,則這個(gè)網(wǎng)站可能會(huì)禁止訪問。()
答案:對requests庫中的requests.get(url)方法中包括兩個(gè)(對象)請求,其中一個(gè)為Request請求,即向服務(wù)器請求資源的request對象,第二個(gè)是R
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年永嘉國企面試試題及答案
- 2024至2030年中國鋁鍶合金行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國調(diào)味品生產(chǎn)線行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國自粘式吸盤行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國空調(diào)掛鉤行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國法半夏枇杷膏行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國扣壓式網(wǎng)絲紡織膠管接頭行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國尼龍里布行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國垂直連接頭行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國低溫液體罐式集裝箱行業(yè)投資前景及策略咨詢研究報(bào)告
- 《有為神農(nóng)之言者許行》講讀課件
- 櫻桃課件完整
- 設(shè)計(jì)報(bào)價(jià)單模板
- 幼兒行為觀察與分析案例教程第2版全套教學(xué)課件
- 醫(yī)院會(huì)計(jì)制度科目表
- 校本研修教師手冊電子模板
- 應(yīng)急隊(duì)伍裝備參考目錄和急性傳染病預(yù)防控制技術(shù)資料清單
- 普通地質(zhì)學(xué)-第四章-巖石課件
- 《E時(shí)代大學(xué)英語-讀寫教程4》教案
- 一種陸空一體垂直起降飛行汽車的制作方法
- 創(chuàng)新者的窘境課件
評論
0/150
提交評論