




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第頁大數(shù)據(jù)采集與處理復(fù)習(xí)試題有答案1.下列選項中,在JSONPath中表示選取根對象的是()A、$B、/C、@D、*【正確答案】:A2.關(guān)于BeautifulSoup的描述,說法錯誤的是()。A、BeautifulSoup是一個用于從HTML或XML文檔中提取目標數(shù)據(jù)的Python庫B、BeautifulSoup支持CSS選擇器C、BeautifulSoup可以將HTML或XML文檔、片段轉(zhuǎn)換成節(jié)點樹D、BeautifulSoup會將整個節(jié)點樹看作一個Python類的對象【正確答案】:D3.下列選項中,關(guān)于動態(tài)頁面的描述說法錯誤的是()A、動態(tài)網(wǎng)頁的內(nèi)容不一定呈現(xiàn)在網(wǎng)頁源代碼中。B、動態(tài)網(wǎng)頁的訪問速度相較于靜態(tài)網(wǎng)頁更快。C、采用動態(tài)網(wǎng)頁技術(shù)的網(wǎng)站可以實現(xiàn)更多的功能,如用戶注冊、用戶登錄等功能D、動態(tài)網(wǎng)頁相比靜態(tài)網(wǎng)頁,動態(tài)網(wǎng)頁有數(shù)據(jù)庫支撐。【正確答案】:B4.下列XPath路徑表達式中。用于選取第一個app元素的是()A、/appstore/app(1)B、/appstore/app(first)C、/appstore/app[1]D、/appstore/app[first]【正確答案】:C5.lxml庫中,用于解析xml文件的方法是()A、etree.parse()B、etree.XML()C、etree.HTML()D、etree.fromstring()【正確答案】:A6.關(guān)于CSS選擇器的描述,說法錯誤的是()A、類別選擇器是根據(jù)類名選擇元素,類名前面用“.”進行標注B、ID選擇器是根據(jù)特定ID選擇元素,ID前面加上“$”進行標注C、屬性選擇器是根據(jù)元素的屬性選擇元素,屬性必須用中括號進行包裹D、元素選擇器是根據(jù)元素名稱選擇元素【正確答案】:B7.selenium中,用于關(guān)閉瀏覽器對象的是()。A、driver.cancel()B、driver.exit()C、driver.quit()D、driver.close()【正確答案】:C8.下列選項中,用于查看響應(yīng)狀態(tài)碼的屬性是()。A、contentB、headersC、textD、status_code【正確答案】:D9.能將’baidu_logo.png’正確的保存到文件中的代碼是()A、withopen('baidu_logo.png','wb')asfile:B、withopen('baidu_logo.png','w')asfile:C、withopen('baidu_logo.png','wr')asfile:D、withopen('baidu_logo.png','a+')asfile:【正確答案】:A10.關(guān)于Requests庫中g(shù)et()函數(shù)的說法錯誤的是()。A、get()函數(shù)既可以發(fā)送GET請求也可以發(fā)送POST請求B、get()函數(shù)中參數(shù)url是必選參數(shù),該參數(shù)含義為請求地址C、get()函數(shù)會根據(jù)傳入的URL構(gòu)建一個請求D、使用get()函數(shù)發(fā)送GET請求時可以攜帶請求參數(shù)【正確答案】:A11.當正則表達式中包含能接受重復(fù)的限定符時,匹配盡可能少的字符,這被稱為()。A、貪婪匹配B、懶惰匹配C、占有匹配D、隨機匹配【正確答案】:B12.下列選項中,關(guān)于設(shè)置代理服務(wù)器目的的說法正確的是()A、加快網(wǎng)絡(luò)爬蟲抓取數(shù)據(jù)的速度B、識別網(wǎng)站驗證碼C、降低訪問網(wǎng)站速度D、防止IP被封禁【正確答案】:D13.下列選項中,關(guān)于靜態(tài)頁面的描述說法錯誤的是()。A、靜態(tài)網(wǎng)頁的交互性較差,在功能方面有較大的限制B、靜態(tài)網(wǎng)頁的訪問速度快,訪問過程中無需連接數(shù)據(jù)庫C、靜態(tài)網(wǎng)頁沒有數(shù)據(jù)庫的支持,內(nèi)容更新與維護比較復(fù)雜D、靜態(tài)網(wǎng)頁的內(nèi)容可根據(jù)用戶信息進行定制化展示【正確答案】:D14.下列選項中,關(guān)于Cookie的描述錯誤的是()。A、Cookie是一段文本數(shù)據(jù),由一個名稱和一個值組成B、Cookie的生存期可以由開發(fā)人員設(shè)置C、Cookie數(shù)據(jù)存儲在網(wǎng)站服務(wù)器中D、Cookie是為了網(wǎng)站辨別用戶身份、進行會話跟蹤而存儲的數(shù)據(jù)【正確答案】:C15.GET請求方法通過請求參數(shù)傳輸數(shù)據(jù),最多能傳輸?shù)臄?shù)據(jù)量是()A、2KBB、4KBC、1MD、無限制【正確答案】:A16.關(guān)于JSONPath的描述,說法錯誤的是()。A、JSONPath只適用于JSON文檔B、JSONPath提供了描述JSON文檔層次結(jié)構(gòu)的表達式C、JSONPath提供的語法與XPath提供的語法相同D、JSONPath可以看作定位目標對象位置的語言【正確答案】:C17.下列選項中,用于標識客戶端身份的是()A、HOSTB、User-AgentC、AcceptD、Refere【正確答案】:B18.()會將數(shù)據(jù)包原封不動地轉(zhuǎn)發(fā)給服務(wù)器,讓服務(wù)器認為當前訪問的用戶只是一個普通客戶端,而不是代理服務(wù)器。A、高度匿名代理服務(wù)器B、普通匿名代理服務(wù)器C、透明代理服務(wù)器D、所有選項均不對【正確答案】:A19.關(guān)于正則表達式的描述,說法錯誤的是()A、一條正則表達式也稱為一個模式。B、正則表達式匹配HTML時會根據(jù)其層次結(jié)構(gòu)進行匹配。C、正則表達式由普通字符、元字符或預(yù)定義字符集組成。D、正則表達式是對字符串操作的一種邏輯公式。【正確答案】:B20.下列正則表達式中,表示只能匹配任意數(shù)字的是()。A、\wB、\sC、\dD、\b【正確答案】:C21.下列響應(yīng)頭中,用于告訴客戶端資源文件的類型和編碼的是()。A、ConnectionB、Content-EncodingC、Content-TypeD、Server?!菊_答案】:C22.下列選項中,關(guān)于處理響應(yīng)的描述說法錯誤的是()A、當服務(wù)器返回的響應(yīng)狀態(tài)碼為200時,表明可以接收到由服務(wù)器返回的響應(yīng)信息。B、Response類的對象中封裝了服務(wù)器返回的響應(yīng)信息。C、響應(yīng)內(nèi)容中只能包含文本內(nèi)容。D、若想獲取響應(yīng)的最終URL,可通過url屬性獲取?!菊_答案】:C23.以下Python語言關(guān)鍵字在異常處理結(jié)構(gòu)中用來捕獲特定類型異常的選項是()A、forB、lambdaC、inD、expect【正確答案】:D24.下列不能匹配任意字符的正則表達式是()A、[\d\D]B、[\w\W]C、[\s\S]D、[\a\A]【正確答案】:D25.XPath路徑表達式中,在搜索節(jié)點是會忽略層級關(guān)系的是()。A、/B、//C、[]D、@【正確答案】:B26.下列選項中,表示超文本傳輸協(xié)議的是()A、FileB、HTTPC、FTPD、Mailto【正確答案】:B27.下列選項中,被稱為主題網(wǎng)絡(luò)爬蟲的是()。A、增量式網(wǎng)絡(luò)爬蟲B、通用網(wǎng)絡(luò)爬蟲C、深層爬蟲D、聚焦網(wǎng)絡(luò)爬蟲【正確答案】:D28.requests庫中,get()函數(shù)能用于設(shè)置是否啟用SSL證書的參數(shù)是()。A、urlB、headersC、verifyD、proxies【正確答案】:C29.https的端口號是()A、80B、8080C、443D、433【正確答案】:C30.以下關(guān)于列表操作的描述,錯誤的是()A、通過append方法可以向列表添加元素B、通過extend方法可以將另一個列表中的元素逐一添加到列表中C、通過insert(index,object)方法,在指定位置index前插入元素D、通過add方法可以向列表添加元素【正確答案】:D31.下列選項中,關(guān)于聚焦網(wǎng)絡(luò)爬蟲的描述錯誤的是()。A、聚焦網(wǎng)絡(luò)爬蟲會隨機抓取網(wǎng)頁與主題相關(guān)的數(shù)據(jù)B、聚焦網(wǎng)絡(luò)爬蟲比通用網(wǎng)絡(luò)爬蟲目的性更強C、聚焦網(wǎng)絡(luò)爬蟲會根據(jù)一定的網(wǎng)頁分析算法對網(wǎng)頁進行篩選D、聚焦網(wǎng)絡(luò)爬蟲會根據(jù)預(yù)先設(shè)定的主題順著某個垂直領(lǐng)域進行抓取【正確答案】:A32.下列哪個正則表達式與1\d{5,9}不相同()A、[1]\d{5,9}B、1[0-9]{5,9}C、1[0123456789]{5,9}D、[1]\D{5,9}【正確答案】:D33.下列選項中,關(guān)于設(shè)置代理服務(wù)器的描述錯誤的是()A、降低單個IP訪問頻率B、防止IP被封禁C、加快訪問網(wǎng)站的速度D、代理IP的壽命是有限的【正確答案】:C34.URL地址'?ie=utf-8&wd=python',其中屬于表示查詢字符串的是()A、ie=utf-8&wd=pythonB、httpsC、D、wd=python【正確答案】:A35.使用xpath獲取文本使用()。A、textB、text()C、contentD、content()【正確答案】:B36.關(guān)于jsonpath模塊的描述,說法錯誤的是()。A、jsonpath是一個解析JSON文檔的模塊B、jsonpath()函數(shù)根據(jù)JSONPath的表達式定位目標對象C、jsonpath函數(shù)會返回包含解析后的結(jié)果的列表D、jsonpath模塊可以解析XML文檔中的數(shù)據(jù)【正確答案】:D37.下列選項中,關(guān)于網(wǎng)絡(luò)爬蟲合法性探究的描述說法錯誤的是()A、Robots協(xié)議又稱爬蟲協(xié)議B、Robots協(xié)議能夠有效防范網(wǎng)絡(luò)爬蟲C、爬蟲會給網(wǎng)站增加不小的壓力D、Robots協(xié)議沒有實際的約束力【正確答案】:B38.在匹配嵌套了HTML內(nèi)容的文本時,會忽略HTML內(nèi)容本身存在的層次結(jié)構(gòu)的解析語言是()A、正則表達式B、XPathC、BeautifulSoupD、所有選項均正確【正確答案】:A39.下列選項中,關(guān)于Selenium的描述說法錯誤的是()A、Selenium是一個開源的、便攜式的自動化測試工具。B、Selenium可以模擬用戶使用瀏覽器完成一些動作。C、Selenium最初的目的是為了便于網(wǎng)絡(luò)爬蟲抓取動態(tài)網(wǎng)頁數(shù)據(jù)。D、Selenium需要通過瀏覽器驅(qū)動程序WebDriver才能與所選瀏覽器進行交互?!菊_答案】:C40.關(guān)于定制請求頭的描述說法錯誤的是()。A、參數(shù)headers可以接收列表類型的數(shù)據(jù)B、定制的請求頭需要由參數(shù)headers中傳遞C、get()函數(shù)和post()函數(shù)均可以添加定制請求頭D、定制請求的目的是將發(fā)送的請求偽裝成瀏覽器發(fā)送的請求【正確答案】:A41.下列選項中,表示圖像標簽的是(D)。A、<html>B、<h1>C、<p>D、<img>【正確答案】:D42.下列選項中,不屬于防爬蟲策略的是()。A、添加User-agent字段B、降低訪問頻率C、反復(fù)使用同一IP抓取數(shù)據(jù)D、識別驗證碼【正確答案】:C43.下列選項中,不屬于請求行組成的是()。A、請求方法B、URLC、協(xié)議版本D、請求數(shù)據(jù)【正確答案】:D44."發(fā)布人:張三□□發(fā)布時間:2022-11-18□□來源:圖情信息中心".split('□□')的執(zhí)行結(jié)果是()A、['發(fā)布人:張三','□','發(fā)布時間:2022-11-18','□','來源:圖情信息中心']B、['發(fā)布人:張三','發(fā)布時間:2022-11-18','來源:圖情信息中心']C、('發(fā)布人:張三','□','發(fā)布時間:2022-11-18','□','來源:圖情信息中心')D、('發(fā)布人:張三','發(fā)布時間:2022-11-18','來源:圖情信息中心')【正確答案】:B45.請閱讀下列一段示例程序:importrequestsurl="/"response=Requests.get(url)response.encoding='ISO-8859-1'print(response.text)上述程序運行后,會使用哪種編碼方式返回文本()。A、utf-8B、gbkC、gbk2312D、ISO-8859-1【正確答案】:D46.以下XPath謂語中,能獲得滿足條件的第一個節(jié)點的是()A、[0]B、[1]C、[first()]D、[min()+1]【正確答案】:B47.下列選項中,屬于Selenium訪問指定URL地址的方法是()A、get()B、post()C、head()D、put()【正確答案】:A48.下列選項中,關(guān)于檢測代理IP有效性的描述說法錯誤的是()。A、當使用代理訪問網(wǎng)站時,返回的狀態(tài)碼為200時表示代理可用B、當代理無效時,不能返回響應(yīng)信息C、使用的代理IP通過參數(shù)proxies傳遞D、post()函數(shù)無法使用代理ip【正確答案】:D49.關(guān)于抓取靜態(tài)網(wǎng)頁實現(xiàn)技術(shù)的說法,下列描述錯誤的是()A、如果要抓取靜態(tài)網(wǎng)頁的數(shù)據(jù),只需要獲得網(wǎng)頁的源代碼即可。B、通過urllib、urllib3和Requests等庫抓取靜態(tài)網(wǎng)頁數(shù)據(jù)。C、Requests庫只能發(fā)送網(wǎng)絡(luò)請求不能獲取網(wǎng)頁源碼。D、抓取靜態(tài)網(wǎng)頁數(shù)據(jù)的整個過程是模仿用戶通過瀏覽器訪問網(wǎng)頁的過程?!菊_答案】:C50.下列選項中,用于以二進制形式獲取響應(yīng)內(nèi)容的屬性是()A、status_codeB、textC、contentD、string【正確答案】:C51.【】img標簽中的什么屬性,用于指圖片地址。()。A、srcB、hrefC、titleD、alt【正確答案】:A52.的元素的表達式是()Selenium中,能查找A、find_element_by_css_selector('hello')B、find_element_by_class_name('hello')C、find_element_by_tag_name('hello')D、find_element_by_name('hello')【正確答案】:D53.selenium中,瀏覽器對象往網(wǎng)頁的輸入框中輸入文字需要調(diào)用的方法是()。A、get()B、save_screenshot()C、send_keys()D、find_element_by_id()【正確答案】:C54.正則表達式[a-z].*3可以配置abc3abc3a3幾次()。A、0B、1C、2D、3【正確答案】:B55.下列選項中,不屬于Python開發(fā)網(wǎng)絡(luò)爬蟲優(yōu)勢的是()A、語法簡潔,容易上手B、開發(fā)效率高C、豐富的模塊D、運行速度快、性能強【正確答案】:D56.下列選項中,關(guān)于HTTP協(xié)議的描述說法錯誤的是()。A、HTTP協(xié)議能夠高效準確的傳送超文本資源B、若協(xié)議類型為HTTP,則每次連接可以處理多個請求C、HTTP協(xié)議中的每個請求都是獨立的D、HTTP協(xié)議用于將Web服務(wù)器的超文本資源傳送到瀏覽器中【正確答案】:B57.下列選項中,表示向服務(wù)器提交表單或上傳文件的請求方法是()A、GETB、POSTC、HEADD、PUT【正確答案】:B58.下列選項中,BeautifulSoup使用CSS選擇器的方法是()A、search()B、findall()C、find()D、select()【正確答案】:D59.關(guān)于XPath的描述,說法錯誤的是()A、XPath基于XML或HTML的節(jié)點樹定位目標節(jié)點所在的位置。B、XPath是一種用于確定XML文檔中部分節(jié)點位置的語言。C、XPath匹配節(jié)點的方式與正則表達式匹配字符串的方式類似。D、XPath通過路徑表達式可以快速地定位與選取XML或HTML文檔中的一個節(jié)點或者一組節(jié)點集?!菊_答案】:C60.下列選項中,不屬于HTML元素組成的是()。A、開始標簽B、內(nèi)容C、樣式D、結(jié)束標簽【正確答案】:C61.下列選項中,關(guān)于網(wǎng)絡(luò)爬蟲實現(xiàn)技術(shù)的描述錯誤的是()。A、只有Python語言能夠?qū)崿F(xiàn)爬蟲程序B、使用Python開發(fā)網(wǎng)絡(luò)爬蟲程序效率相對其他語言更高C、使用C++語言開發(fā)網(wǎng)絡(luò)爬蟲程序代碼成型速度慢D、Java提供了眾多解析網(wǎng)頁的技術(shù),對網(wǎng)頁解析有著良好的支持【正確答案】:A62.閱讀下面的程序:ImportjsonDemo_dict={"city":"北京","name":"小明"}Print(json.dumps(demo_dict,ensure_ascii=False))運行程序,程序最終輸出的結(jié)果為()。A、{"city":"北京","name":"小明"}B、{"city":"\u5317\u4eac","name":"\u5c0f\u660e"}C、{}D、運行錯誤【正確答案】:A63.requests庫中,proxies參數(shù)傳入一個字典,該字典中包含了所需要的代理IP,其中字典的鍵為A、getB、ip地址C、協(xié)議類型(http或https)D、post【正確答案】:C64.關(guān)于響應(yīng)狀態(tài)碼的描述說法錯誤的是()。A、響應(yīng)狀態(tài)碼代表服務(wù)器的響應(yīng)狀態(tài)B、響應(yīng)狀態(tài)碼的作用是告知客戶端請求Web資源的結(jié)果C、若服務(wù)器發(fā)生錯誤,用戶便無法獲取響應(yīng)狀態(tài)碼D、當響應(yīng)狀態(tài)碼為200時表示服務(wù)器接收請求并成功處理【正確答案】:C65.re模塊中,對正則表達式進行預(yù)編譯,從而生成一個代表正則表達式的Pattern對象()。A、re.pattern()B、re.split()C、re.run()D、pile()【正確答案】:D66.下列選項中,關(guān)于Requests庫post()函數(shù)的說法錯誤的是()A、如果請求數(shù)據(jù)類型為Json可通過參數(shù)json傳遞。B、post()函數(shù)會根據(jù)傳入的URL構(gòu)建一個請求并將該請求發(fā)送給服務(wù)器。C、post()函數(shù)通過參數(shù)data攜帶請求數(shù)據(jù)。D、post()函數(shù)既可以發(fā)送GET請求也可以發(fā)送POST請求?!菊_答案】:D67.下列狀態(tài)碼中,表示服務(wù)器拒絕訪問的是()。A、402B、403C、404D、405【正確答案】:B68.下列選項中,用于解析域名的協(xié)議是()。A、HTTPB、DNSC、FTPD、SMTP【正確答案】:B69.下列選項中,表示匹配的字符串開頭元字符是()A、*B、^C、$D、[]【正確答案】:B70.下列選項中,表示匹配前導(dǎo)字符0次或1次的是()A、?B、*C、+D、{n}【正確答案】:A71.以下選項中是HTTP請求行的是()A、GET/HTTP/1.1B、Connection:keep-aliveC、Accept-Language:zh-CN,zh;q=0.9D、User-Agent:Mozilla/5.0(WindowsNT10.0;Win64;x64)...【正確答案】:A72.bs4中,若已找到節(jié)點并存放于變量x中,能獲取節(jié)點內(nèi)容的是()A、x.textB、x.contentC、x.htmlD、x.attrs【正確答案】:A73.關(guān)于瀏覽器加載網(wǎng)頁過程的說法,下列描述錯誤的是()A、瀏覽器通過DNS服務(wù)器查找被訪問服務(wù)器對應(yīng)的IP地址。B、瀏覽器向DNS服務(wù)器解析的IP地址發(fā)送HTTP請求。C、Web服務(wù)器將響應(yīng)的HTML頁面返回給DNS服務(wù)器。D、瀏覽器會對HTML頁面進行渲染并呈現(xiàn)給用戶?!菊_答案】:C74.下列選項中,用于在GET請求中傳遞查詢字符串的是()。A、paramsB、headersC、verifyD、timeout【正確答案】:A75.下列選項中,表示內(nèi)容類型的字段是()。A、Cache-ControlB、ConnectionC、Content-EncodingD、Content-Type【正確答案】:D76.以下哪個選項是文件傳輸協(xié)議,訪問共享主機的文件資源()。A、FileB、FTPC、HTTPD、Mailto【正確答案】:B1.CSS用于向網(wǎng)頁中添加交互行為。()A、正確B、錯誤【正確答案】:B2.Python中的open()函數(shù)可以用于打開網(wǎng)頁并讀取網(wǎng)頁內(nèi)容。()A、正確B、錯誤【正確答案】:B3.POST請求的請求參數(shù)會暴露在URL地址中。()A、正確B、錯誤【正確答案】:B4.在BeautifulSoup中,.get_text()方法會返回標簽內(nèi)所有文本內(nèi)容,但不包括任何子標簽的內(nèi)容。()A、正確B、錯誤【正確答案】:B5.在HTTP請求中,GET方法比POST方法更適合傳輸大量數(shù)據(jù)。()A、正確B、錯誤【正確答案】:B6.get方法相比post方法能攜帶更多信息。()A、正確B、錯誤【正確答案】:B7.在BeautifulSoup中,soup.find_all('div',class_='header')[1]會返回所有Class='header'的div標簽中的第一個元素。()A、正確B、錯誤【正確答案】:B8.JSONPath表達式$..*可以用來獲取JSON對象中所有字段的值。()A、正確B、錯誤【正確答案】:A9.Selenium啟動瀏覽器后,瀏覽器的窗口默認以最大化的形式顯示。()A、正確B、錯誤【正確答案】:B10.在XPath中,@*表示選取所有屬性,而//*表示選取所有節(jié)點。()A、正確B、錯誤【正確答案】:A11.在實際應(yīng)用中,文件存儲和數(shù)據(jù)庫存儲各有利弊,文件存儲比較適合中小型網(wǎng)絡(luò)爬蟲,數(shù)據(jù)庫存儲比較適合大型網(wǎng)絡(luò)爬蟲A、正確B、錯誤【正確答案】:A12.Robots協(xié)議可以從根本上約束爬蟲程序。()A、正確B、錯誤【正確答案】:B13.soup.find('div',class_='header').find_all('p')可以選取class='header'的div標簽下所有p標簽。()A、正確B、錯誤【正確答案】:A14.JSONPath只能解析JSON格式的數(shù)據(jù)。()A、正確B、錯誤【正確答案】:A15.服務(wù)器端可以記住用戶的登錄狀態(tài),因此HTTP協(xié)議自身具有保持會話狀態(tài)的功能。()A、正確B、錯誤【正確答案】:B16.soup.select('div.header>p')會選擇所有div標簽下類名為header的元素的直接子元素p標簽。()A、正確B、錯誤【正確答案】:B17.HTTP協(xié)議是無狀態(tài)的,這意味著每次請求都是獨立的,不會記住之前的請求信息。(√)A、正確B、錯誤【正確答案】:A18.soup.select('div#header')用于選取頁面中第一個id='header'的div標簽。()A、正確B、錯誤【正確答案】:B19.soup.find('p',{'class':'intro'}).find('a')會選取class='intro'的p標簽下第一個A標簽。()A、正確B、錯誤【正確答案】:A20.requests.get()方法可以用來發(fā)送GET請求并返回一個包含響應(yīng)內(nèi)容的對象。()A、正確B、錯誤【正確答案】:A21.re模塊在提取HTML標簽中的特定信息時比BeautifulSoup或lxml會更高效。()A、正確B、錯誤【正確答案】:B22.表層網(wǎng)頁是指傳統(tǒng)搜索引擎可以索引的頁面,主要以超鏈接可以到達的靜態(tài)網(wǎng)頁構(gòu)成的網(wǎng)頁。()A、正確B、錯誤【正確答案】:A23.爬蟲可以通過模擬點擊事件來動態(tài)獲取數(shù)據(jù),但如果沒有正確處理JavaScript渲染,它仍然無法抓取數(shù)據(jù)。()A、正確B、錯誤【正確答案】:A24.XPath表達式//div[@class='header'][contains(text(),'Python')]會選擇Class='header'且包含文本Python的div標簽。()A、正確B、錯誤【正確答案】:A25.互聯(lián)網(wǎng)上每個文件都有一個唯一的URL。(√)A、正確B、錯誤【正確答案】:A26.在XPath中,//div[@id='content']/text()可以選取id="content"的div標簽中的所有文本節(jié)點。()A、正確B、錯誤【正確答案】:B27.在BeautifulSoup中,soup.find_all('div',{'class':'header'})與Soup.find_all('div',class_='header')效果是相同的。()A、正確B、錯誤【正確答案】:A28.爬蟲在抓取動態(tài)內(nèi)容時,如果直接使用requests庫獲取網(wǎng)頁源碼,能夠獲得所有渲染后的內(nèi)容。()A、正確B、錯誤【正確答案】:B29.get方法比post方法速度更快。()A、正確B、錯誤【正確答案】:A30.Selenium不支持瀏覽器的功能,它不需要與第三方瀏覽器結(jié)合使用。()A、正確B、錯誤【正確答案】:B31.soup.select('divp#main')會選擇所有div標簽中的id="main"的p標簽。()A、正確B、錯誤【正確答案】:A32.JSON比XML的語法更簡單,層次結(jié)構(gòu)更加清晰,易于閱讀。()A、正確B、錯誤【正確答案】:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年第三方健康機構(gòu)合作協(xié)議書
- 2025年安陽危運從業(yè)資格試題
- 2025年傳統(tǒng)銀飾項目建議書
- 房地產(chǎn)銷售及回購合同條款約定書
- 信息技術(shù)助力農(nóng)業(yè)現(xiàn)代化合同文本
- 2025年新疆危貨駕駛員模擬考試題庫及答案
- 旅行社與游客協(xié)議旅游合同
- 2025年軟件開發(fā)、評測平臺合作協(xié)議書
- 農(nóng)戶特色農(nóng)產(chǎn)品產(chǎn)銷一體化合同
- 醫(yī)藥醫(yī)療健康領(lǐng)域從業(yè)證明(8篇)
- 鳶飛魚躍:〈四書〉經(jīng)典導(dǎo)讀智慧樹知到期末考試答案章節(jié)答案2024年四川大學(xué)
- MOOC 統(tǒng)計學(xué)-南京審計大學(xué) 中國大學(xué)慕課答案
- 高考作文標準方格紙-A4-可直接打印
- 毛澤東詩詞鑒賞
- 肛腸科的中醫(yī)特色護理【醫(yī)院中醫(yī)護理及保健知識】
- 《高溫熔融金屬吊運安全規(guī)程》(AQ7011-2018)
- 商場糾紛和解書
- 強國必須強軍軍強才能國安
- 幼兒園教育中的多媒體技術(shù)與教學(xué)應(yīng)用
- 第12課 自覺抵制犯罪(課時1)【中職專用】中職思想政治《職業(yè)道德與法治》高效課堂(高教版2023·基礎(chǔ)模塊)
- 農(nóng)貿(mào)市場規(guī)劃設(shè)計方案
評論
0/150
提交評論