奧鵬22秋學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)答卷非免費(fèi)答案_第1頁
奧鵬22秋學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)答卷非免費(fèi)答案_第2頁
奧鵬22秋學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)答卷非免費(fèi)答案_第3頁
奧鵬22秋學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)答卷非免費(fèi)答案_第4頁
奧鵬22秋學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)答卷非免費(fèi)答案_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

答案來源:22秋學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)-00003試卷總分:100

得分:100一、單選題(共20道試題,共40分)Scrapy自帶的待爬隊列是()dequequeuelistlqueue答案:2.Python正則表達(dá)式模塊的findall方法提取內(nèi)容包含多個,則返回結(jié)果的列表中會包含()列表元組字典集合答案:3.Redis是一個開源的使用()語言編寫ANSICC++JAVAPython答案:4.Python寫CSV文件需要哪個方法()CSVWriterCsvWriterDictWriterFileWriter答案:5.使用Xpath構(gòu)造屬性值包含相同字符串的路徑采用()方法containcontainsincludeincludes答案:6.以下關(guān)于Charles的說法正確的是()Charles是一個跨平臺的HTTP抓包工具,可以截取HTTP或者HTTPS請求的數(shù)據(jù)包Charles有Windows32/64版和Linux64版,但是目前還沒有對MacOS進(jìn)行有效的支持。Charles上面滾動的數(shù)據(jù)就是目前計算機(jī)發(fā)起的數(shù)據(jù)包。單擊工具欄上面的黃色笤帚圖標(biāo),可以清停止抓包。在Charles啟動時,系統(tǒng)自帶瀏覽器的部分HTTP流量不會經(jīng)過Charles。答案:7.Redis中寫數(shù)據(jù)到列表中,使用關(guān)鍵字()pushappendlpushlappend答案:8.打開終端,輸入(),屏幕上會出現(xiàn)Python的路徑pythonpathpathpythonwhichpythonpythonwhich答案:9.Python中跳過本次循環(huán)應(yīng)用關(guān)鍵字()breakcontinueexitreturn答案:10.Chrome的開發(fā)者工具中哪個選項可以查找到cookiesElementsSourcesNetworkPeformance答案:11.下列哪項不是HTTP的請求類型()GETPOSTPUTSET答案:12.通常使用()工具來模擬瀏覽器進(jìn)行爬蟲請求SeleniumChromeChromeDriverWebDriver答案:13.chrome默認(rèn)打開開發(fā)者工具的快捷是F5F11F12F2答案:14.Python中專門用來處理圖像的第三方庫是lxmlPillowbeautifulsouppytesseract答案:15.要想讓Scrapy結(jié)合Redis,應(yīng)該對Scrapy爬蟲請求的調(diào)度算法進(jìn)行修改,以下哪種修改不能完成這一任務(wù)?()隊列棧上鎖優(yōu)先級隊列答案:16.以下表示請求資源重定向的HTTP狀態(tài)碼為200301404500答案:17.請問按哪個鍵可以打開Chrome自帶的開發(fā)者工具()F10F1F11F12答案:18.如果使用Python的數(shù)據(jù)結(jié)構(gòu)來做類比的話,MongoDB中庫相當(dāng)于一個()列表元組字典集合答案:19.執(zhí)行下面代碼,結(jié)果為():name_list=[]ifname_listandname_list[100]=='張三':print('OK')程序報錯OKNULL無輸出答案:20.使用UIAutomatorr判斷元素是否存在的操作是得到相應(yīng)控件后使用命令()existexistsisnullcontains答案:二、多選題(共10道試題,共20分)21.為了解決爬蟲代碼本身的錯誤引起的異常,可以采用下列哪些方法仔細(xì)檢查代碼開發(fā)爬蟲中間件開發(fā)下載器中間件等待答案:22.使用BeautifulSoup對象后可以使用()來查找內(nèi)容find_allfindsearchsearch_all答案:23.MongoDB中獲取名字為set1的集合的語句為()database.set1database('set1')database['set1']database{'set1'}答案:C24.以下哪些可以獨(dú)立成為Python編譯器()PycharmIDLEEclipseVisualStudio2010答案:25.使用Selennium獲取網(wǎng)頁中元素的方法有find_element_by_namefind_element_by_idfind_elements_by_namefind_elements_by_id答案:CD26.下列關(guān)于在IOS上配置charles的說法正確的是()不同ios設(shè)備之間會有比較大的差別,所以配置的時候需要找到對應(yīng)的安裝證書的入口。手機(jī)和電腦需要在同一個局域網(wǎng)下。HTTP代理可以使用"自動"選項。安裝好證書以后,打開iOS設(shè)備上的任何一個App,可以看到Charles中有數(shù)據(jù)包在流動答案:27.網(wǎng)絡(luò)爬蟲的用途有()收集數(shù)據(jù)盡職調(diào)查提高流量攻擊服務(wù)器答案:C28.PyMongo刪除操作有()deletedelete_alldelete_onedelete_many答案:29.PyMongo更新操作有()updateupdate_allupdate_oneupdate_many答案:30.BS4可以用來從()中提取數(shù)據(jù)HTMLXML數(shù)據(jù)庫JSON答案:三、答案來源:雅寶題庫網(wǎng)()(共20道試題,共40分)31.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。答案:錯誤32.使用UIAutomatorr操作實(shí)體鍵的命令為device.press.實(shí)體按鍵名稱()答案:正確33.代理中間件的可用代理列表一定要寫在settings.py里面答案:錯誤34.引用中間件時后面的數(shù)字代表的是中間件的執(zhí)行順序,例如'AdvanceSpider.middlewares.ProxyMiddleware':543中的543答案:正確35.如果把網(wǎng)絡(luò)上發(fā)送與接收的數(shù)據(jù)包理解為快遞包裹,那么在快遞運(yùn)輸?shù)倪^程中取出查看更改里面的內(nèi)容,就是類似抓包的過程答案:錯誤36.對Charles設(shè)置代理時,Ip可以設(shè)置為,端口為8888.答案:正確37.Scrapy每一次發(fā)起請求之前都會在這里檢查網(wǎng)址是否重復(fù)。因此如果確實(shí)需要再一次爬取數(shù)據(jù),在Redis中把這個Key刪除即可。答案:正確38.使用異步加載技術(shù)的網(wǎng)站,被加載的內(nèi)容可以在源代碼中找到答案:錯誤39."curlhttp://爬蟲服務(wù)器IP地址:6800/cancel.json-dproject=工程名-djob=爬蟲JOBID"該命令的作用是啟動爬蟲答案:錯誤40.Redis中使用lrange讀取數(shù)據(jù)后數(shù)據(jù)也會刪除答案:錯誤41.在Ubuntu下若要運(yùn)行Redis可以使用CMD進(jìn)入解壓以后的文件夾并運(yùn)行命令redis-server.exeredis.windows.conf啟動Redis答案:錯誤42.需要登錄的網(wǎng)站一般通過GET請求就可以實(shí)現(xiàn)登錄。答案:錯誤43.爬蟲中間件的激活需要另外寫一個文件來進(jìn)行答案:錯誤44.requests中post請求方法的使用為requests.post('網(wǎng)址',data=data)答案:正確45.數(shù)據(jù)抓包就是中間人爬蟲的一個簡單應(yīng)用。所以使用Charles也是一種中間人攻擊答案:正確46.數(shù)據(jù)在MongoDB中是按照"庫(Database)"-"集合(Collections)"-"文檔(Document)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論