




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
長風破浪會有時,直掛云帆濟滄海。南開大學23春“計算機科學與技術”《網(wǎng)絡爬蟲與信息提取》考試高頻考點參考題庫帶答案(圖片大小可自由調(diào)整)第I卷一.綜合考核(共15題)1.如果使用Python的數(shù)據(jù)結(jié)構(gòu)來做類比的話,MongoDB中庫相當于一個大字典,大字典里面的每一個鍵值對都對應了一個集合,Key為集合的名字,Value就是一個()。A.字典B.集合的名字C.集合D.文檔2.當使用Scarpy創(chuàng)建爬蟲時,當爬取網(wǎng)易云音樂首頁信息時,scrapygenspider的第二個參數(shù)直接輸入"163.com"就可以了。()A.正確B.錯誤3.charles配置中,安裝完成證書以后,在設置中打開“關于本機”,找到最下面的“證書信任設置”,并在里面啟動對Charles證書的完全信任。()A.正確B.錯誤4.雖然MongoDB相比于MySQL來說,速度快了很多,但是頻繁讀寫MongoDB還是會嚴重拖慢程序的執(zhí)行速度。()A.正確B.錯誤5.process_spider_output(response,result,output)是在下載器中間件處理完成后,馬上要進入某個回調(diào)函數(shù)parse_xxx()前調(diào)用。()A.正確B.錯誤6.以下哪些方法屬于Python寫CSV文件的方法()A.writeheadersB.writeheaderC.writerrowsD.writerow7.在Scrapy的目錄下,哪個文件負責數(shù)據(jù)抓取以后的處理工作?()A.spiders文件夾B.item.pyC.pipeline.pyD.settings.py8.通用搜索引擎大多提供基于關鍵字的檢索,難以支持根據(jù)語義信息提出的查詢。()T.對F.錯9.在Scrapy的目錄下,哪個文件負責定義需要爬取的數(shù)據(jù)?()A.spiders文件夾B.item.pyC.pipeline.pyD.settings.py10.Python中一個函數(shù)沒有返回值則可以寫()A.沒有returnB.returnC.returnNoneD.returnNULL11.請問按哪個鍵可以打開Chrome自帶的開發(fā)者工具()A.F10B.F1C.F11D.F1212.Redis是()數(shù)據(jù)庫A.關系數(shù)據(jù)庫B.鍵值數(shù)據(jù)庫C.列存數(shù)據(jù)庫D.圖數(shù)據(jù)庫13.下面代碼一共執(zhí)行循環(huán)多少次():foriinrange(10):print(i**i)A.9B.10C.11D.014.在使用多線程處理問題時,線程池設置越大越好。()A.正確B.錯誤15.process_spider_input(response,spider)是在爬蟲運行yielditem或者yieldscrapy.Request()的時候調(diào)用。()T.對F.錯第II卷一.綜合考核(共15題)1.()是Scrapy官方開發(fā)的,用來部署、運行和管理Scrapy爬蟲的工具。A.ScrapydB.ScrapyDeployC.DeployD.Scrapy_Deploy2.當使用Scarpy創(chuàng)建爬蟲時,當爬取網(wǎng)易云音樂首頁信息時,scrapygenspider的第二個參數(shù)直接輸入就可以了。()T.對F.錯3.PyMongoDB中排序方法sort第二個參數(shù)1表示降序。()T.對F.錯4.爬蟲中間件的作用對象是請求request和返回response。()A.正確B.錯誤5.requests中post請求方法的使用為requests.post(‘網(wǎng)址’,data=data)中的data為()。A.列表B.元組C.字典D.集合6.PyMongo中邏輯查詢表示等于的符號是()A.$gtB.$ltC.$eq$ne7.Python中一個函數(shù)沒有返回值則可以寫()。A.沒有returnB.returnC.returnNoneD.returnNULL8.自己能查看的數(shù)據(jù),允許擅自拿給第三方查看。()T.對F.錯9.Robo3T與RoboMongo是完全不一樣的軟件。()A.正確B.錯誤10.Python中退出循環(huán)應用關鍵字()A.breakB.continueC.exitD.return11.cookies在http請求中是明文傳輸?shù)摹?)T.對F.錯12.device.sleep()方法是使用UIAutomatorr關閉屏幕的命令。()A.正確B.錯誤13.需要登錄的網(wǎng)站一般通過GET請求就可以實現(xiàn)登錄。()A.正確B.錯誤14.在對XPath返回的對象再次執(zhí)行XPath的時候,子XPath開頭需要添加斜線。()T.對F.錯15.要使用Python來操作UIAutomator從而控制手機,需要安裝一個第三方庫()A.uiautomatorB.automatorC.ui_automatorD.pyautomator第III卷一.綜合考核(共15題)1.Python在Windows路徑字符串左引號的左邊加()符號來避免反斜杠問題。A.sB.cC.dD.r2.如果使用Python的數(shù)據(jù)結(jié)構(gòu)來做類比的話,MongoDB中集合相當于一個()A.列表B.元組C.字典D.集合3.下面Python代碼輸出為():defdefault_para_without_trap(para=[],value=0):ifnotpara:para=[]para.append(value)returnparaprint('第一步:{}'.format(default_para_trap(value=100)))print('第二步:{}'.format(default_para_trap(value=50)))A.第一步:[100]第二步:[100,50]B.第一步:[100]第二步:[50]C.第一步:[100]第二步:[]D.第一步:[100]第二步:[100]4.在中間人攻擊中,攻擊者可以攔截通信雙方的通話,并插入新的內(nèi)容或者修改原有內(nèi)容。()A.正確B.錯誤5.Scrapy中使用Xpath獲得的結(jié)果調(diào)用了.extract方法,結(jié)果以()形式生成A.列表B.元組C.字典D.集合6.Python中列表生成以后還可以往里面繼續(xù)添加數(shù)據(jù),也可以從里面刪除數(shù)據(jù)。()A.正確B.錯誤7.帶上通過Chrome瀏覽器從評論頁面復制而來的()再發(fā)起請求,可以減少爬蟲被網(wǎng)站封鎖的概率A.CookieB.HtmlC.HeadersD.CSS8.使用UIAutomator獲滾動屏幕的操作是得到相應控件后使用命令()A.scrollB.scroll_upC.scroll_forwordD.scroll_back9.要實現(xiàn)Charles對Android抓包,其過程比iOS稍微復雜一點。這是因為不同的Andorid設備,安裝證書的入口可能不一樣。()A.正確B.錯誤10.Redis中查詢列表長度命令llen中l(wèi)代表left,即從左側(cè)開始數(shù)。()A.正確B.錯誤11.Python在Windows路徑字符串左引號的左邊加()符號來避免反斜杠問題A.sB.cC.dD.r12.設置了這個中間件以后,仍然需要輸入賬號密碼可以成功得到登錄以后才能看到的HTML。()A.正確B.錯誤13.Python并導入uiautomator來操作設備的語句是fromuiautomatorimport()。A.DeviceB.DevicesC.JobsD.Job14.在Linux的終端使用apt-get命令安裝一系列依賴庫時,其中如果存在有已經(jīng)安裝的庫,會覆蓋掉之前的庫重新安裝。()A.正確B.錯誤15.HTTP常用狀態(tài)碼表明表明客戶端是發(fā)生錯誤的原因所在的有()。A.403B.404C.500D.503第I卷參考答案一.綜合考核1.參考答案:C2.參考答案:B3.參考答案:A4.參考答案:A5.參考答案:B6.參考答案:ACD7.參考答案:C8.參考答案:T9.參考答案:B10.參考答案:ABC11.參考答案:D12.參考答案:B13.參考答案:B14.參考答案:B15.參考答案:F第II卷參考答案一.綜合考核1.參考答案:A2.參考答案:F3.參考答案:F4.參考答案:B5.參考答案:C6.參考答案:C7.參考答案:ABC8.參考答案:F9.參考答案:B10.參考答案:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度導師帶徒項目合作知識產(chǎn)權(quán)歸屬合同
- 2025年度個人住房借款抵押擔保合同(鄉(xiāng)村旅游開發(fā)貸款擔保)
- 2025年度影視劇劇本修改居間合同
- 2025年度文化產(chǎn)業(yè)園區(qū)入駐藝術家合作協(xié)議
- 第16課《誡子書》教學設計 2024-2025學年統(tǒng)編版語文七年級上冊
- 人教版七年級歷史與社會上冊第三單元第一課 家住平原教學設計
- 2025年院線發(fā)行項目合作計劃書
- 2025年變頻與逆變電源裝置合作協(xié)議書
- 高中生物學職業(yè)生涯教育內(nèi)容的開發(fā)與應用研究
- 數(shù)據(jù)中心機柜的隔震性能研究
- 《優(yōu)衣庫公司基層員工培訓現(xiàn)狀及問題研究(9400字)》
- 反恐防暴器械與戰(zhàn)術應用講解
- 浙江省2024年中考語文真題試卷(含答案)
- 海邁工程量清單計價軟件使用說明書-20220226100603
- 圖解自然資源部《自然資源領域數(shù)據(jù)安全管理辦法》
- 快消品配送管理方案
- 2024落實意識形態(tài)責任清單及風險點臺賬
- 高校排球教案全集-專項課
- 教師師德師風培訓專題課件
- 2024年鄉(xiāng)鎮(zhèn)綜合行政執(zhí)法工作總結(jié)模板
- 手術室壓瘡預防課件
評論
0/150
提交評論