版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)采集與處理-題庫帶答案1、()是指對客觀事件記錄的符號,是對客觀事物的性質(zhì)、狀態(tài)及相互關(guān)系等進行記載的物理符號或這些物理符號的組合。數(shù)據(jù)字段記錄大數(shù)據(jù)答案:A2、在數(shù)據(jù)表中,表的“列”稱為()數(shù)據(jù)字段記錄大數(shù)據(jù)答案:B3、在數(shù)據(jù)表中,表的“行”稱為()數(shù)據(jù)字段記錄大數(shù)據(jù)答案:C4、數(shù)據(jù)表是由行(記錄)和列(字段)構(gòu)成,因此也稱()數(shù)據(jù)二維表表格大數(shù)據(jù)答案:B5、大數(shù)據(jù)具有以下特征大容量、多種類、高速度復雜性、高價值可變性、真實性以上都是答案:D6、數(shù)據(jù)的獲取途徑有()產(chǎn)品自有數(shù)據(jù)調(diào)查問卷互聯(lián)網(wǎng)數(shù)據(jù)導入從別人數(shù)據(jù)庫竊取答案:ABC7、產(chǎn)品自有數(shù)據(jù)就是自身產(chǎn)品銷售過程中產(chǎn)生的數(shù)據(jù)。答案:正確8、調(diào)查問卷是以問題的形式系統(tǒng)的記載調(diào)查內(nèi)容的一種印件。答案:正確9、互聯(lián)網(wǎng)數(shù)據(jù)分布在網(wǎng)頁的不同位置,我們很難采集下來。答案:錯誤10、Excel是按照數(shù)據(jù)結(jié)構(gòu)來組織,存儲和管理數(shù)據(jù)的倉庫。答案:錯誤11、商務(wù)數(shù)據(jù)指用戶在電子商務(wù)網(wǎng)站購買商品的過程中,網(wǎng)站記錄用戶行為的大量數(shù)據(jù)答案:正確12、商務(wù)數(shù)據(jù)包括()電子商務(wù)平臺的基礎(chǔ)數(shù)據(jù)電子商務(wù)專業(yè)網(wǎng)站的研究數(shù)據(jù)電子商務(wù)媒體報道評論數(shù)據(jù)答案:ABCD13、商品數(shù)據(jù)一般包括()商品分類商品價格商品展示商品評價答案:ABC14、采集交易數(shù)據(jù)主要是為了通過數(shù)據(jù)分析評估客戶價值,將潛在客戶變?yōu)閮r值客戶。答案:正確15、評價數(shù)據(jù)主要以圖片的形式出現(xiàn)。答案:錯誤16、新聞網(wǎng)站有()騰訊網(wǎng)百度貼吧鳳凰網(wǎng)博客答案:AC17、社交網(wǎng)站有()騰訊網(wǎng)百度貼吧鳳凰網(wǎng)博客答案:BD18、商務(wù)數(shù)據(jù)可用于多種行業(yè)()制造業(yè)金融業(yè)個人娛樂餐飲行業(yè)答案:ABCD19、商務(wù)數(shù)據(jù)可以監(jiān)控競爭對手的動態(tài)。答案:正確20、商務(wù)數(shù)據(jù)不同幫助企業(yè)和個人共享客戶信息。答案:錯誤21、商務(wù)數(shù)據(jù)的來源包括()電子商務(wù)平臺社交平臺O2O數(shù)據(jù)個人數(shù)據(jù)答案:ABC22、B2B是企業(yè)對企業(yè)之間通過互聯(lián)網(wǎng)進行產(chǎn)品、服務(wù)及信息的交換。答案:正確23、B2c是個人對企業(yè)開展的電子商務(wù)活動。答案:錯誤24、下列常用的B2c平臺有()阿里巴巴京東唯品會亞馬遜答案:BCD25、常見的C2c平臺有()阿里巴巴咸魚淘寶eBay答案:BCD26、社交電商指基于社交關(guān)系、利用互聯(lián)網(wǎng)社交媒介實現(xiàn)電子商務(wù)中的流量獲取、商品推廣和交易等其中一個或多個環(huán)節(jié),產(chǎn)生間接或直接交易行為的在線經(jīng)營活動。答案:正確27、抖音屬于社交內(nèi)容電商。答案:正確28、社交分享電商主要包括()拼多多微信蘑菇街微博答案:ABD29、O2O電商模式是線上(0“門0)引流線下(Offline)消費模式。答案:正確30、O2O數(shù)據(jù)主要有O2O電商平臺數(shù)據(jù)和展銷平臺組成。答案:正確31、數(shù)據(jù)采集又稱數(shù)據(jù)獲取,是利用設(shè)備或技術(shù)手段從現(xiàn)實環(huán)境及網(wǎng)絡(luò)獲取數(shù)據(jù)并放入系統(tǒng)內(nèi)部進行使用。答案:正確32、大多數(shù)互聯(lián)網(wǎng)頁編寫都是用HTML語言。答案:正確33、電子商務(wù)數(shù)據(jù)主要歸類為()文本圖片視頻音頻答案:ABC34、配置一種采集任務(wù)可以采集多個數(shù)據(jù)源。答案:錯誤35、防采集措施有()A、封IP驗證碼識別登錄不允許打開網(wǎng)頁答案:ABC36、常見的采集方法包括web爬蟲采集和API接口采集。答案:正確37、Web爬蟲主要分為通用網(wǎng)絡(luò)爬蟲和聚焦網(wǎng)絡(luò)爬蟲。答案:正確38、通用網(wǎng)絡(luò)爬蟲基本工作流程包含()打開瀏覽器抓取網(wǎng)頁數(shù)據(jù)存儲預處理答案:BCD39、調(diào)用網(wǎng)站自身提供的應用程序編程接口,可以實現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)采集。答案:正確40、數(shù)據(jù)的存儲方式有()ExcelCSV數(shù)據(jù)庫Python答案:ABC41、數(shù)據(jù)采集工具分為編程類和可視化采集工具兩類。答案:正確42、數(shù)據(jù)采集工具可以針對某個主題從微博爬取相關(guān)信息。答案:正確43、數(shù)據(jù)采集工具不能爬取學術(shù)信息。答案:錯誤44、常見的爬蟲語言有()HTMLPythonJavaPHP答案:BCD45、Python是一款服務(wù)器端解釋性開源非編譯腳本語言。答案:正確46、數(shù)據(jù)采集器是進行數(shù)據(jù)采集的機器或者工具。答案:正確47、數(shù)據(jù)采集器建立的任務(wù)也稱之為規(guī)則。答案:正確48、數(shù)據(jù)采集器采集不同字段時,建立一種規(guī)則就可以了。答案:錯誤49、數(shù)據(jù)采集器不能采集以下哪種數(shù)據(jù)()圖片文字網(wǎng)站信息專利答案:D50、哪種不是數(shù)據(jù)采集器Python爬蟲八爪魚采集器火車頭采集器后羿采集器答案:A51、簡易采集模式是利用系統(tǒng)內(nèi)置模板進行數(shù)據(jù)采集的模式。答案:正確52、簡易采集可根據(jù)不同的參數(shù)進行不同程度的自定義采集。答案:正確53、簡易采集模板所有用戶都可以使用。答案:錯誤54、單頁采集只能采集列表數(shù)據(jù)。答案:錯誤55、表格數(shù)據(jù)采集要先選中表格中的一行數(shù)據(jù)。答案:正確56、單網(wǎng)頁采集主要是采集一個網(wǎng)頁中的數(shù)據(jù)。答案:正確57、列表詳情頁數(shù)據(jù)采集比單網(wǎng)頁數(shù)據(jù)采集復雜。答案:正確58、列表詳情頁需要從每個商品的標題進入到商品的詳情頁。答案:正確59、采集列表詳情頁數(shù)據(jù)不需要循環(huán)步驟。答案:錯誤60、單個網(wǎng)頁上有很多相同鏈接,點擊鏈接后進入,再進行詳情頁數(shù)據(jù)采集,。答案:詳情頁;61、當配置好任務(wù),進行數(shù)據(jù)采集是,即用自己的本地電腦進行數(shù)據(jù)采集。答案:啟動本地采集62、如果想使用云服務(wù)集群進行采集,可以選擇答案:啟動云采集;63、數(shù)據(jù)導出可以導出的文件類型為()ExcelcsvHTMLD、MySql數(shù)據(jù)表答案:ABCD64、文本循環(huán)是通過輸入關(guān)鍵字采集跟關(guān)鍵字相關(guān)的數(shù)據(jù)。答案:正確65、URL循環(huán)是通過使用多個URL地址進行數(shù)據(jù)采集。答案:正確66、循環(huán)采集包括()URL循環(huán)文本循環(huán)單個元素循環(huán)隨機循環(huán)答案:ABC67、采集京東商品詳情頁數(shù)據(jù),字段可任意。要求:敘述采集步驟或使用采集器采集數(shù)據(jù)截圖答案:解析:68、分頁循環(huán)采集是指把一頁數(shù)據(jù)分成多頁進行采集。答案:錯誤69、網(wǎng)址中有多個頁面需要采集叫分頁循環(huán)采集。答案:正確70、點擊頁面上的“下一頁”按鈕翻頁,是最常見的翻頁方式。答案:正確71、需要登錄時就不能進行采集。答案:錯誤72、登錄采集分登錄采集和登錄采集。答案:賬號密碼;Cookie;73、使用登錄采集時,輸入賬號密碼需要用到模塊。答案:輸入文字;74、采集器無法識別驗證碼。答案:錯誤75、登錄利用瀏覽器中的緩存設(shè)置,緩存了當前的一個網(wǎng)頁狀態(tài),可以快速進入當前狀態(tài)的頁面。答案:Cookie;76、Cookie登錄的方式不需要輸入賬號和密碼,直接打開網(wǎng)頁就是登錄狀態(tài)。答案:正確77、Cookie登錄中Cookie長期存在,所以是登錄采集中,最方便的采集方式。答案:錯誤78、使用簡易模式采集任意網(wǎng)站數(shù)據(jù)要求:敘述采集步驟或使用采集器采集數(shù)據(jù)截圖答案:解析:79、使用單頁采集模式,采集任意一個網(wǎng)頁的數(shù)據(jù)要求:敘述采集步驟或使用采集器采集數(shù)據(jù)截圖答案:解析:80、ajax即、異步更新的一種腳本技術(shù)。答案:延時加載;81、ajax可以通過在后臺與服務(wù)器進行少量數(shù)據(jù)交換,可以重新加載整個網(wǎng)頁。答案:錯誤82、使用ajax技術(shù)的網(wǎng)頁,點擊網(wǎng)頁中某個按鈕或下拉頁面,網(wǎng)址一般不發(fā)生改變,網(wǎng)址欄不出現(xiàn)加載狀態(tài),但網(wǎng)頁局部有新的數(shù)據(jù)加載出來,有所變化。答案:正確83、Ajax技術(shù)包括()A、ajax點擊ajax翻頁ajax滾動定位答案:ABC84、Ajax點擊可以對一個按鈕進行多次點擊。答案:錯誤85、如果設(shè)置了ajax技術(shù)的網(wǎng)頁,在采集設(shè)置時,沒有勾選ajax加載,則不能進行采集。答案:錯誤、Ajax滾動包括()直接滾動到底部動到下一行滾動到下一頁向下滾動一屏答案:AD87、XPath語言是網(wǎng)頁內(nèi)容定位語言,它可以幫助采集工具查找網(wǎng)頁內(nèi)容在網(wǎng)頁中的位置。答案:正確88、XPath語言,也稱為HTML路徑語言。答案:錯誤89、XPath語言由、、、內(nèi)容構(gòu)成。答案:名稱;位置;屬性;90、被設(shè)計用來顯示網(wǎng)頁數(shù)據(jù),就是用來在HTML中定位元素的。答案:HTML;XPath91、HTML稱為超文本標記語言。答案:正確92、是構(gòu)成網(wǎng)頁的基本元素。答案:節(jié)點;93、節(jié)點有多種類型,分別是()元素、屬性、文本命名空間、處理指令注釋、文檔節(jié)點屬性值答案:ABC94、節(jié)點關(guān)系是指節(jié)點與節(jié)點之間的關(guān)系,通過包含與被包含關(guān)系區(qū)分。答案:正確95、是對于節(jié)點的描述性語句,用來選取指定節(jié)點。答案:路徑表達式;96、XPath中,表示不論該元素在Html中的任何位置,均選取該元素。答案://;97、XPath中,用于選擇某一元素的子元素,不能跨多層關(guān)系進行選擇答案:/98、XPath中,用來表示屬性,需寫在屬性前方答案:@;99、XPath中,選取父元素,其中“..”表示父元素。選取元素自身,其中“.”表示元素自身。答案:100、XPath中,選取某元素下的所有子元素答案:/*;101、XPath中,選取某元素下的所有后代元素答案://*;102、XPath中,用來查找某個特定的節(jié)點或包含某個指定的值的節(jié)點答案:謂語;103、XPath中,謂語對元素的、及做限制,只要符合限制的元素,使用中括號“[]”表示。答案:位置;屬性;內(nèi)容;104、XPath中,Text()函數(shù),主要功能為選中指定文本內(nèi)容的元素。答案:正確105、XPath中,contains(參數(shù)1,參數(shù)2),主要功能為選中參數(shù)1中包含參數(shù)2中內(nèi)容的元素。答案:正確106、XPath中,last(),主要功能為選中同胞元素中最后一位的元素。答案:正確107、XPath中,position。,主要功能為描述元素在同胞元素中的位置。答案:正確108、哪些行業(yè)需要用到數(shù)據(jù)采集()企業(yè)政府金融教育答案:ABCD109、使用采集器采集需要大量的專業(yè)知識。答案:錯誤110、個人進行數(shù)據(jù)采集是,主要用于()網(wǎng)頁信息收集商務(wù)數(shù)據(jù)采集市場數(shù)據(jù)采集社會公開信息答案:AB111、在公安經(jīng)偵領(lǐng)域通過對網(wǎng)絡(luò)敏感信息監(jiān)控比對管理,幫助公安經(jīng)濟偵查工作的開展和提供數(shù)據(jù)層面的支持。答案:正確112、商務(wù)數(shù)據(jù)采集多用于采購分析、市場分析、項目運行和論文編寫。答案:正確113、數(shù)據(jù)的質(zhì)量因素包可信性和可解釋性答案:準確性;完整性;一致性;時效性;相關(guān)性114、數(shù)據(jù)的質(zhì)量問題從采集的角度劃分,可分為()準確性完整性一致性時效性答案:ABC115、數(shù)據(jù)的質(zhì)量問題從應用的角度劃分,可分為()準確性相關(guān)性時效性可信性答案:BC116、數(shù)據(jù)的質(zhì)量問題從用戶使用的角度劃分,可分為()準確性完整性可信性可解釋性答案:CD117、準確性是指數(shù)據(jù)是否正確的,數(shù)據(jù)存儲在數(shù)據(jù)庫中的值是否對應于真實世界的值。答案:正確118、某用戶在使用支付寶綁定銀行卡時,網(wǎng)站要求驗證用戶的真實姓名和身份證號碼。這時要求采集的數(shù)據(jù)必須有()準確性完整性一致性相關(guān)性答案:A119、數(shù)據(jù)質(zhì)量完整性是指信息具有一個實體描述的所有必需的部分答案:正確120、空值是指缺失或不知道具體的值,可能是一條記錄中的某個屬性缺失,也可能是整條記錄都丟失。答案:正確121、數(shù)據(jù)質(zhì)量的數(shù)據(jù)一致性是指在數(shù)據(jù)庫中,不同表中存儲和使用的同一數(shù)據(jù)應當是等價的,表示數(shù)據(jù)有相等的值和相同的含義。答案:正確122、數(shù)據(jù)質(zhì)量的數(shù)據(jù)相關(guān)性是指數(shù)據(jù)與特定的應用和領(lǐng)域有關(guān)。答案:正確123、數(shù)據(jù)質(zhì)量的時效性是指有些數(shù)據(jù)會隨時間而變化的答案:正確124、數(shù)據(jù)質(zhì)量的可信性由三個因素決定:數(shù)據(jù)來源的權(quán)威性、數(shù)據(jù)的規(guī)范性、數(shù)據(jù)產(chǎn)生的時間。答案:正確125、數(shù)據(jù)質(zhì)量的可解釋性,也稱為可讀性,是指數(shù)據(jù)被人理解的難易程度答案:正確126、數(shù)據(jù)處理的4大流程步驟中的一個大體流向圖,就是()數(shù)據(jù)清理數(shù)據(jù)集成數(shù)據(jù)變換數(shù)據(jù)歸約答案:ABCD127、由于操作員重復錄入,并發(fā)處理等不規(guī)范的操作,導致產(chǎn)生不完整,不準確的,無效的數(shù)據(jù)也可以用在數(shù)據(jù)分析里。答案:錯誤128、數(shù)據(jù)的缺失值是指現(xiàn)有數(shù)據(jù)集中某個或某些屬性的值時不完整的。答案:正確129、處理空缺值的基本方法有6種,包括忽略元組、人工填寫空缺值、使用全局常量替換空缺值、使用屬性的中心度量填充空缺值、使用與給定元組屬同一類的所有樣本的平均值來填充空缺值、使用最可能的值填充空缺值。答案:正確130、若一條記錄中有多個屬性值被遺漏了,則可將該記錄排除在數(shù)據(jù)挖掘之外。答案:正確131、噪聲數(shù)據(jù)是指一個測量變量中的隨機錯誤或偏差答案:正確132、噪聲數(shù)據(jù)也可以用于數(shù)據(jù)挖掘進行分析。答案:錯誤133、孤立點的是不符合數(shù)據(jù)模型的數(shù)據(jù)。答案:正確134、孤立點并不真實存在,是人們無意中弄出的偏差比較大的數(shù)據(jù)。答案:錯誤135、處理噪聲數(shù)據(jù)可以使用()方法。分箱法回歸法聚類忽略元組答案:ABC136、數(shù)據(jù)集成是指將互相關(guān)聯(lián)的分布式異構(gòu)數(shù)據(jù)源集成到一起,使用戶能夠以透明的方式訪問這些數(shù)據(jù)源。答案:正確137、數(shù)據(jù)集成的方法有()聯(lián)邦數(shù)據(jù)庫中間件集成數(shù)據(jù)倉庫聚類答案:ABC138、數(shù)據(jù)倉庫是數(shù)據(jù)集成最常用的方法答案:正確139、數(shù)據(jù)倉庫來集成數(shù)據(jù)時需要處理的問題包括()實體識別冗余相關(guān)分析數(shù)據(jù)沖突和檢測答案:ABCD140、實體識別,它所解決的問題是如何匹配多個信息源在現(xiàn)實世界中的實體事物答案:正確141、數(shù)據(jù)規(guī)約就是為了壓縮數(shù)據(jù)量,幫助從原有龐大數(shù)據(jù)集中獲得一個精簡的數(shù)據(jù)集合,并使這一精簡數(shù)據(jù)集保持原有數(shù)據(jù)集的完整性。答案:正確142、數(shù)據(jù)規(guī)約的策略有()維歸約數(shù)量歸約數(shù)據(jù)壓縮實體識別答案:ABC143、主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉(zhuǎn)化為少數(shù)幾個綜合指標答案:正確144、屬性子集選擇,主要用于檢測并刪除不相關(guān)、弱相關(guān)或冗余的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 威視行業(yè)測繪培訓
- 《淘寶營銷活動技巧》課件
- 《房地產(chǎn)人職業(yè)規(guī)劃》課件
- 《課件視覺設(shè)計》課件
- 2024年四川省德陽市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2023年陜西省漢中市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2024年甘肅省平?jīng)鍪泄_招聘警務(wù)輔助人員輔警筆試自考題2卷含答案
- 2021年黑龍江省鶴崗市公開招聘警務(wù)輔助人員輔警筆試自考題2卷含答案
- 2021年遼寧省沈陽市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2022年黑龍江省大興安嶺地區(qū)公開招聘警務(wù)輔助人員輔警筆試自考題2卷含答案
- 居家養(yǎng)老人員培訓管理制度
- 抗菌藥物的合理應用培訓
- 初三數(shù)學老師家長會發(fā)言稿
- 湖北第二師范學院《操作系統(tǒng)》2023-2024學年期末試卷
- 2021-2022學年河北省唐山市高一上學期期末語文試題
- 舒適化醫(yī)療麻醉
- 南寧二中、柳州高中2025屆高一上數(shù)學期末聯(lián)考試題含解析
- 吃動平衡健康體重 課件 2024-2025學年人教版(2024)初中體育與健康七年級全一冊
- 高效能人士的七個習慣(課件)
- 2024年秋季學期新魯教版(54制)6年級上冊英語課件 Unit6 Section A (3a-3c)(第3課時)
- 福建省泉州市2023-2024學年高一上學期1月教學質(zhì)量檢測(期末考試)地理試題 附答案
評論
0/150
提交評論