![商務(wù)數(shù)據(jù)分析及應(yīng)用- 課件 項目2 商務(wù)數(shù)據(jù)的獲取與管理_第1頁](http://file4.renrendoc.com/view/1b9c02749496724d0535788ac1613b2f/1b9c02749496724d0535788ac1613b2f1.gif)
![商務(wù)數(shù)據(jù)分析及應(yīng)用- 課件 項目2 商務(wù)數(shù)據(jù)的獲取與管理_第2頁](http://file4.renrendoc.com/view/1b9c02749496724d0535788ac1613b2f/1b9c02749496724d0535788ac1613b2f2.gif)
![商務(wù)數(shù)據(jù)分析及應(yīng)用- 課件 項目2 商務(wù)數(shù)據(jù)的獲取與管理_第3頁](http://file4.renrendoc.com/view/1b9c02749496724d0535788ac1613b2f/1b9c02749496724d0535788ac1613b2f3.gif)
![商務(wù)數(shù)據(jù)分析及應(yīng)用- 課件 項目2 商務(wù)數(shù)據(jù)的獲取與管理_第4頁](http://file4.renrendoc.com/view/1b9c02749496724d0535788ac1613b2f/1b9c02749496724d0535788ac1613b2f4.gif)
![商務(wù)數(shù)據(jù)分析及應(yīng)用- 課件 項目2 商務(wù)數(shù)據(jù)的獲取與管理_第5頁](http://file4.renrendoc.com/view/1b9c02749496724d0535788ac1613b2f/1b9c02749496724d0535788ac1613b2f5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
商務(wù)數(shù)據(jù)的獲取與管理《商務(wù)數(shù)據(jù)分析及應(yīng)用(微課版)》02本章學(xué)習(xí)目標熟悉商務(wù)數(shù)據(jù)常見的獲取途徑和方法熟悉采集、清洗和管理商務(wù)數(shù)據(jù)的常用工具掌握采集、清洗和管理商務(wù)數(shù)據(jù)的基本方法能夠根據(jù)實際需求選擇正確的數(shù)據(jù)獲取渠道能夠合理運用正確的工具完成數(shù)據(jù)的采集、清洗與管理工作培養(yǎng)正確的數(shù)據(jù)獲取與處理思路培養(yǎng)因地制宜、靈活運用工具完成任務(wù)的能力目錄任務(wù)一商務(wù)數(shù)據(jù)的獲取任務(wù)二商務(wù)數(shù)據(jù)的采集任務(wù)三?商務(wù)數(shù)據(jù)的清洗任務(wù)實訓(xùn)任務(wù)四商務(wù)數(shù)據(jù)的管理一、商務(wù)數(shù)據(jù)的獲取途徑內(nèi)部途徑就商務(wù)企業(yè)而言,其內(nèi)部的各種管理系統(tǒng),如商品采購和管理系統(tǒng)、客戶服務(wù)管理系統(tǒng)、倉儲管理系統(tǒng)、財務(wù)管理系統(tǒng)等,往往都會建立專門的數(shù)據(jù)庫,以便存放各種與企業(yè)相關(guān)的數(shù)據(jù),當(dāng)企業(yè)需要使用時,就可以從這些系統(tǒng)的數(shù)據(jù)庫中查詢并獲取數(shù)據(jù)外部實地調(diào)查外部實地調(diào)查是企業(yè)獲取客戶等外部人員信息的有效途徑,如全面調(diào)查、隨機抽樣調(diào)查、非隨機抽樣調(diào)查等,都能獲取到有效的數(shù)據(jù)。外部網(wǎng)絡(luò)公開的數(shù)據(jù)庫。數(shù)據(jù)交易平臺。網(wǎng)絡(luò)指數(shù)。二、商務(wù)數(shù)據(jù)的獲取方法下載數(shù)據(jù)如果網(wǎng)頁中提供有“下載”“導(dǎo)出”等功能按鈕,則無需手動復(fù)制數(shù)據(jù),只需單擊相應(yīng)的按鈕,然后按照提示將數(shù)據(jù)保存到計算機上的指定位置。02復(fù)制數(shù)據(jù)訪問目標網(wǎng)頁,拖曳鼠標選擇其中需要獲取的數(shù)據(jù),在所選數(shù)據(jù)上單擊鼠標右鍵,在彈出的快捷菜單中選擇“復(fù)制”命令,或直接按【Ctrl+C】組合鍵復(fù)制。01二、商務(wù)數(shù)據(jù)的獲取方法圖所示為從店偵探數(shù)據(jù)平臺導(dǎo)出數(shù)據(jù),單擊按鈕將打開計算機上的下載軟件或啟動瀏覽器內(nèi)置的下載功能,設(shè)置數(shù)據(jù)的名稱和保存位置后,單擊按鈕完成數(shù)據(jù)的導(dǎo)出和保存操作。目錄任務(wù)一商務(wù)數(shù)據(jù)的獲取任務(wù)二商務(wù)數(shù)據(jù)的采集任務(wù)三?商務(wù)數(shù)據(jù)的清洗任務(wù)實訓(xùn)任務(wù)四商務(wù)數(shù)據(jù)的管理一、商務(wù)數(shù)據(jù)采集的常用工具八爪魚采集器是一款全網(wǎng)通用的互聯(lián)網(wǎng)數(shù)據(jù)采集器,它能夠生成自動化的采集流程,并能夠?qū)?shù)據(jù)存儲在Excel中,是非常實用的一款數(shù)據(jù)采集工具,如圖所示。1.八爪魚采集器一、商務(wù)數(shù)據(jù)采集的常用工具01數(shù)據(jù)采集能力強不僅可以采集電商、新聞、社交媒體、金融、房產(chǎn)等全行業(yè)的互聯(lián)網(wǎng)數(shù)據(jù),也可以采集包括列表頁、詳情頁、搜索頁、瀑布流頁、登錄頁等各種場景的數(shù)據(jù),更可以采集文字、鏈接、圖片、視頻、音頻等多種類型的數(shù)據(jù)02數(shù)據(jù)采集性能強八爪魚采集器使用高性能的云服務(wù)集群,提供多節(jié)點、高并發(fā)、可擴容的采集能力,能夠完成大規(guī)模數(shù)據(jù)的采集。03數(shù)據(jù)采集效率高可以按照網(wǎng)站更新頻率和單次更新數(shù)據(jù)量,設(shè)置合理的定時采集策略,并能根據(jù)定時策略將賬號內(nèi)的云節(jié)點合理分配給數(shù)據(jù)源,以完成每個數(shù)據(jù)源新增數(shù)據(jù)的采集。一、商務(wù)數(shù)據(jù)采集的常用工具火車采集器是一種多線程內(nèi)容采集發(fā)布程序,它功能強大且易于上手,具有先進的內(nèi)容采集和數(shù)據(jù)導(dǎo)入功能,能將采集到的任何網(wǎng)頁數(shù)據(jù)發(fā)布到遠程服務(wù)器,特別對于各大主流文章系統(tǒng)和論壇系統(tǒng)而言,使用火車采集器能夠輕松地完成數(shù)據(jù)采集的工作。2.火車采集器一、商務(wù)數(shù)據(jù)采集的常用工具火車采集器采用了“站點+任務(wù)”的方式管理采集節(jié)點,任務(wù)支持批量操作,再多的數(shù)據(jù)管理也可以輕松實現(xiàn)管理性能強01火車采集器是一款全自動的采集工具,它不需要人為值守,只要配置好相應(yīng)的程序,就能依據(jù)設(shè)置自動運行,完全不需要人工進行干預(yù)全自動程度高02火車采集器可以自動識別網(wǎng)頁編碼,全面支持所有網(wǎng)站的編碼和網(wǎng)頁程序。編碼識別能力強03二、商務(wù)數(shù)據(jù)的采集方法1.八爪魚采集器的采集方法模板采集直接利用八爪魚采集器內(nèi)置的各種采集模板,實現(xiàn)快速采集數(shù)據(jù)的目的。自動識別采集當(dāng)八爪魚采集器內(nèi)置的模板無法滿足采集需求時,可以通過自定義采集的方式進行數(shù)據(jù)采集手動采集手動采集的關(guān)鍵在于如何正確采集需要的數(shù)據(jù)對象云采集此方法會借助八爪魚采集器的云服務(wù)器二、商務(wù)數(shù)據(jù)的采集方法2.火車采集器的采集方法普通網(wǎng)址采集批量網(wǎng)址采集此方法可以采集網(wǎng)頁中指定的各種數(shù)據(jù)對象,設(shè)置時需要充分觀察網(wǎng)頁元素的代碼規(guī)律,從而準確設(shè)置采集規(guī)則,實現(xiàn)數(shù)據(jù)的采集與發(fā)布操作此方法的整個采集設(shè)置過程與普通網(wǎng)址采集相似,不同之處只在于需要設(shè)置網(wǎng)址參數(shù)來實現(xiàn)批量采集的效果。目錄任務(wù)一商務(wù)數(shù)據(jù)的獲取任務(wù)二商務(wù)數(shù)據(jù)的采集任務(wù)三?商務(wù)數(shù)據(jù)的清洗任務(wù)實訓(xùn)任務(wù)四商務(wù)數(shù)據(jù)的管理一、商務(wù)數(shù)據(jù)清洗的常用工具Excel是微軟企業(yè)開發(fā)的辦公軟件Office中的一個組件,具有強大的數(shù)據(jù)計算、管理、分析等功能ExcelPython是一種簡潔、易讀、可擴展的面向?qū)ο蟮膭討B(tài)語言,該語言功能強大,可以通過編寫相應(yīng)的腳本來完成對數(shù)據(jù)的清洗工作Python記事本是Windows操作系統(tǒng)自帶的程序,在數(shù)據(jù)清洗領(lǐng)域,其作用主要是清除原數(shù)據(jù)中帶有的各種格式記事本作為Excel的一個功能插件,其作用是通過編寫宏語言來完成對數(shù)據(jù)的清洗工作,需要數(shù)據(jù)分析人員具備一定的編程水平VBA二、商務(wù)數(shù)據(jù)的清洗方法1.修復(fù)缺失值如果采集到的數(shù)據(jù)量很大,使得即便刪除若干數(shù)據(jù)也不會影響樣本效果時,就可以采取刪除的方式修復(fù)缺失值。在Excel中可以利用兩種最常用的方法來定位缺失值,然后將該值所在行刪除。(1)刪除缺失值如果能夠判斷出缺失值的內(nèi)容,則應(yīng)該及時修補缺失數(shù)據(jù);如果無法判斷,則可以考慮使用平均數(shù)、眾數(shù)等合理的方法預(yù)測出缺失數(shù)據(jù)。但切記不能為了補全數(shù)據(jù)而隨意填寫,造成數(shù)據(jù)出現(xiàn)嚴重失真的情況。(2)修補缺失值二、商務(wù)數(shù)據(jù)的清洗方法2.修復(fù)錯誤值Excel錯誤信息的含義符號產(chǎn)生原因解決方法#N/A單元格的函數(shù)或公式中沒有可用數(shù)值可以忽略或在這些單元格中輸入“#N/A”,公式在引用這些單元格時,將不進行數(shù)值計算,而是返回“#N/A”#####!①單元格中的數(shù)字、日期或時間數(shù)據(jù)長度大于單元格寬度②單元格中的日期或時間公式產(chǎn)生了負值①拖曳列標增加單元格寬度②更正公式或?qū)卧窀袷皆O(shè)置為非日期和時間型數(shù)據(jù)#VALUE!①需要數(shù)字或邏輯值時輸入了文本②將單元格引用、公式或函數(shù)作為數(shù)組常量輸入③賦予需要單一數(shù)值的運算符或函數(shù)一個數(shù)值區(qū)域①確認公式或函數(shù)所需的運算符或參數(shù)正確,并且公式引用的單元格中包含有效的數(shù)值②確認數(shù)組常量不是單元格引用、公式或函數(shù)③將數(shù)值區(qū)域改為單一數(shù)值#DIV/O!①公式中的除數(shù)使用了指向空白單元格或包含零值單元格的引用②輸入的公式中包含明顯的除數(shù)零①修改單元格引用,或在用作除數(shù)的單元格中輸入不為零的值②將零改為非零值二、商務(wù)數(shù)據(jù)的清洗方法符號產(chǎn)生原因解決方法#NAME?①刪除了公式中使用的名稱,或使用了不存在的名稱②名稱出現(xiàn)拼寫錯誤③公式中輸入文本時未使用雙引號④單元格區(qū)域引用時缺少冒號①確認使用的名稱確實存在②修改拼寫錯誤的名稱③將公式中的文本括在英文狀態(tài)下的雙引號中④確認公式中使用的所有單元格區(qū)域引用都使用了英文狀態(tài)下的冒號#REF!刪除了由其他公式引用的單元格或?qū)卧裾迟N到由其他公式引用的單元格中更改公式或在刪除或粘貼單元格之后,單擊快速訪問工具欄中的“撤銷”按鈕#NULL!使用了不正確的區(qū)域運算符或引用的單元格區(qū)域的交集為空更改區(qū)域運算符使之正確,或更改引用使之相交#NUM!公式或函數(shù)中的某個數(shù)值出現(xiàn)問題更正錯誤的數(shù)值二、商務(wù)數(shù)據(jù)的清洗方法使用IFERROR函數(shù)修復(fù)錯誤修復(fù)Excel中出現(xiàn)的錯誤信息時,一般可以利用IFERROR函數(shù)實現(xiàn)。該函數(shù)的語法格式為“=IFERROR(value,value_if_error)”,其中,參數(shù)“value”表示當(dāng)不存在錯誤時的取值;參數(shù)“value_if_error”為存在錯誤時的取值。二、商務(wù)數(shù)據(jù)的清洗方法3.修復(fù)邏輯錯誤例如,某店鋪各商品本月的進貨數(shù)量均沒有超過1000件,因此利用條件格式將超過了1000的數(shù)據(jù)自動描紅加粗顯示出來,就能看到并修改出現(xiàn)錯誤的數(shù)據(jù)。選擇需要設(shè)置條件格式的單元格區(qū)域,在【開始】/【樣式】組中單擊“條件格式”下拉按鈕,在打開的下拉列表中選擇【突出顯示單元格規(guī)則】/【大于】選項二、商務(wù)數(shù)據(jù)的清洗方法然后在打開的對話框中設(shè)置條件格式,并自定義滿足設(shè)置條件時數(shù)據(jù)的顯示格式,這里將大于1000的數(shù)據(jù)顯示為“加粗、紅色”,確認操作后就能按設(shè)置的條件格式顯示數(shù)據(jù),如圖所示。二、商務(wù)數(shù)據(jù)的清洗方法4.統(tǒng)一數(shù)據(jù)格式設(shè)置數(shù)據(jù)類型選擇需設(shè)置統(tǒng)一類型的數(shù)據(jù)所在的單元格區(qū)域,在【開始】/【數(shù)字】組中單擊右下角的“數(shù)字格式”按鈕,打開“設(shè)置單元格格式”對話框的“數(shù)字”選項卡,在“分類”下拉列表框中選擇某種數(shù)據(jù)類型,在右側(cè)的界面中進一步設(shè)置所選類型的數(shù)據(jù)格式,完成后單擊按鈕。二、商務(wù)數(shù)據(jù)的清洗方法查找與替換數(shù)據(jù)例如,某表格中“是否結(jié)算”欄下含有“已付”和“已結(jié)算”兩種數(shù)據(jù),現(xiàn)需要將“已付”統(tǒng)一為“已結(jié)算”,則可在【開始】/【編輯】組中單擊“查找和選擇”下拉按鈕,在打開的下拉列表中選擇“替換”選項,或直接按【Ctrl+H】組合鍵,打開“查找和替換”對話框中的“替換”選項卡,在“查找內(nèi)容”文本框中輸入“已付”,在“替換為”文本框中輸入“已結(jié)算”,依次單擊按鈕和按鈕。二、商務(wù)數(shù)據(jù)的清洗方法5.清理重復(fù)數(shù)據(jù)當(dāng)采集的數(shù)據(jù)量較大時,可以利用Excel的刪除重復(fù)值功能,去掉數(shù)據(jù)中可能存在的重復(fù)記錄,其方法為:在【數(shù)據(jù)】/【數(shù)據(jù)工具】組中單擊“刪除重復(fù)值”按鈕,打開“刪除重復(fù)值”對話框,在其中單擊選中表格項目對應(yīng)的復(fù)選框,表示檢查該項目下是否包含重復(fù)值,單擊按鈕,如圖所示。目錄任務(wù)一商務(wù)數(shù)據(jù)的獲取任務(wù)二商務(wù)數(shù)據(jù)的采集任務(wù)三?商務(wù)數(shù)據(jù)的清洗任務(wù)實訓(xùn)任務(wù)四商務(wù)數(shù)據(jù)的管理一、商務(wù)數(shù)據(jù)管理的常用工具電子表格工具的代表有Excel、WPSOffice等,這類工具可以對數(shù)據(jù)進行計算、排序、篩選、分類匯總等,是十分常用的數(shù)據(jù)管理工具。(1)電子表格工具數(shù)據(jù)庫工具的代表有Access、SQLServer、Mysql、Oracle等,這類軟件不僅能實現(xiàn)電子表格工具對數(shù)據(jù)的各種管理操作,還能通過各種語句定義數(shù)據(jù)性質(zhì),在數(shù)據(jù)之間建立各種聯(lián)系等,功能更加強大,但使用難度更高。(2)數(shù)據(jù)庫工具二、商務(wù)數(shù)據(jù)的管理方法Excel中的公式能夠?qū)崿F(xiàn)自動計算,例如,在A3單元格中需要顯示A1單元格與A2單元格中的數(shù)據(jù)之和,可以在A3單元格中輸入“=A1+A2”,按【Enter】鍵確認,此后只要在A1單元格和A2單元格中輸入了數(shù)據(jù),A3單元格便將自動顯示二者之和,且無論A1單元格和A2單元格中的數(shù)據(jù)如何變化,A3單元格中的結(jié)果都會即時更新。1.計算數(shù)據(jù)二、商務(wù)數(shù)據(jù)的管理方法2.排序數(shù)據(jù)快速排序所謂快速排序,是指利用功能區(qū)的排序按鈕快速實現(xiàn)數(shù)據(jù)排序,即選擇排序區(qū)域中的某個項目下的數(shù)據(jù),單擊【數(shù)據(jù)】/【排序和篩選】組中的“升序”按鈕或“降序”按鈕,便將以該項目為關(guān)鍵字重新排序數(shù)據(jù)。多關(guān)鍵字排序如果需要設(shè)置多個關(guān)鍵字排序,以避免單一關(guān)鍵字出現(xiàn)相同數(shù)據(jù)的情況,則可選擇需排序的數(shù)據(jù)區(qū)域,單擊【數(shù)據(jù)】/【排序和篩選】組中的“排序”按鈕,打開“排序”對話框,在其中選擇關(guān)鍵字,設(shè)置排列次序,然后單擊按鈕,按相同方法設(shè)置次要關(guān)鍵字,完成后單擊按鈕。二、商務(wù)數(shù)據(jù)的管理方法3.篩選數(shù)據(jù)自動篩選手動篩選選擇需要進行篩選的數(shù)據(jù)區(qū)域,單擊【數(shù)據(jù)】/【排序和篩選】組中的“篩選”按鈕,進入篩選狀態(tài),單擊某個項目右側(cè)的下拉按鈕,在打開的下拉列表中選擇“數(shù)字篩選”選項,并根據(jù)需要在打開的子列表中選擇需要的篩選條件并進行設(shè)置手動輸入篩選條件,然后單擊【數(shù)據(jù)】/【排序和篩選】組中的按鈕,打開“高級篩選”對話框,在其中指定數(shù)據(jù)區(qū)域和篩選條件區(qū)域,確認操作即可。二、商務(wù)數(shù)據(jù)的管理方法4.分類匯總數(shù)據(jù)對需要分類匯總的數(shù)據(jù)進行排序,然后選擇排序后的任意單元格,在【數(shù)據(jù)】/【分級顯示】組中單擊“分類匯總”按鈕,打開“分類匯總”對話框,在其中設(shè)置分類字段(即排序時作為關(guān)鍵字的項目)、匯總方式和選定匯總項,然后確認操作,如圖所示。二、商務(wù)數(shù)據(jù)的管理方法5.分列數(shù)據(jù)例如,某個項目中包含客戶所在省市的數(shù)據(jù),如果需要分析客戶所在省的分布情況,就可以將省市分列為“省”和“市”兩個獨立的項目,其具體操作如下。打開“分列數(shù)據(jù).xlsx”文件(配套資源:\素材文件\項目二\數(shù)據(jù)清洗和管理\分列數(shù)據(jù).xlsx),選擇F2:F28單元格區(qū)域,在【數(shù)據(jù)】/【數(shù)據(jù)工具】組中單擊“分列”按鈕。選擇分類方式插入分列線二、商務(wù)數(shù)據(jù)的管理方法設(shè)置列數(shù)據(jù)格式分列前后對比效果二、商務(wù)數(shù)據(jù)的管理方法6.轉(zhuǎn)換數(shù)據(jù)行與列數(shù)據(jù)行列的轉(zhuǎn)換在Excel中稱為“轉(zhuǎn)置”,指的是將原來各條數(shù)據(jù)記錄的首列內(nèi)容轉(zhuǎn)置為數(shù)據(jù)的各個項目,將原來的各個項目轉(zhuǎn)置為數(shù)據(jù)記錄的首列內(nèi)容,從而實現(xiàn)將當(dāng)前各列內(nèi)容轉(zhuǎn)置為橫向的各條數(shù)據(jù)記錄。通過對話框轉(zhuǎn)置單擊【開始】/【剪貼板】組中的“粘貼”按鈕下方的下拉按鈕,在打開的下拉列表中選擇“選擇性粘貼”選項,繼續(xù)在打開的對話框中單擊選中“轉(zhuǎn)置”復(fù)選框,單擊“確定”按鈕。02通過按鈕轉(zhuǎn)置單擊【開始】/【剪貼板】組中的“粘貼”按鈕下方的下拉按鈕,在打開的下拉列表中單擊“轉(zhuǎn)置”按鈕01二、商務(wù)數(shù)據(jù)的管理方法7.提取數(shù)據(jù)Excel中可以使用LEFT函數(shù)、MID函數(shù)和RIGHT函數(shù)來實現(xiàn)數(shù)據(jù)提取的工作。01LEFT函數(shù)語法格式為“=LEFT(text,num_chars]”,表示從指定的單元格中返回左側(cè)的1個或多個字符。02MID函數(shù)語法格式為“=MID(text,start_num,num_chars)”,表示從指定的單元格中的指定位置返回1個或多個字符。03RIGHT函數(shù)語法格式為“=RIGHT(text,num_chars]”,表示從指定的單元格中返回右側(cè)的1個或多個字符。目錄任務(wù)一商務(wù)數(shù)據(jù)的獲取任務(wù)二商務(wù)數(shù)據(jù)的采集任務(wù)三?商務(wù)數(shù)據(jù)的清洗任務(wù)實訓(xùn)任務(wù)四商務(wù)數(shù)據(jù)的管理一、使用八爪魚采集器采集數(shù)據(jù)小米從老張那里了解到,企業(yè)這次對辦公場所的需求主要包括地區(qū)(北京)、租金(4000~5000元)、出租類型(整租)、使用類型(商住兩用)等方面。因此小米需要找到一個租房平臺,按這些要求篩選出合適的信息,然后再利用八爪魚采集器采集數(shù)據(jù)?!緦嵱?xùn)背景】(1)使用八爪魚的自定義任務(wù)功能采集數(shù)據(jù)。(2)在八爪魚采集器中適當(dāng)調(diào)整采集字段,然后將數(shù)據(jù)以Excel表格的形式保存到計算機中?!緦嵱?xùn)要求】一、使用八爪魚采集器采集數(shù)據(jù)登錄安居客,將租房地區(qū)設(shè)置為“北京”,租金設(shè)置為“4000-5000”,類型設(shè)置為“整租”,“更多篩選”欄處設(shè)置為“商住兩用”,如圖1所示,按此設(shè)置搜索房源,然后選擇此時的網(wǎng)址內(nèi)容,按【Ctrl+C】組合鍵復(fù)制下來?!緦嵱?xùn)思路】圖1設(shè)置搜索條件并篩選信息一、使用八爪魚采集器采集數(shù)據(jù)啟動八爪魚采集器并登錄,新建自定義任務(wù),將復(fù)制的網(wǎng)址粘貼到“網(wǎng)址”欄中,保存設(shè)置,如圖2所示。圖2新建自定義任務(wù)等待八爪魚自動完成識別工作,然后查看下方哪些不需要的字段,將鼠標指針移至該字段上,單擊出現(xiàn)的按鈕將其刪除,如圖3所示。圖3識別并整理字段一、使用八爪魚采集器采集數(shù)據(jù)調(diào)整好需要采集的字段后,在“操作提示”面板中依次單擊按鈕和“保存并開始采集”超鏈接。此后將打開“請選擇采集模式”對話框,這里單擊“本地采集”欄下的按鈕,如圖4所示。八爪魚采集器將開始采集數(shù)據(jù)并同步顯示采集過程和結(jié)果。采集完成后將打開提示對話框,單擊按鈕,在打開的“導(dǎo)出本地數(shù)據(jù)”對話框中選擇對應(yīng)的導(dǎo)出方式,這里單擊選中“Excel(xlsx)”單選項,如圖5所示。最后單擊按鈕,設(shè)置數(shù)據(jù)的保存位置和名稱等信息,設(shè)置成功后便可完成數(shù)據(jù)采集的操作。圖4選擇采集模式圖5按指定方式導(dǎo)出數(shù)據(jù)二、清洗采集的數(shù)據(jù)小米利用八爪魚采集器采集了指定的字段,她將在Excel中打開采集的文件,按照公司對房源租金、規(guī)格、面積、朝向等要求,利用學(xué)習(xí)的各種數(shù)據(jù)清洗方法對數(shù)據(jù)做進一步加工?!緦嵱?xùn)背景】(1)使用分列功能將數(shù)據(jù)分為多列。(2)使用查找與替換功能清除多余的空格。(3)使用Excel的數(shù)據(jù)管理功能管理清洗好的數(shù)據(jù)內(nèi)容?!緦嵱?xùn)要求】二、清洗采集的數(shù)據(jù)打開“租房信息.xlsx”文件(配套資源:\素材文件\項目二\任務(wù)實訓(xùn)\租房信息.xlsx),在A列單元
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度回遷房買賣糾紛仲裁服務(wù)合同范本
- 2025年度工地圍擋防火防爆材料供應(yīng)合同
- 2025年度海上貨運保險理賠時效合同
- 2025年度建筑工程綠色施工技術(shù)承攬合同范本
- 2025年度廚師技能考核與雇傭合同范本
- 2025年度國有資產(chǎn)租賃市場調(diào)研與合同編制服務(wù)
- 2025年度汽車租賃優(yōu)惠條件合同
- 2025年度國際貿(mào)易產(chǎn)品質(zhì)量檢測與認證合同
- 2025年度家禽養(yǎng)殖戶信貸融資與風(fēng)險管理合同
- 2025年度換熱站設(shè)備更新?lián)Q代及售后服務(wù)合同
- 運動技能學(xué)習(xí)與控制課件第五章運動中的中樞控制
- 財務(wù)部規(guī)范化管理 流程圖
- 蘇教版2023年小學(xué)四年級數(shù)學(xué)下冊教學(xué)計劃+教學(xué)進度表
- 小學(xué)作文指導(dǎo)《難忘的一件事》課件
- 斷絕關(guān)系協(xié)議書范文參考(5篇)
- 量子力學(xué)課件1-2章-波函數(shù)-定態(tài)薛定諤方程
- 最新變態(tài)心理學(xué)課件
- 工程洽商記錄表格
- 【自考練習(xí)題】石家莊學(xué)院概率論與數(shù)理統(tǒng)計真題匯總(附答案解析)
- 農(nóng)村集體“三資”管理流程圖
- 高中英語 牛津譯林版必修第三冊 Unit 2詞匯全解
評論
0/150
提交評論