版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)獲取與整理項(xiàng)目四添加標(biāo)題在此PART01添加相關(guān)標(biāo)題文字添加相關(guān)標(biāo)題文字相關(guān)標(biāo)題文字學(xué)習(xí)目標(biāo)汪剛制作添加相關(guān)標(biāo)題文字添加相關(guān)標(biāo)題文字相關(guān)標(biāo)題文字項(xiàng)目導(dǎo)圖汪剛制作情境案例本項(xiàng)目案例數(shù)據(jù)比較分散;本項(xiàng)目案例數(shù)據(jù)的類型包括:EXCEL文件格式、文本文件格式、數(shù)據(jù)庫(mdb)文件格式、文件夾格式。本項(xiàng)目案例數(shù)據(jù)原型:某連鎖店銷售數(shù)據(jù);空氣質(zhì)量檢測數(shù)據(jù);某市年度財(cái)政收入數(shù)據(jù);某公司ERP系統(tǒng)中的財(cái)務(wù)數(shù)據(jù);融智財(cái)經(jīng)大數(shù)據(jù)平臺(tái)數(shù)據(jù);淘寶某店鋪的日訪問量和日銷售數(shù)據(jù);某健身會(huì)所的會(huì)員信息;某電子公司產(chǎn)品銷售數(shù)據(jù);某公司會(huì)議邀請信息和參會(huì)信息數(shù)據(jù);汪剛制作1區(qū)分一維表和二維表2數(shù)據(jù)獲取3數(shù)據(jù)整理主目錄汪剛制作區(qū)分一維表和二維表任務(wù)一汪剛制作任務(wù)一區(qū)分一維表和二維表清單型表格,是按照一定的順序,清晰明了地保存最原始數(shù)據(jù)的表格;分為:一維表和二維表;一維表就是簡單的字段、記錄的羅列;二維表,則從ニ個(gè)維度來描述記錄屬性,并且兩個(gè)字段屬性存在一定關(guān)系;在數(shù)據(jù)分析過程中,請盡量使用一維表;將二維表處理成一維表的方式:第一種方式:在PowerBI中利用“逆透視列”功能將二維表迅速轉(zhuǎn)換為一維表;第二種方式,在EXCEL中利用數(shù)據(jù)透視表中多重?cái)?shù)據(jù)透視功能進(jìn)行處理;汪剛制作數(shù)據(jù)獲取任務(wù)二汪剛制作子任務(wù)一從文件導(dǎo)入Excel文件:該種文件格式最為常見;文本文件:是指以ASCII碼方式(也稱文本方式)存儲(chǔ)的文件。比如英文字母、數(shù)字等字符。CSV文件:用逗號(hào)作為分隔符(Comma-SeparatedValues,CSV,有時(shí)也稱為字符分隔值,因?yàn)榉指糇址部梢圆皇嵌禾?hào))的文件,其文件以純文本形式存儲(chǔ)表格數(shù)據(jù)(數(shù)字和文本)。XML(eXtensibleMarkupLanguage):可擴(kuò)展標(biāo)記語言,它非常適合萬維網(wǎng)傳輸,提供統(tǒng)一的方法來描述和交換獨(dú)立于應(yīng)用程序或供應(yīng)商的結(jié)構(gòu)化數(shù)據(jù)。JSON(JavaScriptObjectNotation,JS對象簡譜):是一種輕量級的數(shù)據(jù)交換格式。它基于ECMAScript(歐洲計(jì)算機(jī)協(xié)會(huì)制定的js規(guī)范)的一個(gè)子集,采用完全獨(dú)立于編程語言的文本格式來存儲(chǔ)和表示數(shù)據(jù)。PDF(PortableDocumentFormat的簡稱,意為“便攜式文檔格式”):是由AdobeSystems用于與應(yīng)用程序、操作系統(tǒng)、硬件無關(guān)的方式進(jìn)行文件交換所發(fā)展出的文件格式。汪剛制作汪剛制作子任務(wù)一從文件導(dǎo)入32145子任務(wù)二從文件夾導(dǎo)入需要匯總一些業(yè)務(wù)或經(jīng)營數(shù)據(jù),采用文件夾導(dǎo)入然后匯總;本案例:文件夾下共有北京市、天津市、上海市、重慶市4個(gè)直轄市的年度財(cái)政收入數(shù)據(jù),分別存放在4個(gè)Excel工作簿中;123456汪剛制作子任務(wù)三從數(shù)據(jù)庫導(dǎo)入關(guān)系型數(shù)據(jù)庫:Access、SQLServer、MySQL、Oracle、SAPHANA、SAPBW本案例:Access數(shù)據(jù)庫文件,為從某公司ERP系統(tǒng)中獲取的財(cái)務(wù)數(shù)據(jù);123456汪剛制作子任務(wù)四從網(wǎng)站查詢導(dǎo)入從網(wǎng)頁直接提取數(shù)據(jù);/febd/?username=rzgc-pbi本案例:融智財(cái)經(jīng)大數(shù)據(jù)平臺(tái)的滬深A(yù)股上市公司信息首頁看板數(shù)據(jù);12345汪剛制作子任務(wù)五從其他數(shù)據(jù)源導(dǎo)入從Spark、Hadoop文件(HDFS)、R腳本、Python腳本等更多數(shù)據(jù)源獲取數(shù)據(jù);汪剛制作子任務(wù)六重新設(shè)定數(shù)據(jù)源當(dāng)把已經(jīng)設(shè)定數(shù)據(jù)源的文件移動(dòng)時(shí)(如發(fā)送給其他人員查詢、編輯,購書用戶下載演示文件后打開等情形),因設(shè)定數(shù)據(jù)源文件絕對路徑發(fā)生變化,就需要重新設(shè)定數(shù)據(jù)源;命令:主頁
轉(zhuǎn)換數(shù)據(jù)
數(shù)據(jù)源設(shè)置汪剛制作數(shù)據(jù)整理任務(wù)三汪剛制作任務(wù)三數(shù)據(jù)整理數(shù)據(jù)整理也叫數(shù)據(jù)處理、數(shù)據(jù)清洗;通過查詢編輯器PowerQuery對數(shù)據(jù)進(jìn)行整理和清洗;包括:類型轉(zhuǎn)換、拆分、提取、歸并等操作;汪剛制作子任務(wù)一查詢編輯器和M語言1.查詢編輯器查詢編輯器PowerQuery:當(dāng)需要對數(shù)據(jù)進(jìn)行整理和清洗時(shí),系統(tǒng)就會(huì)打開它;命令:主頁
轉(zhuǎn)換數(shù)據(jù)
轉(zhuǎn)換數(shù)據(jù);汪剛制作子任務(wù)一查詢編輯器和M語言2.M語言在查詢編輯器窗口,通過鼠標(biāo)進(jìn)行的每一步操作,后臺(tái)都會(huì)記錄下來并生成M語言代碼;執(zhí)行“主頁
高級編輯器”命令,可查看自動(dòng)生成的M語言代碼;對于初學(xué)用戶來說,不建議使用M語言代碼;汪剛制作子任務(wù)二數(shù)據(jù)的行、列操作和篩選1、數(shù)據(jù)的行操作汪剛制作子任務(wù)二數(shù)據(jù)的行、列操作和篩選(1)刪除行、首行升為列標(biāo)題【任務(wù)要求】刪除表中不需要的行,并將刪除行后的表格首行提升為列標(biāo)題【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\6-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為2013—2022國家財(cái)政收入年度數(shù)據(jù)。12345汪剛制作子任務(wù)二數(shù)據(jù)的行、列操作和篩選(2)刪除錯(cuò)誤行
【任務(wù)要求】刪除表中的錯(cuò)誤行【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\7-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為淘寶某店鋪的日訪問量和日銷售數(shù)據(jù)。123汪剛制作子任務(wù)二數(shù)據(jù)的行、列操作和篩選(3)刪除重復(fù)值
【任務(wù)要求】刪除表中的重復(fù)項(xiàng)【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\8-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某連鎖店的銷售數(shù)據(jù),需要將客戶的最大訂單銷售額保留在查詢表中。123汪剛制作子任務(wù)二數(shù)據(jù)的行、列操作和篩選2、數(shù)據(jù)的列操作選擇列可以通過選擇的方式將需要的列保留在查詢編輯器中;刪除列可以刪除選中的列或刪除選中列以外的列;【任務(wù)要求】刪除表中2013~2017年年度數(shù)據(jù)【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\9-數(shù)據(jù)整理.xlsx,此案例為2013-2022國家財(cái)政收入年度數(shù)據(jù)1汪剛制作子任務(wù)二數(shù)據(jù)的行、列操作和篩選3、數(shù)據(jù)的篩選操作實(shí)質(zhì)上是行操作;【任務(wù)要求】刪除表中不需要的數(shù)據(jù)行【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\10-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為2013-2022國家財(cái)政收入年度數(shù)據(jù)。123汪剛制作子任務(wù)三數(shù)據(jù)類型的轉(zhuǎn)換數(shù)據(jù)類型:數(shù)值類型、日期時(shí)間類型、文本類型、其他類型等;導(dǎo)入查詢編輯器中的數(shù)據(jù)類型與源表相比經(jīng)常會(huì)發(fā)生變化;【任務(wù)要求】將年度、月份字段數(shù)據(jù)恢復(fù)成源表中的文本型數(shù)據(jù)。【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\11-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為2024年1月份的日期表數(shù)據(jù)。1234汪剛制作子任務(wù)四數(shù)據(jù)格式的轉(zhuǎn)換汪剛制作子任務(wù)四數(shù)據(jù)格式的轉(zhuǎn)換【任務(wù)要求】刪除表中不正確的格式【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\12-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某健身會(huì)所會(huì)員信息。表中黃色標(biāo)出的為不正確的格式:(1)中文名字前后有空格;(2)中文名字中有多行回車符;(3)英文姓氏都為大寫(4)出生年份字段中存在多余的“年”字21345678汪剛制作子任務(wù)五數(shù)據(jù)的拆分、提取和合并1、數(shù)據(jù)的拆分汪剛制作子任務(wù)五數(shù)據(jù)的拆分、提取和合并1、數(shù)據(jù)的拆分【任務(wù)要求】將表中的中文名字字段拆分成姓和名兩個(gè)字段。【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\13-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某健身會(huì)所的會(huì)員信息。213456汪剛制作子任務(wù)五數(shù)據(jù)的拆分、提取和合并2、數(shù)據(jù)的提取汪剛制作子任務(wù)五數(shù)據(jù)的拆分、提取和合并2、數(shù)據(jù)的提取【任務(wù)要求】從表中的身份證號(hào)碼字段中提取出生年份信息?!救蝿?wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\14-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某健身會(huì)所的會(huì)員信息。123456汪剛制作子任務(wù)五數(shù)據(jù)的拆分、提取和合并3、數(shù)據(jù)的合并數(shù)據(jù)的合并是將選中的多列數(shù)據(jù)合并到一列中;“轉(zhuǎn)換”菜單的合并列后,原列刪除;“添加列”菜單的合并列后,原列保留;
【任務(wù)要求】將表中的英文姓名合并成一列,并把原列刪除。【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\15-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某健身會(huì)所的會(huì)員信息。123汪剛制作子任務(wù)六數(shù)據(jù)的轉(zhuǎn)置和反轉(zhuǎn)1、數(shù)據(jù)的轉(zhuǎn)置數(shù)據(jù)的轉(zhuǎn)置實(shí)現(xiàn)數(shù)據(jù)的行列互換;【任務(wù)要求】將表中的數(shù)據(jù)進(jìn)行列互換。【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\16-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某公司各月的銷售數(shù)據(jù)。1汪剛制作2子任務(wù)六數(shù)據(jù)的轉(zhuǎn)置和反轉(zhuǎn)2、數(shù)據(jù)的反轉(zhuǎn)反轉(zhuǎn)行,將行的順序顛倒;【任務(wù)要求】從數(shù)據(jù)表進(jìn)行反轉(zhuǎn)行操作。【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\17-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某公司各月的銷售數(shù)據(jù)。123汪剛制作子任務(wù)七數(shù)據(jù)的透視和逆透視1、數(shù)據(jù)的透視透視列可以將一維表轉(zhuǎn)換成二維表;【任務(wù)要求】將一維表透視成二維表?!救蝿?wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\18-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某公司四種產(chǎn)品各月的銷售數(shù)據(jù)。1234汪剛制作子任務(wù)七數(shù)據(jù)的透視和逆透視2、數(shù)據(jù)的逆透視逆透視可以將二維表轉(zhuǎn)換成一維表;【任務(wù)要求】將二維表透視成一維表?!救蝿?wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\19-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某公司四種產(chǎn)品各月的銷售數(shù)據(jù)231汪剛制作子任務(wù)八數(shù)據(jù)的分組依據(jù)分組依據(jù)類似于Excel中分類匯總功能;分組依據(jù)不僅有數(shù)據(jù)清洗,也具備了一定的數(shù)據(jù)分析功能;【任務(wù)要求】按客戶名稱統(tǒng)計(jì)各客戶的銷售總額。【任務(wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\20-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某公司的產(chǎn)品銷售數(shù)據(jù)。1234汪剛制作子任務(wù)九添加列汪剛制作子任務(wù)九添加列【任務(wù)要求】對月份字段創(chuàng)建索引列,對月份字段排序時(shí)按照索引序號(hào)作為排序依據(jù)?!救蝿?wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\21-數(shù)據(jù)整理.xlsx此案例數(shù)據(jù)原型為常用維度表日期表數(shù)據(jù)。月份默認(rèn)的排序依據(jù)為:10月、11月、12月、1月、2月、3月、4月、5月、6月、7月、8月、9月;通過設(shè)置索引列,可將其按正常順序排序:1月、2月、3月、4月、5月、6月、7月、8月、9月、10月、11月、12月。123汪剛制作子任務(wù)十日期和時(shí)間的整理汪剛制作子任務(wù)十日期和時(shí)間的整理【任務(wù)要求】提取日期字段中的年、月、季度和星期幾信息,并添加到新建列中?!救蝿?wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\22-數(shù)據(jù)整理.xlsx
此案例數(shù)據(jù)原型為某日期表數(shù)據(jù),根據(jù)日期表中的日期構(gòu)建年、月、日、星期幾等字段列。123汪剛制作子任務(wù)十一數(shù)據(jù)的基本運(yùn)算汪剛制作子任務(wù)十一數(shù)據(jù)的基本運(yùn)算【任務(wù)要求】數(shù)據(jù)的基本數(shù)學(xué)運(yùn)算?!救蝿?wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\23-數(shù)據(jù)整理.xlsx,此案例數(shù)據(jù)原型為某公司產(chǎn)品定價(jià)數(shù)據(jù)。12346758汪剛制作子任務(wù)十二數(shù)據(jù)的組合1、數(shù)據(jù)的追加查詢追加查詢是表與表之間的縱向組合;【任務(wù)要求】將兩張表做追加查詢?!救蝿?wù)數(shù)據(jù)】案例數(shù)據(jù)\項(xiàng)目4\24-數(shù)據(jù)整理.xlsx此案例數(shù)據(jù)原型為某電子公司產(chǎn)品銷售數(shù)據(jù)。表sheet1包含訂單編號(hào)、金額、客戶名稱3個(gè)字段,6條記錄;表sheet2包含訂單編號(hào)、客戶名稱、客戶省份、金額4個(gè)字段,5條記錄。12345汪剛制作子任務(wù)十二數(shù)據(jù)的組合2、數(shù)據(jù)的合并查詢合
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度醫(yī)院物業(yè)委托管理與維護(hù)合同4篇
- 2025年度個(gè)人向公司借款用于投資合作合同范本2篇
- 2025年度影視作品制作及版權(quán)運(yùn)營合同3篇
- 2024版院長聘用合同
- 2024裝修樣板間保密協(xié)議
- 2025年度智能家居產(chǎn)品承包加工合同4篇
- 2025年度智慧社區(qū)車位出售及智能停車解決方案合同4篇
- 2025年度咖啡館股權(quán)置換及品牌輸出合同3篇
- 2025年復(fù)雜斷塊油田項(xiàng)目可行性研究報(bào)告
- 2025年度體育場館運(yùn)營管理承包服務(wù)合同范本4篇
- 人教版(2025新版)七年級下冊英語:寒假課內(nèi)預(yù)習(xí)重點(diǎn)知識(shí)默寫練習(xí)
- 藝術(shù)品捐贈(zèng)協(xié)議
- 【公開課】同一直線上二力的合成+課件+2024-2025學(xué)年+人教版(2024)初中物理八年級下冊+
- 高職組全國職業(yè)院校技能大賽(嬰幼兒照護(hù)賽項(xiàng))備賽試題庫(含答案)
- 2024年公安部直屬事業(yè)單位招聘筆試參考題庫附帶答案詳解
- NB-T 47013.15-2021 承壓設(shè)備無損檢測 第15部分:相控陣超聲檢測
- 10KV供配電工程施工組織設(shè)計(jì)
- 終端攔截攻略
- 藥物外滲處理及預(yù)防【病房護(hù)士安全警示教育培訓(xùn)課件】--ppt課件
- 紙箱檢驗(yàn)標(biāo)準(zhǔn)新
評論
0/150
提交評論