




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第四章
數(shù)據(jù)處理與應(yīng)用4.2
大數(shù)據(jù)處理4.2.2編程處理數(shù)據(jù)學(xué)習(xí)目標(biāo)掌握pandas模塊的兩種數(shù)據(jù)結(jié)構(gòu)Series和DataFrame。學(xué)習(xí)使用pandas模塊對(duì)數(shù)據(jù)進(jìn)行編輯、計(jì)算、統(tǒng)計(jì)、分析。能選用合適的方法和軟件對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單可視化。掌握運(yùn)用matplotlib的pyplot子庫(kù)的方法,學(xué)習(xí)和體會(huì)編程處理數(shù)據(jù)的方法和優(yōu)勢(shì)。使用Python語(yǔ)言編程進(jìn)行數(shù)據(jù)分析和挖掘,可以調(diào)用Python的擴(kuò)展模塊。Python常用數(shù)據(jù)處理拓展模塊:Numpy模塊:
科學(xué)運(yùn)算的基礎(chǔ)庫(kù),主要提供科學(xué)計(jì)算中常用的隨機(jī)數(shù)、數(shù)組運(yùn)算等基礎(chǔ)函數(shù)。Scipy模塊:
基于numpy構(gòu)建的一個(gè)模塊,增強(qiáng)了在高等數(shù)學(xué)、信號(hào)處理、圖像處理、統(tǒng)計(jì)等方面的處理能力。Pandas模塊:
基于numpy實(shí)現(xiàn),提供了大量處理數(shù)據(jù)的函數(shù)和方法,能方便地操作大型數(shù)據(jù)集。Matplotlib模塊:
繪圖庫(kù),使用pyplot子庫(kù)中的函數(shù)快速繪圖和設(shè)置圖表坐標(biāo)軸、坐標(biāo)軸刻度、圖例等。知識(shí)點(diǎn)一:利用pandas模塊處理數(shù)據(jù)新課講授pandas提供了Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu),可完成數(shù)據(jù)整理、計(jì)算、統(tǒng)計(jì)、分析及簡(jiǎn)單可視化。在Python中引入pandas模塊的方法如下:importpandasaspdPython模塊的導(dǎo)入——import語(yǔ)句:導(dǎo)入函數(shù)或模塊到python代碼中,實(shí)現(xiàn)代碼復(fù)用。可為模塊或函數(shù)指定別名。import
模塊名
調(diào)用:模塊名.函數(shù)名()from模塊名import函數(shù)名
調(diào)用:函數(shù)名()importmath
math.sqrt(64)frommathimportsqrt
sqrt(64)import模塊名as別名
調(diào)用:別名.函數(shù)名()from模塊名import函數(shù)名
as別名
調(diào)用:別名()importmathassx
sx.sqrt(64)frommathimportsqrtassq
sq(64)1.一維數(shù)據(jù)結(jié)構(gòu)——Series包含一個(gè)數(shù)組的數(shù)據(jù)(values)和一個(gè)與數(shù)據(jù)關(guān)聯(lián)的索引(index),索引值默認(rèn)是從0起遞增的整數(shù)。列表、字典等能用來(lái)創(chuàng)建Series數(shù)據(jù)結(jié)構(gòu),與列表不同的是,Series的索引可以指定,類(lèi)型可以為字符串型。(1)創(chuàng)建Series對(duì)象(2)查看Series對(duì)象中的數(shù)據(jù)2.二維數(shù)據(jù)結(jié)構(gòu)——DataFrame由1個(gè)索引列(index)和若干個(gè)數(shù)據(jù)列組成,每個(gè)數(shù)據(jù)列可以是不同的類(lèi)型。DataFrame可以看作是共享同一個(gè)index的Series的集合。行索引類(lèi)似于關(guān)系表中每行的編號(hào),列標(biāo)題類(lèi)似于表格的列名(也稱(chēng)為字段)。(1)創(chuàng)建DataFrame對(duì)象(2)查看DataFrame對(duì)象中的數(shù)據(jù)(3)DataFrame常用函數(shù)DataFrame數(shù)據(jù)結(jié)構(gòu)提供了豐富的函數(shù),這些函數(shù)可以用來(lái)進(jìn)行行、列編輯和統(tǒng)計(jì)計(jì)算等。知識(shí)點(diǎn)二:利用matplotlib模塊繪圖matplotlib是一個(gè)繪圖庫(kù),使用其中的pyplot子庫(kù)所提供的函數(shù)可以快速繪圖和設(shè)置圖表的坐標(biāo)軸、坐標(biāo)軸刻度、圖例等。在Python中引入matplotlib的pyplot子庫(kù)的方法為:importmatplotlib.pyplotasplt1.有Python程序段如下:importpandasaspdpd1=pd.Series([1,2,3,4])print(pd1.index)該程序段運(yùn)行后輸出結(jié)果為()A.
B.
C.
D.0112122323343445隨堂練習(xí)A2.某DataFrame對(duì)象df,其中包含1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 保潔工作補(bǔ)充合同范例
- 人才經(jīng)紀(jì)服務(wù)合同范例
- 會(huì)議現(xiàn)場(chǎng)拍攝合同樣本
- 個(gè)人現(xiàn)金抵押借款合同范例
- 借用食品資質(zhì)合同范例
- 2025-2030年中國(guó)二氫丹參酮行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 辨別真?zhèn)蔚馁|(zhì)量工程師試題及答案
- 2025-2030年中國(guó)中止門(mén)行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 個(gè)人深圳租房合同范例
- 2025-2030年中國(guó)三聚磷酸鋁行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025年內(nèi)蒙古中煤蒙大新能源化工有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 無(wú)人機(jī)測(cè)量課件
- 插畫(huà)版權(quán)授權(quán)協(xié)議書(shū)
- 安裝鋼結(jié)構(gòu)平臺(tái)合同協(xié)議
- 地理西亞+課件-2024-2025學(xué)年七年級(jí)地理下冊(cè)人教版
- 放射科質(zhì)量管理制度
- 科研助理筆試題庫(kù)及答案
- 2024年中華醫(yī)學(xué)會(huì)招聘考試真題
- 產(chǎn)品上市計(jì)劃
- 醫(yī)院物業(yè)管理服務(wù)合同-范本
- 綜合執(zhí)法考試試題及答案
評(píng)論
0/150
提交評(píng)論