版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
常見(jiàn)的數(shù)據(jù)分析工具教師:亢華愛(ài)北京信息職業(yè)技術(shù)學(xué)院商務(wù)數(shù)據(jù)分析與應(yīng)用專(zhuān)業(yè)教學(xué)資源庫(kù)數(shù)據(jù)收集
Python本身的數(shù)據(jù)分析功能并不強(qiáng),需要安裝一些第三方的擴(kuò)展庫(kù)來(lái)增強(qiáng)它的能力。我們課程用到的庫(kù)包括NumPy、Pandas、Matplotlib、Seaborn.NLTK等,本節(jié)課程我們將針對(duì)相關(guān)庫(kù)做一個(gè)簡(jiǎn)單的介紹,方便后面章節(jié)的學(xué)習(xí)。目錄Seaborn庫(kù)ContentsMatplotlib庫(kù)Pandas庫(kù)NumPy庫(kù)NLTK庫(kù)1PARTNumPy庫(kù)NumPy庫(kù)NumPy是Python開(kāi)源的數(shù)值計(jì)算擴(kuò)展工具,它提供了Python對(duì)多維數(shù)組的支持,能夠支持高級(jí)的維度數(shù)組與矩陣運(yùn)算。此外,針對(duì)數(shù)組運(yùn)算也提供了大量的數(shù)學(xué)函數(shù)庫(kù)。NumPy是大部分Python科學(xué)計(jì)算的基礎(chǔ)。NumPy庫(kù)具有以下功能:(4)矩陣運(yùn)算。無(wú)需循環(huán)即可完成類(lèi)似Matlah中的矢量運(yùn)算。(5)線性代數(shù)、隨機(jī)數(shù)生成以及傅里葉變換功能。(1)快速高效的多維數(shù)據(jù)對(duì)象ndarray。(2)高性能科學(xué)計(jì)算和數(shù)據(jù)分析的基礎(chǔ)包。(3)多維數(shù)組(矩陣)具有矢量運(yùn)算能力,快速且節(jié)省空間。NumPy庫(kù)在調(diào)用NumPy庫(kù)之前,先確保安裝了NumPy庫(kù)(該內(nèi)容在1.6.3中有相關(guān)介紹)NumPy庫(kù)安裝了Numpy之后,可以用Numpy簡(jiǎn)單創(chuàng)建數(shù)組:importnumpyasnpa=[1,2,3]b=np.array(a)c=np.array([[0,1,2,10],[12,13,100,101],[102,110,112,113]],int)print(c)print(b)2PARTPandas庫(kù)Pandas庫(kù)Pandas是一個(gè)基于NumPy的數(shù)據(jù)分析包,它是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas中納入了大量庫(kù)和標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需要的函數(shù)和方法,使用戶能快速便捷地處理數(shù)據(jù)。Python與Pandas在各種學(xué)術(shù)和商業(yè)領(lǐng)域中都有應(yīng)用,包括金融、神經(jīng)科學(xué)、經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)學(xué)、廣告、網(wǎng)絡(luò)分析等。Pandas庫(kù)Pandas庫(kù)的功能:(4)基于標(biāo)簽切片和花式索引獲取數(shù)據(jù)集的子集。(5)可以刪除或插入來(lái)自數(shù)據(jù)結(jié)構(gòu)的列。(1)一個(gè)快速高效的DataFrame對(duì)象,具有默認(rèn)和自定義的索引。(2)用于在數(shù)據(jù)結(jié)構(gòu)和不同文件格式中讀取和寫(xiě)入數(shù)據(jù),如word、Excel及SQLite數(shù)據(jù)庫(kù)。(3)智能數(shù)據(jù)對(duì)齊和缺失數(shù)據(jù)的集成處理。(6)按數(shù)據(jù)分組進(jìn)行聚合和轉(zhuǎn)換。(7)高性能的數(shù)據(jù)合并和連接。(8)時(shí)間序列功能。Pandas庫(kù)安裝了Pandas之后,可以用Pandas簡(jiǎn)單創(chuàng)建數(shù)組:importpandasaspdser_obj=pd.Series([1,2,3,4,5])ser_obj3PARTMatplotlib庫(kù)Matplotlib庫(kù)Matplotlib是一個(gè)用在Python中繪制數(shù)組的2D圖形庫(kù),雖然它起源于模仿Matlab圖形命令,但它獨(dú)立于Matlab,可以通過(guò)Pythonic和面向?qū)ο蟮姆绞绞褂?,是Python中最出色的繪圖庫(kù)。Matplotlib主要用純Python語(yǔ)言進(jìn)行編寫(xiě),但它大量使用NumPy和其他擴(kuò)展代碼,即使對(duì)大型數(shù)組也能提供良好的性能。4PARTSeaborn庫(kù)Seaborn庫(kù)Seaborn是Python中基于Matplotlib的數(shù)據(jù)可視化工具,它提供了很多高層封裝的函數(shù),幫助數(shù)據(jù)分析人員快速繪制美觀的數(shù)據(jù)圖形,從而避免了許多額外的參數(shù)配置問(wèn)題。5PARTNLTK庫(kù)NLTK庫(kù)NLTK被稱為“使用Python進(jìn)行教學(xué)和計(jì)算語(yǔ)言學(xué)工作的絕佳工具”,以及“用自然語(yǔ)言進(jìn)行游戲的神奇圖書(shū)館”。NLTK是一個(gè)領(lǐng)先的平臺(tái),用于構(gòu)建使用人類(lèi)語(yǔ)言數(shù)據(jù)的Python程序,它為超過(guò)50個(gè)語(yǔ)料庫(kù)和詞匯資源(如WordNet)提供了易于使用的接口,還提供了一套文本處理庫(kù),用于分類(lèi)、標(biāo)記化、詞干化、解析和語(yǔ)義推理、NLP庫(kù)的包裝器和一個(gè)活躍的討論論壇。參考文獻(xiàn)[1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- (3篇)2024大學(xué)輔導(dǎo)員個(gè)人工作總結(jié)
- 教師政治思想及職業(yè)道德方面的考核報(bào)告
- 2024年淮南聯(lián)合大學(xué)高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(kù)(頻考版)含答案解析
- 烏魯木齊市八年級(jí)上學(xué)期期末地理試題及答案
- 二零二五年旅游開(kāi)發(fā)項(xiàng)目合同2篇
- 2024年陜西省婦幼保健院高層次衛(wèi)技人才招聘筆試歷年參考題庫(kù)頻考點(diǎn)附帶答案
- 2024年河南藝術(shù)職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫(kù)含答案解析
- 2024年阜陽(yáng)市第三人民醫(yī)院阜陽(yáng)市中心醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫(kù)頻考點(diǎn)附帶答案
- 2024年長(zhǎng)春市婦產(chǎn)科醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫(kù)頻考點(diǎn)附帶答案
- 2024年江西工商職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(kù)(頻考版)含答案解析
- 健康食品開(kāi)發(fā)及生產(chǎn)協(xié)議
- 數(shù)字孿生產(chǎn)業(yè)發(fā)展及軌道交通領(lǐng)域的應(yīng)用研究
- 2024年中學(xué)總務(wù)處工作總結(jié)
- 手術(shù)室各級(jí)人員培訓(xùn)
- 教育部中國(guó)特色學(xué)徒制課題:基于中國(guó)特色學(xué)徒制的新形態(tài)教材建設(shè)與應(yīng)用研究
- 2025年護(hù)理質(zhì)量與安全管理工作計(jì)劃
- (T8聯(lián)考)2025屆高三部分重點(diǎn)中學(xué)12月第一次聯(lián)考評(píng)物理試卷(含答案詳解)
- 工程施工揚(yáng)塵防治教育培訓(xùn)
- 紅薯采購(gòu)合同模板
- 2023年河南省公務(wù)員錄用考試《行測(cè)》真題及答案解析
- 山西省太原市重點(diǎn)中學(xué)2025屆物理高一第一學(xué)期期末統(tǒng)考試題含解析
評(píng)論
0/150
提交評(píng)論