版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)分析?具PandasPandas是做數(shù)據(jù)分析的基礎(chǔ)包,提供了靈活的數(shù)據(jù)結(jié)構(gòu)和其它?便進(jìn)?向量化計(jì)算的?具和函數(shù),使得Python也能夠像R語??樣?便地?于數(shù)據(jù)分析和處理。在Pandas中有兩種常?數(shù)據(jù)結(jié)構(gòu),分別是Series和DataFrame。Series是?種增強(qiáng)型的?維數(shù)組,與Python中的列表相似,由index(索引)和values(值)組成,Series中的值是相同的數(shù)據(jù)?DataFrame是增強(qiáng)型的?維數(shù)組,就像Excel中的表格,有?標(biāo)簽和列表索引,這種數(shù)據(jù)結(jié)構(gòu)在Pandas中最為常?。在做數(shù)據(jù)分析前,我們會(huì)約定俗成地引?Numpy、Pandas、Matplotlib三個(gè)?具包,并使?其簡稱np,pd,plt。numpy是科學(xué)計(jì)算基礎(chǔ)包,pandas依賴于numpy,?matplitlib是繪圖?具。(以下代碼均在IPython中完成,如果你已經(jīng)成功安裝了Anoconda,那么可以直接運(yùn)?ipython命令進(jìn)?)importimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotasInIn[30]:s=In[31]: dtype: InIn[42]:s=pd.Series(['a','b','c'],index=In[43]: dtype:InIn[50]:Out[50]:InIn[51]:s[:2] dtype:InIn[272]:s2=In[273]:s2 dtype:DataFrame對象,可以通過?相等?度的列表組成的字典對象來構(gòu)建DataFrameInIn[52]:data={'state':['Ohio','Ohio','Nevada','year':[2000,2001,2002,'pop':[1.5,1.7,3.6,In[54]:df=In[55]: state0 Ohio1 Ohio2 Ohio32.4Nevada42.9Nevada也可以通過Numpy的?維數(shù)組來構(gòu)建隨機(jī)?成6?4In[58]:df=In[59]:01230123-45還可以從csv?件、數(shù)據(jù)庫中獲取,現(xiàn)在先來熟悉DataFrame?屬性和操作?法,以便后續(xù)能夠靈活運(yùn)?PandasDataFrame既有?索引(index)也有列索引(columns),構(gòu)建DataFrame時(shí)可以指定每?的名字和每列的名字,例如下?的DataFrame?時(shí)間作為?索引,字?A、B、C、D作為列索引。In[61]:dates=In[62]:dates01-03','2013-01-In[63]:df=In[64]:ABCDIn[79]:Out[79]:Index(['A','B','C',In[80]:df.index01-03','2013-01-In[81]:df.valuesarray([[0.51328621,-1.475824,[-0.51829132,1.34522999,1.2847668[-0.43486491,-0.46422712,[0.65441841,-0.99424111,[1.54027403,-0.22712424,[0.88815632,1.93229088,head返回DataFrame的頭部數(shù)據(jù)(默認(rèn)返回表格中的前5?數(shù)In[70]:ABCDtail(DataFrame的尾部數(shù)據(jù)(默認(rèn)返回表格中的最后5?數(shù)In[72]:ABCD按照列索引的降序排列:D->C->B-In[96]:df.sort_index(axis=1,ADCBIn[97]:df.sort_index(axis=0,ascending=False)DABC0.513286-根據(jù)BIn[99]:ABCD先按A的升序排,再按BIn[161]:df.sort_values(by=['A','B'],ascending=[True,False])ADBC2013-01-02-2013-01-03-Freq:D,Name:A,dtype:選擇多列,返回DataFrame對象In[102]:df[['A','B']]ABIn[101]:ABCD通過loc、.ilocABABDABC In[115]:ABCDInIn[121]:4ABC dtype:In[157]:ABCD[159]: dtype:In1111111groupby添加EIn[255]:df['E']=In[256]:df DE2013-01-0100:00:002013-01-0200:00:00-1.2847672013-01-2013-01-0300:00:00-2013-01-042.8166232
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【新課標(biāo)Ⅲ卷】高三第二次全國大聯(lián)考語文試卷(含答案)
- 愛學(xué)習(xí)有自信幼兒舞蹈創(chuàng)編15課件講解
- 2025年專業(yè)期刊發(fā)行協(xié)議
- 2025年合伙勞動(dòng)分工協(xié)議
- 2025年教育捐贈(zèng)合同樣本
- 2025年度教育機(jī)構(gòu)教學(xué)質(zhì)量擔(dān)保合同全文4篇
- 2025版危品運(yùn)輸企業(yè)安全文化建設(shè)合同3篇
- 2024版智能家居系統(tǒng)集成安裝合同
- 2025年留學(xué)家庭教育咨詢與心理輔導(dǎo)服務(wù)合同4篇
- 2025版學(xué)生入學(xué)校園體育設(shè)施維護(hù)與服務(wù)合同2篇
- 2024公路瀝青路面結(jié)構(gòu)內(nèi)部狀況三維探地雷達(dá)快速檢測規(guī)程
- 2024年高考真題-地理(河北卷) 含答案
- 2024光儲(chǔ)充一體化系統(tǒng)解決方案
- 處理后事授權(quán)委托書
- 食材配送服務(wù)方案投標(biāo)方案(技術(shù)方案)
- 足療店?duì)I銷策劃方案
- 封條(標(biāo)準(zhǔn)A4打印封條)
- 2024年北京控股集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 延遲交稿申請英文
- 運(yùn)動(dòng)技能學(xué)習(xí)與控制課件第十章動(dòng)作技能的指導(dǎo)與示范
- 石油天然氣建設(shè)工程交工技術(shù)文件編制規(guī)范(SYT68822023年)交工技術(shù)文件表格儀表自動(dòng)化安裝工程
評論
0/150
提交評論