




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
引入案例任務(wù)分析知識(shí)解析案例解析任務(wù)實(shí)訓(xùn)實(shí)訓(xùn)評(píng)價(jià)4.2.1直接篩選4.2.2索引器篩選4.2.3條件篩選任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選任務(wù)4.2
利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選引入案例美創(chuàng)科技有限公司財(cái)務(wù)人員小王想要從企業(yè)員工加班工資表.xlsx(位置:E:\file\)中篩選出部門為基本生產(chǎn)車間并且加班費(fèi)高于1600元以上的員工數(shù)據(jù),在Pandas中該如何實(shí)現(xiàn)呢?任務(wù)分析從Excel文件導(dǎo)入到Python中的DataFrame數(shù)據(jù)包含了很多信息,通常需要從原始DataFrame數(shù)據(jù)中篩選一部分信息做分析。根據(jù)不同的情況,可以采用直接篩選、條件篩選和索引器篩選從DataFrame對(duì)象中選取數(shù)據(jù)。知識(shí)解析在對(duì)數(shù)據(jù)做相應(yīng)操作之前,應(yīng)先篩選出所需的數(shù)據(jù)。DataFrame對(duì)象的數(shù)據(jù)訪問類似于二維數(shù)組,可以通過值的位置序號(hào)獲取,同時(shí)由于行、列都關(guān)聯(lián)了索引標(biāo)簽,也可以通過索引來進(jìn)行訪問。DataFrame對(duì)象的數(shù)據(jù)篩選可分為直接篩選、條件篩選和索引器篩選三種。任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選4.2.1
直接篩選篩選方式語法格式選取某列DataFrame[col],其中col表示列名。選取多列DataFrame[colList],其中colList表示列名組成的列表。選取多行(切片)或某行DataFrame[index1:index2],其中index表示行自定義索引。說明:采用自定義索引,當(dāng)index1=index2時(shí)表示選擇某一行。②DataFrame[num1:num2],其中num表示行原始索引。說明:采用原始索引,當(dāng)數(shù)字連續(xù)時(shí)表示選擇某一行。選取多行多列DataFrame[colList][index1:index2]DataFrame[colList][num1:num2]【請(qǐng)注意】(1)采用直接篩選選取連續(xù)多列不能采用切片操作,只能采用列表的形式;(2)在進(jìn)行多行多列直接篩選時(shí),一般要先進(jìn)行列篩選,然后再進(jìn)行行篩選。任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選
【做中學(xué)4.2.1】讀入fin_data.xlsx(位置:E:\file\)中的第一個(gè)表格,使用采用篩選方式進(jìn)行數(shù)據(jù)選取?!咀鲋袑W(xué)4.2.1】解析如下:導(dǎo)入Excel表格數(shù)據(jù)并查看。其程序如下:importpandasaspd#導(dǎo)入Pandas模塊#讀取Excel文件df=pd.read_excel(r'E:\file\fin_data.xlsx',sheet_name="資產(chǎn)負(fù)債表項(xiàng)目",
converters={'年':str,'月':str})df.head()#查看前5行數(shù)據(jù)STEP01任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選選取某一列。其程序如下:df['平均流動(dòng)負(fù)債'].head()STEP02選取多列。其程序如下:df[['年','平均流動(dòng)資產(chǎn)','平均所有者權(quán)益']].head()STEP03選取多行。其程序如下:df[0:3]#利用行索引選取數(shù)據(jù),區(qū)間前閉后開STEP04選取多行多列。其程序如下:df[['平均流動(dòng)資產(chǎn)','平均非流動(dòng)資產(chǎn)']][1:4]STEP05任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選4.2.2索引器篩選loc索引器優(yōu)先使用自定義索引,如果數(shù)據(jù)中沒有自定義索引,則使用原始索引,根據(jù)行索引和列索引進(jìn)行選取,先行后列,也可以只選取行。采用loc索引器形成的篩選方式及語法格式如下表所示。篩選方式語法格式①選取單行DataFrame.loc[index]②選取不連續(xù)多行DataFrame.loc[indexList]③選取連續(xù)多行DataFrame.loc[index1:index2]④選取單列DataFrame.loc[:,col]⑤選取不連續(xù)多列DataFrame.loc[:,colList]⑥選取連續(xù)多列DataFrame.loc[:,col1:col2]⑦選取不連續(xù)多行多列DataFrame.loc[indexList,colList]⑧選取連續(xù)多行多列DataFrame.loc[index1:index2,col1:col2]【請(qǐng)注意】①在進(jìn)行多行多列數(shù)據(jù)篩選時(shí),列表和切片可聯(lián)合使用;②loc索引器不能直接選取列,必須先行后列。任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選
【做中學(xué)4.2.2】讀入fin_data2.xlsx(位置:E:\file\)中的第一個(gè)表格,并使用上表中列舉的篩選方式進(jìn)行數(shù)據(jù)選取。
【做中學(xué)4.2.2】解析如下:導(dǎo)入Excel表格數(shù)據(jù)并查看。其程序如下:importpandasaspd#引入Pandas模塊#讀取Excel文件中的第一張表格數(shù)據(jù)df=pd.read_excel(r'E:\file\fin_data.xlsx',sheet_name=0,converters={'年':str,'月':str})df.head()#查看df的前5行數(shù)據(jù)STEP01任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選選取單行。其程序如下:df.loc[2]#選取索引為2的行數(shù)據(jù)STEP02選取不連續(xù)多行。其程序如下:df.loc[[1,3]]#選取行索引為1和3兩行的數(shù)據(jù)STEP03選取連續(xù)多行。其程序如下:df.loc[1:3]#選取連續(xù)3行數(shù)據(jù)STEP04選取單列。其程序如下:df.loc[:,'平均所有者權(quán)益'].head()STEP05任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選選取不連續(xù)多列。其程序如下:df.loc[:,['平均流動(dòng)資產(chǎn)','平均所有者權(quán)益']].head()STEP06選取連續(xù)多列。其程序如下:df.loc[:,'平均流動(dòng)負(fù)債':'平均所有者權(quán)益'].head()STEP07選取不連續(xù)多行多列。其程序如下:df.loc[[1,3],['平均流動(dòng)資產(chǎn)','平均所有者權(quán)益']]STEP08選取連續(xù)多行多列。其程序如下:df.loc[1:3,'平均流動(dòng)負(fù)債':'平均所有者權(quán)益']STEP09任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選4.2.3條件篩選語法格式舉例說明DataFrame[conditon]根據(jù)列條件選擇行df[df[col]==value]表示選取某列滿足一定條件的行df[(df[col1]==value)&(df[col2]>value)]表示選取多列滿足一定條件的行根據(jù)行索引選擇行df[df.index==’行索引’]表示選擇單行df[(df.index==’行索引’)|df.index==’行索引’)]表示選擇兩行,可使用“|”選擇更多行DataFrame.loc[condition,cols]表示選取滿足條件的行及指定列種類符號(hào)及含義比較運(yùn)算符<(小于)、<=(小于等于)、>(大于)、>=(大于等于)、!=(不等于)、==(等于)邏輯運(yùn)算符&(與)、|(或)、~(取反)【請(qǐng)注意】條件表達(dá)式可以使用操作符&、|、~,但是不能使用關(guān)鍵詞and、or、not。任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選
【做中學(xué)4.2.3】讀入fin_data.xlsx(位置:E:\file\)中的第一個(gè)表格,并使用上表中列舉的篩選方式進(jìn)行數(shù)據(jù)選取。導(dǎo)入Excel表格數(shù)據(jù)并查看前5行數(shù)據(jù)。其程序如下:importpandasaspd#引入Pandas模塊#讀取Excel文件中的第一張表格數(shù)據(jù)df=pd.read_excel(r'E:\file\fin_data.xlsx',sheet_name=0,converters={'年':str,'月':str})df.head()#查看前5行數(shù)據(jù)STEP01【做中學(xué)4.2.3】解析如下:任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選采用DataFrame[conditon]方式根據(jù)某一列滿足的一定條件選取行數(shù)據(jù)的程序如下:df[df['年']=='2023'] #選取年列的列值為2023的數(shù)據(jù)STEP02任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選采用DataFrame[conditon]方式,根據(jù)多列滿足一定條件選取行數(shù)據(jù)的程序如下:df[(df['年']=='2023')&(df['平均所有者權(quán)益']<2000000)]STEP03采用DataFrame.loc[condition,cols]方式選取數(shù)據(jù)的程序如下:df.loc[df['平均所有者權(quán)益']<1900000,['年','月','平均所有者權(quán)益']]STEP04任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選案例解析讀入企業(yè)員工加班工資表.xlsx(位置:E:\file\)。程序如下:importpandasaspd#導(dǎo)入Pandas模塊df=pd.read_excel(r'E:\file\企業(yè)員工加班工資表.xlsx')df.head()#查看前5行數(shù)據(jù)STEP01任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選篩選出部門為基本生產(chǎn)車間并且加班工資高于1600元以上的數(shù)據(jù)。程序如下:df[(df['部門']=='基本生產(chǎn)車間')&(df['加班費(fèi)']>1600)]STEP02任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選任務(wù)實(shí)訓(xùn)
請(qǐng)上機(jī)編寫程序?qū)崿F(xiàn)以下要求:讀取企業(yè)員工加班工資表.xlsx(位置:E:\file\),使用條件篩選的兩種方式從企業(yè)員工加
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45212-2025化妝品中甲基二溴戊二腈的測定氣相色譜法
- 度小企業(yè)勞動(dòng)合同模板大全
- 專利代理保密合同范本
- 2花的學(xué)校教學(xué)設(shè)計(jì)-2024-2025學(xué)年三年級(jí)上冊(cè)語文統(tǒng)編版
- 銷售優(yōu)惠合同模板
- 合同樣本:租賃合同示范文本
- 土地測繪項(xiàng)目合同書模板
- 農(nóng)村林地承包權(quán)交易合同范文
- 內(nèi)河航運(yùn)人身意外傷害保險(xiǎn)合同
- 10牛郎織女(一)(教學(xué)設(shè)計(jì))-2024-2025學(xué)年統(tǒng)編版語文五年級(jí)上冊(cè)
- 2024年廣西職業(yè)院校技能大賽中職組《智慧物流作業(yè)》模塊MC競賽樣題
- 人事專員簡歷模板
- 超聲心動(dòng)圖診斷心肌病臨床應(yīng)用指南解讀
- 地面工程油氣集輸工藝介紹
- 消防設(shè)施維保服務(wù)投標(biāo)方案
- 城市軌道交通車輛電氣控制 課件 趙麗 第1-4章 城市軌道交通車輛電氣控制系統(tǒng)構(gòu)成、城市軌道交通車輛輔助供電系統(tǒng)、電動(dòng)列車常用電氣控制系統(tǒng)及其控制方法
- (2024年)新版黃金基礎(chǔ)知識(shí)培訓(xùn)課件
- 資產(chǎn)拆除報(bào)廢申請(qǐng)表
- 《社區(qū)康復(fù)》課件-第九章 言語障礙患者的社區(qū)康復(fù)實(shí)踐
- 萬千教育學(xué)前讓幼兒都愛學(xué)習(xí):幼兒園高質(zhì)量學(xué)習(xí)活動(dòng)設(shè)計(jì)與組織
- 2024年長沙職業(yè)技術(shù)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
評(píng)論
0/150
提交評(píng)論