




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第Python批量操作Excel文件詳解目錄批量操作OS模塊介紹OS模塊基本操作獲取當(dāng)前工作路徑獲取一個(gè)文件夾下的所有文件名對(duì)文件名進(jìn)行重命名創(chuàng)建一個(gè)文件夾刪除一個(gè)文件夾刪除一個(gè)文件利用OS模塊進(jìn)行批量操作批量讀取一個(gè)文件下的多個(gè)文件批量創(chuàng)建文件夾批量重命名文件其他批量操作批量合并多個(gè)文件將一份文件按照指定列拆分成多個(gè)文件
批量操作
OS模塊介紹
OS的全稱是OperationSystem,指操作系統(tǒng)。在Python里面OS模塊中主要提供了與操作系統(tǒng)即電腦系統(tǒng)之間進(jìn)行交互的一些功能。我們很多的自動(dòng)化操作都會(huì)依賴于該模塊的功能。
OS模塊基本操作
獲取當(dāng)前工作路徑
我們?cè)谧铋_始Python基礎(chǔ)知識(shí)那一章節(jié)給講了如何安裝Anaconda以及如何利用Jupyternotebook寫代碼??墒悄銈冎滥銈儗懺贘upyternotebook里面的代碼存儲(chǔ)在電腦的哪里嗎?
是不是很多同學(xué)不知道?想要知道也很簡(jiǎn)單,只需要在Jupyternotebook中輸入如下代碼,然后運(yùn)行:
importos
os.getcwd()
運(yùn)行上面代碼會(huì)得到如下結(jié)果:
'C:\\Users\\zhangjunhong\\python庫\\Python報(bào)表自動(dòng)化'
上面這個(gè)文件路徑就是此時(shí)notebook代碼文件所在的路徑,你的代碼存儲(chǔ)在哪個(gè)文件路徑下,運(yùn)行就會(huì)得到對(duì)應(yīng)結(jié)果。
獲取一個(gè)文件夾下的所有文件名
我們經(jīng)常會(huì)將電腦本地的文件導(dǎo)入到Python中來處理,在導(dǎo)入之前需要知道文件的存儲(chǔ)路徑以及文件名。如果只有一兩個(gè)文件的話還好,我們直接把文件名和文件路徑手動(dòng)輸入即可,但是有的時(shí)候需要導(dǎo)入的文件會(huì)有很多。這個(gè)時(shí)候手動(dòng)輸入效率就會(huì)比較低,就需要借助代碼來提高效率。
如下文件夾中有四個(gè)Excel文件:
我們可以使用os.listdir(path)來獲取path路徑下所有的文件名。具體實(shí)現(xiàn)代碼如下:
importos
os.listdir('D:/Data-Science/share/data/test')
運(yùn)行上面代碼會(huì)得到如下結(jié)果:
['3月績(jī)效-張明明.xlsx','李旦3月績(jī)效.xlsx','王玥月-3月績(jī)效.xlsx','陳凱3月份績(jī)效.xlsx']
對(duì)文件名進(jìn)行重命名
對(duì)文件進(jìn)行重命名也是比較高頻的一種需求,我們可以利用os.rename('old_name','new_name')來對(duì)文件進(jìn)行重命名。old_name就是舊文件名,new_name就是新文件名。
我們先在test文件夾下面新建一個(gè)名為test_old的文件,然后再利用如下代碼,就可以把test_old文件名改成test_new:
os.rename('D:/Data-Science/share/data/test/test_old.xlsx'
,'D:/Data-Science/share/data/test/test_new.xlsx')
運(yùn)行上面代碼以后,再到test文件夾下面,就可以看到test_old文件已經(jīng)不存在了,只有test_new。
創(chuàng)建一個(gè)文件夾
當(dāng)我們想要在指定路徑下創(chuàng)建一個(gè)新的文件夾時(shí),可以選擇手動(dòng)新建文件夾,也可以利用os.mkdir(path)進(jìn)行新建,只需要指明具體的路徑(path)即可。
如下所示,當(dāng)我們運(yùn)行下面代碼,就表示在D:/Data-Science/share/data路徑下新建一個(gè)名為test11的文件夾:
os.mkdir('D:/Data-Science/share/data/test11')
刪除一個(gè)文件夾
刪除文件夾與創(chuàng)建文件夾是相對(duì)應(yīng)的,當(dāng)然了,我們也可以選擇手動(dòng)刪除一個(gè)文件夾,也可以利用os.removedirs(path)進(jìn)行刪除,指明要?jiǎng)h除的路徑(path)。
如下所示,當(dāng)我們運(yùn)行如下代碼,就表示把剛剛創(chuàng)建的test11文件夾刪除了:
os.removedirs('D:/Data-Science/share/data/test11')
刪除一個(gè)文件
刪除文件時(shí)刪除一個(gè)具體的文件,而刪除文件夾是將一整個(gè)文件夾,包含文件夾中的所有文件進(jìn)行刪除。刪除文件利用的是os.remove(path),指明文件所在的路徑(path)。
如下所示,當(dāng)我們運(yùn)行如下代碼,就表示將test文件夾中test_new文件進(jìn)行刪除:
os.remove('D:/Data-Science/share/data/test/test_new.xlsx')
利用OS模塊進(jìn)行批量操作
批量讀取一個(gè)文件下的多個(gè)文件
有的時(shí)候一個(gè)文件夾下面會(huì)包含多個(gè)相類似的文件,比如一個(gè)部門不同人的績(jī)效文件,我們需要把這些文件批量讀取到Python里面中,然后進(jìn)行處理。
我們?cè)谇懊鎸W(xué)過,如何讀取一個(gè)文件,可以用load_work,也可以用read_excel,不管用哪種方式,都只需要指明要讀取文件的路徑即可。
那如何批量讀取呢?先獲取該文件下的所有文件名,然后再遍歷讀取每一個(gè)文件。具體實(shí)現(xiàn)代碼如下所示:
importpandasaspd
#獲取文件夾下的所有文件名
name_list=os.listdir('D:/Data-Science/share/data/test')
#for循環(huán)遍歷讀取
foriinname_list:
df=pd.read_excel(r'D:/Data-Science/share/data/test/'+i)
print('{}讀取完成!'.format(i))
如果要對(duì)讀取進(jìn)來的文件進(jìn)行數(shù)據(jù)操作的時(shí)候,把具體的操作實(shí)現(xiàn)代碼放置在讀取代碼之后即可。比如我們要對(duì)每一個(gè)讀取進(jìn)來的文件進(jìn)行刪除重復(fù)值處理,實(shí)現(xiàn)代碼如下:
importpandasaspd
#獲取文件夾下的所有文件名
name_list=os.listdir('D:/Data-Science/share/data/test')
#for循環(huán)遍歷讀取
foriinname_list:
df=pd.read_excel(r'D:/Data-Science/share/data/test/'+i)
df=df.drop_duplicates()#刪除重復(fù)值處理
print('{}讀取完成!'.format(i))
批量創(chuàng)建文件夾
有的時(shí)候我們需要根據(jù)特定的主題來創(chuàng)建特定的文件夾,比如需要根據(jù)月份創(chuàng)建12個(gè)文件夾。我們前面學(xué)過如何創(chuàng)建單個(gè)文件夾,要批量創(chuàng)建多個(gè)文件夾,只需要遍歷執(zhí)行單個(gè)文件夾的語句即可。具體實(shí)現(xiàn)代碼如下:
month_num=['1月','2月','3月','4月','5月','6月','7月','8月','9月','10月','11月','12月']
foriinmonth_num:
os.mkdir('D:/Data-Science/share/data/'+i)
print('{}創(chuàng)建完成!'.format(i))
運(yùn)行上面代碼以后就會(huì)在該文件路徑下新建了12個(gè)文件夾:
批量重命名文件
有的時(shí)候我們有好多相同主題的文件,但是這些文件的文件名比較混亂,比如下面這些文件,是各個(gè)員工的3月績(jī)效情況,但是命名格式都不太一樣,我們要將其統(tǒng)一成名字+3月績(jī)效這樣的格式。要達(dá)到這種效果,可以通過前面學(xué)到的對(duì)文件進(jìn)行重命名操作來實(shí)現(xiàn),前面只講了對(duì)單一文件的操作,那如何同時(shí)對(duì)多個(gè)文件進(jìn)行批量操作呢?
具體實(shí)現(xiàn)代碼如下:
importos
#獲取指定文件下所有文件名
old_name=os.listdir('D:/Data-Science/share/data/test')
name=["張明明","李旦","王玥月","陳凱"]
#遍歷每一個(gè)姓名
forninname:
#遍歷每一個(gè)舊文件名
foroinold_name:
#判斷舊文件名中是否包含特定的姓名
#如果包含就進(jìn)行重命名
ifnino:
os.rename('D:/Data-Science/share/data/test/'+o,'D:/Data-Science/share/data/test/'+n+"3月績(jī)效.xlsx")
運(yùn)行上面代碼以后可以看到文件下的原文件名全部已被重命名完成。
其他批量操作
批量合并多個(gè)文件
如下所示,該文件夾下面有1-6月的分月銷售日?qǐng)?bào),已知這些日?qǐng)?bào)的結(jié)構(gòu)是相同的,只有日期和銷量?jī)闪?,現(xiàn)在我們想要把這些不同月份的日?qǐng)?bào)合并成一份。
將分月銷售日?qǐng)?bào)合并成一份文件的具體實(shí)現(xiàn)代碼如下:
importos
importpandasaspd
#獲取指定文件下所有文件名
name_list=os.listdir('D:/Data-Science/share/data/sale_data')
#創(chuàng)建一個(gè)相同結(jié)構(gòu)的空DataFrame
df_o=pd.DataFrame({'日期':[],'銷量':[]})
#遍歷讀取每一個(gè)文件
foriinname_list:
df=pd.read_excel(r'D:/Data-Science/share/data/sale_data/'+i)
#進(jìn)行縱向拼接
df_v=pd.concat([df_o,df])
#把拼接后的結(jié)果賦值給df_o
df_o=df_v
df_o
運(yùn)行上面代碼就會(huì)得到合并后的文件df_o,如下所示:
將一份文件按照指定列拆分成多個(gè)文件
上面講了如何批量合并多個(gè)文件,我們也有合并多個(gè)文件逆需求,即按照指定列將一個(gè)文件拆分成多個(gè)文件。
還是上面的數(shù)據(jù)集,假設(shè)我們現(xiàn)在拿到了一份1-6月份的文件,這份文件除了日期和銷量?jī)闪幸酝?,還多了一列月份,現(xiàn)在我們需要做的就是根據(jù)月份這一列將這一份文件拆分成多個(gè)文件,每個(gè)月份單獨(dú)存儲(chǔ)為一個(gè)文件。
具體實(shí)現(xiàn)代碼如下:
#生成一列新的月份列
df_o['月份']=df_o['日期'].apply(lambdax:x.month
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 解除聘用司機(jī)協(xié)議書
- 門面解除合同協(xié)議書
- 避孕節(jié)育措施協(xié)議書
- 農(nóng)業(yè)合作社合同協(xié)議書
- 兩個(gè)人分包合同協(xié)議書
- 鋼筋工程出資協(xié)議書
- 餐桌合作合同協(xié)議書
- cbd土地置換協(xié)議書
- 鏟車機(jī)器轉(zhuǎn)讓協(xié)議書
- 轉(zhuǎn)讓寵物診所協(xié)議書
- 材料科學(xué)基礎(chǔ)chp1-原子結(jié)構(gòu)與鍵合課件
- (完整word版)餐券模板
- 《滑炒技法-滑炒雞絲菜肴制作》說課課件
- 減速機(jī)設(shè)備維修技術(shù)標(biāo)準(zhǔn)
- GB/T 26480-2011閥門的檢驗(yàn)和試驗(yàn)
- 中文版自殺可能量表
- 裝飾藝術(shù)運(yùn)動(dòng)課件
- 【審計(jì)工作底稿模板】FH應(yīng)付利息
- 工貿(mào)企業(yè)安全管理臺(tái)賬資料
- 三方協(xié)議書(消防)
- 預(yù)激綜合征臨床心電圖的當(dāng)前觀點(diǎn)
評(píng)論
0/150
提交評(píng)論