




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
匯報(bào)人:XX2024-01-11Python文件和數(shù)據(jù)格式化的學(xué)習(xí)筆記整理目錄Python文件基本操作數(shù)據(jù)格式化基礎(chǔ)文本文件格式化處理CSV文件格式化處理JSON文件格式化處理XML文件格式化處理01Python文件基本操作使用`open()`函數(shù)打開(kāi)文件,需要指定文件路徑和打開(kāi)模式。打開(kāi)文件關(guān)閉文件上下文管理器使用`close()`方法關(guān)閉文件,釋放資源。使用`with`語(yǔ)句可以自動(dòng)管理文件的打開(kāi)和關(guān)閉,無(wú)需手動(dòng)調(diào)用`close()`方法。030201文件打開(kāi)與關(guān)閉二進(jìn)制模式以二進(jìn)制方式打開(kāi)文件,用于處理二進(jìn)制數(shù)據(jù)。讀取模式以只讀方式打開(kāi)文件,使用`read()`方法讀取文件內(nèi)容。寫(xiě)入模式以寫(xiě)入方式打開(kāi)文件,使用`write()`方法向文件中寫(xiě)入內(nèi)容。如果文件不存在,則創(chuàng)建新文件;如果文件已存在,則覆蓋原有內(nèi)容。追加模式以追加方式打開(kāi)文件,使用`write()`方法向文件中追加內(nèi)容。如果文件不存在,則創(chuàng)建新文件;如果文件已存在,則在文件末尾追加內(nèi)容。文件讀寫(xiě)模式
文件指針操作文件指針位置使用`tell()`方法返回當(dāng)前文件指針的位置。移動(dòng)文件指針使用`seek()`方法移動(dòng)文件指針到指定位置。重置文件指針使用`seek(0)`方法將文件指針重置到文件開(kāi)頭。文件異常處理文件不存在異常當(dāng)嘗試打開(kāi)不存在的文件時(shí),會(huì)拋出`FileNotFoundError`異常。文件讀寫(xiě)異常當(dāng)在讀寫(xiě)文件過(guò)程中發(fā)生錯(cuò)誤時(shí),會(huì)拋出`IOError`異常。文件關(guān)閉異常當(dāng)嘗試關(guān)閉未打開(kāi)的文件或已關(guān)閉的文件時(shí),會(huì)拋出`ValueError`異常。使用`try...except`語(yǔ)句處理…在可能出現(xiàn)異常的代碼塊前加上`try`,在代碼塊后加上`except`捕獲并處理異常。02數(shù)據(jù)格式化基礎(chǔ)Python中的基礎(chǔ)數(shù)據(jù)類(lèi)型包括整數(shù)、浮點(diǎn)數(shù)、布爾值、字符串等?;A(chǔ)數(shù)據(jù)類(lèi)型可以使用內(nèi)置函數(shù)如`int()`,`float()`,`str()`等進(jìn)行數(shù)據(jù)類(lèi)型轉(zhuǎn)換。數(shù)據(jù)類(lèi)型轉(zhuǎn)換使用`type()`函數(shù)可以判斷一個(gè)變量的數(shù)據(jù)類(lèi)型。數(shù)據(jù)類(lèi)型判斷數(shù)據(jù)類(lèi)型與轉(zhuǎn)換舊式字符串格式化01使用`%`操作符進(jìn)行字符串格式化,例如`"Hello,%s!"%name`。str.format()方法02使用`{}`占位符和`format()`方法進(jìn)行字符串格式化,例如`"Hello,{}!".format(name)`。f-string格式化03在Python3.6及以上版本,可以使用f-string進(jìn)行字符串格式化,例如`f"Hello,{name}!"`。格式化字符串方法使用`open()`函數(shù)打開(kāi)文件,可以指定文件名和打開(kāi)模式(如讀取、寫(xiě)入、追加等)。打開(kāi)文件使用文件對(duì)象的`write()`方法將格式化的字符串寫(xiě)入文件。寫(xiě)入文件使用文件對(duì)象的`close()`方法關(guān)閉文件。建議使用`with`語(yǔ)句來(lái)自動(dòng)管理文件的打開(kāi)和關(guān)閉。關(guān)閉文件格式化輸出到文件輸入標(biāo)題格式化占位符錯(cuò)誤數(shù)據(jù)類(lèi)型不匹配常見(jiàn)問(wèn)題及解決方案在進(jìn)行數(shù)據(jù)類(lèi)型轉(zhuǎn)換時(shí),需要確保轉(zhuǎn)換是合理的,例如不能將字符串直接轉(zhuǎn)換為整數(shù),除非該字符串表示一個(gè)數(shù)字。在寫(xiě)入文件時(shí),可能會(huì)因?yàn)榇疟P(pán)空間不足或文件被其他程序占用導(dǎo)致寫(xiě)入失敗。需要確保有足夠的磁盤(pán)空間,且文件沒(méi)有被其他程序占用。在打開(kāi)文件時(shí),可能會(huì)因?yàn)槲募淮嬖凇⒙窂藉e(cuò)誤或權(quán)限問(wèn)題導(dǎo)致打開(kāi)失敗。需要確保文件名和路徑正確,且有足夠的權(quán)限打開(kāi)文件。在使用`str.format()`或f-string進(jìn)行字符串格式化時(shí),需要確保占位符的數(shù)量和類(lèi)型與提供的參數(shù)匹配。文件寫(xiě)入錯(cuò)誤文件打開(kāi)失敗03文本文件格式化處理Python內(nèi)置的`chardet`庫(kù)可用于識(shí)別文本文件的編碼格式,通過(guò)讀取文件內(nèi)容并進(jìn)行分析,可以確定文件所使用的編碼方式。使用Python內(nèi)置的`codecs`庫(kù),可以實(shí)現(xiàn)文本文件編碼格式的轉(zhuǎn)換。通過(guò)指定輸入和輸出的編碼方式,可以將文件從一種編碼轉(zhuǎn)換為另一種編碼。文本文件編碼格式識(shí)別與轉(zhuǎn)換編碼格式轉(zhuǎn)換編碼格式識(shí)別正則表達(dá)式提取利用Python的`re`模塊,可以使用正則表達(dá)式對(duì)文本內(nèi)容進(jìn)行提取。通過(guò)編寫(xiě)匹配規(guī)則,可以提取出文本中的特定信息,如電話(huà)號(hào)碼、郵箱地址等。文本清洗文本清洗是指對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理,去除無(wú)關(guān)信息、噪聲和重復(fù)內(nèi)容。可以使用Python中的字符串處理方法、正則表達(dá)式等技術(shù)進(jìn)行文本清洗。文本內(nèi)容提取與清洗Python中的字符串替換非常簡(jiǎn)單,直接使用字符串的`replace()`方法即可實(shí)現(xiàn)。可以指定要替換的子字符串和替換后的新字符串,實(shí)現(xiàn)文本內(nèi)容的替換。字符串替換對(duì)于更復(fù)雜的文本內(nèi)容修改需求,可以使用Python的`re`模塊提供的正則表達(dá)式功能。通過(guò)編寫(xiě)匹配和替換規(guī)則,可以對(duì)文本內(nèi)容進(jìn)行精確的修改。使用正則表達(dá)式修改文本內(nèi)容替換與修改文本文件合并可以使用Python的文件操作功能,將多個(gè)文本文件的內(nèi)容合并到一個(gè)文件中。通過(guò)打開(kāi)多個(gè)輸入文件和一個(gè)輸出文件,將輸入文件的內(nèi)容逐行或整個(gè)讀取并寫(xiě)入到輸出文件中。文本文件拆分對(duì)于較大的文本文件,可以根據(jù)需要進(jìn)行拆分。可以按照指定的行數(shù)、大小或特定標(biāo)識(shí)進(jìn)行拆分,將一個(gè)大文件拆分成多個(gè)小文件,便于后續(xù)處理和分析。文本文件合并與拆分04CSV文件格式化處理使用Python內(nèi)置的csv模塊,通過(guò)創(chuàng)建csv.reader對(duì)象來(lái)讀取CSV文件內(nèi)容,可以逐行或逐列讀取數(shù)據(jù)。讀取CSV文件同樣使用csv模塊,創(chuàng)建csv.writer對(duì)象來(lái)將數(shù)據(jù)寫(xiě)入CSV文件,可以指定分隔符、引用符等參數(shù)。寫(xiě)入CSV文件CSV文件讀寫(xiě)操作CSV數(shù)據(jù)清洗與整理數(shù)據(jù)清洗對(duì)于讀取的CSV數(shù)據(jù),可以進(jìn)行缺失值處理、異常值處理、重復(fù)值處理等清洗操作,以保證數(shù)據(jù)質(zhì)量。數(shù)據(jù)整理對(duì)清洗后的數(shù)據(jù)進(jìn)行必要的整理,如數(shù)據(jù)類(lèi)型轉(zhuǎn)換、數(shù)據(jù)排序、數(shù)據(jù)篩選等,以便后續(xù)分析。CSV數(shù)據(jù)可視化展示利用matplotlib庫(kù)可以繪制各種圖表,如柱狀圖、折線(xiàn)圖、散點(diǎn)圖等,以直觀地展示CSV數(shù)據(jù)。使用matplotlib庫(kù)pandas庫(kù)提供了豐富的數(shù)據(jù)可視化功能,可以方便地繪制各種統(tǒng)計(jì)圖表,如箱線(xiàn)圖、直方圖、熱力圖等。使用pandas庫(kù)使用pandas庫(kù)的read_excel函數(shù),可以將CSV文件中的數(shù)據(jù)導(dǎo)入到Excel文件中。導(dǎo)入Excel使用pandas庫(kù)的to_excel函數(shù),可以將處理后的數(shù)據(jù)導(dǎo)出為Excel文件,以便在Excel中進(jìn)行進(jìn)一步的分析和處理。導(dǎo)出ExcelCSV數(shù)據(jù)導(dǎo)入導(dǎo)出Excel05JSON文件格式化處理JSON數(shù)組JSON數(shù)組是一種有序的值集合,以"[]"包圍。數(shù)組中的值可以是任意數(shù)據(jù)類(lèi)型。JSON對(duì)象JSON對(duì)象是一種無(wú)序的鍵值對(duì)集合,以"{}"包圍。鍵必須是字符串,值可以是任意數(shù)據(jù)類(lèi)型。數(shù)據(jù)類(lèi)型JSON支持的數(shù)據(jù)類(lèi)型包括字符串、數(shù)字、布爾值、null、對(duì)象和數(shù)組。JSON數(shù)據(jù)結(jié)構(gòu)解析將Python對(duì)象轉(zhuǎn)換為JSON格式的字符串,使用`json.dumps()`函數(shù)。編碼將JSON格式的字符串轉(zhuǎn)換為Python對(duì)象,使用`json.loads()`函數(shù)。解碼通過(guò)設(shè)置`json.dumps()`函數(shù)的參數(shù),可以控制JSON編碼的行為,如縮進(jìn)、排序等。編碼選項(xiàng)JSON數(shù)據(jù)編碼與解碼校驗(yàn)使用`json.loads()`函數(shù)時(shí),如果輸入的字符串不是有效的JSON格式,將會(huì)拋出`json.JSONDecodeError`異常。驗(yàn)證可以使用第三方庫(kù)如`jsonschema`對(duì)JSON數(shù)據(jù)進(jìn)行驗(yàn)證,確保數(shù)據(jù)符合預(yù)期的格式和約束。JSON數(shù)據(jù)校驗(yàn)與驗(yàn)證03自定義展示根據(jù)需要,可以編寫(xiě)自定義的代碼來(lái)解析JSON數(shù)據(jù),并以特定的格式進(jìn)行展示。01可視化工具可以使用在線(xiàn)的JSON可視化工具,如`jsonviewer.stack.hu`,將JSON數(shù)據(jù)以樹(shù)狀結(jié)構(gòu)展示。02Python庫(kù)使用Python的第三方庫(kù)如`prettytable`或`pandas`,可以將JSON數(shù)據(jù)轉(zhuǎn)換為表格形式進(jìn)行展示。JSON數(shù)據(jù)可視化展示06XML文件格式化處理解析方式Python中可以使用內(nèi)置的xml模塊或第三方庫(kù)如lxml進(jìn)行XML文檔的解析。解析步驟通常包括加載XML文檔、獲取根元素、遍歷子元素等步驟。XML文檔結(jié)構(gòu)XML文檔由元素、屬性和文本內(nèi)容構(gòu)成,元素可以嵌套,形成層次化的結(jié)構(gòu)。XML文檔結(jié)構(gòu)解析123可以使用XPath或CSS選擇器等方式定位并提取XML文檔中的特定元素。提取元素通過(guò)修改元素的文本內(nèi)容或?qū)傩?,可以?shí)現(xiàn)對(duì)XML文檔的修改。修改元素可以定位到要?jiǎng)h除的元素,然后從其父元素中移除。刪除元素XML元素提取與修改獲取屬性可以通過(guò)元素的屬性名稱(chēng)獲取屬性值。修改屬性可以直接對(duì)元素的屬性進(jìn)行修改。刪除屬性可以通過(guò)del語(yǔ)句刪
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五增資協(xié)議書(shū)
- 水利工程項(xiàng)目的造價(jià)控制措施
- 二零二五版煙葉運(yùn)輸合同
- 護(hù)工用工合同二零二五年
- 外貿(mào)傭金合同二零二五年
- 提供按摩服務(wù)合同二零二五年
- 二零二五版房地產(chǎn)開(kāi)發(fā)項(xiàng)目資本金監(jiān)管協(xié)議
- 自閉癥兒童情緒管理計(jì)劃
- 公司股權(quán)投資合作協(xié)議書(shū)范例
- 2025年包裝服務(wù)項(xiàng)目發(fā)展計(jì)劃
- 2024年海城市屬事業(yè)單位考試試卷
- 《休閑農(nóng)業(yè)》課件 項(xiàng)目三 休閑農(nóng)業(yè)資源及開(kāi)發(fā)
- 數(shù)學(xué)-江西省萍鄉(xiāng)市2024~2025學(xué)年度2025屆高三一??荚囋嚲恚ㄆ监l(xiāng)一模)試題和答案
- 2025年全國(guó)體育單招高三模擬沖刺政治試題(三)(解析版)
- 寧波十校2025屆高三3月聯(lián)考地理試卷(含答案)
- T-SZSA 021-2024 小型離網(wǎng)式家用光伏發(fā)電系統(tǒng)技術(shù)規(guī)范
- 2025年合作經(jīng)營(yíng)民宿合同模板
- 部編版三年級(jí)語(yǔ)文下冊(cè)《蜜蜂》作業(yè)設(shè)計(jì)
- 三基三嚴(yán)習(xí)題庫(kù)(含答案)
- 2025年江蘇南通職業(yè)大學(xué)招聘事業(yè)編制人員34人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 食為天:2024中國(guó)食品飲料行業(yè)白皮書(shū)
評(píng)論
0/150
提交評(píng)論