版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
6.1數(shù)據(jù)類型變換學習內容1.astype()方法2.
to_numeric()方法6.1數(shù)據(jù)類型變換pandas中進行數(shù)據(jù)類型變換有兩種基本方法:(1)使用astype()方法進行強制類型變換。(2)使用pandas提供的to_numeric()方法變換為數(shù)字類型。6.1.1用astype()方法進行強制類型變換astype()方法可以將pandas的DataFrame對象的一列或多列數(shù)據(jù)變換為指定的數(shù)據(jù)類型,返回值為變換后的數(shù)據(jù),默認更改的是原始對象的副本,語法格式如下:1DataFrame.astype(dtype,copy=True,errors='raise')6.1數(shù)據(jù)類型變換6.1.1用astype()方法進行強制類型變換表6.1.1
astype()方法的參數(shù)說明序號參數(shù)說明1dtype數(shù)據(jù)類型或列名稱,將整個pandas對象強制變換為相同的類型?;蛘撸褂米值鋥col:dtype,...}用于將一列或多列數(shù)據(jù)變換為特定的類型。2copy布爾值,默認為True,返回更改對象的副本。設置為False表示直接修改對象。一般不要輕易設置為False。3errors默認為raise,表示允許引發(fā)異常。還可以設置為ignore,表示忽略異常,出錯時返回原始對象(版本0.20.0中的新功能。)01importpandasaspd02df=pd.read_csv('data/ratings.csv',sep=',')03df.dtypes04df案例:電影評分數(shù)據(jù)集(data/ratings.csv)6.1數(shù)據(jù)類型變換6.1.1用astype()方法進行強制類型變換05df2=df.astype('int64')06df2.dtypes07df3=df.astype({'用戶編號':'int64','項目編號':'int64'})08df3.dtypes案例:電影評分數(shù)據(jù)集(data/ratings.csv)第5行代碼將df對象的所有列都變換為整數(shù),并保存到對象df2。第7行代碼通過傳遞字典的參數(shù),只改變了用戶編號和項目編號的類型。6.1數(shù)據(jù)類型變換6.1.1用astype()方法進行強制類型變換09df4=pd.read_csv('data/booksales.csv',sep=',')10df411df4.dtypes12df5=df4.astype({'價格':'float64'})案例:圖書數(shù)據(jù)集(data/booksales.csv)astype()方法的功能有限,只能進行純數(shù)字的類型轉化,如果數(shù)據(jù)包含其他符號,例如人民幣的符號¥,則無法進行類型變換。所以,如果數(shù)據(jù)列不是純數(shù)字,就不能使用astype()方法進行類型變換6.1數(shù)據(jù)類型變換pandas中的to_numeric()方法可以將參數(shù)變換為數(shù)字類型,默認返回的數(shù)據(jù)類型為float64或int64,語法格式如下:1pandas.to_numerice(arg,errors='raise',downcast=None)表6.1.2
to_numeric()方法的參數(shù)說明序號參數(shù)說明1arglist(列表),(tuple)元組,一維數(shù)組或Series對象2errors默認為'raise',無效的解析將引發(fā)異常。還可以是‘coerce’或’ignore’,‘coerce’表示將無效解析設置為NaN,‘ignore’表示無效的解析將忽略異常。3downcastdowncast:默認為None,根據(jù)數(shù)據(jù)自動變換類型。如果不是None,則根據(jù)以下規(guī)則將結果數(shù)據(jù)變換為可能的最小數(shù)字類型:'integer'或'signed'表示變換為最小的有符號整數(shù)(最小值:8),'unsigned'表示變換為最小的無符號整數(shù)(最小值:numpy.uint8),'float'表示變換為最小的小數(shù)(最小值:numpy.float32)6.1.2用to_numeric()方法變換為數(shù)字類型6.1數(shù)據(jù)類型變換to_numeric()方法進行數(shù)據(jù)類型變換的代碼示例:01importpandasaspd02s=pd.Series(['1.0','2',-3])03pd.to_numeric(s)04pd.to_numeric(s,downcast='float')05pd.to_numeric(s,downcast='signed')'float'表示變換為最小的小數(shù)(最小值:numpy.float32)第5行代碼設置to_numeric()方法的downcast='signed',變換為最小的有符號整數(shù)(最小值:8)6.1數(shù)據(jù)類型變換to_numeric()方法進行數(shù)據(jù)類型變換的代碼示例:06s2=pd.Series(['apple','1.0','2',-3])07pd.to_numeric(s2,errors='ignore')08pd.to_numeric(s2,errors='coerce')09pd
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程合同管理與法律制度知到智慧樹章節(jié)測試課后答案2024年秋煙臺大學
- 2025-2030年中國麻醉科耗材行業(yè)運行狀況及投資發(fā)展前景預測報告
- 2025-2030年中國高檔衛(wèi)生用品市場運行狀況與前景趨勢分析報告
- 2025-2030年中國風電涂料產(chǎn)業(yè)十三五規(guī)劃及投資風險評估報告
- 2025-2030年中國鋁合金游艇行業(yè)十三五規(guī)劃與發(fā)展建議分析報告
- 河北省勞動保障局2025年度勞動合同培訓課程大綱
- 割草在草原面源污染治理中的應用考核試卷
- 2025年度離婚協(xié)議書簽訂與房產(chǎn)分割及債務處理合同
- 2025年度家庭生活助理雇傭保姆合同
- 2025年度潔具衛(wèi)浴產(chǎn)品售后服務與技術支持合同
- SY-T 5333-2023 鉆井工程設計規(guī)范
- 蔣詩萌小品《誰殺死了周日》臺詞完整版
- TB 10010-2008 鐵路給水排水設計規(guī)范
- 黑色素的合成與美白產(chǎn)品的研究進展
- 建筑史智慧樹知到期末考試答案2024年
- 金蓉顆粒-臨床用藥解讀
- 社區(qū)健康服務與管理教案
- 2023-2024年家政服務員職業(yè)技能培訓考試題庫(含答案)
- 2023年(中級)電工職業(yè)技能鑒定考試題庫(必刷500題)
- 藏歷新年文化活動的工作方案
- 果酒釀造完整
評論
0/150
提交評論