《數(shù)據(jù)挖掘與機器學習》 課件2.2.2 pandas數(shù)據(jù)結構_第1頁
《數(shù)據(jù)挖掘與機器學習》 課件2.2.2 pandas數(shù)據(jù)結構_第2頁
《數(shù)據(jù)挖掘與機器學習》 課件2.2.2 pandas數(shù)據(jù)結構_第3頁
《數(shù)據(jù)挖掘與機器學習》 課件2.2.2 pandas數(shù)據(jù)結構_第4頁
《數(shù)據(jù)挖掘與機器學習》 課件2.2.2 pandas數(shù)據(jù)結構_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

處理農產品基本信息數(shù)據(jù)農產品信息可視化分析——NumPy、pandas與Matplotlib庫任務描述水稻是全球最重要的糧食作物之一,水稻審定數(shù)據(jù)可以為農業(yè)科技創(chuàng)新提供重要的參考和依據(jù),可以幫助選擇高產、優(yōu)質、抗逆性強的水稻品種,促進綠色、可持續(xù)的農業(yè)生產方式,有助于推動農業(yè)的可持續(xù)發(fā)展。處理農產品基本信息數(shù)據(jù)本任務先了解水稻信息數(shù)據(jù)的情況,根據(jù)數(shù)據(jù)檢測的內容可知數(shù)據(jù)存在缺失值、重復值、異常值的情況,并對數(shù)據(jù)中的缺失值、重復值、異常值進行處理,增強后續(xù)數(shù)據(jù)分析的效果。對數(shù)據(jù)進行仔細的處理和清洗,確保數(shù)據(jù)的質量可靠,為后續(xù)的數(shù)據(jù)分析和決策提供更可信的基礎,也展現(xiàn)了勞動精神的價值和應用。任務要求讀取農產品基本信息數(shù)據(jù)。檢測數(shù)據(jù)缺失值的情況,并進行缺失值處理。檢測數(shù)據(jù)異常值的情況,并進行異常值處理。檢測數(shù)據(jù)重復值的情況,并進行重復值處理。處理農產品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫入pandas數(shù)據(jù)結構pandas數(shù)據(jù)處理pandas數(shù)據(jù)結構pandas是什么處理農產品基本信息數(shù)據(jù)pandas是一個基于Python的數(shù)據(jù)分析庫,它提供了兩種核心的數(shù)據(jù)結構:Series和DataFrame。Series是一維的數(shù)據(jù)結構,類似于數(shù)組和列表,它包含了一組數(shù)據(jù)以及與之相關的索引。Series可以通過多種方式創(chuàng)建,如從列表、數(shù)組、字典等數(shù)據(jù)類型中創(chuàng)建。pandas數(shù)據(jù)結構pandas是什么處理農產品基本信息數(shù)據(jù)pandas是一個基于Python的數(shù)據(jù)分析庫,它提供了兩種核心的數(shù)據(jù)結構:Series和DataFrame。DataFrame是二維的表格型數(shù)據(jù)結構,類似于SQL數(shù)據(jù)庫中的表格,由多個Series組成,其中每個Series表示一列數(shù)據(jù)。DataFrame的列和行都可以有自己的名稱和索引。pandas還支持多個DataFrame之間的合并和拼接操作。創(chuàng)建DataFrame如何創(chuàng)建DataFrame?處理農產品基本信息數(shù)據(jù)DataFrame是一種二維表格數(shù)據(jù)結構,通常用于數(shù)據(jù)分析和數(shù)據(jù)處理。DataFrame通常包含多個行和多個列,其中每列可以包含不同的數(shù)據(jù)類型,可以用于表示結構化數(shù)據(jù),如從數(shù)據(jù)庫或文件讀取的表格數(shù)據(jù)。在Python中可以使用pandas庫中的DataFrame函數(shù)創(chuàng)建DataFrame類型的數(shù)據(jù)。DataFrame的基本操作查看訪問數(shù)據(jù)處理農產品基本信息數(shù)據(jù)DataFrame的單列數(shù)據(jù)為一個Series。根據(jù)DataFrame的定義可知,DataFrame是一個帶有標簽的二維數(shù)組,每個標簽相當于每一列的列名。pandas提供了loc()和iloc()兩種更加靈活的方法來實現(xiàn)數(shù)據(jù)訪問,也可以用head()方法訪問。loc()方法是針對DataFrame索引名稱的切片方法,如果傳入的不是索引名稱,那么切片操作將無法執(zhí)行。利用loc()方法,能夠實現(xiàn)所有單層索引切片操作,其使用方法如下。DataFrame.loc[行名或條件,列名]DataFrame的基本操作查看訪問數(shù)據(jù)處理農產品基本信息數(shù)據(jù)iloc()方法和loc()方法的區(qū)別是,iloc()方法接收的必須是行索引和列索引的位置。iloc()方法的使用方法如下。DataFrame.iloc[行索引位置,列索引位置]DataFrame的單列數(shù)據(jù)為一個Series。根據(jù)DataFrame的定義可知,DataFrame是一個帶有標簽的二維數(shù)組,每個標簽相當于每一列的列名。pandas提供了loc()和iloc()兩種更加靈活的方法來實現(xiàn)數(shù)據(jù)訪問,也可以用head()方法訪問。DataFrame的基本操作查看訪問數(shù)據(jù)處理農產品基本信息數(shù)據(jù)DataFrame的單列數(shù)據(jù)為一個Series。根據(jù)DataFrame的定義可知,DataFrame是一個帶有標簽的二維數(shù)組,每個標簽相當于每一列的列名。pandas提供了loc()和iloc()兩種更加靈活的方法來實現(xiàn)數(shù)據(jù)訪問,也可以用head()方法訪問。head()方法可以用于返回DataFrame或Series的前n行數(shù)據(jù)。DataFrame的基本操作更改與添加DataFrame中的數(shù)據(jù)處理農產品基本信息數(shù)據(jù)更改DataFrame中的數(shù)據(jù)的原理是將這部分數(shù)據(jù)提取出來,重新賦值為新的數(shù)據(jù)。為DataFrame添加一列的方法非常簡單,只需要新建一個列索引,并對該索引下的數(shù)據(jù)進行賦值操作即可。DataFrame的基本操作刪除數(shù)據(jù)處理農產品基本信息數(shù)據(jù)在Python中可以使用pandas提供的drop()方法刪除某列或某行數(shù)據(jù)。drop()方法的基本使用格式如下。DataFrame.drop(labels=None,axis=0,index=None,columns=None,level=None,inplace=False,errors='raise')DataFrame的基本操作處理農產品基本信息數(shù)據(jù)drop()方法的常用參數(shù)及其說明如表所示。參數(shù)名稱參數(shù)說明labels接收單一標簽。表示要刪除的索引或列標簽。無默認值axis接收0或1。表示操作的軸向。默認為0inplace接收bool。表示操作是否對原數(shù)據(jù)生效。默認為False數(shù)據(jù)類型轉換如何進行轉化處理農產品基本信息數(shù)據(jù)數(shù)據(jù)類型轉換指的是將DataFrame中的某一列或多列的數(shù)據(jù)類型更改為其他類型,如從字符串類型轉換為數(shù)字類型等。在pandas庫中,可以使用astype()方法將DataFrame的一列或多列轉換為其他數(shù)據(jù)類型。pandas數(shù)據(jù)結構處理農產品基本信息數(shù)據(jù)現(xiàn)有4家公司的近三年營收數(shù)據(jù)如表所示。公司名稱2020年營收/億元2021年營收/億元2022年營收/億元甲265.6260.2274.5乙110.4125.8143丙232.9280.5386.1丁136.8161.9182.5pandas數(shù)據(jù)結構處理農產品基本信息數(shù)據(jù)創(chuàng)建DataFrame,將營收數(shù)據(jù)存儲在DataFrame中。使用iloc()方法查看乙公司的2020年營收。使用head()方法可以提取第一行數(shù)據(jù),查看甲公司這三年的營收情況。使用loc()方法查看甲公司的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論