《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件2.2.1 數(shù)據(jù)讀取與寫(xiě)入_第1頁(yè)
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件2.2.1 數(shù)據(jù)讀取與寫(xiě)入_第2頁(yè)
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件2.2.1 數(shù)據(jù)讀取與寫(xiě)入_第3頁(yè)
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件2.2.1 數(shù)據(jù)讀取與寫(xiě)入_第4頁(yè)
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》 課件2.2.1 數(shù)據(jù)讀取與寫(xiě)入_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)農(nóng)產(chǎn)品信息可視化分析——NumPy、pandas與Matplotlib庫(kù)任務(wù)描述水稻是全球最重要的糧食作物之一,水稻審定數(shù)據(jù)可以為農(nóng)業(yè)科技創(chuàng)新提供重要的參考和依據(jù),可以幫助選擇高產(chǎn)、優(yōu)質(zhì)、抗逆性強(qiáng)的水稻品種,促進(jìn)綠色、可持續(xù)的農(nóng)業(yè)生產(chǎn)方式,有助于推動(dòng)農(nóng)業(yè)的可持續(xù)發(fā)展。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)本任務(wù)先了解水稻信息數(shù)據(jù)的情況,根據(jù)數(shù)據(jù)檢測(cè)的內(nèi)容可知數(shù)據(jù)存在缺失值、重復(fù)值、異常值的情況,并對(duì)數(shù)據(jù)中的缺失值、重復(fù)值、異常值進(jìn)行處理,增強(qiáng)后續(xù)數(shù)據(jù)分析的效果。對(duì)數(shù)據(jù)進(jìn)行仔細(xì)的處理和清洗,確保數(shù)據(jù)的質(zhì)量可靠,為后續(xù)的數(shù)據(jù)分析和決策提供更可信的基礎(chǔ),也展現(xiàn)了勞動(dòng)精神的價(jià)值和應(yīng)用。任務(wù)要求讀取農(nóng)產(chǎn)品基本信息數(shù)據(jù)。檢測(cè)數(shù)據(jù)缺失值的情況,并進(jìn)行缺失值處理。檢測(cè)數(shù)據(jù)異常值的情況,并進(jìn)行異常值處理。檢測(cè)數(shù)據(jù)重復(fù)值的情況,并進(jìn)行重復(fù)值處理。處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫(xiě)入pandas數(shù)據(jù)結(jié)構(gòu)pandas數(shù)據(jù)處理數(shù)據(jù)讀取與寫(xiě)入處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas是一個(gè)常用的Python數(shù)據(jù)處理庫(kù),支持多種文件格式的讀取和寫(xiě)入。通過(guò)引入pandas庫(kù),可以使用read_csv()函數(shù)讀取CSV文件、read_excel()函數(shù)讀取Excel文件等。同時(shí),pandas也提供了to_csv()方法將數(shù)據(jù)寫(xiě)入CSV文件、to_excel()方法將數(shù)據(jù)寫(xiě)入Excel文件等。這些函數(shù)、方法的使用使數(shù)據(jù)的讀取和寫(xiě)入變得簡(jiǎn)單方便。讀寫(xiě)文本文件CSV文件讀取處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)如果文本文件是字符分隔文件,那么可以使用讀取CSV文件的函數(shù)進(jìn)行讀取。pandas提供了read_csv函數(shù)讀取CSV文件。read_csv函數(shù)的基本使用格式如下。pandas.read_csv(filepath_or_buffer,sep=<no_default>,header='infer',names=<no_default>,index_col=None,dtype=None,engine=None,skiprows=None,nrows=None,……)讀寫(xiě)文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas提供了read_table函數(shù)讀取文本文件。read_table函數(shù)的基本使用格式如下。pandas.read_table(filepath_or_buffer,sep=<no_default>,header='infer',names=<no_default>,index_col=None,dtype=None,engine=None,skiprows=None,nrows=None,……)讀寫(xiě)文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)read_table函數(shù)與read_csv函數(shù)的參數(shù)說(shuō)明如下。filepath_or_buffer接收str。表示文件路徑。無(wú)默認(rèn)值sep接收str。表示分隔符。read_csv函數(shù)默認(rèn)為“,”,read_table函數(shù)默認(rèn)為制表符“Tab”header接收int或列表形式的int。表示將某行數(shù)據(jù)作為列名。默認(rèn)為infernames接收array。表示列名。無(wú)默認(rèn)值index_col接收int、sequence或False。表示索引列的位置,取值為sequence則代表多重索引。默認(rèn)為None參數(shù)名稱(chēng)參數(shù)說(shuō)明讀寫(xiě)文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)read_table函數(shù)與read_csv函數(shù)的參數(shù)說(shuō)明如下。dtype接收字典形式的列名或類(lèi)型名稱(chēng)。表示寫(xiě)入的數(shù)據(jù)類(lèi)型(列名為key,數(shù)據(jù)格式為values)。默認(rèn)為Noneengine接收c語(yǔ)言或python語(yǔ)言。表示要使用的數(shù)據(jù)解析引擎。默認(rèn)為Nonenrows接收int。要讀取的文件行數(shù)。默認(rèn)為Noneskiprows接收l(shuí)ist或int或callable。表示讀取數(shù)據(jù)時(shí)跳過(guò)開(kāi)頭的行數(shù)。默認(rèn)為None參數(shù)名稱(chēng)參數(shù)說(shuō)明讀寫(xiě)文本文件CSV文件寫(xiě)入處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)文本文件的存儲(chǔ)和讀取類(lèi)似,對(duì)于結(jié)構(gòu)化數(shù)據(jù),可以通過(guò)pandas庫(kù)中的to_csv()方法實(shí)現(xiàn)以csv文件格式存儲(chǔ)。DataFrame.to_csv(path_or_buf=None,sep=',',na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,mode='w',encoding=None,compression='infer',quoting=None,quotechar='"',line_terminator=None,chunksize=None,date_format=None,doublequote=True,escapechar=None,decimal='.',errors='strict',storage_options=None)讀寫(xiě)文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)to_csv()方法參數(shù)如下表所示。參數(shù)名稱(chēng)參數(shù)說(shuō)明path_or_buf接收str。表示文件路徑。默認(rèn)為Nonesep接收str。表示分隔符。默認(rèn)為“,”na_rep接收str。表示缺失值。默認(rèn)為“”columns接收l(shuí)ist。表示寫(xiě)出的列名。默認(rèn)為None讀寫(xiě)文本文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)to_csv()方法參數(shù)如下表所示。header接收bool或列表形式的str。表示是否將列名寫(xiě)出。默認(rèn)為T(mén)rueindex接收bool。表示是否將行名(索引)寫(xiě)出。默認(rèn)為T(mén)rueindex_label接收sequence或str或false。表示索引名。默認(rèn)為Nonemode接收特定str。表示數(shù)據(jù)寫(xiě)入模式。默認(rèn)為wencoding接收特定str。表示存儲(chǔ)文件的編碼格式。默認(rèn)為None參數(shù)名稱(chēng)參數(shù)說(shuō)明讀寫(xiě)Excel文件Excel文件讀取處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)pandas庫(kù)提供了read_excel函數(shù)讀取“xls”“xlsx”兩種Excel文件,其基本使用格式如下。pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skiprows=None,nrows=None,na_values=None,keep_default_na=True,na_filter=True,verbose=False,parse_dates=False,date_parser=None,thousands=None,comment=None,skipfooter=0,convert_float=True,mangle_dupe_cols=True,storage_options=None)讀寫(xiě)Excel文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)read_excel函數(shù)的常用參數(shù)及其說(shuō)明如表所示。參數(shù)名稱(chēng)參數(shù)說(shuō)明io接收str。表示文件路徑。無(wú)默認(rèn)值sheet_name接收str、int、list或None。表示Excel表內(nèi)數(shù)據(jù)的分表位置。默認(rèn)為0header接收int或列表形式的int。表示將某行數(shù)據(jù)作為列名。如果傳遞整數(shù)列表,那么行位置將合并為MultiIndex。如果沒(méi)有表頭,那么使用None。默認(rèn)為0讀寫(xiě)Excel文件處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)參數(shù)名稱(chēng)參數(shù)說(shuō)明names接收array。表示要使用的列名列表。默認(rèn)為Noneindex_col接收int或列表形式的int。表示將列索引用作dataframe的行索引。默認(rèn)為Nonedtype接收dict。表示寫(xiě)入的數(shù)據(jù)類(lèi)型(列名為key,數(shù)據(jù)格式為values)。默認(rèn)為Noneskiprows接收l(shuí)ist、int或callable。表示讀取數(shù)據(jù)開(kāi)頭跳過(guò)的行數(shù)。默認(rèn)為Noneread_excel函數(shù)的常用參數(shù)及其說(shuō)明如表所示。讀寫(xiě)Excel文件Excel文件寫(xiě)入處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)將數(shù)據(jù)存儲(chǔ)至Excel文件,可以使用to_excel()方法,其基本使用格式如下。DataFrame.to_excel(excel_writer,sheet_name='Sheet1',na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,startrow=0,startcol=0,engine=None,merge_cells=True,encoding=None,inf_rep='inf',verbose=True,freeze_panes=None,storage_options=None)讀寫(xiě)Excel文件to_excel()方法的常用參數(shù)及其說(shuō)明如下表。excel_writer接收str。表示文件路徑。無(wú)默認(rèn)值sheet_name接收str。表示Excel文件中工作簿的名稱(chēng)。默認(rèn)為Sheet1na_rep接收str。表示缺失值。默認(rèn)為“”columns接收列表形式的str或sequence。表示寫(xiě)出的列名。默認(rèn)為None參數(shù)名稱(chēng)參數(shù)說(shuō)明處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)讀寫(xiě)Excel文件to_excel()方法的常用參數(shù)及其說(shuō)明如下表。header接收bool或列表形式的str。表示是否將列名寫(xiě)出。默認(rèn)為T(mén)rueindex接收bool。表示是否將行名(索引)寫(xiě)出。默認(rèn)為T(mén)rueindex_label接收sequence或str。表示索引名。默認(rèn)為Noneencoding接收特定str。表示存儲(chǔ)文件的編碼格式。默認(rèn)為None參數(shù)名稱(chēng)參數(shù)說(shuō)明處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)數(shù)據(jù)讀取與寫(xiě)入處理農(nóng)產(chǎn)品基本信息數(shù)據(jù)就業(yè)是最基本的民生,根據(jù)應(yīng)屆生招聘數(shù)據(jù),可以全面地了解當(dāng)前就業(yè)市場(chǎng)的形勢(shì)和趨勢(shì),為應(yīng)屆畢業(yè)生提供更準(zhǔn)確的就業(yè)指導(dǎo)和職業(yè)規(guī)劃建議,深入實(shí)施就業(yè)優(yōu)先戰(zhàn)略。崗位公司性質(zhì)行業(yè)地區(qū)學(xué)歷要求工資/元產(chǎn)品經(jīng)理民營(yíng)公司|少于50人通信/電信/網(wǎng)絡(luò)設(shè)備成都-高新區(qū)本科15000無(wú)線產(chǎn)品經(jīng)理(光谷)民營(yíng)公司|150-500人儀器儀表/工業(yè)自動(dòng)化西安-高新技

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論