版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
博學(xué)谷——讓IT教學(xué)更簡單,讓IT學(xué)習(xí)更有效PAGE12PAGE8《Python數(shù)據(jù)分析與應(yīng)用:從數(shù)據(jù)獲取到可視化(第2版)》教學(xué)設(shè)計(jì)課程名稱:授課年級(jí):授課學(xué)期:教師姓名:年月課題名稱第4章數(shù)據(jù)預(yù)處理計(jì)劃課時(shí)6課時(shí)教學(xué)引入在數(shù)據(jù)分析工作前期收集的數(shù)據(jù)或多或少會(huì)存在著一些瑕疵或不足,比如數(shù)據(jù)缺失、重復(fù)、格式不統(tǒng)一等,因此我們在分析數(shù)據(jù)之前需要先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、數(shù)據(jù)合并、數(shù)據(jù)重塑和數(shù)據(jù)轉(zhuǎn)換。為了處理這些問題數(shù)據(jù),pandas提供了很多用于數(shù)據(jù)預(yù)處理的函數(shù)與方法。接下來,本章將針對(duì)pandas中數(shù)據(jù)預(yù)處理的內(nèi)容進(jìn)行詳細(xì)地講解。教學(xué)目標(biāo)使學(xué)生掌握缺失值的檢測方式,能夠通過isnull()和notnull()函數(shù)檢測數(shù)據(jù)中是否存在缺失值使學(xué)生掌握缺失值的處理方式,能夠通過dropna()或fillna()方法刪除缺失值或填充缺失值使學(xué)生掌握重復(fù)值的檢測方式,能夠通過duplicated()方法檢測數(shù)據(jù)中是否存在重復(fù)值使學(xué)生掌握重復(fù)值的處理方式,能夠通過drop_duplicates()方法刪除重復(fù)值使學(xué)生熟悉異常值的檢測方式,能夠通過3σ原則和箱形圖檢測數(shù)據(jù)中是否存在異常值使學(xué)生掌握異常值的處理方式,能夠通過replace()方法替換數(shù)據(jù)中的異常值使學(xué)生熟悉數(shù)據(jù)類型的轉(zhuǎn)換方式,能夠通過astype()方法或to_numberic()函數(shù)轉(zhuǎn)換數(shù)據(jù)類型使學(xué)生掌握數(shù)據(jù)合并的相關(guān)操作,能夠根據(jù)需求選擇適合的方案實(shí)現(xiàn)數(shù)據(jù)合并的操作使學(xué)生掌握數(shù)據(jù)重塑的相關(guān)操作,能夠根據(jù)需求選擇適合的方案實(shí)現(xiàn)數(shù)據(jù)重塑的相關(guān)操作使學(xué)生掌握數(shù)據(jù)轉(zhuǎn)換的相關(guān)操作,能夠根據(jù)需求選擇適合的方案實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換的相關(guān)操作教學(xué)重點(diǎn)缺失值的檢測缺失值的處理重復(fù)值的檢測重復(fù)值的處理堆疊合并主鍵合并教學(xué)難點(diǎn)異常值的檢測主鍵合并面元?jiǎng)澐謫∽兞刻幚斫虒W(xué)方式課堂教學(xué)以PPT講授為主,并結(jié)合多媒體進(jìn)行教學(xué)教學(xué)過程第一課時(shí)(缺失值的檢測、缺失值的處理、重復(fù)值的檢測、重復(fù)值的處理)一、創(chuàng)設(shè)情景,導(dǎo)入新課教師提前準(zhǔn)備兩份數(shù)據(jù),一份不包含缺失值、重復(fù)值、異常值的數(shù)據(jù),一份包含缺失值、重復(fù)值、異常值的數(shù)據(jù),給學(xué)生提問問題,例如問題是:如果要計(jì)算平均值,大家覺得哪份數(shù)據(jù)得到的結(jié)果相對(duì)是比較準(zhǔn)確的,并根據(jù)學(xué)生的問題進(jìn)行總結(jié),引出數(shù)據(jù)清洗的好處,也就是提高數(shù)據(jù)的質(zhì)量,從而實(shí)現(xiàn)導(dǎo)入新課的目的。二、新課講解知識(shí)點(diǎn)1-缺失值的檢測教師通過PPT結(jié)合實(shí)操的形式講解缺失值的檢測。(1)什么是缺失值缺失值是指數(shù)據(jù)集中某個(gè)或某些屬性的值是不完整的。缺失值一般使用None或np.nan表示,統(tǒng)一標(biāo)記為NaN。(2)檢測缺失值的方式isnull():在檢測到缺失值的位置標(biāo)記True,其他位置標(biāo)記為False。notnull():在檢測到缺失值的位置標(biāo)記False,其他位置標(biāo)記為True。(3)通過代碼演示如何使用isnull()函數(shù)檢測缺失值(4)通過代碼演示如何使用notnull()函數(shù)檢測缺失值(5)通過代碼演示如何自定義函數(shù)來了解缺失值的占比情況知識(shí)點(diǎn)2-缺失值的處理教師通過PPT結(jié)合實(shí)操的形式講解缺失值的處理。(1)處理缺失值的方式刪除缺失值填充缺失值(2)dropna()方法的語法格式(3)通過代碼演示如何使用dropna()方法刪除缺失值(4)fillna()方法的語法格式(5)通過代碼演示如何使用fillna()方法填充缺失值(6)填充不同的值在調(diào)用fillna()方法填充缺失值時(shí)傳入一個(gè)字典給value參數(shù),其中字典的鍵為列索引,字典的值為待替換的值。(7)通過代碼演示如何使用fillna()方法填充不同的值。(8)填充缺失值相鄰的前面的有效值在調(diào)用fillna()方法時(shí)給method參數(shù)傳入值ffill,指定填充方式為前向填充。(9)通過代碼演示如何使用fillna()方法實(shí)現(xiàn)前向填充的效果。知識(shí)點(diǎn)3-重復(fù)值的檢測教師通過PPT結(jié)合實(shí)操的形式講解重復(fù)值的檢測。(1)什么是重復(fù)值重復(fù)值是指數(shù)據(jù)集中某個(gè)或某些記錄是完全相同的。(2)檢測重復(fù)值的方式duplicated()方法默認(rèn)會(huì)對(duì)所有數(shù)據(jù)進(jìn)行檢測,檢測的標(biāo)準(zhǔn)為:只要一行數(shù)據(jù)與其他行數(shù)據(jù)的所有值是完全相同的,就會(huì)將這一行數(shù)據(jù)判定為重復(fù)值,并標(biāo)記為True,非重復(fù)值標(biāo)記為False。(3)duplicated()方法的語法格式(4)通過代碼演示如何使用duplicated()方法檢測缺失值知識(shí)點(diǎn)4-重復(fù)值的處理教師通過PPT結(jié)合實(shí)操的形式講解重復(fù)值的處理。(1)重復(fù)值的處理方式重復(fù)值會(huì)影響分析結(jié)果的準(zhǔn)確性,一般情況下需要進(jìn)行刪除。(2)drop_duplicates()方法的語法格式(3)通過代碼演示如何使用drop_duplicates()方法刪除重復(fù)值三、歸納總結(jié)教師回顧本節(jié)課所講的內(nèi)容,并通過測試題的方式引導(dǎo)學(xué)生解答問題并給予指導(dǎo)。四、布置作業(yè)教師通過高校教輔平臺(tái)()布置本節(jié)課作業(yè)以及下節(jié)課的預(yù)習(xí)作業(yè)。第二課時(shí)(異常值的檢測、異常值的處理、轉(zhuǎn)換數(shù)據(jù)類型、堆疊合并)一、復(fù)習(xí)鞏固教師通過上節(jié)課作業(yè)的完成情況,對(duì)學(xué)生吸收不好的知識(shí)點(diǎn)進(jìn)行再次鞏固講解。二、通過直接引入的方式導(dǎo)入新課上節(jié)課我們主要學(xué)習(xí)了缺失值的檢測與處理、重復(fù)值的檢測與處理,本節(jié)課將繼續(xù)學(xué)習(xí)異常值的檢測與處理、轉(zhuǎn)換數(shù)據(jù)類型和堆疊合并。三、新課講解知識(shí)點(diǎn)1-異常值的檢測教師通過PPT結(jié)合實(shí)操的形式講解異常值的檢測。(1)什么是異常值異常值是指數(shù)據(jù)集中的個(gè)別值明顯偏離它所屬數(shù)據(jù)集的其余值,這些數(shù)值是不合理的或錯(cuò)誤的。(2)異常值的檢測方式3σ原則:適用于符合或近似正態(tài)分布的數(shù)據(jù)集。箱形圖:可以檢測任意的數(shù)據(jù)集。(3)基于3σ原則檢測的原理凡是誤差超過(μ-3σ,μ+3σ)區(qū)間的數(shù)值就認(rèn)為是異常值。(4)基于3σ原則檢測的函數(shù)(5)通過代碼演示如何基于3σ原則檢測異常值(6)基于箱形圖檢測的原理箱形圖可以展示異常值。異常值的范圍一般是小于Q1–1.5IQR或大于Q3+1.5IQR。(7)通過代碼演示如何繪制繪制箱形圖(8)通過代碼演示如何確定異常值的位置知識(shí)點(diǎn)2-異常值的處理教師通過PPT結(jié)合實(shí)操的形式講解異常值的處理。(1)異常值的處理方式異常值被檢測出來之后,需要進(jìn)一步確認(rèn)是否為真正的異常值。通常情況下會(huì)使用指定的值或根據(jù)一些算法計(jì)算的值替換異常值。(2)replace()方法的語法格式(3)通過代碼演示如何使用replace()方法替換一個(gè)異常值(4)通過代碼演示如何使用replace()方法替換多個(gè)異常值知識(shí)點(diǎn)3-轉(zhuǎn)換數(shù)據(jù)類型教師通過PPT結(jié)合實(shí)操的形式講解轉(zhuǎn)換數(shù)據(jù)類型。(1)轉(zhuǎn)換數(shù)據(jù)類型的使用場景(2)轉(zhuǎn)換數(shù)據(jù)類型的方式通過astype()方法轉(zhuǎn)換數(shù)據(jù)的類型。通過to_numeric()函數(shù)轉(zhuǎn)換數(shù)據(jù)類型。(3)astype()方法的語法格式(4)通過代碼演示如何使用astype()方法轉(zhuǎn)換數(shù)據(jù)的類型(5)to_numeric()方法的作用to_numeric()函數(shù)用于將字符串、混合類型等一些復(fù)雜類型的數(shù)據(jù)轉(zhuǎn)換為數(shù)值類型的數(shù)據(jù),并能夠按照不同的參數(shù)配置靈活地處理這些復(fù)雜類型的數(shù)據(jù)。(6)to_numeric()方法的語法格式(7)通過代碼演示如何使用to_numeric()方法轉(zhuǎn)換數(shù)據(jù)的類型知識(shí)點(diǎn)4-堆疊合并教師通過PPT結(jié)合實(shí)操的形式講解堆疊合并。(1)什么是堆疊合并堆疊合并指的是沿著某個(gè)軸的方向?qū)蓚€(gè)或兩個(gè)以上的對(duì)象按照一定的邏輯關(guān)系進(jìn)行合并。(2)concat()函數(shù)的語法格式(3)橫向堆疊與外連接(4)通過代碼演示如何實(shí)現(xiàn)橫向堆疊與外連接的效果(5)縱向堆疊與內(nèi)連接(6)通過代碼演示如何實(shí)現(xiàn)縱向堆疊與內(nèi)連接的效果四、歸納總結(jié)教師回顧本節(jié)課所講的內(nèi)容,并通過測試題的方式引導(dǎo)學(xué)生解答問題并給予指導(dǎo)。五、布置作業(yè)教師通過高校教輔平臺(tái)()布置本節(jié)課作業(yè)以及下節(jié)課的預(yù)習(xí)作業(yè)。第三課時(shí)(主鍵合并、根據(jù)索引合并、合并重疊數(shù)據(jù)、重塑分層索引)一、復(fù)習(xí)鞏固教師通過上節(jié)課作業(yè)的完成情況,對(duì)學(xué)生吸收不好的知識(shí)點(diǎn)進(jìn)行再次鞏固講解。二、通過直接引入的方式導(dǎo)入新課上節(jié)課我們主要學(xué)習(xí)了異常值的檢測、異常值的處理、轉(zhuǎn)換數(shù)據(jù)類型和堆疊合并,本節(jié)課將學(xué)習(xí)其他幾種合并數(shù)據(jù)的方式,包括主鍵合并、根據(jù)索引合并、合并重疊數(shù)據(jù),以及重塑分層索引。三、新課講解知識(shí)點(diǎn)1-主鍵合并教師通過PPT結(jié)合實(shí)操的形式講解主鍵合并。(1)什么是主鍵合并主鍵合并類似于關(guān)系型數(shù)據(jù)庫的主鍵查詢操作,它指的是根據(jù)一個(gè)或多個(gè)鍵將兩個(gè)對(duì)象進(jìn)行合并,大多數(shù)情況下會(huì)將這兩個(gè)對(duì)象中共有的列作為合并的鍵。(2)merge()函數(shù)的語法格式(3)通過代碼演示一個(gè)鍵合并的效果(4)通過代碼演示兩個(gè)鍵合并的效果(5)通過代碼演示全外連接合并的效果(6)通過代碼演示左連接合并的效果知識(shí)點(diǎn)2-根據(jù)索引合并教師通過PPT結(jié)合實(shí)操的形式講解根據(jù)索引合并。(1)什么是根據(jù)索引合并根據(jù)索引合并指的是根據(jù)行索引或列索引將多個(gè)對(duì)象合并成一個(gè)對(duì)象。(2)join()方法的語法格式(3)通過代碼演示如何使用join()方法實(shí)現(xiàn)沒有重疊列合并的效果(4)通過代碼演示如何使用join()方法實(shí)現(xiàn)有重疊列合并的效果知識(shí)點(diǎn)3-合并重疊數(shù)據(jù)教師通過PPT結(jié)合實(shí)操的形式講解合并重疊數(shù)據(jù)。(1)combine_first()方法的語法格式(2)通過代碼演示如何使用combine_first()方法實(shí)現(xiàn)合并重疊數(shù)據(jù)的效果知識(shí)點(diǎn)4-重塑分層索引教師通過PPT結(jié)合實(shí)操的形式講解重塑分層索引。(1)重塑分層索引的方法stack()方法用于將數(shù)據(jù)的列“旋轉(zhuǎn)”為行。unstack()方法用于將數(shù)據(jù)的行“旋轉(zhuǎn)”為列。(2)通過代碼演示如何使用stack()方法實(shí)現(xiàn)重塑索引的操作(3)通過代碼演示如何使用unstack()方法實(shí)現(xiàn)重塑索引的操作(4)通過代碼演示如何使用stack()方法實(shí)現(xiàn)重塑分層索引的效果四、歸納總結(jié)教師回顧本節(jié)課所講的內(nèi)容,并通過測試題的方式引導(dǎo)學(xué)生解答問題并給予指導(dǎo)。五、布置作業(yè)教師通過高校教輔平臺(tái)()布置本節(jié)課作業(yè)以及下節(jié)課的預(yù)習(xí)作業(yè)。第四課時(shí)(軸向旋轉(zhuǎn)、面元?jiǎng)澐?、啞變量處理、案例:預(yù)處理二手房數(shù)據(jù))一、復(fù)習(xí)鞏固教師通過上節(jié)課作業(yè)的完成情況,對(duì)學(xué)生吸收不好的知識(shí)點(diǎn)進(jìn)行再次鞏固講解。二、通過直接引入的方式導(dǎo)入新課上節(jié)課我們主要學(xué)習(xí)了主鍵合并、根據(jù)索引合并、合并重疊數(shù)據(jù)、重塑分層索引,本節(jié)課將繼續(xù)學(xué)習(xí)軸向旋轉(zhuǎn)、面元?jiǎng)澐?、啞變量處理,以及圍繞所學(xué)的知識(shí)完成一個(gè)案例。三、新課講解知識(shí)點(diǎn)1-軸向旋轉(zhuǎn)教師通過PPT結(jié)合實(shí)操的形式講解軸向旋轉(zhuǎn)。(1)軸向旋轉(zhuǎn)的舉例(2)pivot()方法的語法格式(3)通過代碼演示如何使用pivot()方法實(shí)現(xiàn)軸向旋轉(zhuǎn)的效果知識(shí)點(diǎn)2-面元?jiǎng)澐纸處熗ㄟ^PPT結(jié)合實(shí)操的形式講解面元?jiǎng)澐帧#?)什么是面元?jiǎng)澐置嬖獎(jiǎng)澐质侵高B續(xù)數(shù)據(jù)被離散化處理,按一定的映射關(guān)系劃分為相應(yīng)的面元,這里的面元可以理解為區(qū)間。(2)面元?jiǎng)澐值呐e例(3)cut()函數(shù)的語法格式(4)通過代碼演示如何使用cut()函數(shù)實(shí)現(xiàn)面元?jiǎng)澐植僮髦R(shí)點(diǎn)3-啞變量處理教師通過PPT結(jié)合實(shí)操的形式講解啞變量處理。(1)什么是啞變量啞變量又稱虛擬變量、名義變量等,它是人為虛設(shè)的變量,用來反映某個(gè)變量的不同類別,常用的取值為0和1。(2)get_dummies()函數(shù)的語法格式(3)通過代碼演示如何使用get_dummies()函數(shù)實(shí)現(xiàn)啞變量處理的效果知識(shí)點(diǎn)4-案例:預(yù)處理二手房數(shù)據(jù)教師通過PPT結(jié)合實(shí)操的形式講解案例。(1)通過PPT介紹案例的需求(2)通過代碼演示如何讀取數(shù)據(jù)和合并數(shù)據(jù)(3)通過代碼演示案例的實(shí)現(xiàn)步驟四、歸納總結(jié)教師回顧本節(jié)課所講的內(nèi)容,并通過測試題的方式引導(dǎo)學(xué)生解答問題并給予指導(dǎo)。五、布置作業(yè)教師通過高校教輔平臺(tái)()布置本節(jié)課作業(yè)以及下節(jié)課的預(yù)習(xí)作業(yè)。第五、六課時(shí)(上機(jī)練習(xí))上機(jī)練習(xí)主要針對(duì)本章中需要重點(diǎn)掌握的知識(shí)點(diǎn),以及在程序中容易出錯(cuò)的內(nèi)容進(jìn)行練習(xí),通過上機(jī)練習(xí)可以考察同學(xué)對(duì)知識(shí)點(diǎn)的掌握情況,對(duì)代碼的熟練程度。上機(jī)一:(考察知識(shí)點(diǎn)為缺失值的檢測、缺失值的處理、重復(fù)值的檢測、重復(fù)值的處理、異常值的檢測、異常值的處理)形式:單獨(dú)完成題目:練習(xí)4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Rilmazolam-生命科學(xué)試劑-MCE-2242
- cis-N-Acetyl-S-4-hydroxy-2-buten-1-yl-L-cysteine-d3-生命科學(xué)試劑-MCE-7054
- 3-4-MDPA-hydrochloride-生命科學(xué)試劑-MCE-3492
- 二零二五年度離婚后財(cái)產(chǎn)分割與共同生活費(fèi)用承擔(dān)協(xié)議
- 2025年度養(yǎng)老服務(wù)機(jī)構(gòu)專用房產(chǎn)租賃協(xié)議
- 二零二五年度貨車運(yùn)輸貨物跟蹤與反饋合同
- 2025年度股份占比協(xié)議書模板:知識(shí)產(chǎn)權(quán)入股股份占比協(xié)議書
- 二零二五年度企業(yè)食堂衛(wèi)生安全責(zé)任合同
- 2025年度越野輪車銷售與服務(wù)協(xié)議
- 跨學(xué)科知識(shí)體系的整合與實(shí)踐
- 2025年個(gè)人合法二手車買賣合同(4篇)
- 2025年山西國際能源集團(tuán)限公司所屬企業(yè)招聘43人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 青海省海北藏族自治州(2024年-2025年小學(xué)六年級(jí)語文)統(tǒng)編版隨堂測試(上學(xué)期)試卷及答案
- 外研版(三起)小學(xué)英語三年級(jí)下冊Unit 1 Animal friends Get ready start up 課件
- 江蘇省無錫市2023-2024學(xué)年高三上學(xué)期期終教學(xué)質(zhì)量調(diào)研測試語文試題(解析版)
- 銅礦隱蔽致災(zāi)普查治理工作計(jì)劃
- 農(nóng)業(yè)行政執(zhí)法現(xiàn)狀及相關(guān)法律法規(guī)課件
- 班組月度考核評(píng)分表
- 部編版一年級(jí)下冊《道德與法治》教學(xué)工作計(jì)劃及全冊教案
- 三重一大事項(xiàng)決策流程
- 精密配電列頭柜介紹講義
評(píng)論
0/150
提交評(píng)論