




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主講人:陳清華邏輯回歸分類任務(wù)實(shí)施【數(shù)據(jù)挖掘應(yīng)用】課程性別分類分析會(huì)使用sklearn第三方包實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法應(yīng)用;會(huì)應(yīng)用邏輯回歸算法實(shí)現(xiàn)分類分析;會(huì)使用LogisticRegression()對(duì)性別進(jìn)行分類分析與預(yù)測(cè)應(yīng)用。能力目標(biāo)主要內(nèi)容任務(wù)工單引導(dǎo)問題任務(wù)評(píng)價(jià)標(biāo)準(zhǔn)任務(wù)解決方案代碼解析使用邏輯回歸實(shí)現(xiàn)性別分類hw.csv教學(xué)難點(diǎn)任務(wù)工單項(xiàng)目中使用的hw.csv文件中的數(shù)據(jù),包含了性別、年齡、身高、體重等數(shù)據(jù)項(xiàng)。性別項(xiàng)的值為字符類型,其中F代表女,M代表男。為了分析數(shù)據(jù),我們需要將兩者分別映射為1和0,再進(jìn)行邏輯回歸分類。任務(wù)概述
任務(wù)描述:從本地文件(hw.csv)中獲取數(shù)據(jù)并邏輯回歸分類分析。010010011001101010100100110110100101110101000100001011011101001010101101010011010010數(shù)據(jù)源hw.csv顯示結(jié)果
任務(wù)要求任務(wù)概述(1)性別與人的哪些生理特征是密切相關(guān)的?(2)男和女的映射值會(huì)不會(huì)對(duì)訓(xùn)練結(jié)果造成影響?(3)邏輯回歸的原理是什么?主要應(yīng)用在哪些方面?(4)sklearn中是如何實(shí)現(xiàn)邏輯回歸算法的?寫出關(guān)鍵函數(shù)與實(shí)現(xiàn)步驟。(5)模型的輸入與輸出分別是什么?”
問題引導(dǎo):任務(wù)概述
任務(wù)評(píng)價(jià):任務(wù)概述評(píng)價(jià)內(nèi)容評(píng)價(jià)要點(diǎn)分值分?jǐn)?shù)評(píng)定自我評(píng)價(jià)1.任務(wù)實(shí)施數(shù)據(jù)準(zhǔn)備2分?jǐn)?shù)據(jù)正確讀取得1分,數(shù)據(jù)標(biāo)簽映射正確得1分
模型訓(xùn)練2分模型初始化正確得1分,模型訓(xùn)練順利執(zhí)行得1分
模型預(yù)測(cè)2分模型能應(yīng)用得1分,模型預(yù)測(cè)結(jié)果可展現(xiàn)得1分
2.效果評(píng)估模型可視化并評(píng)估效果3分能正確展現(xiàn)模型得2分,模型準(zhǔn)確率90%以上得1分
3.任務(wù)總結(jié)依據(jù)任務(wù)實(shí)施情況總結(jié)結(jié)論1分總結(jié)內(nèi)容切中本任務(wù)的重點(diǎn)要點(diǎn)得1分
合計(jì)10分
任務(wù)解決方案一、數(shù)據(jù)讀取#coding:utf-8importpandasaspddf=pd.read_csv('hw.csv',delimiter=',')df.head()任務(wù)解決方案二、數(shù)據(jù)預(yù)處理fromsklearnimportpreprocessing#類型轉(zhuǎn)換df['Weight']=df['Weight'].astype(float)df['Height']=df['Height'].astype(float)#對(duì)性別進(jìn)行數(shù)值化處理le=preprocessing.LabelEncoder()df['Gender_2']=le.fit_transform(df['Gender'])df.head()任務(wù)解決方案三、數(shù)據(jù)可視化分析importmatplotlib.pyplotaspltX=df[['Height','Weight']]Y=df[['Gender_2']]plt.figure()plt.scatter(
df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths=1,
cmap=plt.cm.Paired)plt.title('性別判定(實(shí)際值)')plt.xlabel('身高/厘米')plt.ylabel('體重/千克')plt.show()任務(wù)解決方案四、模型訓(xùn)練fromsklearnimportlinear_model#初始化回歸模型classifier=linear_model.LogisticRegression(solver='liblinear',C=100)#擬合classifier.fit(X,Y.values.ravel())#給出預(yù)測(cè)結(jié)果output=classifier.predict(X)output=output.reshape(len(output),1)任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn)plt.figure()plt.scatter(
df[['Height']],df[['Weight']],c=output,s=80,edgecolors='black',
linewidths=1,cmap=plt.cm.Paired)plt.title('性別判定(線性分類器,預(yù)測(cè)值)')plt.xlabel('身高')plt.ylabel('體重')plt.show()任務(wù)解決方案五、模型應(yīng)用結(jié)果展現(xiàn):進(jìn)階x_min,x_max=df[['Height']].values.min()-1.0,df[['Height']].values.max()+1.0y_min,y_max=df[['Weight']].values.min()-1.0,df[['Weight']].values.max()+1.0step_size=0.2x_values,y_values=np.meshgrid(np.arange(x_min,x_max,step_size),np.arange(y_min,y_max,step_size))mesh_output=classifier.predict(np.c_[x_values.ravel(),y_values.ravel()])mesh_output=mesh_output.reshape(x_values.shape)plt.pcolormesh(x_values,y_values,mesh_output,cmap=plt.cm.gray)plt.scatter(df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',linewidths
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年安徽省蚌埠市高一下學(xué)期第六次聯(lián)考政治試題及答案
- 2024年山東省濟(jì)南市歷城區(qū)稼軒學(xué)校中考化學(xué)三模試卷(含解析)
- 無人機(jī)應(yīng)用技術(shù)3.3.視覺定位
- 廣東省佛山市重點(diǎn)中學(xué)2025屆高二化學(xué)第二學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 四川省瀘縣五中2025年高一化學(xué)第二學(xué)期期末監(jiān)測(cè)模擬試題含解析
- 政治原創(chuàng)改編題目及答案
- 2025至2030年中國(guó)離子活水機(jī)行業(yè)投資前景及策略咨詢報(bào)告
- 2025至2030年中國(guó)氯林可霉素行業(yè)投資前景及策略咨詢報(bào)告
- 2025至2030年中國(guó)大四開多色膠印機(jī)行業(yè)投資前景及策略咨詢報(bào)告
- 2025至2030年中國(guó)二腳支架行業(yè)投資前景及策略咨詢報(bào)告
- 江蘇省南京市六校聯(lián)合體2024-2025學(xué)年高一下學(xué)期期末調(diào)研測(cè)試歷史試題(含答案)
- 2024年個(gè)人信用報(bào)告(個(gè)人簡(jiǎn)版)樣本(帶水印-可編輯)
- 16J914-1 公用建筑衛(wèi)生間
- 芬頓試劑投加量計(jì)算
- 建筑自動(dòng)化課件2013 10.通信網(wǎng)絡(luò)技術(shù)
- LS/T 8008-2010糧油倉(cāng)庫(kù)工程驗(yàn)收規(guī)程
- GB/T 18749-2002耐化學(xué)腐蝕陶瓷塔填料技術(shù)條件
- GB/T 17431.1-1998輕集料及其試驗(yàn)方法第一部分:輕集料
- 2023年德陽(yáng)市旌陽(yáng)區(qū)廣播電視臺(tái)(融媒體中心)招聘筆試題庫(kù)及答案解析
- 新編阿拉伯語(yǔ)第三冊(cè)第二課課文及單詞
- 焊接工藝評(píng)定氬弧焊
評(píng)論
0/150
提交評(píng)論