版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
構(gòu)建運輸車輛安全駕駛行為分析模型運輸車輛安全駕駛行為分析——樸素貝葉斯、K近鄰任務(wù)描述樸素貝葉斯法是基于貝葉斯定理與特征條件獨立假設(shè)的分類方法。對于運輸企業(yè)來說,安全意識和責(zé)任感的重要性不言而喻,這是是企業(yè)長期發(fā)展和穩(wěn)定運營的必要因素。構(gòu)建運輸車輛安全駕駛行為分析模型能幫助企業(yè)更好地管理和監(jiān)控運輸車輛的安全性能。在本任務(wù)中將使用高斯樸素貝葉斯和多項式分布樸素貝葉斯構(gòu)建運輸車輛安全駕駛行為分析模型,探索、分析各車輛的駕駛行為。構(gòu)建運輸車輛安全駕駛行為分析模型任務(wù)要求讀取并探索駕駛行為數(shù)據(jù)。處理駕駛行為數(shù)據(jù)。使用sklearn庫構(gòu)建樸素貝葉斯模型。利用Matplotlib庫對預(yù)測結(jié)果進(jìn)行可視化展示。使用準(zhǔn)確率、精確率、召回率、F1得分評估樸素貝葉斯模型。構(gòu)建運輸車輛安全駕駛行為分析模型運用Python構(gòu)建運輸車輛安全駕駛行為分析模型需調(diào)用不同的庫高斯樸素貝葉斯多項式分布樸素貝葉斯樸素貝葉斯基本概念什么是樸素貝葉斯?構(gòu)建運輸車輛安全駕駛行為分析模型樸素貝葉斯是分類器中最常用的一種生成式模型,其基于貝葉斯定理將聯(lián)合概率轉(zhuǎn)化為條件概率,利用特征條件及獨立假設(shè)簡化條件的概率進(jìn)行計算。樸素貝葉斯基本概念樸素貝葉斯算法流程構(gòu)建運輸車輛安全駕駛行為分析模型計算先驗概率,如果已經(jīng)給出先驗概率,那么利用給出的先驗概率。分別計算第
k個類別的第
i維特征的第
i個取值的條件概率。按照分類維度計算:分類概率×每個特征概率。確定待分類項所屬的類別。高斯樸素貝葉斯高斯樸素貝葉斯主要處理連續(xù)型變量的數(shù)據(jù),它的模型是假設(shè)每一個維度都符合高斯分布。使用sklearn庫中naive_bayes模塊的GaussianNB類可以構(gòu)建高斯樸素貝葉斯模型,其語法格式如下。構(gòu)建運輸車輛安全駕駛行為分析模型參數(shù)名稱說明priors接收array。表示先驗概率大小,若沒有給定,則模型根據(jù)樣本數(shù)據(jù)計算(利用極大似然法)。默認(rèn)為None。sklearn.naive_bayes.GaussianNB(priors=None)GaussianNB類常用的參數(shù)及其說明如下:樸素貝葉斯例題為了響應(yīng)共同富裕的主題,以幫助當(dāng)?shù)鼐用裉岣呤杖胨?,某地基層組織決定進(jìn)行人口普查,以便更好地了解當(dāng)?shù)鼐用竦氖杖肭闆r?,F(xiàn)有某地的人口普查收入數(shù)據(jù),數(shù)據(jù)描述如下。構(gòu)建運輸車輛安全駕駛行為分析模型性別當(dāng)?shù)鼐用裥詣e,取值為0、1。其中,0代表女性,1代表男性年齡當(dāng)?shù)鼐用衲挲g,取值為其自身年齡婚姻情況當(dāng)?shù)鼐用窕橐銮闆r,取值為0-3。其中,0代表已婚,1代表離異,2代表未婚,3代表喪偶家庭角色當(dāng)?shù)鼐用裨诩彝ブ兴缪莸慕巧?,取值?-5。其中,0代表妻子,1代表丈夫,2代表未婚,3代表離家,4代表孩子,5代表其他關(guān)系受教育程度當(dāng)?shù)鼐用袼邮艿慕逃潭?,取值?-8。其中,0代表初中,1代表中專,2代表高中,3代表職業(yè)學(xué)校,4代表大專,5代表大學(xué)未畢業(yè),6代表學(xué)士,7代表碩士,8代表博士特征名稱特征說明工作類型當(dāng)?shù)鼐用竦墓ぷ黝愋?,取值?-5。其中,0代表私人,1代表自由職業(yè)非公司,2代表自由職業(yè)公司,3代表政府,4代表無薪,5代表無工作經(jīng)驗每周工作時長(h)當(dāng)?shù)鼐用竦拿恐芄ぷ鲿r長,取值為其每周工作的小時數(shù)職業(yè)當(dāng)?shù)鼐用竦穆殬I(yè),取值為0-13。其中,0代表技術(shù)支持,1代表手工藝維修,2代表銷售,3代表執(zhí)行主管,4代表專業(yè)技術(shù),5代表勞工保潔,6代表機(jī)械操作,7代表管理文書,8代表農(nóng)業(yè)捕撈,9代表運輸,10代表家政服務(wù),11代表保安,12代表軍人,13代表其他職業(yè)收入等級當(dāng)?shù)鼐用袼鶎偈杖氲燃夘悇e,取值為0、1。其中,0代表收入小于等于5萬每年,1代表收入大于5萬每年樸素貝葉斯例題為了響應(yīng)共同富裕的主題,以幫助當(dāng)?shù)鼐用裉岣呤杖胨剑车鼗鶎咏M織決定進(jìn)行人口普查,以便更好地了解當(dāng)?shù)鼐用竦氖杖肭闆r。現(xiàn)有某地的人口普查收入數(shù)據(jù),數(shù)據(jù)描述如下。構(gòu)建運輸車輛安全駕駛行為分析模型特征名稱特征說明例題分析構(gòu)建運輸車輛安全駕駛行為分析模型導(dǎo)入庫讀取csv文件把特征集和標(biāo)簽集分開劃分訓(xùn)練集和測試集創(chuàng)建高斯樸素貝葉斯分類器訓(xùn)練模型預(yù)測測試集標(biāo)簽輸出用高斯樸素貝葉斯構(gòu)建人口普查收入分類模型主要由以下8個步驟實現(xiàn)。多項式分布樸素貝葉斯多項式分布樸素貝葉斯主要用于離散特征分類。使用sklearn庫中naive_bayes模塊的MultinomialNB類可以實現(xiàn)多項式分布樸素貝葉斯分類,其語法格式如下。MultinomialNB類常用的參數(shù)及其說明如下。構(gòu)建運輸車輛安全駕駛行為分析模型參數(shù)名稱說明alpha接收float。表示添加拉普拉斯平滑參數(shù),可選項。默認(rèn)1.0fit_prior接收bool。表示是否學(xué)習(xí)先驗概率,可選項。默認(rèn)Trueclass_prior接收floatarray。表示類先驗概率。默認(rèn)為Nonesklearn.naive_bayes.MultinomialNB(alpha=1.0,fit_prior=True,class_prior=None)例題分析構(gòu)建運輸車輛安全駕駛行為分析模型導(dǎo)入庫讀取csv文件把特征集和標(biāo)簽集分開劃分訓(xùn)練集和測試集創(chuàng)建多項式分布樸素貝葉斯分類器訓(xùn)練模型預(yù)測測試集標(biāo)簽輸出用多項式分布樸素貝葉斯構(gòu)建人口普查收入分類模型主要由以下8個步驟實現(xiàn)。構(gòu)建運輸車輛安全駕駛行為分析模型運輸車輛安全駕駛行為分析——樸素貝葉斯、K近鄰任務(wù)描述樸素貝葉斯法是基于貝葉斯定理與特征條件獨立假設(shè)的分類方法。對于運輸企業(yè)來說,安全意識和責(zé)任感的重要性不言而喻,這是是企業(yè)長期發(fā)展和穩(wěn)定運營的必要因素。構(gòu)建運輸車輛安全駕駛行為分析模型能幫助企業(yè)更好地管理和監(jiān)控運輸車輛的安全性能。在本任務(wù)中將使用高斯樸素貝葉斯和多項式分布樸素貝葉斯構(gòu)建運輸車輛安全駕駛行為分析模型,探索、分析各車輛的駕駛行為。構(gòu)建運輸車輛安全駕駛行為分析模型任務(wù)要求讀取并探索駕駛行為數(shù)據(jù)。處理駕駛行為數(shù)據(jù)。使用sklearn庫構(gòu)建樸素貝葉斯模型。利用Matplotlib庫對預(yù)測結(jié)果進(jìn)行可視化展示。使用準(zhǔn)確率、精確率、召回率、F1得分評估樸素貝葉斯模型。構(gòu)建運輸車輛安全駕駛行為分析模型運用Python構(gòu)建運輸車輛安全駕駛行為分析模型需調(diào)用不同的庫讀取并探索駕駛行為數(shù)據(jù)處理駕駛行為數(shù)據(jù)構(gòu)建高斯樸素貝葉斯模型構(gòu)建多項式分布樸素貝葉斯模型讀取并探索駕駛行為數(shù)據(jù)構(gòu)建運輸車輛安全駕駛行為分析模型根據(jù)已知數(shù)據(jù)集,在盡量少的先驗假定下進(jìn)行數(shù)據(jù)探索,通過查看數(shù)據(jù)分布規(guī)律、數(shù)據(jù)之間相關(guān)性等有助于確定如何有效地處理數(shù)據(jù),以便更輕松地找出異常值、數(shù)據(jù)間的關(guān)系等。讀取并探索駕駛行為數(shù)據(jù)的步驟如下。查看駕駛行為數(shù)據(jù)讀取數(shù)據(jù)查看數(shù)據(jù)類型描述性統(tǒng)計分析分布分析查看駕駛行為數(shù)據(jù)特征名稱特征說明某運輸企業(yè)采集到的448輛運輸車駕駛行為數(shù)據(jù)的數(shù)據(jù)說明如下。車輛編碼車牌的唯一編碼,已脫敏行駛里程(km)根據(jù)車輛設(shè)備編號的變化計算行駛里程,若設(shè)備號無變化,則當(dāng)前階段里程數(shù)=當(dāng)前樣本里程值-當(dāng)前階段里程起始值;若設(shè)備號變化,則將當(dāng)前階段里程數(shù)累加至總里程數(shù)中平均速(km/h)根據(jù)傳感器記錄的速度來計算平均速度,即求速度不為0時的速度均值速度標(biāo)準(zhǔn)差基于平均速度,計算每輛車的速度標(biāo)準(zhǔn)差速度差值標(biāo)準(zhǔn)差基于加速度,計算每輛車的速度差值標(biāo)準(zhǔn)差構(gòu)建運輸車輛安全駕駛行為分析模型查看駕駛行為數(shù)據(jù)特征名稱特征說明某運輸企業(yè)采集到的448輛運輸車駕駛行為數(shù)據(jù)的數(shù)據(jù)說明如下。急加速頻率將急加速次數(shù)除以該車的行駛里程數(shù),得到相應(yīng)的次數(shù)率急減速頻率將急減速次數(shù)除以該車的行駛里程數(shù),得到相應(yīng)的次數(shù)率疲勞駕駛頻率將疲勞駕駛次數(shù)除以該車的行駛里程數(shù),得到相應(yīng)的次數(shù)率熄火滑行頻率將熄火滑行次數(shù)除以該車的行駛里程數(shù),得到相應(yīng)的次數(shù)率超長怠速頻率將超長怠速次數(shù)除以該車的行駛里程數(shù),得到相應(yīng)的次數(shù)率駕駛行為駕駛行為類型。其中0表示疲憊型,1表示激進(jìn)型,2表示穩(wěn)健型構(gòu)建運輸車輛安全駕駛行為分析模型查看駕駛行為數(shù)據(jù)特征名稱特征說明某運輸企業(yè)采集到的448輛運輸車駕駛行為數(shù)據(jù)的數(shù)據(jù)說明如下。急加速(次)按照行業(yè)經(jīng)驗預(yù)設(shè),若車輛加速度大于急加速閾值(10.8km/h),且前后間隔時間不超過2s,則將其判定為急加速行為急減速(次)按照行業(yè)經(jīng)驗預(yù)設(shè),若車輛加速度小于急減速閾值(10.8km/h),且前后間隔時間不超過2s,則將其判定為急減速行為疲勞駕駛(次)根據(jù)道路運輸行業(yè)相關(guān)法規(guī)和規(guī)范,駕駛?cè)嗽?4小時內(nèi)累計駕駛時間超過8小時;連續(xù)駕駛時間超過4小時,且每次停車休息時間少于20分鐘;夜間連續(xù)駕駛2小時的行為判定為疲勞駕駛行為熄火滑行(次)假定車輛發(fā)動機(jī)的點火狀態(tài)為關(guān),且車輛經(jīng)緯度發(fā)生了位移的情況稱為熄火滑行狀態(tài)超長怠速(次)若車輛的發(fā)動機(jī)轉(zhuǎn)速不為零且車速為零時,當(dāng)持續(xù)的時間超過設(shè)定的閾值(60s)后,可將其視為超長怠速行為構(gòu)建運輸車輛安全駕駛行為分析模型處理駕駛行為數(shù)據(jù)異常值檢測異常值處理疲勞駕駛異常值檢測熄火滑行異常值檢測超長怠速異常值檢測使用Matplotlib庫的boxplot函數(shù)繪制箱線圖使用箱線圖識別異常值的方式剔除掉駕駛行為數(shù)據(jù)中的異常數(shù)據(jù)構(gòu)建運輸車輛安全駕駛行為分析模型處理駕駛行為數(shù)據(jù)異常值上四分位數(shù)下四分位數(shù)上邊界下邊界中位數(shù)構(gòu)建運輸車輛安全駕駛行為分析模型構(gòu)建高斯樸素貝葉斯模型構(gòu)建運輸車輛安全駕駛行為分析模型構(gòu)建高斯樸素貝葉斯模型主要通過以下6個步驟實現(xiàn)。使用StandardScaler函數(shù)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化處理。標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化使用train_test_split類將數(shù)據(jù)集拆分為訓(xùn)練集和測試集,用于訓(xùn)練模型以及檢驗?zāi)P汀2鸱钟?xùn)練集和測試集根據(jù)車輛駕駛行為數(shù)據(jù)將駕駛行為分為3類,分別為“疲憊型”“激進(jìn)型”“穩(wěn)健型”,對應(yīng)的標(biāo)簽集為“0”“1”“2”。使用GaussianNB類構(gòu)建高斯樸素貝葉斯模型。構(gòu)建模型構(gòu)建高斯樸素貝葉斯模型構(gòu)建運輸車輛安全駕駛行為分析模型在對高斯樸素貝葉斯的預(yù)測結(jié)果進(jìn)行可視化之前,需要對數(shù)據(jù)進(jìn)行PCA降維。此處,選擇將數(shù)據(jù)降為二維數(shù)據(jù)。對數(shù)據(jù)進(jìn)行PCA降維在對數(shù)據(jù)進(jìn)行PCA降維后,使用scatter函數(shù)對預(yù)測結(jié)果進(jìn)行可視化。對預(yù)測結(jié)果進(jìn)行可視化為了評估高斯樸素貝葉斯模型的分類效果,需要分別使用accuracy_score、recall_score、f1_score、precision_score類計算準(zhǔn)確率、精確率、召回率以及F1得分。評估高斯樸素貝葉斯模型對預(yù)測數(shù)據(jù)進(jìn)行可視化構(gòu)建運輸車輛安全駕駛行為分析模型模型分類效果較好!構(gòu)建多項式分布樸素貝葉斯模型構(gòu)建運輸車輛安全駕駛行為分析模型使用MinMaxScaler類對數(shù)據(jù)進(jìn)行最大最小標(biāo)準(zhǔn)化處理,以保證輸入多項式分布樸素貝葉斯的特征矩陣中不帶有負(fù)數(shù)。最大最小標(biāo)準(zhǔn)化使用MultinomialNB類構(gòu)建多項式分布樸素貝葉斯模型。構(gòu)建模型使用train_test_split類將數(shù)據(jù)集拆分為訓(xùn)練集和測試集,用于訓(xùn)練模型以及檢驗?zāi)P汀2鸱钟?xùn)練集和測試集構(gòu)建多項式分布樸素貝葉斯模型主要通過以下6個步驟實現(xiàn)。構(gòu)建多項式分布樸素貝葉斯模型構(gòu)建運輸車輛安全駕駛行為分析模型在對多項式分布樸素貝葉斯的預(yù)測結(jié)果進(jìn)行可視化之前,需要對數(shù)據(jù)進(jìn)行PCA降維。此處,選擇將數(shù)據(jù)降為二維數(shù)據(jù)。對數(shù)據(jù)進(jìn)行PCA降維在對數(shù)據(jù)進(jìn)行PCA降維后,使用scatter函數(shù)對預(yù)測結(jié)果進(jìn)行可視化。對預(yù)測結(jié)果進(jìn)行可視化為了評估多項式分布樸素貝葉斯模型的分類效果,需要分別使用accuracy_score、recall_score、f1_score、precision_score類計算準(zhǔn)確率、精確率、召回率以及F1得分。評估多項式分布樸素貝葉斯模型對預(yù)測數(shù)據(jù)進(jìn)行可視化構(gòu)建運輸車輛安全駕駛行為分析模型模型將類別0和類別2都誤判為了類別1。這說明使用多項式分布樸素貝葉斯構(gòu)建運輸車輛安全駕駛行為分析模型的性能不是很好,因此可以嘗試更換其他算法進(jìn)一步優(yōu)化模型效果。優(yōu)化運輸車輛安全駕駛行為分析模型運輸車輛安全駕駛行為分析——樸素貝葉斯、K近鄰任務(wù)描述創(chuàng)新思維和探索精神可以幫助個人更好地適應(yīng)和應(yīng)對不斷變化的環(huán)境和挑戰(zhàn),創(chuàng)新才能把握時代、引領(lǐng)時代。通過不斷地探索和嘗試,個人可以更好地發(fā)現(xiàn)自己的優(yōu)勢和潛力,從而實現(xiàn)自我價值的最大化。在本任務(wù)中將使用K近鄰構(gòu)建運輸車輛安全駕駛模型,并與樸素貝葉斯分類進(jìn)行對比分析。優(yōu)化運輸車輛安全駕駛行為分析模型任務(wù)要求使用sklearn庫建立K近鄰分類模型。利用Matplotlib庫實現(xiàn)結(jié)果的可視化。使用準(zhǔn)確率、精確率、召回率、F1得分評估K近鄰分類模型。對比分析樸素貝葉斯分類模型和K近鄰分類模型。優(yōu)化運輸車輛安全駕駛行為分析模型K近鄰對比分析法K近鄰什么是K近鄰算法?優(yōu)化運輸車輛安全駕駛行為分析模型K近鄰(K-NearestNeighbor,KNN)算法是一種常用的監(jiān)督學(xué)習(xí)方法。其原理非常簡單:對于給定測試樣本,基于指定的距離度量找出訓(xùn)練集中與其最近的k個樣本,然后基于這k個“鄰居”的信息來進(jìn)行預(yù)測。通常,在分類任務(wù)中用的是“投票法”,即選擇k個“鄰居”中出現(xiàn)最多的類別標(biāo)記作為預(yù)測結(jié)果;在回歸任務(wù)中使用“平均法”,即取k個鄰居的實值,輸出標(biāo)記的平均值作為預(yù)測結(jié)果;還可根據(jù)距離遠(yuǎn)近進(jìn)行加權(quán)投票或加權(quán)平均,距離越近的樣本權(quán)重越大。K近鄰優(yōu)化運輸車輛安全駕駛行為分析模型與其他學(xué)習(xí)算法相比,K近鄰分類有一個明顯的不同之處:接收訓(xùn)練集之后沒有顯式的訓(xùn)練過程。實際上,它是“懶惰學(xué)習(xí)”(lazylearning)的著名代表,此類學(xué)習(xí)算法在訓(xùn)練階段只是將樣本保存起來,訓(xùn)練時間為零,待接收到測試樣本后再進(jìn)行處理。K近鄰優(yōu)化運輸車輛安全駕駛行為分析模型K近鄰算法的示意圖如下所示。等距線樣本類別為負(fù)樣本類別為正當(dāng)k=1時,“+”樣本的個數(shù)為1,“-”樣本的個數(shù)為0。“+”樣本在范圍內(nèi)的樣本中占比高于“-”樣本,因此會將測試樣本判給占比最高的“+”類別.測試樣本K近鄰優(yōu)化運輸車輛安全駕駛行為分析模型K近鄰算法的示意圖如下所示。測試樣本當(dāng)k=3時,“+”樣本在范圍中的樣本所占的比例為1/3,“-”樣本所占的比例為2/3。此時,“-”樣本的占比高于“+”樣本比例,因此會將測試樣本判給占比最大的“-”類別。K近鄰優(yōu)化運輸車輛安全駕駛行為分析模型K近鄰算法的示意圖如下所示。測試樣本當(dāng)k=5時,“+”樣本在范圍中的樣本所占的比例為3/5,“-”樣本所占的比例為2/5。此時,“+”樣本占比高于“-”樣本,因此會將測試樣本判給占比最高的“+”類別。K近鄰優(yōu)化運輸車輛安全駕駛行為分析模型K近鄰算法的示意圖如下所示。測試樣本顯然k是一個重要參數(shù),當(dāng)k取不同值時,分類結(jié)果會顯著不同。在實際的學(xué)習(xí)環(huán)境中要取不同的k值進(jìn)行多次測試,選擇誤差最小的k值。K近鄰使用sklearn庫中neighbors模塊的KNeighborsClassifier類可以實現(xiàn)K近鄰算法對數(shù)據(jù)進(jìn)行分類。KNeighborsClassifier類的基本使用格式如下。優(yōu)化運輸車輛安全駕駛行為分析模型classsklearn.neighbors.KNeighborsClassifier(n_neighbors=5,*,weights='uniform',algorithm='auto',leaf_size=30,p=2,metric='minkowski',metric_params=None,n_jobs=None,**kwargs)K近鄰優(yōu)化運輸車輛安全駕駛行為分析模型參數(shù)名稱說明n_neighbors接收int。表示“鄰居”數(shù)。默認(rèn)為5weights接收str。表示分類判斷時最近鄰的權(quán)重,可選參數(shù)為uniform和distance,uniform表示權(quán)重相等,distance表示按距離的倒數(shù)賦予權(quán)重。默認(rèn)為uniformalgorithm接收str。表示分類時采取的算法,可選參數(shù)為auto、ball_tree、kd_tree和brute,一般選擇auto自動選擇最優(yōu)的算法。默認(rèn)為autoKNeighborsClassifier類常用的參數(shù)及其說明如下。K近鄰KNeighborsClassifier類常用的參數(shù)及其說明如下。優(yōu)化運輸車輛安全駕駛行為分析模型參數(shù)名稱說明p接收int。表示Minkowski指標(biāo)的功率參數(shù),p=1表示曼哈頓距離,p=2表示歐式距離。默認(rèn)為2metric接收str。表示距離度量。默認(rèn)為minkowskin_jobs接收int。表示計算時使用的核數(shù)。默認(rèn)為NoneK近鄰為了響應(yīng)共同富裕的主題,以幫助當(dāng)?shù)鼐用裉岣呤杖胨剑车鼗鶎咏M織決定進(jìn)行人口普查,以便更好地了解當(dāng)?shù)鼐用竦氖杖肭闆r?,F(xiàn)有某地的人口普查收入數(shù)據(jù),數(shù)據(jù)描述如下。優(yōu)化運輸車輛安全駕駛行為分析模型特征名稱特征說明性別當(dāng)?shù)鼐用裥詣e,取值為0、1。其中,0代表女性,1代表男性年齡當(dāng)?shù)鼐用衲挲g,取值為其自身年齡婚姻情況當(dāng)?shù)鼐用窕橐銮闆r,取值為0-3。其中,0代表已婚,1代表離異,2代表未婚,3代表喪偶家庭角色當(dāng)?shù)鼐用裨诩彝ブ兴缪莸慕巧≈禐?-5。其中,0代表妻子,1代表丈夫,2代表未婚,3代表離家,4代表孩子,5代表其他關(guān)系K近鄰為了響應(yīng)共同富裕的主題,以幫助當(dāng)?shù)鼐用裉岣呤杖胨?,某地基層組織決定進(jìn)行人口普查,以便更好地了解當(dāng)?shù)鼐用竦氖杖肭闆r?,F(xiàn)有某地的人口普查收入數(shù)據(jù),數(shù)據(jù)描述如下。優(yōu)化運輸車輛安全駕駛行為分析模型特征名稱特征說明受教育程度當(dāng)?shù)鼐用袼邮艿慕逃潭?,取值?-8。其中,0代表初中,1代表中專,2代表高中,3代表職業(yè)學(xué)校,4代表大專,5代表大學(xué)未畢業(yè),6代表學(xué)士,7代表碩士,8代表博士工作類型當(dāng)?shù)鼐用竦墓ぷ黝愋?,取值?-5。其中,0代表私人,1代表自由職業(yè)非公司,2代表自由職業(yè)公司,3代表政府,4代表無薪,5代表無工作經(jīng)驗K近鄰為了響應(yīng)共同富裕的主題,以幫助當(dāng)?shù)鼐用裉岣呤杖胨?,某地基層組織決定進(jìn)行人口普查,以便更好地了解當(dāng)?shù)鼐用竦氖杖肭闆r?,F(xiàn)有某地的人口普查收入數(shù)據(jù),數(shù)據(jù)描述如下。優(yōu)化運輸車輛安全駕駛行為分析模型特征名稱特征說明每周工作時長(h)當(dāng)?shù)鼐用竦拿恐芄ぷ鲿r長,取值為其每周工作的小時數(shù)職業(yè)當(dāng)?shù)鼐用竦穆殬I(yè),取值為0-13。其中,0代表技術(shù)支持,1代表手工藝維修,2代表銷售,3代表執(zhí)行主管,4代表專業(yè)技術(shù),5代表勞工保潔,6代表機(jī)械操作,7代表管理文書,8代表農(nóng)業(yè)捕撈,9代表運輸,10代表家政服務(wù),11代表保安,12代表軍人,13代表其他職業(yè)收入等級當(dāng)?shù)鼐用袼鶎偈杖氲燃夘悇e,取值為0、1。其中,0代表收入小于等于5萬每年,1代表收入大于5萬每年K近鄰優(yōu)化運輸車輛安全駕駛行為分析模型導(dǎo)入庫讀取csv文件選擇特征集和標(biāo)簽集劃分訓(xùn)練集和測試集對特征集進(jìn)行標(biāo)準(zhǔn)化處理創(chuàng)建K近鄰分類模型,使用5個鄰居訓(xùn)練模型預(yù)測測試集的標(biāo)簽輸出使用K近鄰構(gòu)建人口普查收入分類模型主要由以下9個步驟實現(xiàn)。對比分析法什么是對比分析法?對比分析法是指將兩個或兩個以上的數(shù)據(jù)進(jìn)行比較,分析它們的差異,從而揭示這些數(shù)據(jù)所代表的事物發(fā)展變化的情況和規(guī)律性。對比分析法的特點就是可以非常直觀地看出事物某方面地變化或差距,并且可以準(zhǔn)確、量化地表示出這種變化或差距是多少,這就是對比分析法的定義。對比分析法可以分為靜態(tài)比較和動態(tài)比較兩類。動態(tài)比較和靜態(tài)比較這兩種辦法既可單獨使用,也可結(jié)合使用。優(yōu)化運輸車輛安全駕駛行為分析模型對比分析法對比分析法的實踐運用與目標(biāo)對比,具體就是實際分類效果與預(yù)期目標(biāo)進(jìn)行對比,屬于橫比。與不同時期對比,具體就是選擇不同時期的模型訓(xùn)練結(jié)果作為對比標(biāo)準(zhǔn),屬于縱比。對同類算法對比,具體就是例如本項目中,樸素貝葉斯分類效果與K近鄰分類效果之間的對比,屬于橫比。對機(jī)器學(xué)習(xí)領(lǐng)域內(nèi)對比,具體就是與機(jī)器學(xué)習(xí)中的經(jīng)典算法、最新算法或平均水平進(jìn)行對比,屬于橫比。與數(shù)據(jù)處理效果進(jìn)行對比,具體就是對數(shù)據(jù)預(yù)處理、特征提取、特征選擇等步驟前后進(jìn)行對比,屬于縱比。同時,還可以對數(shù)據(jù)集的劃分方式進(jìn)行分組對比,這屬于橫比。優(yōu)化運輸車輛安全駕駛行為分析模型在使用對比分析法的時候需要注意的是指標(biāo)的口徑范圍、計算方法、計量單位必須一致構(gòu)建K近鄰模型對比樸素貝葉斯和K近鄰模型構(gòu)建K近鄰模型優(yōu)化運輸車輛安全駕駛行為分析模型構(gòu)建K近鄰模型主要通過以下3個步驟實現(xiàn)。使用KNeighborsClassifier類構(gòu)建K近鄰模型判定車輛駕駛行為。構(gòu)建模型在對數(shù)據(jù)進(jìn)行PCA降維后,使用scatter函數(shù)對預(yù)測結(jié)果進(jìn)行可視化。對預(yù)測結(jié)果進(jìn)行可視化為了評估K近鄰模型的分類效果,需要分別使用accuracy_score、recall_score、f1_score、precision_score類計算準(zhǔn)確率、精確率、召回率以及F1得分。評估K近鄰模型對比樸素貝葉斯和K近鄰模型優(yōu)化運輸車輛安全駕駛行為分析模型精益求精的精神也是創(chuàng)新思維和探索精神的重要組成部分。通過對比分析已構(gòu)建的多項式分布樸素貝葉斯、高斯樸素貝葉斯、K近鄰模型的準(zhǔn)確率、精確率、召回率、F1得分,能夠更好地踐行精益求精的精神。樸素貝葉斯模型和K近鄰模型相應(yīng)的評估指標(biāo)如下表所示。指標(biāo)高斯樸素貝葉斯多項式分布樸素貝葉斯K近鄰準(zhǔn)確率0.84126984126984130.46031746031746030.9206349206349206精確率0.83609598709417210.15343915343915340.9063492063492063召回率0.87006496751624180.33333333333333330.9147244559538413F1得分0.8436276367310850.21014492753623190.9092695562850316對比樸素貝葉斯和K近鄰模型優(yōu)化運輸車輛安全駕駛行為分析模型指標(biāo)高斯樸素貝葉斯多項式分布樸素貝葉斯K近鄰準(zhǔn)確率0.84126984126984130.46031746031746030.9
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 七年級英語Whatisyourfavorite課件
- 駕考題庫-70歲以上老年人C2駕照年審三力測試題
- 《證券銷戶寶典》課件
- 單位管理制度集粹選集【職工管理篇】十篇
- 2024服務(wù)合同范文(32篇)
- 單位管理制度合并選集【人員管理】
- 單位管理制度范例選集人事管理十篇
- 七年級英語Nationalheroes課件
- 3ds Max動畫制作實戰(zhàn)訓(xùn)練(第3版)教學(xué)教案
- 2024年醫(yī)院個人工作總結(jié)范文
- 肌萎縮側(cè)索硬化癥查房課件
- 數(shù)學(xué)與語言學(xué)、語言藝術(shù)的交叉研究
- 醫(yī)院“無陪護(hù)”病房試點工作方案
- 清華大學(xué)大學(xué)物理-光的偏振
- 心理健康教育-網(wǎng)絡(luò)與青少年
- 高中英語人教版(2019) 選擇性必修一 Unit 3 課文語法填空(含答案)
- 2021-2022學(xué)年陜西省寶雞市陳倉區(qū)北師大版六年級上冊期末考試數(shù)學(xué)試卷(含答案解析)
- 水工-建筑物課件
- 應(yīng)用PDCA提高入院宣教的知曉率
- 線性系統(tǒng)理論鄭大鐘307張課件
- 2019-2020學(xué)年第一學(xué)期廣東省廣州市天河區(qū)3年級數(shù)學(xué)期末考試卷
評論
0/150
提交評論