基于Kmeans和CBR方法的高校就業(yè)預(yù)測模型應(yīng)用研究_第1頁
基于Kmeans和CBR方法的高校就業(yè)預(yù)測模型應(yīng)用研究_第2頁
基于Kmeans和CBR方法的高校就業(yè)預(yù)測模型應(yīng)用研究_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于Kmeans和CBR方法的高校就業(yè)預(yù)測模型應(yīng)用研究【摘要】提出運(yùn)用Keans聚類算法和BR案例推理方法對(duì)高校學(xué)生就業(yè)趨向進(jìn)展預(yù)測。針對(duì)采集的高校就業(yè)信息的高維海量數(shù)據(jù),首先使用Keans聚類方法將已就業(yè)數(shù)據(jù)劃分成不同的就業(yè)類別,從而極大地減少了特征分析工作量。對(duì)未就業(yè)數(shù)據(jù)進(jìn)展預(yù)測時(shí),先計(jì)算跟每一聚類中心的間隔 值,從而得到其適宜的分類,再在每一類中進(jìn)展BR推理,最后得出對(duì)其的預(yù)測分類結(jié)果。實(shí)驗(yàn)結(jié)果說明,提出的算法預(yù)測結(jié)果較為準(zhǔn)確,為高校就業(yè)指導(dǎo)提供了幫助?!娟P(guān)鍵詞】Keans聚類BR推理高校就業(yè)預(yù)測隨著高校的擴(kuò)招,我國高等教育已經(jīng)由精英教育轉(zhuǎn)向群眾教育,從1999年開始,高等學(xué)校的辦學(xué)規(guī)模

2、、招生規(guī)模逐步擴(kuò)大。而由此帶來了應(yīng)屆畢業(yè)生的就業(yè)形勢一年比一年嚴(yán)峻,2022年,全國普通高等畢業(yè)生達(dá)630萬,比2022年的611萬又增加了19萬人1。面對(duì)如此大的就業(yè)壓力,各個(gè)高校也加強(qiáng)了就業(yè)指導(dǎo)方面的工作。不少高校開展了對(duì)學(xué)生的就業(yè)指導(dǎo),如搜集、挑選有效的需求信息,為畢業(yè)生提供指導(dǎo)與咨詢等,以進(jìn)步學(xué)校的就業(yè)率。但很多高校就業(yè)工作還只是做了面上工作,缺乏實(shí)際效果,并不能真正解決學(xué)生的實(shí)際問題。目前,很多高校都在使用就業(yè)管理系統(tǒng)、學(xué)籍管理系統(tǒng)等數(shù)據(jù)庫幫助工作,但這些數(shù)據(jù)庫往往還停留在簡單的統(tǒng)計(jì)、查詢等功能上。由于畢業(yè)生就業(yè)工作涉及的數(shù)據(jù)量非常宏大,而且時(shí)間集中,僅靠傳統(tǒng)的數(shù)學(xué)和統(tǒng)計(jì)手段已經(jīng)不夠

3、。如何運(yùn)用數(shù)據(jù)庫中的數(shù)據(jù)得到對(duì)就業(yè)指導(dǎo)有用的信息成為了一個(gè)非常有實(shí)際意義的研究內(nèi)容,而數(shù)據(jù)挖掘技術(shù)可在高校就業(yè)預(yù)測中有很好的應(yīng)用前景。本文首先用Keans2方法對(duì)往年已就業(yè)學(xué)生進(jìn)展聚類,對(duì)每一類特征進(jìn)展分析,得到其就業(yè)特征信息。對(duì)未就業(yè)學(xué)生進(jìn)展預(yù)測時(shí),先將其與每一類中心點(diǎn)計(jì)算間隔 ,將其分入某一類,在同一類中再用BR3進(jìn)展案例推理,從而得出其與哪幾個(gè)個(gè)案最相似,用這些成功就業(yè)的特征作為該學(xué)生的預(yù)測結(jié)果,而且還可以根據(jù)這些學(xué)生特征給新同學(xué)一個(gè)建議。本文構(gòu)造如下,第1節(jié)介紹基于Keans和BR的高校就業(yè)預(yù)測模型,第2節(jié)給出實(shí)驗(yàn)結(jié)果和分析,最后一節(jié)給出結(jié)論。1基于Keans和BR的高校就業(yè)預(yù)測模型學(xué)

4、生管理和就業(yè)數(shù)據(jù)數(shù)據(jù)量龐大,因此需要使用數(shù)據(jù)挖掘知識(shí)進(jìn)展處理,使用數(shù)據(jù)挖掘?qū)W(xué)生管理和就業(yè)數(shù)據(jù)進(jìn)展管理的概念流程如圖1所示。在圖1的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)庫中,可以使用多種算法,如決策樹算法4、關(guān)聯(lián)規(guī)那么算法5、SV(SupprtVetrahine,支持向量機(jī))6算法等等。本文重點(diǎn)是對(duì)就業(yè)數(shù)據(jù)進(jìn)展預(yù)測,因此提出了使用Keans聚類算法和BR算法,以得到較好的預(yù)測結(jié)果。Keans(K均值)聚類算法是一種基于劃分的聚類算法,建立在最小化誤差平方和的準(zhǔn)那么上。其過程是先隨機(jī)選擇一些初始代表點(diǎn)作為初始聚類中心,然后計(jì)算其余樣本點(diǎn)與各中心點(diǎn)的間隔 ,把它們分到最近(間隔 最小)的類中去;然后對(duì)每一類中的樣本

5、點(diǎn)計(jì)算均值,把這個(gè)均值作為新的聚類中心點(diǎn);反復(fù)迭代,直到聚類中心點(diǎn)不再改變或者到達(dá)迭代最大步數(shù)。Keans聚類算法的效率很高,時(shí)間復(fù)雜度為(tkn),其中n是樣本數(shù),k是聚類的類數(shù),t是算法迭代次數(shù)(tBR(ase-BasedReasning,基于案例推理)方法是對(duì)已經(jīng)發(fā)生的“歷史與待求解問題進(jìn)展相似性匹配,利用相似的一個(gè)或假設(shè)干個(gè)“歷史對(duì)待求解問題進(jìn)展解答。當(dāng)給定一個(gè)待求解問題,BR首先檢查是否存在一個(gè)同樣的訓(xùn)練案例。假設(shè)找到一個(gè),那么返回附在該案例上的解。假設(shè)找不到同樣的案例,那么BR將搜索具有類似于新案例的訓(xùn)練案例。概念上講,這些訓(xùn)練案例可以視為新案例的鄰接者。BR試圖組合臨近的訓(xùn)練案例

6、,提出新案例的解。假設(shè)解之間出現(xiàn)不相容,可能需要回溯搜索其他解。BR的主要難點(diǎn)包括找到一個(gè)好的相似性度量,開發(fā)對(duì)訓(xùn)練案例索引的有效技術(shù)和組合解的方法。本文提出的基于Keans和BR的高校就業(yè)預(yù)測模型的流程示意圖如圖2所示,首先用Keans方法對(duì)往年已就業(yè)學(xué)生進(jìn)展聚類,對(duì)未就業(yè)學(xué)生進(jìn)展預(yù)測時(shí),先將其與每一類中心點(diǎn)計(jì)算間隔 ,將其分入某一類,在同一類中再用BR進(jìn)展案例推理。2實(shí)驗(yàn)結(jié)果和分析數(shù)據(jù)挑選自最近幾年實(shí)際的就業(yè)信息,共320個(gè)樣本,部分樣本數(shù)據(jù)例子如表1:2.1數(shù)據(jù)預(yù)處理首先要把數(shù)據(jù)進(jìn)展預(yù)處理,不是數(shù)值型的數(shù)據(jù)轉(zhuǎn)換成數(shù)值型數(shù)據(jù)。如性別男用0代表,女用1表示,獲獎(jiǎng)情況我們也將其數(shù)值化,考慮用獲

7、獎(jiǎng)的次數(shù)來交換獲獎(jiǎng)這個(gè)屬性,社會(huì)工作也是如此.對(duì)特長我們簡單用有特長(數(shù)值1表示)、無特長(數(shù)值0表示)來區(qū)分。生源地那么與工作單位所在地進(jìn)展比照,如在同一省份那么用數(shù)值1代替,否那么用數(shù)值0代替。那么上述就業(yè)數(shù)據(jù)例子變成2.2實(shí)驗(yàn)結(jié)果和分析為了驗(yàn)證所提出方法的效果,我們使用eka工具對(duì)預(yù)處理數(shù)據(jù)進(jìn)展分析。對(duì)320個(gè)數(shù)據(jù)進(jìn)展聚類,得到第一步聚類結(jié)果如下:keans=Nuberfiteratins:2ithinlustersufsquarederrrs:259.0277777777773lusterentrids:luster0ean/de:3.9501.50.510StdDevs:0.1505

8、N/A0.50160.50160N/Aluster1ean/de:4.3142.510StdDevs:0.3009N/A1.00310.50160N/AlusteredInstanes0160(50%)1160(50%)即結(jié)果聚成了兩大類,如比照表1中數(shù)據(jù),我們發(fā)現(xiàn)樣例1(讀研)和樣例4(公務(wù)員)被聚在一類中,而樣例2(物流公司)和樣例3(信息公司)的被聚在另一類,這一結(jié)果說明去公司的同學(xué)有相似地方,而讀研和考公務(wù)員的同學(xué)有相近的成績和愛好。進(jìn)一步還可以對(duì)這兩類結(jié)果進(jìn)展細(xì)分分析。假設(shè)把320個(gè)樣例劃分成訓(xùn)練集和測試集來驗(yàn)證我們算法的預(yù)測準(zhǔn)確度,如預(yù)測工作省份與生源地是否一樣省份,可得如下結(jié)果:

9、IB1lassifierrretlylassifiedInstanes109100%InrretlylassifiedInstanes00%Kappastatisti1eanabsluteerrr0Rteansquarederrr0Relativeabsluteerrr0%Rtrelativesquarederrr0%TtalNuberfInstanes109=DetailedAurayBylass=TPRateFPRatePreisinReallF-easurelass101110101111=nfusinatrix=ab-lassifiedas820|a=0027|b=1這個(gè)結(jié)果說明可以完

10、全正確的預(yù)測出工作地點(diǎn),從而可以給就業(yè)工作提供一些指導(dǎo)和幫助。3結(jié)論與展望該文建立了基于Keans聚類算法和BR推理的高校就業(yè)預(yù)測模型,闡述了使用數(shù)據(jù)挖掘?qū)W(xué)生管理和就業(yè)數(shù)據(jù)進(jìn)展管理的概念流程、基于Keans和BR的就業(yè)預(yù)測模型過程、就業(yè)數(shù)據(jù)的搜集以及數(shù)據(jù)數(shù)值化預(yù)處理等過程,最后將Keans方法和BR方法應(yīng)用到高校就業(yè)預(yù)測中。經(jīng)實(shí)驗(yàn)檢驗(yàn),證明了基于Keans和BR方法的有效性和可靠性,同時(shí)將該方法應(yīng)用在高校就業(yè)預(yù)測中,為高校就業(yè)指導(dǎo)提供一個(gè)定量的根據(jù),為從事就業(yè)指導(dǎo)工作的教師提供重要參考。本文分析了高校學(xué)生的就業(yè)情況,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于就業(yè)數(shù)據(jù),實(shí)現(xiàn)Keans和BR算法并得到聚類知識(shí)。通過對(duì)

11、學(xué)生就業(yè)數(shù)據(jù)進(jìn)展挖掘分析,找到學(xué)生就業(yè)信息與學(xué)生學(xué)習(xí)成績、社會(huì)活動(dòng)才能等屬性之間的關(guān)聯(lián),有助于學(xué)校教育目的、教育方向、教育手段的定位與改進(jìn),有助于在校生明確加強(qiáng)學(xué)習(xí)與理論的方向,為學(xué)生培養(yǎng)與就業(yè)指導(dǎo)提供決策根據(jù),進(jìn)步對(duì)畢業(yè)生就業(yè)指導(dǎo)的實(shí)效性,實(shí)現(xiàn)畢業(yè)生更快、更好地就業(yè)。參考文獻(xiàn)1袁貴仁.2022年全國普通高校畢業(yè)生就業(yè)工作視頻會(huì)議.2KaufanLandRusseeuPJ.Findinggrupsindata:anintrdutintlusteranalysis.NeYrk:JhnSns,1990.3Aadt,A.andPlaza,E.ase-BasedReasning:FundatinalIssues,ethdlgialVariatins,andSysteApprahes.AIuniatins,7(i):pp39-59,1994.4J.R.Quinlan.IndutinfDeisinTrees,ahineLearning,1(1):

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論