![大數(shù)據(jù)時(shí)代高校助學(xué)評(píng)審體系的構(gòu)建與思考_第1頁(yè)](http://file4.renrendoc.com/view/da46df4c74fa63336a00f9ef7cc5ed0b/da46df4c74fa63336a00f9ef7cc5ed0b1.gif)
![大數(shù)據(jù)時(shí)代高校助學(xué)評(píng)審體系的構(gòu)建與思考_第2頁(yè)](http://file4.renrendoc.com/view/da46df4c74fa63336a00f9ef7cc5ed0b/da46df4c74fa63336a00f9ef7cc5ed0b2.gif)
![大數(shù)據(jù)時(shí)代高校助學(xué)評(píng)審體系的構(gòu)建與思考_第3頁(yè)](http://file4.renrendoc.com/view/da46df4c74fa63336a00f9ef7cc5ed0b/da46df4c74fa63336a00f9ef7cc5ed0b3.gif)
![大數(shù)據(jù)時(shí)代高校助學(xué)評(píng)審體系的構(gòu)建與思考_第4頁(yè)](http://file4.renrendoc.com/view/da46df4c74fa63336a00f9ef7cc5ed0b/da46df4c74fa63336a00f9ef7cc5ed0b4.gif)
![大數(shù)據(jù)時(shí)代高校助學(xué)評(píng)審體系的構(gòu)建與思考_第5頁(yè)](http://file4.renrendoc.com/view/da46df4c74fa63336a00f9ef7cc5ed0b/da46df4c74fa63336a00f9ef7cc5ed0b5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 大數(shù)據(jù)時(shí)代高校助學(xué)評(píng)審體系的構(gòu)建與思考 張皓Summary: 貧困生認(rèn)定是高校助學(xué)工作中的重點(diǎn)和難點(diǎn)。大數(shù)據(jù)時(shí)代的到來(lái),給高校應(yīng)用信息化手段開展助學(xué)評(píng)定工作提供了技術(shù)支持,該文對(duì)如何在基于數(shù)據(jù)挖掘等理論基礎(chǔ)上設(shè)計(jì)高校助學(xué)體系闡述了總體框架,并對(duì)其中部分關(guān)鍵技術(shù)進(jìn)行了分析。Key: 助學(xué)體系;數(shù)據(jù)挖掘;AHP:TP311 :A :1009-3044(2016)28-0001-03貧困生資助工作是高校扶助家庭困難學(xué)生順利完成學(xué)業(yè)的一項(xiàng)重要舉措,如何構(gòu)建科學(xué)的助學(xué)體系是高校乃至全社會(huì)所面臨的一個(gè)重大課題。自2007年國(guó)家在普通高校中施行助學(xué)政策以來(lái),我國(guó)高校的助學(xué)體系已逐步形成了由“獎(jiǎng)貸助補(bǔ)減”等
2、多項(xiàng)措施全面并行的局面,使無(wú)數(shù)貧困學(xué)生從中受益。然而,目前高校貧困生資助工作依然存在著一些困難和問(wèn)題。其中,缺乏科學(xué)合理的貧困生認(rèn)定標(biāo)準(zhǔn)是目前高校在貧困生資助工作中普遍遇到的主要困難【1】。對(duì)于剛?cè)雽W(xué)的新生來(lái)說(shuō),能提供為判別依據(jù)的僅有一張家庭經(jīng)濟(jì)情況調(diào)查表,而且更令人遺憾的是表中“家庭人均年收入”這最關(guān)鍵的一欄信息無(wú)從考證,出現(xiàn)有些學(xué)生瞞報(bào)少報(bào)家庭收入或者夸大家庭經(jīng)濟(jì)困難的現(xiàn)象,而當(dāng)?shù)氐拿裾块T也不可能詳細(xì)掌握每家每戶的普通百姓的具體收入情況,這就給貧困生的甄別帶來(lái)了極大的障礙。隨著大數(shù)據(jù)時(shí)代的到來(lái),如何運(yùn)用各種信息處理技術(shù)來(lái)解決貧困生認(rèn)定工作中的難題成為各高校研究的熱點(diǎn)之一。本文將對(duì)應(yīng)用數(shù)據(jù)
3、挖掘和AHP等技術(shù)來(lái)構(gòu)建助學(xué)評(píng)審系統(tǒng)做初步的探討。1 高校助學(xué)評(píng)審系統(tǒng)總體設(shè)計(jì)框架近十年來(lái)高校助學(xué)工作的開展和取得的成果為我們積累了寶貴的經(jīng)驗(yàn),不少高校學(xué)生工作者紛紛撰文,就貧困生認(rèn)定的具體工作細(xì)節(jié)提出了許多寶貴的建議和方法。本文所要闡述的運(yùn)用數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)出的評(píng)審系統(tǒng)與之并不排斥,即并非完全擯棄過(guò)去傳統(tǒng)的評(píng)審模式,而是為助學(xué)評(píng)審環(huán)節(jié)提供一個(gè)盡量科學(xué)的參考。最終的評(píng)審結(jié)果必然還是由評(píng)審老師酌情認(rèn)定而不應(yīng)由機(jī)器自動(dòng)“識(shí)別”。因此,本文所提出的助學(xué)評(píng)審體系是建立在如圖1所示的設(shè)計(jì)框架之上。2 助學(xué)評(píng)審體系中的數(shù)據(jù)挖掘等關(guān)鍵技術(shù)探討數(shù)據(jù)挖掘技術(shù)問(wèn)世以后在很多領(lǐng)域有了優(yōu)秀的表現(xiàn)。于是有些高校工作者開
4、始考慮將數(shù)據(jù)挖掘技術(shù)應(yīng)用于助學(xué)評(píng)審工作2中來(lái)。常用的挖掘技術(shù)是使用關(guān)聯(lián)規(guī)則(改進(jìn)APRIOR算法等)推出學(xué)生信息與貧困程度的關(guān)聯(lián)程度,但筆者以為,僅憑單純的挖掘就得出結(jié)論是欠準(zhǔn)確的,因?yàn)閗頻繁集的背后也許有尚不為知的k+1 項(xiàng)起作用,在置信度不高的條件下有誤導(dǎo)的可能。例如校園一卡通消費(fèi)情況,由“月消費(fèi)在200元以下”這個(gè)事件推出“貧困”的置信度可能達(dá)到了70%以上,但也說(shuō)明了有30%的可能是由于該生在減肥或是食堂菜不愛吃等其他原因。如果將該生身高體重比、性別、家庭月收入、體育館每周光顧次數(shù)等相關(guān)事件加進(jìn)來(lái)統(tǒng)計(jì)則有可能會(huì)幫助判別該生是否是在減肥,但隨之而帶來(lái)的問(wèn)題是事件集的膨脹和支持度的下降。不
5、論何種情況,該學(xué)生的情況不能簡(jiǎn)單地只由幾個(gè)事件(以下稱為“評(píng)價(jià)指標(biāo)”)就下結(jié)論,而應(yīng)盡可能地綜合考慮其他各項(xiàng)“指標(biāo)”,避免一葉障目妄下定語(yǔ)。需要強(qiáng)調(diào)的是,本文中關(guān)聯(lián)規(guī)則的運(yùn)用有所不同,它僅僅是第一步和最后一步:用來(lái)發(fā)現(xiàn)和驗(yàn)證評(píng)價(jià)指標(biāo)。2.1利用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)和驗(yàn)證評(píng)價(jià)指標(biāo)評(píng)審體系應(yīng)由許多評(píng)價(jià)指標(biāo)共同構(gòu)成。評(píng)價(jià)指標(biāo)的確定要遵循以下原則:1)科學(xué)性;2)可行性;3)可測(cè)性;4)動(dòng)態(tài)完善性【3】。表1列出和總結(jié)了目前高校在貧困生認(rèn)定中最常用的指標(biāo)【4】。其中位于頂層的指標(biāo)可稱為一級(jí)指標(biāo),一級(jí)指標(biāo)以下的分指標(biāo)稱為二級(jí)指標(biāo),依此類推。指標(biāo)最初可以是專家設(shè)計(jì)或經(jīng)驗(yàn)總結(jié),以后隨著數(shù)據(jù)庫(kù)中的信息量日益增多和完善
6、,可運(yùn)用數(shù)據(jù)挖掘技術(shù)“發(fā)現(xiàn)”并增加潛在的評(píng)價(jià)指標(biāo)。其實(shí)現(xiàn)的主要手段就是利用關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中最基本的技術(shù)之一,其原理是:假設(shè)I=i1, i2im是一個(gè)項(xiàng)目集合,T=t1, t2tn是一個(gè)(數(shù)據(jù)庫(kù))事務(wù)集合,其中每個(gè)事務(wù)ti是一個(gè)項(xiàng)目集合,并滿足ti?I。則一個(gè)關(guān)聯(lián)規(guī)則即是一個(gè)如下形式的蘊(yùn)涵關(guān)系:支持度的值過(guò)小則表明此關(guān)聯(lián)事件有可能只是偶然發(fā)生,而置信度如果太低則表示從X推斷出Y的可靠度不高。Aprior算法是實(shí)現(xiàn)關(guān)聯(lián)規(guī)則的主要算法,并有各種改進(jìn)版本,其原理主要是通過(guò)迭代地發(fā)現(xiàn)頻繁集來(lái)實(shí)現(xiàn),本文由于篇幅限制不再介紹。實(shí)際工作中我們大可不必自己編程去實(shí)現(xiàn)Aprior算法,有些數(shù)據(jù)庫(kù)軟件
7、如SQL Server 2008等自帶了關(guān)聯(lián)算法并可設(shè)置其各種參數(shù),另外還有諸如SPSS、Weka等挖掘工具軟件,我們可以利用這些現(xiàn)成的工具很方便地進(jìn)行挖掘,所要做的只是數(shù)據(jù)清洗和最終的發(fā)現(xiàn)與驗(yàn)證工作。接下來(lái)再通過(guò)設(shè)置合理的置信度和支持度,并可結(jié)合重要性(即改善度lift)等其他參數(shù)進(jìn)行綜合分析,從而判斷所挖掘出的評(píng)價(jià)指標(biāo)是否成立。例如一卡通消費(fèi)情況,如果將其作為一項(xiàng)評(píng)價(jià)指標(biāo),則由其生成的關(guān)聯(lián)規(guī)則在支持度和置信度上應(yīng)不能低于其他常用指標(biāo)太多,否則就難以“置信”,要考慮撤銷該指標(biāo)或降低權(quán)重。2.2 構(gòu)建評(píng)價(jià)目標(biāo)函數(shù)的思路與分析指標(biāo)項(xiàng)確立以后就是考慮如何構(gòu)建評(píng)價(jià)函數(shù)的問(wèn)題。分兩步:第一步是要如何確
8、定這些指標(biāo)項(xiàng)各自對(duì)應(yīng)的權(quán)值;第二步是函數(shù)形式的確立。有的文獻(xiàn)中給出了以模糊數(shù)學(xué)理論為基礎(chǔ)建立模糊矩陣的方式進(jìn)行判別,本文由于篇幅限制僅以最簡(jiǎn)單的目標(biāo)函數(shù)法來(lái)說(shuō)明問(wèn)題。即構(gòu)造以下形式的目標(biāo)函數(shù)來(lái)作為最終的判別輸出:其中是指標(biāo)項(xiàng)的對(duì)應(yīng)權(quán)重。該目標(biāo)函數(shù)最終輸出值即為該生的評(píng)價(jià)指數(shù)。而在此函數(shù)式中,如何確定各指標(biāo)項(xiàng)和對(duì)應(yīng)的權(quán)值則是構(gòu)建該目標(biāo)函數(shù)的關(guān)鍵。這里順便提一下神經(jīng)網(wǎng)絡(luò)和決策樹。神經(jīng)網(wǎng)絡(luò)遠(yuǎn)比這個(gè)目標(biāo)函數(shù)復(fù)雜,它是一種非線性結(jié)構(gòu),依靠大量數(shù)據(jù)樣本進(jìn)行反饋式訓(xùn)練來(lái)自適應(yīng)調(diào)整節(jié)點(diǎn)權(quán)重,適合精確分類輸出。但如果用龐大的數(shù)據(jù)開銷和算法復(fù)雜度去換取“絕對(duì)”精確的分類有“殺雞用牛刀”之嫌。決策樹是一種樹型結(jié)構(gòu),
9、樹中的各節(jié)點(diǎn)是由算法(目前最常用的是C4.5算法)生成,且最終的葉子節(jié)點(diǎn)性質(zhì)為屬性。但是我們希望評(píng)價(jià)體系最終輸出的是一個(gè)可供參考和比較的值而非屬性。盡管可以用把值離散化為一個(gè)個(gè)區(qū)間上的屬性的方法,但這樣做會(huì)加大構(gòu)造樹的復(fù)雜度。還有最重要的一點(diǎn)是,樹型的判別結(jié)構(gòu)并不適合助學(xué)評(píng)價(jià)系統(tǒng)。我們所期望的值是由系統(tǒng)中所有指標(biāo)項(xiàng)的共同影響來(lái)決定的,而不是從某個(gè)節(jié)點(diǎn)開始就直接滑向了葉子。 2.3運(yùn)用AHP算法實(shí)現(xiàn)評(píng)價(jià)目標(biāo)函數(shù)的構(gòu)建美國(guó)運(yùn)籌學(xué)家Saaty教授提出過(guò)一種AHP算法(Analytic Hierarchy Process)5,它為解決這一問(wèn)題提供了途徑。這是一種多準(zhǔn)則決策方法,且非常適合求各層次指標(biāo)的
10、權(quán)重,步驟如下:1)構(gòu)造判斷矩陣:對(duì)同級(jí)的所有指標(biāo)依次構(gòu)造兩兩對(duì)比的判決矩陣:其中aij取從1-9的整數(shù)。 aij越大則表示指標(biāo)Ui相對(duì)比Uj的影響力更大。aji取aij的倒數(shù)。這里aij的初始值是由專家填寫或由經(jīng)驗(yàn)產(chǎn)生的,雖然有些主觀性,但由于后期還可由評(píng)定結(jié)果進(jìn)行反饋訓(xùn)練和調(diào)整,因此并不影響建立模型的科學(xué)性。2)規(guī)范化列并確定各指標(biāo)的權(quán)值:3)一致性檢驗(yàn):計(jì)算一致性比例:其中C.I= ,是矩陣的特征值,而的值可由查表得到。的值越小越好,通常取0.1,若滿足此條件則認(rèn)為通過(guò)一致性檢驗(yàn)。有關(guān)AHP層次分析法中的判斷矩陣構(gòu)造在許多文獻(xiàn)中多有論述,其各種改進(jìn)算法在此不再一一列舉。本文僅使用了最簡(jiǎn)單
11、的和法定義說(shuō)明問(wèn)題。以最頂層的一級(jí)指標(biāo)為例,假設(shè)判斷矩陣如表3所示:即學(xué)生家庭情況的權(quán)重設(shè)置為0.5374,學(xué)生本人情況權(quán)重為0.2680,師生評(píng)定情況權(quán)重為0.1946。以下省略了一致性檢驗(yàn)過(guò)程。以此類推可得到二級(jí)三級(jí)各指標(biāo)的相應(yīng)權(quán)重。3 設(shè)計(jì)貧困生申報(bào)系統(tǒng)與評(píng)定系統(tǒng)用戶界面以數(shù)據(jù)挖掘和AHP層次分析實(shí)現(xiàn)的評(píng)審系統(tǒng)最終以友好的軟件界面形式展現(xiàn)給用戶。申報(bào)系統(tǒng)面向?qū)W生,由學(xué)生本人按實(shí)際情況填寫軟件所要求的各指標(biāo)項(xiàng),并可以加裝智能判斷:例如事先將全國(guó)各地經(jīng)濟(jì)數(shù)據(jù)分為若干片,根據(jù)學(xué)生填寫的父母年齡職稱職務(wù)工作情況等進(jìn)行初步判斷,如果與數(shù)據(jù)庫(kù)里的相同條件下平均收入水平差距超過(guò)臨界值則給出警示;還可要
12、求學(xué)生必須填寫正確的家庭收支情況,發(fā)現(xiàn)“入不敷出”數(shù)據(jù)則要求學(xué)生必須填寫其他經(jīng)濟(jì)來(lái)源或強(qiáng)制重填,否則無(wú)法提交等等。評(píng)審系統(tǒng)則由評(píng)審老師或評(píng)審小組使用,根據(jù)系統(tǒng)生成的參考評(píng)價(jià)值F(a)對(duì)學(xué)生貧困程度給予最終評(píng)定和排序。4 系統(tǒng)開發(fā)工作的前景大數(shù)據(jù)時(shí)代的到來(lái)為我們改變和創(chuàng)新高校助學(xué)評(píng)審模式提供了契機(jī),但種種客觀條件的限制使得數(shù)據(jù)挖掘技術(shù)并未能廣泛應(yīng)用到實(shí)處,如何應(yīng)用該技術(shù)解決高校貧困生評(píng)定工作中遇到的困難仍將是一個(gè)任重而道遠(yuǎn)的過(guò)程。然而不積跬步,無(wú)以至千里,隨著我們鍥而不舍的數(shù)據(jù)積累和挖掘工作的不斷深入,必定會(huì)在不久的將來(lái)給高校助學(xué)系統(tǒng)的研發(fā)帶來(lái)新的變革。Reference:1 王東紅.大數(shù)據(jù)時(shí)代高校貧困生資助工作的思考J.經(jīng)濟(jì)研究導(dǎo)刊,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司與員工勞動(dòng)合同范本(5篇)
- 2025年協(xié)作合同范本之培訓(xùn)事項(xiàng)
- 2025年醫(yī)院衛(wèi)生耗材采購(gòu)銷售合同規(guī)范文本
- 2025年人防使用權(quán)策劃管理合同書
- 2025年醫(yī)院安全整改協(xié)議書范例
- 2025年過(guò)熱蒸汽干燥設(shè)備項(xiàng)目規(guī)劃申請(qǐng)報(bào)告模板
- 2025年光盤數(shù)據(jù)備份協(xié)議
- 2025年鑄造造型材料項(xiàng)目規(guī)劃申請(qǐng)報(bào)告模板
- 2025年舞臺(tái)燈具項(xiàng)目申請(qǐng)報(bào)告模范
- 2025年農(nóng)業(yè)生產(chǎn)資料購(gòu)銷合同范文合同樣本
- 電網(wǎng)工程設(shè)備材料信息參考價(jià)(2024年第四季度)
- 部編版小學(xué)語(yǔ)文二年級(jí)下冊(cè)第三單元集體備課教材分析
- 高中英語(yǔ)選擇性必修二 Unit 1 Period 1 Reading and thinking(課件)(共38張)
- 小學(xué)生電子小報(bào)通用模板-A4電子小報(bào)15
- CAS云計(jì)算軟件平臺(tái)深入介紹
- 課堂教學(xué)方法與手段(課堂PPT)課件(PPT 16頁(yè))
- 固定資產(chǎn)投資統(tǒng)計(jì)培訓(xùn)PPT課件
- 立體幾何專題:距離和角
- 一年級(jí)上冊(cè)必背古詩(shī)
- 平頂山第四屆名師名班主任名校長(zhǎng)培養(yǎng)方案
- 2.通信光纜線路(管道)工程施工及驗(yàn)收技術(shù)規(guī)程要點(diǎn)
評(píng)論
0/150
提交評(píng)論