




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、競賽題目(在AB上打勾): A B 競賽隊編號(參賽學生不填寫):_目 錄問題的提出3問題的分析與假設3模型的建立與求解6效績評價12預測評估13信息推薦方案13模型的評價與推廣14附:給有關部門的信15 參考文獻16高等院校教育信息化推薦模型摘 要本文針對當前我國高等院校教育信息化過程關于信息推薦方面存在的問題,進行了分析研究,建立了包含滿意度、準確率、覆蓋率、實時性這四個方面的信息推薦評價指標體系,通過問卷調查的方式收集相關數據,確定了各指標的權重因子。主要利用奇異值分解法和LSA方法建立了信息推薦模型,并利用相關算法對我們設計出的模型的效績進行檢驗,最后給出了具體的信息推薦方案,并對我們
2、的模型進行了評價推廣。問題一、我們對不同用戶的評測標準進行了問卷調查,通過數據分析,給出了各個指標的權重,滿意度是0.243,準確率是0.265,覆蓋率是0.238 ,實時性是0.255。確定了外生變量: 用戶個體差異、網站建設。內生變量:信息資源建設如學術網站、期刊雜志、選修綜合課。問題二、建立信息推薦模型,對奇異值分解后的矩陣進行降維, 構建潛在語義空間。通過計算得出表面上沒有關聯(lián)的關鍵詞和文章之間的相關性達0.9333,驗證了模型的效績,并對模型進行了優(yōu)化,給出了信息聚類圖。問題三、提出了我國高等院校教育信息推薦的具體方案。奇異值分解和LSA方法建立信息推薦模型的優(yōu)勢:1、應用條件易得;
3、2、不在局限于計算方陣,可以適用于任意矩陣,更加具有普適意義。3、相比傳統(tǒng)向量空間,潛在語義空間的維度更小,語義關系更明確。4、低維空間表示可以刻畫同義詞,同義詞可對應相同或相似的主題。5、降維可去除部分噪聲,使特征更明顯。關鍵詞:教育信息推薦模型、奇異值分解法、LSA方法、Spearman coefficient相關系數一、問題的提出1、問題背景:21世紀是信息時代,隨著信息技術越來越廣泛的應用,互聯(lián)網已經成為我們日常生活中必不可少的工具,而傳統(tǒng)教育體系所暴露出來的弊端也日益明顯,例如嚴重受到地域限制,教育資源分配不均,相互之間交流不夠等,為使之適應信息化社會對教育發(fā)展的新要求,建設更好的教
4、育信息平臺來滿足學生互聯(lián)網學習的需求,教育體系信息化改革刻不容緩。由于教育信息化表現出快捷高效、節(jié)約成本,不受地域時間限制、資源共享,交流開放等優(yōu)勢,所以在教育教學及管理的各個領域都開始推出各種形式的信息教育平臺,例如遠程教育,網站管理,網課、論壇等很大程度上促進了教育信息化的發(fā)展,然而,目前的教育信息體系還是不夠完善的,例如信息推薦體系這一塊被嚴重忽略,而現有的推薦體系仍存在推薦準確率不夠高,推薦方式單一等一系列的問題,因此建立出合理的數學模型來完善教育信息推薦體系是一項迫切等待解決的工作。2、需要解決的問題:(1)建立信息推薦的指標體系,確定信息推薦的變量(2)建立高等學校信息推薦模型(3
5、)就信息推薦模型設計推薦算法(4)給有關部門寫一封信,推介你們的信息推薦模型。二、問題的分析及假設通過讀題可知,有效信息推薦是目前教育信息化的重要問題,我們需要明確信息推薦的指標以及其推薦變量,然后為高等院校建立合理有效的信息推薦模型,設計其相應的算法,最后向相關部門推介我們的模型。1、信息推薦的指標體系為了提高信息推薦模型的準確度,我們的評測指標主要有包含以下四個方面的內容:(1)滿意度O:即用戶的需求被滿足的程度。滿意度是用戶的一種心理狀態(tài),它能夠反映推薦的信息和用戶的期望之間的契合程度,用數學式量化表示如下:O= exp(a1*x1+ a2 *x2+ a3 *x3+ a4 *x4)(其中
6、,x1是下載率、x2是點擊率、x3是停留時間、x4是分享率,a1,a2,a3,a4分別是各自的權重,令a1=0.4,a2=0.2,a3=0.05,a4=0.35,這里我們假設用戶的行為無出錯。)注:O值越大,用戶滿意度越高。(2)準確率:信息推薦的準確性也是評價此體系的一個重要指標,可以有效的提高用戶的搜索效率。我們這里用精確率P和召回率R來評測信息推薦的準確性1。假設:系統(tǒng)檢索到的相關信息(A)系統(tǒng)檢索到的不相關信息(B)相關但是系統(tǒng)沒有檢索到的信息(C)不相關且沒有被系統(tǒng)檢索到的信息(D)則:精確率P: P = A / ( A + B ),0P1召回率R: R = A / ( A + C
7、),0Rnum) z=z,i; endEnd通過這樣的選擇,就可以得到和第一篇文章相關性較強的文章,而這些文章就是我們所要推薦給用戶的。6、模型優(yōu)化將第3部分中的矩陣U和V,投影到一個平面上,可以得到關鍵詞和文章的分布圖,代碼及結果如下: clearclclsi=0,0,1,1,0,0,0,0,0;0,0,0,0,0,1,0,0,1;0,1,0,0,0,0,0,1,0; 0,0,0,0,0,0,1,0,1;1,0,0,0,0,1,0,0,0; 1,1,1,1,1,1,1,1,1;1,0,1,0,0,0,0,0,0; 0,0,0,0,0,0,1,0,1;0,0,0,0,0,2,0,0,1; 1,
8、0,1,0,0,0,0,1,0;0,0,0,1,1,0,0,0,0;U,S,V=svd(lsi);y=U(:,1:2)*S(1:2,1:2)*V(:,1:2);lu=size(U,1);lv=size(V,1);scatter(U(:,2),U(:,3)hold onscatter(V(:,2),V(:,3)legend(point1,point2)hold onfor i=1:lu circle(U(i,2),U(i,3),abs(U(i,3) hold onendfunction =circle(x,y;r) rectangle(Position,x-r,y-r,2*r,2*r,Curva
9、ture,1 1 ) axis equalend圖(三)圖(三)中,每一個紅色的點,表示一個關鍵詞,每一個藍色的點,表示一篇文章,這樣我們可以對這些詞和文章進行聚類。按聚類出現的效果,可以提取文章集合中的近義詞,這樣當用戶檢索文章的時候,就可以用語義級別(近義詞集合)去檢索了。這樣一來就減少了檢索次數和存儲量。 (三)模型的總結在此模型中我們首先構建了用戶行為(關鍵詞)與信息資源(文章)之間的關系矩陣,接下來利用奇異值分解法和LSA法得到了一個語義空間矩陣,該矩陣可以反映那些在表面上看起來沒有關系的關鍵詞與文章之間的相關性,進一步的計算了Spearman coefficient系數,并利用Sp
10、earman coefficient系數的大小判斷文章是否推薦給用戶,最后對模型進行了優(yōu)化。上述模型的具體過程都是以用戶輸入關鍵詞查找文章為例說明的,為了適用于高校教育信息化的其他方面,只需要將模型中的關鍵詞換為用戶的其他具體行為,文章?lián)Q為其它信息資源。下面給出了一般情形的模型算法流程圖:開始構建用戶行為與信息資源的的關系矩陣計算Spearman coefficient相關系數Spearman coefficient相關系數相關系數a奇異值分解,構建語義空間 coefficient相關系數計算Spearman coefficient相關系數Spearman coefficient相關系數相關系
11、數a聚類分析Spearman coefficient相關系數進行推薦Spearman coefficient相關系數不推薦Spearman coefficient相關系數結束是否否是圖(四)上邊算法流程圖中,判斷相關系數時即“相關系數a”,其中a1,a的確定值根據具體情況給,理論上要求接近1。因為,a的值越接近1,相關性越大,推薦的信息的質量就越高。四、效績評價針對教育信息推薦體系待完善的問題,我們從滿意度、準確率、覆蓋率、實時性四個方面建立了信息推薦指標體系,然后通過問卷調查,做圖表匯總并分析相關數據,得出了各個指標的權重,滿意度是0.243,準確率是0.265,覆蓋率是0.238 ,實時性
12、是0.255。并且進一步確定了外生變量: 用戶個體差異、網站建設;內生變量:信息資源建設,如學術網站,期刊雜志,選修綜合課(包括校內課程與網絡公開課);決策變量:用戶需求。在此基礎上我們采用奇異值分解和LSA方法建立信息推薦模型,通過一系列算法得出了在字面上看起來沒有任何聯(lián)系的關鍵詞與文檔實際上其潛在的深層次相關性達到0.9333,驗證了這一模型取的了顯著的效績,更加深入準確的剖析出了搜索關鍵詞和期望文檔之間的潛在聯(lián)系,在很大程度上提高了信息模型的滿意度、準確率、覆蓋率、適時地性等評價指標。為進一步完善模型,我們還對模型的功能做了優(yōu)化,使信息推薦模型的更好的滿足用戶的需求,促進我過教育現代化的
13、發(fā)展步伐。五、預測評估根據模型所取得的效績,在未來幾年,教育推薦體系的效率和準確性將有很大的提高,而且其功能將會進一步被完善,教育信息化將迎來前所未有的創(chuàng)新性改革,大量的云計算將會運用于教育信息化,為教育信息化提供更加廣闊的空間。有望形成“人人皆學,處處能學、時時可學”的國家現代化教育發(fā)展目標。更好的實現教育信息化對學生全面發(fā)展的促進作用。對深化教育領域綜合改革的支撐作用和對教育創(chuàng)新發(fā)展、均衡發(fā)展、優(yōu)質發(fā)展的提升作用。形成具有國際先進水平、信息技術與教育融合創(chuàng)新發(fā)展的現代化教育信息體系。六、信息推薦方案針對目前教育信息化過程中的一些待解決的問題,我們對信息推薦這一模塊,通過收集數據,數學計算等
14、方式建立了一套可以完善信息推薦功能的模型,經過算法檢驗,證明我們所建立的模型表現出很好的效績,并且形成了信息推薦方案如下:第一、嚴格規(guī)范評價指標,全面提高信息推薦質量。采用多種形式,從各個方面全面的對信息推薦體系進行評價,并且打分排名,這樣有利于規(guī)范這個網絡平臺的信息推薦體系的建設,并且在競爭壓力的推動下,也有利于促進各網絡平臺信息推薦平臺不斷的創(chuàng)新完善其功能,從滿意度、準確率、覆蓋率、實時性等各方面全面的提高信息推薦質量。第二、加強用戶需求分析,進一步提高信息推薦準確率。對用戶需求的分析,不應該知識停留在淺顯的字面分析,而應該運用我們上面建立的模型,運用數學算法,客觀的用數據結果給出搜索關鍵
15、字于用戶期望的文檔之間潛在的深層次聯(lián)系,并高效準確的為用戶推薦其期望的文檔,提高信息推薦的準確率,優(yōu)化信息推薦體系的功能。第三、拓寬信息推薦體系的引用,提高教育信息現代化的整體水平。雖然教育信息推薦體系是主要針對教育信息的,在互聯(lián)網如此發(fā)達的時代,整個信息現代化的發(fā)展形成了一個巨大的網絡,各個領域的信息發(fā)展又是相互之間緊密聯(lián)系,相互影響,榮辱共存的。所以應該講此推薦體系的應用進一步推廣到社會發(fā)展的各個領域,只有整個社會的信息化水平總體提高了,教育信息化水平才能進一步提高。不然,教育信息化水平仍然是受到社會總體信息化水平的制約。第四、做好信息推薦體系的監(jiān)督工作,營造健康嚴謹的網絡推薦環(huán)境。應該對
16、系統(tǒng)推薦的信息進行初步過濾篩選,屏蔽不健康的、包含商業(yè)廣告的、正確性沒有權威保障的、以及娛樂八卦、頭條熱點等隨意推送的一些垃圾騷擾信息然后再推送給用戶,這樣就提高了推送效率和質量,并且保障了健康嚴謹的網絡推薦環(huán)境。七、模型的評價與推廣模型中采取的評價指標及相關數據來源于問卷調查,有較高的可靠性和代表性,能夠全面的、客觀的、有效的評價各項指標的權重。奇異值分解法和LSA方法的優(yōu)勢:1、應用條件易得;2,不在局限于計算方陣,可以適用于任意矩陣,更加具有普適意義。3相比傳統(tǒng)向量空間,潛在語義空間的維度更小,語義關系更明確。局限性:無法獲取用戶文章的評價值,僅僅是通過用戶檢索的關鍵詞來給用戶推薦文章,
17、這樣的方法會導致用戶在下一次搜索時,上一次就篩選過的文章又會出現在推薦選項中,若要對模型進行優(yōu)化處理,首先要考慮的問題就是需要如何避免文章的重復推薦,下一步對模型的構思是利用其他算法,來對用戶行為進行學習,通過對用戶搜索行為的記錄,分析之后來推薦出更適合于用戶的文章。推廣:用奇異值分解法和LSA方法建立的模型,不僅可以解決高等學校教育信息化發(fā)展過程中推薦體系存在的一些問題,還可以解決商品購買推薦、旅游攻略、最佳路徑推薦、求職崗位推薦等問題,具有普適意義,應用范圍廣泛,功能全面。附:給有關部門的信尊敬的各位領導:您好!我們是西北師范大學的學生,在此向您推薦我們小組針對高等學校教育信息推薦體系所建
18、立的數學模型并提出具體的信息推薦方案。首先,感謝您在繁忙之余能抽空來瀏覽我們的方案,也渴望您能夠提出寶貴的意見,對此我們將非常感謝。下面簡潔的介紹下我們的方案。 十八大以來,信息化以成為重要的國家戰(zhàn)略,然而,目前的教育信息體系還是不夠完善的,還存在資源分配不均、資源共享較少,值得關注的是信息推薦體系這一塊被嚴重忽略,現有的推薦體系仍存在推薦準確率不夠高,推薦方式單一等一系列的問題,因此建立出合理的數學模型來完善教育推薦體系是一項迫切等待解決的工作。我們從滿意度、準確率、覆蓋率、實時性四個方面建立了信息推薦指標體系,然后通過問卷調查,做圖表匯總并分析相關數據,得出了各個指標的權重,滿意度是0.243,準確率是0.265,覆蓋率是0.238 ,實時性是0.255。并且進一步確定了外生變量: 用戶個體差異、網站建設;內生變量:信息資源建設如學術網站、期刊雜志、選修綜合課(包括校內課程與網絡公開課);決策變量:用戶需求。在此基礎上我們采用奇異值分解和LSA方法建立信息推薦模型,通過一系列算法挖掘出了在字面上看起來沒有任何聯(lián)系的關鍵詞與文檔實際上其潛在的深層次相關性達到0.9333,驗證了這一模型取的了顯著的效績,更加深入準確的剖析出了搜索關鍵詞和期望文檔之間的潛在聯(lián)系,在很大程度上提高了信息模型的評價指標。為進一步完善模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 ISO 19642-6:2019 EN Road vehicles - Automotive cables - Part 6: Dimensions and requirements for 600 V a.c. or 900 V d.c. and 1 000 V a.c. or 1 500 V d.c. single core alumini
- 【正版授權】 IEC 61156-11:2023+AMD1:2025 CSV EN Multicore and symmetrical pair/quad cables for digital communications - Part 11: Symmetrical single pair cables with transmission characte
- 2025至2030中國生菜有機茶行業(yè)產業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國琥珀酸舒馬曲普坦行業(yè)產業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 高校國防教育師資與學科專業(yè)融合發(fā)展研究
- 培訓班課件首頁
- 煤礦新職工培訓課件
- 創(chuàng)新驅動下的教育科技國際化發(fā)展
- 教育技術的未來發(fā)展及其對社會的深遠影響
- 智能辦公教育技術助力高效工作
- 注塑上下模培訓-
- 鋼與混凝土組合結構課件
- 二升三數學暑假作業(yè)
- 職業(yè)衛(wèi)生知識競賽題
- 鋼結構接水盤施工方案
- 酒店住宿水單標準模板
- 新生兒硬腫癥的護理查房
- 生產設備綜合效率 OEE
- KJ香味的分類(我國調香工作者的分類法)“衡水賽”一等獎
- 微電網優(yōu)化調度
- 南站商務城二期綜合物探報告
評論
0/150
提交評論