本創(chuàng)項目結(jié)題材料匯編樣板.doc_第1頁
本創(chuàng)項目結(jié)題材料匯編樣板.doc_第2頁
本創(chuàng)項目結(jié)題材料匯編樣板.doc_第3頁
本創(chuàng)項目結(jié)題材料匯編樣板.doc_第4頁
本創(chuàng)項目結(jié)題材料匯編樣板.doc_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2009年江蘇科技大學(xué)本科生創(chuàng)新計劃項目結(jié)題材料匯編作品名稱: 基于模糊數(shù)學(xué)評閱主觀題的算法 學(xué)院名稱: 數(shù)理學(xué)院 申報者姓名: 凌宏杰 指導(dǎo)老師: - 共青團江蘇科技大學(xué)數(shù)理學(xué)院委員會2009年江蘇科技大學(xué)本科生創(chuàng)新計劃作品申報書 作品名稱: 基于模糊數(shù)學(xué)評閱主觀題的算法 學(xué)院名稱: 數(shù)理學(xué)院 申報者姓名: 凌宏杰 類別:自然科學(xué)類學(xué)術(shù)論文 哲學(xué)社會科學(xué)類社會調(diào)查報告和學(xué)術(shù)論文 科技發(fā)明制作創(chuàng)業(yè)計劃書 項目名稱基于模糊數(shù)學(xué)評閱主觀題的算法項目類型( ) 個人項目 ( ) 團隊項目申請人或申請團隊姓名所在學(xué)院年級、專業(yè)聯(lián)系電話E-mail主持人凌宏杰數(shù)理學(xué)院06信息與計算科 成 員安琪數(shù)理學(xué)院06信息與計算科潘汪霞數(shù)理學(xué)院06信息與計算科張營數(shù)理學(xué)院06信息與計算科學(xué)13815479196413220403導(dǎo) 師姓名某某年齡單位數(shù)理學(xué)院職稱主要成果 指導(dǎo)老師多年來一直從事模糊數(shù)學(xué)的教學(xué)。目前在江蘇科技大學(xué)學(xué)報等期刊發(fā)表論文多篇,具備了較好的理論研究素質(zhì)。一、申請理由(包括自身具備的知識條件、自己的特長、興趣、已有的實踐創(chuàng)新成果等)學(xué)生目前為江蘇科技大學(xué)數(shù)理學(xué)院信息與計算科學(xué)專業(yè)的學(xué)生,已順利完成數(shù)學(xué)分析、高等代數(shù)、概率論、常微分方程、解析幾何、VC+、VFP等課程并取得了優(yōu)異成績,目前正在學(xué)習(xí)數(shù)學(xué)建模、運籌學(xué)、數(shù)理統(tǒng)計、應(yīng)用回歸分析、SPSS、模糊數(shù)學(xué)等課程。進入大學(xué)以來,學(xué)生對為主觀題自動閱卷和評分有一定了解,也經(jīng)常通過互聯(lián)網(wǎng)了解相關(guān)研究的現(xiàn)狀。他們對根據(jù)實際問題寫算法,編程序有著很濃的興趣,并具有較強的動手能力,能編寫程序,實現(xiàn)一些簡單算法。二、項目方案(包括項目的訓(xùn)練目標、前期準備、組織實施、過程管理、實踐環(huán)節(jié)、教師指導(dǎo)、項目結(jié)題等)1.訓(xùn)練目標在理論上探討實際可操作的主觀題評分算法,并用計算機語言加以實現(xiàn),并能舉例應(yīng)用。以論文形式加以總結(jié),其中理論推導(dǎo)、算法程序及結(jié)果分析整理成結(jié)題報告。2. 前期準備,(1)搜集國內(nèi)外相關(guān)資料,了解主觀題評分算法的研究現(xiàn)狀。(2)掌握模糊數(shù)學(xué)基礎(chǔ)知識,能將一些模糊現(xiàn)象進行定量研究。(3)熟悉項目中所用的理論知識,對項目的進程指定好計劃。3.項目執(zhí)行的主要環(huán)節(jié)(1)前期工作:學(xué)習(xí)模糊數(shù)學(xué)的基礎(chǔ)知識,培養(yǎng)分析模糊現(xiàn)象并將其量化的能力。(2)搜集資料:通過搜集近年來閱卷評分技術(shù)的進展情況,討論分析其可行性與優(yōu)缺點,了解主觀題評分的依據(jù)和影響得分的主要因素。(3)項目實施:在理論上探討實際可操作的主觀題評分算法,用計算機語言加以實現(xiàn),并能舉例應(yīng)用。(4)撰寫報告:對所得較好的算法,分析是否可以在界面上實現(xiàn),撰寫結(jié)題報告。4.教師指導(dǎo)(1)在項目執(zhí)行過程中指導(dǎo)教師定期向?qū)W生了解項目研究進度,指導(dǎo)學(xué)生采集處理實際數(shù)據(jù)。(2)指導(dǎo)老師積極參與具體的研究過程,對算法的推導(dǎo)完善提出建設(shè)性建議;幫助學(xué)生舉例對編好的程序進行調(diào)試。(3)指導(dǎo)學(xué)生總結(jié)整理研究成果,指導(dǎo)學(xué)生撰寫項目研究論文和結(jié)題報告;5.項目結(jié)題學(xué)生在指導(dǎo)老師的幫助指導(dǎo)下,將該項目的算法理論推導(dǎo)、程序編寫和結(jié)論進行分析整理,撰寫結(jié)題報告。三、預(yù)期成果1、在理論上探討實際可操作的主觀題評分算法,給出具體算法推導(dǎo);2、 編寫算法程序,并能舉例應(yīng)用;3、 發(fā)表論文1篇;4、提交研究報告1份;四、經(jīng)費預(yù)算(1)小型設(shè)備購置費:1200元;(2)文獻收集、數(shù)據(jù)采集及差旅費:1800元;(3)數(shù)據(jù)測試及文印費:500元;合計:3500元五、導(dǎo)師推薦意見該項目的選題具有較強的實際應(yīng)用背景,研究結(jié)果有實際意義。四名學(xué)生均已順利完成了信息與計算科學(xué)專業(yè)的大部分主干課程,具有較扎實的理論基礎(chǔ)和較強的動手編程能力,態(tài)度端正,勤奮刻苦。同時,對所研究的問題也有較深入的了解,相信一定能夠按期完成該項目,并能取得預(yù)期成果。 簽名:* 2009年 3月 5日六、學(xué)院推薦意見學(xué)院負責(zé)人簽名: 學(xué)院蓋章: 年 月 日 本科生創(chuàng)新計劃項目中 期 檢 查 表項目所屬類別 自然科學(xué)類學(xué)術(shù)論文 項 目 名 稱 基于模糊數(shù)學(xué)評閱主觀題的算法計劃完成時間 2009-12-20 項目負責(zé)人 凌宏杰 指 導(dǎo) 教 師 * 填 表 時 間 2009-10-8 江蘇科技大學(xué)團委制一、截止目前所完成的主要工作(以條文式列述)對于本次創(chuàng)新計劃,我們小組成員已經(jīng)歷了以下3個階段:1、 在徐老師的指導(dǎo)下搜集了國內(nèi)外相關(guān)資料,了解主觀題評分算法的研究現(xiàn)狀,對項目的研究進程制定了具體的方案:(1)主觀題評閱算法的改進;(2)權(quán)重的科學(xué)設(shè)定;(3)將提出的算法編寫成程序;(4)以論文形式對研究成果進行總結(jié)。2、 通過搜集近年來閱卷評分技術(shù)的進展情況,討論分析其可行性與優(yōu)缺點,了解主觀題評分的依據(jù)和影響得分的主要因素。在此基礎(chǔ)上提出了一套簡單可行的算法用于解決主觀題的評閱問題。3、 上述算法已經(jīng)用matlab編寫成相應(yīng)的程序,可以通過程序的運行得出的結(jié)果驗證算法的可行性。4、 針對每一個主觀題都采用了多指標綜合評判(一個指標對應(yīng)于標準答案中的一個關(guān)鍵詞)。5、 對于算法中提到的專家對各關(guān)鍵詞的權(quán)重的設(shè)定,采用了標準離差法提高其可靠性。二、已取得階段性成果會(以條文式列述)1主觀題評閱算法的改進已經(jīng)完成。2權(quán)重設(shè)定方法已經(jīng)確定。3改進后的主觀題評閱算法已經(jīng)編寫成可視化的程序。三、前階段工作體會通過對大量資料的查詢和閱讀,提升了自身對主觀題評測算法的理解。比對各種主觀題評測算法,綜合它們各自的優(yōu)缺點,結(jié)合自己的理解提出了一套自己的算法。通過這段時間對這個課題的研究提升了我對未知問題的分析和解決的能力,對模糊數(shù)學(xué)這門學(xué)科有了新的認識,清楚地認識到很多學(xué)科之間的緊密聯(lián)系。要想解決一個實際問題,往往不是單獨一門學(xué)科就可以解決的,要綜合應(yīng)用多門學(xué)科。徐老師的細心指導(dǎo),使我受益匪淺。四、經(jīng)費使用情況(1)小型設(shè)備購置費: 400元;(2)文獻收集、數(shù)據(jù)采集及差旅費:600元;(3)數(shù)據(jù)測試、辦公文具及文印費:300元; 五、下一階段研究計劃1查閱有關(guān)計算機智能理解語句含義算法的資料,了解計算機智能識別的本質(zhì),在此基礎(chǔ)上,進一步修正這套適合本課題的算法2將此計算機智能理解語句含義的算法編寫成代碼,并且將此代碼整合到已有的算法程序中去。六、 下一階段擬取得的主要成果1、提出一種使用計算機智能的理解語句含義的算法。2、完善現(xiàn)有程序代碼。3、最后的研究成果形成論文。項目負責(zé)人(簽名):凌宏杰2009年 10 月 8 日七、指導(dǎo)教師指導(dǎo)意見及建議該課題進展順利,已做出有效算法雛形,客觀上較好地改進了已有的主觀題評閱算法,同意繼續(xù)完善該算法,進行下階段研究工作。指教教師(簽字)_* 2009 年 10 月 10 日 八、學(xué)院審查意見學(xué)院負責(zé)人(簽字)_年 月 日 八、學(xué)校評審組意見評審組負責(zé)人(簽字)_年 月 日江蘇科技大學(xué)本科生創(chuàng)新計劃項目結(jié)題驗收書項目名稱基于模糊數(shù)學(xué)評閱主觀題的算法所在學(xué)院數(shù)理學(xué)院指導(dǎo)教師姓名移動電話固定電話Email徐維wy_學(xué)生名單姓名專業(yè)年級聯(lián)系方式Email凌宏杰0640501215952813981安琪0640501115952813919潘汪霞0640501215952856530張營0640501213815479196413220403胡璇0640602115952813826一、創(chuàng)新計劃的成果簡介:(主要解決的關(guān)鍵技術(shù)與創(chuàng)新點,主要技術(shù)與經(jīng)濟指標完成情況,項目實施的績效等,包括代表性成果介紹,說明其水平和影響,并簡要闡述其科學(xué)意義或應(yīng)用前景等。)(1)修改采用拆分關(guān)鍵字為單個字符進行比對的現(xiàn)有方法為關(guān)鍵字整體比對的方法,三種順序同時定位最終取大的新方法使得主觀題閱卷的精度大為提高;(2)大膽創(chuàng)新引入了智能化思想,提高了計算機評閱主觀題的可行性和說服力;(3)改進權(quán)重設(shè)計為專家參與設(shè)置原始權(quán)重,標準離差處理,最后設(shè)定修正值方法,使得權(quán)重設(shè)置更為合理,提高主觀題閱卷的合理合情性。二、研究中使用的具體材料:(含參閱的書籍和論文目錄,使用的檢索目錄)1 Yasuhiro Ajiro, Kazunori Ueda.Kimai. An Automator Error Correction System For Concurrent Logic Programs. Automated Software Engineering J, 2002, 9(2): 67-94.2張運良,張全,基于HNC理論的語義相似度計算方法J。計算機工程與應(yīng)用,2005,34(5):5-7. 3李明陽,賈電如,基于模糊理論的主觀題自動評分算法研究與實現(xiàn)J。微計算機應(yīng)用,2008,29(10):17-20.4 孫衛(wèi),基于模糊理論的自動閱卷算法, 福建電腦2007 年第5 期5高思丹, 袁春風(fēng). 主觀試題的計算機自動批改技術(shù)研究J. 計算機應(yīng)用研究,2004,(2)6 張燕姑.論模糊概念的度量J. 計算機工程與應(yīng)用, 2004 , (14)7 張小艷.基于自然語言的主觀題自動閱卷技術(shù)J.西北大學(xué)學(xué)報(自然科學(xué)網(wǎng)絡(luò)版), 2005,3(8)8 黃思先. 程序設(shè)計考試中填空題的自動評分J. 福建電腦, 2003,(7)9 況姍蕓. 網(wǎng)絡(luò)課程中主觀題在線評閱系統(tǒng)設(shè)計與實現(xiàn)J.中國電化教育,2004,206(3)10 王永生. 計算機閱卷中主觀題型的單層模糊綜合評判J.青海大學(xué)學(xué)報,2000,18(3)三、創(chuàng)新計劃的成果形式及數(shù)量:(需提供附件)1.文獻資料綜述( 1 )份;2.調(diào)查報告( )份;3.論文 ( 1 )份;4.軟件 ( )份;5.設(shè)計 ( 1 )份;6.硬件研制( )份;7.專利 ( )份;8.心得體會( 1 )份;9.其他 ( )件,名稱: 四、經(jīng)費使用情況:支出科目金額備注(注明經(jīng)費支出時間)五、項目成果(用附件形式):附件1:文獻資料綜述附件2:論文附件3:設(shè)計附件4:心得體會六、實施本科生創(chuàng)新計劃項目工作存在的問題和建議:七、誠信承諾:我承諾在本科生創(chuàng)新計劃活動中遵守學(xué)校有關(guān)規(guī)定,恪守學(xué)術(shù)規(guī)范,本人項目成果中除特別注明和引用外,均為本人觀點,不存在剽竊、抄襲他人學(xué)術(shù)成果,偽造、篡改實驗數(shù)據(jù)的情況。如有違規(guī)行為,我愿承擔(dān)一切責(zé)任,接受學(xué)校的處理。學(xué)生簽字: 2009年11月30日江蘇科技大學(xué)本科生創(chuàng)新計劃項目研究總結(jié)報告項目名稱: 基于模糊數(shù)學(xué)評閱主觀題的算法 項目類型: 自然學(xué)術(shù)論文 項目等級: 重點 一般 項目負責(zé)人: 凌宏杰 聯(lián)系電話: 指導(dǎo)教師: 聯(lián)系電話: 基于模糊數(shù)學(xué)評閱主觀題的算法項目總結(jié)報告 一、項目的研究意義、價值在線考試與評價系統(tǒng)是網(wǎng)絡(luò)教學(xué)系統(tǒng)的重點和難點,特別是主觀題的自動評分時整個系統(tǒng)中的一個關(guān)鍵技術(shù)。由于自然語言的復(fù)雜性,主觀題評閱自動化還存在著許多困難,我們引入了模糊數(shù)學(xué)中的單向貼近度來描述主觀題閱卷中貼近程度的得分,實現(xiàn)了可調(diào)的自動評分算法,開拓了一條現(xiàn)實可行的途徑,盡管還有不少缺陷,但作為一種輔助手段,在多學(xué)科之間的主觀題自動評分閱卷方面是很有意義的。二、項目的目標、主要任務(wù)及完成情況項目的目標是以單項貼近度為基準,通過標準答案與考生答案之間的關(guān)鍵字比對,從而實現(xiàn)精準可行的主觀題自動評測程序。我們的主要貢獻是在前人的基礎(chǔ)上做出了總共三部分的大改進,包括算法改進、智能化思想的提出和權(quán)重設(shè)計三項重要改進。在算法設(shè)計上,針對這一課題,我們通過比對和提煉已有資料文獻,找出現(xiàn)階段已有算法的不足與缺陷之處,進行了調(diào)整與改進?,F(xiàn)有算法大多數(shù)采用拆分關(guān)鍵字為單個字符進行比對的方法,這個算法缺陷是明顯的,為此,我們改進算法為關(guān)鍵字的整體比對。在我們的算法微調(diào)下,避免了關(guān)鍵字整體信息流失的影響,但隨之而來,如何準確定位考生答題信息中的關(guān)鍵字變成了重中之重。如若關(guān)鍵字定位失敗就注定了該算法不具有實用性。為了解決定位準確性問題,我們共同苦思冥想,最終成功解決了這個問題。那就是在文章中提到的采用三種順序同時定位,最后進行取大運算的新的算法。定位一個關(guān)鍵字采用三種定位方法對其操作,顯然提高了定位精度。智能化思想的提出:已有的關(guān)于這方面的文章,大多數(shù)在智能化這個方面都沒有渉略,本文中我們大膽的提出了一種相對智能化的算法,提高了計算機評閱主觀題的可行性和說服力。權(quán)重的設(shè)計中遇到的問題:針對各個關(guān)鍵字進行加權(quán),權(quán)重設(shè)置的優(yōu)劣直接影響最后的評分的結(jié)果。若權(quán)重設(shè)置不合理,可能會導(dǎo)致計算機評閱的成績和人工評閱的成績相差甚大。權(quán)重設(shè)定的方法我們嘗試了很多種方法,但是最后的結(jié)果都不盡人意??嗫嗨褜ひ粋€好的權(quán)重設(shè)定方法,最后根據(jù)實際情況,我們自己設(shè)計了一套權(quán)重方法,專家參與設(shè)置原始權(quán)重,再用標準離差法處理,最后設(shè)定修正值。采用這種方法解決了權(quán)重的設(shè)定問題。三、項目的研究過程及創(chuàng)新點1、相關(guān)定義為解決考生答案中的關(guān)鍵詞與標準答案庫中的關(guān)鍵詞的貼近度表示問題,把各個關(guān)鍵詞都看成字符串,對單向貼近度的概念進行定義。把關(guān)鍵字看成字符串,把字符串分解成單個的字符并把它們構(gòu)成的有序集合稱為一個模糊集,稱為論域,論域上的全體模糊子集組成的集合記作(也叫模糊冪集)。為度量兩模糊集的接近程度,引入單向貼近度的概念。定義1:設(shè),。若映射:,滿足條件:(1);(2);(3)若,則。稱為A貼近于B的單向貼近度。定義2:設(shè)A、B是字符串,A中包含個字符,表示A貼近于B的單向貼近度;按照從左到右的順序,集合A中的每個元素在集合B中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,則。按照從右到左的順序,集合A中的每個元素在集合B中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,則。按照從中間到兩邊的順序,集合A中的每個元素在集合B中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,則。令。容易驗證,它滿足單向貼近度的定義。2、算法設(shè)計該算法先對考生的答題信息的提取,保存為A字符串,A中包含個字符,表示A貼近于B的單向貼近度,集合B為標準答案中包含個關(guān)鍵語句,其中每個關(guān)鍵語句中包含個字符,對各個關(guān)鍵語句根據(jù)重要性進行加權(quán)依此為;將標準答案看成一個整體在考生的答案中尋找切入點(切入點的標記是:以開始相同的兩個字符)進行整體比對;按照從左到右的順序,集合A中的每個元素在集合B中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,;按照從右到左的順序,集合A中的每個元素在集合B中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,則;按照從中間到兩邊的順序(切入點的標記:若標準答案字符數(shù)為偶數(shù)以中間的兩個字符相同為準,若為奇數(shù)個則以中間的三個字符相同為準),集合A中的每個元素在集合B中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,則;。實現(xiàn)計算機智能化的算法:假設(shè)一個關(guān)鍵語句:表述相同意思的方法有種,其他表述不夠準確的方法有種,表述不夠準確的即使答得完全相同也不能認為這個得分點答得完全沒有問題,所以我們要給這些答得不夠準確的表述方法相應(yīng)的加權(quán)(),表述相同意思的答得完全相同我們認為完全達到了得分點。具體的比對方法及單項貼近度的計算采用算法定義;其中種表述不夠準確的方法求得的單向貼近度要與它們對應(yīng)的權(quán)重相乘才這個關(guān)鍵語句最后的單向貼近度。計算機判斷考生答案的語句連貫性:假設(shè)一個主觀題中設(shè)置了個關(guān)鍵語句,單向貼近度;其中表示所處位置相同的標記個數(shù)。則,其中,為該題語句連貫性的權(quán)重。因此該題的評分公式設(shè)計為:其中F為該題的標準分值,為考生答題信息與標準答案的單向貼近度。針對上面的算法,下面有幾點補充:若該題所設(shè)置的標準答案中關(guān)鍵字中沒有涉及到英文字母或者數(shù)學(xué)公式,則上述所給的算法可以實現(xiàn)自動評分,且所得的分數(shù)應(yīng)該比較合理。若涉及英文字母或者數(shù)學(xué)公式時,則上述的單向貼近度的算法就會產(chǎn)生不合理的方面,此時則需要對其進行修正。我們可以對含有英文字母或者數(shù)學(xué)公式的關(guān)鍵字的單向貼近度設(shè)定為:只有考生答案中對應(yīng)的英文字母或者數(shù)學(xué)公式等必須和標準答案的完全相同,才可以設(shè)定這個關(guān)鍵字的貼近度為1,否則設(shè)定為0(也就是說這樣的關(guān)鍵字對應(yīng)的是一個分明集)??忌痤}時,不能在輸入文字中隨意的敲空格鍵,因為該系統(tǒng)通過得分點的關(guān)鍵字和考生答案進行比對得出單向貼近度的,如果關(guān)鍵字中間出現(xiàn)空格的現(xiàn)象,會影響系統(tǒng)對其的評算。這里的關(guān)鍵字即是此題的主要得分點,所以老師或者專家在設(shè)置標準答案的時候,要注意不能過于繁瑣。因為如果標準答案的一個得分點過長的話,當(dāng)計算機識別出考生答案中有和標準答案相同的語句時,由于答案的表述不能和標準答案完全相同,從而使考生的得分與實際應(yīng)該得分的出入較大。由于在一個題目標準答案設(shè)置的全過程中,可能有的關(guān)鍵字是部分相同的就可以得分,有的關(guān)鍵字必須是完全相同的才可以得分。所以在設(shè)計系統(tǒng)時,針對每一個題目我們都要有普通關(guān)鍵字輸入?yún)^(qū)(關(guān)鍵字部分相同的就可以得分)和特殊關(guān)鍵字輸入?yún)^(qū)(關(guān)鍵字必須是完全相同的才可以得分)。對于單項貼近度的算法做了一些改進,由原來的單一的從左到右的貼近,現(xiàn)在改進為從右向左和從中間到兩邊的順序,然后對于這三個貼近度進行取大運算。因為這三種順序的比較都是為了找出考生答案和標準答案的貼近度的,所以我們要選取最大的為標準。這樣就可以讓考生答案的得分點信息能夠更加準確的被計算機所捕捉,減少因考生表達方式或者答案不全面而影響得分的公正性??梢愿蟪潭鹊淖プ】忌牡梅贮c,給考生一個合理的分數(shù)。3、核心程序流程圖核心程序框架圖如下:將考生的答題信息讀入系統(tǒng)記為集合A專家對關(guān)鍵語句加權(quán)標準答案的設(shè)置進行字符串的比較零分滿分對其進行修正計算出計算出D標記 特殊關(guān)鍵字輸入?yún)^(qū)標記 普通關(guān)鍵字輸入?yún)^(qū)從左到右的順序從右到左的順序從中間到兩邊的順序標記 普通關(guān)鍵字輸入?yún)^(qū)表述相同意思的語句表述意思相近的語句對其加權(quán)4、程序?qū)崿F(xiàn)根據(jù)上述算法, 用matlab 設(shè)計了函數(shù)Approch, 該函數(shù)的功能是計算A 貼近于B 的單向貼近度。該函數(shù)代碼如下:Function Approch (A,B)a=length(A); % 計算考生答案A的長度b=length(B); % 標準答案中一個關(guān)鍵語句B的長度C1=; C2=;C3=; %設(shè)置一個空矩陣C1,C2 ,C3k3=0;t3=0;approach =0;for i=1:a-1 %正序查找標準答案在考生答案中的切入點 if B(1)= A(i)&B(2)=A(i+1)if b=a-i %切入點以后標準答案長度小于考生答案所剩字符 C1=(B(1:b)=A(i:i+b-1); %標準答案與考生答案的比較形成0、1矩陣 else C1=(B(1:a-i+1)=A(i:a); %形成0、1矩陣end endendfor i=a-1:1 %逆序查找標準答案在考生答案中的切入點 if B(b)= A(i)&B(b-1)=A(i+1)if biC3=(B(b/2-i+1:b)=A(1:i+b/2)elseif iiC3=(B(b-1)/2-i+1:b)=A(1:i+(b+1)/2)elseif i0 k(1)=k(1)+1; %統(tǒng)計出矩陣C1中為1的個數(shù) end end if k(1)=0 t(1)=0;else t(1)=k(1)/b; endc(2)=length(C2); %計算矩陣的長度for i=1:c(2) %查找矩陣C2中為1數(shù) if C(i)0 k(2)=k(2)+1; %統(tǒng)計出矩陣C2中為1的個數(shù) end end if k(2)=0 t(2)=0;else t(2)=k(2)/b; endc(3)=length(C3); %計算矩陣的長度for i=1:c(3) %查找矩陣C1中為1數(shù) if C(i)0 k(3)=k(3)+1; %統(tǒng)計出矩陣C1中為1的個數(shù) end end if k(3)=0 t(3)=0;else t(3)=k(3)/b; endif t(1)=t(2) &t(1)=t(3)approach=t(1) ; %確定最終的貼近度approachelse t(2)=t(1)&t(2)=t(3)approach=t(2) ;else approach=t(3) ;end5、權(quán)重系數(shù)的選擇5.1 確定原始權(quán)重對標準答案中語句連貫性和各關(guān)鍵詞(以下稱為指標)設(shè)定權(quán)重集,表示語句連貫性的權(quán)重;邀請若干專家,讓他們根據(jù)自己的理解和判斷,對該主觀題的關(guān)鍵語句的權(quán)重予以評分,不妨稱之為原始權(quán)重。設(shè)表示第個專家對于第個指標的原始權(quán)重,要求所有指標的原始權(quán)重之和必須等于1,即對于任意,有: (1)5.2 計算關(guān)于每個指標的平均權(quán)重這里計算第個指標的平均權(quán)重,我們引入數(shù)學(xué)期望的概念: (2)式(2)中:表示第個指標的平均權(quán)重,其中是專家的總?cè)藬?shù)。5.3 計算權(quán)重的偏移量這里引入方差來衡量偏移量。第個專家,第個指標的偏移量為: (3)式(3)中表示原始權(quán)重的偏移量。個專家對該題各關(guān)鍵語句方差: (4)設(shè)定一個值(分界點),當(dāng)時,即的方差很小,即位專家對這些關(guān)鍵語句的權(quán)值分配的意見很一致;當(dāng)時,即方差比較大,也就是說位專家對第個關(guān)鍵語句的權(quán)值分配的意見有所不同,在這情況下我們需要對這樣的平均權(quán)重進行修正。設(shè)定修正值為: (5)修正后的權(quán)重: (6)5.4 歸一化歸一化系數(shù): (7)歸一化后的每個指標對應(yīng)的權(quán)重: (8)式(8)中表示指標的新權(quán)重。6主觀題綜合評定假設(shè)一題的標準答案有個關(guān)鍵語句,其中有個是分明集中的關(guān)鍵語句()。這個關(guān)鍵語句對應(yīng)的權(quán)重為。令利用公式 其中表示該題的滿分,表示0或者1(當(dāng)?shù)趥€關(guān)鍵語句與標準答案完全匹配時為1,否則為0)。得到該主觀題的評定分數(shù),結(jié)合編程把該種算法通過計算機實現(xiàn)自動評閱主觀題。四、項目的研究成果及實例分析為了清楚地說明上述算法, 本文設(shè)計了一個算例。設(shè): 問題Q=什么是算法;標準答案B=算法是問題求解規(guī)則的一種過程描述( 即計算機解題的過程) 。它具有5 個基本性質(zhì): 確定性、有窮性、可行性、輸入和輸出。( 48 個字符) ;得分點的關(guān)鍵詞 K1=問題求解 K2=過程 K3=確定性 K4=有窮性 K5=可行性 K6=輸入 K7=輸出,設(shè)關(guān)鍵詞對應(yīng)的權(quán)重為:K1,K2,K3,K4, K5, K6, K7=0.2,0.1,0.14,0.14,0.14,0.14,0.14學(xué)生答案A=算法是一種問題求解的過程, 它具有邏輯性、可計算性、窮盡性、輸入、輸出。( 30 個字符)。用已編好的系統(tǒng)運行得到結(jié)果如下:五、項目的應(yīng)用前景由于算法設(shè)計引入了單向貼近度概念,比單純的使用關(guān)鍵詞進行簡單的比較的方法更加確定的反應(yīng)了自動評分的結(jié)果。在權(quán)重系數(shù)的選擇中使用了專家參與加回歸分析和修正計算,使得系數(shù)比較客觀準確。該算法考慮了單個關(guān)鍵詞在一題主觀題所占的不同權(quán)重,明確了答題的關(guān)鍵性,減少了人為因素,保證該算法計出數(shù)來的分數(shù)客觀性和準確性。該算法具備普通性和易推廣性。實際考試中,涉及到政史的中文文科性考試、關(guān)于理化的理科類考試,及部分綜合考試均可以應(yīng)用此模型來進行求解。涉及到政史的中文文科性考試簡介,因為此種類型所設(shè)置的標準答案中關(guān)鍵字中沒有涉及到英文字母或者數(shù)學(xué)公式,則上述所給的算法可以實現(xiàn)自動評分,且所得的分數(shù)應(yīng)該比較合理。關(guān)于理化的理科類考試簡介,涉及英文字母或者數(shù)學(xué)公式時,則上述的單向貼近度的算法就會產(chǎn)生不合理的方面,此時則需要對其進行修正。我們可以對含有英文字母或者數(shù)學(xué)公式的關(guān)鍵字的單向貼近度設(shè)定為:只有考生答案中對應(yīng)的英文字母或者數(shù)學(xué)公式等必須和標準答案的完全相同,才可以設(shè)定這個關(guān)鍵字的貼近度為1,否則設(shè)定為0(也就是說這樣的關(guān)鍵字對應(yīng)的是一個分明集)。依次,修正過的算法可以實現(xiàn)自動評分,且所得的分數(shù)應(yīng)該符合實情。部分綜合考試簡介,由于在一個題目標準答案設(shè)置的全過程中,可能有的關(guān)鍵字是部分相同的就可以得分,有的關(guān)鍵字必須是完全相同的才可以得分。所以在設(shè)計系統(tǒng)時,針對每一個題目我們都要有普通關(guān)鍵字輸入?yún)^(qū)(關(guān)鍵字部分相同的就可以得分)和特殊關(guān)鍵字輸入?yún)^(qū)(關(guān)鍵字必須是完全相同的才可以得分)。據(jù)此,算法可以實現(xiàn)自動評分,且所得的分數(shù)應(yīng)該比較妥當(dāng)。綜上,我們可知,現(xiàn)實生活中的各類大小主觀題考試在一定程度上均可以拆分為關(guān)鍵字或詞得分點加權(quán),從而達到基本客觀評閱,自動生成考生的答題得分。六、收獲和體會通過對本課題的研究探討,對主觀題自動評分問題有了深入了解,對如何應(yīng)用貼近度比對和多指標綜合判斷實現(xiàn)主觀題自動評分問題的原理及其過程有了更為深刻的認識,更總要的事,通過對Matlab的使用,我們對Matlab的程序設(shè)計環(huán)境應(yīng)用更加的熟練了,在這種學(xué)科間的穿插運用中,使我們能夠更好的把所學(xué)的知識應(yīng)用于實踐,做到融會貫通,在此基礎(chǔ)上,能夠很好的創(chuàng)新嘗試、嘗試創(chuàng)新,不斷前進不斷收獲。七、項目進一步研究的設(shè)想通過總結(jié),設(shè)計上的改良:在確保標準答案及評分標準的組織與成功比對學(xué)生答案的標準答案貼近度的前提下,是否能人性化地作出對學(xué)生答題內(nèi)容的語言通順與連貫性考察也是一個至關(guān)重要的問題。計算機作為非人工智能處理工具,在機械比對答案的過程上精準高效,但在理解和分析考生答案的含義上效果很低,若可以提升計算機的理解能力,加強對考生答題內(nèi)容的語言通順與連貫性考察將大為提升此算法的廣度和深度效用:廣度上,幾乎所有的主觀題均可以有成效有可能地被客觀主觀評閱;深度上,對具體一道復(fù)雜的綜合性主觀題,將做到全能高效,有條不紊。此為,對算法的改良亦可使自動評閱系統(tǒng)準確率提高,主要的改進方式包括:(1)設(shè)計更為全面而精準的考生答題信息與標準答案中關(guān)鍵語句之間的比對。(2)解決如若考生需要在答題中鍵入空格的不能實現(xiàn)問題。(3)計算機評閱主觀題算法涉及到得學(xué)科比較廣,此文主要針對文科類考試,對理學(xué)類考試仍需有進一步改進。八、致謝 在此項課題研究中,給予我們幫助和指導(dǎo)的徐維艷老師表示衷心的感謝!幾次培訓(xùn)給我們輸入了嶄新的思想,引發(fā)出了我們許多靈感,從而帶來了許多可行的方法,使得課題研究取得了可喜的成績。文獻資料綜述1 Yasuhiro Ajiro, Kazunori Ueda.Kimai. An Automator Error Correction System For Concurrent Logic Programs. Automated Software Engineering J, 2002, 9(2): 67-94.2張運良,張全,基于HNC理論的語義相似度計算方法J。計算機工程與應(yīng)用,2005,34(5):5-7. 3李明陽,賈電如,基于模糊理論的主觀題自動評分算法研究與實現(xiàn)J。微計算機應(yīng)用,2008,29(10):17-20.4 孫衛(wèi),基于模糊理論的自動閱卷算法, 福建電腦2007 年第5 期5高思丹, 袁春風(fēng). 主觀試題的計算機自動批改技術(shù)研究J. 計算機應(yīng)用研究,2004,(2)6 張燕姑.論模糊概念的度量J. 計算機工程與應(yīng)用, 2004 , (14)7 張小艷.基于自然語言的主觀題自動閱卷技術(shù)J.西北大學(xué)學(xué)報(自然科學(xué)網(wǎng)絡(luò)版), 2005,3(8)8 黃思先. 程序設(shè)計考試中填空題的自動評分J. 福建電腦, 2003,(7)9 況姍蕓. 網(wǎng)絡(luò)課程中主觀題在線評閱系統(tǒng)設(shè)計與實現(xiàn)J.中國電化教育,2004,206(3)10 王永生. 計算機閱卷中主觀題型的單層模糊綜合評判J.青海大學(xué)學(xué)報,2000,18(3)基于模糊數(shù)學(xué)評閱主觀題的算法凌宏杰,徐維艷(江蘇科技大學(xué) 數(shù)理學(xué)院, 江蘇 鎮(zhèn)江, 212003 )摘 要:本文通過分析人腦評閱主觀題的思維方法,引入了貼近度和多指標綜合評判的思想,基于模糊數(shù)學(xué)中單向貼近度的理論,設(shè)計并實現(xiàn)了一種評閱主觀題的帶權(quán)單向匹配算法。算例說明該算法能有效提高主觀題自動評閱的精確度。關(guān)鍵詞:標準答案,單向貼近度,權(quán)重,多指標中圖分類號:TP311 文獻標識碼:A Arithmetic of Subjective Tests Automated Assesment based on fuzzy MathematicsLING Hong-jie XU Wei-yan(School.of Mathematics and Physics, Jiangsu University of Science and Technology, Zhenjiang Jiangsu, 212003; School of Mathematics and Computer Science, Nanjing Normal University, Nanjing Jiangsu, 210097)Abstract: This paper analyzed the way of assesmenting subjective tests with the humans brain, by introducing the one-way close-degree of fuzzy stes and multi-index comprehensive evaluation of the idea, we designed and implemented a one-way matched algorithm with weight to assess the Subjective Test. An example showed that the algorithm can effectively improving the Subjective Tests Automated Assesment. Key Words: Standard answers, One-way close-degree, weight, Multiple index0 引言在線考試快速高效,具有廣闊的應(yīng)用發(fā)展前景。雖然在線考試系統(tǒng)中客觀題自動評閱技術(shù)已經(jīng)很成熟,但主觀題評閱由于涉及到人工智能、模式識別和自然語言理解等目前亟待解決的技術(shù)難點,一直束縛著計算機自動閱卷技術(shù)的應(yīng)用與發(fā)展。國外比較典型的應(yīng)用有英國諾丁漢大學(xué)開發(fā)了計算機語言智能閱卷系統(tǒng)Course Master1。國內(nèi)還沒有較為成熟的可以應(yīng)用的系統(tǒng),文獻2以語義相似度計算為基礎(chǔ)提出的主觀題閱卷算法的設(shè)計與實現(xiàn);主觀題答案以文本方式存儲,文本表示方法是自動評閱主觀題算法的關(guān)鍵,文3借鑒矢量空間模型4-5的思想,提出基于人工智能的主觀題自動評閱算法;文獻6提出一種基于模糊數(shù)學(xué)7理論中貼近度的模式識別方法來計算網(wǎng)絡(luò)考試系統(tǒng)中主觀題自動評閱的算法。鑒于這種僅考慮字符串單方向匹配的算法中字符串比對的單方向性使得處理主觀題評分效率不夠高,而且不能靈活識別同義語句,本文在此基礎(chǔ)上設(shè)計并實現(xiàn)了一套算法。預(yù)先設(shè)定標準答案中各個關(guān)鍵字(詞)的權(quán)重,將考生的答題信息與標準答案中的關(guān)鍵語句進行比對,然后用貼近度進行體現(xiàn),算出的貼近度與相應(yīng)的關(guān)鍵詞預(yù)先設(shè)定的權(quán)重系數(shù)進行相乘,得到考生該題的得分比例,然后把得分比例與該題的總分相乘,最后得出考生該題的得分。同時還初步解決了計算機智能化理解同義語句的問題。算例表明這套算法較符合人的思維方式,增強了計算機評閱主觀題的客觀高效性。1 基本概念 為解決考生答案中的關(guān)鍵詞與標準答案庫中的關(guān)鍵詞的貼近度表示問題,把各個關(guān)鍵詞都看成字符串,對單向貼近度的概念進行定義。定義1 設(shè)在論域上給定映射,則稱確定了上的一個模糊子集,記為模糊集。稱為對模糊集的隸屬度。把關(guān)鍵字看成字符串,把字符串分解成單個的字符并把它們構(gòu)成的有序集合稱為一個模糊集,稱為論域,論域上的全體模糊子集組成的集合記作(也叫模糊冪集)。為度量兩模糊集的接近程度,引入單向貼近度的概念。 定義2 設(shè),。若映射:,滿足條件:(1);(2);(3)若,則,稱為模糊集A貼近于模糊集B的單向貼近度。注:設(shè)A、B是字符串,A中包含個字符,表示A貼近于B的單向貼近度;按照從左到右的順序,集合中的每個元素在集合中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,則;按照從右到左的順序,集合中的每個元素在集合中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,則;按照從中間到兩邊的順序,集合中的每個元素在集合中對應(yīng)關(guān)鍵字出現(xiàn)的有效次數(shù)分別記為,則。令,容易驗證,它滿足上述定義,記為模糊集貼近于的單向貼近度單向貼近度。2、算法設(shè)計分析本文所提出的算法以讀取考生答題信息與標準答案庫中的參考答案的貼近程度作為評判的依據(jù),標準答案以關(guān)鍵詞(或關(guān)鍵語句)的形式給出,即得分點,因為這是計算機衡量考生得分多少的主要依據(jù)。對于單項貼近度的算法3做了一些改進,由原來的單一的從左到右比對文本的貼近度計算,改進為分別從左向右、從右向左和從中間到兩邊的順序比對得出單向貼近度,然后對于這三個貼近度進行取大運算。因為這三種順序的比較都是為了找出考生答案和標準答案的貼近度的,所以我們要選取最大的較為準確。這樣就可以讓考生答案的得分點信息能夠更加準確的被計算機所捕捉,減少因考生表達方式或者答案不全面而影響得分的公正性,可以更大程度的抓住考生的得分點,給考生一個合理的分數(shù)。此外我們實現(xiàn)了這些關(guān)鍵語句的智能識別,即要計算機智能識別考生答題語句連貫性的判斷,因為標準答案的設(shè)置是按照各關(guān)鍵語句出現(xiàn)的先后順序依次挑選出來的,所以計算機實現(xiàn)智能化的識別考生語句的連貫性也就落在這些關(guān)鍵語句上面。我們依次給這些關(guān)鍵語句進行編號作為標記,然后采用所給算法對考生答案進行處理,三種比對方法都進行完畢時,我們將這三種比對方法得到的貼近度選出最大者把這個關(guān)鍵語句的編號插入到考生答案與標準答案貼近度最大相應(yīng)的地方,依次進行,直到全部比對完畢。然后重新遍歷考生的答案尋找其中的各個標記,然后把重新遍歷得到的標記編號的順序和開始記錄的順序進行比對計算出單項貼近度。下面本文就實現(xiàn)計算機智能閱卷設(shè)計了一套算法。2.1算法描述第一步,提取考生的答題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論