開題報告數(shù)據(jù)挖掘_第1頁
開題報告數(shù)據(jù)挖掘_第2頁
開題報告數(shù)據(jù)挖掘_第3頁
開題報告數(shù)據(jù)挖掘_第4頁
開題報告數(shù)據(jù)挖掘_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、附表三:高校教師在職攻讀碩士學(xué)位研究生論文選題計劃表研究生姓名: 指導(dǎo)教師: 專 業(yè): 計算機(jī)應(yīng)用技術(shù)所屬院(所):計算機(jī)科學(xué)與技術(shù)學(xué)院 2010年 4 月 2 日研究生姓名 專 業(yè)計算機(jī)應(yīng)用技術(shù)導(dǎo)師姓名 研究方向數(shù)據(jù)挖掘畢業(yè)論文題目數(shù)據(jù)挖掘在高職教學(xué)中的應(yīng)用論文類型理論研究應(yīng)用研究用于生產(chǎn)其它選題目的和意義:由于我國大眾化高等教育的普及,高校學(xué)生數(shù)量的激增,給高校教學(xué)工作帶來了諸多新的問題。尤其是高職學(xué)生,他們的主體是普通高中應(yīng)屆畢業(yè)生高考最后一批錄取的學(xué)生。這些學(xué)生在學(xué)習(xí)意識、學(xué)習(xí)方法、學(xué)習(xí)能力及學(xué)習(xí)動力上比較欠缺,并可能有較多常見的心理問題。大部分學(xué)生沒有養(yǎng)成良好的學(xué)習(xí)習(xí)慣。他們中的大部

2、分學(xué)習(xí)基礎(chǔ)比較差自制力也比較弱,學(xué)習(xí)目標(biāo)不夠明確,缺乏刻苦鉆研精神。很多學(xué)生就讀離職并不是因?yàn)樽陨砜释麑W(xué)習(xí)。而是無可奈何或出于應(yīng)付家長的要求。他們對所學(xué)的專業(yè)并沒有太多了解,因此學(xué)習(xí)目標(biāo)不夠明確同時,他們還對社會對其的容納有一種懷疑,這種懷疑直接導(dǎo)致了自信心的不足,由此也影響到學(xué)生學(xué)習(xí)的動力。此外,由于這批學(xué)生普遍沒有養(yǎng)成良好的學(xué)習(xí)習(xí)慣,叉影響了良好學(xué)習(xí)氛圍的營造,不良的學(xué)習(xí)氛圍又反過束影響學(xué)生的學(xué)習(xí)動力。教師迫切地需要科學(xué)地研究高職教學(xué)各個環(huán)節(jié)中的大量的數(shù)據(jù)信息。從中獲取知識,繼而科學(xué)地指導(dǎo)教學(xué)。二十世紀(jì),數(shù)據(jù)庫技術(shù)取得了決定性的成果并且得到廣泛應(yīng)用大量信息在給人們帶來方便的同時也帶來了一大

3、堆難題;第一是信息過量,難以消化;第二是信息真假難以辨識:第三是信息安全難以保證;第四是信息形式不一致,難以統(tǒng)一處理。人們開始提出一個新的口號:“要學(xué)會拋棄信息”,并開始考慮:“如何才能不被信息淹沒,而是從中及時發(fā)現(xiàn)有用的知識、提高信息利用率?”如何從含有海量信息的數(shù)據(jù)庫中提取潛在、有價值的信息來輔助決策,預(yù)測未來成為信息處理的更新更高的要求,知識發(fā)現(xiàn)和數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,共顯示出強(qiáng)大的生命力。數(shù)據(jù)挖掘使數(shù)據(jù)庫技術(shù)進(jìn)入了一個更高級的發(fā)展階段。數(shù)據(jù)挖掘技術(shù)(Data Mining)被稱為未來信息處理的骨干技術(shù)之一,是一個多學(xué)科交叉研究領(lǐng)域,融合了數(shù)據(jù)庫,人工智能、機(jī)器學(xué)習(xí),統(tǒng)計學(xué),知識工程、面

4、向?qū)ο蠓椒?、信息檢索,高性能計算以及數(shù)據(jù)可視化等多項最新技術(shù)數(shù)據(jù)挖掘技術(shù)從80年代末開始出現(xiàn)。短短二十多年它的發(fā)展速度很快。目前數(shù)據(jù)挖掘技術(shù)在零售業(yè)的購物籃分析、金融風(fēng)險預(yù)測、產(chǎn)品質(zhì)量分析、通訊及醫(yī)療服務(wù)、基因工程研究等許多領(lǐng)域得到了成功的應(yīng)用很多專題會議也把數(shù)據(jù)挖掘和知識發(fā)現(xiàn)列為議題之一。把數(shù)據(jù)挖掘技術(shù)應(yīng)用于高等學(xué)校的教學(xué)與管理中,是數(shù)據(jù)挖掘技術(shù)在又一個領(lǐng)域的應(yīng)用高等學(xué)校多年來的教學(xué)和管理工作積累了大量的數(shù)據(jù),目前,鑒于社會對高等學(xué)校發(fā)展的需求和高校數(shù)據(jù)管理的現(xiàn)狀,利用這些數(shù)據(jù)理性的分析學(xué)校各方面工作的成效以及教師發(fā)展?fàn)顩r,對高校教學(xué)管理決策支持系統(tǒng)的影響變得十分重要。數(shù)據(jù)挖掘技術(shù)能從大量數(shù)

5、據(jù)中發(fā)現(xiàn)有用的知識,這些知識對高等學(xué)校教學(xué)管理的決策支持是十分有意義的。利用數(shù)據(jù)挖掘技術(shù)從數(shù)據(jù)倉庫中獲取高質(zhì)量的信息,可以檢驗(yàn)教學(xué)效果,調(diào)節(jié)課程設(shè)置。合理安持師資,正確評價教師的年度工作,及輔助調(diào)整招生計劃、分析預(yù)測就業(yè)趨勢等等。雖然目前數(shù)據(jù)挖掘技術(shù)主要在商業(yè)領(lǐng)域中得到廣泛發(fā)展,但它面向應(yīng)用的本質(zhì)決定了在任何需要的領(lǐng)域都會發(fā)揮它的價值.在高校教育教學(xué)及管理中有大量直接或間接的數(shù)據(jù),關(guān)系到教師評價、人才管理及學(xué)生選課指導(dǎo)、學(xué)生成績分析等內(nèi)容。這些數(shù)據(jù)具有復(fù)雜性、多因素性和模糊性等特點(diǎn),是一類帶有大量不確定因素的半結(jié)構(gòu)化問題或非結(jié)構(gòu)化問題而大量的數(shù)據(jù)主要是以各級管理部門提供的統(tǒng)計報表和簡單信息查詢

6、方式存在,對這些數(shù)據(jù)所隱含的價值沒有充分挖掘利用。通過數(shù)據(jù)挖掘技術(shù),找出有價值的信息,客觀、科學(xué)、全面地供教學(xué)管理部門參考。以學(xué)生成績?yōu)槔處煂W(xué)生成績的分析處理一般僅僅是統(tǒng)計成績處在優(yōu)、一般、差級別的人數(shù),對于學(xué)生取得這些成績的原因往往無法了解。如果教師能夠找到有關(guān)影響學(xué)生學(xué)習(xí)成績的因素,必然對教學(xué)質(zhì)量的提高起到積極的作用。國內(nèi)外研究動態(tài):自1989年第11屆國際聯(lián)合人工智能學(xué)術(shù)會議上首次提出KDD這一概念以來,數(shù)據(jù)挖掘日益受到人們的關(guān)注。并已經(jīng)成為當(dāng)前計算機(jī)領(lǐng)域的一大熱點(diǎn),其研究的重點(diǎn)也逐漸從發(fā)現(xiàn)方法轉(zhuǎn)移到系統(tǒng)應(yīng)用,并且注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多學(xué)科之間的相互滲透。從總體上,國

7、外在數(shù)據(jù)挖掘領(lǐng)域中的研究內(nèi)容十分廣泛,從挖掘知識的種類看,己經(jīng)取得了明顯的成果。1、關(guān)聯(lián)規(guī)則的研究。近幾年對關(guān)聯(lián)規(guī)則的研究內(nèi)容較多?,F(xiàn)在,關(guān)聯(lián)規(guī)則的挖掘已經(jīng)從單一概念層次關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)發(fā)展到多概念層次關(guān)聯(lián)規(guī)則的發(fā)現(xiàn),并把研究的重點(diǎn)放在提高算法的效率和規(guī)??墒湛s性上。目前,人們對于定量關(guān)聯(lián)規(guī)則以及其他種類的關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)研究較為深入,提出了關(guān)聯(lián)規(guī)則的興趣性的概念。與此同時,在提高挖掘過程的效率方面也作了不少的研究。比較著名的算法有Apfiori,Charm,F(xiàn)P-Growth,MagnumOPUSS,GenMax2、數(shù)據(jù)分類技術(shù)研究。基于決策樹的分類方法在大規(guī)模數(shù)據(jù)庫條件下的應(yīng)用研究;在較高的抽

8、象層次分類中,MMehte等人針對大型數(shù)據(jù)庫提出了種快速分類算法,稱為QUEST中的超級學(xué)習(xí)算法,SLIQ:分類與回歸的管狀領(lǐng)域研究、最近鄰分類方法的改進(jìn)等等。3、聚類規(guī)則研究。近年,聚類開始在大型數(shù)據(jù)庫中得到研究,RNg和1Han基于隨機(jī)搜索以及統(tǒng)計學(xué)中的兩個聚類算法PAM和CLARA,給出了一個適用于大型應(yīng)用的聚類算法:CLARANS。MEste等人針對CLARANS算法的缺點(diǎn),提出了改進(jìn)技術(shù)。TZhang等人則提出了另一種聚類算法:BIRCH。4、泛化、簡約和特征提取研究。利用數(shù)據(jù)可視化大大擴(kuò)展了數(shù)據(jù)的表達(dá)和理解能力,這是數(shù)據(jù)簡約的一種非常重要的技術(shù),它正受到廣泛的重視。與國外相比,國內(nèi)

9、對數(shù)據(jù)挖掘與知識發(fā)現(xiàn)(MDKD)的研究稍晚,1993年國家自然科學(xué)基金首次支持對該領(lǐng)域的研究項目。目前,清華大學(xué)、中科院計算技術(shù)研究所、空軍第三研究所、海軍裝備論證中心等競相開展數(shù)據(jù)挖掘的基本理論及其應(yīng)用研究。其中,北京系統(tǒng)工程研究所對模糊方法在知識發(fā)現(xiàn)中的應(yīng)用進(jìn)行了較深入的研究,北京大學(xué)也在開展對數(shù)據(jù)立方體代數(shù)的研究;華中理工大學(xué)、復(fù)旦大學(xué)、浙江大學(xué)、中國科技大學(xué)、中科院數(shù)學(xué)研究所、吉林大學(xué)等單位開展了對關(guān)聯(lián)規(guī)則開采算法的優(yōu)化和改造:南京大學(xué)、四川聯(lián)合大學(xué)山東師范大學(xué)碩士學(xué)位論文上海交通大學(xué)等單位探討,研究了非結(jié)構(gòu)化數(shù)據(jù)的知識發(fā)現(xiàn)以及Web數(shù)據(jù)挖掘?,F(xiàn)在盡管與國際上的進(jìn)展相差并不遠(yuǎn),一些研究

10、成果例如:總參六十一所李德毅教授在云模型方面的研究、復(fù)旦大學(xué)的施伯樂教授在關(guān)系數(shù)據(jù)厙中知發(fā)現(xiàn)方面取得很大的成果,南京大學(xué)開發(fā)的KNIGHT系統(tǒng)等但在實(shí)際應(yīng)用方面卻鮮有所聞,成功的例子很少,沒有形成整體力量。總的說來國內(nèi)在數(shù)據(jù)挖掘方面的開發(fā)還停留在實(shí)驗(yàn)的階段,沒有能夠真正的投入到實(shí)際生產(chǎn)應(yīng)用中去。數(shù)據(jù)挖掘最先應(yīng)用于金融和商業(yè)領(lǐng)域,在教育層面上還只能算是新生事物,處于發(fā)展的初級階段。國內(nèi)高校目前在校園信息網(wǎng)中開展數(shù)據(jù)挖掘的研究并不廣泛。浙江大學(xué)使用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)技術(shù)對高校的人事信息庫進(jìn)行挖掘,試圖找到影響學(xué)科發(fā)展的因素,發(fā)現(xiàn)如何評價一個學(xué)科,以及影響學(xué)科發(fā)展的各個要素之間的關(guān)系。另外。曲阜師范大學(xué)體

11、育系與上海市體委就體育人才的選拔探討了數(shù)據(jù)挖掘的可行性。在每年對中小學(xué)生的體質(zhì)調(diào)查中,積累了大量的數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù),他們試圖從數(shù)據(jù)中深入尋找各種因素的相互聯(lián)系,發(fā)現(xiàn)一些隨機(jī)因素動態(tài)變化而產(chǎn)生的新的指導(dǎo)學(xué)校體育科研和教學(xué)訓(xùn)練的規(guī)律,進(jìn)而發(fā)現(xiàn)運(yùn)動人才。數(shù)據(jù)挖掘在教育層面上的研究還只能算是新生事物,處于發(fā)展的初級階段。在教育信息化的大趨勢下,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育領(lǐng)域內(nèi)的學(xué)生招募、市場細(xì)分、學(xué)生來源分析、課程相關(guān)性、學(xué)習(xí)評價度量、學(xué)生生涯規(guī)劃、遠(yuǎn)程開放教育的個性化服務(wù)等方面,必然有十分廣闊的前景。數(shù)據(jù)挖掘是一種技術(shù),和其他技術(shù)一樣,數(shù)據(jù)挖掘也需要時間和精力來研究、開發(fā)和逐步成熟,最終被人們接

12、受。目前己經(jīng)有很多通用的數(shù)據(jù)挖掘系統(tǒng),但是還不能達(dá)到期望的智能系統(tǒng)那樣。在近來的數(shù)據(jù)挖掘研究和開發(fā)中,一些挑戰(zhàn)也已受到一定程度的關(guān)注,并考慮到了各種需求,而另一些處于研究階段。然而,這些問題將繼續(xù)刺激進(jìn)一步的研究和改進(jìn)。我們相信,隨著數(shù)據(jù)挖掘任務(wù)和方法的發(fā)展,一定能帶給我們更多的利益,可以節(jié)約我們的時間和金錢,并發(fā)現(xiàn)新的知識。 主要內(nèi)容:高等學(xué)校多年來的教學(xué)和管理工作積累了大量的數(shù)據(jù),目前這些數(shù)據(jù)還未能得到有效利用,只是一個待開發(fā)的“寶藏”。鑒于社會對高等學(xué)校發(fā)展的需求和目前高校數(shù)據(jù)管理現(xiàn)狀,利用這些數(shù)據(jù)理性地分析學(xué)校各方面工作的成效以及學(xué)生培養(yǎng)過程中的得失變得十分重要。本文主要研究在高校擴(kuò)招

13、、師生比過大的教學(xué)條件下,教師如何利用豐富的信息資源,采用數(shù)據(jù)挖掘技術(shù),獲得輔助決策知識,指導(dǎo)教學(xué),從而進(jìn)一步提高教學(xué)質(zhì)量。數(shù)據(jù)挖掘技術(shù)主要介紹數(shù)據(jù)挖掘的基本知識,包括數(shù)掘挖掘的過程、數(shù)據(jù)挖掘的任務(wù)、數(shù)掘挖掘的分類以及數(shù)據(jù)挖掘的常用技術(shù)和方法。探索數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用,提出數(shù)據(jù)挖掘技術(shù)在高校教學(xué)應(yīng)用中的實(shí)施方案。實(shí)驗(yàn)設(shè)計方案:第一步,確定挖掘?qū)ο蟆⒛繕?biāo)。清晰地定義出問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)果是不可預(yù)測的,但要探索的問題應(yīng)是有預(yù)見的。第二步,數(shù)據(jù)采集。這是一個工作量較大,占據(jù)時問較多的一個階段。教師需要在以往的教學(xué)實(shí)踐中,注意收集數(shù)據(jù)信息,有些數(shù)據(jù)的產(chǎn)

14、生可以直接獲得,有些數(shù)據(jù)需要對學(xué)生進(jìn)行調(diào)查獲得。第三步,數(shù)據(jù)轉(zhuǎn)換。這一步是將教師收集到的不同的數(shù)據(jù)信息集成并轉(zhuǎn)換為一個分析數(shù)據(jù)模型,這一數(shù)掘模型是針對算法而準(zhǔn)備的不同的算法可能需要不同的分析數(shù)據(jù)模型。第四步,數(shù)據(jù)分類挖掘。分類挖掘的目的是為了建立一個分類模型。首先要選擇合適的挖掘算法,并使用合適的程序設(shè)計軟件實(shí)現(xiàn)這一算法:接著對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘。第五步,分類規(guī)則結(jié)果分析。這一步主要解釋和評估分類結(jié)果。第六步。知識的應(yīng)用。這一步是將分析所得到的知識集成到教師的教學(xué)環(huán)節(jié)中去,教師可利用所得知識改進(jìn)教學(xué)策略指導(dǎo)進(jìn)一步教學(xué)。準(zhǔn)備工作情況和主要工作措施:利用學(xué)院的教務(wù)管理系統(tǒng),獲得學(xué)生的成

15、績信息。設(shè)計學(xué)生信息調(diào)查表,由學(xué)生填寫,內(nèi)容包括學(xué)生對計算機(jī)公共基礎(chǔ)課程的感興趣程度、課堂學(xué)習(xí)效果、對本課程的認(rèn)識和教師的教學(xué)方法等。利用數(shù)據(jù)挖掘算法對數(shù)據(jù)進(jìn)行處理,建立決策樹,得出推動計算機(jī)課程教學(xué)的規(guī)則。論文進(jìn)度安排及預(yù)期達(dá)到研究結(jié)果:2010.4-2010.9 資料查詢、確定論文主題2010.9-2010.10 數(shù)據(jù)挖掘的理論研究2010.10-2010.11數(shù)據(jù)挖掘常用技術(shù)研究2010.11-2010.12數(shù)據(jù)挖掘的應(yīng)用研究2010.12-2011.1數(shù)據(jù)挖掘的新技術(shù)研究2011.1-2011.2 數(shù)據(jù)挖掘的發(fā)展方向2011.2-2011.4撰寫論文2011.4-2011.5論文修改 文獻(xiàn)綜述:(4000字以上,參考文獻(xiàn)30篇以上,其中至少10篇外文參考文獻(xiàn))考核小組對報告人查閱專業(yè)技術(shù)文獻(xiàn)情況的評價1 查閱與本專業(yè)相關(guān)的專業(yè)技術(shù)文獻(xiàn)數(shù)量是否達(dá)到30篇(其中外文10篇)?2 查閱的文獻(xiàn)是否全面,是否反映本學(xué)科專業(yè)的最新學(xué)術(shù)動

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論