MOOC學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)探索與學(xué)習(xí)群體特征分析_1_第1頁
MOOC學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)探索與學(xué)習(xí)群體特征分析_1_第2頁
MOOC學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)探索與學(xué)習(xí)群體特征分析_1_第3頁
MOOC學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)探索與學(xué)習(xí)群體特征分析_1_第4頁
MOOC學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)探索與學(xué)習(xí)群體特征分析_1_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、    mooc學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)探索與學(xué)習(xí)群體特征分析    摘要:高輟學(xué)率與低參與度是mooc面臨的一個(gè)主要問題。根據(jù)學(xué)習(xí)結(jié)果預(yù)測(cè),及時(shí)開展有效的教學(xué)干預(yù)是改善此問題的途徑之一。當(dāng)前基于mooc學(xué)習(xí)行為數(shù)據(jù)進(jìn)行結(jié)果預(yù)測(cè)主要以次數(shù)分析為主,較少探索其他行為指標(biāo);在預(yù)測(cè)算法上以回歸分析為主,缺少不同預(yù)測(cè)算法效果的比較分析。以edx平臺(tái)上一門mooc課程的學(xué)習(xí)行為數(shù)據(jù)為研究對(duì)象進(jìn)行的探索研究發(fā)現(xiàn):學(xué)習(xí)結(jié)果預(yù)測(cè)的主要參照行為指標(biāo)組合為視頻學(xué)習(xí)次數(shù)、文本學(xué)習(xí)次數(shù)、評(píng)價(jià)參與時(shí)長(zhǎng)、評(píng)價(jià)參與次數(shù)和論壇主題發(fā)起數(shù);學(xué)習(xí)次數(shù)的預(yù)測(cè)效果要好于學(xué)習(xí)時(shí)長(zhǎng),并與學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)次數(shù)

2、結(jié)合后的預(yù)測(cè)效果接近;bp神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率要優(yōu)于決策樹和樸素貝葉斯網(wǎng)絡(luò),且預(yù)測(cè)準(zhǔn)確率與樣本數(shù)量呈正相關(guān);而在課程學(xué)習(xí)模塊的預(yù)測(cè)比較上,評(píng)價(jià)模塊和文本模塊的學(xué)習(xí)行為數(shù)據(jù)預(yù)測(cè)率較高,互動(dòng)模塊預(yù)測(cè)率最低。研究還發(fā)現(xiàn),mooc學(xué)習(xí)群體包含三類,分別是以視頻學(xué)習(xí)和學(xué)習(xí)評(píng)價(jià)為主、以互動(dòng)交流為輔的學(xué)習(xí)群體;以視頻學(xué)習(xí)和文本學(xué)習(xí)為主、以評(píng)價(jià)參與為輔的學(xué)習(xí)群體,以及以文本學(xué)習(xí)和學(xué)習(xí)評(píng)價(jià)為主、以互動(dòng)交流為輔的學(xué)習(xí)群體。關(guān)鍵詞:mooc,學(xué)習(xí)行為數(shù)據(jù),學(xué)習(xí)結(jié)果預(yù)測(cè),預(yù)測(cè)指標(biāo),學(xué)習(xí)群體特征一、研究緣起當(dāng)前國內(nèi)外越來越多的高校參與mooc課程建設(shè)并發(fā)布各自的特色課程,學(xué)習(xí)者在課程內(nèi)容上有了更多的選擇權(quán),但高輟學(xué)率和低

3、參與度仍是當(dāng)前mooc課程所面臨的一個(gè)主要問題(hew et al.,2014)。而基于學(xué)習(xí)者前期和中期的課程學(xué)習(xí)行為數(shù)據(jù)進(jìn)行學(xué)習(xí)結(jié)果預(yù)測(cè),并依據(jù)分析結(jié)果調(diào)整教學(xué)策略和教學(xué)內(nèi)容以開展有效的教學(xué)干預(yù),可以改善學(xué)習(xí)參與度和學(xué)習(xí)結(jié)果。與此同時(shí),學(xué)習(xí)分析研究已經(jīng)由初期的理論探討逐步走向?qū)嵺`探索和成果轉(zhuǎn)化。在學(xué)習(xí)分析研究中,基于學(xué)習(xí)行為數(shù)據(jù)進(jìn)行學(xué)習(xí)結(jié)果預(yù)測(cè)是學(xué)習(xí)分析和教育數(shù)據(jù)挖掘研究學(xué)術(shù)群體中關(guān)注的一項(xiàng)重要議題(liñán et al.,2015)。而在數(shù)據(jù)的選擇上,學(xué)習(xí)分析研究正從關(guān)注大數(shù)據(jù)轉(zhuǎn)向有意義數(shù)據(jù)的探索(merceron et al.,2016)。如何抓取到學(xué)習(xí)活動(dòng)信息流中

4、的關(guān)鍵行為數(shù)據(jù)并解析出學(xué)習(xí)者的個(gè)性學(xué)習(xí)行為特征是今后研究中要解決的一個(gè)問題(u.s. department of education,2015)。mooc廣泛的學(xué)習(xí)參與群體和多樣化的學(xué)習(xí)行為數(shù)據(jù)使其成為學(xué)習(xí)分析研究的一個(gè)重要對(duì)象。如何基于mooc學(xué)習(xí)行為數(shù)據(jù)有效預(yù)測(cè)學(xué)生的學(xué)習(xí)結(jié)果,并依據(jù)學(xué)習(xí)群體特征提供差異化的學(xué)習(xí)服務(wù)以改善學(xué)習(xí)參與度成為亟待解決的問題。本研究基于edx平臺(tái)的一門mooc課程學(xué)習(xí)行為數(shù)據(jù),探索能夠有效預(yù)測(cè)學(xué)習(xí)結(jié)果的數(shù)據(jù)類型和行為指標(biāo),并分析學(xué)生的群體學(xué)習(xí)特征,為學(xué)習(xí)結(jié)果預(yù)測(cè)分析和教學(xué)干預(yù)提供指導(dǎo)和參照。二、文獻(xiàn)綜述國內(nèi)關(guān)于mooc學(xué)習(xí)行為研究主要集中在學(xué)習(xí)行為影響因素分析、基于

5、學(xué)習(xí)行為數(shù)據(jù)分析學(xué)習(xí)效果、學(xué)習(xí)成績(jī)預(yù)測(cè)、學(xué)習(xí)行為評(píng)價(jià)等方面。比較有代表性的研究有:賈積有等以coursera平臺(tái)上的6門北京大學(xué)mooc課程學(xué)習(xí)行為數(shù)據(jù)為分析對(duì)象,探索在線時(shí)間、觀看視頻和網(wǎng)頁次數(shù)、瀏覽和下載講義次數(shù)、論壇發(fā)帖數(shù)與學(xué)習(xí)成績(jī)之間的關(guān)系(賈積有等,2014)。李曼麗等以“學(xué)堂在線”平臺(tái)的“電路原理”課程數(shù)據(jù)為基礎(chǔ),對(duì)mooc學(xué)習(xí)者的課程學(xué)習(xí)動(dòng)機(jī)、課程參與度、課程注冊(cè)時(shí)間與課程完成度等進(jìn)行分析(李曼麗等,2015)。郝巧龍等用clementine構(gòu)建mooc成績(jī)預(yù)測(cè),并依托智慧樹平臺(tái)“數(shù)據(jù)結(jié)構(gòu)”課程的行為數(shù)據(jù)通過回歸分析驗(yàn)證模型的有效性(郝巧龍等,2016)。國外關(guān)于mooc學(xué)習(xí)行為

6、的研究包括mooc學(xué)習(xí)成敗和保留率的影響因素分析、學(xué)習(xí)動(dòng)機(jī)和學(xué)習(xí)行為對(duì)mooc完成度的影響、學(xué)習(xí)表現(xiàn)預(yù)測(cè)研究、學(xué)習(xí)情境在mooc學(xué)習(xí)中的重要性分析等。如:laxmisha rai等從學(xué)習(xí)者角色、個(gè)人支持和人為干預(yù)、高困難度和自我動(dòng)機(jī)、學(xué)習(xí)環(huán)境、職業(yè)需求、教師和學(xué)校聲望、實(shí)時(shí)反饋等方面分析了mooc學(xué)習(xí)成敗的因素(rai et al.,2016)。bart pursel等基于mooc學(xué)習(xí)者的人口學(xué)數(shù)據(jù)、學(xué)習(xí)行為和課程互動(dòng)數(shù)據(jù),采用邏輯斯回歸分析探索這些數(shù)據(jù)變量如何表征課程完成度(pursel et al.,2016)。paula barba等以coursera平臺(tái)上的“宏觀經(jīng)濟(jì)學(xué)”課程學(xué)習(xí)者為研

7、究對(duì)象,分析以個(gè)人興趣、掌握方法目標(biāo)與應(yīng)用價(jià)值為主的學(xué)習(xí)動(dòng)機(jī)和以視頻點(diǎn)擊與測(cè)評(píng)提交數(shù)為測(cè)量方式的學(xué)習(xí)參與在學(xué)習(xí)表現(xiàn)預(yù)測(cè)上的重要性(barba et al.,2016)。在學(xué)習(xí)者參與mooc學(xué)習(xí)的數(shù)量變化上,研究表明第一周課程教學(xué)之后,學(xué)習(xí)者參與的數(shù)量會(huì)急劇下降(hill,2013),因此suhang jiang等研究者以學(xué)習(xí)者第一周的mooc課程作業(yè)表現(xiàn)和社交互動(dòng)數(shù)據(jù)為分析對(duì)象,并使用邏輯斯回歸作為分類器,預(yù)測(cè)學(xué)習(xí)者獲得課程證書的概率(jiang et al.,2014)。從國內(nèi)外已有研究可以看出,研究者已經(jīng)基于mooc常見的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行學(xué)習(xí)成效分析,探索課程學(xué)習(xí)成敗的內(nèi)在和外在因素,并對(duì)

8、學(xué)習(xí)者最終學(xué)習(xí)表現(xiàn)進(jìn)行預(yù)測(cè)。然而,在數(shù)據(jù)分析和預(yù)測(cè)上還存在以下幾方面的不足:(1)學(xué)習(xí)行為數(shù)據(jù)中以次數(shù)分析為主,應(yīng)用時(shí)間分析較少,兩者之間未統(tǒng)一在一個(gè)學(xué)習(xí)分析層面上,對(duì)于各自的預(yù)測(cè)效果還尚不清晰;(2)在預(yù)測(cè)算法上以回歸分析為主,而采用機(jī)器學(xué)習(xí)模式的預(yù)測(cè)方法較少,且缺少不同預(yù)測(cè)算法效果的比較分析;(3)對(duì)有效預(yù)測(cè)學(xué)習(xí)結(jié)果的行為指標(biāo)探索較少,學(xué)習(xí)行為數(shù)據(jù)較多,需要找到反映學(xué)習(xí)結(jié)果的關(guān)鍵行為指標(biāo)為學(xué)習(xí)分析提供參照。針對(duì)上述問題,本研究以mooc課程學(xué)習(xí)模塊為分類依據(jù),以學(xué)習(xí)行為數(shù)據(jù)指標(biāo)為中心,探索學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)次數(shù)的預(yù)測(cè)效果、課程學(xué)習(xí)模塊的預(yù)測(cè)效果、有效學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)的提取及其計(jì)算方程、學(xué)習(xí)者的

9、群體學(xué)習(xí)行為特征等內(nèi)容,試圖為基于mooc的學(xué)習(xí)行為分析和教學(xué)設(shè)計(jì)提供有益的啟示。三、研究設(shè)計(jì)1.研究問題當(dāng)前mooc平臺(tái)能夠記錄學(xué)習(xí)者的鼠標(biāo)點(diǎn)擊流數(shù)據(jù),而在這些數(shù)據(jù)中時(shí)長(zhǎng)和次數(shù)是兩項(xiàng)重要的數(shù)據(jù)類型?;趯W(xué)習(xí)過程行為數(shù)據(jù)探索能夠反映學(xué)習(xí)結(jié)果的有效數(shù)據(jù)類型,分析指標(biāo)和群體行為特征有助于開展針對(duì)性的學(xué)習(xí)干預(yù),改善學(xué)習(xí)者參與度并降低輟學(xué)率。因此,本研究的問題包括以下三方面:(1)在學(xué)習(xí)行為數(shù)據(jù)中,學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)次數(shù)統(tǒng)計(jì)哪種方式更能較為準(zhǔn)確地預(yù)測(cè)學(xué)習(xí)結(jié)果?哪類課程學(xué)習(xí)模塊數(shù)據(jù)預(yù)測(cè)效果較好?(2)各類學(xué)習(xí)行為數(shù)據(jù)與學(xué)習(xí)結(jié)果有怎樣的相關(guān)性?哪些行為指標(biāo)能夠較好地預(yù)測(cè)學(xué)習(xí)結(jié)果?基于有效學(xué)習(xí)指標(biāo)如何得出可計(jì)算

10、的學(xué)習(xí)結(jié)果預(yù)測(cè)計(jì)算方程?(3)在課程內(nèi)容學(xué)習(xí)上,學(xué)習(xí)者可以分為哪幾類學(xué)習(xí)群體?這些群體表現(xiàn)出怎樣的學(xué)習(xí)行為特征?2.研究樣本與方法研究選取edx上的一門mooc課程“introduction to engineering and engineering mathematics”為研究對(duì)象。該課程是由university of texas at arlington大學(xué)工程學(xué)院pranesh b. aswath教授發(fā)起,由alan bowling、panos shiakolas、william e. dillon、r. stephen gibbs等研究者參與講授的一門工程類基礎(chǔ)專業(yè)課程。該課程于2

11、015年5月12號(hào)在edx平臺(tái)上線發(fā)布,并于同年8月10號(hào)結(jié)束授課,課程持續(xù)14周。該課程的設(shè)計(jì)目標(biāo)是為高中學(xué)生和大學(xué)新生提供工程領(lǐng)域的梗概,以幫助他們?cè)诠こ虒W(xué)上決策自己的職業(yè)生涯。課程授課語言是英語,免費(fèi)向世界范圍內(nèi)學(xué)習(xí)者開放。課程成績(jī)?cè)u(píng)價(jià)方式包括每周練習(xí)測(cè)驗(yàn)(占總成績(jī)40%)、課后作業(yè)(占總成績(jī)40%)、綜合期末考試(占總成績(jī)20%)。練習(xí)測(cè)驗(yàn)主要是選擇題,由系統(tǒng)平臺(tái)自動(dòng)評(píng)閱打分,課后作業(yè)和綜合期末作業(yè)由同伴互評(píng)和教師評(píng)閱打分確定。在課程數(shù)據(jù)的使用權(quán)上,已獲得university of texas at arlington機(jī)構(gòu)審核委員會(huì)(institutional review board

12、,irb)的使用批準(zhǔn)和課程負(fù)責(zé)人授權(quán),準(zhǔn)許使用剔除學(xué)生個(gè)人信息的數(shù)據(jù)。在數(shù)據(jù)選取上,研究基于edx平臺(tái)上記錄的鼠標(biāo)點(diǎn)擊流數(shù)據(jù)抽取與行為分析指標(biāo)有關(guān)的時(shí)長(zhǎng)和次數(shù)統(tǒng)計(jì)數(shù)據(jù)。由于平臺(tái)上涵蓋微視頻、文本學(xué)習(xí)材料、互動(dòng)論壇、學(xué)習(xí)評(píng)價(jià)等學(xué)習(xí)模塊和材料,因此學(xué)習(xí)者的行為活動(dòng)數(shù)據(jù)也涉及上述學(xué)習(xí)活動(dòng)模塊。而在學(xué)習(xí)行為數(shù)據(jù)上除時(shí)長(zhǎng)和次數(shù)等較為常見數(shù)據(jù)外,還有倍速播放、跳幀觀看、停留軌跡等信息。這些數(shù)據(jù)是學(xué)習(xí)者為獲取所需知識(shí)和理解內(nèi)容產(chǎn)生的附屬行為,反映的是學(xué)習(xí)風(fēng)格和學(xué)習(xí)偏好行為特征,其對(duì)學(xué)習(xí)結(jié)果是否產(chǎn)生普遍影響尚不確定。此外,這些數(shù)據(jù)在量化計(jì)算上缺少統(tǒng)一標(biāo)準(zhǔn),因此暫不納入預(yù)測(cè)分析指標(biāo)中。綜上所述,提取的學(xué)習(xí)行為指

13、標(biāo)包括視頻學(xué)習(xí)時(shí)長(zhǎng)(vd)、視頻學(xué)習(xí)次數(shù)(vf)、文本學(xué)習(xí)時(shí)長(zhǎng)(td)、文本學(xué)習(xí)次數(shù)(tf)、互動(dòng)參與時(shí)長(zhǎng)(id)、互動(dòng)參與次數(shù)(if)、評(píng)價(jià)參與時(shí)長(zhǎng)(ed)、評(píng)價(jià)參與次數(shù)(ef)、論壇發(fā)帖數(shù)(pc)、主題發(fā)起數(shù)(tc)、回復(fù)數(shù)(rc)、點(diǎn)贊數(shù)(vf)等。在數(shù)據(jù)預(yù)處理上,研究者對(duì)學(xué)習(xí)時(shí)長(zhǎng)設(shè)定一個(gè)閾值,即超過該閾值的被認(rèn)定為離開學(xué)習(xí)任務(wù),處于非學(xué)習(xí)狀態(tài)。設(shè)定該值的原因是考慮到學(xué)習(xí)者在網(wǎng)絡(luò)學(xué)習(xí)中的認(rèn)知行為習(xí)慣,即在某一具體知識(shí)點(diǎn)中通常不會(huì)較長(zhǎng)時(shí)間一直停留不動(dòng),而學(xué)習(xí)時(shí)間較長(zhǎng)可能是由于學(xué)習(xí)者離開學(xué)習(xí)任務(wù)進(jìn)行其他網(wǎng)絡(luò)活動(dòng)以及學(xué)習(xí)者關(guān)掉瀏覽器但未注銷賬號(hào)造成。在時(shí)間閾值設(shè)定和估計(jì)上,grabe和sigl

14、er使用多種啟發(fā)式探索進(jìn)行時(shí)間估計(jì),所有超過3分鐘的學(xué)習(xí)行為時(shí)間將被替換成2分鐘,在選擇題的操作行為時(shí)間上最高設(shè)定為90秒,每一個(gè)模塊最后活動(dòng)時(shí)間被估計(jì)成60秒(grabe et al.,2002)。ryan baker將超過80秒的活動(dòng)時(shí)間認(rèn)定為脫離活動(dòng)行為時(shí)間(baker,2007)。vitomir kovanovic等通過對(duì)不同時(shí)間估計(jì)進(jìn)行對(duì)比分析,認(rèn)為短時(shí)間的時(shí)間估計(jì)和閾值設(shè)定對(duì)分析結(jié)果并沒有產(chǎn)生顯著影響,反而會(huì)對(duì)長(zhǎng)時(shí)間學(xué)習(xí)者的活動(dòng)行為分析進(jìn)行干擾,進(jìn)而影響分析結(jié)果;通過實(shí)際對(duì)比分析發(fā)現(xiàn)將單周模塊時(shí)間估計(jì)閾值設(shè)定為1800秒可以在不影響分析結(jié)果的前提下盡可能還原學(xué)習(xí)者的行為狀態(tài),發(fā)現(xiàn)學(xué)

15、習(xí)者之間的行為差異(kovanovi et al.,2015)。因此,本研究將每周模塊學(xué)習(xí)行為時(shí)間閾值設(shè)定為1800秒,超過該時(shí)間的學(xué)習(xí)活動(dòng)時(shí)間將被替換。在有效數(shù)據(jù)的提取上,研究采用兩種方式采集數(shù)據(jù)樣本:一是選取實(shí)際參與學(xué)習(xí)模塊的學(xué)習(xí)者行為數(shù)據(jù),剔除在各項(xiàng)學(xué)習(xí)活動(dòng)中數(shù)據(jù)均為0的樣本,最終獲得8804條大樣本數(shù)據(jù);二是選取各個(gè)學(xué)習(xí)模塊中均有學(xué)習(xí)者參與活動(dòng)的數(shù)據(jù)樣本,獲得1631條小樣本數(shù)據(jù)。通過大小樣本數(shù)據(jù)的分析,比較不同預(yù)測(cè)算法的準(zhǔn)確率。在研究方法上,分別采用預(yù)測(cè)分類算法、屬性選擇、多元回歸分析和聚類方法對(duì)數(shù)據(jù)進(jìn)行分析。其中預(yù)測(cè)分類算法用于分析學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)次數(shù)在學(xué)習(xí)結(jié)果上的預(yù)測(cè)準(zhǔn)確率;屬性選

16、擇用于選取能夠預(yù)測(cè)學(xué)習(xí)結(jié)果的有效學(xué)習(xí)行為分析指標(biāo);多元回歸分析用于計(jì)算有效學(xué)習(xí)行為指標(biāo)與學(xué)習(xí)結(jié)果之間的回歸系數(shù);聚類分析用于探索學(xué)習(xí)者的群體行為特征。在研究工具上,選擇機(jī)器學(xué)習(xí)分析工具weka,采用有監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)集進(jìn)行預(yù)測(cè)分析;spss對(duì)數(shù)據(jù)樣本進(jìn)行顯著性差異分析和多元回歸分析。3.研究過程整個(gè)研究過程包括以下6步:(1)采用r工具對(duì)edx平臺(tái)上記錄的原始數(shù)據(jù)進(jìn)行格式化,并提取不同學(xué)習(xí)模塊中的學(xué)習(xí)時(shí)長(zhǎng)、學(xué)習(xí)次數(shù)和論壇互動(dòng)數(shù)。(2)對(duì)每周課程內(nèi)容的學(xué)習(xí)時(shí)長(zhǎng)進(jìn)行處理,超過設(shè)定閾值的樣本數(shù)據(jù)將被替換成1800秒,最后統(tǒng)計(jì)學(xué)習(xí)者的學(xué)習(xí)時(shí)長(zhǎng)總和。(3)選擇決策樹、樸素貝葉斯網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)等三種

17、具有代表性的預(yù)測(cè)分類算法,比較學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)次數(shù)在學(xué)習(xí)結(jié)果預(yù)測(cè)上的準(zhǔn)確率,并分析不同預(yù)測(cè)分類算法的效果;在此基礎(chǔ)上分析不同學(xué)習(xí)模塊在學(xué)習(xí)結(jié)果預(yù)測(cè)上的效果。(4)采用屬性選擇,分析不同學(xué)習(xí)行為分析指標(biāo)在學(xué)習(xí)結(jié)果預(yù)測(cè)上的權(quán)重順序以及準(zhǔn)確預(yù)測(cè)學(xué)習(xí)結(jié)果的有效指標(biāo)組合。(5)采用多元回歸分析有效學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)的回歸系數(shù),并生成學(xué)習(xí)結(jié)果預(yù)測(cè)計(jì)算方程。(6)采用聚類方法分析學(xué)習(xí)行為的群體特征,探索不同群組學(xué)生的學(xué)習(xí)表現(xiàn)和行為特征。四、研究結(jié)果分析1.學(xué)習(xí)時(shí)長(zhǎng)與學(xué)習(xí)次數(shù)的預(yù)測(cè)比較如前所述,學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)次數(shù)是mooc學(xué)習(xí)行為活動(dòng)中的兩種主要數(shù)據(jù)類型,本部分主要分析哪種數(shù)據(jù)類型更能有效預(yù)測(cè)學(xué)習(xí)結(jié)果以及不同預(yù)測(cè)

18、分類算法的預(yù)測(cè)效果。在學(xué)習(xí)結(jié)果的評(píng)判上,由于預(yù)測(cè)分析算法是以標(biāo)稱型屬性作為預(yù)測(cè)的類別變量,因此這里以學(xué)習(xí)者是否獲得課程證書作為最終成績(jī)判定。在樣本均值的差異比較上,因時(shí)長(zhǎng)數(shù)值遠(yuǎn)高于次數(shù)值,故這里不作兩種類型指標(biāo)的顯著性差異分析。為了了解不同數(shù)據(jù)類型獨(dú)立和綜合預(yù)測(cè)效果,在分析學(xué)習(xí)時(shí)長(zhǎng)和次數(shù)的預(yù)測(cè)準(zhǔn)確率時(shí),對(duì)所有行為指標(biāo)進(jìn)行分析以作為參照,預(yù)測(cè)評(píng)估策略選擇十折交叉驗(yàn)證,分析結(jié)果見表1。預(yù)測(cè)準(zhǔn)確率的誤差通過均方根誤差值(root mean squared error,rmse)來評(píng)判。該值通過樣本離散程度來反映預(yù)測(cè)的精密度,其值越小表示測(cè)量精度越高。在預(yù)測(cè)準(zhǔn)確率上,大樣本預(yù)測(cè)值要高于小樣本預(yù)測(cè)值,說

19、明預(yù)測(cè)準(zhǔn)確率與樣本數(shù)量呈正相關(guān),各指標(biāo)的rmse值介于0.07400.1608,測(cè)量精度較高。在數(shù)據(jù)類型的預(yù)測(cè)準(zhǔn)確度上,學(xué)習(xí)次數(shù)的預(yù)測(cè)效果要好于學(xué)習(xí)時(shí)長(zhǎng),特別是在小樣本分析條件下,平均預(yù)測(cè)準(zhǔn)確率較高,且rmse值較低。學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)次數(shù)的整體預(yù)測(cè)效果與學(xué)習(xí)次數(shù)較為接近。在預(yù)測(cè)分析算法的比較上,盡管小樣本分析條件下樸素貝葉斯網(wǎng)絡(luò)在學(xué)習(xí)時(shí)長(zhǎng)的預(yù)測(cè)準(zhǔn)確率要高于決策樹,但整體而言bp神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率最高,決策樹的預(yù)測(cè)效果要好于樸素貝葉斯網(wǎng)絡(luò)。2.課程學(xué)習(xí)模塊的預(yù)測(cè)比較分析mooc教學(xué)設(shè)計(jì)者為學(xué)習(xí)者提供了不同類型的學(xué)習(xí)材料和支持服務(wù)。為了了解不同學(xué)習(xí)模塊在學(xué)習(xí)結(jié)果預(yù)測(cè)上的效果,研究按學(xué)習(xí)者參與的活動(dòng)模

20、塊劃分學(xué)習(xí)行為數(shù)據(jù)。由于不同模塊中涵蓋的指標(biāo)類型數(shù)據(jù)一樣,因此在進(jìn)行預(yù)測(cè)分析之前需要檢驗(yàn)各模塊樣本數(shù)據(jù)之間是否存在顯著性差異。通過對(duì)大樣本的均值統(tǒng)計(jì)分析可知,各模塊均值由高到低排序?yàn)槲谋?、視頻、評(píng)價(jià)和互動(dòng),而小樣本均值排序?yàn)槲谋?、評(píng)價(jià)、視頻和互動(dòng)。在顯著性差異比較上,采用相依樣本t檢驗(yàn)對(duì)不同樣本量下的模塊變量進(jìn)行分析,結(jié)果見表2。在大樣本分析情境下,各模塊變量差異的95%置信區(qū)間未包含0這個(gè)數(shù)值,應(yīng)拒絕虛無假設(shè)h1:1=2,接受對(duì)立假設(shè)h0:12,且顯著性檢驗(yàn)概率值p<0.05,表示模塊之間有顯著性差異存在。在小樣本分析情境下,文本模塊和評(píng)價(jià)模塊的置信區(qū)間涵蓋0,顯著性檢驗(yàn)概率值p=0.110>0.05,表示兩者之間無顯著性差異存在。整體而言,除小樣本中的文本和評(píng)價(jià)模塊無顯著性差異之外,各模塊變量均有顯著性差異,適合對(duì)其進(jìn)行學(xué)習(xí)結(jié)果預(yù)測(cè)分析。在預(yù)測(cè)算法選擇上,由于bp神經(jīng)網(wǎng)絡(luò)算法的學(xué)習(xí)速度較慢且訓(xùn)練失敗的可能性較大,基于前面比較分析結(jié)果采用決策樹作為預(yù)測(cè)分析算法,分析結(jié)果見表3。在整體預(yù)測(cè)準(zhǔn)確率上,大樣本要高于小樣本數(shù)據(jù),這一結(jié)果與前面分析一致。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論