小學藏文教材中詞性的分布情況研究_第1頁
小學藏文教材中詞性的分布情況研究_第2頁
小學藏文教材中詞性的分布情況研究_第3頁
小學藏文教材中詞性的分布情況研究_第4頁
小學藏文教材中詞性的分布情況研究_第5頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、    小學藏文教材中詞性的分布情況研究    冷毛措+張有誼摘要: 在自然語言處理中, 詞類劃分屬于基礎研究, 其重要性不可忽視。本文以小學藏語文教材為語料,利用計算機對教材中藏語詞的頻次,數(shù)量等信息做出統(tǒng)計,進而摸索出目前藏語文教材編輯中藏語詞性的分布規(guī)律,目的在給藏語詞的安排、重要程度等是否科學合理,即是否符合各個年齡段藏族學生對知識的接受狀況,提供重要的參考作用。關鍵詞:藏文信息處理;語料庫分詞;標注:tp18 :a :1009-3044(2016)06-0195-021 概述藏文的詞性主要包括名詞、動詞、形容詞、數(shù)詞、量詞、代詞、副詞、介詞、連

2、詞、助詞、嘆詞、擬聲詞等12種構成,特別是動詞、名詞和虛詞占重要的地位。通過搜集和查閱相關的文獻,目前針對藏語文教材中詞性的分布情況的研究還不多見,最近端智項杰在中小學藏語文教材中詞匯統(tǒng)計及分布情況研究碩士論文中,對詞匯的統(tǒng)計及分布做了一些工作,但其僅對中小學藏語文教材中詞匯的用詞狀況作了統(tǒng)計,分析了其用詞信息及在真實文本中使用的程度信息,沒有對藏語文教材中詞性的分布情況進行研究。本論文擬以小學藏語文教材中詞性作為研究對象,采用藏語言信息處理技術對其詞性的分布進行統(tǒng)計與分析。2. 藏文詞類信息的分類方法我們根據(jù)藏語語料庫建設的實際需要,藏語傳統(tǒng)文法的八種格為:主格、業(yè)格、作格、為格、從格、屬格

3、、于格和呼格,語料庫標注時,根據(jù)其語法功能用介詞p標記。本文遵循格桑居冕、格桑央京編著的實用藏文文法教程中的詞法分類方法,將藏文詞類分為13種,即名詞n、動詞v、數(shù)詞m、量詞q、副詞d、連詞c、介詞p、助詞u、語氣詞y、嘆詞e、代詞r、形容詞a、擬聲詞o、其中動詞存在三時一式(過去時、現(xiàn)在時、未來時和命令式)的形態(tài)變化, 3 藏語文課文體裁選用的教材是五省區(qū)藏語文教材編寫委員會編著,青海民族出版社2009年改版的五省去寫作教材義務教育課程標準試驗教科書,共12冊作為語料,本套藏語文教材共有課文274篇,第1冊為字母學習,在進行課文統(tǒng)計時,未計算在內;藏語文教材第2冊、第3冊、第4冊中分別有10

4、篇、4篇、4篇課文是生詞學習,在課文體裁和篇幅統(tǒng)計時未列入課文數(shù)目統(tǒng)計,在用詞統(tǒng)計中計入。課文體裁在一定程度上反映了整套教材的語言風格和面貌,體現(xiàn)了教材編寫者的教育理念。各類體裁的分布及用詞情況,可以反映出教材各體裁的詞量分布情況。4 語料處理對于錄入的語料首先進行分詞,在及其分詞的基礎上,對分詞軟件標注的“未登錄”部分做人工修改,并人工校對錯誤分詞。藏文分詞盡量與藏語語感中的“詞”保持一致,既能獨立運用,使用穩(wěn)定且具有固定語義的最小單位這里所說的 “詞義”指詞語釋義,當詞語為多義詞時,解釋標注其常用詞義。5 統(tǒng)計方法語料采用人工和計算機軟件想結合的方法:詞語分詞才用及其字段分詞與人工干預相結

5、合的方法進行。分詞軟件采用自己編寫的 “藏文分詞與詞性標注一體化軟件”;對分詞軟件標注為“未登錄詞”的部分,做人工修正。藏文分詞盡量與藏語預感中的“詞”保持一致,既能獨立運用、使用穩(wěn)定且具有固定語義的最小單位。5.1 小學藏文教材中詞性分布統(tǒng)計及分析在小學階段根據(jù)教學大綱要求,將藏語文教材的文章體裁分為記敘文、說明文、議論文、散文、詩歌、小說、童話、其他(戲劇、格言、諺語、謎語)8類。以系統(tǒng)統(tǒng)計的數(shù)據(jù)和科學調研為依據(jù)提出新的教材中新生詞的分布情況和新生詞的難易程度,使教材的新生詞更嚴謹更科學地進入教材編輯,依此達到藏語文教學的嚴謹性,以便提升小學生對藏語文教育的興趣和小學教學中的藏語文教學成果

6、,所以本文主要分析以下幾種詞性。如圖 1所示:圖1顯示,除第1冊字母學習外總分析11冊,由于量詞、感嘆詞、時間詞的數(shù)量比較少,所以本論文中撤銷了那些詞性的分析。將各詞性在小學藏文教材中按比例排序為:名詞,動詞,助詞,代詞,動詞,形容詞,數(shù)詞,副詞,方位詞,名詞在小學藏文教材中均占優(yōu)勢,其中助詞、方位詞和數(shù)詞占的比例比較少,體現(xiàn)了基礎教育階段的詞匯學習以常用和名詞為主,課文個詞性平均分布在各冊,屬于典型的分散式教學。6 結束語通過本論文研究,一方面可以摸清小學藏語文教材中詞性分布狀況,其研究數(shù)據(jù)對小學藏語文教材的編纂有參考作用;另一方面將藏語自然語言處理理論與技術應用于藏語文教材中詞性的分布研究,具有很強的針對性,可以填補藏語言信息處理在這一研究領域的空白。參考文獻:1 毛爾蓋·桑木旦.藏文文法概論m.青海民族出版社,2005.2 李素建.漢語組塊計算的若干研究d.中國科學院研究生院,2002.3 趙德宇.漢語句法分析技術及其在機器人輔助教育智能接口中的應用研究d.天津師范大學,2004.4 韓雪林.現(xiàn)行中小學藏文教材中存在的問題及解決的辦法j.甘肅省甘南藏族自治州教育局,1997(3).5 趙小華.knn詞匯統(tǒng)計及分布中特征詞權重算法的研究d.太原理工大學,2010. 電腦知識與技術2016年6期電腦知識與技術的其它文章基于網(wǎng)絡的高校教材管理系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論