Petri網(wǎng)在留學(xué)生漢語語音評價系統(tǒng)中的應(yīng)用.doc_第1頁
Petri網(wǎng)在留學(xué)生漢語語音評價系統(tǒng)中的應(yīng)用.doc_第2頁
Petri網(wǎng)在留學(xué)生漢語語音評價系統(tǒng)中的應(yīng)用.doc_第3頁
Petri網(wǎng)在留學(xué)生漢語語音評價系統(tǒng)中的應(yīng)用.doc_第4頁
Petri網(wǎng)在留學(xué)生漢語語音評價系統(tǒng)中的應(yīng)用.doc_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Petri 網(wǎng)在留學(xué)生漢語語音評價系統(tǒng)中的應(yīng)用摘 要:本文介紹了 Petri 網(wǎng)在留學(xué)生漢語語音評價系統(tǒng)中的應(yīng)用實例,提出了該系統(tǒng)的形式化的定義和語音評價過程的執(zhí)行規(guī)則,結(jié)合漢語發(fā)音評價體系的特點,利用 Petri 網(wǎng)實現(xiàn)了留學(xué)生漢語語音評價的基本過程,降低了時間成本,提高了留學(xué)生漢語語音評價的效率。關(guān)鍵詞: Petri 網(wǎng) 漢語語音評價 形式化 語音信號一、引言漢語發(fā)音在留學(xué)生漢語學(xué)習(xí)及交流中起著舉足輕重的作用,語音評價是第二語言習(xí)得過程中的基礎(chǔ)內(nèi)容和重要環(huán)節(jié),而漢語發(fā)音數(shù)據(jù)則是語音評價的主體和前提,是語音庫的重要來源。如何對留學(xué)生的發(fā)音做出科學(xué)、有效的評價,一直是語音評價研究的熱點。近年來

2、,隨著信息技術(shù)的不斷發(fā)展,國內(nèi)對漢語語音識別、語音評價系統(tǒng)做了大量研究,主要成果如下:袁毅、吳晨 1 提出了柔性可擴展體系結(jié)構(gòu)非特定人語音識別系統(tǒng)的框架模型,驗證了在該模型指導(dǎo)下所開發(fā)出的語音識別系統(tǒng)的實用性和穩(wěn)定性;施偉 2 提出了對外漢語教學(xué)中的發(fā)音自動評價系統(tǒng),通過分析輸入語音數(shù)據(jù),提取語音特征并與參考標(biāo)準(zhǔn)進行匹配比較,由評分機制根據(jù)相似程度大小給出相應(yīng)的評價;潘志松等3 提出了 Petri 網(wǎng)原理在語音識別中的基礎(chǔ)應(yīng)用方法,并以簡單實例加以研證。以上研究均采用了不用的技術(shù)和方法來實現(xiàn)漢語語音數(shù)據(jù)評價過程,產(chǎn)生了一系列的應(yīng)用結(jié)果,取得了一些進步和成果。本文在前人研究的基礎(chǔ)上, 提出了一種

3、用 Petri 網(wǎng)實現(xiàn)留學(xué)生漢語語音數(shù)據(jù)識別、評價及偏誤分析的方法,大大降低了漢語語音數(shù)據(jù)評價成本,提高了評價過程的效率和留學(xué)生習(xí)得漢語語音的效率,使語音評價過程具有一定的兼容性、擴展性和適應(yīng)性,符合當(dāng)代漢語語音數(shù)據(jù)評價發(fā)展的特點及要求。二、 Petri 網(wǎng)與留學(xué)生漢語語音評價體系(一) Petri 網(wǎng)簡介Petri 網(wǎng)起源于 1962 年 Carl Adam Petri 的博士論文,它是一種可以用網(wǎng)狀圖形表示的系統(tǒng)模型,其概念是在尊重自然規(guī)律的前提下定義的,以確保以其為模型描述的系統(tǒng)都是可以實現(xiàn)的 4 。Petri 網(wǎng)有豐富的系統(tǒng)描述手段和系統(tǒng)行為分析技術(shù),最初主要應(yīng)用于系統(tǒng)的建模、分布式系

4、統(tǒng)的設(shè)計、并行處理等領(lǐng)域,經(jīng)過50 多年的研究發(fā)展,Petri 網(wǎng)理論日益完善,被廣泛應(yīng)用于實現(xiàn)各類流程和系統(tǒng)行為過程問題。按研究對象 (過程),Petri 網(wǎng)的模型可分為網(wǎng)、網(wǎng)系統(tǒng)、庫所 / 變遷系統(tǒng)、 高級網(wǎng)系統(tǒng)等模型系統(tǒng),每類模型均有不同的層次結(jié)構(gòu)。本文涉及到的是高級網(wǎng)系統(tǒng)中的有色自控系統(tǒng)5 ,它的一個庫所中可以包含多種資源(漢語語音信號),一個變遷代表一種流動關(guān)系,涵蓋因資源差異而發(fā)生的不同變化和特征。Petri 網(wǎng)最基本的構(gòu)成單元為: 庫所( Place)圓形節(jié)點(下文以 S代替),變遷( Transition)方形節(jié)點(下文以 P 代替);有向?。?Connection )是庫所和

5、變遷之間的有向弧;托肯(Token)是庫所中的動態(tài)對象 (如為完成某個語音輸入的識別或備份需要調(diào)用到的資源個數(shù)) ,可以從一個庫所移動到另一個庫所。 Petri 網(wǎng)的運行規(guī)則視具體情況而定,但基本規(guī)則是:有向弧是有方向的;兩個庫所或變遷之間不允許有庫所;庫所可以擁有任意數(shù)量的托肯。(二)留學(xué)生漢語語音評價體系留學(xué)生漢語語音評價體系 67 是根據(jù)留學(xué)生發(fā)音特征和漢語發(fā)音偏誤建立的一個衡量和評價漢語語音習(xí)得程度和發(fā)音質(zhì)量高低的智能化系統(tǒng),使留學(xué)生能利用該系統(tǒng)對發(fā)音進行測評,該系統(tǒng)可在第一時間反饋漢語發(fā)音評價結(jié)果、錯誤類型和改進建議,能有效地提高留學(xué)生漢語發(fā)音的正確率,使其能更好地掌握漢語發(fā)音。根據(jù)

6、留學(xué)生漢語發(fā)音特點以及現(xiàn)有語音識別技術(shù),漢語語音評價體系由語音識別層、語音評價層及偏誤分析層三大功能模塊構(gòu)成,在每一個功能模塊下又設(shè)有子模塊,如圖 1 所示。三個主要功能模塊之間相互依存、相互影響和相互作用,通過聯(lián)動和反饋機制不斷地在其間傳遞語音及語音評價信息,構(gòu)成了一個完備的漢語語音評價體系。(三)評價測試項目組利用矢量化編碼VQF技術(shù) 8 進行漢語語音數(shù)據(jù)采集,通過對普通的漢語語音評價實現(xiàn)方案和基于Petri網(wǎng)的語音評價實現(xiàn)方案做出了測試和對比,結(jié)果如圖2 所示。假設(shè) L 為留學(xué)生漢語發(fā)音習(xí)得等級,它是一個五元組L=( L1,L2,L3,L4,H),其中: L1 為元音習(xí)得等級, L2 為

7、輔音習(xí)得等級, L3 為聲調(diào)習(xí)得等級, L4 為語調(diào)習(xí)得等級, H 為權(quán)重因子 7 , F 為基頻參數(shù)。 L 值越高,證明發(fā)音偏誤率越低,發(fā)音更加接近標(biāo)準(zhǔn),發(fā)音質(zhì)量高; L 值越低,證明發(fā)音偏誤率越高, 發(fā)音偏離標(biāo)準(zhǔn), 發(fā)音質(zhì)量低。 圖 2 中 L1 為普通的漢語語音評價實現(xiàn)方案對應(yīng)的語音評價等級,L2 為利用Petri 網(wǎng)實現(xiàn)方案對應(yīng)的語音評價等級;右側(cè)測試數(shù)據(jù)則為某個漢字發(fā)音單元(本研究僅限于單音節(jié)詞)在兩種方案下得出的等級值。由圖可知,L2 實現(xiàn)方案較為合理,大體上符合漢語發(fā)音規(guī)律, 評價值接近預(yù)設(shè)的漢語發(fā)音習(xí)得等級值(L)。(四)留學(xué)生漢語語音評價體系與Petri 網(wǎng)的關(guān)系從理論意義上

8、講,二者在形式上是一一對應(yīng)的關(guān)系,只是涵蓋的內(nèi)容不同,Petri 網(wǎng)及網(wǎng)系統(tǒng)發(fā)生記錄也是語音評價體系的執(zhí)行結(jié)果。 經(jīng)過以上測試可發(fā)現(xiàn):以 Petri 網(wǎng)為工具能有效實現(xiàn)留學(xué)生漢語語音評價系統(tǒng)的模型化,以網(wǎng)絡(luò)圖形方式描述語音評價系統(tǒng)模塊之間的關(guān)系和語音評價的全過程,從而使抽象的語音評價過程具體化。此外,Petri 網(wǎng)語音執(zhí)行記錄還能有效地反饋發(fā)音偏誤、缺陷和系統(tǒng)異常情況,有利于針對某一個(組)語音的分析和處理,為整個留學(xué)生漢語語音系統(tǒng)的運行提供有效的支持和保障。三、 Petri 網(wǎng)在漢語語音識別系統(tǒng)中的應(yīng)用Petri 網(wǎng)是研究和模擬漢語語音評價并行發(fā)生,依次發(fā)生和循環(huán)發(fā)生最理想的工具,與其他智能

9、化系統(tǒng)一樣,留學(xué)生漢語語音評價系統(tǒng)有一套完備的實現(xiàn)程序,系統(tǒng)中各模塊間通過聯(lián)動機制有機地聯(lián)系在一起,這是利用 Petri 網(wǎng)對其形式化描述的物質(zhì)基礎(chǔ)。 下面是一個用Petri 網(wǎng)來描述留學(xué)生漢語語音評價系統(tǒng)中語音識別層的實例。(一)圖形化的漢語語音識別過程語音識別層由語音信號輸入模塊、預(yù)處理模塊、特征提取模塊及標(biāo)準(zhǔn)語音數(shù)據(jù)庫構(gòu)成,如圖1 所示,當(dāng)某個語音信號產(chǎn)生時,語音信號輸入模塊首先將語音轉(zhuǎn)換為計算機能讀取的數(shù)字信號,隨后通過預(yù)處理模塊分辨出語音信號及非語音信號。經(jīng)預(yù)處理后的音頻數(shù)據(jù)一方面會被傳送到標(biāo)準(zhǔn)語音庫進行備份,另一方面作為特征提取模塊的輸入數(shù)據(jù)。將以上漢語語音識別過程以Petri 網(wǎng)

10、描述如下:S1、S2、S3、S4 為不同狀態(tài)下的漢語語音信號;P1 為語音識別功能模塊,P2 為預(yù)處理功能模塊,P3 為特征提取功能模塊; s0 為經(jīng)預(yù)處理后的音頻數(shù)據(jù);p0為標(biāo)準(zhǔn)語音庫和偏誤語音庫之間的聯(lián)動功能模塊。圖 3 是對一個典型的形式化的語音識別過程:漢語語音在處理過程中移動,每個處理環(huán)節(jié)再調(diào)用相關(guān)的函數(shù)及算法,直至語音識別過程結(jié)束。顯然,語音處理環(huán)節(jié)對應(yīng)著Petri網(wǎng)系統(tǒng)中的變遷元素“ T”,而不同狀態(tài)下的漢語語音數(shù)據(jù)則對應(yīng)庫所元素“ S”。圖 3 是整個漢語語音評價過程中截取出來的一個語音識別片段 s,其中庫所中的黑點個數(shù)代表該種語音識別資源的個數(shù),箭頭代表系統(tǒng)中資源流動的方向,

11、弧上的數(shù)字代表語音處理需要調(diào)用到的資源的個數(shù),也稱為權(quán)值,沒有數(shù)字的弧,其權(quán)值為1。例如,語音識別環(huán)節(jié)P1 需要輸入 1 個漢語語音,調(diào)用1 個語音識別資源后完成識別,S2 中語音資源個數(shù)顯然少于預(yù)處理需要調(diào)用的資源總數(shù),就上模型片段而言, 不能繼續(xù)進行語音數(shù)據(jù)的預(yù)處理,P2將等待系統(tǒng)具備充分的資源數(shù)后,方可執(zhí)行。另一方面,s0中已經(jīng)有足夠資源對識別后的語音進行備份和比對,從而p0 過程得以進行。當(dāng)語音識別系統(tǒng)中存在資源競爭時,經(jīng)常出現(xiàn)以下情況:某個語音在識別后備份到標(biāo)準(zhǔn)語音庫中,占用到一定的資源個數(shù),與此同時,偏誤分析功能模塊也要調(diào)用標(biāo)準(zhǔn)語音庫中的數(shù)據(jù)或資源進行比對,資源情況不滿足既定操作,

12、即語音識別層和偏誤分析層在同時對標(biāo)準(zhǔn)語音庫和偏誤語音庫中的資源進行調(diào)用時存在資源競爭現(xiàn)象,有向弧上的權(quán)值不允許操作繼續(xù),語音識別系統(tǒng)將會反饋異常處理記錄,系統(tǒng)將重新分配現(xiàn)有資源,尋求其他途徑解決沖突。就漢語語音資源來說,存放它們的庫所S(語音信號)具有語音庫存貯數(shù)據(jù)的性質(zhì),它只能存放一定種類的語音資源,并且有一定的數(shù)量限制。但S 和語音庫又不完全一樣,語音庫在語音評價網(wǎng)系統(tǒng)中有固定的位置,而S 在網(wǎng)中的位置毫無意義,不管它們處于何種位置,語音識別系統(tǒng)(網(wǎng))的含義是不變的。(二)基于Petri 網(wǎng)的留學(xué)生漢語語音評價網(wǎng)系統(tǒng)1.留學(xué)生漢語語音評價網(wǎng)系統(tǒng)的形式化定義結(jié)合留學(xué)生漢語語音評價過程與Pet

13、ri 網(wǎng)中有色自控系統(tǒng)的特點和性質(zhì),可得出: =( S,P;F,W,R)為留學(xué)生漢語語音評價網(wǎng)系統(tǒng)的條件是:( 1)( S, P; F)為有向網(wǎng),它為的基本網(wǎng);( 2)W: S P P S 0, 1, 2 S,且 W( x, y) 0,當(dāng)且僅當(dāng)( x, y) F,也成為的語音權(quán)函數(shù);( 3) R: S0, 1,2 為的資源標(biāo)記。該定義假設(shè)每個語音信號( S)的容量為無窮(因為考慮到本文設(shè)計的語音評價系統(tǒng)對象是無窮盡的漢語語音數(shù)據(jù),故做上述假設(shè)) ,有向弧的權(quán)值可以作為庫所名,定義中( S;P;F)可映射到留學(xué)生漢語語音評價的各個環(huán)節(jié)。例如: W( x,y)=sn,則可從庫所畫一個以小圓圈為箭頭

14、的有向弧指向弧( x,y),如圖 3 所示。由于該網(wǎng)系統(tǒng)沒有可變的權(quán)值,故設(shè) S=s0,s1,s2sn,P=p0,p1 , p2pn ,由的權(quán)函數(shù)W 可產(chǎn)生模糊矩陣R,R 的第 i 行第 j 列的矩陣元素即W( pj ,si) -W( si, pj),可依此計算出所需資源標(biāo)記(個數(shù))。2.留學(xué)生漢語語音評價網(wǎng)系統(tǒng)的運行規(guī)則( 1)映射 R: S0,1,2 為的資源標(biāo)記;( 2)表示 R 下的權(quán)值函數(shù) Wr 定義為:( x,y) S P P S;若 W( x, y)S,則 Wr ( x, y) =W( x, y);若 W( x,y) =s s S,則 Wr( x,y) =R( s);( 3)變遷

15、 p P 滿足 R 的發(fā)生權(quán),即 Rp的條件是: s S: R(s) Wr (s, p),且有 sS,使 Wr( s, p)0,則 p 至少有一個輸入權(quán)值;(4)若 Rp,則 p 可以發(fā)生,后繼標(biāo)識R( s)為 R( s)=R( s)+Wr( p, s)-Wr ( s, p),有 RpR以上就是留學(xué)生漢語語音評價網(wǎng)系統(tǒng)的運行規(guī)則,權(quán)函數(shù) Wr 隨著標(biāo)識 R 的改變而改變,體現(xiàn)了該系統(tǒng)的缺陷跟蹤能力和語音修正能力。從嚴(yán)格意義上講, “”只是語音評價系統(tǒng)中各子系統(tǒng)的總和,運行規(guī)則里也指出了“ p”的輸入弧上的權(quán)值必須大于 0 方可執(zhí)行,以避免無中生有的變遷發(fā)生,如只要有語音信號,語音評價系統(tǒng)中有無

16、語音數(shù)據(jù)都可完成語音評價,這種情況是不允許的。根據(jù)定義和運行規(guī)則,可對照圖 3,s 中語音識別過程P1、特征提取過程P3 均可發(fā)生,假若S2(識別后的語音)中沒有足夠的托肯,預(yù)處理過程P2 永遠都不會發(fā)生,則語音評價系統(tǒng)中的語音輸入識別功能無法完成,這也將造成之后語音評價系統(tǒng)功能的紊亂和終止。從另外一方面看,Wr函數(shù)體現(xiàn)了語音評價過程的自我修正和反饋意見功能,可針對因資源競爭,產(chǎn)生死鎖而造成系統(tǒng)癱瘓、運行異常等情況做出反應(yīng),并重新配置語音處理資源,使系統(tǒng)在第一時間里回復(fù)正常運行,保證了該系統(tǒng)智能、穩(wěn)定和高效的特點。3.語音評價結(jié)果本研究前期預(yù)測效果顯著,項目組利用以上方法對測試漢語語音評價系統(tǒng)

17、以來的所有漢語語音評價記錄做了相關(guān)統(tǒng)計。抽樣調(diào)查中,95%的留學(xué)生參與了語音評價的各個環(huán)節(jié),語音評價系統(tǒng)成功識別漢語語音數(shù)據(jù)共計15891 條(按單個音節(jié)計算) ,其中有效數(shù)據(jù)13936 條,占 87.69%。在執(zhí)行語音評價的指令中,同時執(zhí)行多條語音處理指令稱為指令并行。圖4 中的并行度是指在語音評價關(guān)系網(wǎng)中,指令并行執(zhí)行的最大條數(shù)。經(jīng)測算,該留學(xué)生漢語語音評價系統(tǒng)在完成所有語音處理指令和不出現(xiàn)異常的情況下,各模塊語音指令總數(shù)為:分割與對比功能模塊,124 條;發(fā)音評價功能模塊, 298 條;習(xí)得等級測評功能模塊,21 條;聯(lián)動模塊,9 條。根據(jù)上表數(shù)據(jù),可見本文設(shè)計的留學(xué)生漢語語音評價系統(tǒng)中

18、的指令并行程度較高,大大提高了語音處理和評價的速度,降低了時間成本,有利于在同一時間處理和分析多條漢語語音數(shù)據(jù)。4.語音數(shù)據(jù)的保存為建立留學(xué)生漢語標(biāo)準(zhǔn)語音庫和偏誤語音庫,為語音識別、對比研究奠定數(shù)據(jù)技術(shù)基礎(chǔ),為最大程度的保證語音評價的準(zhǔn)確性和擴展性,應(yīng)做好標(biāo)準(zhǔn)漢語語音的采集和偏誤語音的收集。 項目組在對產(chǎn)生的每一個漢語語音 (或多個語音)評價結(jié)果后都要對其進行備存和入庫管理, 這是 Petri 網(wǎng)技術(shù)做不到的。四、結(jié)語人類處于一個信息技術(shù)迅猛發(fā)展的時代,語言學(xué)和計算機科學(xué)越來越緊密地結(jié)合在一起,這也是當(dāng)今跨學(xué)科發(fā)展的必然結(jié)果。對于研究人員來說,留學(xué)生漢語語音評價是由一系列復(fù)雜的活動組成的,對其進行形式化的定義不僅需要將語言學(xué)和計算機技術(shù)基礎(chǔ)理論和實踐經(jīng)驗相結(jié)合,還需進行大量的測試和技術(shù)研發(fā)。 本文介紹的基于 Petri 網(wǎng)的留學(xué)生漢語語音評價系統(tǒng)實現(xiàn)方法只是語音評價技術(shù)中的一種,以期能夠給業(yè)內(nèi)人士提供有效參考。(本文是云南省社科規(guī)劃辦項目“基于東盟國家語言政策的云南漢語國際推廣策略研究以GMS 五國為例”, 項目編號: KKSK201335026;云南省教育廳本科教學(xué)質(zhì)量與教學(xué)改革工程項目“東南亞語種人才培養(yǎng)示范點” 項目編號:10968258 。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論