hnc視角下的非常規(guī)對象賓語句的語義分析_第1頁
hnc視角下的非常規(guī)對象賓語句的語義分析_第2頁
hnc視角下的非常規(guī)對象賓語句的語義分析_第3頁
hnc視角下的非常規(guī)對象賓語句的語義分析_第4頁
hnc視角下的非常規(guī)對象賓語句的語義分析_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

hnc視角下的非常規(guī)對象賓語句的語義分析

一、非常序?qū)ο筚e語句hcl(概念層網(wǎng)絡(luò),概念層網(wǎng)絡(luò))理論是一個理論體系,用于理解自然環(huán)境。HNC理論建立的模式之一是關(guān)于自然語言語句的表述模式,這種模式以句類(句子的語義類型)為中心,語義塊是句子語義的直接構(gòu)成成分。根據(jù)句子基本語義信息的重要程度不同,語義塊分為主輔兩大類,建立句子的語義結(jié)構(gòu)式基本上只需要主語義塊。一個句子所表達(dá)的內(nèi)容無非兩個方面:對象和對象的表現(xiàn)。句子中的對象可以分為兩類,一是一般對象,二是特殊對象,是對另一對象發(fā)出作用的對象,前者簡稱為對象B,把后者稱為作用者A。句子的表現(xiàn)也分為一般和特殊兩類,當(dāng)一個句子里的表現(xiàn)不止一個且它們之間具有因果關(guān)系時,HNC把因表現(xiàn)定義為一般表現(xiàn),命名為特征E,把果表現(xiàn)定義為特殊表現(xiàn),命名為內(nèi)容C。其中,B、A、C統(tǒng)稱為廣義對象語義塊,用符號JK表示。語義塊和格一樣都是對語言成分語義角色的劃分,但HNC認(rèn)為語義塊是句類的函數(shù),句類不同語義塊的具體內(nèi)涵就同,從而保證了語義塊描述句義的完備性。語言的結(jié)構(gòu)是人類認(rèn)知結(jié)構(gòu)的摹寫,認(rèn)知結(jié)構(gòu)同人的生命體驗(yàn)相聯(lián)系,并形成了基本的情景概念結(jié)構(gòu)“施事一動作—受事”。漢語被認(rèn)為是一種具有強(qiáng)烈臨摹性的語言,SVO語序以臨摹性為基礎(chǔ),是漢語的優(yōu)勢語序。特殊對象A一般出現(xiàn)在主語位置,一般對象可以出現(xiàn)在主語和賓語的位置,但是有特殊表現(xiàn)C時,一般對象往往要出現(xiàn)在主語位置,當(dāng)A、B出現(xiàn)在以上位置時是一種常序。但漢語中也有這樣的情況,特殊對象出現(xiàn)在賓語位置,有特殊表現(xiàn)C時,一般對象出現(xiàn)在賓語位置,本文將這類句子稱為非常序?qū)ο筚e語句①1。例如,“三個人喝一壺水”是可以而且經(jīng)常出現(xiàn)的,符合“施事一動作一受事”的基本概念結(jié)構(gòu),“三個人”是“喝”這個動作的作用者(特殊對象A),而“一壺水”是作用的對象(一般對象B);而“一壺水喝三個人”也可以出現(xiàn),特殊對象A出現(xiàn)在了賓語的位置,一般表現(xiàn)B作了主語,相對于“施事一動作一受事”的概念結(jié)構(gòu),這句話便是對象作賓語的非常序句子。非常序?qū)ο筚e語句常常造成計(jì)算機(jī)理解的困難②2,也成為語言學(xué)研究的難點(diǎn)和熱點(diǎn)。隨著語言事實(shí)的不斷發(fā)掘和語言研究的不斷深入,漢語語序具有靈活性的特點(diǎn)越來越為人們認(rèn)識和接受,即在不改變基本句義的前提下,語言成分常有移位的自由。非常序?qū)ο筚e語句一般也可以將對象提至E塊之前,構(gòu)成常規(guī)句式,兩種語序的句子在語義表達(dá)上基本相同。當(dāng)然,兩句之間也有一些差別,如話題、焦點(diǎn)不同,使用頻率不同,上下文環(huán)境不同。但對于計(jì)算機(jī)理解語言來說,這些區(qū)別至少在一定階段是可以先放一放的。調(diào)整后的常規(guī)句式,計(jì)算機(jī)較容易處理。于是,通過調(diào)整語序的操作就化解了這類語句的理解難點(diǎn)。HNC用句類格式定義語句主語義塊的排列順序,并引入基本、規(guī)范、違例和省略四種格式概念。句類格式具有窮盡性特征,這樣就為計(jì)算機(jī)透過漢語語義塊排列順序復(fù)雜變化的表象,把握漢語語句的審查語義結(jié)構(gòu)提供了必要的保證條件?;靖袷降倪x取依據(jù)漢語的習(xí)慣,或者說是頻率較高的語義塊排列序列。非常序?qū)ο筚e語句是非基本格式的語序且缺乏語義塊區(qū)分符標(biāo)志,屬于違例格式。黃曾陽先生把違例格式的判斷列為句類分析的16號難點(diǎn),而本文正是將非常序?qū)ο筚e語句與相應(yīng)常式句視為等義,進(jìn)而著力于對違例格式的判定。二、hnc的含義動詞是句子成分次序變化的支點(diǎn),它直接聯(lián)系著句子的主語和賓語。HNC的句類也是依附于某個v概念的,v概念對特征語義塊E的構(gòu)成、廣義對象語義塊的切分組合都起著重要的指導(dǎo)作用。所以本文從語句的v概念入手對非常序?qū)ο筚e語句進(jìn)行分類考察。(一)“常式句”的使用這類語句常表示一定量的存在物可供給某一定量的人員或其他具備[+動物性]特征的存在物使用。v概念一般要涉及兩個JK語義角色,使用者和使用對象。其中使用者優(yōu)先人pe、p,也可以是動物類概念jw62,而對象為物概念,優(yōu)先人造物pw,使用者和對象均含有數(shù)量短語。“使用”義本身較為泛化,這類語句對應(yīng)于多種HNC句類,句類代碼取決于具體的E塊。如“一鍋飯吃七個人”是物轉(zhuǎn)移句,“一條被子蓋三四個人”是換位狀態(tài)句。a組例句是非常序?qū)ο筚e語句,這些句子通過主賓語易位的語序調(diào)整可以構(gòu)成b組常式句。兩組句子表達(dá)的語義基本相同,而常式句的理解基本做到。所以將a組句子處理為b組句子JK1和JK2易位的結(jié)果,a組句子的格式代碼確定為!20。例如,“七個人吃一鍋飯?!钡木漕惐硎臼奖闶?20T21J=TC+T2+TA。c公共課講煩了老師。剩菜吃膩他們了。酒喝醉了老王。上面的c組語句比a組均多了個動詞的補(bǔ)語,但表達(dá)的句式義已發(fā)生改變:表示人或物在某種作用下的反應(yīng)。這類句子的主語是反應(yīng)的引發(fā)者及其表現(xiàn)XAC,賓語是反應(yīng)者XB,所以它們并不是非常序?qū)ο筚e語句,而屬于基本格式(!0)的作用反應(yīng)句X291J(!0X291J=XAC+X29+X2B)。(二)a、內(nèi)容c型這類語句的v概念表示籠罩、覆蓋義,整句話表示某物完全籠罩、覆蓋著某物或某處。一般應(yīng)出現(xiàn)兩個JK:籠罩、覆蓋的對象B和內(nèi)容C,即對象B+E+內(nèi)容C。其中,被覆蓋的內(nèi)容為廣義空間概念,實(shí)施作用的對象多為具體概念(如,效應(yīng)物“白雪”)。這類語句對應(yīng)于HNC的換位狀態(tài)句。a組句子是非常序?qū)ο筚e語句,b組是常式句(B+E+C),兩組句子在語義上是等值的,所以a類句子的格式代碼確定為!20。例如,“天空布滿烏云。”的句類表示式便是!20S02J=SC+S+SB。(四)自身轉(zhuǎn)移句句子的v概念一般表示轉(zhuǎn)移,這類語句表示某物、某人從哪出現(xiàn)、經(jīng)過或者去哪,涉及的兩個JK語義角色為對象B和轉(zhuǎn)移的果內(nèi)容C,一般對應(yīng)于HNC的自身轉(zhuǎn)移句。轉(zhuǎn)移者一定是pp、jw62或pw22b(交通工具),因?yàn)橹挥羞@些概念具有自身轉(zhuǎn)移的能力。自身轉(zhuǎn)移句的語義框架為“轉(zhuǎn)移者+轉(zhuǎn)移的動作+轉(zhuǎn)移相關(guān)的處所”,而非常序?qū)ο筚e語句的格式代碼定為!20后,與這種框架是相合的。下面的a組例句即是非常序?qū)ο筚e語句,b組例句是自身轉(zhuǎn)移句的基本格式。值得注意的是,有些句子不能主賓互易,如“班里走了一名同學(xué)”,可以說“一名同學(xué)從班里走了”(!11),但不能說“一名同學(xué)走了班里”。但!20T2b1J=TB1+T2b+TA作為“班里走了一名同學(xué)”的句類表示式已經(jīng)說明了各語義塊的語義角色。這類語句句首的空間類概念可以是轉(zhuǎn)移的起點(diǎn)、經(jīng)點(diǎn)或終點(diǎn)。三、處理非常序列對象的賓語短語的策略(一)句類結(jié)構(gòu)、語義結(jié)構(gòu)與位置時位句類是HNC給出的語句深層結(jié)構(gòu)的完備描述,以句類知識為指導(dǎo)的語句分析處理稱為句類分析。句類分析的基本策略是“中間切入,先上后下”,即以語義塊感知和句類假設(shè)為切入點(diǎn),再進(jìn)行句類檢驗(yàn),然后進(jìn)入語義塊構(gòu)成處理,這也被稱為句類分析“三部曲”。在語義塊感知和句類假設(shè)這個階段確定語句的格式代碼,主要依據(jù)是E塊的位置以及10概念(主語義塊標(biāo)志符)和11概念(輔語義塊標(biāo)志符)。但違例格式?jīng)]有語義塊切分標(biāo)志符,而且本文研究的語句E塊位于兩個JK之間,這和基本格式是一樣的。所以根據(jù)目前判定格式代碼的條件,在句類分析的第一個階段非常序?qū)ο筚e語句只能獲得基本格式!0,而由此確定的各JK的語義角色顯然是不合適的。句類檢驗(yàn)是檢驗(yàn)得到的語句表示式是否符合句類知識的預(yù)期。句類知識是人對句子的語義抽象的結(jié)果,是理解時機(jī)器擁有的預(yù)期知識。而主語成分同整個謂語部分發(fā)生語義關(guān)聯(lián),而賓語是同述語成分直接關(guān)聯(lián)的,賓語位置成分的語義內(nèi)涵要比主語位置成分的語義內(nèi)涵受限更多。所以非常序?qū)ο筚e語句的處理,首要依據(jù)的是E塊與其后JK語義塊之間的概念關(guān)聯(lián)知識。特征語義塊和廣義對象語義塊之間的關(guān)聯(lián)知識,在HNC語言知識庫中是@S項(xiàng)目的內(nèi)容。當(dāng)然這種關(guān)聯(lián)可以是強(qiáng)制性的,也可以只是優(yōu)先性的,而強(qiáng)制性預(yù)期更利于判斷。非常序?qū)ο筚e語句中E后的語義塊的概念類別往往和E塊預(yù)期的不同。在句類檢驗(yàn)階段,檢測到這種差異便可以激活相應(yīng)規(guī)則進(jìn)行格式代碼的調(diào)整,然后再進(jìn)一步進(jìn)行句類知識的檢驗(yàn)。例如“一鍋飯吃七個人”,“吃”作為v類概念,形成句類T21J(T21J=TA+T2+T2C)。在句類假設(shè)階段,只能獲得基本格式!0,在進(jìn)行句類檢驗(yàn)時,E塊后的T2C優(yōu)先人造物,這和“七個人”的p概念差別較大③3,于是將格式代碼調(diào)整為!20,調(diào)整后的T2C和TA可以通過與E的關(guān)聯(lián)知識檢驗(yàn)。(二)語義角色組成位于句首的處所類詞語是句子主體結(jié)構(gòu)的成員主語還是非必要成分狀語,在語言學(xué)界引起了一定的爭議。HNC也注意到語義塊充當(dāng)語義角色的這種不確定性,認(rèn)為輔語義塊和主語義塊并不是截然分開的,存在語義塊介于主輔之間的兩可語義塊。兩可語義塊的語義角色由句類決定:先假設(shè)表處所的語義塊為主塊,再根據(jù)句類的主塊個數(shù)以及各塊的語義優(yōu)先知識判定是兩可塊是主塊還是輔塊。表處所的語義塊是常見的兩可語義塊,本文第二部分所列的后四類非常序?qū)ο筚e語句都存在處所類詞語在句首的情況,并根據(jù)句類知識將這些語義塊處理為主塊。如果v類概念聯(lián)系的句類只有一個JK時,處所類成分就要處理成輔塊。如“門口站著一位姑娘”,E塊核心v“站”的句類代碼是S(SJ=SB+S),SB的概念優(yōu)先人p和動物jw63。所以p概念“姑娘”比空間類的“門口”更符合“站”對SB的預(yù)期,這樣“門口”便處理為參照輔塊Re,句子的句類表示式為!2SJ=E+SB。(三)對于非測值區(qū)的靜態(tài)審斷句和一般語義塊的預(yù)期知識省略是漢語較為常見的現(xiàn)象,主語在上下文中常會省略,句子的核心動詞有時也可以省略。非常序?qū)ο筚e語句也有E塊省略的情況,例如:一鍋飯十個人。一條凳子三個人。門口兩個警衛(wèi)。陽臺上兩個人。這些省略現(xiàn)象給計(jì)算機(jī)理解語言出了不小的難題,沒有了E塊,HNC句類分析的“三部曲”難以展開。于是HNC給出了四組無特征語義塊的句類(簡明狀態(tài)句S04J、簡明勢態(tài)句jD2J、集內(nèi)比較判斷句jD01J和參照比較判斷句Jd021J),每個句類均由對象語義塊B和內(nèi)容語義塊C構(gòu)成。這類語句的分析主要依靠句類對對象和內(nèi)容語義塊的預(yù)期知識來處理,其中最主要的是內(nèi)容語義塊的預(yù)期知識,內(nèi)容語義塊也是句類假設(shè)的切入點(diǎn)和關(guān)鍵。于是對于無E塊的非常序?qū)ο筚e語句的句類假設(shè)就成為四選一的處理。參照比較判斷句需要出現(xiàn)ljlv邏輯概念,集內(nèi)比較判斷句需要出現(xiàn)三個要素(比較的集合、比較對象和比較的表現(xiàn)),事態(tài)判斷句的內(nèi)容一般為u類概念,所以非常序?qū)ο筚e語句省略E后的句子為簡明狀態(tài)句S04J。從簡明狀態(tài)句的角度分析,內(nèi)容SC的預(yù)期知識概念是SC:Ph(j20);Ph(j41);Ph(194)(第二類條件),即SC一定是基本概念短語Ph(jy)或不定特指短語Ph(194),而且一般是空間短語Ph(j20)或數(shù)量短語Ph(j41)。基本概念短語是在句類分析的預(yù)處理階段構(gòu)造完成的,所以當(dāng)句子末尾發(fā)現(xiàn)一個基本概念短語,而且其類型滿足上述條件時,就能確定它是SC。一般優(yōu)先選擇句子末尾的語義塊進(jìn)行判斷,“十個人”“三個人”“兩個警衛(wèi)”顯然是符合簡明狀態(tài)句的SC預(yù)期知識,整個句子是簡明狀態(tài)句S04J,而句中的第一個語義塊就是SB④4。四、句類代碼的選擇非常序?qū)ο筚e語句是計(jì)算機(jī)理解的一大難點(diǎn),這反映了語序的靈活性和多樣性給語言信息處理帶來的挑戰(zhàn)。消解模糊是HNC對自然語言理解處理當(dāng)前階段的定位。為解決非常序?qū)ο筚e語句的理解問題,本文采取“以退為進(jìn)”的策略,不計(jì)了語句表達(dá)的部分語義信息,通過調(diào)整語序的方式實(shí)現(xiàn)對句義的消解模糊處理。值得一提的是,非常序?qū)ο筚e語句的E塊v類詞匯很多是單音節(jié)的,這類詞使用的頻率相對較高,詞義和用法也更為多樣、靈活,常常會連帶多個句類代碼。優(yōu)選句類代碼是句類檢驗(yàn)階段的主要工作,也是句類分析研究的重點(diǎn)和難點(diǎn)。本文的研究是建立在句類代碼確定的前提之下,集中于對格式代碼的討論,本文的研究也將對HNC句類分析器的進(jìn)一步完善具有一定的積極作用。HNC建立的句類體系(7種基本句類57種基本句類子類、混合句類、復(fù)合句類以及語句格式)基本是可以描述自然語言全貌的,本文對非常序?qū)ο筚e語句的研究也再次印證了HNC所提出的語句無限而句類有限的原則。計(jì)算機(jī)理解語言需要知識,本文的研究建立在HNC語言知識庫基礎(chǔ)上,也進(jìn)一步說明概念關(guān)聯(lián)(尤其是強(qiáng)制性關(guān)聯(lián))知識、違例格式信息對句類分析的重要性,從而對語言知識庫的建設(shè)具有一定的指導(dǎo)意義。a組句子的對象B出現(xiàn)在賓語位置上,是非常序?qū)ο筚e語句,b組是常式句(B+E+C),兩類句子表義相同且具有主賓易位的關(guān)系,所以a類句子的格式代碼確定為!20。例如,“大樓籠罩著晨霧”的句類表示式為!20S02J=SC+S+SB。(三)空間類概念的下裝這類句子表示某物充滿某物或某處。v概念激活的句類包括兩個JK語義塊:充滿的實(shí)施者B和被充滿的一方C,即實(shí)施方+充滿+被充滿方。被充滿的內(nèi)容為廣義空間概念,實(shí)施作用的對象多為具體概念,有時候也可以是抽象概念。這語句的E塊一般是一個雙音節(jié)詞或者“單音節(jié)詞+滿”的結(jié)構(gòu),這類語句基本對應(yīng)于HNC的換位狀態(tài)句。空間類概念是轉(zhuǎn)移的起點(diǎn)、經(jīng)點(diǎn)還是終點(diǎn)一般取決于E塊的核心v概念,但如果E塊有下裝成分,則下裝更多左右著空間類概念承擔(dān)的語義角色。如下裝為“出”時,空間類概念一般為轉(zhuǎn)移的起點(diǎn),句類為T2b1J;下裝為“過”時,空間類概念一般為轉(zhuǎn)移的經(jīng)點(diǎn),句類為T2b3J

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論