框架網(wǎng)絡(luò)與語義句法聯(lián)系的表征_第1頁
框架網(wǎng)絡(luò)與語義句法聯(lián)系的表征_第2頁
框架網(wǎng)絡(luò)與語義句法聯(lián)系的表征_第3頁
框架網(wǎng)絡(luò)與語義句法聯(lián)系的表征_第4頁
框架網(wǎng)絡(luò)與語義句法聯(lián)系的表征_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

框架網(wǎng)絡(luò)與語義句法聯(lián)系的表征第1頁,課件共48頁,創(chuàng)作于2023年2月主要內(nèi)容一背景(格語法、框架語義學(xué))二框架網(wǎng)絡(luò)的目的

三框架網(wǎng)絡(luò)的用途四核心依從圖(副產(chǎn)品)第2頁,課件共48頁,創(chuàng)作于2023年2月Fillmore其人其成果格語法:1968。所謂的格語法并不是語法,而是一種語義模式,它旨在描述小句內(nèi)部語義結(jié)構(gòu)及其和句法的關(guān)系。1971模式一共有9個格。9個格按主語選擇等級排序為:施事格(Agent)、體驗格(Experiencer)、工具格(Instrument)、賓格(Object)、原格(Source)、終格(Goal)、位置格(Location)、時間格(Time)和受益格(Benefactive)。格可以有命題格(propositionalcase)和情態(tài)格(modalcase)之分.命題是小句的語義核心;情態(tài)表示小句的歸向、時間、方式等。命題格組成命題,是命題不可缺少的成分。情態(tài)格對小句語義來說是任意的。第3頁,課件共48頁,創(chuàng)作于2023年2月關(guān)于框架語義學(xué)1.框架語義學(xué)是用來理解及描寫詞語和語法結(jié)構(gòu)的意義的。2.語義框架提供詞語的意義在語言中存在以及在話語中使用的背景和動因。3.框架語義學(xué)的中心思想是詞的意義的描述必須與語義框架相聯(lián)系。4.框架語義學(xué)假設(shè),詞語可以通過它所在的語言結(jié)構(gòu),選擇和突出基本的語義框架的某些方面或某些實例,而這是以一定的方式(按照一定的原則)進行的。第4頁,課件共48頁,創(chuàng)作于2023年2月“偷”與“搶”原理:按照認(rèn)知語義學(xué)的觀點,動詞的詞義不僅包括能跟幾個語義角色和什么種類的語義角色相聯(lián)系,而且包括相關(guān)語義角色的“凸現(xiàn)”(prominence)情況。從認(rèn)知上講,凸現(xiàn)的事物是容易引起人注意的事物,也是容易記憶、容易提取、容易作心理處理的事物。對偷搶事件來說,遭偷搶的人所受的損害越大也就越凸現(xiàn);被偷搶的物越多越貴重也就越凸現(xiàn)。“偷”和“搶”雖然都跟一個施事、一個受事、一個奪事相聯(lián)系,但是語義角色的凸現(xiàn)情形有差別:一般情形下,對“偷”而言,偷竊者和失竊物是凸現(xiàn)角色,遭偷者相對是非凸現(xiàn)角色;而對“搶”而言,搶劫者和遭搶者是凸現(xiàn)角色,搶劫物相對是非凸現(xiàn)角色。第5頁,課件共48頁,創(chuàng)作于2023年2月“偷”[偷竊者遭偷者失竊物]“搶”[搶劫者

遭搶者搶劫物]這種區(qū)別首先是我們生活經(jīng)驗的一部分。我們的經(jīng)驗是:雖然都是受害者,遭搶者所受的損害要比遭偷者來得大。因此法律上搶劫罪比偷竊罪嚴(yán)重。遇到偷竊事件,失竊物是注意的中心:一個人在公共汽車上被偷了錢包,人們首先問他丟了多少錢。而遇到搶劫事件,遭搶者是注意的中心。當(dāng)聽到一個學(xué)生在學(xué)校附近遭劫,聽到這個消息后首先關(guān)心的是這個學(xué)生有沒有受到傷害,而不是被搶去多少錢。第6頁,課件共48頁,創(chuàng)作于2023年2月下面再看一個例子:商業(yè)交易框架TheCommercialTransactionFrame商業(yè)交易框架涉及的概念包括“possession”(領(lǐng)有),“changeofpossession”(給予,取得/收到),交易,錢?;究蚣茉匕∕oney,Goods,Buyer,Seller。外圍術(shù)語還包括,Price,時間特征,Change(找錢,即在償付與價格之間的差),等等。還有一些進一步可以闡述的術(shù)語,比如商品的真正主人和錢的真正主人,以及他們跟參與交易協(xié)議的參加者之間的差別。第7頁,課件共48頁,創(chuàng)作于2023年2月根據(jù)上述概念的結(jié)構(gòu)化組織,我們可以創(chuàng)建對一系列詞語的意義、用法和語法結(jié)構(gòu)的對比描述。比如:buy,sell,pay,spend,cost,charge,price,change,debt,credit,owe,merchant,clerk,broker,shop,merchandise,等等。通過混合商業(yè)交易框架跟其他框架,可以使文本不斷豐富。這樣可以描述諸如tip,bribe(賄賂),fee(酬金),honorarium(酬金),taxes(稅費),tuition(學(xué)費),以及其他許多許多詞語。為了以框架語義術(shù)語刻畫跟商業(yè)交易有關(guān)的一類詞語的性質(zhì),我們可以在我們的描述中提到Money,而不需要詳細(xì)描述錢幣,錢幣經(jīng)濟的社會制度,參與交易的人之間的合同的性質(zhì)等等類似事物。就我們的目的而言,我們僅需要假設(shè),用戶已經(jīng)知道,錢是什么,以及是干什么用的;換句話說,我們可以把它看作是“局部基本的”(localprimitive),在系統(tǒng)內(nèi)無須解釋。第8頁,課件共48頁,創(chuàng)作于2023年2月二框架網(wǎng)絡(luò)的目的1.能夠服務(wù)于自然語言處理的詞匯資源應(yīng)該至少包括以下一些類型:

(1)每一個詞元(lexicalunit)的意義的表征(從紙質(zhì)詞典中來)(定義模式的規(guī)則使獲取詞匯的其它類型的信息成為可能)(2)詞元間聯(lián)系的不同類型(同類詞詞典、通過共享詞干把詞元間的形態(tài)聯(lián)系建立起來)(3)一個詞與其它語言單元組合構(gòu)成短語和句子的能力的信息(核心項與依從項之間的句法聯(lián)系)(4)與某個詞相關(guān)的語義信息,這個信息可以用來解釋包含這個詞的短語的意義。(喚起語義信息arrest,即語義綜合的線索)第9頁,課件共48頁,創(chuàng)作于2023年2月二框架網(wǎng)絡(luò)的目的基于語料庫,根據(jù)框架語義學(xué)的理論,建立提供有關(guān)英語詞項(lexicalitem)的語義和句法信息的計算機詞典。第10頁,課件共48頁,創(chuàng)作于2023年2月第11頁,課件共48頁,創(chuàng)作于2023年2月三框架網(wǎng)絡(luò)的用途任務(wù)明確:(1)描述給定詞元所隸屬的概念結(jié)構(gòu)或者框架;(2)從語料庫中抽取包含某個詞的句子,并從中挑選能夠例示我們所要分析的具有某種給定意義的詞元的例子;(3)通過把與框架相關(guān)的標(biāo)簽指派到包含詞元的句子中的短語上,使挑選的句子得到注釋;(4)準(zhǔn)備最終的注釋總結(jié)報告,簡明顯示每個詞元在組合上的可能性;這些被稱作“配價描述”。第12頁,課件共48頁,創(chuàng)作于2023年2月框架網(wǎng)絡(luò)與“復(fù)仇(Revenge)”框架相關(guān)的詞包括:avenge(復(fù)仇),avenger(復(fù)仇者),getback(at)(實行報復(fù)),get_even(with)(和……算帳),retaliate(報仇),retribution(報應(yīng)),revenge(報仇,名詞),revenge(報仇,動詞),以及vengeance(報仇)。“復(fù)仇(Revenge)”必須與為了回應(yīng)某個不應(yīng)該的遭受而施加的某種懲罰相關(guān)。一個“復(fù)仇者(avenger)”對一個“冒犯者(offender)”施加某種“懲罰(punishment)”,以回應(yīng)冒犯者早期所做的壞事,即某種“傷害(injury)”。

第13頁,課件共48頁,創(chuàng)作于2023年2月請看下列包含“Revenge(復(fù)仇)”框架詞元的做了標(biāo)注的例句:1.[Ethelavenger]eventuallygoteven[withMildredoffender][fortheinsulttoEthel'sfamilyinjury][Ethel復(fù)仇者]最終報仇[向Mildred冒犯者][為了侮辱對Ethel的家傷害]Ethel最終向侮辱她家的Mildred報了仇。第14頁,課件共48頁,創(chuàng)作于2023年2月2.Whyhadn't[heavenger]soughttoavenge[hischildinjuredparty]?

為什么還沒有[他復(fù)仇者]試圖為……報仇[他的孩子被傷害方]?

他為什么還沒有試圖為他的孩子報仇?4.TheOldBaileywastold[heavenger]wasdesperatelyinloveandwantedtogetback[atthewomanoffender]["forendingtheirrelationship"injury]

那個老Bailey據(jù)說[他復(fù)仇者]是絕望地在愛中并且想復(fù)仇[向那個女人冒犯者][“因為結(jié)束他們的關(guān)系”傷害]

據(jù)說,那個老Bailey在戀愛中絕望,并且想向那個結(jié)束他們戀愛關(guān)系的女人復(fù)仇。第15頁,課件共48頁,創(chuàng)作于2023年2月注釋結(jié)果我們研究已注釋了的句子以及這些句子的配價模式的主要工具是兩個自動生成的以網(wǎng)絡(luò)為基礎(chǔ)的報告,它們可以從公共網(wǎng)頁上獲得。這兩個工具被稱作詞元注釋報告(AnnotationbyLexUnitReport)和詞條報告(LexicalEntryReport)。圖1是“復(fù)仇(Revenge)”框架中詞元avenge的注釋報告,它展示了一個給定詞元的所有已注釋的句子。該報告的上部是此框架中所有框架元素的列表,被稱為框架元素表(FrameElementTable)。盡管該報告復(fù)制得不太清楚,但是已注釋的句子中的框架元素與框架元素表中框架元素的顏色相同,顯得很突出。

第16頁,課件共48頁,創(chuàng)作于2023年2月第17頁,課件共48頁,創(chuàng)作于2023年2月詞條報告以兩個表格的形式總結(jié)框架元素的句法實現(xiàn)以及詞元的配價模式。圖2是詞元avenge

的句法實現(xiàn)表,它展示了所有核心框架元素、被注釋的例子的數(shù)目以及它們的句法實現(xiàn)。第18頁,課件共48頁,創(chuàng)作于2023年2月第19頁,課件共48頁,創(chuàng)作于2023年2月圖3是詞元avenge的第二張詞條報告表,它例示了一個給定詞元的配價可能性情況。

第20頁,課件共48頁,創(chuàng)作于2023年2月第21頁,課件共48頁,創(chuàng)作于2023年2月框架之間的關(guān)系最為簡單的聯(lián)系是“繼承(Inheritance)”。在較概括的框架與較具體的框架這二者的繼承關(guān)系中,母框架的所有特征在子框架中都會有所體現(xiàn)。大多數(shù)表示純粹繼承關(guān)系的例子都是詞匯方面的細(xì)節(jié)框架,對它們的細(xì)化程度比通常的做法要高,如:“遺贈”(bequeathing)是“給予”(giving)的子類,“說閑話”(gossiping)是“說話”(speaking)的子類,“昂首闊步”(swaggering)是“走”(walking)的子類。它們當(dāng)中的“子”概念都是相應(yīng)“母”概念意義的一個細(xì)節(jié)體現(xiàn)。第22頁,課件共48頁,創(chuàng)作于2023年2月四核心依從圖目的:當(dāng)一個詞項內(nèi)嵌在一個其組成部分被周圍的成分隔開或者擴充的復(fù)雜句中時,要想識別這個詞項的組成成分中的核心經(jīng)常是困難的。這時我們定義了一種標(biāo)志方法,這種方法可以通過那些無關(guān)成分看到實質(zhì)。這就是“核心依從圖”。

第23頁,課件共48頁,創(chuàng)作于2023年2月隨著機器在學(xué)習(xí)識別框架和框架元素方面的進步,從粗文本中抽取核心依從圖有一天會成為可能。動因:第一個是純粹的語言學(xué)方面的,與人們感興趣的搭配有關(guān)。核心依從圖可以看作是語料庫中“詞匯-句法”搭配的表征,即:文本中彼此處于語法結(jié)構(gòu)當(dāng)中的詞元之間的(句法)聯(lián)系。第二個原因是,通過抽取句子中最凸現(xiàn)的核心依從圖,能夠發(fā)現(xiàn)其所在篇章段落的語義線索。第24頁,課件共48頁,創(chuàng)作于2023年2月1.推導(dǎo)簡單的核心依從圖

Death:“Trumandied“(杜魯門死了)第25頁,課件共48頁,創(chuàng)作于2023年2月

Ingestion:"Thepuppydrankthemilk"第26頁,課件共48頁,創(chuàng)作于2023年2月Showing:"Theprofessordemonstratedtheprooftotheclass"第27頁,課件共48頁,創(chuàng)作于2023年2月Commerce_buy:Thecompany'spurchaseofitsownstockcameasasurprise"第28頁,課件共48頁,創(chuàng)作于2023年2月Similarity:"Carvingchiselsaresimilartocarpentrychisels"第29頁,課件共48頁,創(chuàng)作于2023年2月2.包含缺位填充的核心依從圖

Ingestion:"Everybodysuspectedthepuppyofhavingdrunkthemilk"第30頁,課件共48頁,創(chuàng)作于2023年2月Suspicion:"Everybodysuspectedthepuppyofhavingdrunkthemilk"第31頁,課件共48頁,創(chuàng)作于2023年2月Killing:"Themantriedtokillmyfather"第32頁,課件共48頁,創(chuàng)作于2023年2月Attempt:"Themantriedtokillmyfather"第33頁,課件共48頁,創(chuàng)作于2023年2月

Hiring:"theteam’sdesiretosigntheplayer"第34頁,課件共48頁,創(chuàng)作于2023年2月Desiring:"theteam’sdesiretosigntheplayer"第35頁,課件共48頁,創(chuàng)作于2023年2月

Becoming_aware:"Theinvestigatorsfoundthepuppydead"第36頁,課件共48頁,創(chuàng)作于2023年2月Dead_or_alive:"Theinvestigatorsfoundthepuppydead"第37頁,課件共48頁,創(chuàng)作于2023年2月3.支撐動詞

Desiring:"Theteamhasthedesiretosigntheplayer"第38頁,課件共48頁,創(chuàng)作于2023年2月Appreciation:"Theaudiencegavethespeakerastandingovation"第39頁,課件共48頁,創(chuàng)作于2023年2月4.零形式框架元素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論