人工智能漢語框架語義技術(shù)標(biāo)注規(guī)范第1部分框架構(gòu)建_第1頁
人工智能漢語框架語義技術(shù)標(biāo)注規(guī)范第1部分框架構(gòu)建_第2頁
人工智能漢語框架語義技術(shù)標(biāo)注規(guī)范第1部分框架構(gòu)建_第3頁
人工智能漢語框架語義技術(shù)標(biāo)注規(guī)范第1部分框架構(gòu)建_第4頁
人工智能漢語框架語義技術(shù)標(biāo)注規(guī)范第1部分框架構(gòu)建_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

PAGE1PAGE2人工智能漢語框架語義技術(shù)標(biāo)注規(guī)范

第1部分:框架構(gòu)建范圍本文件規(guī)定了漢語框架的術(shù)語和定義、框架結(jié)構(gòu)、框架分類以及框架構(gòu)建流程。本文件適用于漢語框架數(shù)據(jù)構(gòu)建方開展框架創(chuàng)建活動。漢語框架數(shù)據(jù)需求方對框架數(shù)據(jù)進行檢查、驗收或第三方機構(gòu)對框架數(shù)據(jù)進行評估的活動可參照執(zhí)行。規(guī)范性引用文件本文件沒有規(guī)范性引用文件。術(shù)語和定義下列術(shù)語和定義適用于本文件。圖式化場景人類認(rèn)識或理解客觀世界的認(rèn)知結(jié)構(gòu)??蚣軐Ω拍罱Y(jié)構(gòu)、實踐經(jīng)驗、信仰習(xí)俗等的圖式化表示。框架語義以框架為形式的語言意義。義項詞的某種特定意義。目標(biāo)詞具體句子中能夠激起框架的詞。語義角色目標(biāo)詞和其他語言成分間的語義關(guān)系的標(biāo)簽。框架元素框架語義場景中的參與者、工具等要素,包括核心框架元素與非核心框架元素。核心框架元素框架語義場景中在概念和邏輯上必不可少的語義角色,如謂詞的主語、賓語。非核心框架元素框架語義場景中在概念和邏輯上非必要的外圍語義角色,如時間、空間、環(huán)境條件、原因、目的等。詞元詞形與特定義項的組合對,即具有特定意義的詞。每個詞語可激起一個或者多個框架,但在具體的句子語境中,詞元只能激起某個特定的框架??蚣芙Y(jié)構(gòu)基本要素漢語框架的基本要素可分為框架、框架元素及詞元三部分,結(jié)構(gòu)如圖1所示。其中,框架包含框架中文名稱、框架英文名稱以及場景定義;框架元素包括中文名稱、英文名稱、縮寫、類型以及定義;詞元信息包括詞、詞性和例句。在一個漢語框架中,可以包含多個框架元素,以及多個詞元。漢語框架結(jié)構(gòu)框架名稱應(yīng)對框架語義場景進行簡潔、準(zhǔn)確的描述,并同時具備中文名稱和英文名稱:框架中文名稱命名原則:名稱應(yīng)準(zhǔn)確指稱圖示化場景;字符長度應(yīng)適宜。框架英文名稱命名原則:應(yīng)遵循框架中文名稱命名原則;首字母應(yīng)大寫。場景定義應(yīng)用簡潔準(zhǔn)確的文字描述抽象的圖式化場景,對框架場景中的語義角色及其關(guān)系進行整體描述,可提供例句以幫助理解所定義框架??蚣茉刂形拿Q應(yīng)采用簡潔準(zhǔn)確的文字,概括命名圖示化場景中的語義角色。英文名稱應(yīng)采用框架元素中文名稱的對等詞來命名。英文名稱的首字母須大寫??s寫是對框架元素英文名稱進一步簡化,其英文字母須全部小寫。類型應(yīng)從概念和邏輯角度,根據(jù)其在語義場景中的必要性判斷是否屬于“核心框架元素”或“非核心框架元素”。定義應(yīng)采用簡潔明確的文字,概括描述框架場景中的語義角色。詞元應(yīng)是能激起框架的語言成分。詞元的詞性應(yīng)是動詞、名詞、形容詞等12種詞性之一,詞性定義與示例參見附錄A。框架分類事件類框架用于描述在特定時間發(fā)生的、包括行為、活動及狀態(tài)變化的框架,應(yīng)有助于分析事件發(fā)生的相關(guān)參與者、時間、地點及可能的后果,框架示例參見附錄B的表B.1~表B.3。關(guān)系類框架用于描述不同實體間的相互依存、聯(lián)接或互動關(guān)系的框架,應(yīng)強調(diào)它們之間的相關(guān)性,框架示例參見附錄B的表B.4~表B.6。狀態(tài)類框架用于描述實體在特定時間點的特定屬性、條件或特征的框架,應(yīng)著重于描述實體的瞬時情況和相關(guān)屬性,框架示例參見附錄B的表B.7~表B.9。實體類框架用于描述具體的實體,包括這些實體名稱、特征、類別、用途或相關(guān)屬性等信息,應(yīng)有助于系統(tǒng)性地組織和理解各種實體的本質(zhì)和特點,框架示例參見附錄B的表B.10~表B.12??蚣軜?gòu)建流程框架創(chuàng)建應(yīng)按照圖2所示流程進行實行,詳細示例參見附錄C1:收集語料:確立目標(biāo)詞并收集包含目標(biāo)詞的句子語料,應(yīng)盡可能多的收集數(shù)據(jù);分析語料:對句子語料進行句法分析,應(yīng)理解目標(biāo)詞的主語、賓語、定語、狀語等句法成分;歸納圖示場景:對句法成分進行語義層面分析并確立目標(biāo)詞語義的圖式化表示;確認(rèn)框架信息:通過圖式化場景中各個參與者/工具之間的靜態(tài)/動態(tài)關(guān)系以及前/背景關(guān)系,確定框架名稱、場景定義和框架元素;擴充詞元:收集歸納能激起該框架的其他詞語,擴充語義框架的詞元??蚣軇?chuàng)建流程圖

(資料性)

詞性定義及示例詞性定義及示例見表A.1。表A.1詞性列表詞性定義示例名詞表示人或事物名稱的詞。人、友誼、團體、今天、北京。動詞表示人或事物的動作、存在、變化的詞。走、笑、有、在、看。形容詞表示人或事物的性質(zhì)或狀態(tài)的詞。高、細、軟、白。數(shù)詞表示數(shù)目的詞。數(shù)詞連用或者加上別的詞,可以表示序數(shù)、分?jǐn)?shù)、倍數(shù)、概數(shù)。第一、八成、百分之五、一千倍、十六七。量詞表示人、事物或動作的單位的詞。尺、寸、斗、升、斤、兩、個。代詞代替名詞、動詞、形容詞、數(shù)量詞、副詞的詞,包括:人稱代詞,疑問代詞,指示代詞。人稱代詞:我、你、他;疑問代詞:誰、什么、哪兒;指示代詞:這、這里、這么。副詞修飾或限制動詞和形容詞,表示范圍、程度等,而一般不能修飾或限制名詞的詞。都、只、再三、屢次、很、更、越。介詞用在名詞、代詞或名詞性詞組的前面,合起來表示方向、對象等的詞。從、自、往、朝、在。連詞連接詞、詞組、句子或段落的詞。和、與、而且、但是、因為。助詞獨立性最差、意義最不實在的一種特殊的虛詞。包括:結(jié)構(gòu)助詞、時態(tài)助詞、語氣助詞、比況助詞。結(jié)構(gòu)助詞:的、地、得、所;時態(tài)助詞:了、著、過;語氣助詞:呢、嗎、吧、?。槐葲r助詞:似的、一樣。嘆詞表示強烈的感情以及用于招呼、應(yīng)答的詞。啊、哎、喲、哼。擬聲詞模擬事物的聲音的詞。轟、乒乓、叮咚。

(資料性)

框架分類示例事件類框架示例見表B.1~表B.3。表B.1【出生】框架——框架信息框架中文名稱框架英文名稱場景定義出生Being_born指孩子(通常指人類)的生命在特定的時間和地點開始??赡芴峒捌溆H屬。表B.2【出生】框架——框架元素信息中文名稱英文名稱縮寫類型框架元素定義孩子Childchild核心孩子表示可以自移動的新生物。親屬Relativesrelat非核心與孩子有親緣關(guān)系的個體,包括共同創(chuàng)造出孩子的男性和女性(父母親),以及在血統(tǒng)或者婚姻上與它們相關(guān)的個體。形容Sellerslr非核心孩子來到這個世界時的狀態(tài)。時間Timetime非核心出生事件發(fā)生的時間,通常用日期或年份表示。地點Placeplace非核心出生事件發(fā)生的地點。表B.3【出生】框架——詞元信息詞元詞性例句出生動詞新生兒在清晨時分出生,家人們喜悅不已。誕生動詞一個小生命在這個美好的世界誕生,帶來了無盡的希望。降生動詞貴子降生,全家歡慶,喜氣洋洋。關(guān)系類框架示例見表B.4~表B.6。表B.4【人際關(guān)系】框架——框架信息框架中文名稱框架英文名稱場景定義人際關(guān)系Personal_relationship該框架旨在表明個人和他人間的關(guān)系。其詞元既可以明確表述個人和他人間的關(guān)系,如“配偶”、“朋友”;也可以通過職業(yè)、身份暗含出個人和他人間關(guān)系的存在,如“丈母娘”、“老師”;還可以通過事件本身表明關(guān)系,如“結(jié)婚”。表B.5【人際關(guān)系】框架——框架元素信息中文名稱英文名稱縮寫類型框架元素定義伙伴1Partner_1partner_1核心關(guān)系中的伙伴在主動語態(tài)的句子中作動詞的主語,或是用作表語性形容詞?;锇?Partner_2partner_2核心關(guān)系中非域外論元的伙伴?;锇镻artnerspartners核心關(guān)系中伙伴雙方的聯(lián)合說明。形容Depictivedepic非核心對伙伴進行描述的形容性短語。時量Durationdura非核心關(guān)系的時間長短。B.6【人際關(guān)系】框架——詞元信息詞元詞性例句結(jié)婚動詞他們結(jié)婚二十載,彼此間的扶持見證了深厚的夫妻關(guān)系。未婚夫名詞她期待著與未婚夫共度未來的每一天,他們的關(guān)系充滿了愛與承諾。狀態(tài)類框架示例見表B.7~表B.9。表B.7【位置】框架——框架信息框架中文名稱框架英文名稱場景定義位置Being_located表示一個轉(zhuǎn)移體的固定位置的地點表B.8【位置】框架——框架元素信息中文名稱英文名稱縮寫類型框架元素定義地點Locationloc核心轉(zhuǎn)移體的一個代表性的具體的地點。處所Placeplace核心能夠代表轉(zhuǎn)移體的地點的一片地方。轉(zhuǎn)移體Themethm核心位于特殊位置的一個實體。時間Timetime非核心轉(zhuǎn)移體第一次出現(xiàn)在此處的時間。表B.9【位置】框架——詞元信息詞元詞性例句位于動詞該博物館位于城市的繁華地段,方便市民參觀。坐落動詞古老的城堡坐落在一座風(fēng)景秀麗的山丘上,俯瞰著整個小鎮(zhèn)。實體類框架示例見表B.10~表B.12。表B.10【小裝置】框架——框架信息框架中文名稱框架英文名稱場景定義小裝置Gizmo該框架的詞元包含的都是表示設(shè)備的常用詞,設(shè)備的用途或目的沒有被特定詞位的詞匯說明,但(通常)會被單獨表達出來。這些詞元多是通過物品的使用用途或其典型的使用者表達出來。表B.11【小裝置】框架——框架元素信息中文名稱英文名稱縮寫類型框架元素定義小裝置Gizmogiz核心具有特定用途的復(fù)雜工藝品。描述語Descriptordesc非核心小裝置的某個特點。能量源Power_sourcepwr_src非核心

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論