中文信息處理介紹教學(xué)課件_第1頁
中文信息處理介紹教學(xué)課件_第2頁
中文信息處理介紹教學(xué)課件_第3頁
中文信息處理介紹教學(xué)課件_第4頁
中文信息處理介紹教學(xué)課件_第5頁
已閱讀5頁,還剩97頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

中文信息處理介紹IntroductiontoChineseInformationProcessinYUShiwenZHUXuefeng中文信息處理介紹中文信息處理介紹IntroductiontoChineseInformationProcessinYUShiwenZHUXuefeng主要內(nèi)容中文信息處理概要>漢語信息處理的主攻方向綜合型語言知識(shí)庫介紹研究中的課題與CIP相關(guān)的信息結(jié)語與致謝北京大學(xué)計(jì)算語言學(xué)研宄所米主要內(nèi)容中文信息處理概要>漢語信息處理的主攻方向綜合型語言知識(shí)庫介紹研究中的課題與CIP相關(guān)的信息結(jié)語與致謝北京大學(xué)計(jì)算語言學(xué)研宄所主要內(nèi)容中文信息處理概要>漢語信息處理的主攻方向綜合型語言知識(shí)庫介紹研究中的課題與CIP相關(guān)的信息結(jié)語與致謝北京大學(xué)計(jì)算語言學(xué)研宄所米主要內(nèi)容中文信息處理概要>漢語信息處理的主攻方向綜合型語言知識(shí)庫介紹研究中的課題與CIP相關(guān)的信息結(jié)語與致謝北京大學(xué)計(jì)算語言學(xué)研宄所米相關(guān)的術(shù)語及其所指ChineseInformationProcessing(CIP)中文信息處理ChinesecharacterInformationProcessing漢字信息處理Chinesecharacter(IT)=Chineseideograph(Sinology)ChineselanguageInformationProcessing漢語信息處理NaturalLanguageProcessing(NLP)自然語言處理LanguageInformationProcessing語言信息處理(1)NLP/CIP(2)Chinese-centeredMulti-lingualInformationProcessing以漢語為核心的多語言信息處理北京大學(xué)計(jì)算語言學(xué)研宄所米相關(guān)的術(shù)語及其所指NaturalLanguageUnderstanding自然語言理解自然語言處理的最高境界Computationallinguistics計(jì)算語言學(xué)ABBYYHeadquartersv.selegey4bothlinguisticandcomputationalaspectsofChinesemodelingICL/PKU以文科學(xué)科命名,設(shè)在理科的信息科學(xué)技術(shù)學(xué)院,正好顯著地反映了文理交叉的特點(diǎn)北京大學(xué)計(jì)算語言學(xué)研宄所*“漢語信息處理”在研究什么?實(shí)用系統(tǒng)(1)人工系統(tǒng)的自然語言界面(問答系統(tǒng))(2)機(jī)器翻譯與機(jī)器輔助翻譯(3)信息檢索、信息提取與搜索引擎(4)文本管理(文本分類與聚類、文獻(xiàn)摘要與述評(píng)、0CR后處理)(5)詞典計(jì)算機(jī)輔助編纂(6)領(lǐng)域知識(shí)工程(術(shù)語提取、知識(shí)元數(shù)據(jù)庫、百科全書編撰)(7)語音接口技術(shù)(語音識(shí)別的后處理、語音合成的預(yù)處理)(8)自然語言處理系統(tǒng)評(píng)測技術(shù)(9)面向語言本體研究與語言教學(xué)的應(yīng)用漢語信息處理既立足于漢字信息處理,又區(qū)別于漢字信息處理處理對象不再是單個(gè)的漢字或字符串,而是語言學(xué)的單位:詞、短語、句子乃至篇章、文檔集合。兩者之間也有聯(lián)系:拼音漢字轉(zhuǎn)換、簡繁轉(zhuǎn)換、0CR后處理、文獻(xiàn)檢索、語音識(shí)別與合成等等北京大學(xué)計(jì)算語言學(xué)研究所關(guān)于“漢語信息處理”的基本認(rèn)識(shí)自然語言處理是數(shù)值型計(jì)算機(jī)在非數(shù)值領(lǐng)域最早的應(yīng)用(MT)。但在“自然語言理解”的層次上,至今沒有突破(1)依據(jù)對人類語言機(jī)制的認(rèn)識(shí)(2)語言既是對象,又是工具(3)依據(jù)對當(dāng)代計(jì)算機(jī)能力的認(rèn)識(shí)(4)依據(jù)NLP技術(shù)發(fā)展的歷史經(jīng)驗(yàn)漢語理解研究和其他語言一樣困難需要交流。希望與俄國同行交流在技術(shù)層面上,漢語信息處理又有特殊的課題。北京大學(xué)計(jì)算語言學(xué)研究所米主要內(nèi)容中文信息處理概要漢語信息處理的主攻方向綜合型語言知識(shí)庫介紹研究中的課題與CIP相關(guān)的信息結(jié)語與致謝北京大學(xué)計(jì)算語言學(xué)研宄所自然語言(漢語)理解的困難實(shí)例之關(guān)于自動(dòng)升降晾衣架的對話妻子:“嘿,過了一年才壞?!盬ife丈夫:“什么呀,才一年就壞了?!盚usband:丈夫理解了妻子的意思嗎?——虛詞詞義:才(數(shù)量詞前后,意義不同背景知識(shí):保修期知識(shí)激活機(jī)制?北京大學(xué)計(jì)算語言學(xué)研宄所*自然語言(漢語)理解的困難實(shí)例之二關(guān)于“沙漠化”的文章幾年前由于種植籽瓜有利可圖,使大批的種植者就到過渡帶來開

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論