第二組《勒曼談機(jī)器翻譯》_第1頁(yè)
第二組《勒曼談機(jī)器翻譯》_第2頁(yè)
第二組《勒曼談機(jī)器翻譯》_第3頁(yè)
第二組《勒曼談機(jī)器翻譯》_第4頁(yè)
第二組《勒曼談機(jī)器翻譯》_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

外12級(jí)11班李佩1204021134趙思雨1204021130從《勒曼談機(jī)器翻譯》出發(fā)談機(jī)器翻譯機(jī)器翻譯的概念機(jī)器翻譯的發(fā)展道路

機(jī)器翻譯方法簡(jiǎn)介

機(jī)器翻譯存在的問題關(guān)于機(jī)器翻譯的幾點(diǎn)思考目錄(一)概念理解機(jī)器翻譯(machinetranslation),又稱為自動(dòng)翻譯,是利用計(jì)算機(jī)把一種自然源語言轉(zhuǎn)變?yōu)榱硪环N自然目標(biāo)語言的過程,一般指自然語言之間句子和全文的翻譯。機(jī)器翻譯的概念·很久以來,人們就夢(mèng)想著有朝一日,能造出一種設(shè)備,清除人類交流過程中的“語言障礙”,使得使用不同語言的人能自由地相互交流?!ぴ诋?dāng)代信息社會(huì),語言障礙問題更加突出。大量的政府文件、商業(yè)以及科技資料都需要在短時(shí)期內(nèi)得到翻譯,互聯(lián)網(wǎng)的問世更是擴(kuò)大了翻譯需求。機(jī)器翻譯應(yīng)運(yùn)而生。(二)產(chǎn)生(四)工作原理機(jī)器翻譯的原理簡(jiǎn)單地說就是讓機(jī)器模擬人的翻譯過程。

----《中國(guó)的機(jī)器翻譯》在存儲(chǔ)器中存儲(chǔ)機(jī)器詞典和機(jī)器與法查詞典選擇所需要意義明確各個(gè)詞間的關(guān)系組成譯文翻譯時(shí)翻譯前(三)可實(shí)現(xiàn)性·機(jī)器翻譯之可能實(shí)現(xiàn),還在于語言的可譯性和翻譯工作的可模擬性。

----《中國(guó)的機(jī)器翻譯》·一種語言有許多句子可以很容易地作為整個(gè)單位譯成另一種語言。----《勒曼談機(jī)器翻譯》機(jī)器翻譯的概念???機(jī)器翻譯是語言學(xué)、數(shù)學(xué)、計(jì)算機(jī)技術(shù)、自動(dòng)化等科學(xué)部門共同研究的對(duì)象。----《中國(guó)的機(jī)器翻譯》(三)涉及領(lǐng)域提供詞典和語法則研制便于翻譯的計(jì)算機(jī)解決外部設(shè)備問題語言學(xué)工作者自動(dòng)化工作者將材料代碼化和程序化機(jī)器翻譯的概念數(shù)學(xué)工作者計(jì)算機(jī)工作者機(jī)器翻譯的發(fā)展道路開創(chuàng)期(1947-1964)受挫期(1964-1975)恢復(fù)期(1975-1989)新時(shí)期(1990至今)發(fā)展道路1954年,美國(guó)喬治敦大學(xué)在IBM公司協(xié)同下,用IBM-701計(jì)算機(jī)首次完成了英俄機(jī)器翻譯試驗(yàn),拉開機(jī)器翻譯研究的序幕?!?964年,美國(guó)科學(xué)院成立了語言自動(dòng)處理咨詢委員會(huì)?!?966年11月,該委員會(huì)公布了一個(gè)題為《語言與機(jī)器》的報(bào)告,建議停止對(duì)機(jī)器翻譯項(xiàng)目的資金支持。開創(chuàng)期(1947-1964)受挫期(1964-1975)恢復(fù)期(1975-1989)新時(shí)期(1990至今)發(fā)展道路·國(guó)與國(guó)之間的語言障礙顯得更為嚴(yán)重,傳統(tǒng)的人工作業(yè)方式已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足需求?!び?jì)算機(jī)科學(xué)、語言學(xué)研究的發(fā)展,從技術(shù)層面推動(dòng)了機(jī)器翻譯研究的復(fù)蘇,機(jī)器翻譯項(xiàng)目又開始發(fā)展起來·人們對(duì)于機(jī)器翻譯的需求空前增長(zhǎng),機(jī)器翻譯迎來了一個(gè)新的發(fā)展機(jī)遇,國(guó)際性的關(guān)于機(jī)器翻譯研究的會(huì)議頻繁召開?!ぴ谑袌?chǎng)需求的推動(dòng)下,商用機(jī)器翻譯系統(tǒng)邁入了實(shí)用化階段,走進(jìn)了市場(chǎng),來到了用戶面前。機(jī)器翻譯的發(fā)展道路《勒曼談機(jī)器翻譯》機(jī)器翻譯設(shè)想語言模式和理論程序編制機(jī)器翻譯方法分類基于規(guī)則的機(jī)器翻譯基于統(tǒng)計(jì)的機(jī)器翻譯基于實(shí)例的機(jī)器翻譯機(jī)器翻譯的方法簡(jiǎn)介《勒曼談機(jī)器翻譯》語言的語法和詞典是能夠規(guī)范得十分完善是計(jì)算機(jī)能夠利用它們。一、機(jī)器翻譯設(shè)想語言學(xué)家必須精確地規(guī)定計(jì)算機(jī)所遵循的程序和它處理的語言材料的程序必須制定一種語言模式和理論所涉及語言的語法所涉及語言的詞典《勒曼談機(jī)器翻譯》二、語言的模式和理論語言的主要困難也許就是以一系列不同平面或?qū)哟涡问匠霈F(xiàn)的語言結(jié)構(gòu),語言學(xué)家常把這種結(jié)構(gòu)稱作層次結(jié)構(gòu)。例1.逐詞譯法源語言(德語)目標(biāo)語(英語)DiesekurzegemeinsameüberlegungisteineArtExperientmitunsselbstgewesen.Thisshortjointreflectionhasbeenakindofexperimentwithourselves.Hasakindofjointexperimentwithourselvesbeen.(逐詞譯法)例2.《勒曼談機(jī)器翻譯》/s/與/z/在語言不同部分的作用1)在語音系統(tǒng)中2)在語法系統(tǒng)中zip/s//z/sipprice/s/prize/z/可數(shù)名詞復(fù)數(shù):dogs/z/cats/s/第三人稱單數(shù):Hetakes/s/BusNo.4toschool.

Hebuys/z/asinglenewshirteachmonth./s/和/z/是不同的項(xiàng)目/s/和/z/在某些情況下是等值的語言的不同部分中同一項(xiàng)的作用是有差別的例3.《勒曼談機(jī)器翻譯》動(dòng)詞go的意義2)He’sgoingtomorrow.3)He’sgoingsteady.1)He’sgoingtotown.Heisbeinginlove.走,離開為了簡(jiǎn)單的說明意義上的差別,可以比照語音層次和語法層次,設(shè)置語義層次和語法層次?!独章剻C(jī)器翻譯》美國(guó)德克薩斯大學(xué)語言研究中心的分析系統(tǒng)和程序編制系統(tǒng),就是把語言看做層次體系的。詞匯層次語義層次句法層次處理語言的單詞把形式單位聚合在一起把單詞彼此加以聯(lián)系例4.美國(guó)德克薩斯大學(xué)語言研究中心三、程序編制《勒曼談機(jī)器翻譯》裝置一裝置二裝置四裝置三處理計(jì)算機(jī)所提出的要求(接收器)處理要加工的語言材料處理計(jì)算機(jī)所產(chǎn)生和存儲(chǔ)的語言把對(duì)材料的分析與第二種語言所期望的分析相匹配聽進(jìn)語言材料同語言知識(shí)相匹配程序的兩個(gè)目的:1)對(duì)材料按詞匯、句法和語義等不同層次加以分析2)把這種分析通第二種語言所期望的分析相匹配目的一目的二《勒曼談機(jī)器翻譯》小結(jié)·《勒曼談機(jī)器翻譯》一文談到了機(jī)器翻譯的可實(shí)現(xiàn)性及其在文學(xué)作品翻譯方面的局限性。·文章用簡(jiǎn)潔生動(dòng)的語言介紹了機(jī)器翻譯的設(shè)想依據(jù)、機(jī)器翻譯對(duì)語言的要求、程序的編制等問題?!さ恼聦?duì)機(jī)器翻譯方法的分類和技術(shù)處理等具體問題的介紹仍有不足之處。機(jī)器翻譯方法分類基于規(guī)則的方法(SBMT)基于實(shí)例的方法(EBMT)基于規(guī)則的方法(RBMT)基于語料庫(kù)方法(CBMT)機(jī)器翻譯的方法(MachineTranslation/MT)機(jī)器翻譯方法分類--RBMT·基于規(guī)則的機(jī)器翻譯方法把翻譯過程看作是一個(gè)在語言學(xué)知識(shí)引導(dǎo)下的符號(hào)變換過程。這種方法要求把有關(guān)源語言和目標(biāo)語言的知識(shí)以計(jì)算機(jī)可以操作(“看懂”)的形式表示出來。--《機(jī)器翻譯與語言研究》一、基于規(guī)則的方法·基于規(guī)則的機(jī)器翻譯方法,主要是依靠語言學(xué)家總結(jié)歸納的語言翻譯規(guī)則庫(kù),對(duì)源語言的句子進(jìn)行語法、句法和詞法詞性分析,然后按照相應(yīng)的語法規(guī)則進(jìn)行判斷和推導(dǎo),最后生成等價(jià)的目標(biāo)語言語句,得出翻譯結(jié)果。--《基于實(shí)例機(jī)器翻譯方法_EBMT_的分析與探究》(一)概念理解機(jī)器翻譯方法分類(二)RBMT翻譯過程機(jī)器翻譯方法分類--RBMT源語言的分析轉(zhuǎn)換目標(biāo)語的生成(三)實(shí)例分析1)源語言的詞法分析2)源語言詞串的句法分析分析3)源語言到目標(biāo)語言的句法結(jié)構(gòu)轉(zhuǎn)換4)目標(biāo)語言結(jié)構(gòu)的調(diào)整5)源語言文本單詞的譯詞選擇6)目標(biāo)語言詞串的生成以把“她把一束花放在桌上?!弊g為英語為例分析轉(zhuǎn)換生成機(jī)器翻譯方法分類--RBMT1)源語言的詞法分析這一階段利用源語言詞匯層面的知識(shí),識(shí)別出源語言文本字符串中的單詞,并從詞典中獲得每個(gè)單詞的句法語義知識(shí),以備在后續(xù)處理中使用。她把一束花放在桌上。rpmqnvpngfw代詞介詞數(shù)詞量詞名詞動(dòng)詞介詞名詞性語系方位詞標(biāo)點(diǎn)符號(hào)機(jī)器翻譯方法分類--RBMT2)源語言詞串的句法分析分析為得到句法結(jié)構(gòu)以及跟結(jié)構(gòu)相關(guān)的特征結(jié)構(gòu),這一階段的處理需要運(yùn)用句法層面的知識(shí),指明了短語的組成關(guān)系。她把一束花放在桌上。rpmqnvpngfwspvpppnpmpnpppvpnpdjzj機(jī)器翻譯方法分類--RBMT3)源語言到目標(biāo)語言的句法結(jié)構(gòu)轉(zhuǎn)換結(jié)構(gòu)轉(zhuǎn)換主要利用源語言結(jié)構(gòu)和目標(biāo)語言結(jié)構(gòu)之間的對(duì)應(yīng)關(guān)系進(jìn)行,通過一組轉(zhuǎn)換規(guī)則的指導(dǎo)把源語言的句法樹轉(zhuǎn)換成目標(biāo)語言的句法樹。源語言目標(biāo)語機(jī)器翻譯方法分類--RBMT4)目標(biāo)語言結(jié)構(gòu)的調(diào)整通常經(jīng)過結(jié)構(gòu)轉(zhuǎn)換得到的句法結(jié)構(gòu)還保留著源語言結(jié)構(gòu)的諸多痕跡,尚需根據(jù)目標(biāo)語言的句法知識(shí)對(duì)該結(jié)構(gòu)進(jìn)行調(diào)整源語言目標(biāo)語機(jī)器翻譯方法分類--RBMT(三)RBMT的優(yōu)點(diǎn)和缺點(diǎn)1.規(guī)則的主觀性強(qiáng),規(guī)則的一致性難以保障;2.知識(shí)獲取難、工作量大;3.不利于系統(tǒng)擴(kuò)充,尤其對(duì)非規(guī)范的特殊語言現(xiàn)象缺乏新理論和新方法相應(yīng)的處理能力。1.不同語種在語法上的相似依存度很低、處理能力較強(qiáng);2.具有對(duì)知識(shí)表達(dá)的抽象程度高、代表性強(qiáng)的特點(diǎn);3.對(duì)文法結(jié)構(gòu)具有很強(qiáng)的保持能力;

機(jī)器翻譯方法分類--SBMT二、基于統(tǒng)計(jì)的方法(一)概念理解·SBMT是一種間接地使用語料庫(kù)的機(jī)器翻譯方法,將語料庫(kù)作為獲取翻譯規(guī)則信息的依據(jù),通過相關(guān)概率的計(jì)算,使用純數(shù)學(xué)的方法對(duì)待譯文本進(jìn)行“翻譯”(轉(zhuǎn)換)。

----《基于實(shí)例英漢翻譯系統(tǒng)研究與實(shí)現(xiàn)》·思想萌芽——Weaver發(fā)表的以《翻譯》為題的備忘錄中就提出:“當(dāng)我閱讀一篇用俄語寫的文章的時(shí)候,我可以說,這篇文章實(shí)際上是用英語寫的,只不過它是用另外一種奇怪的符號(hào)編了碼而已,當(dāng)我在閱讀時(shí),我是在進(jìn)行解碼。”機(jī)器翻譯方法分類--SBMT·基于統(tǒng)計(jì)的機(jī)器翻譯方法無需人工編寫規(guī)則,直接從語料庫(kù)中學(xué)知識(shí),并將這些知識(shí)應(yīng)用到句子的翻譯中。--《基于雙語句法短語的統(tǒng)計(jì)機(jī)器翻譯研究》(二)SBMT分類基于統(tǒng)計(jì)的機(jī)器翻譯方法大體上分為以下三類基于平行概率語法的統(tǒng)計(jì)機(jī)器翻譯方法基于信源信道模型的統(tǒng)計(jì)機(jī)器翻譯方法基于最大嫡的統(tǒng)計(jì)機(jī)器翻譯方法機(jī)器翻譯方法分類--RBMT基本思想是——把機(jī)器翻譯看成是一個(gè)信息傳輸?shù)倪^程,用一種信源信道模型對(duì)機(jī)器翻譯進(jìn)行解釋。(二)基于信源信道模型的統(tǒng)計(jì)機(jī)器翻譯方法S噪聲信道T源語言目標(biāo)語言輸入輸出機(jī)器翻譯方法分類--SBMT(三)SBMT的優(yōu)點(diǎn)和缺點(diǎn)1.資源豐富,易于實(shí)現(xiàn);2.良好的統(tǒng)計(jì)翻譯模型能夠融合更多的句法結(jié)構(gòu)和語義、語法信息;3.統(tǒng)計(jì)機(jī)器翻譯的翻譯性能可通過大規(guī)模語料訓(xùn)練進(jìn)行改善。1.系統(tǒng)運(yùn)行消耗的資源巨大,需要大規(guī)模雙語平行語料庫(kù)進(jìn)行訓(xùn)練學(xué)習(xí),語料的選擇和處理工程量也很巨大。機(jī)器翻譯方法分類--EBMT二、基于實(shí)例的方法·思想萌芽——長(zhǎng)尾真指出:“人類在翻譯一個(gè)簡(jiǎn)單句子的時(shí)候,并不會(huì)作深層次的語法分析,而是首先將源語句適當(dāng)?shù)胤譃槿舾啥陶Z片段然后再把這些短語翻譯成目標(biāo)語言,最后把翻譯好的短語片段恰當(dāng)?shù)亟M合成為一個(gè)句子。而對(duì)每一個(gè)短語片段則是用相應(yīng)的例子作為參考,通過類推原則進(jìn)行翻譯的?!蹦7氯祟惙g外語過程中的基本模式將源語句分解為短語片段并在一個(gè)實(shí)例庫(kù)的基礎(chǔ)上對(duì)其進(jìn)行匹配確定這些短語片段所對(duì)應(yīng)的目標(biāo)語言的短語片將翻譯好的目標(biāo)語言的短語片段進(jìn)行適當(dāng)重組,構(gòu)成一個(gè)完整的目標(biāo)語言句子(一)概念理解機(jī)器翻譯方法分類--EBMT(二)基本原理·EBMT在譯文轉(zhuǎn)換時(shí),從實(shí)例庫(kù)中搜索出一個(gè)與輸入句最相似的例句,并仿照實(shí)例庫(kù)中例句的翻譯方式進(jìn)行輸入句的翻譯。源語言S最相似句S’模擬S’的譯語T’構(gòu)成S的譯語T·一種語言中的任何一個(gè)句子都有可能是另外一種語言中某個(gè)句子的譯文,只不過可能性大小不同,而取可能性最大的那個(gè)譯文應(yīng)該是風(fēng)險(xiǎn)最小的?!痘谡Z義語言機(jī)器翻譯系統(tǒng)的若干問題的研究》機(jī)器翻譯方法分類--EBMT(三)EBMT的優(yōu)點(diǎn)和缺點(diǎn)1.相似度計(jì)算困難;2.大規(guī)模獲取語言知識(shí)的代價(jià)非常大,對(duì)于詞法、語法和語義規(guī)則的概括難以全面。1、不需要編寫規(guī)則;2、系統(tǒng)容易維護(hù);3、容易產(chǎn)生高質(zhì)量譯文;4、需要的相關(guān)語言知識(shí)少。機(jī)器翻譯方法分類--小結(jié)小結(jié)·基于規(guī)則和基于語料庫(kù)的機(jī)器翻譯方法優(yōu)缺點(diǎn)各異,使用不同方法研制的機(jī)器翻譯系統(tǒng)的性能表現(xiàn)也不盡相同,對(duì)譯文質(zhì)量的保障程度深淺不一,翻譯精度也還不盡如人意?!と绾?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論