機器翻譯和計算機輔助翻譯_第1頁
機器翻譯和計算機輔助翻譯_第2頁
機器翻譯和計算機輔助翻譯_第3頁
機器翻譯和計算機輔助翻譯_第4頁
機器翻譯和計算機輔助翻譯_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、機器翻譯和計算機輔助翻譯機器翻譯和計算機輔助翻譯 MT& CAT邵白楊 劉洋 劉娜 鄧雯 馬雪機器翻譯和計算機輔助翻譯機器翻譯機器翻譯機器翻譯(Machine Translation),又稱為自動翻譯,是利用計算機把一種自然源語言轉(zhuǎn)變?yōu)榱硪环N自然目標(biāo)語言的過程,它是自然語言處理(Natural Language Processing)的一個分支,與計算語言學(xué)(Computational Linguistics)、自然語言理解(Natural Language Understanding)之間存在著密不可分的關(guān)系。機器翻譯和計算機輔助翻譯一、機器翻譯簡史一、機器翻譯簡史機器翻譯的研究歷史

2、可以追溯到20世紀(jì)四五十年代,學(xué)界一般將其劃分為如下四個階段:1開創(chuàng)期(1946-1964) 1954年,美國喬治敦大學(xué)(Georgetown University)在IBM公司協(xié)同下,用IBM-701計算機首次完成了英俄機器翻譯試驗,向公眾和科學(xué)界展示了機器翻譯的可行性,從而拉開了機器翻譯研究的序幕。中國開始這項研究也并不晚,早在1956年,國家就把這項研究列入了全國科學(xué)工作發(fā)展規(guī)劃,課題名稱是“機器翻譯、自然語言翻譯規(guī)則的建設(shè)和自然語言的數(shù)學(xué)理論”。1957年,中國科學(xué)院語言研究所與計算技術(shù)研究所合作開展俄漢機器翻譯試驗,翻譯了9種不同類型的較為復(fù)雜的句子。從20世紀(jì)50年代開始到20世紀(jì)

3、60年代前半期,機器翻譯研究呈不斷上升的趨勢。機器翻譯和計算機輔助翻譯2受挫期(受挫期(1964-1975)1964年,為了對機器翻譯的研究進展作出評價,美國科學(xué)院成立了語言自動處理咨詢委員會(Automatic Language Processing Advisory Committee,簡稱ALPAC委員會),開始了為期兩年的綜合調(diào)查分析和測試。1966年11月,該委員會公布了一個題為語言與機器的報告(簡稱ALPAC報告),該報告全面否定了機器翻譯的可行性,并建議停止對機器翻譯項目的資金支持。這一報告的發(fā)表給了正在蓬勃發(fā)展的機器翻譯當(dāng)頭一棒,機器翻譯研究陷入了近乎停滯的僵局。無獨有偶,在此

4、期間,中國爆發(fā)了“十年文革”,基本上這些研究也停滯了。機器翻譯步入蕭條期。機器翻譯和計算機輔助翻譯3恢復(fù)期(恢復(fù)期(1975-1989)進入70年代后,隨著科學(xué)技術(shù)的發(fā)展和各國科技情報交流的日趨頻繁,國與國之間的語言障礙顯得更為嚴(yán)重,傳統(tǒng)的人工作業(yè)方式已經(jīng)遠遠不能滿足需求,迫切地需要計算機來從事翻譯工作。機器翻譯和計算機輔助翻譯4新時期:(新時期:(1990現(xiàn)在)現(xiàn)在)隨著Internet的普遍應(yīng)用,世界經(jīng)濟一體化進程的加速以及國際社會交流的日漸頻繁,傳統(tǒng)的人工作業(yè)的方式已經(jīng)遠遠不能滿足迅猛增長的翻譯需求,人們對于機器翻譯的需求空前增長,機器翻譯迎來了一個新的發(fā)展機遇。國際性的關(guān)于機器翻譯研究

5、的會議頻繁召開,中國也取得了前所未有的成就,相繼推出了一系列機器翻譯軟件,例如“譯星”、“雅信”、“通譯”、“華建”等。機器翻譯和計算機輔助翻譯 二二 機器翻譯的優(yōu)缺點機器翻譯的優(yōu)缺點弊端:很粗糙,使用者必須先作譯前編輯;相應(yīng)地會增加成本,進而導(dǎo)致成本高于人的翻譯。優(yōu)點:一、準(zhǔn)確無誤地完成了翻譯定額;二、譯文也將隨著語言學(xué)家和程序編制人員探索如何更好地處理語言而得到改進;三、成本也正在穩(wěn)定下降;四、有助于全世界的學(xué)者及時了解現(xiàn)代發(fā)展的情況。機器翻譯和計算機輔助翻譯機器翻譯當(dāng)前存在機器翻譯當(dāng)前存在的兩大突出問題的兩大突出問題:一、尚無法做到確認(rèn)不同講話人的等值語音二、在處理語義的組成部分上,仍有

6、問題機器翻譯和計算機輔助翻譯三三 機器翻譯的推動作用機器翻譯的推動作用推動社會的進步推動社會的進步 人類想盡一切辦法研制并完成了一個一個的機器翻譯系統(tǒng),開發(fā)了一個一個的翻譯軟件,推動了經(jīng)濟的發(fā)展,社會的進步,消除了世界人與人之間的語言障礙,溝通了整個世界,促進了交流,加快了全球化進程。提高翻譯效率提高翻譯效率 隨著機器翻譯研究水平不斷提高,翻譯領(lǐng)域也取得了前所未有的成就。在我們的翻譯工作中,我們可以借助各種翻譯系統(tǒng)或軟件完成翻譯任務(wù),這樣可以提高翻譯的速度和準(zhǔn)確度,提高了翻譯工作的效率。促進其他領(lǐng)域發(fā)展促進其他領(lǐng)域發(fā)展 機器翻譯涉足數(shù)學(xué)、計算機科學(xué)、語言學(xué)、翻譯學(xué)等多門學(xué)科領(lǐng)域,需要這些學(xué)科強

7、勁的發(fā)展,豐厚的成果作基礎(chǔ),從而促進了這些領(lǐng)域的發(fā)展。機器翻譯和計算機輔助翻譯四四 機器翻譯的前景:機器翻譯的前景:1、用計算機分析語言將在處理語言材料方面帶來重大變革2、計算機將使我們重新獲得控制現(xiàn)有各種語言中所可利用的大量情報的能力3、機器翻譯的研制成功,必將快速排除交流情報的障礙機器翻譯和計算機輔助翻譯計算機輔助翻譯計算機輔助翻譯計算機輔助翻譯(Computer aided translation,CAT)類似于CAD(計算機輔助設(shè)計),能夠幫助翻譯者優(yōu)質(zhì)、高效、輕松地完成翻譯工作。 它不同于以往的機器翻譯軟件,不依賴于計算機的自動翻譯,而是在人的參與下完成整個翻譯過程。與人工翻譯相比,

8、質(zhì)量相同或更好,翻譯效率可提高一倍以上。CAT使得繁重的手工翻譯流程自動化,并大幅度提高了翻譯效率和翻譯質(zhì)量。計算機輔助翻譯是一個廣泛的和不精確的術(shù)語,涵蓋了一系列的工具,從非常簡單到更復(fù)雜的。機器翻譯和計算機輔助翻譯機器翻譯和計算機輔助翻譯主要功能主要功能在翻譯過程中,存在著大量重復(fù)或相似的句子和片段。采用人工筆譯哪怕是最簡單的句子, 也需要書寫一遍。 CAT技術(shù)具有自動記憶和搜索機制,可以自動存儲用戶翻譯的內(nèi)容。當(dāng)用戶翻譯某個句子時,系統(tǒng)自動搜索用戶已經(jīng)翻譯過的句子,如果當(dāng)前翻譯的句子用戶曾經(jīng)翻譯過,會自動給出以前的翻譯結(jié)果;對于相似的句子,也會給出翻譯參考和建議。CAT是一個具有自學(xué)習(xí)功

9、能的軟件,它會隨著用戶的使用,學(xué)習(xí)新的單詞、語法和句型,為用戶節(jié)省更多的時間。CAT還配有增強工具CAM (Computer Aided Match),可將用戶以前翻譯過的資料轉(zhuǎn)換為可以重復(fù)使用的記憶庫。這樣,用戶就無需重復(fù)以前的勞動,從而提高翻譯速度和準(zhǔn)確性。機器翻譯和計算機輔助翻譯核心技術(shù)核心技術(shù)CAT技術(shù)的核心是翻譯記憶技術(shù),當(dāng)翻譯在不停地工作時,CAT則在后臺忙于建立語言數(shù)據(jù)庫。這就是所謂的翻譯記憶。每當(dāng)相同或相近的短語出現(xiàn)時,系統(tǒng)會自動提示用戶使用記憶庫中最接近的譯法。用戶可以根據(jù)自己的需要采用、舍棄或編輯重復(fù)出現(xiàn)的文本。機器翻譯和計算機輔助翻譯輔助功能輔助功能對于CAT技術(shù)來說,另

10、一個重要組成部分則是術(shù)語管理。廣義的說,翻譯中出現(xiàn)的任何詞匯,如果有重復(fù)使用的必要,都可以作為術(shù)語進行保存,保存的術(shù)語集合則成為術(shù)語庫。術(shù)語庫也可以重復(fù)利用,不僅僅是在本次翻譯,還可以在以后的項目或其他人的翻譯工作中重復(fù)使用,不但提高工作效率,更重要的是解決翻譯一致性問題。機器翻譯和計算機輔助翻譯當(dāng)前的翻譯機構(gòu)必須倚重翻譯技術(shù),越來越多的大中型翻譯機構(gòu)要求加盟的專職和兼職譯員掌握諸如Trados、Wordfast等主流的TM軟件機器翻譯和計算機輔助翻譯計算機輔助翻譯基本過程計算機輔助翻譯基本過程詞匯復(fù)用:系統(tǒng)提供大容量的專業(yè)詞庫,為用戶節(jié)省查詞典的時間,可自動進行詞頻記憶并按詞頻排序,用戶只要

11、點擊鼠標(biāo)或按快捷鍵即可完成句子翻譯。句子復(fù)用:采用先進的翻譯記憶( TM)技術(shù),把用戶翻譯的原文句子和譯文自動記憶到數(shù)據(jù)庫中。翻譯過程中,通過搜索引擎,自動查找記憶庫,對需要翻譯的內(nèi)容進行快速分析、對比,保證相同的句子永遠不要翻譯第二遍。機器翻譯和計算機輔助翻譯模糊匹配復(fù)用:一旦發(fā)現(xiàn)與記憶庫中例句相同或相似的句子,將根據(jù)與原文的匹配情況,系統(tǒng)自動給出翻譯建議,用戶可選擇自動匹配替換,直接得到翻譯結(jié)果,避免重復(fù)性勞動,提高工作效率。片段復(fù)用:如果當(dāng)前翻譯的句子與記憶庫中例句有相同的片段時,系統(tǒng)會給出提示,作為翻譯時的參考。機器翻譯和計算機輔助翻譯翻譯項目管理翻譯項目管理項目管理是多語翻譯和多語軟

12、件本地化項目的關(guān)鍵因素。術(shù)語詞庫準(zhǔn)備:在翻譯開始之前,項目經(jīng)理準(zhǔn)備術(shù)語詞庫和例句庫,由同一項目中的所有翻譯者共享。術(shù)語詞庫準(zhǔn)備可大大影響項目的成本,還可以統(tǒng)一用詞和相同句的譯法。材料接收和完成:翻譯者收到項目經(jīng)理所發(fā)來的需翻譯的材料和術(shù)語詞庫,就可用翻譯軟件打開文件,進行翻譯。翻譯時,翻譯者可使用翻譯記憶和術(shù)語詞庫,并不斷的把新的語言片斷加入到翻譯記憶中,也不斷把新的術(shù)語詞匯加入到詞庫中。翻譯完成后,翻譯者以目的語言代替源語言,建立一個與源語言文件布局完全一致的目的語言文件。再通過電子郵件的形式,發(fā)送給項目經(jīng)理。機器翻譯和計算機輔助翻譯隨著全球經(jīng)濟的發(fā)展和各國之間交流的增多,對語言翻譯的需求將會進一步增加。在這樣的背景下,如何更加高效、高質(zhì)的處理語言轉(zhuǎn)換已經(jīng)成為眾多機構(gòu)和公司共同關(guān)心的問題。計算機輔助翻譯技術(shù)正是在這種背景下應(yīng)運而生,它能夠幫助翻譯者優(yōu)質(zhì)、高效、輕松地完成翻譯工作。機器翻譯和計算機輔助翻譯前景前景翻譯產(chǎn)業(yè)化的重要途徑就是翻譯信息化,CAT技術(shù)的研究,就是為了適應(yīng)現(xiàn)代計算機技術(shù)在語言轉(zhuǎn)換、國際交流、本地化、國際化以及翻譯領(lǐng)域中的發(fā)展和應(yīng)用。但這一能夠使學(xué)生面對市場,面對競爭,面對未來的CAT技術(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論