搭建屬于自己的機(jī)器翻譯系統(tǒng)_第1頁
搭建屬于自己的機(jī)器翻譯系統(tǒng)_第2頁
搭建屬于自己的機(jī)器翻譯系統(tǒng)_第3頁
搭建屬于自己的機(jī)器翻譯系統(tǒng)_第4頁
搭建屬于自己的機(jī)器翻譯系統(tǒng)_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、搭建屬于自己的機(jī)器翻譯系統(tǒng) MTI專業(yè)“技術(shù)小白”走進(jìn)小牛翻譯開源社區(qū)的心得搭建屬于自己的機(jī)器翻譯系統(tǒng)MTI專業(yè)“技術(shù)小白”走進(jìn)小牛翻譯開源社區(qū)的心得首先,自我介紹一下。我是一個MTI(翻譯碩士)專業(yè)、沒有計算機(jī)編程背景、沒有機(jī)器翻譯理論基礎(chǔ)的菜鳥,任職于一家網(wǎng)絡(luò)科技公司的市場部門,之前的工作中需要做些翻譯工作,有時候求助百度翻譯、有道翻譯等免費(fèi)的機(jī)器翻譯系統(tǒng)來解決問題,但是對于一些涉及我們商業(yè)機(jī)密的數(shù)據(jù),由于擔(dān)心泄密,只能借助于有道詞典查查詞,然后再自己形成翻譯結(jié)果。很早之前我就想,要是能有自己的機(jī)器翻譯系統(tǒng)就好了。我心目中的翻譯技術(shù)大牛、對外經(jīng)貿(mào)大學(xué)的崔啟亮老師曾在微博中給MTI的學(xué)生提建

2、議,“學(xué)好翻譯技術(shù),有前途。對于仍在迷茫MTI的同學(xué),我建議學(xué)機(jī)器翻譯設(shè)計與開發(fā),走出迷茫?!狈浅7浅P疫\(yùn)的是,我一個東大畢業(yè)的同學(xué)告訴我,東北大學(xué)自然語言處理實(shí)驗(yàn)室(國內(nèi)搞機(jī)器翻譯最好的團(tuán)隊(duì)之一)聯(lián)合沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司推出了“小牛翻譯開源社區(qū)”,社區(qū)中有一項(xiàng)內(nèi)容,就是教不懂機(jī)器翻譯的人學(xué)習(xí)“快速搭建自己的機(jī)器翻譯系統(tǒng)”。于是,我走進(jìn)社區(qū),按照社區(qū)里的相關(guān)說明,親身體驗(yàn)了搭建過程。下面,我想談?wù)勥@個被譽(yù)為“目前國內(nèi)首個以機(jī)器翻譯為核心的交流平臺”的菜鳥級用戶體驗(yàn)。小牛翻譯開源社區(qū)里提供了統(tǒng)計機(jī)器翻譯開源系統(tǒng)的全部代碼。我了解了一下,NiuTrans開源系統(tǒng)在國際上比較有名,據(jù)說是目前國際

3、上能夠支持統(tǒng)計機(jī)器翻譯模型最全的兩套統(tǒng)計機(jī)器翻譯系統(tǒng)之一(另一套是愛丁堡大學(xué)的Moses)。這些內(nèi)容對MT(機(jī)器翻譯)的專業(yè)學(xué)者應(yīng)該很有用吧,但是對于我這個非科班出身的人來說,其實(shí)會完全忽略這部分內(nèi)容。我還是講講我在社區(qū)里的真正收獲快速搭建實(shí)用的機(jī)器翻譯系統(tǒng)。一、搭建過程詳細(xì)說明需要說明的是,我是在在網(wǎng)頁指導(dǎo)與人工指導(dǎo)下才在自己的電腦(Windows7 64位系統(tǒng),硬盤500G,內(nèi)存8G)上成功搭建機(jī)器翻譯系統(tǒng)的。解釋一下為什么我不僅看了網(wǎng)頁上操作指導(dǎo),還需要人工指導(dǎo)。身為“技術(shù)小白”的我,雖然網(wǎng)頁上的操作指導(dǎo)寫的很規(guī)范,但是第一次接觸這么“高大上”的東西,還是有點(diǎn)小緊張的。于是,我加入了小牛

4、翻譯開源社區(qū)的QQ群(群號451967838),聯(lián)系了群主,群主很熱心的幫我講解,在服務(wù)方面我的用戶體驗(yàn)很好。下面我就與大家分享我如何一步步完成在自己電腦上搭建機(jī)器翻譯系統(tǒng)的。第一步,進(jìn)入“小牛翻譯開源社區(qū)”網(wǎng)站(第二步,根據(jù)自己電腦的操作系統(tǒng)(Windows系統(tǒng)還是Linux系統(tǒng)),選擇合適的“NiuTrans Server工具包”(之所以叫NiuTrans Server,據(jù)說是因?yàn)檫@個工具包是針對單服務(wù)器的,或者說,這個工具包還不能用于搭建機(jī)器翻譯云平臺)。小牛翻譯開源社區(qū)的群主告訴我,目前正式運(yùn)行的機(jī)器翻譯系統(tǒng),都是在Linux操作系統(tǒng)下安裝的,但Linux系統(tǒng)下沒有圖形界面,需要用戶稍

5、微懂一些代碼。為了方便像我這樣的用戶,他們很貼心地研發(fā)出Windows系統(tǒng)下如何搭建機(jī)器翻譯系統(tǒng)的方法(此處值得為他們點(diǎn)贊哦)。第三步,點(diǎn)擊“Windows版搭建教程,下載“NiuTrans Server工具包”。根據(jù)語言方向和電腦內(nèi)存的大小,社區(qū)里提供了四個工具包。由于我的電腦內(nèi)存總共只有8G,所以選擇的是“中譯英Windows4G版”。點(diǎn)擊下載即可。第四步,安裝perl。我是在人工指導(dǎo)下完成的,一共需要四步操作才能完成。首先,點(diǎn)擊上面網(wǎng)頁中“運(yùn)行環(huán)境準(zhǔn)備”項(xiàng)中的“Perl下載地址”。如下圖:Step 1、進(jìn)入“Perl-download”頁面,點(diǎn)擊“Windows”圖標(biāo)。Step 2、點(diǎn)擊

6、頁面中“DOWNLOAD ACTIVEPERL”,即頁面上Windows下右面第一個圖標(biāo)。大家可以看一下左側(cè)的英文說明,除了64位操作系統(tǒng),32位操作系統(tǒng)也可以支持的。Step 3、在新的頁面中,點(diǎn)擊“Download ActivePerl 5.22.1 forWindows (64-bit,x64)”(我的電腦是64位系統(tǒng))。Step 4、在新的頁面中,會自動彈出一個下載框。經(jīng)過以上操作就可以成功下載Perl。第五步,做了以上準(zhǔn)備工作后,接下來進(jìn)入搭建步驟。搭建共分兩步,Step 1、解壓工具包。找到剛剛下載的工具壓縮包,windows 7 系統(tǒng)可直接右鍵解壓到“當(dāng)前文件夾”,解壓

7、后的文件夾名稱為“NiuTransServer_v1.1.0_zh2en_x64_window”。打開文件夾如下圖:Step 2、啟動機(jī)器翻譯系統(tǒng)。點(diǎn)擊上圖文件夾中“service”文件夾,進(jìn)入文件夾內(nèi),找到“start.service.bat(BAT腳本文件)”,雙擊該文件即實(shí)現(xiàn)啟動機(jī)器翻譯系統(tǒng)。如圖:第六步,搭建操作全部完成后,頁面會出現(xiàn)下列提示即代表啟動成功。下圖是社區(qū)指導(dǎo)步驟中給的樣圖。其實(shí)操作者只要看最后一句“Server startup in  XXX ms”即可,代表專屬于你的機(jī)器翻譯系統(tǒng)已經(jīng)搭建成功,此處特別提醒,該頁面不可以關(guān)閉,要想運(yùn)行機(jī)器翻譯系統(tǒng),要保持著該頁面

8、一直打開狀態(tài)。第七步,將該“:1517/niutrans/”網(wǎng)址粘貼到瀏覽器中,即可彈出如下圖頁面:然后嘛,就可以開始使用機(jī)器翻譯系統(tǒng)了!以上就完成在自己電腦中搭建機(jī)器翻譯系統(tǒng)的全過程。在“指導(dǎo)搭建機(jī)器翻譯系統(tǒng)”頁面中還介紹了很多小牛翻譯系統(tǒng)的其他功能。如翻譯API功能、利用自有數(shù)據(jù)訓(xùn)練翻譯模型等,經(jīng)過好一頓的研究,被社區(qū)群主告知這些功能都是為機(jī)器翻譯專業(yè)人士準(zhǔn)備的,不懂程序的人無法直接使用。特此提醒其他使用者,完成我上述七步操作,專屬于你的機(jī)器翻譯系統(tǒng)就搭建成功了,其他的小牛翻譯系統(tǒng)各種功能就只能根據(jù)使用者自身的能力來選擇使用了。二、對小牛開源社區(qū)的建議社區(qū)內(nèi)搭

9、建機(jī)器翻譯系統(tǒng)的方法實(shí)現(xiàn)起來真的很便捷,但是對搭建過程中的某些技術(shù)指導(dǎo)表述不夠清晰,建議以下部分應(yīng)該有改進(jìn)。1)安裝perl環(huán)節(jié)應(yīng)該添加詳細(xì)介紹。在上一部分我的搭建過程中,我詳細(xì)了介紹了安裝perl的步驟。安裝perl的網(wǎng)頁是全英文版,由于我是翻譯碩士所以我讀起來較輕松,但是對于英語水平不太高的使用者,閱讀起來會比較困難,這會導(dǎo)致此部分的操作有一定難度。希望社區(qū)開發(fā)者會進(jìn)一步詳細(xì)介紹一下如何選擇各個步驟的下載選項(xiàng)。2)“代表啟動成功”的展示圖片需修改。應(yīng)提示,操作者只要看最后一句“Serverstartup in  XXX ms”即可,這就代表專屬于你的機(jī)器翻譯系統(tǒng)已經(jīng)搭建成功,亦在

10、圖片中明顯標(biāo)畫出來,讓操作者可以非常清晰操作思路。如下圖:3)截下圖,只想表達(dá),下圖的解釋說明雖然可以看得懂,但是卻不清晰,典型的程序猿表達(dá)方式。如果想要提升用戶體驗(yàn),某些表達(dá)也可以優(yōu)化一下。我相信,隨著大家對機(jī)器翻譯的需求逐漸興起以及對數(shù)據(jù)翻譯安全的考慮,這種可以在自己電腦上搭建機(jī)器翻譯系統(tǒng)會有越來越多的需求。因此,“詳細(xì)、直白、清晰、簡潔”的搭建過程說明是很有必要的。三、搭建體會作為一名不懂計算機(jī)編程、機(jī)器翻譯技術(shù)基礎(chǔ)的我,竟然可以實(shí)現(xiàn)自己動手搭建機(jī)器翻譯系統(tǒng),我都被自己嚇到了,應(yīng)該說小牛翻譯開源社區(qū)給了我很大驚喜。通過自己親手搭建機(jī)器翻譯系統(tǒng),雖然我還是不懂機(jī)器翻譯技術(shù),但是在使用上,感受到了機(jī)器翻譯的更多優(yōu)勢。比如,在自己的電腦上搭建機(jī)器翻譯系統(tǒng),使用的穩(wěn)定性、數(shù)據(jù)的安全性均可得到保

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論