ABBYY FineReader使用指南_第1頁
ABBYY FineReader使用指南_第2頁
ABBYY FineReader使用指南_第3頁
ABBYY FineReader使用指南_第4頁
ABBYY FineReader使用指南_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、abbyyfinereader使用指南 (2012-09-19 18:36:31)轉載標簽:掃描校對書籍ocr分享雜談分類:他山之石首先,什么是 ocr 技術?ocr (optical character recognition,光學字符識別)傳統(tǒng)上是指,電子設備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程。本文所述 ocr,特指將 pdf 文檔,拆分為一幅幅圖像文件,用 ocr 技術通過相應軟件,將圖片中文字轉換成文本,便于下一步操作(例如導入書苑的 epubb

2、uilder 制作軟件)。傳說中一步到位的 pdf 轉換成 epub ,并不在本文的討論范疇內。一、準備工作:1.準備 pdf 源文件,并將 pdf 按頁拆分成圖像文件。方法有很多,不一一贅述了,如圖例1;2.準備 ocr 軟件,本人用的是abbyy finereader 10,如圖例2;二、初始工作:1.新建 finereader 文檔,如圖例3;2.點擊上欄“打開”圖標,打開圖像,打開后,軟件處理圖像添加進文檔,如圖例4、5;提示:在新建的 finereader 文檔中,添加若干圖像文件,可以合理安排工作量,例如:按章節(jié)分派,每個文檔就是一個章節(jié)的圖像文件;平均分派,每個文檔取一個固定值的

3、圖像文件,便于均衡校對的工作量。3.保存 finereader 文檔,如圖例6;提示:建立并保存 finereader 文檔后,下次可以打開未完成的文檔,繼續(xù)校對工作。三、設置工作:1.將輸出設置為“另存為txt”,如圖例7;提示:個人認為無格式的txt文檔便于后期編輯,具體喜好因人而宜。2.點擊“選項”圖標,設置“文檔語言”,這個很重要,如圖例8;提示:簡體中文書籍,繁體書籍,英文書籍請按相應語言設置,也可按右側“編輯語言”,設置你要的語言,不要添加過多選項,否則將影響準確率。如圖例9。3.在“選項”內選“查看”標簽,設置軟件顯示待校對文字的字體,如圖例10;提示:我選“楷體”,并不是說我喜

4、歡這個字體,而是因為,很多生僻字在楷體字庫下顯示不出,例如“事”和“亊”,識別為“亊”,在宋體下能顯示,楷體不顯示,便于糾錯。四、校對工作:1.打開 finereader 文檔(類似一個專輯),調出一組圖像文件;2.一般情況打開左右兩欄,左側原圖,右側待校對文字;3.調整好兩欄顯示大??;4.打開右上角“顯示不可打印字符”按鈕,便于將不規(guī)則字符去除;如圖例115.遇到書源不好的pdf,字跡比較模糊,也可調整為上下倆欄(共4欄),識別校對,如圖例12;6.軟件會將可能錯誤的字符以背景顏色顯示出來,便于校對更正,更正時可以手動輸入,也可以鼠標移動待修改字,右鍵以顯示待選字符,再選擇正確字符。如圖例13;7.將此檔校對完畢,保存輸出,如圖例14;8.其他一些情況,如中英文混編的書籍,更復雜一些。建議分別選擇識別區(qū)域,分別識別,如圖例15。9.ocr 技術的擴展應用,一份小女的卷子,手機拍下,分別識別校對。五、總結:有書友提出不必拆分為圖片,直接進行轉換,甚至有的軟件號稱可以直接 pdf 轉 epub。當然那也是可以的,同樣的 ocr 軟件輸出質量應該是相差無幾的。但是本人是完美主義者,做事的理念是:“不喜歡難看的東西,更不喜歡錯誤的東西”。所以多做了一些前期工作,喜歡以圖片、文字對照的方式邊讀邊校對。作完一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論