版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 OCR自動(dòng)閱卷解決方案北京文通科技有限公司2014年4月目錄第一章背景介紹1第二章系統(tǒng)概述2第三章解決方案21處理流程22功能介紹33系統(tǒng)拓?fù)浣Y(jié)構(gòu)54方案組成65系統(tǒng)特點(diǎn)76應(yīng)用效果8Best Regards!劉經(jīng)理 北京文通科技有限公司BeijingWintoneScience & Technology Corporation Ltd.地址:北京海淀區(qū)北四環(huán)西路9號(hào)銀谷大廈16層1609室郵編:手機(jī):公司網(wǎng)址:E-mail:第一章 背景介紹問(wèn)卷是政府機(jī)關(guān)、教育機(jī)構(gòu)、公司、企業(yè)和媒體做專(zhuān)題調(diào)查并且期望得到結(jié)
2、果的一種方式。對(duì)問(wèn)卷結(jié)果的錄入和統(tǒng)計(jì)傳統(tǒng)方式都是采用人工作業(yè),對(duì)于數(shù)量特別多的問(wèn)卷,處理起來(lái)會(huì)花費(fèi)大量的人力和時(shí)間,甚至不能在期望的時(shí)間內(nèi)完成。另外,有些調(diào)查問(wèn)卷也是客戶、會(huì)員等資料的收集渠道,因此調(diào)查問(wèn)卷的結(jié)果除了進(jìn)行必要的保存以及分析外,還需要進(jìn)行必要的影像管理和查詢。例如像一年一度的全國(guó)高考這樣的大型考試,數(shù)千萬(wàn)份試卷的批閱,對(duì)高考的閱卷系統(tǒng)就提出了嚴(yán)峻的挑戰(zhàn)。第二章 系統(tǒng)概述傳統(tǒng)的人工閱卷方式,工作量大,出錯(cuò)率高,整個(gè)過(guò)程可謂高成本低效率。而傳統(tǒng)的OMR閱卷技術(shù)也隨著近年來(lái)的大范圍應(yīng)用,其不足之處也日漸顯現(xiàn):首先是對(duì)答題卡的印刷質(zhì)量要求非??量蹋痤}卡不能折疊、起皺,字跡亦不能潦草,否
3、則處理起來(lái)困難重重,錯(cuò)判誤判現(xiàn)象更是時(shí)有發(fā)生。OMR答題方式并不直觀,考生涂填答題卡時(shí)非常容易出錯(cuò),例如錯(cuò)位;信息采集量少,不易改變答題卡的內(nèi)容;不能保存原始圖像,查對(duì)時(shí)必須對(duì)照原卡或原考卷,極大地增加了工作量;如果考生想修改所選答案,由于擦涂不干凈,極易產(chǎn)生錯(cuò)判現(xiàn)象,特別是當(dāng)考生進(jìn)行多項(xiàng)選擇時(shí)。OMR技術(shù)的不足,在考生資源巨大的情形下尤其明顯,例如高考。由于OMR技術(shù)對(duì)考生成績(jī)誤判、錯(cuò)判、漏判的現(xiàn)象屢屢發(fā)生,在一定程度上嚴(yán)重影響了考試的公平公正性。針對(duì)當(dāng)前市場(chǎng)上的實(shí)際需求,文通科技推出了基于清華TH-OCR(光學(xué)字符識(shí)別)技術(shù)的自動(dòng)閱卷系統(tǒng),該系統(tǒng)首先通過(guò)高速掃描儀對(duì)問(wèn)卷進(jìn)行快速掃描,然后對(duì)
4、掃描得到的圖像進(jìn)行OCR識(shí)別,最后對(duì)識(shí)別得到的結(jié)果進(jìn)行校對(duì),并將校對(duì)后的結(jié)果存入數(shù)據(jù)庫(kù)中。文通OCR自動(dòng)閱卷系統(tǒng)為廣大用戶提供了一套完整而周全的解決方案,充分滿足了用戶對(duì)問(wèn)卷數(shù)據(jù)采集的四個(gè)需求:高質(zhì)量、高效率、低成本、低風(fēng)險(xiǎn)。作為該解決方案的核心,清華TH-OCR識(shí)別引擎,是由清華大學(xué)電子工程系智能圖文信息處理實(shí)驗(yàn)室研制,是國(guó)家“863”計(jì)劃支持的重要科研成果。該識(shí)別引擎包含了表格處理、手寫(xiě)數(shù)字識(shí)別、印刷體中英文識(shí)別等多種技術(shù),在識(shí)別率、適應(yīng)能力、校對(duì)能力等方面均位居國(guó)際領(lǐng)先水平。第三章 解決方案1 處理流程識(shí)別問(wèn)卷掃描識(shí)別為了達(dá)到最佳的識(shí)別效果,從而提高數(shù)據(jù)統(tǒng)計(jì)的準(zhǔn)確性,文通對(duì)系統(tǒng)識(shí)別流程做
5、了周密的設(shè)計(jì)(詳見(jiàn)下圖)。2 功能介紹 問(wèn)卷掃描系統(tǒng)連接高速掃描儀,按照每份問(wèn)卷的頁(yè)序進(jìn)行掃描。系統(tǒng)會(huì)自動(dòng)按照每份問(wèn)卷的頁(yè)數(shù)分組,并添加到主界面左邊的樹(shù)結(jié)構(gòu)中。高速掃描儀的掃描速度在3060頁(yè)/分鐘。 問(wèn)卷識(shí)別系統(tǒng)自動(dòng)對(duì)掃描進(jìn)來(lái)的問(wèn)卷識(shí)別,首先自動(dòng)分類(lèi)問(wèn)卷,然后依據(jù)不同的模板對(duì)問(wèn)卷OCR識(shí)別。識(shí)別速度平均為1張/秒,結(jié)合掃描速度3060頁(yè)/分鐘,掃描和識(shí)別可以同步處理,系統(tǒng)總體處理速度為3060頁(yè)/分鐘,以人工閱卷12分鐘/頁(yè)對(duì)比,OCR的數(shù)據(jù)采集速率是人工閱卷速率的30120倍(注:表格的復(fù)雜程度對(duì)人工閱卷速率的影響明顯,而對(duì)OCR系統(tǒng)處理速率的影響微乎其微),可見(jiàn)OCR技術(shù)的絕對(duì)優(yōu)勢(shì)。 問(wèn)
6、卷校對(duì)系統(tǒng)提供全圖映射校對(duì)方式,直觀簡(jiǎn)潔,用戶光標(biāo)定位到任一窗口的任一位置,系統(tǒng)會(huì)自動(dòng)定位到另一窗口的對(duì)應(yīng)位置。 數(shù)據(jù)入庫(kù)統(tǒng)計(jì)系統(tǒng)按照預(yù)先建立的問(wèn)卷表,把識(shí)別的結(jié)果導(dǎo)入到相應(yīng)的數(shù)據(jù)表中,并按照問(wèn)卷設(shè)定的評(píng)分規(guī)則實(shí)時(shí)對(duì)數(shù)據(jù)做評(píng)分計(jì)算,評(píng)分統(tǒng)計(jì)結(jié)果與問(wèn)卷掃描識(shí)別同步完成。 報(bào)表輸出用戶可定制豐富的報(bào)表輸出,定制查詢和報(bào)表輸出功能,用戶可方便打印各單位的得分情況和總體的考評(píng)情況,及時(shí)掌握各單位年度的工作情況。3 系統(tǒng)拓?fù)浣Y(jié)構(gòu)可根據(jù)不同的應(yīng)用場(chǎng)景靈活配置,根據(jù)問(wèn)卷調(diào)查的規(guī)模確定處理客戶端的數(shù)量,系統(tǒng)具有很強(qiáng)的可擴(kuò)展性;方案的部署比較簡(jiǎn)單,在現(xiàn)場(chǎng)布置局域網(wǎng)即可,甚至掃描識(shí)別客戶端、數(shù)據(jù)庫(kù)、任務(wù)管理工作都
7、可以在一臺(tái)計(jì)算機(jī)上完成。系統(tǒng)的拓?fù)鋱D如下:4 方案組成 掃描儀及驅(qū)動(dòng)程序掃描儀對(duì)問(wèn)卷快速掃描,驅(qū)動(dòng)軟件具有智能化處理的完美頁(yè)面掃描功能,自動(dòng)完成影像的歪斜校正、原稿尺寸裁剪、去底色、旋轉(zhuǎn)、去白頁(yè)等功能??赏瑫r(shí)得到掃描稿件的黑白、灰度、彩色三種影像輸出,并且針對(duì)稅票特征配置了最優(yōu)化的對(duì)比度、亮度,為后續(xù)OCR(文字識(shí)別)提供優(yōu)質(zhì)的影像。 OCR自動(dòng)閱卷客戶端軟件文通OCR識(shí)別技術(shù)已在中組部、全國(guó)武警總隊(duì)系統(tǒng)中成熟應(yīng)用,技術(shù)特點(diǎn)如下:a) 準(zhǔn)確率在達(dá)99%:充分利于框線、框線顏色、標(biāo)題內(nèi)容、標(biāo)題顏色、文本內(nèi)容、文本顏色等多種特征來(lái)進(jìn)行版面的區(qū)分;相似憑證、多聯(lián)憑證、同聯(lián)憑證打印多種交易均可準(zhǔn)確區(qū)分
8、。b) 識(shí)別類(lèi)型豐富:系統(tǒng)支持印刷體中英數(shù)混排識(shí)別、印刷漢字識(shí)別、印刷英文識(shí)別、印刷數(shù)字識(shí)別、手寫(xiě)漢字識(shí)別、手寫(xiě)英文識(shí)別、手寫(xiě)數(shù)字識(shí)別、磁碼識(shí)別、條形碼識(shí)別等引擎。c) 識(shí)別速度快:200DPI彩色圖像,生產(chǎn)線上平均識(shí)別時(shí)間約500ms,300DPI彩色圖像,識(shí)別平均時(shí)間約為1秒。 OCR識(shí)別引擎(SDK)OCR識(shí)別引擎(SDK)以DLL(動(dòng)態(tài)鏈接庫(kù))或者OCX控件的方式提供客戶端調(diào)用。5 系統(tǒng)特點(diǎn) 識(shí)別性能強(qiáng)勁w 識(shí)別字符類(lèi)型豐富,系統(tǒng)能識(shí)別的字符 印刷中文(簡(jiǎn)體)、印刷中文(繁體) 、印刷英文、印刷數(shù)字 手寫(xiě)中文(簡(jiǎn)體) 、手寫(xiě)中文(繁體)、手寫(xiě)英文、手寫(xiě)數(shù)字 標(biāo)識(shí)碼、條碼、 CheckB
9、ox 等w 識(shí)別速度快 一張表格的速度在1.0秒鐘左右; w 識(shí)別率高 對(duì)版面整潔的印刷字符的識(shí)別,正確率達(dá)99.96% 對(duì)于規(guī)范手寫(xiě)數(shù)字的識(shí)別,正確率在99.5%以上 對(duì)于規(guī)范手寫(xiě)漢字的識(shí)別,正確率在93%左右; 抗干擾能力強(qiáng)文通強(qiáng)大的數(shù)字圖像處理技術(shù),能對(duì)圖像自動(dòng)糾偏、去黑邊、去除裝訂孔、去噪、圖像增強(qiáng)弱化,多樣的二值化手段保障為識(shí)別輸入優(yōu)質(zhì)的圖像;文通成熟的OCR技術(shù)提供高精度的識(shí)別,對(duì)彩色、灰度、二值圖像均適用。 可保留原始圖像可以將識(shí)別完的圖像保存到光盤(pán)等大容量的存貯介質(zhì),長(zhǎng)久地保存,既安全又方便,不需要再保留原始紙質(zhì)問(wèn)卷,大大減少了問(wèn)卷存檔管理的費(fèi)用和紙張堆放的空間。 提供可集成SDK系統(tǒng)背后有強(qiáng)大的TH-OCR表格識(shí)別引擎支撐,同時(shí)該引擎以標(biāo)準(zhǔn)的DLL方式提供二次開(kāi)發(fā),用戶可把表格識(shí)別技術(shù)嵌入到自己的應(yīng)用系統(tǒng)中,滿足多樣化的需求。第四章 關(guān)于文通北京文通科技有限公司是在原國(guó)家科委的支持下,為推廣應(yīng)用清華大學(xué)電子工程系的科
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國(guó)牡荊油行業(yè)市場(chǎng)全景評(píng)估及發(fā)展戰(zhàn)略研究報(bào)告
- 2019-2025年中國(guó)電紙書(shū)行業(yè)市場(chǎng)前景預(yù)測(cè)及投資戰(zhàn)略研究報(bào)告
- 華南日產(chǎn)水15萬(wàn)噸自來(lái)水廠建設(shè)可行性研究報(bào)告-廣州齊魯咨詢
- 2025年烤漆涂料項(xiàng)目可行性研究報(bào)告
- 中國(guó)自動(dòng)止液輸液器行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及投資方向研究報(bào)告
- 貴州省某煤礦改造項(xiàng)目可行性研究報(bào)告
- 2024年社交媒體行業(yè)市場(chǎng)行情動(dòng)態(tài)分析及發(fā)展前景趨勢(shì)預(yù)測(cè)報(bào)告
- 黑龍江省工業(yè)氣體項(xiàng)目可行性研究報(bào)告
- 2025年中國(guó)名片冊(cè)行業(yè)發(fā)展趨勢(shì)預(yù)測(cè)及投資戰(zhàn)略咨詢報(bào)告
- 2019-2025年中國(guó)野生動(dòng)物園行業(yè)市場(chǎng)運(yùn)營(yíng)現(xiàn)狀及投資規(guī)劃研究建議報(bào)告
- 2025年八省聯(lián)考高考語(yǔ)文作文真題及參考范文
- 科研倫理與學(xué)術(shù)規(guī)范(研究生)期末試題庫(kù)及答案
- 消防水池 (有限空間)作業(yè)安全告知牌及警示標(biāo)志
- 修復(fù)學(xué)全口義齒
- 機(jī)械設(shè)備租賃合同范本簡(jiǎn)單版(9篇)
- 美甲顧客檔案表Excel模板
- 公安警察工作總結(jié)匯報(bào)PPT模板
- 城市生活垃圾分選系統(tǒng)設(shè)計(jì)
- 外國(guó)文學(xué)專(zhuān)題作業(yè)答案
- 綠色施工管理體系與管理制度管理辦法(新版)
- 機(jī)動(dòng)車(chē)交通事故快速處理協(xié)議書(shū)(最新格式)
評(píng)論
0/150
提交評(píng)論