檔案數(shù)字化整體解決方案--館藏檔案掃描、數(shù)字化加工整體解決方案范本_第1頁(yè)
檔案數(shù)字化整體解決方案--館藏檔案掃描、數(shù)字化加工整體解決方案范本_第2頁(yè)
檔案數(shù)字化整體解決方案--館藏檔案掃描、數(shù)字化加工整體解決方案范本_第3頁(yè)
檔案數(shù)字化整體解決方案--館藏檔案掃描、數(shù)字化加工整體解決方案范本_第4頁(yè)
檔案數(shù)字化整體解決方案--館藏檔案掃描、數(shù)字化加工整體解決方案范本_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、武漢 xx 數(shù)字科技有限公司目錄第一節(jié)質(zhì)數(shù)字化加工作業(yè)前期準(zhǔn)備一、數(shù)字化工作人員準(zhǔn)備11二、數(shù)字化工作軟件、硬件準(zhǔn)備4第二節(jié)三、確定數(shù)字化內(nèi)容、數(shù)量及用戶需求數(shù)字化加工流程及主要技術(shù)方案65一、入庫(kù)提卷、拆卷6二、標(biāo)引著錄 7三、檔案掃描 8四、圖像處理 11 五、全文 OCR、生成雙層 pdf、板式還原及格式 12 六、總質(zhì)檢 14七、批量掛接 15八、還卷及數(shù)據(jù)備份提交15第三節(jié)質(zhì)量控制方案和保證措施17一、加工質(zhì)量保障措施17二、多環(huán)節(jié),多層次的質(zhì)量檢查體系17三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終級(jí)保障19第四節(jié)安全保密控制 21保密協(xié)議 22第五節(jié)售后服務(wù) 24項(xiàng)目背

2、景隨著全國(guó)文化信息資源共享工程與中國(guó)數(shù)字圖書(shū)館工程的起動(dòng),信息化已 成為國(guó)際潮流,信息資源建設(shè)成為當(dāng)務(wù)之急。信息資源建設(shè)的重點(diǎn)是電子文獻(xiàn)、各類(lèi)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)資源、電子檔案、電子圖書(shū)等新型數(shù)字化信息資源的建設(shè)。 在數(shù)字化信息資源建設(shè)中,很大的一個(gè)需求是將現(xiàn)有的紙介質(zhì)印刷品數(shù)字化, 使之成為能夠用計(jì)算機(jī)閱讀、理解、查詢(xún)、檢索的電子文件,最終將其應(yīng)用于 數(shù)據(jù)庫(kù)存儲(chǔ),或通過(guò)CD-RO、M Internet網(wǎng)進(jìn)行出版,或上傳數(shù)字檔案館供用戶使用。以傳統(tǒng)紙張為載體的保存方式,占據(jù)了大量的空間,需要特殊的環(huán)境,而且不方便查詢(xún),隨著時(shí)間的推移,還面臨著腐蝕、老化等問(wèn)題。而將紙介質(zhì)文件信息進(jìn)行電子化處理,保存到光

3、盤(pán)上,具有存儲(chǔ)、管理、共享等功能,還可以減少文件庫(kù)房占地,節(jié)省保管設(shè)備和人員方面開(kāi)支,又方便統(tǒng)計(jì)和進(jìn)行遠(yuǎn)程查詢(xún)。因此,將檔案、期刊、文件等資料通過(guò)掃描儀,掃描成圖像文件,再通過(guò)處理轉(zhuǎn)換成電子文檔,建立目錄和索引,制作成電子文件,已是當(dāng)務(wù)之急。公司簡(jiǎn)介武漢 xx 數(shù)字科技有限責(zé)任公司 (前身是湖北華新職業(yè)學(xué)院數(shù)字科研中心)成立于 1994 年,是在原國(guó)家科委的支持下, 為推進(jìn)建設(shè)國(guó)家 “工程” 高等學(xué)校中英文圖書(shū)數(shù)字化國(guó)際合作計(jì)劃(China-America Digital AcademicLibrary)“CADA”L 項(xiàng)目而成立的一家高新技術(shù)企業(yè)。公司擁有先進(jìn)的OCR(雙層光學(xué)字符識(shí)別)技術(shù)

4、,圖像掃描處理系統(tǒng)、生產(chǎn)流程管理系統(tǒng),實(shí)現(xiàn)工廠化流水作業(yè),智能化質(zhì)量控制與管理的具有國(guó)際領(lǐng)先水平的信息數(shù)字化工廠技術(shù)??赏瑫r(shí)為圖書(shū)館、檔案館、政府、企業(yè)提供信息管理系統(tǒng)和信息資源數(shù)字化加工服務(wù)。經(jīng)過(guò)六年的不斷探索和實(shí)踐,公司建立了一套完善的服務(wù)于各領(lǐng)域的 業(yè)務(wù)體系,檔案館:檔案綜合管理系統(tǒng),檔案、古籍、期刊、論文、文獻(xiàn)資料數(shù)字化加工,檔案著錄、OCR,數(shù)據(jù)制作、檔案館設(shè)備及耗材提供等。政府機(jī)關(guān):數(shù)字檔案管理系統(tǒng),歷史陳舊檔案數(shù)字化加工。醫(yī)療、保險(xiǎn)金融領(lǐng) 域: 病歷、保單等數(shù)字化加工,數(shù)據(jù)錄入服務(wù),全文等。第一節(jié)數(shù)字化加工作業(yè)前期準(zhǔn)備一數(shù)字化工作人員準(zhǔn)備1 .甲方人員職務(wù):現(xiàn)場(chǎng)交接管理人員人數(shù)要

5、求:一名專(zhuān)業(yè)要求:為學(xué)校檔案館負(fù)責(zé)檔案管理工作的技術(shù)或管理人員。職責(zé)范圍:. 負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作,協(xié)同甲方人員作好交接清單記錄并簽字。. 負(fù)責(zé)監(jiān)督乙方規(guī)范化加工。隨時(shí)把握乙方加工進(jìn)度并進(jìn)行協(xié)調(diào)。. 及時(shí)關(guān)注并抽查乙方加工質(zhì)量代表甲方與乙方進(jìn)行及時(shí)的溝通及問(wèn)題協(xié)調(diào),確保項(xiàng)目順利完工。2 乙方人員2.1 管理人員主要為:熟悉現(xiàn)場(chǎng)加工管理,熟悉數(shù)字化整體作業(yè)流程,具有較強(qiáng)組織能力和現(xiàn)場(chǎng)管理及溝通能力的乙方負(fù)責(zé)人。2.2 工程技術(shù)人員主要為:熟悉計(jì)算機(jī)軟、硬件技術(shù),了解檔案數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)和系統(tǒng)開(kāi)發(fā)。了解檔案管理等相關(guān)專(zhuān)業(yè)知識(shí)的乙方技術(shù)部技術(shù)支持工程師。2.3 數(shù)據(jù)采集作業(yè)員主要為:了解檔

6、案數(shù)據(jù)庫(kù)數(shù)據(jù)標(biāo)準(zhǔn)和計(jì)算機(jī)軟件應(yīng)用等相關(guān)知識(shí)的乙方數(shù)字化制作部工作人員。人員安排見(jiàn)表 3-1職務(wù)職責(zé)人員1. 負(fù)責(zé)人員,資源的調(diào)配工作。2. 負(fù)責(zé)施工組織設(shè)計(jì)、管理。備注項(xiàng)目負(fù)責(zé)人不 一定 要常 駐現(xiàn)場(chǎng),但要通過(guò)項(xiàng)目負(fù)責(zé)人管理人員現(xiàn)場(chǎng)主管3. 負(fù)責(zé)施工條件的保障及與甲乙雙方關(guān)于項(xiàng)目進(jìn)展?fàn)顟B(tài)的匯報(bào)和協(xié)調(diào)工作。1. 負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作2. 負(fù)責(zé)現(xiàn)場(chǎng)的人員管理和加工管理3. 負(fù)責(zé)數(shù)據(jù)的終驗(yàn)和掛接4. 配合項(xiàng)目負(fù)責(zé)人做好與乙方的溝通協(xié)調(diào)工作。一 切通 訊手 段1 人 和 定期 到現(xiàn) 場(chǎng)的督導(dǎo), 切實(shí)做到 對(duì)該 項(xiàng)目 加工 進(jìn)度 和加 工質(zhì)量的掌控1 人1 人著錄人員負(fù)責(zé)將檔案卷內(nèi)目錄及

7、其它索引信息進(jìn)行手工錄入為電子數(shù)據(jù)信息并校對(duì)數(shù)負(fù)責(zé)按制定的技術(shù)規(guī)范將檔案資料掃據(jù) 掃描人員采集人員圖像處理描1 人1. 去污:將掃描獲取的圖像進(jìn)行圖像去污;去黑邊及去雜點(diǎn)等;2. 糾偏:將偏斜的圖像進(jìn)行糾正處理;在進(jìn)行圖像處 理的時(shí)候, 肯定是逐頁(yè)處理, 所以要留意每一人員圖像矢量化人員3. 文字處理:將不清楚的文字進(jìn)行加深或變淺;4. 拼接:將頁(yè)面較大的圖像進(jìn)行拼接處理;1. 負(fù)責(zé)將處理好的圖像進(jìn)行全文識(shí)別、2. 校對(duì)、板式還原和格式轉(zhuǎn)換3. 對(duì)已經(jīng)產(chǎn)生的成品數(shù)據(jù)進(jìn)行初驗(yàn)后移交給現(xiàn)場(chǎng)主管終驗(yàn)并掛接。1 人1-3人頁(yè)掃描的質(zhì)量,發(fā)現(xiàn)掃描質(zhì)量問(wèn)題立即發(fā)還上一工序重掃并作好記錄。矢量化人員最終定員

8、需結(jié)合矢量化的圖形數(shù)量和采集難度。二 .數(shù)字化工作軟、硬件準(zhǔn)備1. 配備硬件數(shù)量及檔次要視數(shù)據(jù)采集工作情況及數(shù)據(jù)量大小。2. 甲方提供 PC機(jī) 4-6 臺(tái)給乙方作為采集作業(yè)使用,其他硬件設(shè)備由乙方自行解決。3. 場(chǎng)地: 甲方提供。4. 辦公用具:甲方提供打印機(jī)(以實(shí)際用量為標(biāo)準(zhǔn))辦公桌椅檔案資料的裝訂及打印機(jī)所用的全部耗材。5. 其他條件:提供電力和飲水。軟硬件準(zhǔn)備詳見(jiàn)表3-2表 3-2軟、硬件配備列表軟、硬件名稱(chēng)數(shù)量詳細(xì)配置響應(yīng)時(shí)間提供方1. 需支持全文檢索使用功綜合檔案管理系統(tǒng)一套數(shù)字化流程管理和加工全套軟件、 OCR 軟件能。2. 支持 TIFF 和PDF 格式數(shù)據(jù)的批量掛接功能。能 滿

9、 足 本 加工項(xiàng) 目 所 有 的技術(shù)要求項(xiàng)目開(kāi)始需甲方到位項(xiàng)目開(kāi)始需乙方到位甲方服務(wù)器一臺(tái)項(xiàng)目開(kāi)始需到位掃描儀( A3 幅面)一臺(tái)富士通 A3 幅面FI-4750C(ADF)A4 幅面項(xiàng)目開(kāi)始需到位乙方項(xiàng)目開(kāi)始需掃描儀( A4 幅面)一臺(tái)虹光-FB6030(平板)到位乙方計(jì)算機(jī)4-6 套PC 機(jī)項(xiàng)目開(kāi)始需甲方到位三.確定數(shù)字化內(nèi)容、數(shù)量及用戶需求在數(shù)據(jù)采集之前,首先要客觀真實(shí)統(tǒng)計(jì)數(shù)字化內(nèi)容和數(shù)量,確定用戶使用需求, 然后制定對(duì)應(yīng)方案和技術(shù)控制以便準(zhǔn)確地進(jìn)行施工安排。表 3-3三峽大學(xué)檔案館檔案數(shù)字化用戶需求調(diào)研表檔案類(lèi)型檔案數(shù)量數(shù)字化準(zhǔn)備情況紙張及保存情況用戶需求備約件招生名冊(cè)約面約件學(xué)籍檔案

10、約面約件學(xué)生成績(jī)約面約件黨群檔案約面約件基建檔案約面約件科研檔案約面其它:約件約面檔案裝訂檔案著錄注很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序填表人職務(wù)第二節(jié)數(shù)字化加工流程及主要技術(shù)方案檔案數(shù)字化加工主要流程包括:提卷- 拆卷- 檔案著錄 - 掃描- 圖像處理 -O

11、CR-校對(duì)- 版式還原 - 轉(zhuǎn)雙層 PDF-終驗(yàn)- 掛接。一、入庫(kù)提卷、拆卷1. 從檔案室移交檔案,嚴(yán)格執(zhí)行原始檔案的交接手續(xù),使用雙方項(xiàng)目負(fù)責(zé)人確認(rèn)的檔案交接清單(完成清點(diǎn)登記) 。2. 檔案整理:編寫(xiě)頁(yè)碼、核對(duì)紙質(zhì)檔案頁(yè)碼、對(duì)可拆釘?shù)奈募霾疳斕幚硪赃m應(yīng)掃描的要求、對(duì)需要修復(fù)的檔案進(jìn)行歸并整理(如果發(fā)現(xiàn)破損嚴(yán)重,無(wú)法 直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、折皺不平影響掃描質(zhì)量的原件應(yīng)先 進(jìn)行相應(yīng)處理后再進(jìn)行掃描,發(fā)現(xiàn)破損嚴(yán)重的檔案須立即報(bào)知項(xiàng)目相關(guān)負(fù)責(zé)人) 制作卷內(nèi)目錄,掃描文件抽取3 按照掃描處理量明確交接周期和檔案交接量(雙方項(xiàng)目負(fù)責(zé)人簽字, 以保在施工過(guò)程中檔案不損失、不丟失。 )二

12、、標(biāo)引著錄按要求將文件所需信息錄入到軟件數(shù)據(jù)庫(kù)里,標(biāo)引著錄按照國(guó)家檔案局有關(guān)標(biāo)準(zhǔn)結(jié)合用戶檔案著錄的具體要求進(jìn)行。1. 錄入方式采用手工錄入的方式2. 校對(duì)方式校對(duì)以軟件校對(duì)和打印輸出、對(duì)比校對(duì)相結(jié)合,錯(cuò)誤率在萬(wàn)分之二以下。案卷目錄和卷內(nèi)目錄按照檔案的原始數(shù)據(jù)錄入。卷案目錄和卷內(nèi)目錄的樣式經(jīng)用戶同意可做相應(yīng)調(diào)整。對(duì)檔案目錄數(shù)據(jù)修改和補(bǔ)充的數(shù)據(jù),須填寫(xiě)更改資料、更改資料放入原案卷內(nèi),卷內(nèi)目錄及其他不全的需補(bǔ)充完整。三、檔案掃描1. 掃描方式:根據(jù)檔案幅面的大小選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn)行掃描。大幅面檔案可采用加長(zhǎng)式掃描或者圖像拼接處理方式處理,同一頁(yè)面有兩個(gè)以上文件,需分別掃描。2. 掃描

13、色彩模式:以黑白二值掃描為主,附有灰度(彩色)照片及原件分明度很低的檔案,可視情況采取灰度和24 位真彩色掃描。然后以黑白二值保存。例:藍(lán)底招生名冊(cè),此種檔案長(zhǎng)見(jiàn)為A3 幅面、紙張很薄,底色與文字的分明度很低。實(shí)物檔案查看時(shí)都顯吃力,此種檔案如果用黑白二值掃描,則會(huì)出現(xiàn)大幅暗面,文字顯現(xiàn)不清; 如果使用彩色掃描,文字部分明度很低。只有使用灰度掃描,效果相對(duì)好一些,如圖三。掃 描后的圖像再輔以黑白二值保存,則最大限度的提高了圖像質(zhì)量,如圖四。圖三 灰度掃描效果圖四 保存為黑白值后的效果3. 分辨率:無(wú)全文檢索需求的文檔分辨率調(diào)整為 200DPI 最為合適。需要全文檢索而做 ocr 識(shí)別的文檔,

14、黑白二值掃描分辨率最佳為 400dpi,此分辨率下識(shí)別成功率最高。 24 位真彩色掃描分辨率標(biāo)準(zhǔn)為 200dpi。4. 圖像文件的大小:黑白二值掃描 A3 頁(yè)面: 20K40K;灰度或彩色掃描A3 頁(yè)面: 100150K。5. 如遇字間距和行間距過(guò)密、原件本身是復(fù)印件等字跡不清楚的情況,可適當(dāng)增加掃描的分辨率,但要保證圖像清晰的同時(shí),又不影響遠(yuǎn)程查詢(xún)和瀏覽的速度。6. 清晰度:掃描圖像字跡清晰、顏色恰當(dāng),不宜過(guò)淺或過(guò)深,并且不得出現(xiàn)字跡筆畫(huà)殘缺或字跡筆畫(huà)疊合而影響閱讀的情況,即使原檔案存在銹斑變質(zhì)、顏色過(guò)淺或深淺不一致,也保證掃描圖像可讀,掃描留下的墨跡寬度不得超過(guò)0.5 厘米,并且指印和黑線

15、不能覆蓋或影響正文內(nèi)容。7. 根據(jù)檔案實(shí)體情況,在檔案電子文件中相對(duì)應(yīng)目錄設(shè)置“復(fù)制件” 、“原件不清”標(biāo)志。目錄以原有檔案目錄為準(zhǔn),在實(shí)際處理過(guò)程中著有未歸類(lèi)的新目錄??筛鶕?jù)情況修改目錄,增加或調(diào)整標(biāo)準(zhǔn)目錄,對(duì)檔案原目錄數(shù)據(jù)修改或補(bǔ)充的數(shù)據(jù),需填寫(xiě)更改資料,更改資料放入原案卷內(nèi),能實(shí)現(xiàn)一條目錄對(duì)應(yīng)多個(gè)圖像和一個(gè)圖像對(duì)應(yīng)多條目錄的編目。8. 圖像內(nèi)容:8.1 實(shí)時(shí)在屏幕上監(jiān)控掃描全過(guò)程,遇有漏掃、 重張,圖像黑邊、 偏斜、折角、不清晰等情況,則進(jìn)行重掃或補(bǔ)掃。8.2 檢查掃描件是否合乎要求,掃描圖像必須與原圖頁(yè)面一一對(duì)應(yīng),不得出現(xiàn)顛倒、缺頁(yè)、重頁(yè)或錯(cuò)頁(yè)情況,不能有遺漏、重復(fù),掃錯(cuò)的現(xiàn)象8.3

16、掃描的頁(yè)面內(nèi)容居中顯示,不可出現(xiàn)明顯偏左或偏右的現(xiàn)象,正文內(nèi)容、頁(yè)眉、頁(yè)腳、反面印章、附件、手寫(xiě)注釋等信息完整;圖像內(nèi)容與書(shū)本面完全對(duì)應(yīng),不得出現(xiàn)書(shū)頁(yè)內(nèi)容殘缺或?qū)⑴赃呿?yè)面信息掃入本頁(yè)的現(xiàn)象。(對(duì)圖像黑邊、偏斜、折角、不清晰等情況進(jìn)行處理,以達(dá)到用戶需求)8.4 紙張較差檔案掃描方案:由于進(jìn)行數(shù)字化的檔案會(huì)有部分為歷史檔案,紙張質(zhì)量比較差,對(duì)于這部分紙張質(zhì)量較差的歷史檔案掃描,我們本著以下原則:8.4.1 保證檔案安全。紙張較差的檔案多為破損檔案,對(duì)于破 損檔案更應(yīng)該在生產(chǎn)流程中加以特殊對(duì)待,不能造成二次破壞。 保證檔案的安全是第一要?jiǎng)?wù)。 因此,在處理紙張較差的檔案時(shí), 不允許使用蘸水防滑等有破

17、壞檔案可能性的操作方法。8.4.2 保證掃描質(zhì)量。歷史檔案之所以進(jìn)行檔案數(shù)字化,其中最主要的目的之一就是搶救這部分歷史檔案,今后在應(yīng)用這部分檔案時(shí),盡量避免人為翻閱歷史檔案而給檔案造成二次傷害,而應(yīng)使用電子系統(tǒng),使用掃描件。這樣檔案掃描的質(zhì)量要盡可能的清晰、干凈,盡可 能的恢復(fù)歷史原貌,這對(duì)掃描質(zhì)量的要求很高。8.4.3 高效高質(zhì)的完成任務(wù)。9. 掃描登記:認(rèn)真填寫(xiě)紙質(zhì)檔案數(shù)字化轉(zhuǎn)換過(guò)程交接登記表單,登記掃描的頁(yè)數(shù),核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)與檔案整理時(shí)填寫(xiě)的文件頁(yè)數(shù)是否一致, 不一致時(shí)應(yīng)注明具體原因和處理方法。四、圖像處理1. 逐張檢查圖像質(zhì)量(包括黑邊、折角、圖像偏斜度、清晰度、失真度等

18、進(jìn)行檢查,發(fā)現(xiàn)不符合圖像質(zhì)量要求時(shí),應(yīng)重新進(jìn)行圖像處理),檔案順序(頁(yè)號(hào))是否正確,有無(wú)漏掃、重張等情況(發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確插入圖像。發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時(shí),應(yīng)及時(shí)進(jìn)行調(diào)整。)2. 糾偏:圖像整體傾斜不得超過(guò)1 度,不得出現(xiàn)圖像的一部分傾斜或扭曲而影響閱讀的現(xiàn)象。如果檔案頁(yè)面存在部分傾斜的,以頁(yè)面中標(biāo)題糾正為準(zhǔn)。3 去污:所有掃描留下的黑線、指印、陰影或污點(diǎn)都必須清除干凈(在放大50%的情況下)由于印刷質(zhì)量或紙張質(zhì)量等造成的頁(yè)面上有零星的污點(diǎn)和反面倒映文字污點(diǎn)比較多,如果在頁(yè)面視圖下看不清楚,或該污點(diǎn)嵌在文本行中無(wú)法清除,可以不清除,但應(yīng)盡量保證圖像可讀。4 全

19、文頁(yè)面及局部文字的加深和變淺的處理:原始檔案的清晰度較低時(shí), 可提高圖像的清晰度,修正原資料中存在的字間距和行間距過(guò)密,文字較深或較淺,字跡不清楚的缺陷,確保文字及圖像信息清晰可辨。5 圖像拼接:對(duì)大幅面檔案進(jìn)行分區(qū)掃描形式的多幅圖像,應(yīng)進(jìn)行拼接處理,合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性和數(shù)字化檔案的準(zhǔn)確可讀。6 照片頁(yè)處理: 必要時(shí)采用專(zhuān)業(yè)的圖像處理軟件進(jìn)行處理,確保照片的清晰度。7 圖像存儲(chǔ): 存儲(chǔ)格式以 G-4 壓縮 TIFF 格式保存。A4 幅面檔案保存文件不得大于 100K;其他幅面檔案掃描形成文件在保證影像質(zhì)量的前提下,盡量縮小文件占用空間。掃描文件存儲(chǔ)命名必須與條目

20、檔案號(hào)一一對(duì)應(yīng)。五、全文識(shí)別( OCR)及生成雙層 pdf、版式還原及格式轉(zhuǎn)換將掃描處理完成后的文檔利用專(zhuān)業(yè)的識(shí)別軟件進(jìn)行全文OCR,如甲方對(duì)識(shí)別成功率有嚴(yán)格要求的,還需另外進(jìn)行人工校對(duì),校對(duì)結(jié)束后將版式還原及轉(zhuǎn)換成雙層 PDF文件格式。根據(jù)用戶對(duì)識(shí)別率的要求,可選擇性進(jìn)行人工校對(duì)。進(jìn)行人工校對(duì)和不進(jìn)行校對(duì)的優(yōu)缺點(diǎn)對(duì)比:1. 不進(jìn)行人工校對(duì):其原理是在單層PDF 的基礎(chǔ)上利用計(jì)算機(jī)軟件進(jìn)行全文 OCR 識(shí)別后生成雙層PDF 文件。從而激活了圖片中所反映的文字,而達(dá)到提取文字和利用原文所包含的文字進(jìn)行檢索的目的。但是不進(jìn)行人工校對(duì)和版式還原,識(shí)別的準(zhǔn)確率取決于原始資源的情況及保存現(xiàn)狀。優(yōu)點(diǎn):效率

21、高、成本低、能利用原文檢索瀏覽速度快。缺點(diǎn):識(shí)別準(zhǔn)確率取決于原件的質(zhì)量,所以準(zhǔn)確率不穩(wěn)定。適應(yīng)范圍:、原件版面干凈及保存完好的資源。 (準(zhǔn)確率可達(dá)95%以上)、原文中只含部份核心檢索內(nèi)容的資源。(如學(xué)籍檔案,檢索的重點(diǎn)2. 進(jìn)行人工校對(duì):其原理是在OCR 的基礎(chǔ)上,為了確保識(shí)別的準(zhǔn)確率而增加了人工校對(duì)和版式還原的工序??蓪?shí)現(xiàn)無(wú)障礙的全文檢索。優(yōu)點(diǎn):全文檢索無(wú)差錯(cuò),準(zhǔn)確率可達(dá)99%,且文本層和圖像層一一對(duì)應(yīng)。缺點(diǎn):效率極低、成本極高、因?yàn)檫M(jìn)行了版式還原,所以原真率不到98%,而且存儲(chǔ)空間很大而致瀏覽速度降低。適應(yīng)范圍:、所載信息珍貴且使用頻率很高的資源。、數(shù)字化項(xiàng)目資金預(yù)算充裕且項(xiàng)目實(shí)施時(shí)間寬松

22、的資源。、有很好的硬件環(huán)境支持的數(shù)字化項(xiàng)目。六、總質(zhì)檢1. 對(duì)掃描處理完成后的圖像頁(yè)進(jìn)行檢驗(yàn),對(duì)檔案拆分、掃描、修正、去污、插圖、照片的處理以及文本和圖像頁(yè)的匹配等質(zhì)量進(jìn)行全面檢驗(yàn),對(duì)于質(zhì)量達(dá) 不到要求的進(jìn)行重掃、補(bǔ)掃等操作。2. 對(duì)文本域錄入與文本錄入域的標(biāo)引、文件的頁(yè)號(hào)和頁(yè)數(shù)進(jìn)行對(duì)比,對(duì)掃描前圖像頁(yè)的標(biāo)引與掃描后的圖像頁(yè)的編號(hào)與頁(yè)數(shù)進(jìn)行對(duì)比,發(fā)現(xiàn)不合格的登記清單重新處理。3. 對(duì)圖像質(zhì)量的檢查,確保圖像版面清晰,干凈,大小一致,方向一致。4. 主要質(zhì)檢標(biāo)準(zhǔn):4.1. 加工后的電子影像在總數(shù)量、完整性、清晰度上與源文件保持一致。4.2. 案卷著錄、按文件的屬性著錄數(shù)據(jù)庫(kù)字段,檢查“文件路徑”

23、字段與文件實(shí)際存儲(chǔ)位置一致,差錯(cuò)率控制在千分之五以?xún)?nèi)。4.3. 電子影像檔案件信息定義數(shù)據(jù)差錯(cuò)率控制在百分之二以?xún)?nèi)。4.4. 電子影像檔案卷內(nèi)頁(yè)碼差錯(cuò)率控制在千分之一以?xún)?nèi)。4.5. 每頁(yè)電子影像左右端正度控制在三度以?xún)?nèi)。4.6. 電子影像漏掃,壓邊率控制在千分之一以?xún)?nèi)。4.7. 電子檔案與條目數(shù)據(jù)的掛接一致,差錯(cuò)率小于千分之一以?xún)?nèi)。七、批量掛接1 掃描處理后的圖像成品,按年度、機(jī)構(gòu)上傳至檔案專(zhuān)用服務(wù)器,利用檔案管理軟件中的對(duì)應(yīng)掛接功能將掃描圖像信息與錄入到檔案管理軟件系統(tǒng)中的目錄進(jìn)行對(duì)應(yīng)掛接,確保目錄與原文的一一對(duì)應(yīng)。2 掛接到檔案管理系統(tǒng)中區(qū),進(jìn)行再次的成品驗(yàn)收。八、還卷及數(shù)據(jù)備份提交1.

24、原始檔案還原工作嚴(yán)格按照國(guó)家檔案局規(guī)定的相關(guān)標(biāo)準(zhǔn)和實(shí)際情況進(jìn)行有序的還原,將還原的檔案資料逐卷精心檢查,確實(shí)沒(méi)有落頁(yè)、掉頁(yè)、折頁(yè)等問(wèn)題后再歸還檔案管理人員,經(jīng)雙方仔細(xì)核實(shí)無(wú)誤后,在還卷交接單上簽字確認(rèn)。2. 在數(shù)據(jù)化加工過(guò)程中的各項(xiàng)工作記錄,在數(shù)據(jù)轉(zhuǎn)移完成后、提交給用戶方。3. 為了有效地保護(hù)數(shù)據(jù),因此建立數(shù)據(jù)備份制度,在數(shù)字化加工項(xiàng)目工作 結(jié)束,并經(jīng)用戶在終驗(yàn)報(bào)告上簽字確認(rèn)后,將通過(guò)驗(yàn)收后的數(shù)據(jù)利用用戶軟件 的光盤(pán)制作功能刻錄成光盤(pán),刻錄到DVD光盤(pán)中,刻錄完成后再制作一個(gè)光盤(pán)備份,或用移動(dòng)硬盤(pán)等存儲(chǔ)介質(zhì),將所有成品數(shù)據(jù)備份,提交給用戶。4. 刻錄光盤(pán)要求:4.1 、光盤(pán)制作兩份,制作成檔案

25、數(shù)據(jù)格式為多頁(yè)TIFF 的光盤(pán)單盤(pán)調(diào)閱。4.2 、同一份文件不跨越二片DVD片號(hào)(同一份文件頁(yè)數(shù)需在同一DVD內(nèi))4.3 、電子檔案存在于符合標(biāo)準(zhǔn)的單片包裝光盤(pán)4.4 、光盤(pán)標(biāo)示光盤(pán)編號(hào),單片包裝盒上注明光盤(pán)內(nèi)主要信息4.5 、在光盤(pán)刻錄完成后,與硬盤(pán)系統(tǒng)中電子檔案進(jìn)行一次比對(duì),確保檔案資料無(wú)遺漏及正確性。4.6 、制作光盤(pán)人員對(duì)于所有光盤(pán)序號(hào)進(jìn)行標(biāo)記,并提交相應(yīng)表格。第三節(jié)質(zhì)量控制方案和保證措施項(xiàng)目加工總體質(zhì)量目標(biāo):保證合格、爭(zhēng)創(chuàng)優(yōu)良!一、加工質(zhì)量保障措施1. 嚴(yán)格遵照?qǐng)?zhí)行我方簽定的不分包、轉(zhuǎn)包三峽大學(xué)檔案數(shù)字化項(xiàng)目承諾書(shū),避免項(xiàng)目轉(zhuǎn)包、分包引起的管理混亂和質(zhì)量風(fēng)險(xiǎn)。2. 嚴(yán)格按照我方制定的

26、人員和設(shè)備投入計(jì)劃進(jìn)場(chǎng)加工,確保人員設(shè)備供應(yīng),為項(xiàng)目進(jìn)度和質(zhì)量提供保障。3. 在該項(xiàng)目加工過(guò)程中,我方所有現(xiàn)場(chǎng)加工人員均受我公司數(shù)字化作業(yè)人員質(zhì)量考核制度的約束,并承擔(dān)相應(yīng)獎(jiǎng)罰結(jié)果。二、多環(huán)節(jié),多層次的質(zhì)量檢查體系。1. 對(duì)檔案簽收和屬性數(shù)據(jù)錄入的質(zhì)量檢查,主要內(nèi)容:檔案簽收的準(zhǔn)確性, 完整性和即時(shí)性;數(shù)據(jù)內(nèi)容齊全,屬性數(shù)據(jù)輸入準(zhǔn)確;與數(shù)據(jù)校對(duì)的檔案交接。2. 對(duì)數(shù)據(jù)校對(duì)處理的質(zhì)量檢查,主要內(nèi)容: 校對(duì)后的數(shù)據(jù)內(nèi)容齊全, 正確; 紙質(zhì)檔案實(shí)體完整,還案及時(shí)無(wú)誤。3. 對(duì)數(shù)據(jù)遷移的質(zhì)量檢查,主要內(nèi)容:遷移后的數(shù)據(jù)的完整性準(zhǔn)確性;對(duì)數(shù)據(jù)進(jìn)行組合查詢(xún)并且結(jié)果正確;對(duì)數(shù)據(jù)進(jìn)行匯總統(tǒng)計(jì)并輸出標(biāo)準(zhǔn)表 格,

27、試運(yùn)行無(wú)死機(jī)現(xiàn)象。4. 在完成以上每個(gè)環(huán)節(jié)后,檢查人員將其數(shù)據(jù)再次進(jìn)行一遍全面的復(fù)查, 尤其對(duì)檢查記錄單上更正后的錯(cuò)誤進(jìn)行仔細(xì)的檢查,確保掃描得來(lái)的數(shù)據(jù)與源文件內(nèi)容完全一致。5. 實(shí)施項(xiàng)目負(fù)責(zé)人對(duì)成品數(shù)據(jù)進(jìn)行百分之十的抽查,在抽查時(shí)將該查數(shù)據(jù)的年度、保管期限、全宗號(hào)、卷號(hào)、卷內(nèi)順序號(hào)等目錄信息是否準(zhǔn)確無(wú)誤,再對(duì)獲取圖像數(shù)據(jù)的亮度、歪斜、是否錯(cuò)頁(yè)等方面進(jìn)行抽查,如有不合格的數(shù)據(jù)及時(shí)進(jìn)行統(tǒng)計(jì)和修正,確保最終數(shù)據(jù)的準(zhǔn)確無(wú)誤。三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終極保障。階段驗(yàn)收?qǐng)?bào)告項(xiàng)目名稱(chēng)項(xiàng)目編號(hào)報(bào)告人時(shí)間項(xiàng)目負(fù)責(zé)人所處階段 項(xiàng)目狀態(tài)參數(shù)監(jiān)控情況項(xiàng)目狀態(tài)計(jì)劃情況實(shí)際情況偏差掃描糾正措

28、施項(xiàng)目進(jìn)度項(xiàng) 目 工 作 量(人時(shí)) 項(xiàng)目規(guī)模項(xiàng) 目 外 工 作量 情 況 描 述( 非 項(xiàng) 目 工作)其他工作中遇到問(wèn)題及困難:需要用戶支持與配合:用戶意見(jiàn):用戶簽字: 簽字日期:終驗(yàn)報(bào)告項(xiàng)目名稱(chēng)項(xiàng)目編號(hào)報(bào)告人項(xiàng)目負(fù)責(zé)人時(shí)間第()階段本階段項(xiàng)目完成情況檔案整理(驗(yàn)收項(xiàng)目卷)完成情況檔案掃描(A4頁(yè), A3頁(yè),其他頁(yè))圖像處理(卷頁(yè))索引目錄錄入( 全文 OCR所有報(bào)表輸出(條)卷)備注資料裝訂(卷,件) 內(nèi)部驗(yàn)收(頁(yè))目錄與圖像文件的銜接數(shù)據(jù)是否上傳到服務(wù)器第四節(jié)安全保密控制一、為了確保采集數(shù)據(jù)不外泄,在開(kāi)始進(jìn)行數(shù)字化加工后,我公司將不允許加工人員攜帶任何存儲(chǔ)介質(zhì)進(jìn)出加工現(xiàn)場(chǎng)。二、為避免采集

29、數(shù)據(jù)在硬盤(pán)上的物理磁道上被還原外泄,我公司將使用乙方提供的電腦用于數(shù)據(jù)采集作業(yè)。三、電腦上所有的可以讀寫(xiě)存儲(chǔ)介質(zhì)的接口,自進(jìn)場(chǎng)之日起即貼上封條,直到工程完工。四、為避免數(shù)據(jù)采集過(guò)程中數(shù)據(jù)通過(guò)網(wǎng)絡(luò)外泄,我公司在加工期間將關(guān)閉外網(wǎng),只使用局域網(wǎng)完成數(shù)字化作業(yè)。五、為了建立并嚴(yán)格落實(shí)安全保密制度,保證檔案資料的安全保密性,做到絕對(duì)不外泄任何信息。保密協(xié)議將同加工合同同時(shí)簽定并成為合同不可分割的一部分。見(jiàn)附件。附件:保密協(xié)議保密協(xié)議甲方: 地址:乙方:武漢 xx 數(shù)字科技有限公司地址:武漢市武昌區(qū)街道口阜華大廈B 座 1702鑒于甲方委托乙方承擔(dān)其檔案資料的數(shù)字化加工服務(wù),乙方可能接觸到甲方某些非公開(kāi)

30、的,涉密的文件、檔案和資料,為了維護(hù)甲方資料的安全,保守國(guó)家秘密,乙方同意在整理檔案中涉及大量的重要的檔案材料承擔(dān)保密義務(wù), 并遵守如下保密規(guī)定:1, 乙方同意上訴須保密的文件和資料承擔(dān)保密義務(wù),數(shù)字化期間保證上訴文件和資料秘密安全,不得以任何形式向第三方(包括家屬、親友) 談?wù)摴ぷ髦薪佑|的文件資料內(nèi)容。2, 在乙方工作人員在工作過(guò)程中接觸到重要文件資料時(shí),除確有必要(如自擬文件標(biāo)題,圖像處理等需要查看文件內(nèi)容外)不得閱讀文件資料內(nèi)容。3,乙方工作人員不得帶進(jìn)、帶出各種計(jì)算機(jī)磁盤(pán)、光盤(pán)等易于存儲(chǔ)文件資料的存儲(chǔ)介質(zhì);4,因工作需要必須帶進(jìn)的計(jì)算機(jī)軟件工具類(lèi)應(yīng)用軟件,須經(jīng)檔案室同意,并在帶出時(shí)辦理

31、檢查登記手續(xù)。5,甲方提供乙方所需數(shù)字化處理的文件和資料等有形載體,僅限于乙方 基于甲方需要制作檔案數(shù)字化產(chǎn)品的應(yīng)用,乙方不得復(fù)制以上的任何文件和資料,或向第三方泄露;同時(shí)乙方在結(jié)束本期工作,所加工的數(shù)據(jù) 經(jīng)甲方按照合同驗(yàn)收合格后,必須無(wú)條件將其工作組機(jī)器內(nèi)的數(shù)據(jù) 清理干凈。6,乙方工作人員在工作任務(wù)實(shí)事工程中,非工作需要不得將檔案資料帶出工作場(chǎng)所,不得私自記錄或議論甲方涉密文件資料的內(nèi)容。7,乙方應(yīng)承擔(dān)本協(xié)議約定的保密責(zé)任,妥善保管有觀點(diǎn)文件和資料,并對(duì)有關(guān)人員進(jìn)行有效管理,以確保本協(xié)議的履行。8,乙方工作人員在工作過(guò)程中造成泄密或遺失文件資料的,甲方視情節(jié)輕重追究其行政甚至刑事責(zé)任。9,未

32、盡事宜,按保密法等有關(guān)規(guī)定執(zhí)行。10, 本協(xié)議一式貳份,甲乙雙方各執(zhí)一份,其有同等的法律效率,本協(xié)議經(jīng)甲乙雙方簽字蓋章立即生效。甲方:乙方:代表人(簽字)代表人(簽字)第五節(jié)售后服務(wù)一、二、享有在雙方簽字驗(yàn)收合格后12 個(gè)月內(nèi)的免費(fèi)技術(shù)服務(wù)一般技術(shù)響應(yīng)時(shí)間為24 小時(shí),若出現(xiàn)數(shù)據(jù)加工質(zhì)量問(wèn)題,在48 小時(shí)內(nèi)到達(dá)現(xiàn)場(chǎng)進(jìn)行服務(wù)。三、為檔案館軟件使用人員提供免費(fèi)的檔案資料加工軟件的使用培訓(xùn),同時(shí)有義務(wù)提供有償?shù)暮罄m(xù)技術(shù)支持。四、保證建庫(kù)的檔案資料電子影像的數(shù)據(jù)質(zhì)量,對(duì)出現(xiàn)質(zhì)量問(wèn)題的檔案資料, 有重新整理,免費(fèi)補(bǔ)掃的責(zé)任。五、電話支持服務(wù):提供7 24 小時(shí)電話支持,售后服務(wù)電話:0xx501xx0六

33、、在線 QQ技術(shù)服務(wù):提供5-8 小時(shí) QQ在線支持,號(hào)碼: xx77、 電子郵件服務(wù):在收到郵件的8 小時(shí)內(nèi)做出響應(yīng)。郵件地址:xxcom 八、 定期回訪服務(wù)。在售后服務(wù)有效期內(nèi),我公司將安排不少于三次的定期回訪服務(wù),以了解用戶使用狀況,收集反饋意見(jiàn)等。1總則1.1為了加強(qiáng)公司的環(huán)境衛(wèi)生管理,創(chuàng)造一個(gè)整潔、文明、溫馨的購(gòu)物、辦公環(huán)境,根據(jù)公共場(chǎng)所衛(wèi)生管理?xiàng)l例的要求,特制定本制度。1.2集團(tuán)公司的衛(wèi)生管理部門(mén)設(shè)在企管部,并負(fù)責(zé)將集團(tuán)公司的衛(wèi)生區(qū)域詳細(xì)劃分到各部室,各分公司所轄區(qū)域衛(wèi)生由分公司客服部負(fù)責(zé)劃分,確保無(wú)遺漏。2衛(wèi)生標(biāo)準(zhǔn)2.1室內(nèi)衛(wèi)生標(biāo)準(zhǔn)2.1.1地面、墻面:無(wú)灰塵、無(wú)紙屑、無(wú)痰跡、無(wú)

34、泡泡糖等粘合物、無(wú)積水,墻角無(wú)灰吊、無(wú)蜘蛛網(wǎng)。2.1.2門(mén)、窗、玻璃、鏡子、柱子、電梯、樓梯、燈具等,做到明亮、無(wú)灰塵、無(wú)污跡、無(wú)粘合物,特別是玻璃,要求兩面明亮。2.1.3柜臺(tái)、貨架:清潔干凈,貨架、柜臺(tái)底層及周?chē)鸁o(wú)亂堆亂放現(xiàn)象、無(wú)灰塵、無(wú)粘合物,貨架頂部、背部和底部干凈,不存放雜物和私人物品。2.1.4購(gòu)物車(chē)(筐)、直接接觸食品的售貨工具(包括刀、叉等) :做到內(nèi)外潔凈,無(wú)污垢和粘合物等。購(gòu)物車(chē)(筐)要求每天營(yíng)業(yè)前簡(jiǎn)單清理,周五全面清理消毒;售貨工具要求每天消毒,并做好記錄。2.1.5商品及包裝:商品及外包裝清潔無(wú)灰塵(外包裝破損的或破舊的不得陳列)。2.1.6收款臺(tái)、服務(wù)臺(tái)、辦公櫥、存包

35、柜:保持清潔、無(wú)灰塵,臺(tái)面和側(cè)面無(wú)灰塵、無(wú)灰吊和蜘蛛網(wǎng)。桌面上不得亂貼、亂畫(huà)、亂堆放物品,用具擺放有序且干凈,除當(dāng)班的購(gòu)物小票收款聯(lián)外,其它單據(jù)不得存放在桌面上。2.1.7垃圾桶:桶內(nèi)外干凈,要求營(yíng)業(yè)時(shí)間隨時(shí)清理,不得溢出,每天下班前徹底清理,不得留有垃圾過(guò)夜。2.1.8窗簾:定期進(jìn)行清理,要求干凈、無(wú)污漬。2.1.9吊飾:屋頂?shù)牡躏椧鬅o(wú)灰塵、無(wú)蜘蛛網(wǎng),短期內(nèi)不適用的吊飾及時(shí)清理徹底。2.1.10內(nèi)、外倉(cāng)庫(kù):半年徹底清理一次,無(wú)垃圾、無(wú)積塵、無(wú)蜘蛛網(wǎng)等。2.1.11室內(nèi)其他附屬物及工作用具均以整潔為準(zhǔn),要求無(wú)灰塵、無(wú)粘合物等污垢。2.2室外衛(wèi)生標(biāo)準(zhǔn)2.2.1門(mén)前衛(wèi)生:地面每天班前清理,平時(shí)每

36、一小時(shí)清理一次,每周四營(yíng)業(yè)結(jié)束后有條件的用水沖洗地面(冬季可根據(jù)情況適當(dāng)清理) ,墻面干凈且無(wú)亂貼亂畫(huà)。2.2.2院落衛(wèi)生:院內(nèi)地面衛(wèi)生全天保潔,果皮箱、消防器械、護(hù)欄及配電箱等設(shè)施每周清理干凈。垃圾池周邊衛(wèi)生清理徹底,不得有垃圾溢出。2.2.3綠化區(qū)衛(wèi)生:做到無(wú)雜物、無(wú)紙屑、無(wú)塑料袋等垃圾。3清理程序3.1室內(nèi)和門(mén)前院落等區(qū)域衛(wèi)生: 每天營(yíng)業(yè)前提前 10 分鐘把所管轄區(qū)域內(nèi)衛(wèi)生清理完畢,營(yíng)業(yè)期間隨時(shí)保潔。下班后 5-10 分鐘清理桌面及衛(wèi)生區(qū)域。3.2綠化區(qū)衛(wèi)生:每周徹底清理一遍,隨時(shí)保持清潔無(wú)垃圾。4管理考核4.1實(shí)行百分制考核,每月一次(四個(gè)分公司由客服部分別考核、集團(tuán)職4.2集團(tuán)堅(jiān)持定

37、期檢查和不定期抽查的方式監(jiān)督各分公司、部門(mén)的衛(wèi)生工作。每周五為衛(wèi)生檢查日,集團(tuán)檢查結(jié)果考核至各分武漢 xx 數(shù)字科技有限公司目錄第一節(jié)質(zhì)數(shù)字化加工作業(yè)前期準(zhǔn)備一、數(shù)字化工作人員準(zhǔn)備11二、數(shù)字化工作軟件、硬件準(zhǔn)備4第二節(jié)三、確定數(shù)字化內(nèi)容、數(shù)量及用戶需求數(shù)字化加工流程及主要技術(shù)方案65一、入庫(kù)提卷、拆卷6二、標(biāo)引著錄 7三、檔案掃描 8四、圖像處理 11 五、全文 OCR、生成雙層 pdf、板式還原及格式 12 六、總質(zhì)檢 14七、批量掛接 15八、還卷及數(shù)據(jù)備份提交15第三節(jié)質(zhì)量控制方案和保證措施17一、加工質(zhì)量保障措施17二、多環(huán)節(jié),多層次的質(zhì)量檢查體系17三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格

38、驗(yàn)收程序是質(zhì)量控制的終級(jí)保障19第四節(jié)安全保密控制 21保密協(xié)議 22第五節(jié)售后服務(wù) 24項(xiàng)目背景隨著全國(guó)文化信息資源共享工程與中國(guó)數(shù)字圖書(shū)館工程的起動(dòng),信息化已 成為國(guó)際潮流,信息資源建設(shè)成為當(dāng)務(wù)之急。信息資源建設(shè)的重點(diǎn)是電子文獻(xiàn)、各類(lèi)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)資源、電子檔案、電子圖書(shū)等新型數(shù)字化信息資源的建設(shè)。 在數(shù)字化信息資源建設(shè)中,很大的一個(gè)需求是將現(xiàn)有的紙介質(zhì)印刷品數(shù)字化, 使之成為能夠用計(jì)算機(jī)閱讀、理解、查詢(xún)、檢索的電子文件,最終將其應(yīng)用于 數(shù)據(jù)庫(kù)存儲(chǔ),或通過(guò)CD-RO、M Internet網(wǎng)進(jìn)行出版,或上傳數(shù)字檔案館供用戶使用。以傳統(tǒng)紙張為載體的保存方式,占據(jù)了大量的空間,需要特殊的環(huán)境,而且

39、不方便查詢(xún),隨著時(shí)間的推移,還面臨著腐蝕、老化等問(wèn)題。而將紙介質(zhì)文件信息進(jìn)行電子化處理,保存到光盤(pán)上,具有存儲(chǔ)、管理、共享等功能,還可以減少文件庫(kù)房占地,節(jié)省保管設(shè)備和人員方面開(kāi)支,又方便統(tǒng)計(jì)和進(jìn)行遠(yuǎn)程查詢(xún)。因此,將檔案、期刊、文件等資料通過(guò)掃描儀,掃描成圖像文件,再通過(guò)處理轉(zhuǎn)換成電子文檔,建立目錄和索引,制作成電子文件,已是當(dāng)務(wù)之急。公司簡(jiǎn)介武漢 xx 數(shù)字科技有限責(zé)任公司 (前身是湖北華新職業(yè)學(xué)院數(shù)字科研中心)成立于 1994 年,是在原國(guó)家科委的支持下, 為推進(jìn)建設(shè)國(guó)家 “工程” 高等學(xué)校中英文圖書(shū)數(shù)字化國(guó)際合作計(jì)劃(China-America Digital AcademicLibra

40、ry)“CADA”L 項(xiàng)目而成立的一家高新技術(shù)企業(yè)。公司擁有先進(jìn)的OCR(雙層光學(xué)字符識(shí)別)技術(shù),圖像掃描處理系統(tǒng)、生產(chǎn)流程管理系統(tǒng),實(shí)現(xiàn)工廠化流水作業(yè),智能化質(zhì)量控制與管理的具有國(guó)際領(lǐng)先水平的信息數(shù)字化工廠技術(shù)??赏瑫r(shí)為圖書(shū)館、檔案館、政府、企業(yè)提供信息管理系統(tǒng)和信息資源數(shù)字化加工服務(wù)。經(jīng)過(guò)六年的不斷探索和實(shí)踐,公司建立了一套完善的服務(wù)于各領(lǐng)域的 業(yè)務(wù)體系,檔案館:檔案綜合管理系統(tǒng),檔案、古籍、期刊、論文、文獻(xiàn)資料數(shù)字化加工,檔案著錄、OCR,數(shù)據(jù)制作、檔案館設(shè)備及耗材提供等。政府機(jī)關(guān):數(shù)字檔案管理系統(tǒng),歷史陳舊檔案數(shù)字化加工。醫(yī)療、保險(xiǎn)金融領(lǐng) 域: 病歷、保單等數(shù)字化加工,數(shù)據(jù)錄入服務(wù),全

41、文等。第一節(jié)數(shù)字化加工作業(yè)前期準(zhǔn)備一數(shù)字化工作人員準(zhǔn)備3 .甲方人員職務(wù):現(xiàn)場(chǎng)交接管理人員人數(shù)要求:一名專(zhuān)業(yè)要求:為學(xué)校檔案館負(fù)責(zé)檔案管理工作的技術(shù)或管理人員。職責(zé)范圍:. 負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作,協(xié)同甲方人員作好交接清單記錄并簽字。. 負(fù)責(zé)監(jiān)督乙方規(guī)范化加工。隨時(shí)把握乙方加工進(jìn)度并進(jìn)行協(xié)調(diào)。. 及時(shí)關(guān)注并抽查乙方加工質(zhì)量代表甲方與乙方進(jìn)行及時(shí)的溝通及問(wèn)題協(xié)調(diào),確保項(xiàng)目順利完工。4 乙方人員4.1 管理人員主要為:熟悉現(xiàn)場(chǎng)加工管理,熟悉數(shù)字化整體作業(yè)流程,具有較強(qiáng)組織能力和現(xiàn)場(chǎng)管理及溝通能力的乙方負(fù)責(zé)人。4.2 工程技術(shù)人員主要為:熟悉計(jì)算機(jī)軟、硬件技術(shù),了解檔案數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)和系統(tǒng)

42、開(kāi)發(fā)。了解檔案管理等相關(guān)專(zhuān)業(yè)知識(shí)的乙方技術(shù)部技術(shù)支持工程師。4.3 數(shù)據(jù)采集作業(yè)員主要為:了解檔案數(shù)據(jù)庫(kù)數(shù)據(jù)標(biāo)準(zhǔn)和計(jì)算機(jī)軟件應(yīng)用等相關(guān)知識(shí)的乙方數(shù)字化制作部工作人員。人員安排見(jiàn)表 3-1職務(wù)職責(zé)人員1. 負(fù)責(zé)人員,資源的調(diào)配工作。2. 負(fù)責(zé)施工組織設(shè)計(jì)、管理。備注項(xiàng)目負(fù)責(zé)人不 一定 要常 駐現(xiàn)場(chǎng),但要通過(guò)項(xiàng)目負(fù)責(zé)人管理人員現(xiàn)場(chǎng)主管3. 負(fù)責(zé)施工條件的保障及與甲乙雙方關(guān)于項(xiàng)目進(jìn)展?fàn)顟B(tài)的匯報(bào)和協(xié)調(diào)工作。5. 負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作6. 負(fù)責(zé)現(xiàn)場(chǎng)的人員管理和加工管理7. 負(fù)責(zé)數(shù)據(jù)的終驗(yàn)和掛接8. 配合項(xiàng)目負(fù)責(zé)人做好與乙方的溝通協(xié)調(diào)工作。一 切通 訊手 段1 人 和 定期 到現(xiàn) 場(chǎng)的督導(dǎo)

43、, 切實(shí)做到 對(duì)該 項(xiàng)目 加工 進(jìn)度 和加 工質(zhì)量的掌控1 人1 人著錄人員負(fù)責(zé)將檔案卷內(nèi)目錄及其它索引信息進(jìn)行手工錄入為電子數(shù)據(jù)信息并校對(duì)數(shù)負(fù)責(zé)按制定的技術(shù)規(guī)范將檔案資料掃據(jù) 掃描人員采集人員圖像處理描1 人5. 去污:將掃描獲取的圖像進(jìn)行圖像去污;去黑邊及去雜點(diǎn)等;6. 糾偏:將偏斜的圖像進(jìn)行糾正處理;在進(jìn)行圖像處 理的時(shí)候, 肯定是逐頁(yè)處理, 所以要留意每一人員圖像矢量化人員7. 文字處理:將不清楚的文字進(jìn)行加深或變淺;8. 拼接:將頁(yè)面較大的圖像進(jìn)行拼接處理;4. 負(fù)責(zé)將處理好的圖像進(jìn)行全文識(shí)別、5. 校對(duì)、板式還原和格式轉(zhuǎn)換6. 對(duì)已經(jīng)產(chǎn)生的成品數(shù)據(jù)進(jìn)行初驗(yàn)后移交給現(xiàn)場(chǎng)主管終驗(yàn)并掛接

44、。1 人1-3人頁(yè)掃描的質(zhì)量,發(fā)現(xiàn)掃描質(zhì)量問(wèn)題立即發(fā)還上一工序重掃并作好記錄。矢量化人員最終定員需結(jié)合矢量化的圖形數(shù)量和采集難度。二 .數(shù)字化工作軟、硬件準(zhǔn)備6. 配備硬件數(shù)量及檔次要視數(shù)據(jù)采集工作情況及數(shù)據(jù)量大小。7. 甲方提供 PC機(jī) 4-6 臺(tái)給乙方作為采集作業(yè)使用,其他硬件設(shè)備由乙方自行解決。8. 場(chǎng)地: 甲方提供。9. 辦公用具:甲方提供打印機(jī)(以實(shí)際用量為標(biāo)準(zhǔn))辦公桌椅檔案資料的裝訂及打印機(jī)所用的全部耗材。10. 其他條件:提供電力和飲水。軟硬件準(zhǔn)備詳見(jiàn)表3-2表 3-2軟、硬件配備列表軟、硬件名稱(chēng)數(shù)量詳細(xì)配置響應(yīng)時(shí)間提供方1. 需支持全文檢索使用功綜合檔案管理系統(tǒng)一套數(shù)字化流程管

45、理和加工全套軟件、 OCR 軟件能。2. 支持 TIFF 和PDF 格式數(shù)據(jù)的批量掛接功能。能 滿 足 本 加工項(xiàng) 目 所 有 的技術(shù)要求項(xiàng)目開(kāi)始需甲方到位項(xiàng)目開(kāi)始需乙方到位甲方服務(wù)器一臺(tái)項(xiàng)目開(kāi)始需到位掃描儀( A3 幅面)一臺(tái)富士通 A3 幅面FI-4750C(ADF)A4 幅面項(xiàng)目開(kāi)始需到位乙方項(xiàng)目開(kāi)始需掃描儀( A4 幅面)一臺(tái)虹光-FB6030(平板)到位乙方計(jì)算機(jī)4-6 套PC 機(jī)項(xiàng)目開(kāi)始需甲方到位三.確定數(shù)字化內(nèi)容、數(shù)量及用戶需求在數(shù)據(jù)采集之前,首先要客觀真實(shí)統(tǒng)計(jì)數(shù)字化內(nèi)容和數(shù)量,確定用戶使用需求, 然后制定對(duì)應(yīng)方案和技術(shù)控制以便準(zhǔn)確地進(jìn)行施工安排。表 3-3三峽大學(xué)檔案館檔案數(shù)字

46、化用戶需求調(diào)研表檔案類(lèi)型檔案數(shù)量數(shù)字化準(zhǔn)備情況紙張及保存情況用戶需求備約件招生名冊(cè)約面約件學(xué)籍檔案約面約件學(xué)生成績(jī)約面約件黨群檔案約面約件基建檔案約面約件科研檔案約面其它:約件約面檔案裝訂檔案著錄注很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化很好一般影像化較差很差矢量化檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序填表人職務(wù)第二節(jié)數(shù)字化加工

47、流程及主要技術(shù)方案檔案數(shù)字化加工主要流程包括:提卷- 拆卷- 檔案著錄 - 掃描- 圖像處理 -OCR-校對(duì)- 版式還原 - 轉(zhuǎn)雙層 PDF-終驗(yàn)- 掛接。一、入庫(kù)提卷、拆卷1. 從檔案室移交檔案,嚴(yán)格執(zhí)行原始檔案的交接手續(xù),使用雙方項(xiàng)目負(fù)責(zé)人確認(rèn)的檔案交接清單(完成清點(diǎn)登記) 。2. 檔案整理:編寫(xiě)頁(yè)碼、核對(duì)紙質(zhì)檔案頁(yè)碼、對(duì)可拆釘?shù)奈募霾疳斕幚硪赃m應(yīng)掃描的要求、對(duì)需要修復(fù)的檔案進(jìn)行歸并整理(如果發(fā)現(xiàn)破損嚴(yán)重,無(wú)法 直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、折皺不平影響掃描質(zhì)量的原件應(yīng)先 進(jìn)行相應(yīng)處理后再進(jìn)行掃描,發(fā)現(xiàn)破損嚴(yán)重的檔案須立即報(bào)知項(xiàng)目相關(guān)負(fù)責(zé)人) 制作卷內(nèi)目錄,掃描文件抽取3 按照掃

48、描處理量明確交接周期和檔案交接量(雙方項(xiàng)目負(fù)責(zé)人簽字, 以保在施工過(guò)程中檔案不損失、不丟失。 )二、標(biāo)引著錄按要求將文件所需信息錄入到軟件數(shù)據(jù)庫(kù)里,標(biāo)引著錄按照國(guó)家檔案局有關(guān)標(biāo)準(zhǔn)結(jié)合用戶檔案著錄的具體要求進(jìn)行。3. 錄入方式采用手工錄入的方式4. 校對(duì)方式校對(duì)以軟件校對(duì)和打印輸出、對(duì)比校對(duì)相結(jié)合,錯(cuò)誤率在萬(wàn)分之二以下。案卷目錄和卷內(nèi)目錄按照檔案的原始數(shù)據(jù)錄入。卷案目錄和卷內(nèi)目錄的樣式經(jīng)用戶同意可做相應(yīng)調(diào)整。對(duì)檔案目錄數(shù)據(jù)修改和補(bǔ)充的數(shù)據(jù),須填寫(xiě)更改資料、更改資料放入原案卷內(nèi),卷內(nèi)目錄及其他不全的需補(bǔ)充完整。三、檔案掃描10. 掃描方式:根據(jù)檔案幅面的大小選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn)行掃描。大幅面檔案可采

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論