版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、最新資料推薦 檔案室、檔案館 館藏檔案掃描、數(shù)字化加工 整體解決方案 -0 - 最新資料推薦 第一節(jié)質(zhì)數(shù)字化加工作業(yè)前期準(zhǔn)備1 一、數(shù)字化工作人員準(zhǔn)備1 二、數(shù)字化工作軟件、硬件準(zhǔn)備 4 三、確定數(shù)字化內(nèi)容、數(shù)量及用戶需求 5 第二節(jié)數(shù)字化加工流程及主要技術(shù)方案6 一、入庫(kù)提卷、拆卷 6 二、標(biāo)引著錄7 三、檔案掃扌苗 8 四、圖像處理11 五、全文OCR、生成雙層pdf、板式還原及格式12 六、總質(zhì)檢 14 七、批量掛接15 八、還卷及數(shù)據(jù)備份提交 15 第三節(jié) 質(zhì)量控制方案和保證措施 17 一、 加工質(zhì)量保障措施 17 二、多環(huán)節(jié),多層次的質(zhì)量檢查體系 17 三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)
2、格驗(yàn)收程序是質(zhì)量控制的終 級(jí)保障19 第四節(jié) 安全保密控制 21 保密協(xié)議 22 第五節(jié) 售后服務(wù)24 項(xiàng)目背景 隨著全國(guó)文化信息資源共享工程與中國(guó)數(shù)字圖書(shū)館工程的起動(dòng),信息化已 成為國(guó)際潮流,信息資源建設(shè)成為當(dāng)務(wù)之急。信息資源建設(shè)的重點(diǎn)是電子文獻(xiàn)、 各類(lèi)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)資源、電子檔案、電子圖書(shū)等新型數(shù)字化信息資源的建設(shè)。 在數(shù)字化信息資源建設(shè)中,很大的一個(gè)需求是將現(xiàn)有的紙介質(zhì)印刷品數(shù)字化, 使之成為能夠用計(jì)算機(jī)閱讀、理解、查詢、檢索的電子文件,最終將其應(yīng)用于 數(shù)據(jù)庫(kù)存儲(chǔ),或通過(guò) CD-RO、M Internet 網(wǎng)進(jìn)行出版,或上傳數(shù)字檔案館供用戶 使用。 以傳統(tǒng)紙張為載體的保存方式,占據(jù)了大量的
3、空間,需要特殊的環(huán)境,而 且不方便查詢,隨著時(shí)間的推移,還面臨著腐蝕、老化等問(wèn)題。而將紙介質(zhì)文 件信息進(jìn)行電子化處理,保存到光盤(pán)上,具有存儲(chǔ)、管理、共享等功能,還可 以減少文件庫(kù)房占地,節(jié)省保管設(shè)備和人員方面開(kāi)支,又方便統(tǒng)計(jì)和進(jìn)行遠(yuǎn)程 查詢。 因此,將檔案、期刊、文件等資料通過(guò)掃描儀,掃描成圖像文件,再通過(guò) 處理轉(zhuǎn)換成電子文檔,建立目錄和索引,制作成電子文件,已是當(dāng)務(wù)之急。 - 3 - 第一節(jié) 數(shù)字化加工作業(yè)前期準(zhǔn)備 一數(shù)字化工作人員準(zhǔn)備 1 . 甲方人員 職務(wù):現(xiàn)場(chǎng)交接管理人員 人數(shù)要求:一名 專(zhuān)業(yè)要求:為學(xué)校檔案館負(fù)責(zé)檔案管理工作的技術(shù)或管理人員。 職責(zé)范圍: . 負(fù)責(zé)與乙方的檔案提卷和還
4、卷等交接工作,協(xié)同甲方人員作好交接清單記錄 并簽字。 . 負(fù)責(zé)監(jiān)督乙方規(guī)范化加工。 隨時(shí)把握乙方加工進(jìn)度并進(jìn)行協(xié)調(diào)。 . 及時(shí)關(guān)注并抽查乙方加工質(zhì)量 .代表甲方與乙方進(jìn)行及時(shí)的溝通及問(wèn)題協(xié)調(diào),確保項(xiàng)目順利完工。 2 乙方人員 2.1 管理人員 主要為:熟悉現(xiàn)場(chǎng)加工管理,熟悉數(shù)字化整體作業(yè)流程,具有較強(qiáng)組織能力和現(xiàn) 場(chǎng)管理及溝通能力的乙方負(fù)責(zé)人。 2.2 工程技術(shù)人員 主要為:熟悉計(jì)算機(jī)軟、硬件技術(shù),了解檔案數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)和系統(tǒng)開(kāi)發(fā)。了解檔案 管理等相關(guān)專(zhuān)業(yè)知識(shí)的乙方技術(shù)部技術(shù)支持工程師。 2.3 數(shù)據(jù)采集作業(yè)員 主要為:了解檔案數(shù)據(jù)庫(kù)數(shù)據(jù)標(biāo)準(zhǔn)和計(jì)算機(jī)軟件應(yīng)用等相關(guān)知識(shí)的乙方數(shù)字化制 作部工作人員
5、最新資料推薦 人員安排見(jiàn)表3-1 職務(wù) 職責(zé) 人 員 備注 管 理 人 員 項(xiàng)目負(fù)責(zé) 人 1 負(fù)責(zé)人員,資源的調(diào)配工作。 2負(fù)責(zé)施工組織設(shè)計(jì)、管理。 3負(fù)責(zé)施工條件的保障及與甲乙雙方 關(guān)于項(xiàng)目進(jìn)展?fàn)顟B(tài)的匯報(bào)和協(xié)調(diào)工 作。 1人 項(xiàng)目負(fù)責(zé)人 不一定要常駐 現(xiàn)場(chǎng),但要通過(guò) 一切通訊手段 和定期到現(xiàn)場(chǎng) 的督導(dǎo),切實(shí)做 到對(duì)該項(xiàng)目加 工進(jìn)度和加工 質(zhì)量的掌控 現(xiàn)場(chǎng)主管 1. 負(fù)責(zé)與乙方的檔案提卷和還卷等交 接工作 2. 負(fù)責(zé)現(xiàn)場(chǎng)的人員管理和加工管理 3負(fù)責(zé)數(shù)據(jù)的終驗(yàn)和掛接 4.配合項(xiàng)目負(fù)責(zé)人做好與乙方的溝通 協(xié)調(diào)工作。 1人 數(shù)據(jù)采集人員 著錄人員 負(fù)責(zé)將檔案卷內(nèi)目錄及其匕索引信息 進(jìn)行手工錄入為電子
6、數(shù)據(jù)信息并校對(duì) 1人 掃描人員 負(fù)責(zé)按制定的技術(shù)規(guī)范將檔案資料掃 描 1人 圖像處理 人員 1去污:將掃描獲取的圖像進(jìn)行圖像去 污;去黑邊及去雜點(diǎn)等; 2糾偏:將偏斜的圖像進(jìn)行糾正處理; 3文字處理:將不清楚的文字進(jìn)行加深 或變淺; 4拼接:將頁(yè)面較大的圖像進(jìn)行拼接處 理; 1人 在進(jìn)行圖像處 理的時(shí)候,肯定 是逐頁(yè)處理,所 以要留意每一 頁(yè)掃描的質(zhì)量, 發(fā)現(xiàn)掃描質(zhì)量 問(wèn)題立即發(fā)還 上一工序重掃 并作好記錄。 圖像矢量 化人員 1負(fù)責(zé)將處理好的圖像進(jìn)行全文識(shí)別、 2.校對(duì)、板式還原和格式轉(zhuǎn)換 3.對(duì)已經(jīng)產(chǎn)生的成品數(shù)據(jù)進(jìn)行初驗(yàn)后 移交給現(xiàn)場(chǎng)主管終驗(yàn)并掛接。 1-3 人 矢量化人員最 終定員需結(jié)合
7、 矢量化的圖形 數(shù)量和采集難 度。 數(shù)字化工作軟、硬件準(zhǔn)備 1 .配備硬件數(shù)量及檔次要視數(shù)據(jù)采集工作情況及數(shù)據(jù)量大小。 2. 甲方提供PC機(jī)4-6臺(tái)給乙方作為采集作業(yè)使用,其他硬件設(shè)備由乙方自行解 決。 3. 場(chǎng)地:甲方提供。 4. 辦公用具:甲方提供打印機(jī)(以實(shí)際用量為標(biāo)準(zhǔn))、辦公桌椅、檔案資料的 裝訂及打印機(jī)所用的全部耗材。 5. 其他條件:提供電力和飲水。 軟硬件準(zhǔn)備詳見(jiàn)表3-2 表3-2軟、硬件配備列表 軟、硬件名稱 數(shù)量 詳細(xì)配置 響應(yīng)時(shí)間 提供方 綜合檔案管理系統(tǒng) 一套 1 需支持全文 檢索使用功 能。 2.支持TIFF和 PDF格式數(shù) 據(jù)的批量掛 接功能。 項(xiàng)目開(kāi)始需 到位 甲方
8、 數(shù)字化流程管理和加工 軟件、OCR軟件 全套 能滿足本加 工項(xiàng)目所有的 技術(shù)要求 項(xiàng)目開(kāi)始需 到位 乙方 服務(wù)器 一.臺(tái) 項(xiàng)目開(kāi)始需 到位 甲方 掃描儀(A3幅面) 一.臺(tái) 富士通A3幅面 FI-4750C(ADF) 項(xiàng)目開(kāi)始需 到位 乙方 掃描儀(A4幅面) 一.臺(tái) A4幅面 虹光-FB6030 (平板) 項(xiàng)目開(kāi)始需 到位 乙方 計(jì)算機(jī) 4-6套 PC機(jī) 項(xiàng)目開(kāi)始需 到位 甲方 確定數(shù)字化內(nèi)容、數(shù)量及用戶需求 在數(shù)據(jù)采集之前,首先要客觀真實(shí)統(tǒng)計(jì)數(shù)字化內(nèi)容和數(shù)量,確定用戶使用需求, 然后制定對(duì)應(yīng)方案和技術(shù)控制以便準(zhǔn)確地進(jìn)行施工安排。 - 11 - 表3-3 三峽大學(xué)檔案館檔案數(shù)字化用戶需求調(diào)
9、研表 檔案類(lèi)型 檔案數(shù)量 數(shù)字化準(zhǔn)備情況 紙張及保存情況 用戶需求 招生名冊(cè) 檔案裝訂 廠檔案著錄 檔案整理排序 學(xué)籍檔案 檔案裝訂 檔案著錄 檔案整理排序 學(xué)生成績(jī) |檔案裝訂 檔案著錄 檔案整理排序 黨群檔案 廠檔案裝訂 廠檔案著錄 檔案整理排序 廠很好 一般 廠較差廠很差 廠很好 一般 較差口很差 匚I很好二一般 r較差戸很差 j很好一般 匚較差口很差 影像化 匚矢量化 影像化 矢量化 口影像化 矢量化 影像化 矢量化 基建檔案 檔案裝訂 (檔案著錄 檔案整理排序 廠很好一般 匚較差口很差 科研檔案 檔案裝訂 檔案著錄 =檔案整理排序 廠很好匚一般 口較差廠很差 其它: 廠檔案裝訂 檔案
10、著錄 檔案整理排序 :很好口一般 較差戸很差 影像化 匚矢量化 1影像化 矢量化 口影像化 I矢量化 填表人 職務(wù) 第二節(jié)數(shù)字化加工流程及主要技術(shù)方案 檔案數(shù)字化加工主要流程包括:提卷 -拆卷-檔案著錄-掃描-圖像處理-OCR- 校對(duì)-版式還原-轉(zhuǎn)雙層PDF終驗(yàn)-掛接 檔案數(shù)字化加工流程圖 流程單 光盤(pán)制作 憊質(zhì)檢 光盤(pán)移交諧單 檔案 目錄 檔案 田錄 C 1掃描文件 檔 目錄 v(數(shù)期呈入 檔案 流珂單 電子 文舛 電子 文件 I (文件質(zhì)檢j 流程單、 7蔬程單 二 流程單 電子 文件 電子 文件 一、入庫(kù)提卷、拆卷 1. 從檔案室移交檔案,嚴(yán)格執(zhí)行原始檔案的交接手續(xù),使用雙方項(xiàng)目負(fù)責(zé)人
11、確認(rèn)的檔案交接清單(完成清點(diǎn)登記)。 2檔案整理:編寫(xiě)頁(yè)碼、核對(duì)紙質(zhì)檔案頁(yè)碼、對(duì)可拆釘?shù)奈募霾疳斕幚硪?適應(yīng)掃描的要求、對(duì)需要修復(fù)的檔案進(jìn)行歸并整理(如果發(fā)現(xiàn)破損嚴(yán)重,無(wú)法 直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、折皺不平影響掃描質(zhì)量的原件應(yīng)先 進(jìn)行相應(yīng)處理后再進(jìn)行掃描,發(fā)現(xiàn)破損嚴(yán)重的檔案須立即報(bào)知項(xiàng)目相關(guān)負(fù)責(zé)人) 制作卷內(nèi)目錄,掃描文件抽取 3按照掃描處理量明確交接周期和檔案交接量(雙方項(xiàng)目負(fù)責(zé)人簽字,以保 在施工過(guò)程中檔案不損失、不丟失。) 4裝訂案卷應(yīng)保證裝訂牢固,案卷整齊,卷內(nèi)材料不松動(dòng),脫落,保持與原 案卷一致。 圖二 檔案北接就段圖 J J.衛(wèi)吟直;t卑 3.乞方當(dāng)寧囁認(rèn) .七苻,
12、記痕交出臺(tái)牴 :l 正rtiJiUC I乜竹詫IV草. / 爐i ;一聯(lián)1:狂申, -Er.-KiT / I占整Ift書(shū)之:円調(diào)iH阱1. 2 X 二、標(biāo)引著錄 按要求將文件所需信息錄入到軟件數(shù)據(jù)庫(kù)里,標(biāo)引著錄按照國(guó)家檔案局有 關(guān)標(biāo)準(zhǔn)結(jié)合用戶檔案著錄的具體要求進(jìn)行。 1. 錄入方式 采用手工錄入的方式 2. 校對(duì)方式 校對(duì)以軟件校對(duì)和打印輸出、對(duì)比校對(duì)相結(jié)合,錯(cuò)誤率在萬(wàn)分之二以下。 案卷目錄和卷內(nèi)目錄按照檔案的原始數(shù)據(jù)錄入。卷案目錄和卷內(nèi)目錄的樣 式經(jīng)用戶同意可做相應(yīng)調(diào)整。對(duì)檔案目錄數(shù)據(jù)修改和補(bǔ)充的數(shù)據(jù),須填寫(xiě)更改 資料、更改資料放入原案卷內(nèi),卷內(nèi)目錄及其他不全的需補(bǔ)充完整。 三、檔案掃描 1
13、.掃描方式:根據(jù)檔案幅面的大小選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn) 行掃描。大幅面檔案可采用加長(zhǎng)式掃描或者圖像拼接處理方式處理,同一頁(yè)面 有兩個(gè)以上文件,需分別掃描。 2掃描色彩模式:以黑白二值掃描為主,附有灰度(彩色)照片及原件分明 度很低的檔案,可視情況采取灰度和24位真彩色掃描。然后以黑白二值保存 例:藍(lán)底招生名冊(cè),此種檔案長(zhǎng)見(jiàn)為 A3幅面、紙張很薄,底色與文字的分明度很低。實(shí) 物檔案查看時(shí)都顯吃力,此種檔案如果用黑白二值掃描,則會(huì)出現(xiàn)大幅暗面,文字顯現(xiàn)不清; 如果使用彩色掃描,文字部分明度很低。只有使用灰度掃描,效果相對(duì)好一些,如圖三。掃 描后的圖像再輔以黑白二值保存,則最大限度的提高了
14、圖像質(zhì)量,如圖四。 圖三 灰度掃描效果圖四 保存為黑白值后的效果 1110810501 1 1110407 p |厚玉鳳* * 1161 I - ” I- 叫叫 趣亦 152 I 202003a . . 1 . 楊飛 1 2010590145 1 3)10073 女 1151 1 1010000736 1 101 孟苻楓J女 IL1 115 2100S90Q25 2100068 李春 * 115 3分辨率:無(wú)全文檢索需求的文檔分辨率調(diào)整為 200DPI最為合適。需要全 文檢索而做ocr識(shí)別的文檔,黑白二值掃描分辨率最佳為400dpi,此分辨率下識(shí) 別成功率最高。24位真彩色掃描分辨率標(biāo)準(zhǔn)為20
15、0dpi。 4. 圖像文件的大?。汉诎锥祾呙?A3頁(yè)面:20K40K;灰度或彩色掃描 A3 頁(yè)面:100 150K。 5. 如遇字間距和行間距過(guò)密、原件本身是復(fù)印件等字跡不清楚的情況,可 適當(dāng)增加掃描的分辨率,但要保證圖像清晰的同時(shí),又不影響遠(yuǎn)程查詢和瀏覽 的速度。 6. 清晰度:掃描圖像字跡清晰、顏色恰當(dāng),不宜過(guò)淺或過(guò)深,并且不得出 現(xiàn)字跡筆畫(huà)殘缺或字跡筆畫(huà)疊合而影響閱讀的情況,即使原檔案存在銹斑變質(zhì)、 顏色過(guò)淺或深淺不一致,也保證掃描圖像可讀,掃描留下的墨跡寬度不得超過(guò) 0.5 厘米,并且指印和黑線不能覆蓋或影響正文內(nèi)容。 7根據(jù)檔案實(shí)體情況,在檔案電子文件中相對(duì)應(yīng)目錄設(shè)置“復(fù)制件” 、
16、“原 件不清”標(biāo)志。目錄以原有檔案目錄為準(zhǔn),在實(shí)際處理過(guò)程中著有未歸類(lèi)的新 目錄。可根據(jù)情況修改目錄,增加或調(diào)整標(biāo)準(zhǔn)目錄,對(duì)檔案原目錄數(shù)據(jù)修改或 補(bǔ)充的數(shù)據(jù),需填寫(xiě)更改資料,更改資料放入原案卷內(nèi),能實(shí)現(xiàn)一條目錄對(duì)應(yīng) 多個(gè)圖像和一個(gè)圖像對(duì)應(yīng)多條目錄的編目。 8圖像內(nèi)容: 8.1實(shí)時(shí)在屏幕上監(jiān)控掃描全過(guò)程, 遇有漏掃、 重張,圖像黑邊、偏斜、 折角、不清晰等情況,則進(jìn)行重掃或補(bǔ)掃。 8.2 檢查掃描件是否合乎要求,掃描圖像必須與原圖頁(yè)面一一對(duì)應(yīng),不 得出現(xiàn)顛倒、缺頁(yè)、重頁(yè)或錯(cuò)頁(yè)情況,不能有遺漏、重復(fù),掃錯(cuò)的現(xiàn)象 8.3 掃描的頁(yè)面內(nèi)容居中顯示,不可出現(xiàn)明顯偏左或偏右的現(xiàn)象,正文 內(nèi)容、頁(yè)眉、頁(yè)腳、
17、反面印章、附件、手寫(xiě)注釋等信息完整;圖像內(nèi)容與書(shū)本 面完全對(duì)應(yīng),不得出現(xiàn)書(shū)頁(yè)內(nèi)容殘缺或?qū)⑴赃呿?yè)面信息掃入本頁(yè)的現(xiàn)象。 (對(duì)圖 像黑邊、偏斜、折角、不清晰等情況進(jìn)行處理,以達(dá)到用戶需求) 8.4 紙張較差檔案掃描方案:由于進(jìn)行數(shù)字化的檔案會(huì)有部分為歷史檔 案,紙張質(zhì)量比較差,對(duì)于這部分紙張質(zhì)量較差的歷史檔案掃描,我們本著以 下原則: 8.4.1 保證檔案安全。紙張較差的檔案多為破損檔案,對(duì)于破 損檔案更應(yīng)該在生產(chǎn)流程中加以特殊對(duì)待, 不能造成二次破壞。 保證檔 案的安全是第一要?jiǎng)?wù)。 因此,在處理紙張較差的檔案時(shí), 不允許使用蘸 水防滑等有破壞檔案可能性的操作方法。 8.4.2 保證掃描質(zhì)量。歷史
18、檔案之所以進(jìn)行檔案數(shù)字化,其中 最新資料推薦 最主要的目的之一就是搶救這部分歷史檔案,今后在應(yīng)用這部分檔案 時(shí),盡量避免人為翻閱歷史檔案而給檔案造成二次傷害, 而應(yīng)使用電子 系統(tǒng),使用掃描件。這樣檔案掃描的質(zhì)量要盡可能的清晰、干凈,盡可 能的恢復(fù)歷史原貌,這對(duì)掃描質(zhì)量的要求很高。 8.4.3 高效高質(zhì)的完成任務(wù)。 9. 掃描登記:認(rèn)真填寫(xiě)紙質(zhì)檔案數(shù)字化轉(zhuǎn)換過(guò)程交接登記表單,登記掃描 的頁(yè)數(shù),核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)與檔案整理時(shí)填寫(xiě)的文件頁(yè)數(shù)是否一致, 不一致時(shí)應(yīng)注明具體原因和處理方法。 四、圖像處理 1. 逐張檢查圖像質(zhì)量(包括黑邊、折角、圖像偏斜度、清晰度、失真度等 進(jìn)行檢查,發(fā)現(xiàn)不符合圖
19、像質(zhì)量要求時(shí),應(yīng)重新進(jìn)行圖像處理) ,檔案順序(頁(yè) 號(hào))是否正確,有無(wú)漏掃、重張等情況(發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確 插入圖像。發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時(shí),應(yīng)及時(shí)進(jìn)行調(diào)整。 ) 2. 糾偏:圖像整體傾斜不得超過(guò) 1 度,不得出現(xiàn)圖像的一部分傾斜或扭曲 而影響閱讀的現(xiàn)象。如果檔案頁(yè)面存在部分傾斜的,以頁(yè)面中標(biāo)題糾正為準(zhǔn)。 3 去污:所有掃描留下的黑線、指印、陰影或污點(diǎn)都必須清除干凈(在放大 50%的情況下)由于印刷質(zhì)量或紙張質(zhì)量等造成的頁(yè)面上有零星的污點(diǎn)和反面倒 映文字污點(diǎn)比較多,如果在頁(yè)面視圖下看不清楚,或該污點(diǎn)嵌在文本行中無(wú)法 清除,可以不清除,但應(yīng)盡量保證圖像可讀。 4
20、全文頁(yè)面及局部文字的加深和變淺的處理: 原始檔案的清晰度較低時(shí), 可 提高圖像的清晰度,修正原資料中存在的字間距和行間距過(guò)密,文字較深或較 淺,字跡不清楚的缺陷,確保文字及圖像信息清晰可辨。 5 圖像拼接:對(duì)大幅面檔案進(jìn)行分區(qū)掃描形式的多幅圖像, 應(yīng)進(jìn)行拼接處理, 合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性和數(shù)字化檔案的準(zhǔn)確 可讀。 6 照片頁(yè)處理: 必要時(shí)采用專(zhuān)業(yè)的圖像處理軟件進(jìn)行處理, 確保照片的清晰 度。 7 圖像存儲(chǔ): 存儲(chǔ)格式以 G-4 壓縮 TIFF 格式保存。 A4 幅面檔案保存文件不 得大于100K;其他幅面檔案掃描形成文件在保證影像質(zhì)量的前提下,盡量縮小 文件占用空間
21、。掃描文件存儲(chǔ)命名必須與條目檔案號(hào)一一對(duì)應(yīng)。 五、全文識(shí)別(OCR)及生成雙層pdf、版式還原及格式轉(zhuǎn)換 將掃描處理完成后的文檔利用專(zhuān)業(yè)的識(shí)別軟件進(jìn)行全文OCR如甲方對(duì)識(shí)別 成功率有嚴(yán)格要求的,還需另外進(jìn)行人工校對(duì),校對(duì)結(jié)束后將版式還原及轉(zhuǎn)換 成雙層PDF文件格式。 根據(jù)用戶對(duì)識(shí)別率的要求,可選擇性進(jìn)行人工校對(duì)。進(jìn)行人工校對(duì)和不進(jìn)行 校對(duì)的優(yōu)缺點(diǎn)對(duì)比: 1不進(jìn)行人工校對(duì):其原理是在單層 PDF 的基礎(chǔ)上利用計(jì)算機(jī)軟件進(jìn)行全 文OCR識(shí)別后生成雙層PDF文件。從而激活了圖片中所反映的文字,而達(dá)到提 取文字和利用原文所包含的文字進(jìn)行檢索的目的。但是不進(jìn)行人工校對(duì)和版式 還原,識(shí)別的準(zhǔn)確率取決于原始
22、資源的情況及保存現(xiàn)狀。 優(yōu)點(diǎn):效率高、成本低、能利用原文檢索 瀏覽速度快。 缺點(diǎn):識(shí)別準(zhǔn)確率取決于原件的質(zhì)量,所以準(zhǔn)確率不穩(wěn)定。 適應(yīng)范圍: 、原件版面干凈及保存完好的資源。(準(zhǔn)確率可達(dá)95%以上) - 13 - 最新資料推薦 、原文中只含部份核心檢索內(nèi)容的資源。(如學(xué)籍檔案,檢索的重點(diǎn) 只是圍繞學(xué)生的身份信息) 2. 進(jìn)行人工校對(duì):其原理是在 OCR的基礎(chǔ)上,為了確保識(shí)別的準(zhǔn)確率而增 加了人工校對(duì)和版式還原的工序??蓪?shí)現(xiàn)無(wú)障礙的全文檢索。 優(yōu)點(diǎn):全文檢索無(wú)差錯(cuò),準(zhǔn)確率可達(dá) 99%,且文本層和圖像層一一對(duì) 應(yīng)。 缺點(diǎn):效率極低、成本極高、因?yàn)檫M(jìn)行了版式還原,所以原真率不到 98%,而且存儲(chǔ)空間
23、很大而致瀏覽速度降低。 適應(yīng)范圍: 、所載信息珍貴且使用頻率很高的資源。 、數(shù)字化項(xiàng)目資金預(yù)算充裕且項(xiàng)目實(shí)施時(shí)間寬松的資源。 、有很好的硬件環(huán)境支持的數(shù)字化項(xiàng)目。 六、總質(zhì)檢 1. 對(duì)掃描處理完成后的圖像頁(yè)進(jìn)行檢驗(yàn),對(duì)檔案拆分、掃描、修正、去污、 插圖、照片的處理以及文本和圖像頁(yè)的匹配等質(zhì)量進(jìn)行全面檢驗(yàn),對(duì)于質(zhì)量達(dá) 不到要求的進(jìn)行重掃、補(bǔ)掃等操作。 2. 對(duì)文本域錄入與文本錄入域的標(biāo)引、文件的頁(yè)號(hào)和頁(yè)數(shù)進(jìn)行對(duì)比,對(duì)掃 描前圖像頁(yè)的標(biāo)引與掃描后的圖像頁(yè)的編號(hào)與頁(yè)數(shù)進(jìn)行對(duì)比,發(fā)現(xiàn)不合格的登 記清單重新處理。 3. 對(duì)圖像質(zhì)量的檢查,確保圖像版面清晰,干凈,大小一致,方向一致。 4主要質(zhì)檢標(biāo)準(zhǔn): 4
24、.1加工后的電子影像在總數(shù)量、完整性、清晰度上與源文件保持一 致。 4.2案卷著錄、按文件的屬性著錄數(shù)據(jù)庫(kù)字段,檢查“文件路徑”字 段與文件實(shí)際存儲(chǔ)位置一致,差錯(cuò)率控制在千分之五以內(nèi)。 4.3電子影像檔案件信息定義數(shù)據(jù)差錯(cuò)率控制在百分之二以內(nèi)。 4.4電子影像檔案卷內(nèi)頁(yè)碼差錯(cuò)率控制在千分之一以內(nèi)。 4.5每頁(yè)電子影像左右端正度控制在三度以內(nèi)。 4.6電子影像漏掃,壓邊率控制在千分之一以內(nèi)。 4.7電子檔案與條目數(shù)據(jù)的掛接一致,差錯(cuò)率小于千分之一以內(nèi)。 七、批量掛接 1 掃描處理后的圖像成品,按年度、機(jī)構(gòu)上傳至檔案專(zhuān)用服務(wù)器,利用檔案 管理軟件中的對(duì)應(yīng)掛接功能將掃描圖像信息與錄入到檔案管理軟件系
25、統(tǒng)中的目 錄進(jìn)行對(duì)應(yīng)掛接,確保目錄與原文的一一對(duì)應(yīng)。 2 掛接到檔案管理系統(tǒng)中區(qū),進(jìn)行再次的成品驗(yàn)收。 八、還卷及數(shù)據(jù)備份提交 1原始檔案還原工作嚴(yán)格按照國(guó)家檔案局規(guī)定的相關(guān)標(biāo)準(zhǔn)和實(shí)際情況進(jìn)行 有序的還原, 將還原的檔案資料逐卷精心檢查,確實(shí)沒(méi)有落頁(yè)、掉頁(yè)、折頁(yè)等問(wèn)題后再 歸還檔案管理人員,經(jīng)雙方仔細(xì)核實(shí)無(wú)誤后,在還卷交接單上簽字確認(rèn)。 2在數(shù)據(jù)化加工過(guò)程中的各項(xiàng)工作記錄,在數(shù)據(jù)轉(zhuǎn)移完成后、提交給用戶 方。 3為了有效地保護(hù)數(shù)據(jù),因此建立數(shù)據(jù)備份制度,在數(shù)字化加工項(xiàng)目工作 結(jié)束,并經(jīng)用戶在終驗(yàn)報(bào)告上簽字確認(rèn)后,將通過(guò)驗(yàn)收后的數(shù)據(jù)利用用戶軟件 的光盤(pán)制作功能刻錄成光盤(pán),刻錄到DVD光盤(pán)中,刻錄完
26、成后再制作一個(gè)光盤(pán) 備份,或用移動(dòng)硬盤(pán)等存儲(chǔ)介質(zhì),將所有成品數(shù)據(jù)備份,提交給用戶。 4刻錄光盤(pán)要求: 4.1、光盤(pán)制作兩份,制作成檔案數(shù)據(jù)格式為多頁(yè) TIFF 的光盤(pán)單盤(pán)調(diào)閱。 4.2、同一份文件不跨越二片DVD片號(hào)(同一份文件頁(yè)數(shù)需在同一 DVD內(nèi)) 4.3 、電子檔案存在于符合標(biāo)準(zhǔn)的單片包裝光盤(pán) 4.4、光盤(pán)標(biāo)示光盤(pán)編號(hào),單片包裝盒上注明光盤(pán)內(nèi)主要信息 4.5、在光盤(pán)刻錄完成后,與硬盤(pán)系統(tǒng)中電子檔案進(jìn)行一次比對(duì),確保檔案資 料無(wú)遺漏及正確性。 4.6 、制作光盤(pán)人員對(duì)于所有光盤(pán)序號(hào)進(jìn)行標(biāo)記,并提交相應(yīng)表格。 - 18 - 第三節(jié) 質(zhì)量控制方案和保證措施 項(xiàng)目加工總體質(zhì)量目標(biāo):保證合格、爭(zhēng)創(chuàng)
27、優(yōu)良! 加工質(zhì)量保障措施 1 嚴(yán)格遵照?qǐng)?zhí)行我方簽定的不分包、轉(zhuǎn)包三峽大學(xué)檔案數(shù)字化項(xiàng)目承 諾書(shū),避免項(xiàng)目轉(zhuǎn)包、分包引起的管理混亂和質(zhì)量風(fēng)險(xiǎn)。 2 嚴(yán)格按照我方制定的人員和設(shè)備投入計(jì)劃進(jìn)場(chǎng)加工,確保人員設(shè)備供 應(yīng),為項(xiàng)目進(jìn)度和質(zhì)量提供保障。 3 在該項(xiàng)目加工過(guò)程中,我方所有現(xiàn)場(chǎng)加工人員均受我公司數(shù)字化作 業(yè)人員質(zhì)量考核制度的約束,并承擔(dān)相應(yīng)獎(jiǎng)罰結(jié)果。 多環(huán)節(jié),多層次的質(zhì)量檢查體系。 1. 對(duì)檔案簽收和屬性數(shù)據(jù)錄入的質(zhì)量檢查, 主要內(nèi)容:檔案簽收的準(zhǔn)確性, 完整性和即時(shí)性;數(shù)據(jù)內(nèi)容齊全,屬性數(shù)據(jù)輸入準(zhǔn)確;與數(shù)據(jù)校對(duì)的檔 案交接。 2. 對(duì)數(shù)據(jù)校對(duì)處理的質(zhì)量檢查, 主要內(nèi)容: 校對(duì)后的數(shù)據(jù)內(nèi)容齊全,
28、 正確; 紙質(zhì)檔案實(shí)體完整,還案及時(shí)無(wú)誤。 3. 對(duì)數(shù)據(jù)遷移的質(zhì)量檢查,主要內(nèi)容:遷移后的數(shù)據(jù)的完整性準(zhǔn)確性;對(duì) 數(shù)據(jù)進(jìn)行組合查詢并且結(jié)果正確;對(duì)數(shù)據(jù)進(jìn)行匯總統(tǒng)計(jì)并輸出標(biāo)準(zhǔn)表 格,試運(yùn)行無(wú)死機(jī)現(xiàn)象。 4. 在完成以上每個(gè)環(huán)節(jié)后,檢查人員將其數(shù)據(jù)再次進(jìn)行一遍全面的復(fù)查, 尤其對(duì)檢查記錄單上更正后的錯(cuò)誤進(jìn)行仔細(xì)的檢查,確保掃描得來(lái)的數(shù) 據(jù)與源文件內(nèi)容完全一致。 5. 實(shí)施項(xiàng)目負(fù)責(zé)人對(duì)成品數(shù)據(jù)進(jìn)行百分之十的抽查,在抽查時(shí)將該查數(shù)據(jù) 的年度、保管期限、全宗號(hào)、卷號(hào)、卷內(nèi)順序號(hào)等目錄信息是否準(zhǔn)確無(wú) 誤,再對(duì)獲取圖像數(shù)據(jù)的亮度、歪斜、是否錯(cuò)頁(yè)等方面進(jìn)行抽查,如有 不合格的數(shù)據(jù)及時(shí)進(jìn)行統(tǒng)計(jì)和修正,確保最終數(shù)
29、據(jù)的準(zhǔn)確無(wú)誤。 最新資料推薦 三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終極保障 階段驗(yàn)收?qǐng)?bào)告 項(xiàng)目名稱 項(xiàng)目編 號(hào) 報(bào)告人 時(shí)間 項(xiàng)目負(fù)責(zé)人 所處階 段 項(xiàng)目狀態(tài)參數(shù)監(jiān)控情況 項(xiàng)目狀態(tài) 計(jì)劃情況 實(shí)際情況 偏差掃描 糾正措施 項(xiàng)目進(jìn)度 項(xiàng)目工作量 (人時(shí)) 項(xiàng)目規(guī)模 項(xiàng)目外工作 量情況描述 (非項(xiàng)目工 作) 其他 工作中遇到問(wèn)題及困難: 需要用戶支持與配合: 用戶意見(jiàn): 用戶簽字: 簽字日期: 終驗(yàn)報(bào)告 項(xiàng)目名稱 項(xiàng)目編號(hào) 報(bào)告人 時(shí)間 項(xiàng)目負(fù)責(zé)人 第()階段 本階段項(xiàng)目完成情況 驗(yàn)收項(xiàng)目 完成情況 備注 檔案整理(卷) 檔案掃描(A4頁(yè),A3頁(yè),其他頁(yè)) 圖像處理(卷頁(yè)) 索引目
30、錄錄入(條) 全文OCR 所有報(bào)表輸出(卷) 資料裝訂(卷,件) 內(nèi)部驗(yàn)收(頁(yè)) 目錄與圖像文件的銜接 數(shù)據(jù)是否上傳到服務(wù)器 數(shù)據(jù)備份 本階段驗(yàn)收結(jié)論:雙方于年月日,進(jìn)行了檔案數(shù)字化工作的第階段的 成品驗(yàn)收,乙方所提供的數(shù)據(jù)基本滿足甲方的要求,甲方同意通過(guò)驗(yàn)收,進(jìn)入下一個(gè)工作 階段。 用戶簽字:日期:項(xiàng)目經(jīng)理簽字:日期: 第四節(jié)安全保密控制 一、為了確保采集數(shù)據(jù)不外泄,在開(kāi)始進(jìn)行數(shù)字化加工后,我公司將不允許 加工人員攜帶任何存儲(chǔ)介質(zhì)進(jìn)出加工現(xiàn)場(chǎng)。 二、為避免采集數(shù)據(jù)在硬盤(pán)上的物理磁道上被還原外泄,我公司將使用乙方 提供的電腦用于數(shù)據(jù)采集作業(yè)。 三、電腦上所有的可以讀寫(xiě)存儲(chǔ)介質(zhì)的接口,自進(jìn)場(chǎng)之日起即貼上封條,直 到工程完工。 四、為避免數(shù)據(jù)采集過(guò)程中數(shù)據(jù)通過(guò)網(wǎng)絡(luò)外泄,我公司在加工期間將關(guān)閉外 網(wǎng),只使用局域網(wǎng)完成數(shù)字化作業(yè)。 五、為了建立并嚴(yán)格落實(shí)安全保密制度,保證檔案資料的安全保密性,做到 絕對(duì)不外泄任何信息。保密協(xié)議將同加工合同同時(shí)簽定并成為合同不可分割 的一部分。見(jiàn)附件 -21 - 最新資料推薦 附件:保密協(xié)議 保密協(xié)議 甲方: 地址: 乙方:數(shù)字科技有限公司 地址: 鑒于甲方委托乙方承擔(dān)其檔案資料的數(shù)字化加工服務(wù),乙方可能接觸到甲 方某些非公開(kāi)的,涉密的文件、檔案和資料,為了維護(hù)甲方資料的安全,保守 國(guó)家
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度大型商業(yè)綜合體招商管理合同3篇
- 2025版門(mén)樓廣告位租賃與設(shè)計(jì)制作合同4篇
- 2025年度旅行社與旅游科技研發(fā)企業(yè)合作協(xié)議4篇
- 2025年按揭車(chē)輛交易糾紛調(diào)解服務(wù)合同模板2篇
- 2025年度美食廣場(chǎng)廚師團(tuán)隊(duì)承包與節(jié)假日活動(dòng)策劃服務(wù)協(xié)議3篇
- 2025年度個(gè)人分包合作協(xié)議(智能安防設(shè)施)4篇
- 2025版壓力罐施工與施工許可證申請(qǐng)合同3篇
- 2025年水利工程勞務(wù)分包合同環(huán)境保護(hù)與綠色施工規(guī)范3篇
- 二零二五版工業(yè)自動(dòng)化設(shè)備加工制造合同3篇
- 2025年高速公路服務(wù)區(qū)停車(chē)場(chǎng)及餐飲服務(wù)合同3篇
- 2024版?zhèn)€人私有房屋購(gòu)買(mǎi)合同
- 2024爆炸物運(yùn)輸安全保障協(xié)議版B版
- 《食品與食品》課件
- 讀書(shū)分享會(huì)《白夜行》
- 光伏工程施工組織設(shè)計(jì)
- DB4101-T 121-2024 類(lèi)家庭社會(huì)工作服務(wù)規(guī)范
- 化學(xué)纖維的鑒別與測(cè)試方法考核試卷
- 安慶時(shí)聯(lián)新材料有限責(zé)任公司10000噸年抗氧劑系列產(chǎn)品及抗紫外線吸收劑生產(chǎn)項(xiàng)目環(huán)境影響報(bào)告
- 中醫(yī)師承申請(qǐng)表
- 臨床微生物檢查課件 第2章細(xì)菌的生理
- 作品著作權(quán)獨(dú)家授權(quán)協(xié)議(部分授權(quán))
評(píng)論
0/150
提交評(píng)論