檔案數(shù)字化建設方案_第1頁
檔案數(shù)字化建設方案_第2頁
檔案數(shù)字化建設方案_第3頁
檔案數(shù)字化建設方案_第4頁
免費預覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、檔案數(shù)字化建設方案檔案,作的數(shù)字化建設是順應潮流,適應時代發(fā)展的新舉措、新要求,檔案做為原 生的信息資源,其重要性正日益凸顯出來,逐步掌握信息技術為檔案工作服 務,為社 會主義經(jīng)濟建設服務,為社會主義精神建設服務。檔案數(shù)字化是數(shù)字檔案建設最基礎的工作,傳統(tǒng)載體的檔案經(jīng)高科技技術加工成數(shù) 字檔案形式,通過局域網(wǎng)、政務網(wǎng)、互聯(lián)網(wǎng)進行計算檢索、閱讀電子檔案,為 迎接檔 案信息服務新環(huán)境的挑戰(zhàn)、提高管理水平、提高效率、增強檔案部門的服務水平、為 檔案內(nèi)部管理及面向客戶服務提供高效率的全面服務。完整的檔案數(shù)字化建設流程包括案卷交接、檔案整理、LI錄著錄、檔案掃描、圖 像處理、OCR文字識別、數(shù)字校對、數(shù)

2、字質(zhì)檢、數(shù)據(jù)掛接、整理還原、案卷入庫 等環(huán) 節(jié)。業(yè)務流程紙質(zhì)檔案數(shù)字化標準:DA/T31-2005紙質(zhì)檔案數(shù)字化技術規(guī)范DA/T18-1999檔案著錄規(guī)則L制訂批次計劃為在數(shù)字化處理過程中對紙質(zhì)檔案進行有效管理以及對數(shù)字化處理進行有效控制,需對館藏檔案的數(shù)字化處理分批次進行。2.檔案出庫交接根據(jù)檔案數(shù)字化加工批次訃劃進行出庫,對出庫的檔案進行完整性檢查。對通過完整性檢查的檔案,進行數(shù)量確認,并詳細登記資料出庫單。確保資料的交接過程中的數(shù)量正確性,完整性;3 .目錄著作按照文件數(shù)據(jù)庫LI錄結(jié)構與LI錄著錄要求以及檔案著錄規(guī)則(DA/T18)等標 準,規(guī)范需要LI錄補錄的檔案口錄內(nèi)容,包括確定檔案

3、LI錄的著錄項、字段長度和內(nèi) 容要求等,規(guī)范案卷題名、文件名、責任者、起止頁號和頁數(shù)等。4 .檔案整理對出庫待加工的檔案進行掃描前處理,使之成為能夠進行掃描的形態(tài)。拆除裝訂影響掃描工作進行的檔案,應拆除裝訂物。資料及檔案內(nèi)的成冊資料嚴禁拆除。區(qū)分掃描件和非掃描件區(qū)分同一案卷(卷、件)中的掃描件和非掃描件。頁面修整對破損嚴重、無法直接進行掃描的檔案,先期進行技術修復,折皺不平影響掃描質(zhì) 量的原件進行相應技術處理(壓平和燙平等)后再進行掃描。確保較薄紙張(如信紙、 便箋紙)、破損紙張、底灰較深(如草漿紙、油印紙)、字跡較淺(如鉛筆字跡)等紙張的狀況較較差的檔案掃描圖像清晰。檔案整理登記詳細記錄檔案

4、整理后每份文件的起止頁號和頁數(shù)等情況。裝訂掃描完成后,檔案按原檔案保管單位要求進行重新裝訂,保持每頁檔案原有的排列 順序不變、案卷不掉頁、右邊和底邊整齊。5 .檔案掃描黑白掃描采用(300dpi) TIFF格式,彩色掃描采用(300dpi) JPG格式。照片以原色彩為準(600dpi) TIFF格式掃描。保證掃描圖像效果原原件吻合。大幅面檔案采用大幅面匚程掃描儀或小幅面掃描后進行圖像拼接處理。需要進行OCR文字識別的檔案,掃描分辨率?300dpi。對資料等成冊材料不宜 拆卷的,采用不拆卷掃描儀掃描。核對每件文件的掃描頁碼、頁數(shù)與實際的文件頁碼、頁數(shù) 是否一致。圖片命名時一定要正確,不能出現(xiàn)圖片

5、顛倒、錯亂等現(xiàn)象。掃描時保證檔案原件不 被損壞。6 .圖像處理糾偏偏斜的圖像進行糾偏處理,傾斜不超過3度,方向不正確的圖像進行旋轉(zhuǎn)還原,以符合閱讀習慣。去污圖像頁面中影響圖像質(zhì)量的雜質(zhì)如黑點、黑線、黑框、黑邊等進行去污處理。圖像拼接大幅面檔案進行分區(qū)掃描形成的多幅圖像進行拼接處理,合并為一個完整圖像,以 保證檔案數(shù)字化圖像的完整性。栽邊處理去除多余的白邊,縮小圖像文件的容量,節(jié)省存儲空間。深淺度調(diào)整圖像深淺度不一致時進行修復,保證圖像的深淺度一致。7 . OCR識別運用先進的OCR識別軟件,對掃描的圖像進行文字識別8 .圖像存儲采用TIFF、JPG格式存儲,存儲時選擇的壓縮率在保證掃描的圖像清

6、晰可讀的確前 提下,盡量減小存儲容易為準則。供網(wǎng)絡查詢的掃描圖像,存儲為PDF文件格式,進行 過文字識別的,形成文件文字層。紙質(zhì)檔案目錄數(shù)字庫中的每一份文件,都有一個與之相應的唯一檔號,以該檔號為這份文件掃描后的圖像文件名。多頁文件可采用該檔號建立相應文件夾,按頁碼順序?qū)D像文件命名。9 .數(shù)據(jù)質(zhì)檢關鍵項檢驗和整理數(shù)據(jù)質(zhì)量抽檢。抽檢工作由專為進行操作,操作結(jié)果進行記錄。數(shù)據(jù)采用全檢方式,合格率要求達到95%以后確保質(zhì)量。10.數(shù)據(jù)掛接運用批量掛接與單張掛接的方式,將口錄庫與圖像庫一一對應起來,并生成索引文 件。匯總掛接檔案數(shù)字化轉(zhuǎn)換過程中形成的U錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫,通過質(zhì)檢環(huán)節(jié)確認“合格”后

7、,通過網(wǎng)絡加載到數(shù)據(jù)服務器終端匯總,實現(xiàn)批量、快速掛接。數(shù)據(jù)關聯(lián)以紙質(zhì)檔案LI錄數(shù)據(jù)庫為依據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個或多個圖 像存儲為一份圖像文件,通過每一份圖像文件的文件名與檔案LI錄數(shù)據(jù)庫中該份文件 的檔號的一致性和唯一性,建立起一一對應的關聯(lián)關系,實現(xiàn)檔案LI錄數(shù)據(jù)庫 和圖像 文件的批量掛接。1L數(shù)據(jù)自檢建立嚴格的質(zhì)量檢測體系,對加工的數(shù)據(jù)進行自檢,自檢必須達到檔案館紙質(zhì)檔 案數(shù)字化驗收標準的,才能遞交進行驗收。12.數(shù)據(jù)驗收LI錄數(shù)據(jù)庫、圖像文件及數(shù)據(jù)掛接的總體質(zhì)量。數(shù)據(jù)校對員進校對過程不接觸任務紙質(zhì)檔案,根據(jù)掃描的圖像結(jié)果來進行校對。首批數(shù)據(jù)采用全檢方式以后批次采用抽檢的方式檢查已完成數(shù)字化轉(zhuǎn)換的所有數(shù)據(jù),包括LI錄數(shù)據(jù)庫、 圖像文件、數(shù)據(jù)掛接的總體質(zhì)量。根據(jù)紙質(zhì)檔案數(shù)字化加,驗收標準進行檢查。檔案實體驗收必須逐卷清點,按檔案數(shù)量、文件狀況、卷內(nèi)文件頁數(shù)與順序、裝訂 要求等進行檢查。13 .數(shù)據(jù)備份經(jīng)驗收合格的完整數(shù)據(jù)及時進行備份。同一份文件,不跨二片DVD片號光盤表面標示光盤片編號并注明光盤LI錄索引信息光盤片刻錄完成后,與影像系統(tǒng)檔案進行比對一次,確保檔案資料

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論