版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
ICS35.040CCSA14DB32/T4818.2—2024黨史資料數(shù)據(jù)規(guī)范第2部分數(shù)據(jù)采集DataspecificationforCommunistPartyofChinahistorymaterials—Part2Dataacquisition2024-07-08發(fā)布 2024-08-08實施江蘇省市場監(jiān)督管理局 發(fā) 布中國標準出版社 出 版DB32/T4818.2—2024目 次前言 Ⅲ引言 Ⅳ范圍 1規(guī)范性引用文件 1術語和定義 1縮略語 2總體要求 2組織與管理 3黨史資料出庫 4數(shù)字化前處理 5目錄數(shù)據(jù)庫建立 6資料掃描與采集 6資料處理 10數(shù)據(jù)掛接 14數(shù)字化成果驗收與移交 14黨史資料歸還入庫 16附錄資料)黨史資料數(shù)字化安全管理制度 18附錄資料)黨史資料數(shù)字化加工保密管理制度 19附錄資料)黨史資料出庫申請單 20附錄資料)黨史資料數(shù)字化加工登記單 21附錄資料)報刊數(shù)據(jù)標引生成文件XML樣例 22附錄資料) 黨史資料數(shù)字化備份管理登記表 26ⅠDB32/T4818.2—2024前 言本文件按照GB/T1.1—202標準化工作導則 第1部分標準化文件的結(jié)構(gòu)和起草規(guī)的規(guī)起草。本文件是DB32/T481《黨史資料數(shù)據(jù)規(guī)范》的第2部分。DB32/T4818已經(jīng)發(fā)布了以下部分:——第1部分:數(shù)據(jù)編目;——第2部分:數(shù)據(jù)采集;——第3部分:數(shù)據(jù)標引。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔識別專利的責任。本文件由中國共產(chǎn)黨江蘇省委員會黨史工作辦公室提出并歸口。本文件起草單位:中國共產(chǎn)黨江蘇省委員會黨史工作辦公室、中電鴻信信息科技有限公司、江蘇省質(zhì)量和標準化研究院。ⅢDB32/T4818.2—2024引 言為貫徹落實黨史學習教育領導小組辦公室、國家檔案局印發(fā)的《關于做好黨史學習教育文件材料收為數(shù)字化文獻,并通過網(wǎng)絡信息實現(xiàn)資源共享,推動江蘇省黨史資料數(shù)字化建設高質(zhì)量發(fā)展,特制定本文件。在黨史資料數(shù)據(jù)建設工作中但由于標準文件篇幅限制且數(shù)據(jù)編目DB32/T4818分為以下三個部分。——第1部分:數(shù)據(jù)編目。旨在明確黨史資料數(shù)據(jù)編目過程中的相關要求,包括編目項目的確定、編目主體分類、編目流程等,提高數(shù)據(jù)編目的科學性和準確性?!?部分:數(shù)據(jù)采集。旨在明確黨史資料數(shù)據(jù)采集過程中的相關要求,包含了從黨史資料出庫到黨史資料歸還入庫的一系列采集流程和內(nèi)容,提高數(shù)據(jù)采集的規(guī)范性和可操作性?!?部分:數(shù)據(jù)標引。旨在明確黨史資料數(shù)據(jù)標引過程中的相關要求,包括不同類型、不同主題黨史資料數(shù)據(jù)的標引要求,提高數(shù)據(jù)標引的規(guī)范性和準確性。ⅣDB32/T4818.2—2024黨史資料數(shù)據(jù)規(guī)范第2部分數(shù)據(jù)采集范圍本文件確定了江蘇省黨史部門黨史資料數(shù)據(jù)采集的總體要求庫的相關內(nèi)容。本文件適用于江蘇省黨史部門對各類黨史資料的采集與管理。規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文包括所有的修改單適用于本文件。GB/T20530 文獻檔案資料數(shù)字化工作導則GB/T23286.1—2009 文獻管理 長期保存的電子文檔文件格式 第1部分PDF1.PDF/A?)的使用DA/T31—2017 紙質(zhì)檔案數(shù)字化規(guī)范DB32/T4818.1—2024 黨史資料數(shù)據(jù)規(guī)范 第1部分數(shù)據(jù)編目ISO/TR130282010 信息和文獻 記錄數(shù)字化實施指Informationanddocumentation—Imple?mentationguidelinesfordigitizationofrecords)術語和定義GB/T20530DA/T31—2017GB/T23286.1—2009界定的以及下列術語和定義適用于本文件。黨史資料數(shù)字化 digitizationofCommunistPartyofChinahistorymaterials對黨史資料進行數(shù)字化加工,使其轉(zhuǎn)化為存儲在光盤、硬盤等載體上的數(shù)字資源,并按照黨史資料的內(nèi)在聯(lián)系,建立起目錄數(shù)據(jù)與數(shù)字資源關聯(lián)關系的處理過程。失真度 distortiondegree對資料進行數(shù)字化轉(zhuǎn)換后,數(shù)字圖像與原件在色彩、幾何等方面的偏離程度。國際標準書號 internationalstandardbooknumber國際上通用的出版物標識編碼的標識符。注:采用ISBN編碼系統(tǒng)的出版物有:圖書、小冊子、縮微出版物、盲文印刷品等。便攜式文檔格式 portabledocumentformat一種用獨立于應用程序、硬件、操作系統(tǒng)的方式呈現(xiàn)文檔的文件格式。1DB32/T4818.2—2024聯(lián)合圖像專家組 jointphotographicexpertsgroup一種常用的圖像有損壓縮格式,可設置壓縮率,壓縮率越高,文件越小,圖像品質(zhì)越低。Matroska多媒體容器 Matroskamultimediacontainer能夠在一個文件中容納無限數(shù)量的視頻、音頻、圖片或字幕軌道的一種開放標準的自由的容器和文件格式,一種多媒體合并轉(zhuǎn)化格式。注Matroska.mkv,對于單一的純音頻文件是.mka??s略語下列縮略語適用于本文件。AVIAudioVideoInterleave)BOMByteOrderMar)COMCommercia)DPIDotsPerInc)HTTPSHypertextTransferProtocolSecur)ISBNInternationalStandardBookNumbe)JPEG/JPGJointPhotographicExpertsGrou)MXFMaterialeXchangeForma)NTSCNationalTelevisionStandardsCommitte)OFDOpenFixed?layoutDocumen)PALPhaseAlterationLin)PCMPulse?CodeModulatio)PDFPortableDocumentForma)SECAMSequentielCouleurAMemoir)SRTSubRipTex)TIFFTagImageFileForma)XMLEXtensibleMarkupLanguag)總體要求基本要求各相關單位應根據(jù)黨史資料的珍貴程度素統(tǒng)籌規(guī)劃、科學開展黨史資料數(shù)字化。黨史資料數(shù)字化的開展應符合GB/T20530的相關要求。應采取有效的管理和技術手段,確保黨史資料數(shù)字化成果質(zhì)量。黨史資料數(shù)字化應遵循黨史資料文件以PDF/A形式保存,文件的內(nèi)容應以標記形式嵌入黨史資料,保留文字的邏輯結(jié)構(gòu),以便搜索引擎進行全文檢索。2DB32/T4818.2—2024基本環(huán)節(jié)黨史資料數(shù)字化的基本環(huán)節(jié)主要包括:數(shù)字化前處理;目錄數(shù)據(jù)庫建立;資料掃描與信息采集;資料處理;數(shù)據(jù)掛接;數(shù)字化成果驗收與移交等。黨史資料數(shù)字化過程中據(jù),元數(shù)據(jù)元素的確定應符合ISO/TR130282010的相關要求。安全管理加強黨史資料數(shù)字化各環(huán)節(jié)的安全管理,建立黨史資料數(shù)字化安全管理制度見附錄實體和黨史資料信息的安全應符合安全管理制度要求。保密要求加工涉密黨史資料時,應按照黨史資料數(shù)字化加工保密管理制度見附錄開展工作。組織與管理機構(gòu)及人員應建立黨史資料數(shù)字化組織應配備具有相應能力的工作人員熟悉黨史業(yè)務并具有較高的調(diào)查研究水平和良好的組織領導能力的管理人員;熟悉相關標準規(guī)范并能為黨史資料數(shù)字化各環(huán)節(jié)提供技術支持的技術人員;掌握一定數(shù)字化基礎知識并熟悉本職工作的操作人員等。應通過科學規(guī)范的管理制度,對工作人員進行規(guī)范化管理。應加強對外聘工作人員的審核,強化數(shù)字化的安全性?;A設施應配備專用加工場地加工場地的選擇及溫濕度等環(huán)境的控制應利于黨史資料實體的保護。場地內(nèi)應配備可覆蓋全部加工涉密音視頻黨史和文獻資料時,應由黨史部門提供場地和電腦、存儲設備等具備記憶功能的存儲與處理設備,音視頻讀取和轉(zhuǎn)換設備由制作單位自備。工作方案應在充分調(diào)研的基礎上3DB32/T4818.2—2024黨史資料數(shù)字化方案應包括數(shù)字化對象慮黨史資料的珍貴程度宜對黨史資料數(shù)字化方案進行專家論證黨史資料數(shù)字化方案應經(jīng)審批后嚴格執(zhí)行。工作方案審批結(jié)果應與數(shù)字化過程中形成的其他文件一并保存。管理制度化成果質(zhì)量。黨史資料數(shù)字化管理制度應包含崗位管理體管理等方面的制度:崗位管理制度對各數(shù)字化崗位的工作目標和職責進行規(guī)范,形成明確的崗位業(yè)務流程規(guī)范、考核標準、獎懲辦法等;人員管理制度對人員的安全責任進行規(guī)范;場地管理制度對人員出入和工作場地內(nèi)基礎設施理工作進行規(guī)范;設備管理制度對數(shù)字化各環(huán)節(jié)涉及的全部設備的管理工作進行規(guī)范;數(shù)據(jù)管理制度對數(shù)字化各環(huán)節(jié)所產(chǎn)生的數(shù)據(jù)的管理工作進行規(guī)范;黨史資料實體管理制度對黨史資料實體在數(shù)字化過程中的交接工作流程控制應制定黨史資料數(shù)字化流程和各環(huán)節(jié)操作規(guī)范,對黨史資料數(shù)字化全過程進行有效的控制,確保數(shù)字化成果質(zhì)量。應加強對黨史資料數(shù)字化的全流程安全管理。應建立完善的問題反饋機制,對黨史資料數(shù)字化過程中后端環(huán)節(jié)發(fā)現(xiàn)前端環(huán)節(jié)中產(chǎn)生的問題進行及時反饋和修正。工作資料管理應根據(jù)情況制定符合實際要求的黨史資料數(shù)字化工作資料,加強對數(shù)字化的管理。工作資料主要包括:黨史資料數(shù)字化方案;黨史資料數(shù)字化審批書;黨史資料數(shù)字化流程單;數(shù)據(jù)驗收單;項目驗收報告;黨史資料數(shù)字化成果移交清單等。應加強對黨史資料數(shù)字化工作資料的管理等管理要求。黨史資料出庫黨史資料保管部門應按照黨史資料數(shù)字化方案確定的數(shù)字化對象開展黨史資料調(diào)取4DB32/T4818.2—2024見附錄,經(jīng)相關責任人批準后,按照各地黨史資料庫房管理要求為數(shù)字化對象辦理出庫手續(xù)黨史資料數(shù)字化過程中,應設置距離數(shù)字化加工場所較近的保管庫以臨時存放黨史資料,對黨史資料的領取與歸還進行嚴格管理黨史資料按介質(zhì)可分為以下幾類。的擁有ISBN的圖書、各公開發(fā)表的報紙雜志等;開盤帶等。數(shù)字化前處理確定掃描頁宜將確定為數(shù)字化對象的黨史資料全部掃描。如有不需要掃描的頁面應加以標注。編制頁號應對沒有頁號或頁號不正確的黨史資料重新編制頁號。書寫頁號所使用的筆、墨等不應破壞黨史資料原件或?qū)h史資料長期保存造成影響。應將破損頁面、缺頁等特殊情況進行登記。目錄數(shù)據(jù)準備按照目錄數(shù)據(jù)庫建立時制定的數(shù)據(jù)規(guī)則應對需要在目錄數(shù)據(jù)庫中進行標記的情況進行標記。拆除裝訂應以對黨史資料的保護為原則確定是否拆除裝訂。如需拆除裝訂物,應注意保護黨史資料不受損害,并對排列順序不準確的黨史資料進行重排。特殊裝訂且拆除裝訂后需恢復的黨史資料,在拆除裝訂物時應采用拍照等方式記錄黨史資料原技術修復紙質(zhì)資料件進行相應處理5DB32/T4818.2—2024圖像資料對殘缺、褪色、偏色的進行補充和校色。如需提供原片,應補充相關資料。音視頻資料對音視頻黨史和文獻資料載體進行外觀檢查,如出現(xiàn)以下情況,應對音視頻黨史和文獻資料載體進行適度清潔或修復等技術處理:資料載體物理形態(tài)出現(xiàn)卷曲資料載體出現(xiàn)可見性微斑影響音視頻資料數(shù)字化的其他情況。檢查資料載體是否存在已經(jīng)損毀無法數(shù)字化的情況,對于認定為不能數(shù)字化的資料載體,送到省級黨史部門做進一步檢查認定。如遇恢復率較低的情況,應與提供單位協(xié)商解決。實物資料對實物資料進行拍照,標注實物的尺寸大小質(zhì)地,體現(xiàn)實物資料的形狀和內(nèi)容。資料登記按照DB32/T4818.1—2024第67章的要求,制作并填寫《黨史資料數(shù)字化加工登記單見附錄,詳細記錄資料相關信息。恢復裝訂掃描工作完成后,拆除裝訂物的資料應重新進行裝訂。恢復裝訂時,應注意保持資料的排列順序不變,案卷左邊和底邊整齊,做到完整、準確、無遺漏。目錄數(shù)據(jù)庫建立應制定包括數(shù)據(jù)字段長度、字段類型、字段內(nèi)容要求等的目錄數(shù)據(jù)庫數(shù)據(jù)規(guī)則,其制定應符合DB32/T4818.1—2024對黨史資料編目的要求。應選擇可轉(zhuǎn)換為通用數(shù)據(jù)格式的數(shù)據(jù)庫,數(shù)據(jù)庫結(jié)構(gòu)設計時應注意保持黨史資料的內(nèi)在聯(lián)系。將黨史資料數(shù)字化前工作中對黨史資料目錄進行修改目錄數(shù)據(jù)??刹捎糜嬎銠C自動校對與人工校對相結(jié)合的方式,對目錄數(shù)據(jù)的質(zhì)量進行檢查,檢查內(nèi)容包括編目項目的完整性、編目內(nèi)容的規(guī)范性和準確性等。發(fā)現(xiàn)不合格的數(shù)據(jù)應及時進行修改。資料掃描與采集基本要求黨史資料掃描應根據(jù)黨史資料原件實際情況等選擇相應的掃描設備,進行相關參數(shù)的設置和調(diào)整。參數(shù)的設置和調(diào)整應保證掃描后數(shù)字圖像清晰、6DB32/T4818.2—2024個以上文件時,應分別掃描。若后期采用軟件自動拼接的方式,重疊尺寸應不小于單幅圖像對應原件尺寸的1/3。利用專業(yè)的讀取設備采集音視頻信息術處理。掃描設備宜選擇對黨史資料實體破壞性小的掃描設備進行數(shù)字化,保護黨史資料實體。應采用平板掃描儀、專業(yè)不拆卷非接觸光源掃描儀及高分辨率的拍攝機進行掃描,不應采用滾筒式掃描儀。超出所使用掃描儀掃描尺寸的黨史資料可采用更大幅面掃描儀進行掃描,也可采用小幅面掃描儀分幅掃描后進行圖像拼接的方式處理。應遵循相關設備的使用規(guī)律掃描色彩模式宜全部采用彩色模式進行掃描,最大限度保留黨史資料原件信息。頁面中有紅頭、印章或插有照片、彩色插圖、多色彩文字等的黨史資料,應采用彩色模式進行掃描。頁面為黑白兩色,但字跡清晰度差或帶有插圖的黨史資料,可采用灰度模式進行掃描。掃描分辨率應綜合考慮掃描后圖像的清晰度、完整度和數(shù)字圖像后期利用方式等因素進行掃描分辨率的選擇。掃描分辨率不應小于300dpi600dpi。如有COM進行COM輸出的黨史資料,掃描分辨率不應小于300dpi;進行高精度仿真復制的黨史資料600dpi;進行印刷出版的黨史資料辨率。存儲格式黨史資料數(shù)字圖像長期保存格式為JPG格式保存任一方向上的尺寸誤差不應超過3 水平斜角度不應超過1°。圖像壓縮率的選擇可根據(jù)實際應用的需求而定。黨史資料數(shù)字圖像利用時將圖像轉(zhuǎn)換為OFDPDF等其他格式。若轉(zhuǎn)化則所有JPG圖片應合并轉(zhuǎn)化成PDF文件。同一批黨史資料應采用相同的存儲格式。掃描圖像命名應在資料編號為主文件名的基礎上對數(shù)字圖像命名。應將數(shù)字圖像存儲為單頁文件,并按主文件名與圖像流水號的組合對圖像命名。例如:命名為×××××××××××.jpg。數(shù)字圖像確需存儲為多頁文件時,可采用該黨史資料的資料編號+4位序號對圖像命名。示例197875118960870001.jpg97875118960870002.jpg97875118960870003.jpg示例2320000_01_02_01_03_00000010001.jpg320000_01_02_01_03_00000010002.jpg7DB32/T4818.2—2024紙質(zhì)資料掃描常規(guī)紙質(zhì)資料掃描按照10.2.2要求的掃描設備和掃描方式進行掃描,彩色模式下掃描精度不應低于300dpi照10.5要求進行存儲,主文件名采取8位格式,文件名按約定的命名方法,命名為×××××××××.jpg。所有JPG圖片合并轉(zhuǎn)化成PDF文件。應在未改變原掃描圖像的色彩應保證圖像信息與原資料圖像內(nèi)容完全一致寫注釋和印鑒等。應清除干凈掃描留下的所有黑線、指印或陰影,圖像剪裁應保留到該頁文獻的外邊緣不包括書本疊頁部分。掃描圖像整體傾斜不應超過1°;不應出現(xiàn)圖像一部分傾斜或扭曲而影響閱讀的情況。圖片頁面存在部分傾斜的,以頁面中的文字糾正為準。方向不正確的圖像應進行旋轉(zhuǎn)還原,以符合閱讀習慣。紙張質(zhì)量造成的頁面上零星的污點,若在頁面視圖下看不清楚,或該污點嵌在文本行中無法清特殊紙質(zhì)資料掃描高進行拍照掃描,后將掃描文件組織成PDF文件。圖像資料掃描傳統(tǒng)沖洗的圖像資料掃描精度不應低于600dpi2寸以下的照片用600~1200dpi以上精度掃描,掃描后應對圖片進行題PDF文件。圖像格式可采用JPEG,應保證掃描精度。幻燈片可通過幻燈機等設備進行數(shù)字化,在原有圖像精度下轉(zhuǎn)換為JPEG格式的文件,而后以專題形式集結(jié)成冊,附上標題和說明,轉(zhuǎn)換為PDF文件。數(shù)字化的圖像數(shù)碼設備拍攝的,應在原有圖像精度下轉(zhuǎn)換為JPEG格式的文件;數(shù)字化矢量圖像文件,應在600dpi下進行柵格化,保存為JPEG文件,而后以專題形式集結(jié)成冊,附上標題和說明,轉(zhuǎn)換為PDF文件,不應改變內(nèi)嵌圖像的格式與精度,圖像容量不受限制。圖像存儲所有資料形成的圖像文件均應采用JPG格式存儲。轉(zhuǎn)存一套雙層PDF格式。圖像文件以文件夾命名,文件夾命名應與文件級目錄中的ISBN命名相一致,文件夾內(nèi)單頁圖像以8位流水號命名。8DB32/T4818.2—2024到100 。應科學建立黨史資料數(shù)字圖像的存儲路徑,確保數(shù)據(jù)掛接的準確性。圖像檢查數(shù)字化單位應在掃描完成后立即進行質(zhì)檢,檢查各級別圖像數(shù)據(jù)的質(zhì)量。數(shù)據(jù)檢查的內(nèi)容和要求如下。圖像文件各種格式放大到1馬賽克等或圖像內(nèi)容不完整等現(xiàn)象。若不符合圖像質(zhì)量要求應進行圖像校正或重新掃描。發(fā)現(xiàn)文件漏掃時,應及時補掃并正確插入圖像。拼接圖像接縫處無錯位是否符合掃描規(guī)格要求和技術參數(shù)。所有文件保存位置正確,可有效打開和顯示。資料一致。等文檔是否齊全。報紙資料掃描掃描版面圖像,按400dpi精度對報紙整版掃描,確保版面文件的完整性。保留400dpi精度的原始掃描版面圖像文件,修圖后版面圖不低于400dpiPDF版面數(shù)據(jù)不低于400dpi。圖片數(shù)據(jù)庫資料格式采用JPG壓縮格式。黑白版面及圖片采用灰度技術片采用彩色技術。糾正掃描圖像的傾斜度,糾正后傾斜度不超過2°。全部圖片均應裁切,標引后以原掃描大小原色彩交付。音視頻資料采集模擬信號的音視頻資料載體信息采集后字幕文件,實現(xiàn)文字搜索定位。應按照11.3音視頻資料處理中的技術參數(shù)要求進行數(shù)字化轉(zhuǎn)換形成數(shù)字副本,并建立目錄數(shù)據(jù)庫。數(shù)字信號的音視頻資料拷貝采集后,按原格式保留一份資料后進行降噪、建立字幕文件等數(shù)字化處理。有多件錄音錄像電子文件反映相同場景或主題內(nèi)容的原始的錄音錄像文件素材和后期編輯制作的錄音錄像文件都應收集保存,并對檔案實體進行系實物資料掃描對實物資料進行數(shù)碼拍照。一個角度無法反映實物形狀的,應多個角度進行拍照。印章等實物,應將印章內(nèi)容體現(xiàn)出來。拍照后的實物資料數(shù)字化制作過程同圖片資料類處理方法。9DB32/T4818.2—2024珍貴且尺寸不規(guī)則的黨史資料大小。掃描后圖像處理圖像拼接對分幅掃描形成的多幅數(shù)字圖像,應進行拼接處理,合并為一個完整的圖像,保證黨史資料數(shù)字圖像的整體性。拼接時應確保拼接處平滑地融合,拼接后整幅圖像無明顯拼接痕跡。旋轉(zhuǎn)及糾偏對不符合閱讀方向的數(shù)字圖像應進行旋轉(zhuǎn)還原。對出現(xiàn)偏斜的圖像應進行糾偏處理基本不感覺偏斜為準。裁邊如需對數(shù)字圖像進行裁邊處理,應在距頁邊最外延至少2mm~3mm處裁剪圖像。去污去除在掃描過程中產(chǎn)生的污點、污線、黑邊等影響圖像質(zhì)量的雜質(zhì),應遵循展現(xiàn)黨史資料原貌的原則,處理過程中不應去除黨史資料頁面原有的紙張褪變斑點、水漬、污點、裝訂孔等痕跡。圖像質(zhì)量檢查應進行圖像質(zhì)量檢查,發(fā)現(xiàn)質(zhì)量問題及時進行整改:數(shù)字圖像不完整、無法清晰識別或圖像失真度較大時,應重新掃描;數(shù)字圖像的排列順序與黨史資料原件不一致時,應及時進行調(diào)整;重新進行圖像處理。資料處理除報紙外的文字及圖像資料處理OCR識別依據(jù)數(shù)字化加工登記單OCR的資料進行OCR逐頁識別校對,差錯率應保持在千分之一以內(nèi)。PDF文件應根據(jù)圖像尺寸間至最小。手寫文檔等不適宜OCR識別的資料,應將每份資料的標題、目錄等通過人工干預方式進行識別標注。PDF合并轉(zhuǎn)化成冊裝訂的資料,一冊資料合并轉(zhuǎn)化為一個多頁的PDF文件;按卷歸檔的資料由多個成冊資料按照順序進行編號組成。PDF文件的命名即該資料的加工編號。目錄導航編輯成冊裝訂的資料,應將輸出后的雙層PDF進行目錄標簽提取,提取級別上限為三級。提取過程中應10DB32/T4818.2—2024按照原書頁面順序進行提取,不應出現(xiàn)章節(jié)丟失或級別劃分錯誤等情況,若書本目錄缺失,則由人工編制兩級目錄進行編目。報紙資料處理文字處理應按照以下要求進行文字處理。全文數(shù)字化部分的文字處理差錯率應在萬分之一以下。標引文字差錯率應在萬分之一以下。轉(zhuǎn)版文章應連成一篇文章特定文章的差錯標準如下:政治人物——歷屆黨和國家領導人名單,歷屆省/市委和省/市政府領導人名單,全國人大、政協(xié)領導人名單,省/國家及本省領導人的講話含公告版面文件制作將紙質(zhì)報紙制作生成雙層PDF格式文件版面數(shù)據(jù)完整性應達到100 。文件夾命名及存放文件夾命名應遵循以下要求。以報紙為單位組織成文件的第一層目錄jsrb。)在報名簡稱的目錄下,以年月日為組織單位形成第二層目錄,目錄名為YYYY?MM?DDMM和DD表示22022年12月122022?12?12。單位數(shù)的日期表示為0+2022年9月92022?09?09。在年月日形成的目錄下,以各版版名形成第三層目錄:0101;若為字母加數(shù)字命名的版面A02A02;010203版;A2A3A02;01;A01B01。文件夾存放應遵循以下要求:除分類規(guī)則文件外均存放在年月日表示的第四層目錄下XMLPDF版JPG版面文件,新聞圖文件;表格、公式可作圖片處理;去掉版面上筆記、公章等痕跡。有排版生成的報刊電子數(shù)據(jù),宜使用對應的標引工具進行反解。沒有排版報刊數(shù)據(jù)或不使用推薦標引系統(tǒng)的E生成XML文件。11DB32/T4818.2—2024交付成果標引好的XMLPDFJPGJPG插圖文件,彩色版面的色彩模式為RGB色彩模式為Grayscale。11.3 音視頻資料處理基本要求采集完成后的原始音視頻文件在提供利用前,可針對原始音視頻文件的拷貝文件進行文件轉(zhuǎn)用于長期保存的音視頻文件應是原始音視頻文件,而非處理后的文件。信息處理音頻資料數(shù)字化的技術參數(shù)應滿足以下要求。a)采樣率:不低于44.1kHz。對于珍貴或有特別用途的音頻資料,采樣率不低于96kHz。b)量化位數(shù):24位。聲道:以原始聲道數(shù)記錄。文件格式:模擬信號原始檔案資料采用WAVE格式,數(shù)字資料按原格式數(shù)據(jù)采集與保存。數(shù)字化處理:所有采集到的資料采用MPEG?4AAC編碼處理,應采用可變碼率壓縮,平均碼率為160kbps。數(shù)字化成果資料用Matroska多媒體容器合并轉(zhuǎn)化音頻文件和字幕文件,音頻文件是MKA格式,字幕文件是SRT格式,背景可配上相關人物相片或相關圖片。對于配套的字幕數(shù)據(jù),字符編碼采用UTF?8BOM。視頻資料數(shù)字化的技術參數(shù)應滿足以下要求。H.264標準編碼。特別珍貴和特殊用途的錄像資料,可采用無壓縮的方式。幀率:與原錄像資料相同。畫面寬高比:與原錄像資料相同。分辨率:采集為標清視頻時為720×57原資料為PAL制式和SECAM制式或720×48原資料為NTSC;采集為高清視頻時分辨率不低于1920×1080。色彩采樣率:采集為標清視頻時不低于0,采集為高清視頻時不低于2。視頻量化位數(shù):不低于8bit。對于特別珍貴的資料應不低于10bit。視頻比特率:采集為標清視頻時不低于8Mbit/s,采集為高清視頻時不低于16Mbit/s。)音頻編碼格式:PCM。48kHz。音頻量化位數(shù):不低于16bit。對于特別珍貴的資料應不低于24bit。聲道:以原始聲道數(shù)記錄。AVI或MXF格式。數(shù)字化成果:以Matroska格式合并轉(zhuǎn)化,視頻文件的擴展名為.mkv;字幕文件采用SRT格式,字符編碼采用UTF?8BOM。11.4 資料存儲存儲要求文字及圖像資料所有經(jīng)過識別和標注的資料內(nèi)容,文字差錯率應控制在千分之一以內(nèi)。元數(shù)據(jù)編目差錯率在12DB32/T4818.2—2024千分之一以內(nèi)。雙層PDFPDF文件的圖像層和文字層的文字對位準確。整本PDF應制作書簽。書簽是電子書的目錄,內(nèi)容和紙質(zhì)書的目錄一致。書簽的功能是用戶點擊書簽的某一章節(jié),電子書會自動顯示為相應頁。打開PDF文件時,自動顯示書簽,書簽只展開到第一級目錄。成冊資料的PDF目錄導航文字內(nèi)容差錯率千分之一以內(nèi),鏈接要求100準確。打開一本電子文獻閱覽并對文字放大時,應保證在放大到200的時候,字跡清晰,筆畫連音視頻資料音視頻數(shù)據(jù)最終都應以Matroska格式合并轉(zhuǎn)化為文件形式3D內(nèi)容使用左右格式編碼在其中合并轉(zhuǎn)化相關的章節(jié)信息與圖片文件,圖片文件精度應不低于300dpiJPEG格式編碼。Matroska容器的標簽中循Matroska可擴展的開放標準音視頻容器中的定義。存儲格式所有文字及圖像數(shù)字化資料以PDF/A?1a格式存儲;視頻數(shù)字化資料以MKV格式存儲;音頻數(shù)字化資料以MKA格式存儲;配套字幕數(shù)據(jù)以SRT格式存儲。文件命名規(guī)則數(shù)字化資料命名數(shù)字化資料按照命名規(guī)則進行命名6位當?shù)匦姓^(qū)劃代碼+2位資料大類區(qū)分碼+2位出版內(nèi)外區(qū)分碼+2位資料時期區(qū)分碼+2位資料細類區(qū)分碼+7位順序區(qū)分碼。具體見圖1。圖1 數(shù)字化資料命名規(guī)則行政區(qū)劃代碼、大類區(qū)分碼等編制說明見表1。表1 數(shù)字化資料命名說明序號名稱長度說明1行政區(qū)劃代碼6位參考國家行政區(qū)劃代碼2大類區(qū)分碼2位0102030405069913DB32/T4818.2—2024表1 數(shù)字化資料命名說明(續(xù))序號名稱長度說明3出版內(nèi)外區(qū)分碼2位0102994資料時期區(qū)分碼2位01:新民主主義革命時期02:社會主義革命和建設時期03:改革開放和社會主義現(xiàn)代化建設新時期04:中國特色社會主義新時代05995資料細類區(qū)分碼2位0102030405060708996順序區(qū)分碼7位按順序編碼“320000_01_02_01_03_0000001時間為新民主主義革命時期0000001實物資料標簽命名實物資料應加貼標簽。標簽的命名和數(shù)字化資料命名一致。數(shù)據(jù)掛接數(shù)字化轉(zhuǎn)換過程中形成的目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫,通過質(zhì)檢環(huán)節(jié)確認為合格后,應借助相關軟逐條對掛接結(jié)果進行檢查,發(fā)現(xiàn)錯誤及時進行糾正,編目條目與對應圖像文件掛接正確率應達到100 。檢查內(nèi)容包括:a)目錄數(shù)據(jù)與黨史資料數(shù)字圖像對應的準確性;b)已掛接數(shù)字圖像與實際掃描數(shù)量的一致性;c)數(shù)字圖像是否能正常打開等。數(shù)字化成果驗收與移交驗收方式黨史部門應成立專門的驗收組,采用系統(tǒng)自動檢驗與人工檢驗相結(jié)合的方式對黨史資料數(shù)字化成果14DB32/T4818.2—2024進行驗收檢驗。驗收內(nèi)容黨史資料數(shù)字化成果包括黨史資料目錄數(shù)據(jù)載體等。應對目錄數(shù)據(jù)進行驗收,主要包括數(shù)據(jù)庫中各條目的內(nèi)容、格式等的準確程度,必填項是否填寫等。應對元數(shù)據(jù)進行驗收,主要包括元數(shù)據(jù)元素的完整性和賦值規(guī)范性等。應對數(shù)字圖像進行驗收序的準確性、圖像質(zhì)量等。應對音視頻文件進行驗收應對數(shù)據(jù)掛接進行驗收,主要包括目錄數(shù)據(jù)與其對應的數(shù)字圖像的掛接的準確性等。應對工作文件進行驗收應對存儲載體進行驗收,主要包括載體的可用性、有無病毒等。驗收指標總體要求能采用計算機自動檢驗的項目應采用計算機自動檢驗的方式進行100檢驗,檢驗合格率應為100。不能用計算機自動檢驗的項目,可根據(jù)情況以件或卷為單位采用抽檢的方式進行人工檢驗,抽檢比率不應低于5,對于數(shù)據(jù)庫條目與數(shù)字圖像內(nèi)容對應的準確性,抽檢合格率應為100,其他內(nèi)容的抽檢合格率應不低于95。圖像掃描和目錄建庫數(shù)據(jù)驗收經(jīng)數(shù)字化單位自檢符合要求后,在數(shù)字化單位無償提供的客戶質(zhì)檢管理終端上,每批以抽檢50的方式進行圖像掃描和目錄建庫數(shù)據(jù)的驗收,其中:黨史資料號、文件夾命名、掃描無漏頁、掃描圖像完整性的準確率應達到100。如發(fā)現(xiàn)一條錯誤應退回重檢,且檢查驗收方不提供錯誤數(shù)據(jù)。其他數(shù)據(jù)項允許差錯率控制在1以內(nèi)。文件完整性檢查對PDF文件的清晰度、傾斜度、失真度等進行檢查。如發(fā)現(xiàn)不符合質(zhì)量要求的文件,應重新進行掃描處理。由于操作不當導致掃描文件不完整或無法清晰識別時,應重新掃描。檢查驗收方不提供錯誤信息。資料數(shù)據(jù)掛接驗收數(shù)字化單位自檢符合規(guī)定要求后,每批以抽檢50的方式進行數(shù)據(jù)驗收。數(shù)據(jù)掛接準確率應達到100 資料實體驗收資料實體驗收應逐卷清點98以上予以驗收通過。15DB32/T4818.2—2024驗收結(jié)論黨史資料數(shù)字化成果質(zhì)量檢驗達到13.213.3“通過。驗收未通過應視情況進行返工或修改,后重新進行驗收。驗收完成后應經(jīng)驗收組成員簽字。驗“通過的結(jié)論,應經(jīng)相關項目負責人和質(zhì)檢人員審查簽字,并提交黨史部門審核確認后方有效。移交數(shù)字化成果資料驗收合格后,制作單位應按照應標黨史資料數(shù)字化方案完善各種文件資料,連同省級黨史部門將統(tǒng)一對各市采集處理完成的原始資料和數(shù)字化資料進行專業(yè)存儲和開放應用。黨史資料歸還入庫原始資料歸還入庫資料裝訂黨史資料數(shù)字化完成后,拆除過裝訂物的黨史資料如需裝訂,應保持黨史資料原貌,做到安全、準確、無遺漏。資料歸還入庫對黨史資料進行處理和清點,并履行黨史資料入庫手續(xù)。數(shù)字化資料備份備份范圍經(jīng)驗收合格的完整數(shù)據(jù)。備份方式每完成一個類別的數(shù)據(jù)驗收后,保存未經(jīng)壓縮的單頁TIFF格式硬盤兩套,另轉(zhuǎn)存兩套雙層PDF格式硬盤。存儲數(shù)據(jù)的硬盤由數(shù)字化單位無償提供。為保證數(shù)據(jù)安全性,備份可選擇多樣化的載體,可采用在線、離線等多種方式相結(jié)合進行多套備份,并注意異地保存。備份數(shù)據(jù)檢驗檢驗內(nèi)容主要包括備份數(shù)據(jù)能否打開對移交的硬盤進行質(zhì)量檢查,檢查硬盤外觀及硬盤質(zhì)量,目錄完整性、圖像是否可以打開等情數(shù)據(jù)重新進行備份。備份標簽離線備份,如移動硬盤、光盤、磁帶存儲等,應做好介質(zhì)上的標簽,以便查找和管理。16DB32/T4818.2—2024備份登記應進行備份登記,填寫《黨史資料數(shù)字化備份管理登記表見附錄17DB32/T4818.2—2024附 錄 A資料性)黨史資料數(shù)字化安全管理制度工作區(qū)域應安裝無死角監(jiān)控探頭全天監(jiān)控。工作人員應佩戴工牌,非工作人員不應進入作業(yè)區(qū)。工作人員應簽訂保密協(xié)議。在作業(yè)區(qū)不應攜帶及使用電子設備U盤等。工作電腦只提供內(nèi)網(wǎng),不應開通因特網(wǎng)權(quán)限。不應攜帶任何火源、食品、飲料等進入加工場所。在省市縣之間通過網(wǎng)絡傳輸數(shù)據(jù)時HTTPS協(xié)議。傳輸前應根據(jù)省級黨史部門規(guī)定的統(tǒng)一加解密方法和密鑰,對內(nèi)容進行加密。通過物理介質(zhì)傳遞電子資料時,也應對內(nèi)容進行加密。數(shù)字化竣工移交后應格式化本地存儲。18DB32/T4818.2—2024附 錄 B資料性)黨史資料數(shù)字化加工保密管理制度黨史資料管理人員和數(shù)字化加工單位均應樹立保密觀念,共同保守黨史資料機密。對各類黨史資料均應按合同規(guī)定的范圍進行出入庫、掃描,并嚴格履行手續(xù)。不應對不在掃描范圍應嚴格管理掃描的黨史資料或復制。凡涉及黨史機密的人員一律不準許在家庭、子女及無關人員面前談論有關黨史機密內(nèi)容,不應在普通電話、明碼電報和私人通信中暴露黨史機密。數(shù)字化加工單位對所掃描黨史資料應妥善保管訪友、出入公共場所等。對目錄有錯誤、失去保存價值的黨史資料文件應及時溝通處理,不應以廢紙出售。發(fā)生失密、泄密和資料被盜事件時,應立即報告主管領導。當事者應寫出書面報告。對違反保密規(guī)對電子化掃描的黨史資料在掃描后宜按原順序入庫;對需要作出調(diào)整的黨史資料,應及時向領導報告,協(xié)商出對問題資料的處理辦法。不應私自處理解決。在黨史資料加工場所不應攜帶手機U盤、相機等可存儲設備。在加工期間所需要的電子設備、存儲裝置不應攜帶出加工場所。出入庫的黨史資料應做好出入庫登記,并且做好每日掃描進度的登記。黨史資料加工場所工作人員上下班及中午休息時間應嚴格簽到。在黨史資料數(shù)字化加工工作結(jié)束后交黨史部門接收,不準許帶出。在加工期間產(chǎn)生的廢棄的資料應統(tǒng)一交由黨史部門處理。19DB32/T4818.2—2024黨史資料出庫申請單見表C.1。
附 錄 C資料性)黨史資料出庫申請單表C.1 黨史資料出庫申請單交接事由注意事項序號資料名稱資料內(nèi)容數(shù)量備注1234審批人日期移交人日期接收人日期20附 錄 D資料性)黨史資料數(shù)字化加工登記單表附 錄 D資料性)黨史資料數(shù)字化加工登記單表D.1 黨史資料數(shù)字化加工登記單下載權(quán)限*禁止“*字段為必填字段。是否上架*是所屬地區(qū)多個編號用空格)32103212保密等級*項目數(shù)據(jù)內(nèi)容簡介*XXXXXX出版單位*新華日報出版時間*2022?08?02作者*張三相關事件*(多個用空格隔開)七七事變盧溝橋事變相關人物多個用空格隔開鄧小平周恩來文獻標簽*多個用空格隔開)南京無錫上海文件分類*(多個用空格隔開)10010002000200021001000200020003isbn編號*XXXXXX文件名稱樣例數(shù)據(jù)黨史資料數(shù)字化加工登記單見表D.1。*21黨史資料數(shù)字化加工登記單見表D.1。*DB32/T4818.2—2024附 錄 E資料性)報刊數(shù)據(jù)標引生成文件XML樣例以下為報刊數(shù)據(jù)標引生成文件XML樣例。<?xmlversion="1.0"encoding="utf?8"?><版面><大樣><日期>2022?04?25</日期><版次>01</版次><版名>要聞</版名><組版人/><報名>人民日報</報名><版面真名/><文件名>rb01RBXW1C425.fit</文件名><簽發(fā)部門/><簽發(fā)人/><版面編輯>鞠鵬</版面編輯><版面高>14605</版面高><版面寬>9384</版面寬><文本篇數(shù)>8</文本篇數(shù)><圖片篇數(shù)>3</圖片篇數(shù)><PDF><文件名>rb01RBXW1C425.pdf</文件名></PDF><版面圖><文件名>rb01RBXW1C425b.jpg</文件名><高>544</高><寬>350</寬><真圖><文件名>rb01RBXW1C425.jpg</文件名><高>5905</高><寬>3795</寬></真圖><簡圖><文件名>rb01RBXW1C425b.jpg</文件名><高>544</高><寬>350</寬></簡圖>22<圖標><文件名>rb01RBXW1C425i.jpg</文件名><高>100</高><寬>64</寬></圖標></版面圖></大樣><小樣><發(fā)布類型>發(fā)布類型</發(fā)布類型><發(fā)布>1</發(fā)布><信息ID>人民日報012021?04?2500033</信息ID><來源/><引題><![CDATA[]]></引題><標題><![CDATA[國家主席發(fā)表二〇二一年新年賀詞]]></標題><副題><![CDATA[]]></副題><摘要><![CDATA[]]></摘要><作者>鞠鵬</作者><通訊員/><欄目/><圖片說明/><下轉(zhuǎn)/><上接/><序號>1</序號><分類/><體裁/><轉(zhuǎn)載/><文件名>zll7465.txt</文件名><字數(shù)>1244</字數(shù)><版面圖映射><頂點個數(shù)>10</頂點個數(shù)><頂點>0.01 11.81 </頂點><頂點>70.59 11.81 </頂點><頂點>70.59 38.58 </頂點><頂點>0.01 38.58 </頂點><頂點>0.01 11.81 </頂點><頂點>-0.01 11.81 </頂點><頂點>0.01 11.81 </頂點><頂點>0.01 24.41 </頂點><頂點>-0.01 24.41 </頂點><頂點>-0.01 11.81 </頂點></版面圖映射>
DB32/T4818.2—202423DB32/T4818.2—2024<內(nèi)容><![CDATA[ ■記
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年人教版高一數(shù)學下冊月考試卷
- 寶雞三模理科數(shù)學試卷
- 家教如何助力孩子實現(xiàn)全面發(fā)展目標
- 小學生閱讀習慣的醫(yī)學研究價值探討
- 學校安全教育培訓的案例教學方法探索
- 學校國際交流與合作中的法律與政策問題
- 2024版古建筑防水修復合同協(xié)議
- 醫(yī)療與教育并進跨學科心理輔導實踐
- 二零二五年度瑜伽館加盟合同2篇
- 昌平高三2模數(shù)學試卷
- DBJ∕T 15-120-2017 城市軌道交通既有結(jié)構(gòu)保護技術規(guī)范
- CJJ181-2012 城鎮(zhèn)排水管道檢測與評估技術規(guī)程
- 生物醫(yī)學電子學智慧樹知到期末考試答案章節(jié)答案2024年天津大學
- 2023 版《中國近現(xiàn)代史綱要》 課后習題答案
- DB11T 489-2024 建筑基坑支護技術規(guī)程
- 一例火電機組有功功率突變原因分析及預防措施
- 數(shù)學寒假計劃書
- 第五章 中國特色社會主義理論體系的形成發(fā)展(一)
- 低空經(jīng)濟公司設立可行性分析
- 2024新能源風電場集電線路施工方案
- 2023-2024學年江西省吉安市吉州區(qū)八年級(上)期末數(shù)學試卷(含解析)
評論
0/150
提交評論