基于信息空間理論的歷史檔案數(shù)據(jù)化及其生存模式研究-檔案管理論文_第1頁
基于信息空間理論的歷史檔案數(shù)據(jù)化及其生存模式研究-檔案管理論文_第2頁
基于信息空間理論的歷史檔案數(shù)據(jù)化及其生存模式研究-檔案管理論文_第3頁
基于信息空間理論的歷史檔案數(shù)據(jù)化及其生存模式研究-檔案管理論文_第4頁
基于信息空間理論的歷史檔案數(shù)據(jù)化及其生存模式研究-檔案管理論文_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

8/8基于信息空間理論的歷史檔案數(shù)據(jù)化及其生存模式研究-檔案管理論文

Abstract:Thepaperusesliteratureanalysismethod.thispaperanalyzesthedatafeaturesofhistoricalarchivesfromthethreedimensionsofcoding,abstractionanddiffusion.Thearticlepointsoutthatthekeytobreakingthroughthecrisisofhistoricalarchivesisthesocializationofhistoricalarchivesknowledge,emphasizingthedigitaldevelopmentandutilizationofdigitalhistoricalarchives.Accordingtotheprocessofknowledgeevolutionintheinformationspace,thearticledrawstwokindsofhistoricalarchivessurvivalmode.

Keyword:InformationSpace;historicalarchives;Digitization

?v史檔案真實記錄和反映著中華民族的集體記憶,不僅是中華先民智慧的結晶,也是中華歷史文化遺產(chǎn)不可或缺的重要組成部分。關于歷史檔案的定義,馮惠玲、張輯哲認為:“歷史檔案是指形成時間較早、離現(xiàn)在較久遠且主要起歷史文化作用的檔案?!盵1]李財富認為:“歷史檔案是指1949年中華人民共和國成立之前的檔案,這些檔案主要發(fā)揮的是非現(xiàn)行價值,面對的利用主體是社會的各個方面?!盵2]楊珩、史江認為:“歷史檔案主要是指1949年10月中華人民共和國成立以前所形成的檔案,包括明代以前、明清檔案、民國檔案和革命歷史檔案等?!盵3]從上述定義可以發(fā)現(xiàn),學界主要是從時間角度界定歷史檔案,歷史檔案具有形成時間久遠、歷史文化作用明顯等特質(zhì)。

信息革命之前,歷史檔案就已經(jīng)出現(xiàn)生存危機,這種危機源于歷史檔案形成時間早的特征,體現(xiàn)在歷史檔案實體上。信息革命發(fā)生后,在數(shù)字化技術的幫助下,檔案的內(nèi)容信息從載體上解放出來,在縮微技術、數(shù)字化技術的幫助下,得以以模擬形式、數(shù)字形式重現(xiàn),這些技術從一定程度上緩解了歷史檔案長期保存危機,檔案館也因此有了更多的時間思考如何戰(zhàn)勝危機。然而,信息革命在挽救歷史檔案實體危機的同時也帶來了新的問題。信息革命后,信息成為與物質(zhì)、能源同等重要的存在,共同構成起支撐社會發(fā)展的三大支柱,世界范圍內(nèi)數(shù)據(jù)的數(shù)量激增,數(shù)據(jù)的豐富性阻礙了人們對有用信息的捕獲能力,成為歷史檔案生存危機新的源頭。如若歷史檔案利用無法打破時空界限被社會獲取發(fā)揮價值,則注定被海量數(shù)據(jù)掩埋,被迫處于社會邊緣狀態(tài),為社會所淘汰。當前,已有學者意識到這一危機。理論層面,裴燕生提出通過因特網(wǎng)管理和數(shù)據(jù)庫管理提供利用文件是歷史檔案數(shù)字化管理的最終目的。[4]楊珩、史江提出要對歷史檔案的潛在信息進行挖掘,強化歷史檔案在編目、???、輯佚等方面的數(shù)字化工作,同時建立專題性強且具地方特色的歷史檔案數(shù)據(jù)庫,并允許用戶登錄互聯(lián)網(wǎng)進行目錄查詢。[5]實踐層面,中國第一歷史檔案館、中國第二歷史檔案館相繼開展歷史檔案的數(shù)字化項目并對其進行開發(fā)利用,為理論研究提供經(jīng)驗參考。顯然,檔案界將實現(xiàn)歷史檔案數(shù)字化開發(fā)利用視為歷史檔案度過危機的突破口。立足已有的研究基礎,筆者嘗試將信息空間理論與歷史檔案數(shù)字時代的生存問題相結合,依托信息空間模型,從編碼、抽象和擴散三個維度分析數(shù)字時代歷史檔案的生存特征,繼續(xù)探索歷史檔案如何度過生存危機這一核心問題并思考突破策略,為歷史檔案在數(shù)字時代的生存提供新的思路。

1信息空間理論與歷史檔案數(shù)字生存

信息空間(Iinformationspace)是英國學者馬克斯?H?布瓦索(Max?H?boistz)提出的概念框架,用于研究信息空間框架中編碼、抽象和傳播三維上數(shù)據(jù)、信息和知識的轉(zhuǎn)化關系。布瓦索將數(shù)據(jù)定義為事物的一種屬性,如輕重、黑白等;而知識是行為主體的屬性,預先決定了行為主體在特定條件下的行為方式;信息則是事物與行為主體之間建立的一種聯(lián)系,其轉(zhuǎn)化關系如圖1所示[6]。

從圖1可以看出,行為主體通過感性或理性工具過濾得到對行為方式有意義的事物的數(shù)據(jù)子集(信息),這些信息會融入行為主體的知識儲備,成為其知識源,在特定條件下影響行為主體。布瓦索通過信息空間上編碼、抽象和擴散三個維度解釋了這個過程,信息空間的構成如圖2所示。其中,編碼是賦予現(xiàn)象或經(jīng)驗以形式的過程,抽象是構成種種形式之基礎的結構的過程,擴散是經(jīng)過編碼和抽象的信息傳播給受眾的過程[7]。

當前歷史檔案的生存危機除了實體保存之外,還有因數(shù)字時代到來而出現(xiàn)的新危機,即歷史檔案需要在海量數(shù)據(jù)環(huán)境中獲得競爭優(yōu)勢,避免被其他數(shù)據(jù)掩埋。針對新的危機,我們需要對歷史檔案數(shù)據(jù)進行深入開發(fā)并將其轉(zhuǎn)化為易于大眾接受的知識為社會所用,換句話說就是實現(xiàn)歷史檔案知識社會化。這一點,恰好同信息空間上事物本身的數(shù)據(jù)通過編碼、抽象和擴散三個維度轉(zhuǎn)化為知識的運動過程相類似。從信息空間理論視角來看,對歷史檔案的開發(fā)合理利用實質(zhì)上就是對歷史檔案進行原始數(shù)據(jù)編碼、抽象得到適合大面積擴散的信息集合的過程。需要強調(diào)的是,歷史檔案本身就是數(shù)據(jù)、信息和知識的集合體,在數(shù)字化的過程中,這種原有的集合體在技術的影響下發(fā)生變化,原先感官可捕捉的信息在數(shù)字化之后被隱藏,需要額外的描述將其表達出來。舉例來說,明清檔案原件字體的大小、字跡顏色、紙張材料及薄厚程度的不同等,如深紅色背景黑色字跡,淡黃色背景紅色字跡,顏色較淺字跡,以及紅、藍色字跡等因素,會對輸出到縮微膠片上信息的清晰度及完整性產(chǎn)生相當大程度的影響,從而造成檔案信息丟失。[8]這種丟失若不采取措施,會隨著“模轉(zhuǎn)數(shù)”技術被傳遞到數(shù)字形態(tài)的歷史檔案上,影響檔案的質(zhì)量。因此,重新分析數(shù)字化后的歷史檔案在信息空間編碼、抽象、擴散三個維度的特征可以為歷史檔案生存問題提供更好的方法和思路。2基于信息空間三個維度的歷史檔案數(shù)據(jù)化解讀

2.1編碼維度。編碼的過程是以其最具一般性的表達方式,創(chuàng)造有助于對現(xiàn)象進行分類的感性的和理性的范疇[9]。具體來說,就是對事物的數(shù)據(jù)進行描述的數(shù)據(jù)處理過程,使其從模糊向清晰轉(zhuǎn)變,比如對于玻璃杯,從視覺角度來看是透明的、觸覺角度看是硬的?!巴该鳌薄坝驳摹边@些形容就是對玻璃杯這個事物數(shù)據(jù)的最初的具體的描述,是個人所接收感官數(shù)據(jù)被外化和描述的結果。通過編碼這些具體的感官數(shù)據(jù)可以使用更高級的表達方式,比如語言和文字來建構起某個事物的整體性認識。對檔案來說也是一樣的,“文字記注的”“放在庫房里”這些是對檔案這一事物的直觀的描述,通過編碼,人們開始使用案牘、冊等概念來描述檔案這個事物。因此,編碼程度的高低影響著人們對其描述的事物識別的清楚程度。

就歷史檔案而言,編碼維度強調(diào)完整性。從內(nèi)容上看歷史檔案本身已經(jīng)是形成者對檔案所記述內(nèi)容的編碼成果,并且這個編碼成果是已經(jīng)經(jīng)歷過抽象和擴散過程,以符合識別標準的結構的狀態(tài)被呈現(xiàn)出來。因此,當歷史檔案從物理形式向數(shù)字形式轉(zhuǎn)變時,需要注意歷史檔案原有的內(nèi)容信息(編碼成功)的完整轉(zhuǎn)移,做到不遺漏,確保歷史檔案信息價值的發(fā)揮不會受到影響。然而,除了歷史檔案所記載的內(nèi)容信息,歷史檔案的載體材質(zhì)、記錄形式、裝具、紋飾等也是不可缺少的信息,這些信息側(cè)面反映了檔案形成和流轉(zhuǎn)的時空特質(zhì)。當歷史檔案向數(shù)字形式轉(zhuǎn)變,從以原子和分子構成轉(zhuǎn)變?yōu)橛?和1構成,時間和空間的距離阻斷了人們對歷史檔案這個事物的實體數(shù)據(jù)的直接捕獲,人們所接收的所有信息都依托于數(shù)字形式的歷史檔案,這時歷史檔案數(shù)字化表達的完整性直接影響這部分信息數(shù)據(jù)的隱現(xiàn)。若不對被隱藏的數(shù)據(jù)進行重新編碼,則這部分數(shù)據(jù)可能就此被忽略,造成檔案信息丟失。因此,數(shù)字形式的歷史檔案要想保證完整性,一方面需要保證歷史檔案從物理形式向數(shù)字形式轉(zhuǎn)變后,保有原先物理形式歷史檔案的全部編碼結果;另一方面,還需要在數(shù)字化過程中關注歷史檔案的物理形態(tài)信息,對轉(zhuǎn)碼過程中被隱藏的信息數(shù)據(jù)進行額外的編碼。編碼過程的完整是歷史檔案抽象和擴散的基礎。

2.2抽象維度。抽象是通過我們在完成某項特定任務時所需要的類別數(shù)最小化,從而實現(xiàn)數(shù)據(jù)處理上的節(jié)約[10]。簡單來說,抽象就是一個簡化過程,是一個用少表示多的過程,是對編碼后的數(shù)據(jù)集合進行分類、精簡和概括的過程??梢哉f編碼過程指向歷史檔案數(shù)據(jù)完整性,而抽象過程指向歷史檔案數(shù)據(jù)描述的可共享性。比如,關于玻璃杯的描述有玻璃杯大小、重量、顏色、手感、易碎度等多種,如果將所有的特征直接打包進入信息的擴散維度,會出現(xiàn)數(shù)據(jù)量大和數(shù)據(jù)冗余的情況,不適合信息(數(shù)據(jù)集合)的接收者接收和理解?!皺n案”這一詞匯的產(chǎn)生實質(zhì)上也是抽象過程發(fā)揮作用的結果。清軍入關前,滿漢兩族各自擁有對“檔案”這一事物的描述,比如檔子、案牘、冊等。清王朝成立后,在民族融合的推動下,“檔案”一詞開始逐漸普及開來??傊?,抽象就是對描述進行篩選與合并,在這一過程中與信息的傳播最終意圖無關的數(shù)據(jù)的排除,并且以一個具有更高概括度和社會認可度的結構確定下來的過程。抽象的程度越高,則越容易被不同背景的用戶所共享[11]。

歷史檔案在抽象維度主要經(jīng)歷兩個階段:第一個階段是對編碼的結果進行整理和歸納。也就是說,要形成具有一定概括性和普及度的類,方便歷史檔案編碼結果的分類和匯總。第二個階段是在第一個階段的基礎上,圍繞特定主題對結果進行數(shù)據(jù)過濾,對分類后的數(shù)據(jù)集合(信息)根據(jù)與核心意圖的因果關系進行類別的刪減,通過數(shù)據(jù)節(jié)約的方式保證數(shù)字呈現(xiàn)和傳播的結果最優(yōu)化。

2.3擴散維度。擴散維度是構成信息空間的三個維度中的第三個維度,擴散維度可參照在不同編碼和抽象程度上運作的信息可以達到的特定數(shù)據(jù)處理的總體的比例來標度[12]。換句話說,擴散維度衡量的是經(jīng)歷過編碼和抽象維度的信息在多大程度上能夠被社會各方面的利用者所接收和理解。就檔案而言,“檔案”一詞是清軍入關,滿族民族詞語逐漸同漢文化相結合的產(chǎn)物,擴散就是描述“檔案”這個詞匯在群體中的被接受和普及的程度。從某種意義上來說,擴散維度其實是對編碼和抽象維度得到的結果的顯示的檢驗,表示的是基于個體的私有知識向共享知識移動的區(qū)域,擴散值越大,則信息實現(xiàn)的共享程度就越高。

對歷史檔案而言,擴散維度上強調(diào)?韃サ撓行?性,即歷史檔案信息的傳播速度、范圍和接收者的理解,這些首先受到技術的影響。歷史檔案信息從發(fā)送端傳送到接收端,首先受到信息傳遞技術的影響,要想保證內(nèi)容信息在發(fā)送端和接收端具有一致性,必須選擇合適的技術。其次,傳播速度和范圍還會受到編碼和抽象結果表達方式的影響,采用更多人可以掌握的表達方式有利于信息的擴散。此外,傳播速度和范圍還需要結合宏觀的社會和文化環(huán)境,分析適合歷史檔案信息擴散的時機,合適的時機下,信息接收群體對歷史檔案信息的吸收和運用能力更高。

3信息空間視角下歷史檔案生存模式

3.1知識演化與歷史檔案數(shù)據(jù)生存。知識是行為主體通過選擇和過濾,從數(shù)據(jù)中提煉出來的信息中,對特定行為方式產(chǎn)生決定作用的部分。歷史檔案數(shù)字化生存從實質(zhì)上也可以理解為是數(shù)字化后的歷史檔案數(shù)據(jù)經(jīng)過整合和提煉,以信息的形式被傳遞,追求知識化的結果。在信息空間中,知識的動態(tài)演化涉及四個區(qū)域。如圖3所示,在區(qū)域A中的是未被擴散的個體的知識。位于A區(qū)域的知識通過抽象和編碼,去除一些默會的細節(jié)可以獲得一般性,從而進入B區(qū)域。在B區(qū)域中,知識受到其創(chuàng)造者的控制變成專有的東西,這種控制表現(xiàn)為專利和著作權等形式。隨著時間的推移,專有的知識會進入公共領域得到進一步的擴散,成為公共知識。而當人們使用公共知識,并把它運用在不同情況之下,公共知識會發(fā)生內(nèi)化,到達D區(qū)域,知識會從顯性轉(zhuǎn)化為隱性的默會知識,被整合到常識的范疇,從而達到普遍[13]。

就歷史檔案而言,檔案館藏歷史檔案同時分布在A區(qū)域和B區(qū)域之間,這兩個區(qū)域的共同特征是擴散性不高,但B區(qū)域比A區(qū)域的抽象編碼值更好,若A區(qū)域是經(jīng)歷過整理環(huán)節(jié)的歷史檔案,則B區(qū)域則是經(jīng)過檔案館編纂的檔案產(chǎn)品。A、B區(qū)域的歷史檔案要想進入C區(qū)域,知識性質(zhì)的轉(zhuǎn)變是關鍵,而擴散是這種轉(zhuǎn)變的表征,擴散所具有的傳播特質(zhì),對于歷史檔案提高社會認知度,在數(shù)字時代繼續(xù)發(fā)揮價值有著積極作用。從知識演化過程可以看出,知識的最高形式是常識,常識通過知識的內(nèi)在化達到,而知識內(nèi)在化又以知識的運用為前提。前文已經(jīng)提及知識實質(zhì)上是信息集合,所以知識的運用即信息集合的運用,根據(jù)信息集合編碼抽象程度的差異,筆者認為當前檔案領域內(nèi)通過知識運用以實現(xiàn)歷史檔案擴散的模式有兩個,區(qū)別在于進入知識運用環(huán)節(jié)時歷史檔案編碼抽象的程度:一是待數(shù)字形式的歷史檔案形成具有高編碼、高抽象特征的信息集合時,通過現(xiàn)代傳播技術,投入擴散維實現(xiàn)知識運用;二是直接將編碼、抽象程度不高的數(shù)字形式的歷史檔案投入擴散維,讓利用者成為編碼抽象的執(zhí)行主體,在傳播同時繼續(xù)編碼、抽象工作。3.2基于高編碼抽象的歷史檔案。高編碼、高抽象形式的歷史檔案,其擴散維的主要目標在于歷史檔案知識的傳播,這需要耗費較大的人力和時間成本,所以一般是以檔案館為這些過程的執(zhí)行主體,檔案館在這些過程中需要著重解決三方面問題:一是在抽象過程中,對于數(shù)字形式的歷史檔案數(shù)據(jù)應該遵循怎樣的標準和規(guī)范來保證歷史檔案的原生性,盡可能避免數(shù)字化過程對完整性的影響;二是在抽象過程中,要發(fā)掘歷史檔案之間的因果關系,形成特定主題歷史檔案信息的知識脈絡;三是擴散過程,確保歷史檔案信息傳播的準確性和有效性。

從編碼過程看,目前檔案館針對歷史檔案的數(shù)字化項目,以歷史檔案長期保存為目標,強調(diào)數(shù)字轉(zhuǎn)化成果與歷史檔案原件保持一致。實際操作過程中,有部分檔案館已經(jīng)關注到轉(zhuǎn)碼后歷史檔案整體數(shù)據(jù)的變化,從而增加對技術性信息的額外描述,但從整體層面來看對歷史檔案整體數(shù)據(jù)化仍有不足。因此,歷史檔案的數(shù)據(jù)化應當立足歷史檔案長期保存的目標,以歷史檔案整體數(shù)據(jù)化為核心,重視修訂與之相?P元數(shù)據(jù)標準和規(guī)范,將除歷史檔案內(nèi)容之外的其他有價值的數(shù)據(jù)包含在內(nèi),積極吸納有利于歷史檔案完整轉(zhuǎn)化的新興數(shù)字技術,為后期的抽象和擴散打好基礎。

從抽象過程看,當前歷史檔案多采用先整理后數(shù)字化的模式,數(shù)字化后的歷史檔案直接將物理形式歷史檔案整理的結果轉(zhuǎn)移到數(shù)字環(huán)境[14]。知識脈絡也在此基礎上得以呈現(xiàn)。數(shù)字化經(jīng)驗豐富,降低了數(shù)據(jù)化過程對歷史檔案進行抽象的難度,但也帶來了問題。經(jīng)驗豐富意味著檔案館可以運用的分類法較多,在不同分類法上形成的歷史檔案元數(shù)據(jù)集合的語義關聯(lián)懸殊,主題法基礎上形成的元數(shù)據(jù)集合具有更高的語義關聯(lián)度,而組織機構法則較為薄弱。因此,檔案館應當明確歷史檔案原件分類法,建立符合要求的元數(shù)據(jù)標準,以保證知識脈絡的完整呈現(xiàn)。

從擴散過程看,當前對歷史檔案傳播效果的評價多是從檔案館角度展開的,忽視了利用者對傳播效果的評價功能,缺少在線服務溝通與反饋機制。因此,檔案館應當開辟有效的在線服務反饋平臺,積極與利用者進行溝通,保證歷史檔案信息在發(fā)送端和接收端的一致性,明確利用者對在線歷史檔案的理解程度,并以此評價歷史檔案傳播的有效性,根據(jù)獲得的指標及時調(diào)整編碼工作和抽象工作。

3.3基于低編碼抽象的歷史檔案數(shù)據(jù)化。對于低編碼、低抽象形式的歷史檔案而言,將其置于擴散維度進行傳播目的不直接作用于歷史檔案知識的傳播和知識形態(tài)的轉(zhuǎn)變。低編碼、低抽象歷史檔案進入擴散維旨在通過誘發(fā)社會的好奇,吸引社會層面的關注

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論