高校圖書館數(shù)字資源存儲需求分析_第1頁
高校圖書館數(shù)字資源存儲需求分析_第2頁
高校圖書館數(shù)字資源存儲需求分析_第3頁
高校圖書館數(shù)字資源存儲需求分析_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

高校圖書館數(shù)字資源存儲需求分析

1存儲方案優(yōu)化隨著高校圖書館數(shù)字化建設(shè)的推進(jìn),數(shù)字資源遠(yuǎn)遠(yuǎn)積累。這些數(shù)字資源種類繁多,數(shù)量巨大,訪問用戶多,并呈現(xiàn)出幾何級數(shù)激增的趨勢。在傳統(tǒng)的存儲方案中,是通過不斷地添加存儲設(shè)備和服務(wù)器來暫時滿足這種激增的存儲需求的。但由于缺少統(tǒng)一的規(guī)劃,現(xiàn)在已經(jīng)逐漸無法便捷高效地管理這些設(shè)備了。因此迫切需要一種新的存儲方案,在整合原有資源基礎(chǔ)之上來解決海量數(shù)據(jù)的存儲和傳輸問題,以滿足高校圖書館持續(xù)發(fā)展的存儲需求。本文在分析圖書館的存儲需求的基礎(chǔ)上,結(jié)合最近發(fā)展的云存儲技術(shù),采用針對不同類型的數(shù)字資源采用不同的存儲策略的原則,提出了一種基于混合云的新的存儲方案。2其他類型的存儲高校圖書館的數(shù)字資源主要是通過數(shù)字化館藏資源,收集社會公共數(shù)字資源以及購買商業(yè)數(shù)據(jù)庫等途徑來獲得的。主要可以分為以下幾類:第一類是本校特有的數(shù)字資源,它們一般是以文件形式存儲的。如本館資源數(shù)字化所得的成果、本校教師的數(shù)字教學(xué)資源、本校學(xué)生的學(xué)位論文等。這些資源的數(shù)據(jù)量大并且在不斷增加中,數(shù)據(jù)的訪問頻率也很大,對存儲的訪問速度和安全性要求都很高。因為是特有的資源,萬一丟失,將造成巨大損失。第二類是購買的商業(yè)數(shù)據(jù)庫、電子圖書等,如電子期刊全文、電子圖書、隨書光盤等。這類資源存儲的特點是數(shù)據(jù)總量大,增長迅速,以讀操作為主,這類資源主要是對存儲的訪問速度要求高,安全性要求比第一類低。如果這些資源丟失,還可以從購買處恢復(fù)。第三類是本校資源的流通記錄和學(xué)生借閱記錄等管理信息。這些信息一般記錄在圖書管理系統(tǒng)的數(shù)據(jù)庫系統(tǒng)中。這些數(shù)據(jù)對于學(xué)校圖書館的采購等管理工作具有巨大的價值,對存儲的訪問速度和安全性要求都高。第四類是上述各類資源的備份數(shù)據(jù)。這些數(shù)據(jù)周期性地增加,數(shù)據(jù)量大,對存儲速度的要求不高,只有在災(zāi)難發(fā)生時才會被用來恢復(fù)原有數(shù)據(jù)。3網(wǎng)絡(luò)存儲sa當(dāng)前網(wǎng)絡(luò)化存儲技術(shù)主要分為DAS(直接附加存貯)、NAS(網(wǎng)絡(luò)附加存儲)和SAN(存貯區(qū)域網(wǎng)絡(luò))三大類。由于DAS中服務(wù)器一旦發(fā)生故障,存儲設(shè)備中的數(shù)據(jù)將不能被存取,服務(wù)器容易成為網(wǎng)絡(luò)瓶頸。而NAS在備份過程中要消耗帶寬,從而要影響數(shù)據(jù)的存取速度。SAN可以很好地滿足存儲系統(tǒng)的高效等方面的要求,但由于要構(gòu)建專用的光纖網(wǎng)絡(luò),成本比較高,管理比較復(fù)雜,因此不能廣泛推廣。目前應(yīng)用最廣泛的網(wǎng)絡(luò)存儲技術(shù)是IP-SAN。IP-SAN是一種基于ISCSI存儲技術(shù)的存儲產(chǎn)品。它在FC-SAN的基礎(chǔ)上再進(jìn)一步把SCSI協(xié)議完全封裝在IP協(xié)議之中,用更成熟的以太網(wǎng)來替代FC-SAN中的光纖通道?;贗P-SAN的存儲設(shè)備可以通過塊I?OSCSI指令對其進(jìn)行訪問,操作便捷。雖然IP-SAN解決了網(wǎng)絡(luò)存儲的傳輸距離、異地容災(zāi)、兼容性以及管理復(fù)雜問題等,同時也降低了使用成本,但是依然還存在以下很多問題。3.1ip協(xié)議沒有考慮安全問題由于采用TCP?IP來傳輸數(shù)據(jù),而TCP?IP協(xié)議在設(shè)計當(dāng)初并沒有考慮安全問題。比如數(shù)據(jù)在傳輸過程中容易被竊聽造成泄密,存儲網(wǎng)絡(luò)容易遭受DOS?DDOS攻擊而癱瘓。3.2網(wǎng)絡(luò)基礎(chǔ)設(shè)施的差由于ISCSI協(xié)議的標(biāo)準(zhǔn)沒有被所有廠家使用,不同廠家的產(chǎn)品之間可能無法互聯(lián)。3.3cpu消耗嚴(yán)重在實現(xiàn)數(shù)據(jù)的安全傳輸時,必須借助CPU來實現(xiàn)編碼、校驗、糾錯等工作。4對存儲的存儲方案探索的建議由于當(dāng)今圖書館中普遍使用的存儲方案都存在各種各樣的問題,因此迫切需要探索新的存儲方案。云計算和云存儲的出現(xiàn),為我們研究新的存儲方案提供了新的思路。4.1云存儲服務(wù)商云存儲技術(shù)是隨著云計算技術(shù)的發(fā)展而發(fā)展起來的。它通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)、虛擬存儲等技術(shù),將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能。它的基本思想與云計算相同,都是通過技術(shù)手段,將很多的資源統(tǒng)一起來管理,根據(jù)需要向不同的用戶提供服務(wù),從而得到資源共享及配制優(yōu)化的目的。云存儲系統(tǒng)是個復(fù)雜的系統(tǒng),它由網(wǎng)絡(luò)設(shè)備、存儲設(shè)備、服務(wù)器、應(yīng)用軟件、公用訪問接口、接入網(wǎng)和客戶端程序等多個部分組成。其中最核心的部分是管理其他部件協(xié)同工作的管理軟件。云存儲提供商通過向企業(yè)或個人提供存儲服務(wù)來獲利,而企業(yè)或個人則可以通過少量的費用來透明地享用存儲服務(wù),達(dá)到高效、可靠、降低成本的目的?,F(xiàn)在提供云存儲服務(wù)的公司與系統(tǒng)主要有:Amazon推出的彈性塊存儲(EBS)技術(shù)支持?jǐn)?shù)據(jù)持久性存儲、Google推出的在線存儲服務(wù)GDrive、Microsoft公司推出WindowsAzure、EMC的Atmos等。這些由第三方云存儲服務(wù)商提供的存儲云叫公共云。除此之外,如果僅僅依靠公共云不能完全滿足自己的存儲需求,企業(yè)可以利用自己的技術(shù)力量或者借助私有云方案提供商在企業(yè)內(nèi)部搭建云存儲環(huán)境,面向內(nèi)部用戶或者外部客戶提供存儲服務(wù)。企業(yè)擁有整個存儲環(huán)境的自主權(quán),因此可以基于自己的存儲需求來改進(jìn)服務(wù),這種云被稱為私有云。現(xiàn)在的私有云解決方案提供商主要有IBM、HP、DELL等。云存儲技術(shù)將存儲作為一種服務(wù)來提供,它與傳統(tǒng)的存儲技術(shù)相比最大的優(yōu)勢是存儲容量大,并可方便地動態(tài)擴展和縮小容量。這避免了存儲資源不夠無法提供優(yōu)質(zhì)服務(wù)或者由于資源空置造成的浪費,降低了成本。另外將存儲交給專業(yè)的公司來做,簡化了數(shù)據(jù)管理的工作,使企業(yè)或用戶可以專注于業(yè)務(wù)。同時借助云存儲服務(wù),數(shù)據(jù)可以存放在異地,這比將所有數(shù)據(jù)存放在同一地點能更好地抵抗災(zāi)難的發(fā)生。4.2基于混合云的存儲方案由上分析可知,云存儲具有傳統(tǒng)的存儲技術(shù)不具備的優(yōu)勢。根據(jù)公共云和私有云的不同特點和當(dāng)前圖書館存儲管理的現(xiàn)狀,本人從實際出發(fā)提出一種基于混合云的存儲方案。它主要由四層組成,其存儲體系結(jié)構(gòu)如圖1所示。4.2.1統(tǒng)一存儲管理系統(tǒng)數(shù)據(jù)存儲層是云存儲的基礎(chǔ),它是數(shù)據(jù)的存儲載體。由于高校圖書館已經(jīng)有很多的存儲設(shè)備和存儲網(wǎng)絡(luò),因此數(shù)據(jù)存儲層可以由原有存儲設(shè)備和網(wǎng)絡(luò)整合而成?,F(xiàn)有的DAS存儲服務(wù)器、NAS中的存儲設(shè)備、FC-SAN或IP-SAN存儲網(wǎng)絡(luò)都可以成為數(shù)據(jù)存儲層的存儲結(jié)點。將這些已有的存儲設(shè)備或網(wǎng)絡(luò)通過互聯(lián)網(wǎng)或者FC光纖通道網(wǎng)絡(luò)連接在一起,采用集群和虛擬存儲等技術(shù)構(gòu)建一個統(tǒng)一的存儲設(shè)備管理系統(tǒng)。通過這個管理系統(tǒng)來實現(xiàn)存儲設(shè)備的邏輯化管理,上層可以通過邏輯地址來對設(shè)備進(jìn)行訪問,而不需要關(guān)注具體的物理存儲設(shè)備。這樣當(dāng)存儲空間不夠時,可以動態(tài)地擴展云存儲的容量,而上層可以不做任何的更改。4.2.2存儲的安全機制數(shù)據(jù)管理層在數(shù)據(jù)存儲層的基礎(chǔ)上為服務(wù)接口層提供服務(wù)。它的主要職能是通過分布式文件系統(tǒng)、集群、網(wǎng)格計算等技術(shù)來實現(xiàn)云存儲系統(tǒng)中不同的存儲設(shè)備之間的協(xié)同工作,通過協(xié)同工作來提高存儲的訪問速度和存儲設(shè)備的利用率。它向服務(wù)接口層提供統(tǒng)一的數(shù)據(jù)壓縮、解壓、加密、解密等基本數(shù)據(jù)操作以簡化上層的設(shè)計。向上層提供統(tǒng)一的安全機制如用戶訪問控制機制、用戶密碼管理機制、用戶安全認(rèn)證機制、用戶密碼協(xié)商機制等來保證數(shù)據(jù)的存儲安全。向上層提供刪除重復(fù)數(shù)據(jù)等操作來減少數(shù)據(jù)的冗余,從而提高資源的利用率。4.2.3圖書館數(shù)據(jù)安全服務(wù)接口層是在數(shù)據(jù)管理層的基礎(chǔ)上向上層應(yīng)用提供統(tǒng)一的服務(wù)接口,它可以根據(jù)各個圖書館的不同需求來提供相應(yīng)的服務(wù)支撐接口。常用的服務(wù)有FTP服務(wù)、檢索服務(wù)、查詢服務(wù)、數(shù)據(jù)挖掘服務(wù)等。FTP服務(wù)可以為老師和學(xué)生分享教學(xué)資源提供方便;檢索服務(wù)使學(xué)生可以方便地查詢到圖書館存在的圖書信息及狀態(tài),檢索下載最新的期刊文獻(xiàn)等;查詢服務(wù)可以讓讀者方便地查詢自己的借閱記錄等;數(shù)據(jù)挖掘服務(wù)可以幫助圖書館管理員分析圖書的流通情況,為圖書的采購、擺放等提供科學(xué)依據(jù),從而達(dá)到資源的優(yōu)化配制;數(shù)據(jù)服務(wù)層是非常靈活的,拓展性強,它可以只實現(xiàn)配制的服務(wù)的支撐接口,當(dāng)有新數(shù)據(jù)服務(wù)增加時,再新增對應(yīng)的支撐接口。本方案根據(jù)前面分析的圖書館的存儲需求以及公有云和私有云的各自特點,基于混合云來實現(xiàn)服務(wù)接口層。對于FTP、檢索、查詢、數(shù)據(jù)挖掘、數(shù)據(jù)庫操作對訪問速度要求比較高的接口,我們借助私有云來實現(xiàn)。而像備份對存儲的空間要求大而訪問速度卻不關(guān)鍵,我們采用公共云提供的備份服務(wù)來實現(xiàn)。采用這種方式,克服了公共云訪問速度很慢的缺點,很好地滿足了前面分析的前三類數(shù)據(jù)存儲速度方面的要求。同時將第四類數(shù)據(jù)放到公共云,既很好地解決了存儲空間的問題,又低成本地實現(xiàn)了數(shù)據(jù)的異地備份,解決了所有數(shù)據(jù)的安全性方面的要求。為了克服公共云在傳輸過程中可能泄密這一缺點,對于敏感數(shù)據(jù)的備份可以采用先加密后傳輸?shù)姆绞?也就是采用托管密文的方式,這樣可以很好地解決這一問題。為了節(jié)約向公共云租用存儲空間的大小,在托管數(shù)據(jù)前可以采用壓縮、刪除重復(fù)數(shù)據(jù)等技術(shù)來減小備份數(shù)據(jù)的數(shù)據(jù)量,從而達(dá)到減少費用的目的。4.2.4建立了統(tǒng)一的安全管理應(yīng)用層是由向讀者和管理人員提供具體服務(wù)的應(yīng)用程序組成。應(yīng)用程序中的存儲相關(guān)部分利用服務(wù)接口層提供的服務(wù)支撐接口來實現(xiàn),這樣大大簡化了具體服務(wù)應(yīng)用的開發(fā)工作。由于對數(shù)據(jù)實現(xiàn)了統(tǒng)一的安全管理,這進(jìn)一步加強了數(shù)據(jù)的安全管理功能?;谠拼鎯Φ膽?yīng)用程序有兩種開發(fā)方式:一種是全新開發(fā),另一種是移植。全新開發(fā)是指利用云存儲提供的接口,重新構(gòu)建應(yīng)用程序,這種開發(fā)方式可以充分發(fā)揮云存儲的優(yōu)勢,但開發(fā)量比較大。移植是將現(xiàn)有的應(yīng)用程序移植到云存儲平臺上來,這種開發(fā)方式只是將原先應(yīng)用程序中對存儲訪問的接口用云存儲提供的接口來實現(xiàn),保持程序的邏輯不變。這樣代碼的開發(fā)量小,但由于移植層的存在,效率比不上全新開發(fā)方式。各圖書館可以根據(jù)各自的情況來選擇合適的開發(fā)方式。5基于混合云的存儲方案當(dāng)今,高校圖書館正

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論