版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、鹽 城 師 范 學(xué) 院畢業(yè)設(shè)計(jì)20152016學(xué)年度基于云計(jì)算模式下圖像檢索系統(tǒng)的研究設(shè)計(jì) 學(xué)生姓名 朱 青 學(xué) 院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院 專 業(yè) 信息與計(jì)算科學(xué) 班 級(jí) 12(6) 學(xué) 號(hào) 12213453 指導(dǎo)教師 朱 青 2015年4月25日 畢業(yè)論文(設(shè)計(jì))承諾書本人鄭重承諾:1、本論文(設(shè)計(jì))是在指導(dǎo)教師的指導(dǎo)下,查閱相關(guān)文獻(xiàn),進(jìn)行分析研究,獨(dú)立撰寫而成的.2、本論文(設(shè)計(jì))中,所有實(shí)驗(yàn)、數(shù)據(jù)和有關(guān)材料均是真實(shí)的.3、本論文(設(shè)計(jì))中除引文和致謝的內(nèi)容外,不包含其他人或機(jī)構(gòu)已經(jīng)撰寫發(fā)表過的研究成果.4、本論文(設(shè)計(jì))如有剽竊他人研究成果的情況,一切后果自負(fù).學(xué)生(簽名): 朱青 2015
2、 年4月25日 基于云計(jì)算模式下圖像檢索的研究設(shè)計(jì) 摘要隨著web2.0技術(shù)為代表的當(dāng)代技術(shù)不斷地快速成長及應(yīng)用,加快了網(wǎng)絡(luò)信息容量的膨脹,但是怎么才能在這龐大的信息中快速簡單地尋找到自己需求的信息,特別像圖像這種信息.然而圖像檢索傳統(tǒng)算法,難以解決海量數(shù)據(jù)存儲(chǔ)問題,而云計(jì)算作為一種新興的計(jì)算模式也在迅速的發(fā)展,對(duì)于解決圖像檢索所存在的問題有著較為重要的作用.本篇文章利用了云計(jì)算模式的模型和理念,為解決如今大數(shù)據(jù)時(shí)代下的圖像檢索系統(tǒng)的大數(shù)據(jù)信息的儲(chǔ)存、處理和計(jì)算等問題提出了一條思路.通過分析其中的存儲(chǔ)方式、計(jì)算方法,來理論說明云計(jì)算模式下的圖像檢索系統(tǒng)節(jié)約了儲(chǔ)存空間、提高了計(jì)算能力、提升了讀寫
3、效率.具有無限制的數(shù)據(jù)存儲(chǔ)計(jì)算性能,較高的經(jīng)濟(jì)性,數(shù)據(jù)的可靠性,信息更新的及時(shí)性等一系列優(yōu)點(diǎn)優(yōu)點(diǎn).因此在信息化的這個(gè)大時(shí)代中,對(duì)云計(jì)算的這種新技術(shù)的革新必將加速圖像信息檢索技術(shù)的快速發(fā)展. 【關(guān)鍵字 】 云計(jì)算 圖像檢索 海量數(shù)據(jù) 算法研究 Study Design cloud computing model-based image retrieval窗體底端 Abstract 窗體頂端窗體底端With web2.0 technology as the representative of modern technology continue to grow rapidly and applic
4、ations to speed up the expansion of the capacity of the network information, but how can this vast information quickly and easily find information about their needs, especially like this image information. However, the conventional image retrieval algorithms, massive data storage is difficult to sol
5、ve the problem, but also the rapid development of cloud computing as an emerging computing model for solving the problems of image retrieval has a more important role. This article utilizes the cloud computing model and the concept model, to address the large data storage and so now in an era of big
6、 data image retrieval system information, processing and calculation of a proposed idea by analyzing the way in which memory, calculation method to explain the theory of image retrieval system under the cloud computing model saves storage space and improves the computing capacity, improve the effici
7、ency of reading and writing. reliability data storage has unlimited computing performance, high economic, data, and information update the timeliness of the advantages of a series of advantages. Thus in this era of information technology, the innovation of cloud computing this new technology will ac
8、celerate the rapid development of image information retrieval technology【Keywords 】 Cloud computing image retrieval algorithm massive research data窗體底端目 錄1緒論11.1研究背景11.2研究意義12 圖像檢索技術(shù)系統(tǒng)12.1基于文本和內(nèi)容的圖像檢索技術(shù)12.2云計(jì)算圖像檢索的定義22.3 云計(jì)算模式下圖像信息的系統(tǒng)結(jié)構(gòu)32.4 云計(jì)算模式下圖像信息的存儲(chǔ)32.5 云計(jì)算模式下圖像信息的計(jì)算方式43 云計(jì)算模式下圖像檢索系統(tǒng)設(shè)計(jì)的實(shí)例分析63.1
9、云計(jì)算模式下的圖像存儲(chǔ)63.2云計(jì)算模式下的檢索系統(tǒng)的圖像處理73.2.1圖像寫入流程73.2.2圖像讀取/查詢流程73.2.3實(shí)驗(yàn)測(cè)試84 結(jié)論104.1云計(jì)算模式下圖像檢索系統(tǒng)的優(yōu)點(diǎn)104.2云計(jì)算模式下圖像檢索系統(tǒng)存在的部分問題10參考文獻(xiàn)12鹽城師范學(xué)院畢業(yè)論文1緒論1.1研究背景當(dāng)代網(wǎng)絡(luò)信息技術(shù)快速發(fā)展及運(yùn)用,加快了網(wǎng)絡(luò)信息容量的膨脹,但是怎么才能在這龐大的信息中快速簡單地尋找到自己需求的信息,特別像是圖像這種信息.其中的數(shù)據(jù)存儲(chǔ)、計(jì)算及傳遞一系列問題已經(jīng)成為了當(dāng)務(wù)之急.然而近年來出現(xiàn)的云計(jì)算技術(shù)充分利用信息資源平臺(tái)的海量的數(shù)據(jù),構(gòu)造出一套新的體系架構(gòu),使云計(jì)算技術(shù)從幕后走向前臺(tái),為
10、解決大數(shù)據(jù)時(shí)代海量圖像信息檢索,提出了一種快捷輕便的解決方案,加快了大數(shù)據(jù)時(shí)代的來臨.1.2研究意義伴隨著信息技術(shù)迅速發(fā)展,圖像數(shù)據(jù)急劇增多,現(xiàn)有的檢索技術(shù)已經(jīng)不能提供各方面的技術(shù)支持,再者近年來云計(jì)算技術(shù)逐漸走向成熟,這是一種全新的結(jié)構(gòu)體系,云計(jì)算極大得利用到了信息所提供的資源.對(duì)于圖像大數(shù)據(jù)的檢索方法這方面,云計(jì)算模式下的圖像檢索為其提供一個(gè)新的解決方法,使其成為可能.為了提升海量圖像檢索的效率,摒棄傳統(tǒng)圖像檢索的算法,利用新的算法獲取圖像數(shù)據(jù)的頻域和空域特征,運(yùn)用具有并行式、分布處理能力的云計(jì)算將各個(gè)任務(wù)分配到每個(gè)工作節(jié)中同時(shí)完成圖像信息的檢索.要是基于云計(jì)算模式下的圖像信息檢索系統(tǒng)提升
11、了圖像信息檢索的速度和效率,就能解決批量的圖像數(shù)據(jù)檢索問題.大數(shù)據(jù)的圖像檢索問題的得到的最優(yōu),最快的解決,使云計(jì)算應(yīng)用到更多的領(lǐng)域.2 圖像檢索技術(shù)系統(tǒng)2.1基于文本和內(nèi)容的圖像檢索技術(shù)圖像檢索是依據(jù)對(duì)圖像信息的描述,在目的圖像信息集合中尋找到具有符合特征或者包含指定信息的圖像1.從上個(gè)世紀(jì)70年代起,對(duì)于圖像檢索的研究就已經(jīng)開始了,隨著信息時(shí)代的來臨,我們主要運(yùn)用的方法還是僅僅停留在對(duì)圖像的內(nèi)容和文本來進(jìn)行檢索圖像的信息內(nèi)容.(1) 文本圖像的檢索方法,主要方式是利用圖像存儲(chǔ)位置及其他信息來檢索圖像,但是當(dāng)數(shù)據(jù)增多就會(huì)出現(xiàn)效率較低;對(duì)于文本的圖像檢索方法來說,首先我們是在數(shù)據(jù)庫中添加對(duì)于圖片
12、信息描述的文字,并且將文字的描述對(duì)應(yīng)到數(shù)據(jù)庫中相應(yīng)數(shù)據(jù).在利用數(shù)據(jù)庫中本身關(guān)系查詢功能,進(jìn)行一一對(duì)應(yīng)的查詢。但是存在的問題是不一樣的檢索系統(tǒng)中對(duì)不同的數(shù)據(jù)的描述和關(guān)鍵字段不能有統(tǒng)一的的關(guān)聯(lián),所以缺少統(tǒng)一的描述系統(tǒng),資源共享率比較低.針對(duì)圖像信息的利用率也隨之下降,無法達(dá)到信息資源的共享.因此為了在互聯(lián)網(wǎng)方式下解決圖像檢索的問題,在1995年3月第一屆數(shù)據(jù)研究的都柏林討會(huì)上,產(chǎn)生了一個(gè)簡單的元數(shù)據(jù)集合-都柏林核心元數(shù)據(jù)集2.(2) 內(nèi)容的圖像檢索方法,主要是描述圖像的基本特點(diǎn),再從圖像的特點(diǎn)中檢索.例如為了尋求到自己需要的圖像,可以從圖像的色彩,基本的特征及圖像不同的紋理和分布中分析.但是當(dāng)隨著
13、數(shù)據(jù)庫中圖像數(shù)據(jù)的急劇增多,就出現(xiàn)了檢索的圖像信息準(zhǔn)確率下降.對(duì)于內(nèi)容的圖像檢索系統(tǒng)也必須具有視覺的自動(dòng)識(shí)別功能,才可以在完成此項(xiàng)檢索.而針對(duì)內(nèi)容的圖像檢索的技術(shù)國外也有不少的涉及.首先是針對(duì)圖像的直方型特征,章毓晉3和劉忠偉4提出了累加直方圖和局部累加直方圖的方法運(yùn)用于檢索圖像的技術(shù).Zachary5在Lab顏色空間上建立了直方圖特征的辦法來檢索圖像.而針對(duì)空間特征上,張磊6提出了對(duì)量化后的色彩計(jì)算質(zhì)心的方法來描述顏色特征,從而用于圖像檢索技術(shù).也有不少人提出了運(yùn)用紋理特征的計(jì)算方法,用于圖像檢索技術(shù).2.2云計(jì)算圖像檢索的定義增加、使用和交付模式是基于網(wǎng)絡(luò)相關(guān)的服務(wù),一般是通過網(wǎng)絡(luò)來提供動(dòng)
14、態(tài)易擴(kuò)展并且常常虛擬化資源.云計(jì)算具有龐大的運(yùn)算能力,用戶可以通過PC、筆記本、手機(jī)等方式連接中心數(shù)據(jù)庫,按照自己的具體需求進(jìn)行計(jì)算.云計(jì)算是結(jié)合了數(shù)據(jù)的儲(chǔ)存、分布式的并行計(jì)算、負(fù)載均衡等幾種傳統(tǒng)網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)功能,憑借著特有的較低的錯(cuò)誤率、較高的經(jīng)濟(jì)性性及較為方便的推廣方式受到廣泛的認(rèn)可.Apache開發(fā)的Hadoop主要包含分布式文件的系統(tǒng)及并行運(yùn)算的框架.對(duì)于Hadoop來所,它是云計(jì)算模式下的開源平臺(tái).集群規(guī)模的大小依據(jù)客戶需求來確定,儲(chǔ)存和計(jì)算的要求低時(shí)可以由幾臺(tái)來完成,儲(chǔ)存和計(jì)算的要求高則需要成百上千臺(tái)來完成,集群規(guī)模的大小可以根據(jù)具體的需求來確定.數(shù)據(jù)集運(yùn)用到了分布式的文件系統(tǒng)
15、,而分布式文件系統(tǒng)是Hadoop的一種,具有文件儲(chǔ)存功能,因此數(shù)據(jù)集擁有了龐大存儲(chǔ)能力.之所以運(yùn)用分布式文件系統(tǒng)是因?yàn)槠淇梢詷O大的防止單點(diǎn)出現(xiàn)問題,這是由于此系統(tǒng)是把一個(gè)較大文件分解成幾個(gè)小的分文件,然后再進(jìn)行多次拷貝并保存在含有多個(gè)數(shù)據(jù)節(jié)點(diǎn)的集合里.因此利用分布式的文件系統(tǒng)能使該系統(tǒng)實(shí)現(xiàn),有以下幾大特色:大規(guī)模的數(shù)據(jù)儲(chǔ)存、高的冗余、輕松的擴(kuò)容、負(fù)載可以均衡7等能力.Hadoop是并行計(jì)算的結(jié)構(gòu),其基礎(chǔ)是分布式文件系統(tǒng),使用者需要進(jìn)行大數(shù)據(jù)的并行計(jì)算時(shí)可以自由獲得并行編程模式。2.3 云計(jì)算模式下圖像信息的系統(tǒng)結(jié)構(gòu)云計(jì)算模式下龐大的圖像信息在互聯(lián)網(wǎng)上形成了一個(gè)云資源庫,成為了一個(gè)檢索速度快、利
16、用率高的圖像檢索系統(tǒng).為了實(shí)現(xiàn)該系統(tǒng)的檢索功能,我們首先要建立云計(jì)算的計(jì)算模型和大數(shù)據(jù)存儲(chǔ)模型來解決圖像的計(jì)算和儲(chǔ)存.再者要檢索系統(tǒng)需要建立統(tǒng)一的客戶端檢索系統(tǒng),當(dāng)用戶使用的檢索系統(tǒng)為統(tǒng)一的前端時(shí),可以更加方便、快捷的系統(tǒng)中查詢到所需的圖片信息.最主要是云計(jì)算模式下的圖像檢索系統(tǒng)一定要建立統(tǒng)一的查詢標(biāo)準(zhǔn),這使得不同的數(shù)據(jù)庫的資源可以廣泛的使用.根據(jù)云計(jì)算模式下圖像信息檢索不同的層次可以分成兩個(gè)部分.如圖1所示;(1)云資源層:可以組建大型服務(wù)器層,所有的圖像信息的檢索、存儲(chǔ)、傳遞都可以建立在云資源層中,實(shí)現(xiàn)了一致性和高效性.(2)用戶層:用戶根據(jù)檢索系統(tǒng)制定的統(tǒng)一檢索標(biāo)準(zhǔn),在輸入端輸入圖像檢索
17、的請(qǐng)求,可以迅速的檢索出用戶需要的圖像信息,可以有效的提高檢索出的數(shù)據(jù)的準(zhǔn)確性以及高效性.圖1反應(yīng)的是云模式下圖像檢索系統(tǒng)的結(jié)構(gòu)。 圖1云計(jì)算模式下圖像信息的系統(tǒng)2.4 云計(jì)算模式下圖像信息的存儲(chǔ)圖像的自動(dòng)檢索的基礎(chǔ)是圖像儲(chǔ)存,是通過數(shù)據(jù)密集型的計(jì)算來實(shí)現(xiàn)的,然而傳統(tǒng)方法是把圖像放到分布式文件系統(tǒng)中,且耗時(shí).因此需要運(yùn)用分布式的處理方式把圖像傳輸?shù)椒植际轿募到y(tǒng)中:在Map過程中,利用函數(shù)Map可以獲取每一幅圖像的信息,并且從中獲得圖像的紋理和顏色等特征.在Reduce過程中,將獲得的圖像信息特征數(shù)據(jù)儲(chǔ)存到分布式文件系統(tǒng).可以設(shè)置存儲(chǔ)到一個(gè)面向列的分布式的數(shù)據(jù)庫中,因此分布式文件系統(tǒng)的圖像是采
18、用表形式的儲(chǔ)存方式.Map與Reduce的關(guān)系反應(yīng)如圖2; 圖2 Map與Reduce的關(guān)系 云計(jì)算模式下圖像檢索方法與傳統(tǒng)的圖像檢索方法存在的最大不同之處就是使用者通過整個(gè)云資源層來檢索圖像信息,而服務(wù)器的單一不會(huì)影響到存儲(chǔ)的空間,因而云計(jì)算模式下的數(shù)據(jù)儲(chǔ)存技術(shù)需要具備較高的傳輸速率和較高的輸入輸出率.(1)在云計(jì)算模式下圖像存儲(chǔ)技術(shù)具有較好的數(shù)據(jù)保護(hù)性.云計(jì)算模式的圖像數(shù)據(jù)是存儲(chǔ)在巨大的云資源層中,而云資源層就是由一個(gè)個(gè)網(wǎng)絡(luò)服務(wù)器組成的.當(dāng)有一個(gè)或者幾個(gè)出現(xiàn)問題后,不會(huì)對(duì)數(shù)據(jù)的存儲(chǔ)和檢索產(chǎn)生影響.相對(duì)于傳統(tǒng)的圖像存儲(chǔ)技術(shù)相比,該模式下的圖像存儲(chǔ)技術(shù)不會(huì)由于部分服務(wù)器的失去功能,從而出現(xiàn)數(shù)據(jù)
19、的丟失.(2)在云計(jì)算模式下的圖像存儲(chǔ)技術(shù)與傳統(tǒng)圖像存儲(chǔ)相比,提供統(tǒng)一的存儲(chǔ)標(biāo)準(zhǔn).2.5 云計(jì)算模式下圖像信息的計(jì)算方式在云計(jì)算模式下,該圖像檢索系統(tǒng)可以在不一樣的地址下,由不同的使用者一起使用該圖像的檢索功能.與傳統(tǒng)的圖像檢索系統(tǒng)相比,該圖像檢索系統(tǒng)資源范圍比較大、數(shù)據(jù)量大,因而如何同時(shí)解決多用戶海量的圖像檢索成為了一個(gè)非常重要的科研問題.目前階段,基于云計(jì)算模式下的并行計(jì)算技術(shù)多數(shù)是MapReduce.而大數(shù)據(jù)的并行計(jì)算,就可以運(yùn)用到MapReduce技術(shù).這是因?yàn)樵贖adoop的分布式文件系統(tǒng)生成的MapReduce,可以讓使用者輕松的獲得可靠的并行式編程模版,來完成龐大的信息并行運(yùn)算.
20、MapReduce是利用圖片與數(shù)據(jù)一一對(duì)應(yīng)的關(guān)系將圖片信息輸入到數(shù)據(jù)庫的主要節(jié)點(diǎn)中,然后映射給各個(gè)從節(jié)點(diǎn)來進(jìn)行并行計(jì)算,最后利用規(guī)約函數(shù)把各個(gè)從節(jié)點(diǎn)的運(yùn)行的結(jié)果歸約合并,輸出最后的運(yùn)行結(jié)果.這個(gè)方法主要是把一份任務(wù)分成多個(gè)很小的任務(wù)集,而小的任務(wù)可以隨機(jī)被分配到不同的節(jié)點(diǎn)中,在運(yùn)用和快讀處理之后,經(jīng)過指定的規(guī)格來合并生成結(jié)果,處理過的規(guī)模類型與傳統(tǒng)的編程模型的分解和歸納方法相似8.利用Mapreduce程序使得圖像的檢索系統(tǒng)得以實(shí)現(xiàn),步驟有下文所示。圖3為Mapreduce程序步驟.(1)客戶端寫入檢索的請(qǐng)求文件;(2)通過云網(wǎng)絡(luò)將客戶端發(fā)出的檢索請(qǐng)求任務(wù)分解不同的小任務(wù)集,例如不一樣的節(jié)點(diǎn)可
21、以同時(shí)滿足不一樣的客戶端的請(qǐng)求任務(wù),或者是將一個(gè)大的任務(wù)分解成小的任務(wù)來滿足對(duì)同一個(gè)客戶端的需求。(3)每一個(gè)節(jié)點(diǎn)可以接收來自系統(tǒng)將分解后的小任務(wù)。(4)當(dāng)系統(tǒng)中的節(jié)點(diǎn)完成各自的任務(wù)時(shí),通過將小的任務(wù)進(jìn)行歸納產(chǎn)生為大的任務(wù)再回饋給檢索的客戶端. 圖3 Mapreduce程序結(jié)構(gòu)同時(shí)Mapreduce 模型具有很強(qiáng)的可靠性,可用性以及可測(cè)性9,當(dāng)節(jié)點(diǎn)出現(xiàn)無法識(shí)別時(shí),檢索任務(wù)是不會(huì)因此停止運(yùn)行的,它會(huì)直接跳過無法識(shí)別的節(jié)點(diǎn),再把任務(wù)轉(zhuǎn)移到別的節(jié)點(diǎn)上來完成任務(wù).所以在Mapreduce中具有大數(shù)據(jù)的并行計(jì)算的功能,可以將它運(yùn)用到云計(jì)算下的圖像檢索上.3 云計(jì)算模式下檢索系統(tǒng)設(shè)計(jì)的實(shí)例分析3.1云計(jì)算
22、模式的圖像存儲(chǔ)通常一個(gè)三甲醫(yī)院每日可以生成60 GB以上的數(shù)據(jù)信息,整個(gè)院總的數(shù)據(jù)信息量有45TB,因此醫(yī)務(wù)人員每天需要大量的瀏覽圖像信息用來診斷病人的病情.要是可以設(shè)計(jì)出一套基于云計(jì)算模式下圖像檢索系統(tǒng)的設(shè)計(jì)模型,用于該系統(tǒng)的檢索.為了可以更好的解決這個(gè)問題,本系統(tǒng)的儲(chǔ)存是一種把分布式和集中式儲(chǔ)存相結(jié)合的PACS架構(gòu).先形成Hadoop云集群并建立在每所醫(yī)院園區(qū)網(wǎng)的內(nèi)部中,而Hadoop集群的HDFS是一種分布式的存儲(chǔ)數(shù)據(jù)信息結(jié)構(gòu),將MapReduce利用到處理大數(shù)據(jù)就可以實(shí)現(xiàn)對(duì)龐大的圖像信息的檢索.PACSD架構(gòu)示意圖如圖4. 圖4 PACS的架構(gòu)系統(tǒng)把全部原始的信息移至HDFS,集中式的
23、存儲(chǔ)服務(wù)器只能保存最近一段時(shí)間的數(shù)據(jù)信息.而新增加的圖像信息集中式的存儲(chǔ)服務(wù)器之上或者保存在HDFS里.這就使得集中式的存儲(chǔ)器儲(chǔ)存空間得到釋放,因此提升了原二級(jí)的儲(chǔ)存與讀寫的速度,使得最好的解決了HDFS的數(shù)據(jù)信息的儲(chǔ)存問題,讓Hadoop的MapReduce實(shí)現(xiàn)了對(duì)數(shù)據(jù)的進(jìn)行并計(jì)算.在今后的系統(tǒng)更新中,只用簡簡單單地增多Hadoop集群中節(jié)點(diǎn)的數(shù)量,就可以使得系統(tǒng)的內(nèi)存和計(jì)算效率有了質(zhì)的飛躍.而為了使不同地區(qū)之間醫(yī)療組織中信息資源得到的共享同時(shí)不會(huì)出現(xiàn)較大的安全漏洞,可以將防火墻置于醫(yī)院得園區(qū)網(wǎng)與公共網(wǎng)絡(luò)之間.在面對(duì)來自于公共網(wǎng)絡(luò)上出現(xiàn)得任務(wù)要求時(shí),防火墻可以識(shí)別是否安全,控制是否可以進(jìn)行訪
24、問,當(dāng)符合條件的任務(wù)請(qǐng)求出現(xiàn)時(shí),就可以傳遞至中心的服務(wù)器上.3.2云計(jì)算模式下的檢索系統(tǒng)的圖像處理 3.2.1圖像寫入流程為了使每一次的訪問不存在安全隱患,將必要的權(quán)限寫到園區(qū)的設(shè)備中與內(nèi)部的工作站里.外界人員想要通過公共網(wǎng)絡(luò)來進(jìn)行訪問時(shí),則屏蔽了對(duì)HDFS與FC-SAN進(jìn)行的寫入.以下是對(duì)于圖像寫入的操作方式:(1)圖像中心的服務(wù)器可以接受來自具有權(quán)限的工作站發(fā)出寫入請(qǐng)求(C_STORE)報(bào)文; (2)圖像中心在面對(duì)不同的文儲(chǔ)存地址來及時(shí)的更新索引表中的數(shù)據(jù),.當(dāng)儲(chǔ)存信息進(jìn)入HDFS時(shí),就可以進(jìn)行第(3)、第(4)這兩個(gè)階段,當(dāng)儲(chǔ)存的信息進(jìn)入FC-SAN時(shí)就可以進(jìn)行第(5)階段; (3)節(jié)點(diǎn)
25、的文件名稱是根據(jù)Hadoop而來的,再在各個(gè)分塊數(shù)據(jù)的節(jié)點(diǎn)列表中建立起節(jié)點(diǎn)的名稱; (4)把文件輸入到HDFS數(shù)據(jù)的節(jié)點(diǎn),出現(xiàn)輸入成功的信息時(shí),就說明輸入的過程完成了了. (5)就把信息輸入FC-SAN,輸入的階段完成了. 當(dāng)對(duì)FC-SAN的數(shù)據(jù)進(jìn)行轉(zhuǎn)移或者拷貝到HDFS時(shí),就要利用遞歸的方式來訪問全部的源文件下的文件夾,不停地進(jìn)行第(3)、第(4)階段的輸入,直到將所有的數(shù)據(jù)的都拷貝出.具體的文件寫入過程如圖5. 圖5文件寫入階段3.2.2圖像讀取和查詢流程(1) 對(duì)于那些公共網(wǎng)絡(luò)的外部訪問者和園區(qū)的網(wǎng)關(guān)搭建而成的SSL,可以輸入所要查詢的信息指令. (2)網(wǎng)關(guān)中的指令接收器可以收錄HTTP
26、的指令這是因?yàn)樗呀?jīng)合法的和外部關(guān)聯(lián)上了. (3)網(wǎng)關(guān)中釋義器把HTTP的指令轉(zhuǎn)變成DICOM形式的C_FIND報(bào)文. (4)指令器把C_FIND的報(bào)文輸送到圖像中心,圖像中心就可以收錄C_FIND指令,再把文件的物理地址信息從數(shù)據(jù)庫中提取出,由不同的文件存在著不同的地址信息所以進(jìn)行第(5)或第(6)階段. (5對(duì)于那些來自FC-SAN的數(shù)據(jù),進(jìn)行第(8)階段. (6)當(dāng)需要使用文件每一部分?jǐn)?shù)據(jù)的節(jié)點(diǎn)時(shí),需要對(duì)HDFS名稱節(jié)點(diǎn)信息進(jìn)行判斷. (7)運(yùn)用組件中的文件讀取器從名稱節(jié)點(diǎn)的每一個(gè)部分中獲得信息. (8)釋義器把響應(yīng)的報(bào)文轉(zhuǎn)變?yōu)镠TTP報(bào)文. (9)將HTTP報(bào)文發(fā)送給HTTP請(qǐng)求器.
27、(10)SSL可以把HTTP的指令輸送給外部使用者,讀取階段完成.當(dāng)出現(xiàn)局域網(wǎng)內(nèi)部的工作站指令的報(bào)文時(shí),因?yàn)樗缫汛嬖谟诰钟蚓W(wǎng)的中,而且報(bào)文已轉(zhuǎn)成DICOM3.0的樣子,只要把報(bào)文輸送到DICOM的指令器中,在進(jìn)行第(4)階段.文件的讀取和查詢的階段如圖6. 圖6文件讀取和查詢階段 當(dāng)工作站需要對(duì)圖像進(jìn)行較大數(shù)據(jù)的檢索時(shí),其運(yùn)行階段的過程與上圖的過程大致相似,在進(jìn)行第(4)階段中利用到MapReduce方式來進(jìn)行特征的計(jì)算和匹配從而得到所需要的信息.3.2.3實(shí)驗(yàn)測(cè)試(1) 實(shí)驗(yàn)結(jié)果分析(1)寫入和讀取對(duì)比分析:從圖7可得到,寫入與讀取的HDFS平均速度是3.52Mb/s和28Mb/s,對(duì)比以
28、前的系統(tǒng)FC-SAN的1.4 Mb/s和2.35 Mb/s來說,其速度有了很大進(jìn)步. (2)壓縮比測(cè)試:如果平均每一個(gè)病人的圖像信息大約是300 MB而將其變成SDCM時(shí),其信息的大小僅為120MB,壓縮率達(dá)到了40.8%;從而整個(gè)系統(tǒng)平均的壓縮率為是40.6%.由于SDCM不但可以把原來的信息進(jìn)行無損失的壓縮,而且還可以把信息轉(zhuǎn)換成鍵值對(duì),這樣就方便使得MapReduce將信息進(jìn)行快捷處理計(jì)算,減少了再次格式化信息的時(shí)間,大大提升計(jì)算的效率. (3)計(jì)算測(cè)試:圖像的計(jì)算第一步就是特征提取,這個(gè)系統(tǒng)設(shè)計(jì)的模型是大小為4.2 GB的DICOM的信息(11438個(gè)圖像)將全部的信息進(jìn)行挖掘并處理,
29、用于測(cè)定系統(tǒng)設(shè)計(jì)的模型計(jì)算性能.集群的數(shù)目可以分成1、2、3、4(當(dāng)集群的數(shù)目是1的時(shí)候,就是單機(jī)形式的原系統(tǒng)設(shè)計(jì)模型)每一組都進(jìn)行6次運(yùn)算,再計(jì)算平均運(yùn)算的時(shí)間.在圖8中我們可以得到結(jié)果,即當(dāng)出現(xiàn)較為龐大的信息云算時(shí),使用到較多個(gè)節(jié)點(diǎn)運(yùn)行的模型比單機(jī)運(yùn)行的模型,在速度上有著這個(gè)明顯的差異,多個(gè)節(jié)點(diǎn)的優(yōu)于單機(jī)運(yùn)行的 圖7寫入和讀寫速度對(duì)比圖8運(yùn)行時(shí)間對(duì)比經(jīng)模擬測(cè)試,系統(tǒng)在儲(chǔ)存能力上節(jié)約了空間、計(jì)算能力上得到了提高、讀寫方式上加快了效率,使得云計(jì)算在圖像檢索上的運(yùn)用奠定了基礎(chǔ),讓這種技術(shù)得到廣泛的運(yùn)用提供理論依據(jù)。 在不同節(jié)點(diǎn)情況下,有圖像檢索請(qǐng)求時(shí),從圖像存儲(chǔ)所需要的時(shí)間可以得出,在圖像的量較
30、小時(shí),這兩種系統(tǒng)儲(chǔ)存的性能相差不怎么明顯;但當(dāng)圖像數(shù)量的請(qǐng)求逐漸增加,單節(jié)點(diǎn)的系統(tǒng)儲(chǔ)存的時(shí)間極快的增多,而Hadoop分布式的系統(tǒng)儲(chǔ)存時(shí)間緩慢地增多;同時(shí)云計(jì)算下圖像檢索的系統(tǒng)的存儲(chǔ)能力要優(yōu)于傳統(tǒng)的圖像處理系統(tǒng).所以,系統(tǒng)設(shè)計(jì)模型減少了圖像儲(chǔ)存的時(shí)間,可以將圖像檢索的系統(tǒng)整體性提高.基于云計(jì)算模式下圖像檢索系統(tǒng)查準(zhǔn)率與查全率略要高于傳統(tǒng)圖像檢索系統(tǒng)以及B/S單節(jié)點(diǎn)圖像檢索系統(tǒng),優(yōu)勢(shì)就不是很明顯了.但是當(dāng)時(shí)大規(guī)模的圖像檢索時(shí),云計(jì)算下的圖像系統(tǒng)性能優(yōu)就可以通過其速率直接反應(yīng)出來了.在基于云計(jì)算模式圖像檢索中的Hadoop分布式的系統(tǒng)就可以有效降低圖像檢索的時(shí)間,提升了圖像檢索的效率,輕松地使海量
31、圖像檢索效率低的難題得到解決,獲取到想要的圖像信息4 結(jié)論4.1云計(jì)算模式下圖像檢索系統(tǒng)的優(yōu)點(diǎn)云計(jì)算模式下的圖像檢索系統(tǒng)對(duì)比與傳統(tǒng)的圖像檢索系統(tǒng)來說有以下幾大優(yōu)點(diǎn):第一點(diǎn)從無限制的數(shù)據(jù)存儲(chǔ)來說,云計(jì)算的信息儲(chǔ)存在云里面,不會(huì)被限制容量即使是單一數(shù)據(jù)庫的儲(chǔ)存;第二點(diǎn)從計(jì)算性能的提高來說,云計(jì)算的圖像檢索分布式的網(wǎng)絡(luò)計(jì)算方式不僅可以進(jìn)行龐大的信息運(yùn)算,而且在加快了運(yùn)行的速度同時(shí),使得其正確率得到了提高;第三點(diǎn)從經(jīng)濟(jì)性的提高來說,云計(jì)算的圖像檢索系統(tǒng)在每一個(gè)計(jì)算中心都可以完成對(duì)信息進(jìn)行運(yùn)算與存儲(chǔ),使其利用率得到了提高;第四點(diǎn)從數(shù)據(jù)的更新來說,云計(jì)算圖像信息可以快速的查找到最新的信息回饋給使用者,無論
32、是信息的更替或者是儲(chǔ)存地址的更改;第五點(diǎn)從信息可靠性的提升來說,外在因素的變化不會(huì)降低檢索功能的使用能力,所有的圖像信息和硬件服務(wù)都保留在運(yùn)資源層中,使用者只用訪問網(wǎng)絡(luò)就可以享受到安全可靠的服務(wù).4.2云計(jì)算模式下圖像檢索系統(tǒng)存在的部分問題雖然利用了云計(jì)算技術(shù)可以處理大數(shù)據(jù)時(shí)代下的海量信息,使得在原來的基礎(chǔ)上提高了工作效率,但我們還面臨一些暫時(shí)無法解決問題,希望在以后的研究中得到完善.(1)圖像檢索請(qǐng)求問題的統(tǒng)一性.不同的人對(duì)同一組圖像的理解不一定是相同,因此存在的問題有:用戶會(huì)關(guān)心圖像信息不同的層次,即使是一樣層次也會(huì)注重圖像信息不一樣的類別10.面對(duì)不一樣的使用標(biāo)準(zhǔn)我們?cè)趺床拍苋诤纤?,由此該制定一個(gè)怎樣的統(tǒng)一使用標(biāo)準(zhǔn)也成為了一個(gè)難題.(2)系統(tǒng)之間的交叉操作.在云計(jì)算模式的系統(tǒng)中最重要的就是運(yùn)資源層中具有到龐大的信息.而當(dāng)一個(gè)圖像檢索系統(tǒng)要利用另一個(gè)圖像檢索系統(tǒng)時(shí),必定要通過云來完成的,這樣就可以完成不同的圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- PLC控制技術(shù)考試模擬題(含答案)
- 養(yǎng)老院環(huán)境保護(hù)管理制度
- 交通安全教育課件
- 《打造學(xué)習(xí)型團(tuán)隊(duì)》課件
- 2024年新能源項(xiàng)目投資委托居間合同范本3篇
- 教育合同范本
- 2024年度特殊工種委托招聘與職業(yè)安全防護(hù)用品供應(yīng)合同3篇
- 臨床靜脈留置針護(hù)理及并發(fā)癥
- 2024年度綠色有機(jī)食材供應(yīng)合作協(xié)議2篇
- 2024天津出租車租賃車輛安全性能檢測(cè)合同3篇
- 高考日語語法之授受關(guān)系的動(dòng)詞課件
- 人體解剖生理學(xué)理論知識(shí)考核試題題庫及答案
- 國家開放大學(xué)電大建筑制圖基礎(chǔ)機(jī)考網(wǎng)考試題庫及答案
- 職業(yè)生涯訪談活動(dòng)范文優(yōu)選5篇
- 園林景觀工程施工組織機(jī)構(gòu)
- 坍落度試驗(yàn)課件
- 消防設(shè)施操作員報(bào)名承諾書
- 中醫(yī)方劑學(xué)之祛濕劑課件
- 阿里巴巴管理三板斧
- 以“政府績效與公眾信任”為主題撰寫一篇小論文6篇
- 地理中考試題說題稿
評(píng)論
0/150
提交評(píng)論