廣東海洋大學(xué)高級數(shù)據(jù)庫復(fù)習(xí)重點(diǎn)_第1頁
廣東海洋大學(xué)高級數(shù)據(jù)庫復(fù)習(xí)重點(diǎn)_第2頁
廣東海洋大學(xué)高級數(shù)據(jù)庫復(fù)習(xí)重點(diǎn)_第3頁
廣東海洋大學(xué)高級數(shù)據(jù)庫復(fù)習(xí)重點(diǎn)_第4頁
廣東海洋大學(xué)高級數(shù)據(jù)庫復(fù)習(xí)重點(diǎn)_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

聚集類型(CollectionType)一組相同類型元素組成的并且滿足一定要求的集合稱為聚集類型。聚集類型也稱為集合類型,具體可以分為以下四種:列表類型(listType)相同類型元素的有序集合,但允許一個元素多次出現(xiàn)。作為特例,字符串類型就是列表類型的簡化形式包類型(BagType)相同類型元素的無序集合,但允許一個元素出現(xiàn)多次。也稱為多集類型,例如成績集合{75,80,80,70,80}集合類型(SetType)相同類型元素的無序集合,每個元素只能出現(xiàn)一次,集合類型實(shí)際上就是一種關(guān)系,因此也稱為關(guān)系類型。例如課程集合:Maths,DB,Physics}。3.時間公為哪些時間可以分為絕對時間(absolutetime)和相對時間(relati和浮動時間)■時間模型:基丁對時間軸結(jié)構(gòu)的選擇,時間模型可以劃分如下幾種模型:■連續(xù)模型把時間看作同構(gòu)于實(shí)數(shù),每一個實(shí)數(shù)對應(yīng)于一個時間點(diǎn)。因此,在時間軸的兩個時間點(diǎn)之間,可以存在其它的時間點(diǎn)。這種模型能夠最精確地為時間建模,但是由于現(xiàn)代計(jì)算機(jī)基于數(shù)字邏輯的工作方式,所以不可能無失真的記錄時間。在許多實(shí)時控制場合,例如工業(yè)控制領(lǐng)域,需要記錄大量隨時間不斷變化的數(shù)據(jù)。在這種情況下,往往采取采樣的方式記錄數(shù)據(jù)變化,對相鄰時間點(diǎn)之間的數(shù)據(jù)采取插值的方法得到?!霾竭M(jìn)模型把數(shù)據(jù)的狀態(tài)看成是時間的函數(shù)。當(dāng)時間點(diǎn)上的數(shù)據(jù)狀態(tài)發(fā)生變化時才記錄狀態(tài)變化,否則保持不變。在這種模型下,時間序列上任一點(diǎn)上數(shù)據(jù)的值對應(yīng)于上一次數(shù)據(jù)改變時保持的狀態(tài),如果要查詢當(dāng)前數(shù)據(jù)的取值,需要回溯。離散模型把時間和整數(shù)映射起來,在相鄰的兩個時間點(diǎn)之間不存在另一個時間點(diǎn)。任一時間點(diǎn)有前驅(qū)和后繼時間點(diǎn)。在實(shí)際應(yīng)用中,該模型適用于記錄那些在關(guān)鍵時間點(diǎn)4.恒定模型(NonTemporalmodel)■有些數(shù)據(jù)是不隨時間變化的,例如:籍貫、出生地等。這些數(shù)據(jù)只有其本身固有的屬性。但是大部分?jǐn)?shù)據(jù)在一種情況下沒有時態(tài)屬性,但在另一種情況下往往會有時態(tài)屬性。例如:住址、身份、工作單位等。在一般情況下,在建模時通常沒有充分考慮值隨時間變化的情況。如果發(fā)生變化時,就采用最新值進(jìn)行替換。(TimePoints).這種描述方法是把時間看成一個個離散的時間點(diǎn),這些離散化的間點(diǎn)是否封閉分為4種,如圖所示?!鰰r間跨度(timespan)是指持續(xù)的一段時間,表示時間的長度。在數(shù)據(jù)庫系統(tǒng)內(nèi),■與時間區(qū)間類似,時間跨度也是表示一段時間;所不同的是,時間跨度沒有時間起時間粒度反映了時態(tài)信息系統(tǒng)中時間點(diǎn)描述的最小單位,時間粒度越小,離散的時間點(diǎn)越多,描述的事件的變化信息越精細(xì)準(zhǔn)確;反之,描述的事件變化的信息越粗糙。時間粒度的大小,要受到時間量子的約束。系統(tǒng)的時間量子(Chronon)是計(jì)算機(jī)系統(tǒng)所支持的最小的、不可分割的時間間隔??陀^世界中的時間,離散化的程度可以任意的小,但是計(jì)算機(jī)系統(tǒng)的離散化程度是受到機(jī)器性能制約的??梢姡瑫r間量子是系統(tǒng)記錄時間屬性的精確程度的一個度量。時間量子越小,系統(tǒng)記錄的精確度越高。時間元素UCUntilChanged(簡記UC)主要用于事務(wù)時間中的時間變元,表示直到該元組改變的時間,在應(yīng)用于事務(wù)時間中它有比Now更精確的解釋語義,并與有效時間中的時間變元Now相區(qū)別,但與Now具有類似的含義。■事務(wù)時間(transactiontime)是指記錄邏輯上被存放在數(shù)據(jù)庫中的時間,它反映了記錄被查、刪、改的時間。事務(wù)時間與有效時間正交的一個概念,表示了數(shù)據(jù)庫的變化事務(wù)時間區(qū)間[start.stop]中的start表示該事務(wù)的起始時間,stop表示該事務(wù)的終止時數(shù)據(jù)庫更新集合了插入和刪除兩種操作。■1.用戶自定義時間一般傳統(tǒng)數(shù)據(jù)庫系統(tǒng)都支持用戶自定義數(shù)據(jù)類型,允許用戶在原有系統(tǒng)數(shù)據(jù)類型的基礎(chǔ)上建立自己定義的數(shù)據(jù)類型。這些用戶自定義的數(shù)據(jù)類型,在數(shù)據(jù)表建立或結(jié)構(gòu)修改時,和其他標(biāo)準(zhǔn)數(shù)據(jù)類型一樣被用戶使用。和傳統(tǒng)數(shù)據(jù)庫系統(tǒng)一樣,時態(tài)數(shù)據(jù)庫系統(tǒng)不對用戶自定義時間進(jìn)行任何特殊的處理,不需要專門的語言支持。用戶自定義時間值是完全應(yīng)用依賴的,由用戶和系統(tǒng)以常規(guī)方式存取?!鲇行r間(ValidTime)是指一個對象(事件)在現(xiàn)實(shí)世界中發(fā)生并保持的那段時間,或者該對象在現(xiàn)實(shí)世界中為真的時間。有效時間既可以反映過去和現(xiàn)在的時間,還可以反映將來的時間。有效時間的含義依賴于具體應(yīng)用,取值是否有效視具體應(yīng)用場合而定,對應(yīng)于實(shí)際應(yīng)用的需要或現(xiàn)實(shí)世有效時間可以是單一的時間點(diǎn),單一的時間區(qū)間,或者是時間點(diǎn)的集合,時間區(qū)間的有限集合,或者是整個時間域。也就是說,元組的屬性可以在任意的時間點(diǎn),任意的時間區(qū)間里取值為真。和用戶定義的時間不同,當(dāng)查詢語句被檢測到有時態(tài)語義的時候,有效時間是由數(shù)據(jù)庫系統(tǒng)解釋的。而且有效時間可以被更新,有效時間的提供和更新也通常把只支持有效時間的數(shù)據(jù)庫稱為歷史數(shù)據(jù)庫(HistoricalDatabase)。歷史數(shù)據(jù)庫記錄現(xiàn)實(shí)世界在有效時間點(diǎn)的事件,或者現(xiàn)實(shí)世界的狀態(tài)變化。有效時間對事物的描據(jù)庫狀態(tài)?!鍪聞?wù)時間的值由系統(tǒng)時鐘給出,它獨(dú)立于應(yīng)用,用戶不能修改事務(wù)時間;■事務(wù)時間不能晚于現(xiàn)在時間,因?yàn)樗从持鴶?shù)據(jù)庫實(shí)際操作的時間,不能指未“多態(tài)”(polymorphism)等基本概念,而關(guān)系數(shù)據(jù)模型和其他傳統(tǒng)數(shù)據(jù)模型不具有這些概在GIS中,基本空間數(shù)據(jù)類型由下述三種空間對象組成:線不僅表示線上各點(diǎn)在空間的位置,而且還有長度,即表示其在空間的延伸范圍。(3)區(qū)域(Region)例如森林、湖泊、行政區(qū)域等。區(qū)域不但有位置,而且有面積、周長s,黑種時態(tài)繳據(jù)厚的概念1.快照數(shù)據(jù)庫■快照數(shù)據(jù)庫(SnapshotDatabase)是以在特定的時刻的瞬間快照來建立模型,來考慮現(xiàn)實(shí)世界,盡管現(xiàn)實(shí)世界是變化的,快照數(shù)據(jù)庫只是反映了某一個瞬間的情況。■之所以在這里將快照數(shù)據(jù)庫介紹一下,是因?yàn)榭煺諗?shù)據(jù)庫也支持一種時間用戶定義時間。而且對快照數(shù)據(jù)庫的研究,可以看到數(shù)據(jù)庫對時變屬性的支持變化情況?!隹煺諗?shù)據(jù)庫由靜態(tài)的二維關(guān)系表組成,分別是屬性維和元組維。數(shù)據(jù)庫的狀態(tài)變遷快照數(shù)據(jù)庫不能夠進(jìn)行與時間相關(guān)的任何工作,不能進(jìn)行含有時間因素的推理,不能進(jìn)行以往歷史數(shù)據(jù)的查詢;而且,它更改的歷史數(shù)據(jù)全部丟失。■實(shí)際上是一種非時態(tài)數(shù)據(jù)庫,它反映的是數(shù)據(jù)的當(dāng)前狀態(tài),隨著時間的推移,數(shù)據(jù)庫狀態(tài)在不斷的改變,新狀態(tài)將覆蓋舊的狀態(tài)。狀態(tài)之間的轉(zhuǎn)變是通過更新操作實(shí)回滾數(shù)據(jù)庫記錄了數(shù)據(jù)庫事務(wù)變化歷史,它實(shí)現(xiàn)的是事務(wù)時間軸。任何一個更新語句的執(zhí)行將產(chǎn)生一個新的數(shù)據(jù)庫狀態(tài)。新狀態(tài)不會覆蓋舊的狀態(tài)。因此沒有數(shù)據(jù)會被物理刪除。通過將一個元組的事務(wù)結(jié)束時間設(shè)為執(zhí)行語句的當(dāng)時時間,從而實(shí)1)回滾數(shù)據(jù)庫因?yàn)槭前凑帐聞?wù)時間編址,記錄的是數(shù)據(jù)庫狀態(tài)變遷的歷史,而不是現(xiàn)實(shí)世界變化的歷史,現(xiàn)實(shí)世界中元組的屬性在某個時間點(diǎn)(屬性的有效時間)變3)回滾數(shù)據(jù)庫的冗余太多。在前一個事務(wù)時間內(nèi)提交的數(shù)據(jù),即使在下一個事務(wù)時間沒有數(shù)據(jù)的改變或者改變甚小也需要進(jìn)行所有的數(shù)據(jù)的重新輸入及儲存,這種冗記錄事實(shí)的有效時間的數(shù)據(jù)庫稱為歷史數(shù)據(jù)庫。歷史數(shù)據(jù)庫記錄了在有效時間軸上的一系列的數(shù)據(jù)庫狀態(tài),可能是過去、現(xiàn)在或?qū)?。它可以被看作是記錄了事?shí)在歷史數(shù)據(jù)庫上的查詢語言必須具有有效時間演算能力。同時更新語句必須指明修改語句涉及哪些數(shù)據(jù)庫狀態(tài)(也就是只對指明的時間區(qū)間內(nèi)有效的記錄才進(jìn)行修■歷史數(shù)據(jù)庫無法記錄數(shù)據(jù)庫的修改歷史。因此,在歷史數(shù)據(jù)庫中有效時間的修改歷史也是不能被記錄的。例如某個事實(shí)的有效時間有錯誤而進(jìn)行了更新,新的記■歷史數(shù)據(jù)庫主要特點(diǎn)是支持有效時間,數(shù)據(jù)冗余度小,結(jié)構(gòu)相對簡單。■但是也存在一些不知,主要不足之處是:不支持事務(wù)時間,不可以象回滾數(shù)■回滾數(shù)據(jù)庫和歷史數(shù)據(jù)庫各具優(yōu)點(diǎn),通過設(shè)計(jì)一種數(shù)據(jù)庫,使它既支持事務(wù)時間又支持有效時間,這就是雙時態(tài)數(shù)據(jù)庫(BitemporalDatabase)。元組,另外兩維是事務(wù)時間和有效時間(圖7),一個時態(tài)關(guān)系可以看成是一個歷史關(guān)■雙時態(tài)數(shù)據(jù)庫綜合了回滾數(shù)據(jù)庫和歷史數(shù)據(jù)庫的優(yōu)良特性,它即保存了數(shù)據(jù)庫變遷的歷史,又保存了現(xiàn)實(shí)世界的真實(shí)的數(shù)據(jù)屬■這種數(shù)據(jù)庫,才是真正的對數(shù)據(jù)時態(tài)屬性支持的數(shù)據(jù)庫,以前的回滾數(shù)據(jù)庫■應(yīng)當(dāng)注意的是,雙時態(tài)數(shù)據(jù)庫是以犧牲大容量的儲存空間為代價(jià)的,對雙時態(tài)數(shù)據(jù)庫的儲存進(jìn)行優(yōu)化是時態(tài)數(shù)據(jù)庫研究的一個重要工作。從知識源獲取知識建立知識庫的工作。知識庫的知識主要有兩個來中間知識(再生知識),由推理機(jī)生成后加入到知識庫中的知識。聯(lián)機(jī)分析處理(OLAP)是基于數(shù)據(jù)倉庫的信息分析處理過程,是數(shù)據(jù)倉庫的用戶接口部分。數(shù)據(jù)倉庫側(cè)重于存儲和管理面向決策主題的數(shù)據(jù)。而OLAP則側(cè)重于數(shù)據(jù)倉庫中數(shù)據(jù)分析,并將其轉(zhuǎn)換成輔助決策信息。OLAP技術(shù)的典型應(yīng)用是對多維數(shù)據(jù)的切片和切塊、鉆取、旋轉(zhuǎn)等,便于使用者從不同角度提取有關(guān)數(shù)據(jù)。OLAP一個重要的特點(diǎn)是對多維數(shù)據(jù)的分析。與數(shù)據(jù)倉庫的多維組織正好形成相互結(jié)合、相互補(bǔ)充的關(guān)>OLTP是面向顧客的,用于辦事員.客戶和信息技術(shù)專業(yè)人員的事務(wù)和查詢處理:>OLAP是面向市場的,用于幫助經(jīng)理、主管和分析入員等進(jìn)行數(shù)據(jù)分析。管理信息.>OLTP系統(tǒng)通常采用實(shí)體-聯(lián)系(ER)模型和面向應(yīng)用的數(shù)>OLAP系統(tǒng)通常采用星型或雪花模型和面向主題的數(shù)據(jù)模式。>OLTP系統(tǒng)的訪問主要由短的原子事務(wù)組成。>OLAP系統(tǒng)的訪問由一些只讀操作組成,盡管可能是很復(fù)雜的查詢操作。>OLTP系統(tǒng)主要關(guān)注一個企業(yè)或部門內(nèi)部的當(dāng)前數(shù)據(jù),而不涉及歷史數(shù)據(jù)或不同組>OLAP系統(tǒng)則通??缭綌?shù)據(jù)庫模式的多個版本,處理來自不同組織的信息和多個數(shù)Le面向用戶人員知識工人(如經(jīng)理、主管、分析員)功能DB設(shè)計(jì)數(shù)據(jù)匯總視圖復(fù)雜查詢讀/寫操作數(shù)百萬數(shù)百DB規(guī)模100GB到TB8、九交數(shù)據(jù)模型(記住有意義的)AAA相接A∩aB≠BA部分重疊B州9、時態(tài)數(shù)據(jù)庫的時間粒度轉(zhuǎn)換兩種操作■時間值的粒度影響了有關(guān)涉及時間值的表達(dá)式的語義。例如當(dāng)比較一個時間粒度是天的時間值和一個時間粒度是分的時間值時,表達(dá)式代表什么的語義,如何操作。這時就需要存在轉(zhuǎn)換函數(shù),實(shí)現(xiàn)粒度之間的轉(zhuǎn)換??梢圆捎孟旅娴膬蓚€函數(shù)scale>cast操作和scale操作是相似的,但是scale操作產(chǎn)生不確定的時間值,即時間區(qū)間,■在移動數(shù)據(jù)庫的關(guān)鍵技術(shù)的研究中,比較重要的有復(fù)制與緩存技術(shù)、數(shù)據(jù)廣播、移首先是服務(wù)器節(jié)點(diǎn)間的數(shù)據(jù)復(fù)制,簡稱為復(fù)制;>另外還包括移動節(jié)點(diǎn)與服務(wù)器節(jié)點(diǎn)之間的復(fù)制,這常被稱為緩存。>嚴(yán)格一致性協(xié)議要求在任何時刻所有數(shù)據(jù)庫的復(fù)制都是一致的;是數(shù)據(jù)庫系統(tǒng)追求的目標(biāo),但是在移動數(shù)據(jù)庫系統(tǒng)中卻并不合適?!桃?yàn)閲?yán)格一致性協(xié)議需要所有節(jié)點(diǎn)都處于連接狀態(tài),以完成所有副本的更新,而移動計(jì)算環(huán)境中移動節(jié)點(diǎn)卻有頻繁斷接的特點(diǎn)。即使是在保持連接的服務(wù)器節(jié)點(diǎn)間采用嚴(yán)格一致性協(xié)議,其可用性也很差,因此只要允許,服務(wù)器節(jié)點(diǎn)間的復(fù)制更新也>弱一致性協(xié)議允許各個復(fù)制之間存在暫時的不一致,但這種不一致總是保持在一定移動計(jì)算環(huán)境下復(fù)制技術(shù)需要考慮的主要問題有三個(1)考慮移動節(jié)點(diǎn)與服務(wù)器節(jié)點(diǎn)間如何合理分配數(shù)據(jù)的問題。即要考慮如何提高移動節(jié)點(diǎn)(2)考慮移動節(jié)點(diǎn)與服務(wù)器節(jié)點(diǎn)數(shù)據(jù)的同步問題.在可以保持兩者數(shù)(3)考慮如何改良服務(wù)器節(jié)點(diǎn)間的復(fù)制策略以使其更高效、更好地支持移動性,11、時態(tài)數(shù)據(jù)表的創(chuàng)建(增刪改查)VALUES('pl',dom',va','32、VALIDTIMEPERIOD(DATE"2013-02-01"-now)INSERTINTOprescriptionVALUES('p2','dl',erythromycin','VALIDTIMEPERIOD(DATE"20112、數(shù)據(jù)倉庫(有3種模型)的搭建和定義■根據(jù)數(shù)據(jù)倉庫所管理的數(shù)據(jù)類型和它們所解決的企業(yè)問題范圍,一般可將數(shù)據(jù)倉庫分為企業(yè)數(shù)據(jù)倉庫(EDW)、操作型數(shù)據(jù)庫(ODS)和數(shù)據(jù)集市(Data■企業(yè)數(shù)據(jù)倉庫:它既含有大量詳細(xì)的數(shù)據(jù),也含有大量累贅的或聚集的數(shù)據(jù),這些數(shù)據(jù)具有不易改變性和面向歷史性。這種數(shù)據(jù)倉庫被用來進(jìn)行涵蓋多種企業(yè)領(lǐng)域上(3)多態(tài)性■操作型數(shù)據(jù)庫:既可以被用來針對工作數(shù)據(jù)作決策支持,又可用作將數(shù)據(jù)加載到數(shù)的,僅包含目前的、詳細(xì)的數(shù)據(jù),而沒有累計(jì)的、歷史性的數(shù)據(jù)等特點(diǎn)。數(shù)據(jù)集市:是一種更小的、更集中的數(shù)據(jù)倉庫。簡單地說,原始數(shù)據(jù)從數(shù)據(jù)倉庫流入不同的部門以支持這些部門的定制化使用,這些部門級的數(shù)據(jù)倉庫就是數(shù)據(jù)集市。不同的部門有不同的主題域,因而也就有不同的數(shù)據(jù)集市。例如,財(cái)務(wù)部門有自己的數(shù)據(jù)集市,市場部門也有自己的數(shù)據(jù)集市,它們之間可能有關(guān)聯(lián),但相互不同,且在本質(zhì)上互為獨(dú)立。數(shù)據(jù)集市可以在一定程度上緩解訪問■開發(fā)數(shù)據(jù)倉庫的流程包括以下8個步驟:(1)啟動工程.(3)確定主題.1、數(shù)據(jù)特

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論