數(shù)據(jù)庫基本概念課件_第1頁
數(shù)據(jù)庫基本概念課件_第2頁
數(shù)據(jù)庫基本概念課件_第3頁
數(shù)據(jù)庫基本概念課件_第4頁
數(shù)據(jù)庫基本概念課件_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1.1 數(shù)據(jù)庫基本概念信息信息是現(xiàn)實事物的存在方式或運動狀態(tài)的反映,即信息是經(jīng)過加工后的數(shù)據(jù),它會對接收者的行為和決策產(chǎn)生影響,具有現(xiàn)實的或潛在的價值。信息的主要特征:信息傳遞需要物質載體,信息的獲取和傳遞要消耗能量。信息可以感知。信息可以存儲、壓縮、加工、傳遞、共享、擴散、再生和增值。1.1.1 信息、數(shù)據(jù)、數(shù)據(jù)處理及 數(shù)據(jù)庫數(shù)據(jù)(Data) 數(shù)據(jù)是描述現(xiàn)實世界事物的符號記錄,是用物理符號記錄的可以鑒別的信息。包括文字、圖形、聲音等,他們都是用來描述事物特性的。 數(shù)據(jù)與信息的聯(lián)系與區(qū)別如下。數(shù)據(jù)客觀實體的屬性值,是信息的載體;但不是所有的數(shù)據(jù)都能表示信息,信息是人們消化了的數(shù)據(jù)。信息是抽象的

2、,不隨數(shù)據(jù)設備所決定的數(shù)據(jù)形式而改變;而數(shù)據(jù)的表示方式卻具有可選擇性。信息與數(shù)據(jù)緊密相關,信息提供現(xiàn)實世界中有關事物的知識,數(shù)據(jù)是載荷信息的物理符號。1.1 數(shù)據(jù)庫基本概念1.1 數(shù)據(jù)庫基本概念數(shù)據(jù)與信息之間的關系(如圖1-1所示)可以表示為:信息 = 數(shù)據(jù) + 數(shù)據(jù)處理圖1-1 數(shù)據(jù)與信息的關系1.1 數(shù)據(jù)庫基本概念數(shù)據(jù)處理 數(shù)據(jù)處理是對各種類型的數(shù)據(jù)進行收集、存儲、分類、計算、加工、檢索與傳輸?shù)倪^程。包括:收集原始數(shù)據(jù)、編碼轉換、數(shù)據(jù)輸入、數(shù)據(jù)處理、數(shù)據(jù)輸出等。數(shù)據(jù)庫(DataBase,簡記為DB) 數(shù)據(jù)庫是長期存儲在計算機內、有組織的、可共享的數(shù)據(jù)集合。它不僅包括數(shù)據(jù)本身,而且包括相關數(shù)

3、據(jù)之間的聯(lián)系。數(shù)據(jù)庫技術主要研究如何存儲、使用和管理數(shù)據(jù)。這種集合具有如下特點:最小的冗余度應用程序對數(shù)據(jù)資源共享數(shù)據(jù)獨立性高統(tǒng)一管理和控制1.1 數(shù)據(jù)庫基本概念1.1.2 數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫應用系統(tǒng) 數(shù)據(jù)庫應用系統(tǒng)是指系統(tǒng)開發(fā)人員利用數(shù)據(jù)庫系統(tǒng)資源開發(fā)出來的,面向某一類實際應用的應用軟件系統(tǒng)。例如:財務管理系統(tǒng),人事管理系統(tǒng)等等。 數(shù)據(jù)庫管理系統(tǒng)(DBMS) 數(shù)據(jù)庫管理系統(tǒng)是維護和管理數(shù)據(jù)庫的軟件,是位于用戶與操作系統(tǒng)之間的一個數(shù)據(jù)管理軟件。它的基本功能包括以下幾個方面:數(shù)據(jù)定義功能 用戶通過數(shù)據(jù)定義語言對數(shù)據(jù)庫中的數(shù)據(jù)對象進行定義。數(shù)據(jù)操縱功能 用戶可以使用數(shù)據(jù)操縱語言操縱數(shù)據(jù),如查詢、插入

4、、刪除和修改。數(shù)據(jù)庫的運行管理功能 數(shù)據(jù)庫在建立、運行和維護時由數(shù)據(jù)庫管理系統(tǒng)統(tǒng)一管理和控制。數(shù)據(jù)庫的建立和維護功能 它包括數(shù)據(jù)庫初始數(shù)據(jù)的輸入、轉換功能,數(shù)據(jù)庫的轉儲、恢復功能等。1.1 數(shù)據(jù)庫基本概念 數(shù)據(jù)庫系統(tǒng)的組成 數(shù)據(jù)庫系統(tǒng)由5部分組成:硬件系統(tǒng)、數(shù)據(jù)庫集合、數(shù)據(jù)庫管理系統(tǒng)、應用系統(tǒng)和人員。其中,人員包括:數(shù)據(jù)庫管理員、系統(tǒng)分析員、數(shù)據(jù)庫設計員、應用程序員和最終用戶等。其中,數(shù)據(jù)庫管理員是對數(shù)據(jù)庫進行規(guī)劃、設計、維護、監(jiān)視等的專業(yè)人員。 計算機硬件:包括CPU、內存、顯示器、磁盤、及其外部設備。要求要有足夠大的內存、足夠大的磁盤、系統(tǒng)有較高的通道能力。軟件:DBMS、支持DBMS運行

5、的操作系統(tǒng)、應用開發(fā)工具等。圖2數(shù)據(jù)庫系統(tǒng)的組成 1.1 數(shù)據(jù)庫基本概念1.1 數(shù)據(jù)庫基本概念1.1.3 數(shù)據(jù)庫技術的發(fā)展 數(shù)據(jù)管理技術的發(fā)展經(jīng)歷了人工管理、文件系統(tǒng)和數(shù)據(jù)庫系統(tǒng)3個階段。人工管理階段 這一階段是指20世紀50年代中期以前,計算機主要用于科學計算,當時的計算機硬件狀況是:外存只有磁帶、卡片、紙帶,沒有磁盤等直接存取的存儲設備;軟件狀況是:沒有操作系統(tǒng),沒有管理數(shù)據(jù)的軟件,數(shù)據(jù)處理方式是批處理。人工管理階段的特點是:數(shù)據(jù)不保存、數(shù)據(jù)無專門軟件進行管理、數(shù)據(jù)不共享、數(shù)據(jù)不具有獨立性、數(shù)據(jù)無結構。文件系統(tǒng)階段 這一階段從20世紀50年代后期到60年代中期,計算機硬件和軟件都有了一定的

6、發(fā)展。計算機不僅用于科學計算,還大量用于管理。這時硬件方面已經(jīng)有了磁盤、磁鼓等直接存取的存儲設備。在軟件方面,操作系統(tǒng)中已經(jīng)有了數(shù)據(jù)管理軟件,一般稱為文件系統(tǒng)。處理方式上不僅有了文件批處理,而且能夠聯(lián)機實時處理1.1 數(shù)據(jù)庫基本概念數(shù)據(jù)庫系統(tǒng)階段 20世紀60年代末數(shù)據(jù)管理進入新時代數(shù)據(jù)庫系統(tǒng)階段。數(shù)據(jù)庫系統(tǒng)階段出現(xiàn)了統(tǒng)一管理數(shù)據(jù)的專門軟件系統(tǒng),即數(shù)據(jù)庫管理系統(tǒng)。數(shù)據(jù)庫系統(tǒng)是一種較完善的高級數(shù)據(jù)管理方式,也是當今數(shù)據(jù)管理的主要方式,獲得了廣泛的應用。 分布式數(shù)據(jù)庫系統(tǒng)階段 分布式數(shù)據(jù)庫系統(tǒng)是由若干個站集合而成。這些站又稱為節(jié)點,它們在通訊網(wǎng)絡中聯(lián)接在一起,每個節(jié)點都是一個獨立的數(shù)據(jù)庫系統(tǒng),它們

7、都擁有各自的數(shù)據(jù)庫、中央處理機、終端,以及各自的局部數(shù)據(jù)庫管理系統(tǒng)。因此分布式數(shù)據(jù)庫系統(tǒng)可以看作是一系列集中式數(shù)據(jù)庫系統(tǒng)的聯(lián)合。它們在邏輯上屬于同一系統(tǒng),但在物理結構上是分布式的。 面向對象數(shù)據(jù)庫系統(tǒng) 面向對象編程(Object Oriented Programming,OOP,面向對象程序設計)是一種計算機編程架構。OOP 的一條基本原則是計算機程序是由單個能夠起到子程序作用的單元或對象組合而成。OOP 達到了軟件工程的三個主要目標:重用性、靈活性和擴展性。面向對象數(shù)據(jù)庫吸收了面向對象程序設計方法的核心概念和基本思想,采用面向對象的觀點來描述現(xiàn)實世界實體(對象)的邏輯組織、對象之間的限制和聯(lián)

8、系等。1.2 數(shù)據(jù)庫管理的實現(xiàn)1.2.1 三個世界的轉化現(xiàn)實世界 數(shù)據(jù)庫管理的對象存在于現(xiàn)實世界中,現(xiàn)實世界中的事物存在著各種各樣的聯(lián)系。這種聯(lián)系是客觀存在的,是由事物本身的性質決定的。例如,學??紕展芾硐到y(tǒng)中有老師、學生、課程、教室等構成元素。概念世界 概念世界也叫做信息世界,是現(xiàn)實世界在人們頭腦中的反映,是對客觀事物及其聯(lián)系的一種抽象描述。從現(xiàn)實世界到概念世界是通過概念模型來表達的。如對學生的描述可分為:學號、姓名、班級、籍貫、性別等概念。數(shù)據(jù)世界 存入計算機系統(tǒng)的數(shù)據(jù)是將概念世界中的事物數(shù)據(jù)化的結果。為準確地反映事物本身及事物之間的各種聯(lián)系,數(shù)據(jù)庫中的數(shù)據(jù)一定存在一個結構,數(shù)據(jù)模型可用來

9、準確描述這種結構。 在實現(xiàn)數(shù)據(jù)庫管理,也就是三個世界的轉化過程中,概念模型和數(shù)據(jù)模型是實現(xiàn)現(xiàn)實世界數(shù)據(jù)化的橋梁,是對現(xiàn)實世界中的事物進行抽象的工具。 1.2 數(shù)據(jù)庫管理的實現(xiàn) 三個世界的轉化過程示意圖 1.2 數(shù)據(jù)庫管理的實現(xiàn)1.2.2 數(shù)據(jù)模型 模型概念 模型(model):一般而言,模型是現(xiàn)實世界某些特征的模擬和抽象,分為實物模型與抽象模型。建筑模型,汽車模型,飛機模型等都是實物模型,它們通常是客觀事物的某些外觀特征或者功能的模擬與刻畫;數(shù)學模型s=r2是一種抽象模型,它抽象描述了園的面積和園的半徑之間的數(shù)量關系,揭示客觀事物的某些本質的、內部的特征。數(shù)據(jù)模型 在實現(xiàn)數(shù)據(jù)庫管理的過程中,數(shù)

10、據(jù)模型起著關鍵作用。整個數(shù)據(jù)庫技術的發(fā)展就是沿著數(shù)據(jù)模型的主線展開的。現(xiàn)有的數(shù)據(jù)庫均是基于某種數(shù)據(jù)模型,了解數(shù)據(jù)模型的基本概念是學習數(shù)據(jù)庫的基礎。根據(jù)模型應用的不同目的,可以將這些模型劃分為兩類,他們分屬于兩個不同的層次。 第一類模型是概念模型,也稱信息模型。它是按用戶的觀點來對數(shù)據(jù)和信息建模,主要用于數(shù)據(jù)庫設計。 另一類模型是數(shù)據(jù)模型,主要包括網(wǎng)狀模型、層次模型、關系模型等,它是按計算機系統(tǒng)的觀點對數(shù)據(jù)建模,主要用于DBMS的實現(xiàn),這種數(shù)據(jù)模型也叫結構數(shù)據(jù)模型。1.2 數(shù)據(jù)庫管理的實現(xiàn)數(shù)據(jù)模型的要素:數(shù)據(jù)結構 數(shù)據(jù)結構是所研究的對象類型的集合,這些對象是數(shù)據(jù)庫的組成成分,它們包括兩類,一類是

11、與數(shù)據(jù)類型、內容、性質有關的對象;一類是與數(shù)據(jù)之間聯(lián)系有關的對象。數(shù)據(jù)操作 數(shù)據(jù)操作是指對數(shù)據(jù)庫中各種對象的(型)的實例(值)允許執(zhí)行的操作的集合,包括操作及有關的操作規(guī)則。數(shù)據(jù)庫主要有檢索和更新(包括插入、刪除、修改)兩大類操作,數(shù)據(jù)模型必須定義這些操作的確切含義、操作符號、操作規(guī)則(如優(yōu)先級)以及實現(xiàn)操作的語言。數(shù)據(jù)操作是對系統(tǒng)動態(tài)特性的描述。數(shù)據(jù)的約束條件 數(shù)據(jù)約束條件是一組完整性規(guī)則的集合。完整性規(guī)則是給定的數(shù)據(jù)模型中數(shù)據(jù)及其聯(lián)系所具有的制約和依存規(guī)則,用以限定符合數(shù)據(jù)模型的數(shù)據(jù)庫狀態(tài)以及狀態(tài)的變化,以保證數(shù)據(jù)的正確、有效、相容。如:入學年齡不超過30歲,成績不得有三門以上不及格等。1

12、.2 數(shù)據(jù)庫管理的實現(xiàn)1.2.3 概念模型概念模型的相關概念(1)實體(Entity):客觀存在并相互區(qū)別的事物及其事物之間的聯(lián)系。例如,一個學生、一門課程、學生的一次選課、一次考試等都是實體。(2)屬性(Attribute):實體所具有的某一特性。例如,學生的學號、姓名、性別、出生年份、系、入學時間等。(3)碼(Key):唯一標示實體的屬性集。例如,學號是學生實體的碼。(4)域(Domain):屬性的取值范圍。例如,年齡的域為15至35之間。(5)實體型(Entity Type):用實體名及其屬性名集合來抽象和刻畫同類實體,稱為實體型。例如,學生(學號,姓名,性別,出生年份,系,入學時間)就

13、是一個實體型。(6)實體集(Entity Set):同型實體的集合稱為實體集。如,全體學生就是一個實體集。(7)聯(lián)系(Relationship):實體與實體之間以及實體與組成它的各屬性間的關系。1.2 數(shù)據(jù)庫管理的實現(xiàn)實體間聯(lián)系的三種情況 (1)一對一聯(lián)系(1 : 1) 如果對于實體集A中的每一個實體,實體集B中至少有一個(也可以沒有)實體與之聯(lián)系,反之亦然,則稱實體集A與實體集B具有一對一聯(lián)系,記為1:1。例如,一個學生只能有一個學號,而一個學號只能指向一個學生,則學生與學號之間具有一對一聯(lián)系。 (2)一對多聯(lián)系(1 : n ) 如果對于實體集A中的每一個實體,實體集B中有個n實體(n0)之

14、聯(lián)系,反之,對于實體集B中的每一個實體,實體集A中至多只有一個實體與之聯(lián)系,則稱實體集A與實體集B有一對多聯(lián)系,記為1 : n 。例如,一個班級中有若干名學生,而每個學生只在一個班級中學習,則班級與學生之間具有一對多聯(lián)系。 (3)多對多聯(lián)系(m : n) 如果對于實體集A中的每一個實體,實體集B中有n 個實體(n0)與之聯(lián)系,反之,對于實體集B中的每一個實體,實體集A中也有m 個實體(m0)與之聯(lián)系,則稱實體集A與實體集B具有多對多聯(lián)系,記為m : n 。例如,一門課程同時有若干個學生選修,而一個學生可以同時選修多門課程,則課程與學生之間具有多對多聯(lián)系。 注意:實際上,一對一聯(lián)系是一對多聯(lián)系的

15、特例,而一對多聯(lián)系又是多對多聯(lián)系的特例。 1.2 數(shù)據(jù)庫管理的實現(xiàn)概念模型的表示方法概念模型的表示方法很多,最常用的是實體聯(lián)系方法。該方法用E-R(EntityRelationship Approch) 圖來描述現(xiàn)實世界的概念模型。E-R圖提供了表示實體型、屬性和聯(lián)系的方法。E-R圖有三個要素:(1)實體型:用矩形表示,矩形框內寫明實體名。(2)屬 性:用橢圓形表示,并用無向邊將其與相應的實體連接起來。(3)聯(lián) 系:用菱形表示,菱形框內寫明聯(lián)系名,并用無向邊分別與有關實體連接起來,同時在無向邊旁標上聯(lián)系的類型(1:1,1:n或m:n)。 1.2 數(shù)據(jù)庫管理的實現(xiàn)1.2 數(shù)據(jù)庫管理的實現(xiàn)1.2.

16、4 數(shù)據(jù)模型 這里講的數(shù)據(jù)模型是在概念級的模型(概念模型)的基礎上形成的,為計算機上某一DBMS支持的數(shù)據(jù)模型。本書主要介紹前三種模型。層次模型若用圖來表示,層次模型是一棵倒立的樹。在數(shù)據(jù)庫中,滿足以下條件的數(shù)據(jù)模型稱為層次模型: 有且僅有一個結點無父結點,這個結點稱為根結點; 其他結點有且僅有一個父結點。1.2 數(shù)據(jù)庫管理的實現(xiàn)網(wǎng)狀模型 在現(xiàn)實世界中,事物之間的聯(lián)系更多的是非層次關系的,用層次模型表示非樹型結構是很不直接的,網(wǎng)狀模型則可以克服這一弊病。網(wǎng)狀模型是一個網(wǎng)絡。在數(shù)據(jù)庫中,滿足以下兩個條件的數(shù)據(jù)模型稱為網(wǎng)狀模型。 允許一個以上的結點無父結點; 一個結點可以有多于一個的父結點。 從以

17、上定義看出,網(wǎng)狀模型構成了比層次結構復雜的網(wǎng)狀結構,適宜表示多對多的聯(lián)系。網(wǎng)狀模型和網(wǎng)頁上的“超鏈接數(shù)據(jù)”模式有類似之處。1.2 數(shù)據(jù)庫管理的實現(xiàn)關系模型 以二維表的形式表示實體和實體之間聯(lián)系的數(shù)據(jù)模型稱為關系數(shù)據(jù)模型。從模型的三要素角度看,關系模型的內容為:數(shù)據(jù)結構:一張二維表格。數(shù)據(jù)操作:數(shù)據(jù)表的定義,檢索、維護、計算等。數(shù)據(jù)約束條件:表中列的取值范圍即域值的限制條件。關系模型的幾個常見概念: (1)關系:一個關系就是一張二維表,每個關系都有一個關系名,即數(shù)據(jù)表名。 (2)元組:表中的行稱為元組,一行就是一個元組,對應表中一條記錄。 (3)屬性:表中的列稱為屬性,即字段。字段名稱為屬性名,

18、字段值稱為屬性值。 (4)域: 屬性的取值范圍,如,分數(shù)在0100之間。 (5)關鍵字:表中的一個屬性(組),它的值可以唯一地標志一個元組。如:學號。 (6)候選碼:表中的某一個屬性,它的值可以唯一地標志一個元組。一個表中可能有多個候選碼,選擇一個作為主鍵,主鍵的屬性稱為主屬性。 (7) 外關鍵字:如果一個關系中的屬性或屬性組并非該關系的關鍵字,但它們是另外一個關系的關鍵字,則稱其為該關系的外關鍵字。1.2 數(shù)據(jù)庫管理的實現(xiàn)關系模型:1.2 數(shù)據(jù)庫管理的實現(xiàn)關系模型的完整性 關系模型對數(shù)據(jù)一般都具有一定的限制,這種限制稱為完整性或完整性約束。關系模型的完整性是保證關系數(shù)據(jù)表正確的關鍵。關系模型

19、支持實體完整性約束、參照完整性約束和域約束3種完整性約束。(1)實體完整性約束 假設A是一個表R的主鍵,則A不能接收空值,即單列主鍵的值不能為空,復合主鍵的任何列也不能接收空值。例如,在學生信息表中,“學號”為該表的主鍵,那么在數(shù)據(jù)庫的任何記錄中,“學號”列的值都不能為空。這樣的約束稱為實體完整性約束。(2)參照完整性約束 參照完整性約束關心的是邏輯相關的表中值與值之間的關系。假設X是一個表A的主鍵,在表B中是外鍵,那么若K是表B中一個外部鍵值,則表A中必然存在在X上的值為K的記錄。例如,“系編碼”是院系信息表的主鍵,而在學生信息表中是相對于院系信息表的外鍵(學生信息表中的主關鍵字是由“學號”

20、和“系編碼”組合而成),對于學生信息表的任何記錄,其所包含的“系編碼”的值,在院系信息表的“系編碼”列中必然存在一個相同的值。這樣的約束稱為參照完整性約束。 1.2 數(shù)據(jù)庫管理的實現(xiàn)1.2 數(shù)據(jù)庫管理的實現(xiàn)(3)域約束 域是邏輯相關的值的集合,從域中可以得出特定列的值。 例如,在學生信息表中:“出生日期”域的值必須按照特定的統(tǒng)一格式存放,而不能有時用:1986.12.23格式,有時用:12/23/1986格式,造成數(shù)據(jù)混亂;“學生名字”、“院系名稱”等域的值必須屬于字符集合;對于“性別”,該域中的值必須局限于男、女等。 返回首頁1.2 數(shù)據(jù)庫管理的實現(xiàn)1.2.5 關系運算關系的基本運算有兩類:

21、傳統(tǒng)的集合運算和專門的關系運算。 傳統(tǒng)的集合運算(1)并(Union):設有兩個關系R和S,它們具有相同的結構。R和S的并是由屬于R或屬于S的元組組成的集合,運算符為。例如:設每個班有一個學生關系R1,R2,R3,則全校學生關系T是: T= R1 R2 R3 (2)差 (Difference) :設有兩個關系R和S,它們具有相同的結構。R和S的差是由屬于R但不屬于S的元組組成的集合。運算符為。例如:設有參加計算機小組的學生關系,參加橋牌小組的學生關系。求參加了計算機小組但沒有參加橋牌小組的學生。結果放在關系1中,則 T1=R-S。(3)交(Intersection):設有兩個關系R和S,它們具

22、有相同的結構。R和S的交是由既屬于R又屬于S的元組組成的集合,運算符為。交運算的結果是R和S的共同元組。例如:設有參加計算機小組的學生關系,參加橋牌小組的學生關系。求既參加了計算機小組又參加橋牌小組的學生。結果放在關系2中,則2 =R S。關系的交可以用關系的差來表示。即RS= R-(R S),所以,上式也可以寫成:2 =R-(R S)。返回首頁1.2 數(shù)據(jù)庫管理的實現(xiàn)專門的關系運算(1)選擇( Selection ):按照給定條件從指定的關系中挑選出滿足條件的元組構成新的關系,其關系模式不變,但其中元組的數(shù)目小于等于原來的關系中元組的個數(shù),它是原關系的一個子集。這是從行的角度進行的運算,即水平方向抽取元組。(2)投影(projection):從指定的關系中挑選出某些屬性構成新的關系,其關系模式所包含的屬性個數(shù)往往比原關系少,或者屬性的排列順序不同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論