數(shù)據(jù)處理的技術課件_第1頁
數(shù)據(jù)處理的技術課件_第2頁
數(shù)據(jù)處理的技術課件_第3頁
數(shù)據(jù)處理的技術課件_第4頁
數(shù)據(jù)處理的技術課件_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第四章數(shù)據(jù)處理的技術第一節(jié)數(shù)據(jù)處理概述第二節(jié)數(shù)據(jù)庫技術復習思考題四第四章數(shù)據(jù)處理的技術第一節(jié)數(shù)據(jù)處理概述1第一節(jié)數(shù)據(jù)處理概述

(一)數(shù)據(jù)處理的內(nèi)容所謂數(shù)據(jù)處理,就是把來自科學研究、生產(chǎn)實踐和社會經(jīng)濟活動等領域中的原始數(shù)據(jù)用一定的設備和一定的手段按一定的使用要求加工處理成另一種形式的數(shù)據(jù),以便獲得對人們決策有價值的信息的過程。1.數(shù)據(jù)的采集數(shù)據(jù)的采集就是按照用戶的需要和系統(tǒng)的要求收集必要的原始數(shù)據(jù)。這是數(shù)據(jù)處理工作的第一步。它直接影響到加工信息的質(zhì)量。在數(shù)據(jù)采集中,不僅要及時準確,而且還要有針對性,即根據(jù)處理的目的和需要有選擇地加以采集。一、數(shù)據(jù)處理的主要內(nèi)容與方式第一節(jié)數(shù)據(jù)處理概述(一)數(shù)據(jù)處理的內(nèi)容1.數(shù)據(jù)的采集2

第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式1.數(shù)據(jù)的采集數(shù)據(jù)采集可以是人工采集,也可以通過聯(lián)機方式形成自動化數(shù)據(jù)采集系統(tǒng)。人工采集的數(shù)據(jù),一般是經(jīng)過一定的中間環(huán)節(jié)而獲得的數(shù)據(jù),如檔案文件、賬冊、票據(jù)、憑證等。利用人工采集的主要優(yōu)點是簡單經(jīng)濟,缺點是及時性差,出錯率高。聯(lián)機方式采集數(shù)據(jù),主要是將某種計算裝置、測試裝置等直接與電子數(shù)據(jù)處理系統(tǒng)相聯(lián)接,利用電磁感應、光電感應、聲電感應、電熱感應及機械原理等,將所需要的有關數(shù)值或狀態(tài)數(shù)據(jù)直接送入計算機數(shù)據(jù)處理系統(tǒng)直接處理。采用自動化裝置采集數(shù)據(jù)的優(yōu)點是快速、準確,缺點是投資較大。第一節(jié)數(shù)據(jù)處理概述一、數(shù)據(jù)處理的主要內(nèi)容與3數(shù)據(jù)的轉(zhuǎn)換也叫數(shù)據(jù)的預處理,是將采集到的原始數(shù)據(jù)通過一定手段轉(zhuǎn)換成適合于計算機處理的形式,使數(shù)據(jù)代碼化。如職工文件中的職工性別,年齡,工作單位等數(shù)據(jù),對計算機系統(tǒng)來說可以用相應的代碼表示這些數(shù)據(jù),如用0、1或M~F表示性別,用00001表示工作單位號。數(shù)據(jù)的轉(zhuǎn)換一定要注意正確性、完整性檢查。2.數(shù)據(jù)的轉(zhuǎn)換及錄入第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式數(shù)據(jù)的轉(zhuǎn)換也叫數(shù)據(jù)的預處理,是將采集到的原始數(shù)據(jù)通過4分類是根據(jù)一定順序?qū)o序的數(shù)據(jù)元素調(diào)整成為一個有序序列,也就是將數(shù)據(jù)元素按某一關鍵字的先后次序(升序或降序)進行排序,形成一個有序文件。如生產(chǎn)統(tǒng)計報表要求按產(chǎn)值的大小對各車間排序;工資文件按職工編號排序或按工資的多少排序等。合并是將兩個或多個簡單有序集合中的數(shù)據(jù)按同樣的順序連接成一個有序集合。合并后的文件,可以增加記錄的數(shù)量,也可以增加數(shù)據(jù)項。3.數(shù)據(jù)的分類與合并第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式數(shù)據(jù)的運算包括數(shù)據(jù)的算術運算、邏輯運算及復雜的數(shù)學模型求解。4.數(shù)據(jù)的運算分類是根據(jù)一定順序?qū)o序的數(shù)據(jù)元素調(diào)整成為一個有序序5數(shù)據(jù)的傳輸有兩層含義:一是指實現(xiàn)數(shù)據(jù)資源的共享與交換,例如,利用網(wǎng)絡和通訊技術共享各網(wǎng)點的數(shù)據(jù)資源,一是數(shù)據(jù)處理結果的輸出,常以報告、文件、圖表等形式輸出給各用戶、并傳送到各部門。第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式5.數(shù)據(jù)的傳輸6.數(shù)據(jù)的存儲數(shù)據(jù)的存儲就是對原始待加工的數(shù)據(jù)及已加工后的各種信息的儲存。為此需要確定儲存哪些信息、儲存多長時間、以何種方式儲存、采用何種數(shù)據(jù)結構,以符合速度快、占用存儲器的容量少、成本低等多方面的要求。數(shù)據(jù)的傳輸有兩層含義:一是指實現(xiàn)數(shù)據(jù)資源的共享與交換6數(shù)據(jù)的更新、維護是指對原文件中的記錄或數(shù)據(jù)項進行修改、插入(增加)、刪除及數(shù)據(jù)存儲的調(diào)整,數(shù)據(jù)正確性的檢驗和安全性的保證等。第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式7.數(shù)據(jù)的更新、維護8.數(shù)據(jù)的檢索數(shù)據(jù)的檢索即為從計算機存儲的數(shù)據(jù)中查找和選取所需要的數(shù)據(jù)。采用何種方式檢索,取決于數(shù)據(jù)存儲的形式。例如,在職工文件中可按職工編號或姓名查找某職工的工資、出生年月、職稱、職務等。數(shù)據(jù)的更新、維護是指對原文件中的記錄或數(shù)據(jù)項進行修改7(二)數(shù)據(jù)處理的方式根據(jù)數(shù)據(jù)的發(fā)生及數(shù)據(jù)處理的響應時間的不同,數(shù)據(jù)處理方式可分為批處理(batchprocessing)方式和實時處理(realtimeprocessing)方式兩種。1.批處理方式批處理方式也叫匯總處理方式。它是把一定時間內(nèi)準備處理的各個業(yè)務地點的數(shù)據(jù)累積成批后,一次輸入到計算機集中進行加工處理。例如,工資計算中,把一個月中的各項津貼、扣款憑證等積累起來,在發(fā)薪前一次輸入到計算機,經(jīng)處理以后打印一次工資單。根據(jù)系統(tǒng)與用戶之間距離的遠近不同,數(shù)據(jù)處理方式可分為本地批處理和遠程批處理方式。第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式(二)數(shù)據(jù)處理的方式根據(jù)數(shù)據(jù)的發(fā)生及數(shù)據(jù)處理8(1)本地批處理本地批處理的數(shù)據(jù)輸入輸出發(fā)生在計算中心,它把待處理的數(shù)據(jù)通過郵寄、運輸工具等送到計算中心,然后用一定手段輸入計算機進行批處理。根據(jù)向計算機輸人數(shù)據(jù)的方式不同,本地批處理又可分為中心批處理、聯(lián)機批處理及脫機批處理三種方式。(2)遠程批處理方式這種批處理方式是通過把數(shù)據(jù)從分散的遠程終端經(jīng)過通信線路輸入到計算機,經(jīng)批處理后再把處理結果返回到運送終端。批處理的優(yōu)點是效率高,缺點是不及時。1.批處理方式第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式(1)本地批處理(2)遠程批處理方式批處理的優(yōu)點9實時處理方式是指在數(shù)據(jù)產(chǎn)生的同時,立即輸入計算機,計算機即時作出響應并進行相應的處理,將處理結果直接傳遞給用戶。實時處理方式的應用領域非常廣泛,例如,監(jiān)控系統(tǒng)、窗口詢問系統(tǒng)、金融流通系統(tǒng)、飛機訂票系統(tǒng)等。實時處理又可分為聯(lián)機實時處理與分時處理兩種方式。2.實時處理方式聯(lián)機實時處理方式聯(lián)機方式是用戶通過終端輸入的數(shù)據(jù)立即由中央計算機處理,并向用戶終端輸出處理信息。它包括詢問方式、事務數(shù)據(jù)處理方式和信息交換等方式。(二)數(shù)據(jù)處理的方式第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式實時處理方式是指在數(shù)據(jù)產(chǎn)生的同時,立即輸入計算機,計算10所謂分時,就是指一個計算機系統(tǒng)可以由許多獨立的用戶共享,每個用戶都可以分到一個雖短但一再出現(xiàn)的計算時間片,使其感到只有自己一個人在使用計算機,并且都能得到最快的響應。這種多用戶共用計算機的分時處理又稱會話型處理或即時處理。分時處理方式實時處理方式的優(yōu)點是響應迅速,人機配合良好,缺點是不能面向大量的數(shù)據(jù)處理,且由于線路費用增加而使成本提高。2.實時處理方式第一節(jié)數(shù)據(jù)處理概述

一、數(shù)據(jù)處理的主要內(nèi)容與方式所謂分時,就是指一個計算機系統(tǒng)可以由許多獨立的11(一)數(shù)據(jù)結構的概念及形式1、數(shù)據(jù)結構的概念“數(shù)據(jù)結構”是為了解決和研究非數(shù)值數(shù)據(jù)處理問題而提出的理論和方法。在任何問題中,數(shù)據(jù)元素之間都存在著某種聯(lián)系,這種數(shù)據(jù)元素之間所存在的相互關系我們稱之為數(shù)據(jù)的邏輯結構而數(shù)據(jù)元素在計算機存儲器中的表示稱之為數(shù)據(jù)的物理結構,或稱為存儲結構。第一節(jié)數(shù)據(jù)處理概述

二、數(shù)據(jù)結構與文件組織2、數(shù)據(jù)結構的主要形式在數(shù)據(jù)處理過程中常用的數(shù)據(jù)結構有線性表、堆棧、隊列、樹及圖等形式。(一)數(shù)據(jù)結構的概念及形式1、數(shù)據(jù)結構的概念122、數(shù)據(jù)結構的主要形式(1)線性表線性表(linearlist)是一種最基本、最簡單,也是應用最廣泛的數(shù)據(jù)結構。線性表是由n個數(shù)據(jù)元素組成的有限序列(al,a2,…,an)。至于每個元素ai的具體含義,可按不同的情況和要求賦予不同的內(nèi)涵,它可以是一個數(shù),一個符號,一串文字,也可以是其它更復雜的信息。在復雜的線性表中,一個數(shù)據(jù)元素可以由若干數(shù)據(jù)項(item)組成。通常我們將含有多個數(shù)據(jù)項的數(shù)據(jù)元素稱為記錄(record)。第一節(jié)數(shù)據(jù)處理概述

二、數(shù)據(jù)結構與文件組織2、數(shù)據(jù)結構的主要形式(1)線性表第一節(jié)數(shù)據(jù)處理概述13

表4.1學生基本狀況登記表學號姓名年齡性別班級籍貫96070201張建平20男96信息河北96070202郝曉麗19女96信息河北96070203陳玉東21男96信息天津………………2、數(shù)據(jù)結構的主要形式第一節(jié)數(shù)據(jù)處理概述

(1)線性表

例如,一個學校的學生基本情況登記表(見表4.l),也構成一個線性表,它的數(shù)據(jù)元素(或稱為記錄)由六個數(shù)據(jù)項:學號、姓名、年齡、性別、班級、籍貫組成。表4.1學生基本狀況登記表學號姓名年齡14(2)堆棧堆棧(stack)是一種特殊的線性表,其數(shù)據(jù)元素只能從表的一端進行插入和刪除。允許插入和刪除操作的一端稱為棧頂(top),不允許插入和刪除的一端稱為棧底(bottom),堆棧用來保存尚未處理而又等待處理的數(shù)據(jù)項,這些數(shù)據(jù)項的處理是依據(jù)后進先出的規(guī)則。也就是說,取出(刪除)元素順序恰好是最后進棧的元素。如食堂里的一疊盤子,如果每次只允許一個一個地往上堆,一個一個地往下取,而不允許從中間抽出或插入。2、數(shù)據(jù)結構的主要形式第一節(jié)數(shù)據(jù)處理概述

(2)堆棧2、數(shù)據(jù)結構的主要形式第一節(jié)數(shù)據(jù)處理概述15隊列也是一種特殊的線性表,它規(guī)定在表的一端進行插入,在另一端進行刪除。隊列是依照先進先出的原則。因此,通常把隊列又叫作先進先出表。簡稱為FIFO(FirstInFirstOut)表。所有需要進隊的數(shù)據(jù)項,只能從隊列的一端進入,該端稱為隊列的首部(front),而從另一端刪除,該端稱為隊列的尾部(rear)。隊列是一個兩端均打開的向量,它限制數(shù)據(jù)項從隊列的一端移到另一端,保證處理的次序與原來的次序一致。2、數(shù)據(jù)結構的主要形式第一節(jié)數(shù)據(jù)處理概述

(3)隊列隊列也是一種特殊的線性表,它規(guī)定在表的一端進行插入,16樹(tree)就是一種重要的非線性數(shù)據(jù)結構,它是以分支關系定義的層次結構。它可以遞歸地定義:樹是一個有n(n≥1)個節(jié)點的有限集合,并滿足:有一個特殊的節(jié)點稱為根節(jié)點(root)。除根節(jié)點之外的其余結點可分為m(m≥0)個互不相交的有限集合t1,t2,…,tm,其中每一個集合本身又是一棵樹。并且稱為根的子樹(subtree)。

2、數(shù)據(jù)結構的主要形式第一節(jié)數(shù)據(jù)處理概述

(4)樹樹(tree)就是一種重要的非線性數(shù)據(jù)結構,它是以分17圖是比樹更復雜的一種非線性數(shù)據(jù)結構。圖中節(jié)點之間的聯(lián)系是任意的,任何一個節(jié)點都可以與其它節(jié)點相連接,呈現(xiàn)出一種網(wǎng)狀形式。嚴格地講,一個圖G是由兩個集合V和E組成,V是有限的非空頂點式稱節(jié)點集,E是邊的有限集,并分別用V(G)和E(G)表示圖中的頂點集和邊集,G=(V、E)表示圖。樹中至少有一個根節(jié)點,每一個節(jié)點,相對于根有一個層次,規(guī)定根為節(jié)0層,其它節(jié)點根據(jù)所處的位置依次為第1層,第2層……。樹中的最大層次加1稱為樹的高度或稱深度。一個節(jié)點子樹的個樹稱為該節(jié)點的度(degree)。度為零的節(jié)點稱為終端節(jié)點。2、數(shù)據(jù)結構的主要形式第一節(jié)數(shù)據(jù)處理概述

(4)樹(5)圖圖是比樹更復雜的一種非線性數(shù)據(jù)結構。圖中節(jié)點之間的聯(lián)18計算機處理用的文件具有特定的含義。文件(file)是由性質(zhì)相同的記錄組成的集合。根據(jù)所記錄的內(nèi)容,文件大致可分為兩類:程序文件與數(shù)據(jù)文件。(二)文件組織第一節(jié)數(shù)據(jù)處理概述

二、數(shù)據(jù)結構與文件組織1.文件及文件組織的含義程序文件是把程序作為庫加以管理的文件,它包含各種高級語言程序、進行各種數(shù)據(jù)處理的實用程序以及用戶應用程序文件;而用戶在程序中定義、處理的文件均為數(shù)據(jù)文件。計算機處理用的文件具有特定的含義。文件(file)是由19文件的組織和其它類型的數(shù)據(jù)組織一樣,主要是研究它的邏輯結構和物理結構。文件的邏輯結構是指呈現(xiàn)在用戶面前的數(shù)據(jù)組織形式,是用戶對數(shù)據(jù)的表示和存取的方式。文件的物理結構是指數(shù)據(jù)在外存上的存儲方式,是數(shù)據(jù)的物理表示和組織。文件的邏輯結構主要著眼于用戶的使用方便;文件的物理結構則應考慮存儲空間的利用率和減少存取記錄的時間。第一節(jié)數(shù)據(jù)處理概述

二、數(shù)據(jù)結構與文件組織2.文件的組織方式根據(jù)外存介質(zhì)類型以及記錄的訪問形式的不同,文件可以有各種各樣的組織方式,這里主要介紹順序文件,索引文件和直接存取文件。1.文件及文件組織的含義文件的組織和其它類型的數(shù)據(jù)組織一樣,主要是研20(l)順序文件順序文件是按記錄的序號或記錄的相對位置來進行存取的文件組織形式。順序文件是物理結構最簡單的文件。在這種結構中,記錄是按進入的次序順序存放在存儲器上,邏輯結構和物理結構一致。若相繼的兩個記錄在存儲介質(zhì)上的存儲位置相鄰,則又稱為連續(xù)文件;若物理記錄之間的次序由指針相鏈表示,則稱為串鏈文件。對順序文件如果要求記錄對關鍵字有序,則記錄進入應按關鍵字進行排列。例如,如果班級學生文件的關鍵字是學生的學號,按照記錄的順序,學號為35012的記錄將放在學號為35013的前面。第一節(jié)數(shù)據(jù)處理概述

二、數(shù)據(jù)結構與文件組織2.文件的組織方式(l)順序文件第一節(jié)數(shù)據(jù)處理概述二、數(shù)據(jù)結構與文件組織21(2)索引文件在索引文件組織中,決定存儲單元地址的操作與記錄的存取是分開的。

對于按關鍵字存取的文件結構,若用關鍵字直接對文件進行查找,不論是順序查找還是折半查找,都因大量記錄的輸入、輸出使查找速度很慢。為此,可以建立一個表,用來指示關鍵字值與相應建立的存儲地址之間的對應關系,如圖4.1所示。圖4.1記錄與存儲地址的關系第一節(jié)數(shù)據(jù)處理概述

2.文件的組織方式(2)索引文件圖4.1記錄與存儲地址的關系第一節(jié)數(shù)22利用這個圖可以減少查找時間,提高處理速度。圖中Ki為關鍵字值;RKi表示關鍵字值為Ki的記錄;A(RKi)為記錄RK的存儲地址。這個圖中的表叫做索引,其中的<Ki,A(RKi)>則稱為索引項。具有索引項的文件稱為索引文件,它是由索引和文件本身兩部分組成的。相應的,索引文件的存儲分為兩個區(qū):索引區(qū)和記錄區(qū)。(2)索引文件第一節(jié)數(shù)據(jù)處理概述

2.文件的組織方式利用這個圖可以減少查找時間,提高處理速度。圖中23(3)直接存取文件直接存取文件是指用哈希法進行組織的文件。對于磁盤來說,記錄通常是成組存放的,每一個存儲單位存放若干個記錄,這種存儲單位叫做桶(bucket)。按桶尋址,一次I/O操作可以把一個桶的全部記錄讀入到內(nèi)存緩沖區(qū),或者從內(nèi)存寫入外存。通常,一個桶可以存放M個記錄,一個文件空間分為n個桶,編號為0,1,2,…,n-1。哈希函數(shù)H(K)是把關鍵字值轉(zhuǎn)換成桶地址。直接存取文件比索引、順序文件更簡單,它的特點是:文件隨機存放;記錄未排序;不能按關鍵字值讀出;插人數(shù)據(jù)方便;存取速度快;節(jié)省空間;不占用索引區(qū)。第一節(jié)數(shù)據(jù)處理概述

2.文件的組織方式(3)直接存取文件第一節(jié)數(shù)據(jù)處理概述2.文件的組織方24第二節(jié)數(shù)據(jù)庫技術一、數(shù)據(jù)庫基本概念數(shù)據(jù)庫:是指被計算機存儲起來的數(shù)據(jù)及數(shù)據(jù)間邏輯關系的集合。換句話說,數(shù)據(jù)庫是通過文件而組織起來的,具有最小冗余度、獨立性、共享性和統(tǒng)一管理等特點的數(shù)據(jù)集合。數(shù)據(jù)庫管理系統(tǒng):是一個以統(tǒng)一的方式管理、維護數(shù)據(jù)庫中的數(shù)據(jù)的一系列軟件的集合。數(shù)據(jù)庫系統(tǒng):是指在計算機系統(tǒng)中引進數(shù)據(jù)庫后的系統(tǒng)構成。一般由數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、計算機軟件、硬件以及系統(tǒng)人員和用戶等組成。第二節(jié)數(shù)據(jù)庫技術一、數(shù)據(jù)庫基本概念數(shù)據(jù)庫:是指251.幾個常用的術語數(shù)據(jù)模型體現(xiàn)了數(shù)據(jù)的組織形式及數(shù)據(jù)之間的聯(lián)系,是實現(xiàn)現(xiàn)實世界的事物如何轉(zhuǎn)變?yōu)樾畔⑹澜绲膶嶓w和屬性,再轉(zhuǎn)變成計算機世界的記錄和數(shù)據(jù)項的關鍵。第二節(jié)數(shù)據(jù)庫技術二、數(shù)據(jù)模型現(xiàn)實世界中客觀存在并可相互區(qū)別的“事物”被稱之為實體。實體可以指人,也可以指物,可以指實際的東西(如汽車、書),也可以指抽象和概念性的東西(如一次借書,一種感情),還可以指“事物”與“事物”之間的聯(lián)系(如訂貨)。在數(shù)據(jù)庫組織中,指客觀存在的與某一應用有關的事物。(l)實體(entity)1.幾個常用的術語數(shù)據(jù)模型體現(xiàn)了數(shù)據(jù)的組織形26(2)屬性(attribute)實體具有的某種(或若干種)特性或特征被稱之為屬性。例如人的“姓名”、“年齡”、“性別”,產(chǎn)品的“顏色”、“重量”、“單價”等,這些都表示了“人”、“產(chǎn)品”這兩個實體的固有特征。屬性是對實體特征的抽象描述,屬性的具體取值稱為屬性值,例如:“王芳,21,女”這些值均為屬性值。1.幾個常用的術語第二節(jié)數(shù)據(jù)庫技術(3)實體集(entityset)同一類型的實體集合被稱為實體集,即具有同一類屬性的客觀存在的事物集合。例如所有的人是一個實體集,所有的中國人也是一個實體集,所有活著的人也是一個實體集,只不過范圍有大有小,區(qū)分的特征有多有少而已。(2)屬性(attribute)1.幾個常用的術語第二節(jié)27(4)域(domain)域是屬性的取值范圍,是由屬性值構成的集合。即同一實體集中各實體同一屬性具有的值在一定范疇之內(nèi),這—范疇稱為該屬性的值域,簡稱為域。一個屬性的值域可以是整數(shù)、實數(shù)、字符串等,如“人”這個實體集的姓名屬性的值域是字符串,“高度”的值域是實數(shù),“年齡”的值域是整數(shù),“性別’的值域為(男、女)。通常屬性是個變量,屬性值是變量所取的值,而域是變量取值的集合。(5)聯(lián)系(relationship)聯(lián)系一般指實體相互之間關系的抽象表示,亦即現(xiàn)實世界中事物之間的語義關系。例如“系”屬于“學?!?,“教師”與“學生”屬于“系”,“廠長”領導“工人”,“工人”生產(chǎn)“產(chǎn)品”,“產(chǎn)品”使用“材料”等。1.幾個常用的術語第二節(jié)數(shù)據(jù)庫技術(4)域(domain)(5)聯(lián)系(relationship282.實體聯(lián)系模型(entityrelationshipmodel)兩個實體集之間的聯(lián)系可分為三類,如圖4.2所示。圖4.2二元關系模型第二節(jié)數(shù)據(jù)庫技術二、數(shù)據(jù)模型2.實體聯(lián)系模型(entityrelationship29(1)一對一聯(lián)系(one—to—one)一對一的聯(lián)系是指對于實體集A中的每一實體,實體集B中至多有一個實體與之有聯(lián)系,反之亦然,則實體集A與實體集B具有一對一的聯(lián)系。例如醫(yī)院中的住院病人與病床的聯(lián)系就是一對一的,即一個病人只占一張病床,而一張病床也只被一個病人占用。(2)一對多聯(lián)系(one—to—many)一對多的聯(lián)系是指對于實體集A中的每一實體,實體集B中有n個實體(n≥0)與之有聯(lián)系;反之,實體集B中每一個實體,實體A中最多只有一個實體與之有聯(lián)系,則稱實體集A與實體集B有一對多的聯(lián)系。例如醫(yī)院中的病房與住院的病人的聯(lián)系就是一對多的,即一間病房可以有多個病人,但每個病人只住一個病房。2.實體聯(lián)系模型(entityrelationshipmodel)第二節(jié)數(shù)據(jù)庫技術(1)一對一聯(lián)系(one—to—one)(2)一對多聯(lián)30(3)多對多聯(lián)系(many—to—many)多對多聯(lián)系是指對于實體集A中的每一個實體,實體集B中有n個實體(n≥0)與之有聯(lián)系;反之,實體集B中的每一個實體,實體集A中有m個實體(m≥0)與之有關系,則稱實體集A與實體集B有多對多的聯(lián)系。例如工人與技能之間的關系就是多對多的關系,即一個工人可以有多種技能,一種技能也可為多個工人所掌握。3.數(shù)據(jù)庫的數(shù)據(jù)模型數(shù)據(jù)模型是對客觀事物及其聯(lián)系的數(shù)據(jù)描述,是實體聯(lián)系模型數(shù)據(jù)化。2.實體聯(lián)系模型(entityrelationshipmodel)第二節(jié)數(shù)據(jù)庫技術(3)多對多聯(lián)系(many—to—many)3.數(shù)據(jù)庫31(l)層次模型(HierarchicalModel)層次模型是層次式數(shù)據(jù)庫所采用的數(shù)據(jù)模型,它是以樹結構作為基本結構,通過樹結構及樹結構之間的邏輯關系來表示數(shù)據(jù)間聯(lián)系的一種模型,它反映了現(xiàn)實世界中實體之間的一對多的關系。層次式數(shù)據(jù)模型的優(yōu)點是層次清楚,結點間的聯(lián)系簡單。缺點是處理個別記錄效率低,數(shù)據(jù)庫文件的維護麻煩。(2)網(wǎng)狀模型(NetworkModel)網(wǎng)狀模型又叫網(wǎng)絡模型,它反映了現(xiàn)實世界中實體間存在的較為復雜的聯(lián)系。在網(wǎng)狀結構中,任何一個已知實體可以有任意個上屬記錄和下屬記錄。網(wǎng)狀結構克服了層次結構中的許多固有缺陷,但網(wǎng)狀結構太復雜,數(shù)據(jù)處理快又繁雜,而且適合于某一網(wǎng)狀結構的處理方法往往不適合于別的網(wǎng)狀結構。3.數(shù)據(jù)庫的數(shù)據(jù)模型第二節(jié)數(shù)據(jù)庫技術(l)層次模型(HierarchicalModel)(2)32(3)關系模型(RelationalModel)關系模型是采用二維表格式的數(shù)據(jù)模型,在一張二維表中,一個豎列反映實體的某一屬性,我們稱之為字段。表中的一行形成一個實體,我們稱之為記錄,它由各個數(shù)據(jù)項(字段值)所組成,反映了某一實體的所有有關特性。由許多行、許多列組成的二維表可以用來反映同類實體(或?qū)嶓w集)的所有有關的信息,稱為數(shù)據(jù)庫文件。關系式數(shù)據(jù)模型是一種數(shù)學化的模型。關系式數(shù)據(jù)結構具有堅實的數(shù)學理論基礎,簡單、明了、直觀、容易理解和掌握,在現(xiàn)實生活中應用最多,因此關系式數(shù)據(jù)庫得到了非常廣泛的應用。而且,由于層次式和網(wǎng)狀式數(shù)據(jù)結構都可以通過一定方法轉(zhuǎn)化為關系式數(shù)據(jù)模型來處理。因此,關系式數(shù)據(jù)庫被認為是今后數(shù)據(jù)庫的發(fā)展方向。3.數(shù)據(jù)庫的數(shù)據(jù)模型第二節(jié)數(shù)據(jù)庫技術(3)關系模型(RelationalModel)3.數(shù)33目前數(shù)據(jù)庫的系統(tǒng)結構基本上采用的是三級結構模式,即對應于全局邏輯級的模式,對應于用戶級分模式和對應于物理存儲級的存儲模式。如圖4.3所示。圖4.3數(shù)據(jù)庫系統(tǒng)結構示意圖第二節(jié)數(shù)據(jù)庫技術三、數(shù)據(jù)庫的系統(tǒng)結構目前數(shù)據(jù)庫的系統(tǒng)結構基本上采用的是三級結構模式34數(shù)據(jù)庫管理系統(tǒng)(DataBaseManagementSystem,DBM)是對數(shù)據(jù)進行管理的軟件系統(tǒng),是為數(shù)據(jù)庫建立、使用和維護而配置的。數(shù)據(jù)庫管理系統(tǒng)的主要目的是使數(shù)據(jù)作為一種可管理的資源,從而使數(shù)據(jù)易于為各種用戶所共享,增進數(shù)據(jù)的安全性、完整性和可用性,提高數(shù)據(jù)的獨立性。(1)數(shù)據(jù)定義語言數(shù)據(jù)定義語言用以定義數(shù)據(jù)庫的各級數(shù)據(jù)結構及它們之間的映象,還包括各種完整性約束和安全性措施。依描述的對象不同,它可分為模式數(shù)據(jù)描述語言、子模式數(shù)據(jù)描述語言和物理數(shù)據(jù)描述語言。1.數(shù)據(jù)庫管理系統(tǒng)的組成數(shù)據(jù)庫管理系統(tǒng)由下列三類軟件組成:第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)(DataBaseManageme35(2)數(shù)據(jù)操縱語言數(shù)據(jù)操縱語言為用戶或應用程序訪問數(shù)據(jù)庫提供接口,它因數(shù)據(jù)庫系統(tǒng)而異。但一般可分為獨立式查詢語言和嵌入式查詢語言兩大類。獨立式查詢語言可以獨立使用,交互地對數(shù)據(jù)庫進行操縱。它的特點是命令簡單,使用方便;便于非程序員用戶使用;但功能有限,需要專門的編譯程序。嵌入式查詢語言,不獨立使用,而是嵌入到某種高級語言中使用。第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)1.數(shù)據(jù)庫管理系統(tǒng)的組成(2)數(shù)據(jù)操縱語言第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)1.36(3)數(shù)據(jù)庫運行控制系統(tǒng)數(shù)據(jù)庫運行控制系統(tǒng)是數(shù)據(jù)管理系統(tǒng)的核心,它包含各種例行程序。主要有:第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)1.數(shù)據(jù)庫管理系統(tǒng)的組成①存儲控制例行程序,支持各種環(huán)境下由數(shù)據(jù)庫管理系統(tǒng)或用戶提出的對數(shù)據(jù)的存取請求;②安全性控制例行程序,用于授權機制的管理控制;③完整性控制例行系統(tǒng),用于各種完整性校驗與控制;④事務管理例行程序,用于事務完整性控制與并發(fā)控制。此外還有恢復例行程序、監(jiān)控例行程序、系統(tǒng)總控例行程序和通信控制例行程序等。(3)數(shù)據(jù)庫運行控制系統(tǒng)第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)372.數(shù)據(jù)庫管理系統(tǒng)的工作方式數(shù)據(jù)庫管理系統(tǒng)的工作方式有以下幾種:(1)終端用戶工作方式在這種方式下,用戶使用鍵盤輸入某一帶有參數(shù)的命令,向數(shù)據(jù)庫存取數(shù)據(jù)。用發(fā)出的命令經(jīng)過遠程處理后,由數(shù)據(jù)庫管理系統(tǒng)作進一步加工并給出命令執(zhí)行結果。這種工作方式一般稱為單命令工作方式或問答式工作方式。(2)批處理工作方式批處理工作方式也稱為程序方式,用戶應用數(shù)據(jù)庫操縱語言編出完整的程序后運行,機器根據(jù)應用程序的指示完成所需的一系列工作。第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)2.數(shù)據(jù)庫管理系統(tǒng)的工作方式數(shù)據(jù)庫管理系統(tǒng)的工作方式有以下38(3)在線用戶工作方式在線用戶工作方式也稱為聯(lián)機用戶工作方式,也是用數(shù)據(jù)操縱語言工作的,這一點和批處理工作方式一樣。但因為其程序是通過鍵盤輸入,也要經(jīng)過遠程處理程序,這一點又和終端用戶工作方式相似。2.數(shù)據(jù)庫管理系統(tǒng)的工作方式第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)3.關系數(shù)據(jù)庫的特點(1)簡單、靈活易用。由于它對實體集及實體集間的聯(lián)系均采用關系來描述,對各種用戶(最終用戶、程序員、DBA等)提供統(tǒng)一的單一數(shù)據(jù)結構形式,使用戶很容易掌握和應用這種模型和系統(tǒng)。(3)在線用戶工作方式2.數(shù)據(jù)庫管理系統(tǒng)的工作方式第二節(jié)39(2)關系數(shù)據(jù)語言具有較好的非過程化特性,從而面向非專業(yè)用戶,同時應用系統(tǒng)的開發(fā)效率也大大提高。第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)3.關系數(shù)據(jù)庫的特點(3)有更高的數(shù)據(jù)獨立性。邏輯數(shù)據(jù)庫結構及其操作完全獨立于數(shù)據(jù)的物理存儲方式,應用程序不必關心其物理存儲細節(jié),不受存儲結構變化的影響,因而與層次、網(wǎng)絡系統(tǒng)相比有更好的獨立性。(4)易于實現(xiàn)對數(shù)據(jù)庫的重組和控制,簡化了DBA的工作。(2)關系數(shù)據(jù)語言具有較好的非過程化特性,從而面向非專業(yè)用戶40(5)易于實現(xiàn)各種不可預計的隨機查詢,從而對管理決策活動中數(shù)據(jù)庫應用提供較好的支持。第二節(jié)數(shù)據(jù)庫技術四、數(shù)據(jù)庫管理系統(tǒng)3.關系數(shù)據(jù)庫的特點(6)理論基礎好,數(shù)據(jù)庫的研究更加科學化,尤其是關系操作的完備性,規(guī)范化及查詢優(yōu)化等方法,為數(shù)據(jù)庫技術的成熟奠定了很好的基礎。(7)易于向推理系統(tǒng)和知識庫系統(tǒng)擴展和綜合。關系數(shù)據(jù)語言與一階謂詞邏輯間具有固有的內(nèi)在聯(lián)系,從而為以關系數(shù)據(jù)庫為基礎的推理系統(tǒng)和知識庫的研究提供了方便。(5)易于實現(xiàn)各種不可預計的隨機查詢,從而對管理決策活動中數(shù)41在關系型數(shù)據(jù)庫中,用范式(NormalFormat,NF)來衡量數(shù)據(jù)庫規(guī)范的層次,要想設計一個好的關系,必須使關系滿足一定的約束條件。此約束已形成了范式,分成幾個等級,一級比一級要求嚴格。根據(jù)關系模式滿足的不同性質(zhì)和規(guī)范化的程度,把關系模式分為1NF、2NF、3NF、BCNF、4NF、5NF。

一個較低范式的關系,可以通過關系的無損分解轉(zhuǎn)換為若干個較高級的范式關系的集合,這一過程稱為關系的規(guī)范化。第三節(jié)關系規(guī)范化在關系型數(shù)據(jù)庫中,用范式(NormalFo421、1NF定義:如果關系R的所有屬性都是不可再分的數(shù)據(jù)項,則稱該關系屬于第一范式,記為:R∈1NF。1NF的關系是從關系的基本性質(zhì)而來的,任何關系必須遵守。第三節(jié)關系規(guī)范化1、1NF第三節(jié)關系規(guī)范化43表1.關系W的樣值示意日期

工號

姓名

工種

定額

超額

車間

車間

主任90.5

101

李一

車工

80

22%

金工

李明

90.5

102

張二

車工

80

17%

金工

李明

90.5

103

王三

鉗工

75

14%

工具

趙杰

90.5

104

李四

銑工

70

20%

金工

李明

90.6101

李一

車工

80

19%

金工

李明

90.6102

張二

車工

80

25%

金工

李明

90.6103

王三

鉗工

75

16%

工具

趙杰

90.6104

李四

銑工

70

26%

金工

李明

表1.關系W的樣值示意日期工號姓名工種定額超額車44W(日期,工號,姓名,工種,定額,超額,車間,車間主任)從表1中,不難發(fā)現(xiàn)其中存在以下毛病:①數(shù)據(jù)冗余大②修改麻煩③插入異常④刪除異常W(日期,工號,姓名,工種,定額,超額,車間,車45W(日期,工號,姓名,工種,定額,超額,車間,車間主任)第三節(jié)關系規(guī)范化原因:w關系不夠規(guī)范,即對w的限制太少,造成其中存放的信息太雜亂。W關系中屬性間存在著完全依賴、部分依賴、傳遞依賴三種不同的依賴情況。W(日期,工號,姓名,工種,定額,超額,車間,車462、2NF定義:如果關系R∈1NF,且它的每一非主屬性都完全依賴于主鍵,則稱R屬于第二范式,記為:R∈2NF。

第三節(jié)關系規(guī)范化2、2NF第三節(jié)關系規(guī)范化47W(日期,工號,姓名,工種,定額,超額,車間,車間主任)W1+W2W分解其中:w1(日期,工號,超額)w2(工號,姓名,工種,定額,車間,車間主任)

第三節(jié)關系規(guī)范化W(日期,工號,姓名,工種,定額,超額,車間,車48對應w關系的w1和w2關系樣值日期

工號

超額

90.5

101

22%

90.5

102

17%

90.5

103

14%

90.5

104

20%

90.6101

19%

90.6102

25%

90.6103

16%

90.6104

26%

工號

姓名

工種

定額

車間

車間主任101

李一

車工

80

金工

李明

102

張二

車工

80

金工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論