1地理空間數(shù)據(jù)與GIS_第1頁
1地理空間數(shù)據(jù)與GIS_第2頁
1地理空間數(shù)據(jù)與GIS_第3頁
1地理空間數(shù)據(jù)與GIS_第4頁
1地理空間數(shù)據(jù)與GIS_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第一章地理空間數(shù)據(jù)分析與GIS2023/2/11

GIS中存貯了海量數(shù)據(jù),迫切需要高效、精確、科學(xué)地分析,找出數(shù)據(jù)所蘊涵的意義,進而了解事物的性質(zhì)與規(guī)律,為科學(xué)決策提供必需的信息。(對數(shù)據(jù)“點石成金”

)因此,GIS領(lǐng)域由原來重點關(guān)注數(shù)據(jù)庫創(chuàng)建和系統(tǒng)開發(fā)建設(shè),逐漸轉(zhuǎn)向重點關(guān)注空間分析和空間建模。

2023/2/12GIS的奠基人之一M.F.Goodchild曾指出:“地理信息系統(tǒng)真正的功能在于它利用空間分析技術(shù),對空間數(shù)據(jù)的分析”。

空間分析使GIS超越一般空間數(shù)據(jù)庫、信息系統(tǒng)和地圖制圖系統(tǒng),能挖掘出對科學(xué)決策具有指導(dǎo)意義的信息,從而解決復(fù)雜的地學(xué)應(yīng)用問題,進行地學(xué)綜合研究的技術(shù)系統(tǒng)。2023/2/13

目前多數(shù)GIS的應(yīng)用還局限于數(shù)據(jù)庫型GIS層面上,沒有充分利用和開發(fā)GIS的空間分析功能。因此,建立完善的空間數(shù)據(jù)分析理論和方法體系,集成先進的空間數(shù)據(jù)分析工具,增強GIS的空間分析能力,使數(shù)據(jù)庫型GIS上升為分析型GIS,是GIS技術(shù)與應(yīng)用的發(fā)展目標(biāo)和趨勢。2023/2/141.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS2023/2/15第一節(jié):簡要回顧20世紀(jì)50年代以來地理空間數(shù)據(jù)處理與建模領(lǐng)域重要的技術(shù)方法--數(shù)量地理學(xué)、地理信息系統(tǒng)和地理計算;第二節(jié):論述數(shù)據(jù)分析領(lǐng)域中迅速發(fā)展的新技術(shù)——數(shù)據(jù)挖掘;第三節(jié):討論GIS環(huán)境下空間分析的基本框架。2023/2/161.1地理空間數(shù)據(jù)處理與建模

地理空間數(shù)據(jù)分析:

是地理學(xué)和地理信息科學(xué)領(lǐng)域的重要研究內(nèi)容。通過研究地理空間數(shù)據(jù)及其相應(yīng)分析理論、方法和技術(shù),探索、證明地理要素之間的關(guān)系,揭示地理特征和過程的內(nèi)在規(guī)律和機理,實現(xiàn)對地理空間信息的認(rèn)知、解釋、預(yù)測和調(diào)控。2023/2/171.1地理空間數(shù)據(jù)處理與建模地理空間數(shù)據(jù)分析的發(fā)展:從對地理現(xiàn)象及其空間關(guān)系的文字記載,到利用數(shù)學(xué)概念和方法進行解釋性描述;從傳統(tǒng)統(tǒng)計學(xué)方法和數(shù)學(xué)模型對地理現(xiàn)象和過程的模擬,到基于地理信息系統(tǒng)的多維地理空間數(shù)據(jù)表達、管理、地理過程的動態(tài)模擬、可視化分析和決策支持;

從空間數(shù)據(jù)挖掘技術(shù)到高性能計算技術(shù)支撐下的地理計算方法。數(shù)量地理學(xué)

地理信息系統(tǒng)地理計算2023/2/181.1地理空間數(shù)據(jù)處理與建模1.1.1數(shù)量地理學(xué)1.1.2地理信息系統(tǒng)1.1.3地理計算2023/2/191.1.1數(shù)量地理學(xué)

數(shù)量地理學(xué)(QuantitativeGeography)又稱計量地理學(xué)或地理數(shù)量方法,是應(yīng)用數(shù)學(xué)思想方法和計算機技術(shù)進行地理學(xué)研究的科學(xué)。

數(shù)量地理學(xué)是地理學(xué)領(lǐng)域中最先(上世紀(jì)50年代)采用數(shù)學(xué)原理方法來探討地理數(shù)據(jù)分析處理與建模的學(xué)科2023/2/1101.1.1數(shù)量地理學(xué)數(shù)量地理學(xué)的產(chǎn)生與發(fā)展數(shù)量地理學(xué)與傳統(tǒng)地理學(xué)的比較數(shù)量地理學(xué)中地理數(shù)據(jù)分析模擬方法2023/2/111數(shù)量地理學(xué)的發(fā)展階段

數(shù)量地理學(xué)發(fā)展初期階段數(shù)量地理學(xué)發(fā)展中期階段數(shù)量地理學(xué)日趨成熟階段20世紀(jì)50年代末至60年代末20世紀(jì)60年代末至70年代20世紀(jì)70年代末至今把統(tǒng)計學(xué)方法引入地理學(xué)研究在地理學(xué)研究中應(yīng)用多元統(tǒng)計方法和計算機技術(shù)

地理學(xué)與運籌學(xué)、模糊數(shù)學(xué)、系統(tǒng)科學(xué)、GIS技術(shù)等結(jié)合2023/2/112數(shù)量地理學(xué)與傳統(tǒng)地理學(xué)的比較

數(shù)學(xué)方法是人們進行數(shù)字運算和求解的工具,能以嚴(yán)密的邏輯和簡潔的形式描述復(fù)雜的問題,表達極為豐富的實質(zhì)性思想。對于現(xiàn)代地理學(xué)而言,數(shù)學(xué)方法不僅是應(yīng)用地理學(xué)研究中進行預(yù)測、決策、規(guī)劃及優(yōu)化設(shè)計的工具,也是理論地理學(xué)研究中進行邏輯推理和理論演繹的手段。2023/2/113數(shù)量地理學(xué)與傳統(tǒng)地理學(xué)研究方法比較

傳統(tǒng)地理學(xué)方法數(shù)量地理學(xué)方法實地考察收集資料根據(jù)已有的概念體系條理化比較歸納、概括地理解釋建立理論與法則觀察實踐先期模式資料篩選建立理論與法則反復(fù)檢驗成功建立模型提出假設(shè)失敗

傳統(tǒng)地理學(xué)分析方法所采用的推理方式以經(jīng)驗歸納型綜合為主,以觀察材料和事實為基礎(chǔ),由直接的類推得出現(xiàn)實世界的結(jié)論,這一方法難以回避特殊情況或解釋者的主觀好惡問題。數(shù)量地理學(xué)以理論演繹為主,整個研究過程經(jīng)歷了提出假設(shè)、建立模式、檢驗假設(shè)和建立理論四個步驟,符合感性-理性-實踐這一認(rèn)識的過程規(guī)律。2023/2/114地理系統(tǒng)分析123隨機數(shù)學(xué)方法地理系統(tǒng)數(shù)學(xué)模擬數(shù)量地理學(xué)中地理數(shù)據(jù)分析模擬方法

2023/2/115

地理系統(tǒng)分析:指揚棄地理事物繁瑣的枝節(jié),抽象出地理事物在結(jié)構(gòu)與功能上的主線,揭示地理事物動態(tài)演變的方向與強度,預(yù)測其狀態(tài)變化和穩(wěn)定性程度,將復(fù)雜、高級的地理系統(tǒng)簡化為次一級簡單的系統(tǒng),進而探討地理要素之間的數(shù)量關(guān)系。

步驟:(1)列出所研究等級系統(tǒng)的要素清單;(2)根據(jù)地理系統(tǒng)的實際繪出各要素的聯(lián)系框圖;(3)再以定量方法研究系統(tǒng)要素之間的關(guān)系。地理系統(tǒng)分析2023/2/116隨機數(shù)學(xué)方法

地理系統(tǒng)輸入與輸出之間一般具有隨機性,數(shù)量地理學(xué)研究方法中隨機數(shù)學(xué)占很大比重。

(1)地理系統(tǒng)是多級、多元系統(tǒng),在進行系統(tǒng)分析時,分析一組或幾組地理要素之間的關(guān)系經(jīng)常應(yīng)用多元統(tǒng)計分析方法(多元線性回歸、逐步回歸、主成分分析、因子分析等);(2)地理系統(tǒng)是具有空間范圍和地域界線的系統(tǒng),確定界線、進行地理區(qū)域的劃分等(二級判別分析、多級判別、逐步判別等數(shù)學(xué)分類技術(shù));(3)在探討地理系統(tǒng)結(jié)構(gòu)、類型組合、空間關(guān)系時,常運用系統(tǒng)聚類分析方法;(4)分析地理系統(tǒng)的空間特性時,常用趨勢面分析方法;(5)地理系統(tǒng)研究中十分重視系統(tǒng)目標(biāo)、系統(tǒng)結(jié)構(gòu)的研究,以使地理系統(tǒng)達到符合一定目標(biāo)的最佳狀態(tài),常用運籌學(xué)方法;(6)模擬地理系統(tǒng)狀態(tài)的轉(zhuǎn)移規(guī)律時還包括馬爾柯夫鏈、多元線性方程組、微分方程的應(yīng)用等。2023/2/117

地理系統(tǒng)的數(shù)學(xué)模擬(簡稱地理模型):

建立地理系統(tǒng)數(shù)學(xué)模型的過程。

地理系統(tǒng)數(shù)學(xué)模擬的一般過程:(1)從實際的地理系統(tǒng)或其要素出發(fā),對空間狀態(tài)、空間成分、空間相互作用進行分析,建立地理系統(tǒng)或要素的數(shù)學(xué)模型。(2)經(jīng)驗檢查,若與實際情況不符,則要重新分析,修改模型;若大致相符,則選擇計算方法,進行程序設(shè)計、程序調(diào)試和上機運算,從而輸出模型解。(3)分析模型解,若模型解出錯,則修改模型;若模型解正確,則對成果進行地理解釋,提出切實可行的方案。

可見,地理系統(tǒng)數(shù)學(xué)模擬過程是反復(fù)修改數(shù)學(xué)模型、調(diào)試和修改程序的過程。地理系統(tǒng)數(shù)學(xué)模擬2023/2/1181.1.2地理信息系統(tǒng)

英國著名地理學(xué)家R.J.Johnston在1995年曾指出“計量革命的直接成果是導(dǎo)致了GIS革命的到來”。

GIS起源于20世紀(jì)60年代,是對地理空間數(shù)據(jù)進行采集、存儲、表達、更新、檢索、管理、綜合分析與輸出的計算機應(yīng)用技術(shù)系統(tǒng)。

GIS是以應(yīng)用為導(dǎo)向的空間信息技術(shù),強調(diào)空間實體及其關(guān)系,注重空間分析與模擬,是重要的地理空間數(shù)據(jù)管理和分析工具。2023/2/119GIS是客觀現(xiàn)實世界抽象化的數(shù)字模型GIS是地理空間數(shù)據(jù)管理、顯示與制圖的集成工具GIS是地理空間數(shù)據(jù)分析模擬與可視化的技術(shù)平臺2023/2/120

客觀現(xiàn)實世界極其復(fù)雜,運用各種數(shù)據(jù)采集手段和量測工具,如野外調(diào)查、遙感技術(shù)等,獲取有關(guān)客觀世界的數(shù)據(jù),把各種來源和類型的地理空間數(shù)據(jù)數(shù)字化,輸入計算機,按一定的規(guī)則組織管理,構(gòu)建客觀現(xiàn)實世界的抽象化數(shù)字模型,即GIS。2023/2/121空間數(shù)據(jù)管理GIS空間數(shù)據(jù)獲取空間數(shù)據(jù)輸入基于數(shù)學(xué)法則客觀世界數(shù)據(jù)數(shù)據(jù)庫客觀世界的抽象化過程2023/2/1221.1.3地理計算

隨著計算機技術(shù)、數(shù)學(xué)方法的不斷進步,空間數(shù)據(jù)分析處理方法論也隨之革新,20世紀(jì)90年代,一門融合了計算機科學(xué)、地理學(xué)、地球信息科學(xué)(Geomatics)、信息科學(xué)、數(shù)學(xué)和統(tǒng)計學(xué)理論與方法的地理計算(GeoComputation)開始形成并逐漸發(fā)展起來,數(shù)量地理學(xué)進入全新的計算地理學(xué)(GeocomputationalGeography)時代,地理空間數(shù)據(jù)分析與建模有了一個新的技術(shù)平臺。2023/2/1231.1.3地理計算1.地理計算的概念與內(nèi)涵2.地理計算模型與方法2023/2/1241.地理計算的概念與內(nèi)涵

20世紀(jì)90年代中期,英國著名地理學(xué)家,里茲大學(xué)計算地理研究中心StanOpenshaw教授認(rèn)為空間數(shù)據(jù)挖掘已成為數(shù)量地理學(xué)中一個重要分支,并以地理計算命名這個新的學(xué)科。StanOpenshaw因此被稱為“地理計算之父”。

2023/2/125地理計算的各種定義Openshaw在2000年進一步深化對于地理計算的理解,認(rèn)為:地理計算是一種高性能計算,用以解決目前不能解決的、甚至未知的空間問題的科學(xué)。具有三方面特點:(1)是強調(diào)地理主題;(2)對現(xiàn)存問題承認(rèn)有新的或更好的解決辦法,且可以解決以前不能解決的問題;(3)地理計算需要獨特的思考方式,由于基于海量計算代替殘缺的知識或理論的過程,故能夠增強機器的智能。

英國里茲大學(xué)著名地理學(xué)家Rees等提議將地理計算定義為:應(yīng)用計算技術(shù)求解地理問題的理論、方法和過程。2023/2/126Gahegan在1999年發(fā)表的論文中細(xì)致地談到“…地理計算關(guān)注利用一系列方法的工具箱豐富地理模擬和分析大量高度復(fù)雜的、非確定性的問題…這是人類有意識的努力去探索地理學(xué)與計算機科學(xué)之間的關(guān)聯(lián)。這是一個真正的對于數(shù)量地理學(xué)家的技術(shù),也是計算機科學(xué)家進行計算性應(yīng)用的豐富源泉。”Conclelis(1998)采用相對簡潔的定義:地理計算是應(yīng)用數(shù)學(xué)計算方法與技術(shù)來描述空間特征、解釋地理現(xiàn)象、解決地理問題。

Openshaw和Abrahart(2000)認(rèn)為:地理計算是一門新興的交叉學(xué)科,它是在科學(xué)方法的整體范圍內(nèi)利用各種不同類型的地理數(shù)據(jù)發(fā)展相關(guān)的地理工具和模型。

2003年8月,我國亞運村地理學(xué)術(shù)沙龍談到“虛擬地理實驗室”建設(shè),認(rèn)為地理計算既不是數(shù)量地理學(xué),也不是GIS,而是智能計算在地理學(xué)中的精確應(yīng)用,是強大的高性能計算,其理論驅(qū)動是科學(xué)。

2023/2/127地理計算定義(廣義、狹義)

廣義:地理計算是以計算機方法為基本科學(xué)工具的處理地理信息和分析地理現(xiàn)象的地理學(xué)分支,它包括地理信息處理與管理、地理數(shù)據(jù)挖掘、地理過程建模模擬以及支持這些處理與分析的軟件工程和計算體系研究,如地理信息系統(tǒng)、地理決策支持系統(tǒng)和空間網(wǎng)格體系。它是地理信息科學(xué)的另一種說法,外延包括數(shù)量地理學(xué)、遙感、地理信息系統(tǒng)、建模模擬和計算體系。

狹義:地理計算是地理信息科學(xué)的核心內(nèi)容之一,主要研究地理信息科學(xué)的方法學(xué)問題,包括算法、建模和計算體系。我們主張一般情況下采用狹義定義。地理計算的內(nèi)容除了建模、算法之外,還有一般方法學(xué)問題。2023/2/1282.地理計算模型與方法

地理計算的目標(biāo):是將地理學(xué)領(lǐng)域的知識引入計算機工具,設(shè)計合適的地理數(shù)據(jù)挖掘和知識發(fā)現(xiàn)操作,研發(fā)時空尺度上的集群算法,獲得超越目前軟件、硬件能力的地理數(shù)據(jù)分析方法,用可視化和虛擬現(xiàn)實的手段實現(xiàn)地理問題的理解與交流。

計算地理學(xué)是數(shù)量地理學(xué)向深層次的拓展,強調(diào)數(shù)學(xué)模型與模擬實驗并重的理念,憑借計算機工具對地理學(xué)問題進行定量或非定量分析的抽象概括和綜合研究,解決海量、復(fù)雜數(shù)據(jù)集或數(shù)據(jù)庫分析的復(fù)雜空間問題。2023/2/129

地理計算學(xué)包含豐富的模型和方法體系,不僅采納了傳統(tǒng)的數(shù)量地理學(xué)理論與模型還涉及一系列新的理論技術(shù)方法:(1)GIS:創(chuàng)建數(shù)據(jù)庫;

(2)人工智能技術(shù)(AI)和智能計算技術(shù)(CI):提供計算原理和計算工具;

智能計算技術(shù):神經(jīng)網(wǎng)絡(luò)模型(NN)、模糊邏輯模型、遺傳算法模型(GA)、元胞自動機模型(CA)以及分形分析等

(3)高性能計算服務(wù)系統(tǒng):提供動力。

高性能計算:是利用超級計算機對大容量資料、需要進行實時分析與控制的系統(tǒng)以及那些復(fù)雜而又不能用其他手段來處理的現(xiàn)實世界所實施的計算。2023/2/1301.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS2023/2/1311.2地理空間數(shù)據(jù)挖掘產(chǎn)生背景:(1)人類正被數(shù)據(jù)淹沒(數(shù)據(jù)豐富)

◆空間科學(xué)技術(shù)的發(fā)展,獲得了大量對地觀測數(shù)據(jù)?!魯?shù)據(jù)庫技術(shù)的成熟與應(yīng)用普及,人類累積的數(shù)據(jù)量正在呈指數(shù)級增長,全世界每天存入數(shù)據(jù)數(shù)量超過萬兆字符。(2)人類饑渴信息(知識貧乏)面臨浩如煙海的數(shù)據(jù),人們呼喚從數(shù)據(jù)的汪洋大海中去蕪存精、去偽存真2023/2/1321.2地理空間數(shù)據(jù)挖掘1.2.1地理空間數(shù)據(jù)挖掘概述1.2.2地理空間數(shù)據(jù)立方體1.2.3聯(lián)機分析處理技術(shù)1.2.4地理空間數(shù)據(jù)挖掘典型方法2023/2/1331.2.1地理空間數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘(1)技術(shù)上定義:是從大量的數(shù)據(jù)中,抽取出潛在的、有價值的知識(模型、規(guī)則、規(guī)律)的過程。(2)學(xué)科定義:是一個由數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計和可視化等多學(xué)科與技術(shù)交叉、滲透、融合形成的交叉學(xué)科。數(shù)據(jù)挖掘的過程2023/2/134

數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識。

數(shù)據(jù)挖掘所得到的信息應(yīng)具有三個特征:

(1)先前未知。先前未知的信息是指該信息是預(yù)先未曾預(yù)料到的,即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值.

(2)有效。

(3)可實用。2023/2/135進化階段技術(shù)手段數(shù)據(jù)搜集(20世紀(jì)60年代)數(shù)據(jù)訪問(20世紀(jì)80年代)數(shù)據(jù)倉庫(20世紀(jì)90年代)數(shù)據(jù)挖掘(目前)

計算機、磁帶和磁盤關(guān)系數(shù)據(jù)庫、結(jié)構(gòu)化查詢語言、ODBC

聯(lián)機分析處理、多維數(shù)據(jù)庫、數(shù)據(jù)倉庫

高級算法、多處理器計算機、海量數(shù)據(jù)庫數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的進化歷程

數(shù)據(jù)倉庫包含了完整的、主題明確的、凈化的、綜合性的數(shù)據(jù),可以為數(shù)據(jù)挖掘提供新的支撐平臺。2023/2/1361.2.1地理空間數(shù)據(jù)挖掘概述

地理空間數(shù)據(jù)挖掘是數(shù)據(jù)挖掘的一個研究分支。其實質(zhì)是從地理空間數(shù)據(jù)庫中挖掘時空系統(tǒng)中潛在的、有價值的信息、規(guī)律和知識的過程,包括空間模式與特征、空間與非空間數(shù)據(jù)之間的概要關(guān)系等。由于空間數(shù)據(jù)具有海量、多維和自相關(guān)性等特征,使得地理空間數(shù)據(jù)挖掘更為復(fù)雜。

2023/2/137空間數(shù)據(jù)挖掘的原型系統(tǒng)加拿大西蒙菲莎(SimonFraser)大學(xué)計算機科學(xué)系HanJiawei教授領(lǐng)導(dǎo)的小組進行了基于關(guān)系數(shù)據(jù)庫挖掘系統(tǒng)的研究,在MapInfo平臺上開發(fā)了空間數(shù)據(jù)挖掘原型系統(tǒng)GeoMiner,并設(shè)計了專門用于空間數(shù)據(jù)挖掘的語言GMQL,實現(xiàn)了空間數(shù)據(jù)特征描述、空間比較、空間關(guān)聯(lián)、空間聚類和空間分類等空間數(shù)據(jù)分析方法的集成。GeoMiner原型系統(tǒng)圖形用戶接口各種數(shù)據(jù)挖掘模塊空間數(shù)據(jù)庫空間數(shù)據(jù)庫服務(wù)器和數(shù)據(jù)立方體空間數(shù)據(jù)庫

空間數(shù)據(jù)庫2023/2/138空間數(shù)據(jù)挖掘的基本過程2023/2/139空間聚類規(guī)則發(fā)現(xiàn)空間關(guān)聯(lián)規(guī)則發(fā)現(xiàn)空間序列模式發(fā)現(xiàn)空間預(yù)測模型發(fā)現(xiàn)空間異常值發(fā)現(xiàn)空間趨勢模型發(fā)現(xiàn)空間數(shù)據(jù)立方體圖形用戶界面空間依賴關(guān)系發(fā)現(xiàn)未來空間發(fā)現(xiàn)模塊挖掘模塊集合空間數(shù)據(jù)庫服務(wù)器空間數(shù)據(jù)庫非空間數(shù)據(jù)庫相關(guān)概念數(shù)據(jù)庫和知識庫

四個組成部分:(1)圖形用戶界面(2)挖掘模塊集合(3)空間數(shù)據(jù)庫服務(wù)器(4)數(shù)據(jù)庫和知識庫

空間數(shù)據(jù)挖掘的體系結(jié)構(gòu)2023/2/140

(1)地理空間數(shù)據(jù)立方體通過訪問地理空間數(shù)據(jù)立方體,才能進行深層次的分析,尋求有意義的信息。(2)聯(lián)機分析處理(OLAP)模塊OLAP為數(shù)據(jù)挖掘提供了一個極佳的操作平臺

(3)空間數(shù)據(jù)挖掘模塊。

進行相應(yīng)的數(shù)據(jù)挖掘

地理空間數(shù)據(jù)挖掘系統(tǒng)三大支柱模塊

2023/2/1411.2.2地理空間數(shù)據(jù)立方體人們很容易理解一個二維表,對于三立方體同樣也容易理解,但是要再加一維或任意多維,則圖形很難想象,也不容易在屏幕上畫出來。地理空間數(shù)據(jù)立方體(又稱為多維數(shù)據(jù)集)是一個面向?qū)ο蟮摹⒓傻?、以時間為變量的、持續(xù)采集空間與非空間數(shù)據(jù)的多維數(shù)據(jù)集合,組織和匯總成一個由一組維度和度量值定義的多維結(jié)構(gòu),用以支持地理空間數(shù)據(jù)挖掘技術(shù)和決策支持過程。

作用:基于空間數(shù)據(jù)立方體中的數(shù)據(jù)進行挖掘,可以利用已有的聚合信息和計算結(jié)果,有效地提供數(shù)據(jù)挖掘算法的執(zhí)行效率。2023/2/142數(shù)據(jù)立方體在邏輯上一般由一個事實數(shù)據(jù)表和多個維度表構(gòu)成一種星形構(gòu)架,其核心是事實數(shù)據(jù)表。事實數(shù)據(jù)表是數(shù)據(jù)立方體中度量值的源,維度表是數(shù)據(jù)立方體中維度的源。2023/2/143地理空間數(shù)據(jù)立方體涉及的概念

●維度是數(shù)據(jù)立方體的一種結(jié)構(gòu)特性,是描述事實數(shù)據(jù)表中數(shù)據(jù)級別的有組織的層次結(jié)構(gòu)。包括:(1)非空間維度;(2)空間-非空間維度;(3)空間-空間維度。●度量值是在數(shù)據(jù)立方體內(nèi)基于該數(shù)據(jù)立方體的事實數(shù)據(jù)表中某列的一組值,它們通常是數(shù)字。包括:數(shù)值度量、空間度量?!癯蓡T屬性是維度表的一個可選特性,為最終用戶提供成員的其他信息,僅從屬于級別。2023/2/1441.2.3聯(lián)機分析處理技術(shù)OLAP的概念:是共享多維信息的、針對特定問題的聯(lián)機數(shù)據(jù)訪問和分析的軟件技術(shù),具有匯總、合并、聚集以及從不同角度觀察消息的能力。

是一種軟件技術(shù),它使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數(shù)據(jù)的目的。這些信息是從原始數(shù)據(jù)轉(zhuǎn)換過來的,按照用戶的理解,反映了真實情況。聯(lián)機分析處理

(OLAP)的概念最早是由關(guān)系數(shù)據(jù)庫之父E.F.Codd于1993年提出的。它可以跨越空間數(shù)據(jù)庫模式的多個版本,處理來自不同組織的信息和由多個數(shù)據(jù)存儲集成的信息。2023/2/145當(dāng)今的數(shù)據(jù)處理大致可以分成兩大類:聯(lián)機事務(wù)處理OLTP(on-linetransactionprocessing)、聯(lián)機分析處理OLAP(On-LineAnalyticalProcessing)。OLTP是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的主要應(yīng)用,主要是基本的、日常的事務(wù)處理,例如銀行交易。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。下表列出了OLTP與OLAP之間的比較。2023/2/146聯(lián)機分析處理是共享多維信息的快速分析。體現(xiàn)了四個特征:(1)快速性:用戶對OLAP的快速反應(yīng)能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計分析。(3)多維性:系統(tǒng)必須提供對數(shù)據(jù)分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應(yīng)能及時獲得信息,并且管理大容量的信息。2023/2/147●數(shù)據(jù)切片:多維數(shù)據(jù)是由多個維度組成的,如果在某個維度上選定一個取值,則多維數(shù)據(jù)從n維下降成n-1維●數(shù)據(jù)切塊:將完整的數(shù)據(jù)立方體切取一部分?jǐn)?shù)據(jù)而得到的新的數(shù)據(jù)立方體?!駭?shù)據(jù)鉆取(下鉆):從較高的維度層次下降到較低的維度層次上來觀察多維數(shù)據(jù)●數(shù)據(jù)聚合(上卷):對數(shù)據(jù)進行高層次綜合的操作●數(shù)據(jù)旋轉(zhuǎn):改變維度的位置關(guān)系,使最終用戶可從其他視角來觀察多維數(shù)據(jù)。OLAP的基本操作2023/2/148

業(yè)務(wù)處理系統(tǒng)數(shù)據(jù)提取數(shù)據(jù)準(zhǔn)備區(qū)OLAP服務(wù)器多維化處理客戶端可視化處理地理空間數(shù)據(jù)立方體數(shù)據(jù)加載地理空間數(shù)據(jù)立方體與OLAP的關(guān)系

OLAP技術(shù)則可利用數(shù)據(jù)立方體中的數(shù)據(jù)進行聯(lián)機分析,將復(fù)雜的分析查詢結(jié)果快速地返回用戶。2023/2/1491.2.4地理空間數(shù)據(jù)挖掘典型方法1.地理空間統(tǒng)計方法2.地理空間聚類方法3.地理空間關(guān)聯(lián)分析4.地理空間分類與預(yù)測分析5.異常值分析112023/2/1501.地理空間統(tǒng)計方法

地理空間統(tǒng)計是指分析地理空間數(shù)據(jù)的統(tǒng)計方法,主要是基于空間中鄰近的要素通常比相離較遠(yuǎn)的要素具有較高的相似性這一原理。地理空間統(tǒng)計分析與傳統(tǒng)分析主要有兩大差異:(1)空間數(shù)據(jù)間并非獨立,而是在D維空間中具有某種空間相關(guān)性,且在不同的空間分辨率下呈現(xiàn)不同的相關(guān)程度;(2)大多數(shù)空間問題僅有一組(不規(guī)則分布空間中)觀測值,而無重復(fù)觀測的資料。2023/2/151目前地理空間統(tǒng)計模型大致可分為三類:●地統(tǒng)計:是以區(qū)域化變量理論為基礎(chǔ),以變差函數(shù)為主要工具,研究空間分布上既具有隨機性又具有結(jié)構(gòu)性的自然現(xiàn)象的科學(xué)。●格網(wǎng)空間模型:用以描述分布于有限(或無窮離散)空間點(或區(qū)域)上數(shù)據(jù)的空間關(guān)系。●空間點分布形態(tài):在自然科學(xué)研究中,許多資料是由點(或小區(qū)域)所構(gòu)成的集合,比如,地震發(fā)生地點分布、樹木在森林中的分布、某種鳥類鳥巢的分布、生物組織中細(xì)胞核的分布,太空中星球的分布等,稱之為空間點分布形態(tài),其中點的位置為事件。2023/2/152

優(yōu)勢:

空間數(shù)據(jù)統(tǒng)計分析是分析空間數(shù)據(jù)廣泛使用的一種方法,能夠很好地處理數(shù)字?jǐn)?shù)據(jù),提出空間現(xiàn)象的現(xiàn)實模型。

局限性:

然而,需要指出的是統(tǒng)計分析方法往往假設(shè)在空間中分布的數(shù)據(jù)具有統(tǒng)計獨立性,而在現(xiàn)實中,空間物體相關(guān)性很大。此外,絕大多數(shù)統(tǒng)計模型需要在有豐富領(lǐng)域知識和統(tǒng)計專門技術(shù)的專家的協(xié)助下才能實現(xiàn)。而且,統(tǒng)計模型不能很好地處理字符值、不完整或非確定性數(shù)據(jù)。2023/2/1532.地理空間聚類方法

地理空間數(shù)據(jù)聚類是按照某種距離度量準(zhǔn)則,在大型、多維數(shù)據(jù)集中標(biāo)識出聚類或稠密分布的區(qū)域,從而發(fā)現(xiàn)數(shù)據(jù)集的整體空間分布模式。該方法把空間數(shù)據(jù)庫中的對象分為有意義的子類,使同一子類內(nèi)部的成員有盡可能多的相同屬性,而不同的子類之間差異較大。2023/2/154

目前,地理空間聚類方法主要有四類:

分割法、層次法、基于密度的方法及基于網(wǎng)格的方法。

而經(jīng)典聚類法包括K-mean、K-mediods、ISODATA等。

2023/2/155完全的空間任意分布地理空間聚類聚集型分布分散型分布11222233333341:極密2:密3:一般密4:稀疏經(jīng)典聚類完全的空間任意分布模式空間聚類分散分布模式2023/2/1563.地理空間關(guān)聯(lián)分析

地理空間關(guān)聯(lián)分析:利用空間關(guān)聯(lián)規(guī)則提取算法發(fā)現(xiàn)空間數(shù)據(jù)庫中空間目標(biāo)間的關(guān)聯(lián)程度,是空間數(shù)據(jù)庫知識發(fā)現(xiàn)研究中的一個重要研究課題。

GIS數(shù)據(jù)庫是典型的空間數(shù)據(jù)庫,從GIS數(shù)據(jù)庫中挖掘空間關(guān)聯(lián)規(guī)則是理解GIS模型和將GIS數(shù)據(jù)轉(zhuǎn)化成知識的一種有效方法。2023/2/157

地理空間關(guān)聯(lián)分析的核心內(nèi)容是挖掘空間關(guān)聯(lián)規(guī)則??臻g關(guān)聯(lián)規(guī)則是指空間目標(biāo)間相鄰(如村落與道路相鄰)、相連(如火車站與鐵路相連)、共生(如蒙古包與草場的關(guān)系)、包含(如區(qū)域中包含的城市)等空間相關(guān)關(guān)系。具體而言,空間關(guān)聯(lián)規(guī)則中包含各種不同的空間謂詞,它們不但可以表示空間對象之間的拓?fù)潢P(guān)系(如相交、不相交、相鄰等),還可以表示空間方位、排列次序(如東、西、南、北等)以及距離信息(如靠近、遠(yuǎn)離等)。

2023/2/158

空間關(guān)聯(lián)規(guī)則指明了空間謂詞與非空間謂詞間存在的關(guān)聯(lián)性。例如,通過挖掘GIS數(shù)據(jù)庫,可能發(fā)現(xiàn)“靠近海灘的房屋”有90%“價格很貴”,“加油站”有75%“靠近高速公路”等??臻g關(guān)聯(lián)規(guī)則提取算法并不唯一,較常用的是利用MBR技術(shù)、R+樹及其他快速方法進行空間分析,并采用概念層次樹對拓?fù)潢P(guān)系進行概化形成拓?fù)潢P(guān)系數(shù)據(jù)表,從而提取關(guān)聯(lián)規(guī)則。2023/2/1594.地理空間分類與預(yù)測分析

地理空間分類與預(yù)測是根據(jù)已知的分類模型把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中,進行數(shù)據(jù)趨勢預(yù)測分析的方法。

分類是將數(shù)據(jù)庫中的對象根據(jù)一定的意義劃分為若干個子集。

預(yù)測是利用歷史數(shù)據(jù)記錄自動推導(dǎo)出對給定數(shù)據(jù)的推廣描述,實現(xiàn)對未來數(shù)據(jù)的趨勢分析。2023/2/160

分類和聚類算法的差別在于:聚類算法是根據(jù)一定要求將對象聚為一個集合,最后得到的分布模式是聚類之前未確知的;分類算法則是根據(jù)已知分布模式的屬性要求,將數(shù)據(jù)庫對象歸入相應(yīng)的分類中。在機器學(xué)習(xí)中,數(shù)據(jù)分類一般稱為監(jiān)督學(xué)習(xí),而數(shù)據(jù)聚類則稱為非監(jiān)督學(xué)習(xí)。

地理空間數(shù)據(jù)分類包括兩個步驟:通過分析數(shù)據(jù)庫中各數(shù)據(jù)行的內(nèi)容建立一個分類模型(分類器),描述已知數(shù)據(jù)集類別或概念。利用所獲得的分類模型(分類器)進行分類操作。2023/2/161

分類和回歸都可用于預(yù)測,空間回歸規(guī)則與空間分類規(guī)則相似,也是一種分類器,其差別在于空間分類規(guī)則的預(yù)測值是離散的,空間回歸規(guī)則的預(yù)測值是連續(xù)的。二者常表現(xiàn)為一棵決策樹,根據(jù)數(shù)據(jù)值從樹根開始搜索,沿著滿足條件的分支往上走,走到樹葉就能確定類別??臻g分類或回歸的規(guī)則是普及知識,實質(zhì)是對給定數(shù)據(jù)對象集的抽象和概括,可用宏元組表示。2023/2/1625.異常值分析

若一個數(shù)據(jù)庫包含的數(shù)據(jù)目標(biāo)與通常的行為或數(shù)據(jù)模型不一致,則這些數(shù)據(jù)目標(biāo)被稱為異常值。絕大多數(shù)數(shù)據(jù)挖掘方法把異常值作為噪音或例外數(shù)據(jù),然而,在很多情況下這將會導(dǎo)致重要隱含信息的丟失。

基于計算機的異常值分析方法主要有三種:基于統(tǒng)計的異常值分析;基于距離的異常值探測;基于偏差的異常值探測。2023/2/1631.1地理空間數(shù)據(jù)處理與建模1.2地理空間數(shù)據(jù)挖掘1.3GIS環(huán)境下的空間分析第1章地理空間數(shù)據(jù)分析與GIS2023/2/1641.3GIS環(huán)境下的空間分析1.3.1空間分析概念1.3.2空間分析的萌芽與發(fā)展1.3.3GIS與空間分析1.3.4GIS環(huán)境下空間分析框架2023/2/1651.3.1空間分析概念

空間分析(SpatialAnalysis,SA)是地理學(xué)的精髓,是為解答地理空間問題而進行的數(shù)據(jù)分析與挖掘。

空間分析是集空間數(shù)據(jù)分析和空間模擬于一體的技術(shù)方法,通過地理計算和空間表達挖掘潛在空間信息,以解決實際問題。

理解:以地理空間數(shù)據(jù)庫為基礎(chǔ),運用邏輯運算、一般統(tǒng)計和地統(tǒng)計、圖形與形態(tài)分析、數(shù)據(jù)挖掘等技術(shù),提取隱含在空間數(shù)據(jù)內(nèi)部的與空間信息有關(guān)的知識和規(guī)律,包括位置、形態(tài)、分布、格局以及過程等內(nèi)容,以解決涉及地理空間的各種理論和實際問題。1.空間分析的定義2023/2/166空間分析的本質(zhì)特征包括:●探測空間數(shù)據(jù)中的模式;●研究空間數(shù)據(jù)間的關(guān)系并建立相應(yīng)的空間數(shù)據(jù)模型;●提高適合于所有觀察模式處理過程的理解;●改進發(fā)生地理空間事件的預(yù)測能力和控制能力。2023/2/1672.空間分析的研究對象

空間分析的研究對象:空間目標(biāo)。

空間分析主要通過對空間數(shù)據(jù)和空間模型的聯(lián)合分析來挖掘空間目標(biāo)的潛在信息??臻g目標(biāo)具有空間位置、分布、形態(tài)、空間關(guān)系(距離、方位、拓?fù)?、相關(guān)場)等基本特征??臻g分析的主要內(nèi)容

●空間位置:借助于空間坐標(biāo)系傳遞空間對象的定位信息,是空間對象表述的研究基礎(chǔ),即投影與轉(zhuǎn)換理論。

●空間分布:同類空間對象的群體定位信息,包括分布、趨勢、對比等內(nèi)容。

●空間形態(tài):空間對象的幾何形態(tài)

●空間距離:空間物體的接近程度

●空間關(guān)系:空間對象的相關(guān)關(guān)系,包括拓?fù)?、方位、相似、相關(guān)等。2023/2/1683.空間分析研究的主要目標(biāo)

(或稱:空間分析功能的實現(xiàn)分為以下5個層次)

●認(rèn)知。有效獲取空間數(shù)據(jù),并對其進行科學(xué)的組織描述,利用數(shù)據(jù)再現(xiàn)事物本身,例如繪制風(fēng)險圖。

●解釋。理解和解釋地理空間數(shù)據(jù)的背景過程,認(rèn)識事件的本質(zhì)規(guī)律,例如住房價格中的地理鄰居效應(yīng)。

●預(yù)報。在了解、掌握事件發(fā)生現(xiàn)狀與規(guī)律的前提下,運用有關(guān)預(yù)測模型對未來的狀況做出預(yù)測,例如傳染病的爆發(fā)。

●調(diào)控。對地理空間發(fā)生的事件進行調(diào)控,例如合理分配資源。

空間分析的根本目標(biāo):是建立有效的空間數(shù)據(jù)模型來表達地理實體的時空特性,發(fā)展面向應(yīng)用的時空分析模擬方法,以數(shù)字化方式動態(tài)地、全局地描述地理實體和地理現(xiàn)象的空間分布關(guān)系,從而反映地理實體的內(nèi)在規(guī)律和變化趨勢。2023/2/1691.3.2空間分析的萌芽與發(fā)展(1)在古代,人類出于生存和發(fā)展的需要,要學(xué)會分析周圍地理事物的空間關(guān)系,因而始終在進行著各種類型的空間分析。從某種意義上講,空間分析孕育了地理學(xué)。(2)地圖的出現(xiàn)使人類的空間分析能力大大增強。為使地圖有助于空間分析,地理學(xué)家試圖尋找一種能以形象方式描述數(shù)據(jù)空間分布的方法,這就是早期的空間統(tǒng)計方法。(3)隨著地圖理論與應(yīng)用的廣泛深入,物理、數(shù)學(xué)概念與方法的不斷引入以及地學(xué)各分支的發(fā)展,傳統(tǒng)的空間分析能力大大加強,人們對地圖表達空間信息的理解與解譯能力顯著提高。2023/2/1701.3.2空間分析的萌芽與發(fā)展(4)現(xiàn)代“空間分析”概念的提出源于20世紀(jì)60年代地理與區(qū)域科學(xué)的計量革命。

初始階段主要是應(yīng)用統(tǒng)計分析方法,定量描述點、線、面的空間分布模式;后期逐漸強調(diào)地理空間本身的特征、空間決策過程和復(fù)雜空間系統(tǒng)的時空演化過程。GIS使空間分析能力發(fā)生了質(zhì)的飛躍。

(5)新一代空間分析的主要目的是從現(xiàn)有數(shù)據(jù)的空間關(guān)系中挖掘新的信息。隨著GIS技術(shù)的不斷進步,空間分析成為地理信息系統(tǒng)的核心,是地理信息系統(tǒng)區(qū)別于一般空間數(shù)據(jù)庫和普通制圖系統(tǒng)的標(biāo)志?!皬哪撤N意義上講,空間分析與GIS間的關(guān)系類似于統(tǒng)計學(xué)與統(tǒng)計軟件包間的關(guān)系”。2023/2/171國內(nèi)外GIS軟件空間分析比較2023/2/1721.3.3GIS與空間分析空間分析一般采用專業(yè)分析模型與GIS集成方式(兩種):專業(yè)模型

統(tǒng)計分析

網(wǎng)絡(luò)分析

其他空間分析模塊

用戶界面GIS管理系統(tǒng)空間數(shù)據(jù)庫(1)緊耦合。把空間分析模塊作為一個高級應(yīng)用模塊嵌入GIS軟件包中,GIS不僅可以為空間分析提供圖形顯示功能,而且GIS中的有關(guān)數(shù)據(jù)直接參與空間分析計算。這種方式可以為用戶提供方便、全面、有效的使用功能,但造價高,實現(xiàn)周期長。GIS與空間分析的緊耦合2023/2/173GIS與空間分析的松耦合數(shù)據(jù)交換接口用戶GIS管理系統(tǒng)空間分析模型空間數(shù)據(jù)庫數(shù)據(jù)文件(2)松耦合。在兩個相對獨立的GIS軟件和空間分析軟件之間增加數(shù)據(jù)交換接口,使空間分析數(shù)據(jù)及相關(guān)的影響因素和空間分析結(jié)果能夠在GIS中以各種簡單的或復(fù)雜的圖形方式顯示出來,這種方式適用于短期且費用較小的情況。2023/2/1741.3.4GIS環(huán)境下空間分析框架空間分析是GIS的核心空間分析是GIS的核心功能2023/2/175GIS環(huán)境中的空間分析(AnselinL提出的一般性框架)縮放瀏覽空間查詢緩存視圖選擇空間采樣地圖提取質(zhì)心鑲嵌聚集分散空間權(quán)重拓?fù)洳逖a覆蓋空間分布全局空間組織局域空間組織空間回歸模型評價模型診斷空間預(yù)測探索空間數(shù)據(jù)分析操作確認(rèn)空間數(shù)據(jù)分析模型確定一般性框架2023/2/176

考慮到GIS環(huán)境下空間分析的易理解性和可操作性,將GIS環(huán)境下空間分析方法分為如下六個方面:●確定性空間分析●探索性空間數(shù)據(jù)分析●時空數(shù)據(jù)分析●專業(yè)模型集成分析●智能化的空間分析●可視化空間分析2023/2/1771.

確定性空間分析

確定性空間分析是指分析處理確定性空間數(shù)據(jù)或解決確定性空間問題的方法,它是高級空間分析的基礎(chǔ)。從算法來看,確定性空間分析的算法基本上是基于經(jīng)典數(shù)學(xué)方法建模的,其在GIS空間分析技術(shù)中已經(jīng)相當(dāng)成熟。

2023/2/178

2.探索性空間數(shù)據(jù)分析(ESDA)

是利用統(tǒng)計學(xué)原理和圖形圖表相結(jié)合對空間數(shù)據(jù)的性質(zhì)進行分析、鑒別,用以引導(dǎo)確定性模型的結(jié)構(gòu)和解法的一種技術(shù),本質(zhì)上是一種“數(shù)據(jù)驅(qū)動”的分析方法。

ESDA技術(shù)注重研究數(shù)據(jù)的空間相關(guān)性與空間異質(zhì)性,在知識發(fā)現(xiàn)中用于選取感興趣的數(shù)據(jù)子集,以發(fā)現(xiàn)隱含在數(shù)據(jù)中的某些特征和規(guī)律。相對于傳統(tǒng)的統(tǒng)計分析而言,ESDA技術(shù)不是預(yù)設(shè)數(shù)據(jù)具有某種分布或某種規(guī)律,而是一步步地、試探性地分析數(shù)據(jù),逐步地認(rèn)識和理解數(shù)據(jù)。

2023/2/179

探索性歸納學(xué)習(xí)方法(EIL

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論