GIS空間分析原理與方法_第1頁
GIS空間分析原理與方法_第2頁
GIS空間分析原理與方法_第3頁
GIS空間分析原理與方法_第4頁
GIS空間分析原理與方法_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第1章地理空間數(shù)據(jù)分析與GIS然而,目前多數(shù)地理信息系統(tǒng)的應用還局限于數(shù)據(jù)庫型GIS層面上,沒有充分利用和開發(fā)GIS的空間分析功能,不能真正滿足全球變化和區(qū)域可持續(xù)發(fā)展研究對空間分析、預測預報、決策支持等多方面的應用要求,GIS空間分析功能偏弱已經(jīng)嚴重地阻礙了其作為空間數(shù)據(jù)分析工具和決策支持系統(tǒng)的使用。因此,建立完善的空間數(shù)據(jù)分析理論和方法體系,集成先進的空間數(shù)據(jù)分析工具,增強GIS的空間分析能力,使數(shù)據(jù)庫型GIS上升為分析型GIS,是GIS技術與應用的發(fā)展目標和趨勢。本章首先對20世紀50年代以來地理空間數(shù)據(jù)處理與建模領域重要的技術方法如數(shù)量地理學、地理信息系統(tǒng)和地理計算等進行簡要的回顧,然

2、后論述數(shù)據(jù)分析領域中迅速發(fā)展的新技術數(shù)據(jù)挖掘,在此基礎上,討論GIS環(huán)境下空間分析的基本框架。1.1 地理空間數(shù)據(jù)處理與建模地理空間數(shù)據(jù)分析是地理學和地理信息科學領域的重要研究內(nèi)容,它通過研究地理空間數(shù)據(jù)及其相應分析理論、方法和技術,探索、證明地理要素之間的關系,揭示地理特征和過程的內(nèi)在規(guī)律和機理,實現(xiàn)對地理空間信息的認知、解釋、預測和調(diào)控。長久以來,人們一直不懈地致力于研究和探索高效的、適合于地理空間數(shù)據(jù)處理與分析的方法,從對地理現(xiàn)象及其空間關系的文字記載,到利用數(shù)學概念和方法進行解釋性描述;從傳統(tǒng)統(tǒng)計學方法和數(shù)學模型對地理現(xiàn)象和過程的模擬,到基于地理信息系統(tǒng)的多維地理空間數(shù)據(jù)表達、管理、地

3、理過程的動態(tài)模擬、可視化分析和決策支持;從空間數(shù)據(jù)挖掘技術到高性能計算技術支撐下的地理計算方法,隨著人們對信息需求水平的不斷提高和科學技術的日益進步,地理空間數(shù)據(jù)分析的技術和方法得到不斷完善和豐富。數(shù)量化方法在感知、認識和解釋現(xiàn)實世界的各種自然、人文、社會現(xiàn)象過程中的相互關系中起著定性方法不能替代的作用。對于決策者而言,數(shù)量化方法是獲取更為合乎理性、可信、有效決策信息的重要手段。它能夠以多種方式,從多重側(cè)面,詳盡、準確地解釋事物的狀態(tài)特征和演變過程,合理推測未來發(fā)展規(guī)律,提供可供選擇的多重決策。馬克思早就指出:“一種科學只有在成功地運用數(shù)學時,才算達到了真正完善的程度”。數(shù)量地理學(Quant

4、itative Geography又稱計量地理學或地理數(shù)量方法,是應用數(shù)學思想方法和計算機技術進行地理學研究的科學。它試圖以定量的精確判斷來彌補定性文字描述的不足;以抽象的、反映本質(zhì)的數(shù)學模型去刻畫具體的、龐雜的各種地理現(xiàn)象;以對過程的模擬和預測來代替對現(xiàn)狀的分析和說明;以合理的趨勢推導和反饋機制分析來代替簡單的因果關系分析。數(shù)量地理學提供了理性的復雜方法以傳遞有關諸如行為、決策的確定性程度、綜合研究精度等有用的信息,與定性研究方法結合共同構筑了地理學研究方法的科學體系。數(shù)量地理學是對地理學傳統(tǒng)研究方法的發(fā)展和變革,反映了地理學向定量化、科學化發(fā)展的趨勢,使地理學由一門對地表事物進行解釋性描述

5、的學科,轉(zhuǎn)變?yōu)橐婚T進行確定性解釋的科學。數(shù)量地理學是地理學領域中最先采用數(shù)學原理方法來探討地理數(shù)據(jù)分析處理與建模的學科。1.數(shù)量地理學的產(chǎn)生與發(fā)展地理學是一門研究地球表層自然要素與人文要素相互作用關系及其時空規(guī)律的科學。作為一門古老的空間科學,地理學與數(shù)學有著不解之緣。在古代,地理學與數(shù)學之源泉科學幾何學,幾乎都是研究地表的科學,如運用幾何學原理和方法測算河流長度、山體高度、土地面積等。古希臘學者、西方“地理學之父”艾拉托塞尼(Eratcsthenes最早運用幾何學原理和方法測算了地球的周長。在近代地理學時期,經(jīng)濟學中的區(qū)位論被移植到地理學中,開辟了地理學運用分析數(shù)學之先河。20世紀20-30

6、年代,地理學研究中統(tǒng)計方法開始萌芽,主要是一般的數(shù)理統(tǒng)計,進行地理要素的統(tǒng)計概括和相關關系探討。前蘇聯(lián)地理學家馬爾科夫指出:“更多的地理學家應當使主要的研究方向現(xiàn)代化,應當偏重于以基礎科學、首先是精確性科學為基礎的道路?!爆F(xiàn)代地理學中的數(shù)量方法與理論模式的產(chǎn)生與形成,可以追溯到20世紀50年代末期開始的計量運動。計量運動主要由美國地理學家發(fā)起,早期集中在衣阿華、威斯康星、普林斯頓和華盛頓等幾所大學。不同學者所持觀點不同,研究方向各異,由此形成了所謂的經(jīng)濟、統(tǒng)計、社會等學派。從世界范圍看,計量運動的興起首先要歸功于加里森(William L.Garrison及其領導的華盛頓小組。加里森是第一個把

7、地理學的理論和方法建立在定量基礎上的倡導者和實踐者,也是第一本計量地理學教材的作者。作為地理科學的方法論之一,數(shù)量地理學盡管歷史不長,但發(fā)展速度很快,且時時充滿著變革和創(chuàng)新。20世紀50年代末開始,數(shù)量地理學先后經(jīng)歷了三個發(fā)展時期,各自呈現(xiàn)不同特征(如圖1.1。 圖1.1 數(shù)量地理學的發(fā)展階段2.傳統(tǒng)地理學與數(shù)量地理學數(shù)學方法是人們進行數(shù)字運算和求解的工具,能以嚴密的邏輯和簡潔的形式描述復雜的問題,表達極為豐富的實質(zhì)性思想。對于現(xiàn)代地理學而言,數(shù)學方法不僅是應用地理學研究中進行預測、決策、規(guī)劃及優(yōu)化設計的工具,也是理論地理學研究中進行邏輯推理和理論演繹的手段。世界上的任何事物都可以用數(shù)值來描述

8、和度量,地理要素如區(qū)域范圍、城市位置、道路長短、氣溫高低、雨量多少、山高水深、人口增減、物產(chǎn)豐欠等都可用數(shù)量來表示。各種地理要素的分布形態(tài)及其相互關系特征,亦可以用數(shù)學方法進行定量分析與研究。與地理學傳統(tǒng)的思維模式相比,地理數(shù)量方法有著明顯的優(yōu)勢(如圖1.2。傳統(tǒng)地理學分析方法所采用的推理方式以經(jīng)驗歸納型綜合為主,以觀察材料和事實為基礎,由直接的類推得出現(xiàn)實世界的結論,這一方法難以回避特殊情況或解釋者的主觀好惡問題。而數(shù)量地理學以理論演繹為主,把感知到的地理事物通過假設予以條理化,繼而經(jīng)過模式化得出數(shù)據(jù)進行檢驗,在成功的情況下建立法則和理論,否則反饋回去重新制定假設。整個研究過程經(jīng)歷了提出假設

9、、建立模式、檢驗假設和建立理論四個步驟,符合感性-理性-實踐這一認識的過程規(guī)律。 3. 數(shù)量地理學中地理數(shù)據(jù)分析模擬方法數(shù)量地理學本質(zhì)上是一門關于地理數(shù)據(jù)分析處理與建模的科學,其主要研究內(nèi)容涉及地理要素的描述統(tǒng)計和數(shù)量分析技術,地理系統(tǒng)的分析方法,數(shù)學模型的構建和應用,數(shù)學模擬(仿真技術,地理預測和決策的方法、程序、模型以及地理學理論表述的數(shù)學形式等。其研究方法歸納如下:(1地理系統(tǒng)分析地理系統(tǒng)分析是指揚棄地理事物繁瑣的枝節(jié),抽象出地理事物在結構與功能上的主線,揭示地理事物動態(tài)演變的方向與強度,預測其狀態(tài)變化和穩(wěn)定性程度,將復雜、高級的地理系統(tǒng)簡化為次一級簡單的系統(tǒng),進而探討地理要素之間的數(shù)量

10、關系。一般是首先列出所研究等級系統(tǒng)的要素清單,根據(jù)地理系統(tǒng)的實際繪出各要素的聯(lián)系框圖,再以定量方法研究系統(tǒng)要素之間的關系。(2隨機數(shù)學方法地理系統(tǒng)輸入與輸出之間一般具有隨機性,數(shù)量地理學研究方法中隨機數(shù)學占很大比重。地理系統(tǒng)是多級、多元系統(tǒng),在進行系統(tǒng)分析時,分析一組或幾組地理要素之間的關系經(jīng)常應用多元統(tǒng)計分析方法,如多元線性回歸、逐步回歸、主成分分析、因子分析等;地理系統(tǒng)是具有空間范圍和地域界線的系統(tǒng),確定界線、進行地理區(qū)域的劃分等經(jīng)常應用二級判別分析、多級判別、逐步判別等數(shù)學分類技術;在探討地理系統(tǒng)結構、類型組合、空間關系圖1.2 數(shù)量地理學與傳統(tǒng)地理學研究方法比較傳統(tǒng)地理學方法 數(shù)量地理

11、學方法時,常運用系統(tǒng)聚類分析方法;分析地理系統(tǒng)的空間特性時,常用趨勢面分析方法;地理系統(tǒng)研究中十分重視系統(tǒng)目標、系統(tǒng)結構的研究,以使地理系統(tǒng)達到符合一定目標的最佳狀態(tài)。此外,模擬地理系統(tǒng)狀態(tài)的轉(zhuǎn)移規(guī)律時還包括馬爾柯夫鏈、多元線性方程組、微分方程的應用等。(3地理系統(tǒng)模擬建立地理系統(tǒng)數(shù)學模型的過程稱為地理系統(tǒng)的數(shù)學模擬(簡稱地理模型。地理模型成為表達地理現(xiàn)象的狀態(tài),描述地理現(xiàn)象的過程,揭示地理現(xiàn)象的結構,說明地理現(xiàn)象的分級,認識該現(xiàn)象與其他地理現(xiàn)象之間聯(lián)系的概念性和本質(zhì)性的表征方式。地理系統(tǒng)數(shù)學模擬的一般過程是:從實際的地理系統(tǒng)或其要素出發(fā),對空間狀態(tài)、空間成分、空間相互作用進行分析,建立地理系

12、統(tǒng)或要素的數(shù)學模型;經(jīng)驗檢查,若與實際情況不符,則要重新分析,修改模型;若大致相符,則選擇計算方法,進行程序設計、程序調(diào)試和上機運算,從而輸出模型解;分析模型解,若模型解出錯,則修改模型;若模型解正確,則對成果進行地理解釋,提出切實可行的方案。可見,地理系統(tǒng)數(shù)學模擬過程是反復修改數(shù)學模型、調(diào)試和修改程序的過程。英國著名地理學家R.J. Johnston 在1995 年曾指出“計量革命的直接成果是導致了GIS 革命的到來”。GIS 起源于20世紀60年代,是對地理空間數(shù)據(jù)進行采集、存儲、表達、更新、檢索、管理、綜合分析與輸出的計算機應用技術系統(tǒng)。GIS 是以應用為導向的空間信息技術,強調(diào)空間實體

13、及其關系,注重空間分析與模擬,是重要的地理空間數(shù)據(jù)管理和分析工具。1. GIS 是客觀現(xiàn)實世界抽象化的數(shù)字模型客觀現(xiàn)實世界極其復雜,運用各種數(shù)據(jù)采集手段和量測工具,如野外調(diào)查、遙感技術等,獲取有關客觀世界的數(shù)據(jù),把各種來源和類型的地理空間數(shù)據(jù)數(shù)字化,輸入計算機,按一定的規(guī)則組織管理,構建客觀現(xiàn)實世界的抽象化數(shù)字模型,即GIS (如圖1.3。 存貯于GIS 中的地理空間數(shù)據(jù)不是客觀世界的完全再現(xiàn),而是在地理認知的基礎上對真實世界進行抽象和概括而形成的數(shù)字模型,在一定比例尺下表達客觀事物的分類、分級、空間過程和空間格局。GIS 應用成功與否不僅在于空間信息技術的發(fā)達程度,更多地依賴于人類定義客觀世

14、界認知模型的恰當程度。在GIS 中,對現(xiàn)實世界的理解是從數(shù)據(jù)、信息、知識到智慧逐漸深入的。2. GIS 是地理空間數(shù)據(jù)管理、顯示與制圖的集成工具地理信息系統(tǒng)不僅是客觀世界抽象化的數(shù)字模型,同時還是一種對空間數(shù)據(jù)進行采集、存儲、管理、顯示與制圖的計算機系統(tǒng)和集成工具,這是地理信息系統(tǒng)最主要的功能之一。GIS 處理的數(shù)據(jù)可以歸納為兩大類:一類描述地理實體的空間位置和空間拓撲關系的圖形圖像信息;另一類描述地理實體的屬性文字、數(shù)字信息等。通過數(shù)據(jù)的獲取、管理、顯示、分析與制圖輸出,保證了地理信息系統(tǒng)數(shù)據(jù)庫中數(shù)據(jù)在內(nèi)容與空間上的完整性、數(shù)值邏輯上的一致性與正確性。地理信息系統(tǒng)擁有所有大型數(shù)據(jù)庫管理系統(tǒng)所

15、具有的功能,如地學空間數(shù)圖1.3 客觀世界的抽象化過程據(jù)的采集、監(jiān)測、編輯、存儲與管理等,能夠高效地組織海量數(shù)據(jù),為解決空間復雜問題奠定基礎。地理信息系統(tǒng)還為用戶提供了許多用于顯示地理空間數(shù)據(jù)的工具,其表達形式既可以是計算機屏幕顯示,也可以是諸如報告、表格、地圖等硬拷貝圖件。GIS除了具有計算機輔助設計(CAD、計算機輔助制圖(CAC等一般顯示功能外,還具有多幅圖層疊加、陰影透視、網(wǎng)狀透視、用戶格網(wǎng)、地圖動畫等高級顯示功能。一個完備的地理信息系統(tǒng)應能提供種良好的、交互式的制圖環(huán)境,使地理信息系統(tǒng)的使用者能設計和印制出具有高品質(zhì)的地圖。3.GIS是地理空間數(shù)據(jù)分析模擬與可視化的技術平臺地理信息系

16、統(tǒng)支持多種數(shù)學模型綜合運用,可以建立一系列具有分析、模擬、仿真、預測、規(guī)劃、決策、調(diào)控等多功能的模型系統(tǒng)。這種模型系統(tǒng)的運行既需要海量地理數(shù)據(jù)構成的地理數(shù)據(jù)庫支持,也依賴強有力的計算方法與計算機程序,最終的研究結論則以可視化的地圖、統(tǒng)計圖或者三維圖等形式輸出。GIS用戶可以完成對空間數(shù)據(jù)的一系列處理、分析與建模任務,實現(xiàn)空間數(shù)據(jù)的可視化。(1空間數(shù)據(jù)分析與建模現(xiàn)實世界中,越來越多的地理現(xiàn)象都以數(shù)字形式表達,形成地理空間數(shù)據(jù)庫。對數(shù)據(jù)庫中的空間數(shù)據(jù)進行分析與建模以挖掘出有用的空間信息是GIS最具生命力的核心功能,也是GIS區(qū)別于其他計算機系統(tǒng)的主要標志之一。目前常用的GIS空間分析方法有緩沖區(qū)分

17、析、疊加分析、網(wǎng)絡分析、拓撲結構分析、三維分析等。對于復雜的地理空間問題可以為其建立空間分析模型,如數(shù)字地形模型(DTM、空間統(tǒng)計分析模型、人工神經(jīng)網(wǎng)絡模型、粗集模型等。借助GIS進行地理模型分析是研究地球系統(tǒng)的重要途徑,如綜合評價模型、預測模型、規(guī)劃模型、決策分析模型等應用分析模型在分析地理空間信息、探究地學研究對象的本質(zhì)特征及其動態(tài)變化方面具有重要價值。(2空間信息可視化科學可視化技術貫穿GIS空間分析的始終,將分析結果以易于理解的方式直觀地表達出來,最大限度地利用信息,實現(xiàn)信息共享。從某種角度講,GIS可以稱為“動態(tài)的地圖”,它提供了比普通地圖更為豐富和靈活的空間數(shù)據(jù)表現(xiàn)方式,如動態(tài)信息

18、表達、虛擬現(xiàn)實等。地學專家對可視化在地學中的地位和作用已進行了深入探討,提出了與可視化密切相關的地圖可視化、地理可視化、GIS可視化、探析地圖學(Exploratory Cartography、地學多維圖解、虛擬地理環(huán)境等概念,但不同的專家有不同的理解,對其相互關系認識仍不明確。隨著計算機技術、數(shù)學方法的不斷進步,空間數(shù)據(jù)分析處理方法論也隨之革新,20世紀90年代,一門融合了計算機科學、地理學、地球信息科學(Geomatics、信息科學、數(shù)學和統(tǒng)計學理論與方法的地理計算學(GeoComputation開始形成并逐漸發(fā)展起來,數(shù)量地理學進入全新的計算地理學(Geocomputational Ge

19、ography時代,地理空間數(shù)據(jù)分析與建模有了一個新的技術平臺。1.地理計算的概念與內(nèi)涵20世紀90年代中期,英國著名地理學家,里茲大學計算地理研究中心(The Center of Computational GeographyStan Openshaw教授認為空間數(shù)據(jù)挖掘已成為數(shù)量地理學中一個重要分支,并以GeoComputation命名這個新的學科,Stan Openshaw因此被稱為“地理計算之父”。此后,許多學者紛紛從不同角度對地理計算的定義與內(nèi)容框架進行設計,并論證其作為一個學科的必要性和合理性。Openshaw(1999認為地理計算本質(zhì)上是繼地理信息科學之后的革命。他在2000年又

20、進一步深化對于地理計算的理解,認為地理計算是一種高性能計算,用以解決目前不能解決的、甚至未知的空間問題的科學。地理計算具有三方面特點:一是強調(diào)地理主題;二是對現(xiàn)存問題承認有新的或更好的解決辦法,且可以解決以前不能解決的問題;三是地理計算需要獨特的思考方式,由于基于海量計算代替殘缺的知識或理論的過程,故能夠增強機器的智能。英國里茲大學著名地理學家Rees等提議將地理計算定義為:應用計算技術求解地理問題的理論、方法和過程。從構詞來看,GeoComputation 由前綴“Geo”和主詞“Computation”組合而成,前者指地理計算要做什么,后者則是如何去做。Gahegan在1999年發(fā)表的論文

21、中細致地談到“地理計算關注利用一系列方法的工具箱豐富地理模擬和分析大量高度復雜的、非確定性的問題這是人類有意識的努力去探索地理學與計算機科學之間的關聯(lián)。這是一個真正的對于數(shù)量地理學家的技術,也是計算機科學家進行計算性應用的豐富源泉?!盋onclelis(1998采用相對簡潔的定義:地理計算是應用數(shù)學計算方法與技術來描述空間特征、解釋地理現(xiàn)象、解決地理問題。Openshaw和Abrahart(2000認為:地理計算是一門新興的交叉學科,它是在科學方法的整體范圍內(nèi)利用各種不同類型的地理數(shù)據(jù)發(fā)展相關的地理工具和模型。2003年8月,我國亞運村地理學術沙龍談到“虛擬地理實驗室”建設,認為地理計算既不是

22、數(shù)量地理學,也不是GIS,而是智能計算在地理學中的精確應用,是強大的高性能計算,其理論驅(qū)動是科學。地理計算能夠有效地用于非線性復雜地理問題的模擬、計算與求解。地理計算是利用不同類型的地理與環(huán)境數(shù)據(jù),在計算科學方法的整個體系中發(fā)展相關的計算工具。它依賴于新計算技術、算法和范例,并且利用高性能計算(High-Performance Computing,HPC和高效率計算機(HTC,包括空間數(shù)據(jù)分析、自動建模、模擬、時空動力學、可視化和虛擬現(xiàn)實。地理計算試圖回歸計量革命時代的地理分析和建模,吸收了新的計算機科學成果,如高性能計算,模式識別、分類、預測與模型技術,知識挖掘,可視化等一系列計算方法和工具

23、,建立地理模型并分析復雜的、具有不確定性的地理問題,從而豐富了地理學的研究。GeoComputation不僅僅是計算機在地理信息領域中的應用,關鍵是可以輔助進行地理研究,從而獲得基于數(shù)據(jù)驅(qū)動的地理信息管理和地理信息分析。綜上所述,地理計算這一學科的統(tǒng)一視角就是“計算”,它被認為是一系列有效的程序或算法(如神經(jīng)網(wǎng)絡、模糊邏輯、遺傳算法等,當應用到地理問題時必然產(chǎn)生結果,不同算法之間由于基本假設的不同而產(chǎn)生結果的差異。地理計算本質(zhì)上可認為是對地理學時間與空間問題所進行的基于計算機的定量化分析。2.地理計算模型與方法地理計算的目標是將地理學領域的知識引入計算機工具,設計合適的地理數(shù)據(jù)挖掘和知識發(fā)現(xiàn)操

24、作,研發(fā)時空尺度上的集群算法,獲得超越目前軟件、硬件能力的地理數(shù)據(jù)分析方法,用可視化和虛擬現(xiàn)實的手段實現(xiàn)地理問題的理解與交流。地理計算學是數(shù)量地理學向深層次的拓展,強調(diào)數(shù)學模型與模擬實驗并重的理念,憑借計算機工具對地理學問題進行定量或非定量分析的抽象概括和綜合研究,解決海量、復雜數(shù)據(jù)集或數(shù)據(jù)庫分析的復雜空間問題。GeoComputation 包含豐富的模型和方法體系,不僅采納了傳統(tǒng)的數(shù)量地理學理論與模型,還涉及一系列新的理論技術方法:GIS為之創(chuàng)建數(shù)據(jù)庫;人工智能技術(Artificial Intelligence,AI和智能計算技術(Computational Intelligence,CI

25、為之提供計算原理和計算工具;高性能計算服務系統(tǒng)為之提供動力。智能計算技術中的神經(jīng)網(wǎng)絡模型(Neural Network,NN、模糊邏輯模型(Fuzzy Logic、遺傳算法模型(Genetic Algorithm,GA、元胞自動機模型(Cellular Automata,CA以及分形分析(Fractal Analysis等不斷被引入并成為地理計算的核心。高性能計算(High-Performance Computing 是利用超級計算機對大容量資料、需要進行實時分析與控制的系統(tǒng)以及那些復雜而又不能用其他手段來處理的現(xiàn)實世界所實施的計算。地理研究的實踐,更多的是充分利用GIS 技術,結合GPS 和

26、RS 技術,以向量或并行處理器為基礎的超級計算機為工具,對海量數(shù)據(jù)資料所表征的地理學問題實施高性能計算,探索并構筑新的地理學理論與應用模型。在目前GIS 技術下,計算機表達地理空間基本上是靜止的。地理計算研究的重要內(nèi)容之一是如何建立一種模型將空間(地理目標的結構元素與改變這種空間結構(人類活動及其影響的過程相結合。這種模型將改變對于空間的靜止描述觀點,強調(diào)作為地理空間基本部分的動態(tài)組成,如使用元細胞自動機技術模擬城市和區(qū)域增長等。1.2 地理空間數(shù)據(jù)挖掘數(shù)據(jù)挖掘是一個由數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計和可視化等多學科與技術交叉、滲透、融合形成的交叉學科(邸凱昌,2000。它試圖綜合應用上述領域技術,

27、在龐大的數(shù)據(jù)庫中探索事先并不知道,但潛在有用的、新的結構形態(tài)或者關系特征,即關于數(shù)據(jù)的高層次信息結構和知識。地理空間數(shù)據(jù)挖掘(Geospatial Data Mining 是數(shù)據(jù)挖掘的一個研究分支,其實質(zhì)是從地理空間數(shù)據(jù)庫中挖掘時空系統(tǒng)中潛在的、有價值的信息、規(guī)律和知識的過程,包括空間模式與特征、空間與非空間數(shù)據(jù)之間的概要關系等。由于空間數(shù)據(jù)具有海量、多維和自相關性等特征,使得地理空間數(shù)據(jù)挖掘更為復雜。地理空間數(shù)據(jù)挖掘技術可以有效地解決一些地學問題。例如,地球系統(tǒng)的基本驅(qū)動力是什么?整個地球系統(tǒng)是如何變化的?如何能更好地預測地球系統(tǒng)未來的變化?某一種流行病的分布模式?流行病發(fā)展變化范圍、趨勢及

28、速率等?其中許多分析都是基于空間位置關系的,因此地理空間數(shù)據(jù)挖掘技術最根本的是基于事物的空間特性(如拓撲、距離、方位等。 近些年來,國內(nèi)外開展了許多有關地理空間數(shù)據(jù)分析與挖掘方面的研究。加拿大Simon Fraser 大學計算機科學系Han Jiawei 教授領導的小組進行了基于關系數(shù)據(jù)庫挖掘系統(tǒng)的研究,在MapInfo 平臺上開發(fā)了空間數(shù)據(jù)挖掘原型系統(tǒng)GeoMiner ,并設計了專門用于空間數(shù)據(jù)挖掘的語言GMQL ,實現(xiàn)了空間數(shù)據(jù)特征描述、空間比較、空間關聯(lián)、空間聚類和空間分類等空間數(shù)據(jù)分析方法的集成。該系統(tǒng)具有空間數(shù)據(jù)庫模型、空間數(shù)據(jù)立方體、空間OLAP 等模塊(如圖1.4。武漢大學李德仁

29、院士等提出從GIS 數(shù)據(jù)庫可以挖掘出包括幾何信息、空間關系、幾何性質(zhì)與屬性關系以及面向?qū)ο笾R等多種知識,認為空間數(shù)據(jù)分析與挖掘使GIS 的有限數(shù)據(jù)變成無限的知識。圖1.5為數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的進化歷程(陳述彭等,1996。圖1.4 GeoMiner 系統(tǒng)結構地理空間數(shù)據(jù)挖掘包含旨在從地理空間數(shù)據(jù)庫中發(fā)現(xiàn)有用卻尚未發(fā)現(xiàn)的模式的一系列技術。傳統(tǒng)觀點認為數(shù)據(jù)挖掘技術植根于計算科學和數(shù)學,不需要也不得益于數(shù)據(jù)立方體。這種觀點今天看來并不正確,數(shù)據(jù)挖掘成功的關鍵之一就是先通過訪問正確、完整和集成的數(shù)據(jù)庫,才能進行深層次的分析,尋求有意義的信息。而這些正是數(shù)據(jù)立方體所能提供的,數(shù)據(jù)立方體不僅是集成數(shù)據(jù)的

30、一種方式,其聯(lián)機分析功能OLAP 還為數(shù)據(jù)挖掘提供了一個極佳的操作平臺。實現(xiàn)空間數(shù)據(jù)挖掘與數(shù)據(jù)立方體有效的聯(lián)結,將給空間數(shù)據(jù)挖掘帶來各種便利操作和新的功能。按照不同的挖掘任務,地理空間數(shù)據(jù)挖掘可以分為預測模型發(fā)現(xiàn)、聚類、關聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關系發(fā)現(xiàn)、異常值分析和趨勢發(fā)現(xiàn)等。由于空間數(shù)據(jù)庫包含了大量的拓撲/距離信息,需要按照復雜的多維空間索引結構組織數(shù)據(jù)。在訪問這些數(shù)據(jù)時,需要采用空間推理、地理計算和空間知識的表示技術。地理空間數(shù)據(jù)挖掘系統(tǒng)包括三大支柱模塊:地理空間數(shù)據(jù)立方體、聯(lián)機分析處理(OLAP 模塊和空間數(shù)據(jù)挖掘模塊。地理空間數(shù)據(jù)挖掘的體系結構如圖1.6所示,由以下四部分組成:

31、 (1圖形用戶界面(交互式挖掘;(2挖掘模塊集合;(3數(shù)據(jù)庫和知識庫(空間、非空間數(shù)據(jù)庫和相關概念;地理空間數(shù)據(jù)立方體(Geospatial Data Cube 是一個面向?qū)ο蟮?、集成的、以時間為變量的、持續(xù)采集空間與非空間數(shù)據(jù)的多維數(shù)據(jù)集合,組織和匯總成一個由一組維度和度量值定義的多維結構,用以支持地理空間數(shù)據(jù)挖掘技術和決策支持過程。地理空間數(shù)據(jù)立方體絕非僅在數(shù)據(jù)庫上加一層空間外衣,而是真正地以空間數(shù)據(jù)庫為基礎,進行復雜的空間分析, 圖1.6 地理空間數(shù)據(jù)挖掘體系結構圖1.5 數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的進化歷程進 化階 段技 術 手 段反映不同時空尺度下的動態(tài)變化趨勢,為決策者提供及時、準確的信息

32、。地理空間數(shù)據(jù)立方體中的數(shù)據(jù)是經(jīng)過選擇、整理、集成等處理的,為空間數(shù)據(jù)挖掘提供了良好的數(shù)據(jù)基礎,因而在地理空間數(shù)據(jù)立方體中進行數(shù)據(jù)挖掘比在原始數(shù)據(jù)庫中更加有效。數(shù)據(jù)立方體法的基本思想是把那些經(jīng)常被查詢到的求和、求平均值、求最大最小值等成本較高的計算進行具體化,并將這些具體化的視圖存儲到數(shù)據(jù)立方體中,便于知識發(fā)現(xiàn)。 所謂“立方體”并非指數(shù)據(jù)包含3個維度,事實上一個數(shù)據(jù)立方體可以包含128個維度。數(shù)據(jù)立方體在處理時預先計算好一些匯總數(shù)據(jù),稱為聚合。聚合提供了一種便于使用、快捷且響應時間一致的數(shù)據(jù)查詢機制。數(shù)據(jù)立方體在邏輯上一般由一個事實數(shù)據(jù)表和多個維度表構成一種星形構架(如圖1.7,其核心是事實數(shù)

33、據(jù)表。事實數(shù)據(jù)表是數(shù)據(jù)立方體中度量值的源,維度表是數(shù)據(jù)立方體中維度的源。地理空間數(shù)據(jù)立方體涉及的概念包括:1. 維度是數(shù)據(jù)立方體的一種結構特性,是描述事實數(shù)據(jù)表中數(shù)據(jù)級別的有組織的層次結構。這些級別通常描述相似成員的集合,用戶要根據(jù)它們進行分析。例如,某個地理維度可能包括國家、省以及城市等級別。在地理空間數(shù)據(jù)立方體中有三種維度類型:(1非空間維度:包含非空間信息,如城市名稱、城市人口數(shù)、氣溫、濕度等。(2空間-非空間維度:該維度的初始數(shù)據(jù)是空間維度,其解釋數(shù)據(jù)變?yōu)榉强臻g維度。例如,作為空間維度的城市分布是中國地圖的一部分,假設該城市分布被表達為“長江以北”,盡管“長江以北”是一個空間概念,但它

34、從表達上是一個字符型,屬于非空間維度。(3空間-空間維度:初始數(shù)據(jù)和解釋數(shù)據(jù)均為空間維度。例如,等溫區(qū)維度包含空間數(shù)據(jù),其解釋數(shù)據(jù)為05、510區(qū)域的空間維度數(shù)據(jù)。2. 度量值是在數(shù)據(jù)立方體內(nèi)基于該數(shù)據(jù)立方體的事實數(shù)據(jù)表中某列的一組值,它們通常是數(shù)字。度量值是進行聚合和分析的主要數(shù)值??臻g數(shù)據(jù)立方體的度量值有兩種類型: (1數(shù)值度量:僅包含數(shù)字數(shù)據(jù)。例如,已知一個區(qū)域的人均月收入,便能計算總體收入(年、國家等。(2空間度量:包含空間目標的指示性聚集信息。例如,相同的溫度和風力范圍的區(qū)域可以被合成為一單元。1. OLAP 概念地區(qū)維度表圖1.7 東北地區(qū)天氣數(shù)據(jù)立方體星形構架已不能滿足終端用戶對

35、數(shù)據(jù)庫查詢分析的需要,SQL 對大型數(shù)據(jù)庫的簡單查詢也無法滿足用戶分析的需求,因此提出了多維數(shù)據(jù)庫和多維分析的概念,即OLAP 。OLAP 是共享多維信息的、針對特定問題的聯(lián)機數(shù)據(jù)訪問和分析的軟件技術,具有匯總、合并、聚集以及從不同角度觀察消息的能力。它可以跨越空間數(shù)據(jù)庫模式的多個版本,處理來自不同組織的信息和由多個數(shù)據(jù)存儲集成的信息。聯(lián)機分析處理對空間數(shù)據(jù)立方體進行的多維數(shù)據(jù)分析主要有切塊、切片、旋轉(zhuǎn)、鉆取等分析動作,目的是進行跨維、跨層次的計算與建模。在多維空間數(shù)據(jù)結構中,按二維進行切片,按某一維進行切塊,對片、塊或整個多維數(shù)據(jù)庫在維數(shù)不變的前提下通過改變維的層次或位置,進行數(shù)據(jù)鉆取和旋轉(zhuǎn)

36、。利用OLAP 對空間數(shù)據(jù)立方體進行多維分析的一般過程是:先按某一維切塊得到關注的內(nèi)容,然后鉆取空間數(shù)據(jù)到達適當?shù)木C合層次,再通過旋轉(zhuǎn)動作更換空間數(shù)據(jù)觀察角度,選取重要的空間數(shù)據(jù)進行切片分析。每個環(huán)節(jié)可能有一定的重復,但是經(jīng)過如此切片、切塊、旋轉(zhuǎn)、鉆取可以形成對空間數(shù)據(jù)新的觀察角度和綜合層次,可能提取出有價值的空間信息,得到潛在知識。2. OLAP 與地理空間數(shù)據(jù)立方體OLAP 和地理空間數(shù)據(jù)立方體密不可分,但兩者概念內(nèi)涵不同。如前所述,地理空間數(shù)據(jù)立方體中的數(shù)據(jù)不能用于聯(lián)機事物處理系統(tǒng)(OLTP ,而OLAP 技術則可利用數(shù)據(jù)立方體中的數(shù)據(jù)進行聯(lián)機分析,將復雜的分析查詢結果快速地返回用戶。O

37、LAP 利用多維數(shù)據(jù)集和數(shù)據(jù)聚集技術對數(shù)據(jù)倉庫中的數(shù)據(jù)進行組織和匯總,用聯(lián)機分析和可視化工具對這些數(shù)據(jù)迅速進行評價。從圖1.8中可以發(fā)現(xiàn),OLAP 用多維結構表示空間數(shù)據(jù)立方體中的數(shù)據(jù),有效地滿足用戶復雜查詢的要求。因此,空間數(shù)據(jù)立方體的結構將直接影響立方體的設計和構造,進而影響OLAP 的工作效率。 1. 地理空間統(tǒng)計方法地理空間統(tǒng)計是指分析地理空間數(shù)據(jù)的統(tǒng)計方法,主要是基于空間中鄰近的要素通常比相離較遠的要素具有較高的相似性這一原理。它是通過空間位置建立數(shù)據(jù)間的統(tǒng)計關系,其應用范圍極廣,包括地質(zhì)、大氣、水文、生態(tài)、天文、遙測、地震、環(huán)境監(jiān)測、流行病及影像處理等。事實上,除極少數(shù)情況外,真實

38、世界的空間數(shù)據(jù)大多無法僅基于物理化學機制用簡單的公式來描述。為解決數(shù)據(jù)中所隱含的空間不確定因素,地理空間統(tǒng)計模型嘗試從凌亂的地理空間數(shù)據(jù)中,用統(tǒng)計方法發(fā)掘地理空間變化規(guī)律。地理空間統(tǒng)計分析與傳統(tǒng)分析主要有兩大差異:(1空間數(shù)據(jù)間并非獨立,而是在D 維空間中具有某種空間相關性,且在不同的空間分辨率下呈現(xiàn)不同的相關程度;(2大多數(shù)空間問題僅有一組(不規(guī)則分布空間中觀測值,而無重復觀測的資料。因此,真正地了解與數(shù)據(jù)準備區(qū)端圖1.8 地理空間數(shù)據(jù)立方體與OLAP 的關系描述空間現(xiàn)象是極為復雜的任務。傳統(tǒng)的統(tǒng)計分析技術,特別是基于獨立樣本的統(tǒng)計方法,并不適于分析處理空間數(shù)據(jù)。而地理空間統(tǒng)計分析與時間序列

39、分析最大的差異在于空間中并無過去、未來的次序,因而不易透過某種因果關系的描述來建構空間模型。目前地理空間統(tǒng)計模型大致可分為三類:地統(tǒng)計(Geostatistics、格網(wǎng)空間模型(Spatial Lattice Model和空間點分布形態(tài)(Spatial Point Pattern(如表1.1。地統(tǒng)計是以區(qū)域化變量理論為基礎,以變差函數(shù)為主要工具,研究空間分布上既具有隨機性又具有結構性的自然現(xiàn)象的科學。它可以根據(jù)離散數(shù)據(jù)生成連續(xù)表面,通過空間自相關進行空間預測。格網(wǎng)空間模型用以描述分布于有限(或無窮離散空間點(或區(qū)域上數(shù)據(jù)的空間關系。例如,在流行病學中通過地理區(qū)域(如縣市、鄉(xiāng)鎮(zhèn)的發(fā)病人數(shù)數(shù)據(jù)研究

40、疾病發(fā)生率與地理位置的關系,在影像處理中利用扭曲或帶有噪聲的數(shù)字影像(如醫(yī)學或衛(wèi)星影像數(shù)據(jù),重建背后的真實影像等。在自然科學研究中,許多資料是由點(或小區(qū)域所構成的集合,比如,地震發(fā)生地點分布、樹木在森林中的分布、某種鳥類鳥巢的分布、生物組織中細胞核的分布,太空中星球的分布等,稱之為空間點分布形態(tài),其中點的位置為事件。由于形成機制不同,空間點分布形態(tài)具有隨機、叢聚或規(guī)則等不同類型?;诳臻g點分布形態(tài)的研究,可以找尋叢聚所在,并了解其形成的原因及其可能的影響。空間點分布形態(tài)通常由一個D維的空間點過程描述。此類模型的隨機機制在于位置本身,其中最基本的空間點過程為均勻泊松點過程,通常用于定義所謂完全

41、空間隨機的點分布形態(tài),并與叢聚或規(guī)則的分布區(qū)別開來。表1.1數(shù)據(jù)類型與統(tǒng)計模型 空間數(shù)據(jù)統(tǒng)計分析是分析空間數(shù)據(jù)廣泛使用的一種方法,能夠很好地處理數(shù)字數(shù)據(jù),提出空間現(xiàn)象的現(xiàn)實模型。然而,需要指出的是統(tǒng)計分析方法往往假設在空間中分布的數(shù)據(jù)具有統(tǒng)計獨立性,而在現(xiàn)實中,空間物體相關性很大。此外,絕大多數(shù)統(tǒng)計模型需要在有豐富領域知識和統(tǒng)計專門技術的專家的協(xié)助下才能實現(xiàn)。而且,統(tǒng)計模型不能很好地處理字符值、不完整或非確定性數(shù)據(jù)。2.地理空間聚類方法地理空間數(shù)據(jù)聚類是按照某種距離度量準則,在大型、多維數(shù)據(jù)集中標識出聚類或稠密分布的區(qū)域(如圖1.9,從而發(fā)現(xiàn)數(shù)據(jù)集的整體空間分布模式。該方法把空間數(shù)據(jù)庫中的對象

42、分為有意義的子類,使同一子類內(nèi)部的成員有盡可能多的相同屬性,而不同的子類之間差異較大。比如,空間聚類方法可以將距離很近的、散布的居民點聚類成居民區(qū),也可將精準農(nóng)業(yè)中的作物產(chǎn)量圖聚類成高、中、低產(chǎn)區(qū)。事實上,聚類分析技術把大型數(shù)據(jù)庫分為多個較小的部分,采用“分而治之”的策略使用戶可以更好地分析空間數(shù)據(jù),更容易把握大局。地理空間聚類是空間數(shù)據(jù)挖掘中的主要方法之一,對于處理海量數(shù)據(jù)、提取大型空間數(shù)據(jù)庫中的有用信息和知識具有十分重要的意義。而且在實施其他空間數(shù)據(jù)挖掘任務之前,應用空間聚類方法可大大提高挖掘精度與效率。目前,地理空間聚類方法主要有四類:分割法、層次法、基于密度的方法及基于網(wǎng)格的方法。而經(jīng)

43、典聚類法包括K-mean、K-meriod、ISODATA等。近年來,圍繞DMKD領域發(fā)展了CLARANS(Ng R.et al.,1994、DBSCAN(Ester M.et al.,1996、Murray(Murray A.J.et al.,1998等算法。Kohonen 自組織特征映射網(wǎng)絡、競爭學習網(wǎng)絡等自組織神經(jīng)網(wǎng)絡方法,在空間聚類應用中亦有較好的效果。 3. 地理空間關聯(lián)分析空間數(shù)據(jù)庫存儲了大量與空間有關的數(shù)據(jù),與關系數(shù)據(jù)庫存在很大區(qū)別??臻g數(shù)據(jù)表現(xiàn)了地理空間實體的位置、大小、形狀、方向及幾何拓撲關系。地理空間關聯(lián)分析利用空間關聯(lián)規(guī)則提取算法發(fā)現(xiàn)空間數(shù)據(jù)庫中空間目標間的關聯(lián)程度,是空

44、間數(shù)據(jù)庫知識發(fā)現(xiàn)研究中的一個重要研究課題。GIS 數(shù)據(jù)庫是典型的空間數(shù)據(jù)庫,從GIS 數(shù)據(jù)庫中挖掘空間關聯(lián)規(guī)則是理解GIS 模型和將GIS 數(shù)據(jù)轉(zhuǎn)化成知識的一種有效方法。地理空間關聯(lián)分析的核心內(nèi)容是挖掘空間關聯(lián)規(guī)則??臻g關聯(lián)規(guī)則是指空間目標間相鄰(如村落與道路相鄰、相連(如火車站與鐵路相連、共生(如蒙古包與草場的關系、包含(如區(qū)域中包含的城市等空間相關關系。具體而言,空間關聯(lián)規(guī)則中包含各種不同的空間謂詞,它們不但可以表示空間對象之間的拓撲關系(如相交、不相交、相鄰等,還可以表示空間方位、排列次序(如東、西、南、北等以及距離信息(如靠近、遠離等。空間關聯(lián)規(guī)則指明了空間謂詞與非空間謂詞間存在的關聯(lián)

45、性。例如,通過挖掘GIS 數(shù)據(jù)庫,可能發(fā)現(xiàn)“靠近海灘的房屋”有90%“價格很貴”,“加油站”有75%“靠近高速公路”等??臻g關聯(lián)規(guī)則提取算法并不唯一,較常用的是利用MBR 技術、R+樹及其他快速方法進行空間分析,并采用概念層次樹對拓撲關系進行概化形成拓撲關系數(shù)據(jù)表,從而提取關聯(lián)規(guī)則。4. 地理空間分類與預測分析地理空間分類與預測是根據(jù)已知的分類模型把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中,進行數(shù)據(jù)趨勢預測分析的方法。分類是將數(shù)據(jù)庫中的對象根據(jù)一定的意義劃分為若干個子集。它和聚類算法的差別在于:聚類算法是根據(jù)一定要求將對象聚為一個集合,最后得到的分布模式是聚類之前未確知的;分類算法則是根據(jù)已知分布模式的

46、屬性要求,將數(shù)據(jù)庫對象歸入相應的分類中。在機器學習中,數(shù)據(jù)分類一般稱為監(jiān)督學習,而數(shù)據(jù)聚類則稱為非監(jiān)督學習。分類目的是通過學習完全的空間任意分布聚集型分布 分散型分布1 12 2 2 23 3 3 3 3 34 1:極密 2:密 3:一般密 4:稀疏圖1.9 地理空間聚類確定一個分類模型(或分類器,該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中。地理空間數(shù)據(jù)分類包括兩個步驟(圖1.10。第一步通過分析數(shù)據(jù)庫中各數(shù)據(jù)行的內(nèi)容建立一個分類模型(分類器,描述已知數(shù)據(jù)集類別或概念。第二步利用所獲得的分類模型(分類器進行分類操作。首先對模型分類的準確率進行評估,若分類準確率可以被用戶接受,則利用該分類器對目

47、標數(shù)據(jù)庫進行分類。分類器的典型構造方法有決策樹法、貝葉斯法、神經(jīng)網(wǎng)絡法、近鄰學習或基于案例學習等方法。 預測是利用歷史數(shù)據(jù)記錄自動推導出對給定數(shù)據(jù)的推廣描述,實現(xiàn)對未來數(shù)據(jù)的趨勢分析。分類和回歸都可用于預測,空間回歸規(guī)則與空間分類規(guī)則相似,也是一種分類器,其差別在于空間分類規(guī)則的預測值是離散的,空間回歸規(guī)則的預測值是連續(xù)的。二者常表現(xiàn)為一棵決策樹,根據(jù)數(shù)據(jù)值從樹根開始搜索,沿著滿足條件的分支往上走,走到樹葉就能確定類別??臻g分類或回歸的規(guī)則是普及知識,實質(zhì)是對給定數(shù)據(jù)對象集的抽象和概括,可用宏元組表示。5. 異常值分析若一個數(shù)據(jù)庫包含的數(shù)據(jù)目標與通常的行為或數(shù)據(jù)模型不一致,則這些數(shù)據(jù)目標被稱為

48、異常值。絕大多數(shù)數(shù)據(jù)挖掘方法把異常值作為噪音或例外數(shù)據(jù),然而,在很多情況下這將會導致重要隱含信息的丟失。從另一角度講,異常值是內(nèi)在數(shù)據(jù)可變性的必然結果。例如,與我國其他城市的商業(yè)產(chǎn)值相比,我國經(jīng)濟中心上海市的商業(yè)產(chǎn)值很自然地成為一個異常值出現(xiàn)。在一些應用,如贗品檢測、定制買賣、數(shù)值分析等任務中,異常值分析有很重要的價值。一個人認為的噪音可能是其他人所需的重要信息,稀有事件往往比規(guī)律發(fā)生的事件更能說明問題。因此,異常值檢測與分析也是一項重要的數(shù)據(jù)挖掘技術。基于計算機的異常值分析方法主要有三種:基于統(tǒng)計的異常值分析;基于距離的異常值探測;基于偏差的異常值探測。聚類分析方法將異常值視為噪聲,事實上可

49、以將異常值探測作為聚類分析的副產(chǎn)品。另外,由于人眼能夠迅速、有效地觀察出異常數(shù)據(jù),利用數(shù)據(jù)可視化方法探測異常值可以說是一個明智之舉。需要指出的是,人眼只擅長于數(shù)字數(shù)據(jù)或二維、三維數(shù)據(jù),在探測多種類屬圖1.10 數(shù)據(jù)分類過程 (a 學習過程 (b 分類過程性數(shù)據(jù)或高維數(shù)據(jù)時,數(shù)據(jù)可視化方法沒有優(yōu)勢。1.3GIS環(huán)境下的空間分析1.空間分析的定義空間分析(Spatial Analysis,SA是地理學的精髓,是為解答地理空間問題而進行的數(shù)據(jù)分析與挖掘。目前,比較典型的空間分析定義有如下幾種:空間分析是對數(shù)據(jù)的空間信息、屬性信息或二者共同信息的統(tǒng)計描述或說明(Goodchild,1987??臻g分析是

50、對于地理空間現(xiàn)象的定量研究,其常規(guī)能力是操縱空間數(shù)據(jù)成為不同的形式,并且提取其潛在信息(Openshaw,1997;Baily et al.,1995??臻g分析是基于地理對象空間布局的地理數(shù)據(jù)分析技術(Robert Haining,1990??臻g查詢和空間分析是從GIS目標之間的空間關系中獲取派生的信息和新的知識(李德仁,1993。空間分析是指為制定規(guī)劃和決策,應用邏輯或數(shù)學模型分析空間數(shù)據(jù)或空間觀測值(Landis.J, 1995。空間分析是基于地理對象的位置和形態(tài)特征的空間數(shù)據(jù)分析技術,其目的在于提取和傳輸空間信息(郭仁忠,1996。GIS空間分析是從一個或多個空間數(shù)據(jù)圖層獲取信息的過程(

51、DeMers,1997??臻g分析是集空間數(shù)據(jù)分析和空間模擬于一體的技術方法,通過地理計算和空間表達挖掘潛在空間信息,以解決實際問題??臻g分析的本質(zhì)特征包括:(1探測空間數(shù)據(jù)中的模式;(2研究空間數(shù)據(jù)間的關系并建立相應的空間數(shù)據(jù)模型;(3提高適合于所有觀察模式處理過程的理解;(4改進發(fā)生地理空間事件的預測能力和控制能力。2.空間分析的研究對象空間分析主要通過對空間數(shù)據(jù)和空間模型的聯(lián)合分析來挖掘空間目標的潛在信息??臻g目標是空間分析的具體研究對象??臻g目標具有空間位置、分布、形態(tài)、空間關系(距離、方位、拓撲、相關場等基本特征??臻g關系是指地理實體之間存在的與空間特性有關的關系,是刻畫數(shù)據(jù)組織、查詢

52、、分析和推理的基礎。不同類型的空間目標具有不同的形態(tài)結構描述,對形態(tài)結構的分析稱為形態(tài)分析。例如,可以將地理空間目標劃分為點、線、面和體四大類要素,點具有位置這一形態(tài)結構,線具有長度、方向等形態(tài)結構??紤]到空間目標兼有幾何數(shù)據(jù)和屬性數(shù)據(jù)的描述,因此必須聯(lián)合幾何數(shù)據(jù)和屬性數(shù)據(jù)進行分析。空間數(shù)據(jù)分析實際上是對空間數(shù)據(jù)一系列的運算和查詢。不同的應用具有不同的運算和不同的查詢內(nèi)容、方式、過程。應用模型是在對具體對象與過程進行大量專業(yè)研究的基礎上總結出來的客觀規(guī)律的抽象,將它們歸結成一系列典型的運算與查詢命令,可以解決某一類專業(yè)的空間分析任務。3. 空間分析的研究目標空間分析是指用于分析地理事件的一系列

53、技術,分析結果依賴于事件的空間分布,面向最終用戶。其主要目標有:認知。有效獲取空間數(shù)據(jù),并對其進行科學的組織描述,利用數(shù)據(jù)再現(xiàn)事物本身,例如繪制風險圖。解釋。理解和解釋地理空間數(shù)據(jù)的背景過程,認識事件的本質(zhì)規(guī)律,例如住房價格中的地理鄰居效應。預報。在了解、掌握事件發(fā)生現(xiàn)狀與規(guī)律的前提下,運用有關預測模型對未來的狀況做出預測,例如傳染病的爆發(fā)。調(diào)控。對地理空間發(fā)生的事件進行調(diào)控,例如合理分配資源??傊?空間分析的根本目標是建立有效的空間數(shù)據(jù)模型來表達地理實體的時空特性,發(fā)展面向應用的時空分析模擬方法,以數(shù)字化方式動態(tài)地、全局地描述地理實體和地理現(xiàn)象的空間分布關系,從而反映地理實體的內(nèi)在規(guī)律和變化

54、趨勢。GIS空間分析實際是一種對GIS 海量地球空間數(shù)據(jù)的增值操作??臻g分析在地理學研究中有著悠久的傳統(tǒng)與歷史。從某種意義上講,空間分析孕育了地理學。在古代,人類出于生存和發(fā)展的需要,要學會分析周圍地理事物的空間關系,因而始終在進行著各種類型的空間分析。作為地理學的第二語言,地圖的出現(xiàn)使人類的空間分析能力大大增強。從1863年Lalanne L.提出六邊形軌道模式到1963年Tobler W. R.提出圖像轉(zhuǎn)換方法,前GIS時期的地圖學家對地理空間數(shù)據(jù)“自我表述”方法極為感興趣。為使地圖有助于空間分析,地理學家試圖尋找一種能以形象方式描述數(shù)據(jù)空間分布的方法,這就是早期的空間統(tǒng)計方法。地圖研究者

55、一方面研究空間數(shù)據(jù)表達及空間數(shù)據(jù)歸納,一方面借助統(tǒng)計學等數(shù)學手段,探索從地圖中提取盡可能多信息的方法。長期以來,人們在地圖上量測各種地理要素間的距離、方位、面積,或者利用地圖進行信息疊加與合成,也基于地圖進行較高層次的信息分析,例如社會、經(jīng)濟、文化和軍事等領域的各種區(qū)域性決策。隨著地圖理論與應用的廣泛深入,物理、數(shù)學概念與方法的不斷引入以及地學各分支的發(fā)展,傳統(tǒng)的空間分析能力大大加強,人們對地圖表達空間信息的理解與解譯能力顯著提高。比如,交通部門進行公路選線,需要使修建和運營費用最小,解決這一問題要考慮坡度、地面覆蓋物、水系、填挖的土石方量等多個因素。可以從多張地圖上抽取相關信息,進行地圖投影

56、轉(zhuǎn)換、量測、傳統(tǒng)疊加(即將來自不同數(shù)據(jù)源的圖紙繪于透明紙上,在透光桌上將其疊放在一起,然后用筆勾出所需信息等分析處理,最終達到所選線路最安全、費用最小等目標。現(xiàn)代“空間分析”概念的提出源于20世紀60年代地理與區(qū)域科學的計量革命。初始階段主要是應用統(tǒng)計分析方法,定量描述點、線、面的空間分布模式,后期逐漸強調(diào)地理空間本身的特征、空間決策過程和復雜空間系統(tǒng)的時空演化過程。地理信息系統(tǒng)把人們從過去繁重的手工操作中解脫出來,集成了多學科的最新技術和所能利用的空間分析方法,包括關系數(shù)據(jù)庫管理、高效圖形算法、插值、區(qū)劃和網(wǎng)絡分析等,為解決地理空間問題提供了便捷途徑,空間分析能力發(fā)生了質(zhì)的飛躍。新一代空間分

57、析的主要目的是從現(xiàn)有數(shù)據(jù)的空間關系中挖掘新的信息。探測性空間分析方法不僅可以揭示空間數(shù)據(jù)庫中許多非直觀的內(nèi)容,如空間異常點、層次關系、時域變化及空間交互模型,還可以揭示用傳統(tǒng)地圖不能辨明的數(shù)據(jù)模式和趨勢。在地理信息系統(tǒng)的數(shù)字環(huán)境中,數(shù)據(jù)的比例尺能夠很方便地改變,能將不同的數(shù)據(jù)媒介如文字、聲音、圖形和影像連接在一起。數(shù)字環(huán)境表明了物體空間上的接近及鄰近關系,也提供物體間的相互作用,以及文化、貿(mào)易和社會網(wǎng)絡的聯(lián)系。比如上例中利用地理信息系統(tǒng)軟件進行公路選線,其量測與疊加等工作都在計算機內(nèi)進行,與傳統(tǒng)空間分析相比提高了工作效率,減小了計算誤差。隨著GIS技術的不斷進步,空間分析成為地理信息系統(tǒng)的核心

58、,是地理信息系統(tǒng)區(qū)別于一般空間數(shù)據(jù)庫和普通制圖系統(tǒng)的標志?!皬哪撤N意義上講,空間分析與GIS間的關系類似于統(tǒng)計學與統(tǒng)計軟件包間的關系”(Goodchild,1988。空間分析涉及地理空間數(shù)據(jù)的分析、計算、表達等內(nèi)容,與一般的數(shù)據(jù)分析方法不同,它強調(diào)事件(如森林火災或參數(shù)(如地面溫度的時空變化。用戶利用空間分析技術,通過對原始數(shù)據(jù)模型的觀察與實驗,可以獲得新的信息和知識,并以此作為空間行為的決策依據(jù)??臻g分析方法從簡單到復雜,簡單的方法如兩個地物之間的空間距離量測,復雜的方法如對全球氣候變化過程的數(shù)值模擬。空間分析技術可以分為驗證性和探索性兩大類,如何選擇不同的空間分析方法主要取決于空間數(shù)據(jù)的特征和應用目標。傳統(tǒng)的空間分析方法包括空間信息量算、空間信息分類、空間信息疊加、網(wǎng)絡分析、鄰域分析、地統(tǒng)計分析等多方面,這些分析方法在一般GIS 軟件中都已經(jīng)實現(xiàn)??臻g插值、探測性數(shù)據(jù)分析(描述性統(tǒng)計、解釋性分析和確定性數(shù)據(jù)分析(統(tǒng)計推論和模型的發(fā)展與測試等技術也不斷發(fā)展與完善。為了適應空間分析新需求的挑戰(zhàn),計算機領域的智能計算技術提供了一系列適應地理空間數(shù)據(jù)的高性能計算模型,并重點強調(diào)在數(shù)據(jù)豐富的計算環(huán)境中所產(chǎn)生的空間分析新方法,包括神經(jīng)網(wǎng)絡、模擬退火、遺

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論