




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章
空間數(shù)據(jù)查詢、分析及應用模型主要內容空間數(shù)據(jù)的查詢空間數(shù)據(jù)的分析空間分析的模型方法應用分析模型與GIS系統(tǒng)工具的集成和GIS應用系統(tǒng)的環(huán)境模式天津理工大學第一節(jié)空間數(shù)據(jù)的查詢空間數(shù)據(jù)查詢的含義空間數(shù)據(jù)查詢的方式查詢結果的顯示方式天津理工大學空間數(shù)據(jù)查詢的含義空間數(shù)據(jù)查詢就是指:作用在GIS數(shù)據(jù)上的函數(shù),它返回滿足條件的內容。
查詢是GIS用戶最經常使用的功能,用戶提出的很大一部分問題都可以以查詢的方式解決,查詢的方法和查詢的范圍在很大程度上決定了GIS的應用程度和應用水平。
天津理工大學空間數(shù)據(jù)查詢的方式基于屬性數(shù)據(jù)的查詢基于圖形數(shù)據(jù)的查詢圖形屬性混合查詢模糊查詢自然語言空間查詢超文本查詢符號查詢天津理工大學基于屬性數(shù)據(jù)的查詢:根據(jù)空間目標的屬性數(shù)據(jù)來查詢該目標的其他屬性信息或者相應的圖形信息。屬性屬性屬性圖形天津理工大學基于圖形數(shù)據(jù)的查詢:基于圖形的查詢是可視化的查詢,用戶通過在屏幕上選取地物目標來查詢其對應的圖形和屬性信息。 基于圖形的查詢包括兩種方式:區(qū)域查詢和點選查詢。天津理工大學圖形與屬性的混合查詢:圖形與屬性的混合查詢是指查詢條件同時包括了圖形部分的內容和屬性方面的內容,查詢結果集應該同時滿足這兩個方面的要求。天津理工大學模糊查詢:一般意義上的模糊查詢指的是限定需要查詢的數(shù)據(jù)項的部分內容,查詢所有數(shù)據(jù)項中具有該內容的數(shù)據(jù)庫記錄。天津理工大學自然語言空間查詢:所謂自然語言查詢就是在GIS的數(shù)據(jù)查詢中引入人類使用的自然語言(區(qū)別于程序語言和數(shù)據(jù)庫SQL語言),通過簡單而意義直接的自然語言來表達數(shù)據(jù)查詢的要求。天津理工大學超文本查詢:超文本方式查詢是一種基于IE瀏覽器的查詢,在瀏覽器里面,可以把圖形、圖像、字符等皆當作文本,并設置一些“熱點”(HotSpot),“熱點”可以是文本、鍵、圖形或者其部分等。用戶用鼠標點擊“熱點”后,瀏覽器可以彈出說明信息、播放聲音、完成某項工作等,這些信息往往都是與該目標相關聯(lián)的信息,從而達到“查詢”的目的。但超文本查詢只能預先設置好,用戶不能實時構建自己要求的各種查詢。天津理工大學符號查詢:地物在GIS中都是以一定的符號系統(tǒng)表示的,系統(tǒng)應該提供根據(jù)地物符號來進行查詢的功能。 其實質是通過用戶指定某種符號,在符號庫中查詢其代表的地物類型,在屬性庫中查詢該地物屬性信息或者圖形信息。天津理工大學查詢結果的顯示方式地圖:空間數(shù)據(jù)的最佳表示方式。選定參數(shù),基于SQL查詢天津理工大學第二節(jié)空間數(shù)據(jù)的分析空間分析是基于空間數(shù)據(jù)的分析技術,它以地學原理為依托,通過分析算法,從空間數(shù)據(jù)中獲取有關地理對象的空間位置,空間分布、空間形態(tài)、空間形成、空間演變等信息。目的——通過對空間數(shù)據(jù)的深加工或分析,獲取新的信息,為空間行為提供決策依據(jù)。天津理工大學空間數(shù)據(jù)的緩沖區(qū)分析空間數(shù)據(jù)的疊置分析空間數(shù)據(jù)的網絡分析空間數(shù)據(jù)的統(tǒng)計分析空間數(shù)據(jù)的泰森多邊形分析天津理工大學緩沖區(qū)分析概念——是指圍繞地理要素的一定寬度的區(qū)域性。緩沖區(qū)分析是指根據(jù)分析對象的點、線、面實體、自動建立它們周圍一定距離的帶狀區(qū),用來確定這些實體的輻射范圍和影響度。天津理工大學分類數(shù)據(jù)類型分基于矢量數(shù)據(jù)的緩沖區(qū)分析基于柵格數(shù)據(jù)的緩沖區(qū)分析從圖形分點緩沖區(qū)先緩沖區(qū)面緩沖區(qū)天津理工大學作用:一般用于求地理實體的影響范圍,即鄰近度的問題如道路的噪聲影響范圍就是沿道路建一定寬度的緩沖區(qū),車流量決定緩沖區(qū)的半徑。如某地區(qū)有危險品倉庫,要分析一旦倉庫爆炸所涉及的范圍,這就需要進行點緩沖區(qū)分析。如果要分析因為道路改造需拆除的建筑物和需要搬遷的居民,則需要進行線緩沖區(qū)分析。緩沖區(qū)的作用天津理工大學天津理工大學基于矢量數(shù)據(jù)的緩沖區(qū)的建立天津理工大學天津理工大學線類主體對兩側鄰近對象施加的作用和強度不同-----不對稱緩沖區(qū)天津理工大學天津理工大學天津理工大學天津理工大學天津理工大學柵格數(shù)據(jù)的緩沖區(qū)分析相對于矢量數(shù)據(jù),柵格數(shù)據(jù)的緩沖區(qū)分析操作較為簡單。在柵格數(shù)據(jù)中可以將緩沖區(qū)看作是對網格單元向其周圍8個方向進行一定距離的擴展。種子擴展算法是一種典型的建立柵格數(shù)據(jù)緩沖區(qū)的方法。單個網格單元的緩沖區(qū)天津理工大學天津理工大學疊置(合)分析天津理工大學天津理工大學12AB2A1A1B2B10a12bcdefgab……………………區(qū)域類型數(shù)面積101143合成疊合統(tǒng)計疊合地貌圖土壤圖合成圖土壤圖行政圖統(tǒng)計表11天津理工大學天津理工大學天津理工大學類型:點與多邊形疊合線與多邊形疊合多邊形與多邊形疊合天津理工大學天津理工大學1234ACBD點號屬性1屬性2多邊形號屬性31A2C3B4D點與多邊形疊合分析天津理工大學天津理工大學線號原線號多邊形號11B21C32C43C線與多邊形疊合分析213BACD天津理工大學天津理工大學多邊形與多邊形疊合將兩個或多個多邊形圖層進行疊合產生一個新多邊形圖層的操作,其結果將原來多邊形要素分割成新要素,新要素綜合了原來兩層或多層的屬性。疊合過程可分為幾何求交過程和屬性分配過程兩步。被疊合的多邊形——本底多邊形用來疊合的多邊形——上覆多邊形產生的具有多重屬性的多邊形————新多邊形天津理工大學幾何求交過程首先求出所有多邊形邊界線的交點,再根據(jù)這些交點重新進行多邊形拓撲運算,對新生成的拓撲多邊形圖層的每個對象賦以多邊形唯一標識碼,同時生成一個與新多邊形對象一一對應的屬性表。屬性分配過程最典型的方法是將輸入圖層對象的屬性拷貝到新對象的屬性表中,或把輸入圖層對象的標識作為外鍵,直接關聯(lián)到輸入圖層的屬性表。也可以結合多種統(tǒng)計方法為新多邊形賦屬性值。天津理工大學疊加分析實例AB123451B2B1A2A4A3A5B3B4B降雨量土壤類型適宜農作物矢量圖層疊加分析天津理工大學天津理工大學柵格圖層疊加分析柵格圖層疊加天津理工大學天津理工大學天津理工大學應用如何得到某市區(qū)內危險化學品儲存場所的個數(shù)?如何知道某省區(qū)內雨量站點的個數(shù)?如何獲得某城市的消防所分布的密度?……….天津理工大學柵格數(shù)據(jù)的空間疊置分析在GIS中基于柵格數(shù)據(jù)的空間疊置分析有時是必要的,并且算法比基于矢量的空間疊置分析要簡單的多,柵格數(shù)據(jù)的空間疊置分析可以概括為三種變換運算:點變換區(qū)域變換鄰域變換天津理工大學點變換
是指對單個柵格單元進行屬性值的運算,點變換函數(shù)不受鄰域點上屬性值的影響,也不受區(qū)域內一般特征的影響.其運算函數(shù)可以是加、減、乘、除、指數(shù)、對數(shù)、三角函數(shù)等。天津理工大學主要的點變換算法原理:賦常數(shù)(constant):將上一層所有的像元賦予一個常數(shù)加法(Add):各層上屬性相加得到新層上相應點的值減法(Substract):兩層上對應點的屬性相減覆蓋(Cover),用第二幅圖上的非零像元覆蓋第一幅圖產生新圖。天津理工大學提取(Extract):從一層上選取特定屬性值或值的區(qū)間產生新層分類(Slice):將連續(xù)值按數(shù)據(jù)區(qū)間分成類別邏輯組合(Cross):把幾幅圖的屬性按布爾邏輯關系組合成新圖。天津理工大學區(qū)域變換:指在計算新層屬性時,不僅與原疊置層的柵格屬性值有關,也與柵格所在地的區(qū)域長度、范圍、周長、形狀有關,與原圖層同名柵格的個數(shù)有關。天津理工大學主要變換函數(shù):按面積分類(SIZE):按計算出的每個區(qū)域的面積大小和輸出地圖的要求重新給予每個區(qū)域一個名稱。確定區(qū)域形狀(RULER):確定一定區(qū)域的形狀和某一層上分離開的區(qū)域數(shù)量。天津理工大學鄰域變換:P163指在計算新層屬性時,不僅考慮疊置層對應柵格本身和其它屬性值相同的區(qū)域,而且也要考慮與該柵格相關聯(lián)的鄰域或影響半徑范圍內的柵格屬性值的影響。天津理工大學例:洪水淹沒損失估算損失與如下因素有關(1)地形高程,高程值大于500米的范圍不受洪水淹沒,由高程多邊形的最大高程屬性(Hight)決定。(2)土地使用,只對住宅用地分析,由地塊多邊形的土地使用屬性(landuse)決定(3)地基類型,房屋的損失在差地基上比好地基上大,由地基損失參數(shù)表(found,dbf)中的地基類型(Class)和損失系數(shù)確定。(4)地塊上居民的財產,由地塊的估計財產屬性(Value)決定。天津理工大學疊置分析的步驟確定空間分析的目標與標準準備空間操作的數(shù)據(jù)空間操作為表格分析準備數(shù)據(jù)表格分析評價并解釋分析結果進一步分析結果產生分析結果天津理工大學天津理工大學數(shù)據(jù)處理過程計算地塊財產密度空間疊合計算疊合后的多邊形面積計算地塊估計損失、地塊損失密度過濾地塊,表達分析結果。天津理工大學天津理工大學天津理工大學天津理工大學計算結果為疊合后多邊形的面積天津理工大學天津理工大學天津理工大學天津理工大學天津理工大學天津理工大學天津理工大學天津理工大學天津理工大學天津理工大學天津理工大學空間數(shù)據(jù)的網絡分析概念 空間網絡分析(spacialnetworkanalysis)是GIS空間分析的重要組成部分。網絡是一個由點、線的二元關系構成的系統(tǒng),通常用來描述某種資源或物質在空間上的運動。
GIS中的網絡分析是依據(jù)網絡的拓撲關系(線性實體之間,線性實體與結點之間,結點與節(jié)點之間的連接,連通關系),通過考察網絡元素的空間及屬性數(shù)據(jù),以數(shù)學理論模型為基礎,對網絡的性能特征進行多方面的一種分析計算。天津理工大學網絡的組成 一個網絡由以下基本要素組成:節(jié)點(node)鏈(links)障礙(barries)拐角(turn)中心(centers)站點(stops)天津理工大學(1)結點。網絡中任意兩條線段或路徑的交點,其屬性如方向數(shù)、資源數(shù)量等。
(2)鏈或弧段。連接兩個結點的弧段或路徑,是網絡中資源運移的通道。其屬性如資源流動的時間、速度、資源種類和數(shù)量、弧段長度等。
(3)障礙。指資源不能通過的結點,如被破壞的橋梁和禁止通行的關口等。它是惟一不表示任何屬性的元素。天津理工大學(4)拐角。在網絡的結點處,資源運移方向可能轉變,從一個鏈經結點轉向另一個鏈,例如在十字路口禁止車輛左拐,便構成拐角。其拐角的類型及其屬性描述見表5—12。
(5)中心。指網絡中具有從鏈上接受或發(fā)送資源能力的結點所在地,如水庫屬于河網的中心,學校屬于路網的中心等等。其屬性如資源最大容量、最大服務半徑等。
(6)站點。是網絡中裝卸資源的結點所在地,例如車站、碼頭等。其屬性如資源需求量,正值表示裝載量,負值表示下卸量。天津理工大學天津理工大學天津理工大學空間網絡分析方法路徑優(yōu)化(最短路徑)定位--配置分析天津理工大學路徑優(yōu)化(最短路徑) 在空間網絡分析中,路徑問題占有重要位置,人們通常比較關心網絡的兩個指定的結點之間是否存在路徑,如果有,則特別希望找出其中的最短路徑。這種路徑問題對于交通、消防、信息傳輸、救災、搶險有著重要的意義,天津理工大學例如:1、在運輸網絡中,有時要找出運費最小的路徑;2、在通訊網絡中,要找出兩點間進行信息傳遞具有最大可靠性的路徑,由于大量的最優(yōu)化問題等價于找一個網絡。。。。。。。。天津理工大學最優(yōu)(佳)路徑選擇:足球是沿最優(yōu)路徑下落天津理工大學P177-178Dijkstra算法天津理工大學無向圖G,它的距離矩陣W天津理工大學v1到v7的最短路徑的標號過程v1到v7的最短路徑的長度是7,經由路徑為v1-------v3-------v8-------v7天津理工大學天津理工大學考慮到道路的單向性,通常用有向圖表示之。在圖中,每個頂點(結點)表示一地點,邊則表示各地點之間的距離。路徑的長度是指路徑上各個邊的加權值之和。路徑的起始點稱為源點,路徑的最后一個頂點稱為終點。如:有5個地點V1,V2,V3,V4,V5相互間通路如下面有向網絡圖所示。圖中各邊上所標的數(shù)字為其具有的權重值。天津理工大學以V1為源,其到V5點的路徑為:<V1,V5>的長度為100<V1,V4,V5>為30+60=90<V1,V4,V3,V5>的長度為30+20+10=60<V1,V2,V3,V5>的長度為10+50+10=70
天津理工大學顯然路徑<V1,V4,V3,V5>長度最短。盡管它含有3條邊,但仍比含有1條邊的<V1,V5>路徑短。從源點V1到各頂點的最短路徑表源點中間點終點路徑長度V1V210V1V430V1V4V350V1V4,V3V560如何采用Dijkstra迪杰斯特拉算法上表的最短路徑?
天津理工大學Dijkstra算法實質上是一種按路徑長度遞增的次序求最短路徑:從源出發(fā),求到達其它頂點的最短路徑時,當前正在生成的最短路徑上,除終點之外,其余頂點的最短路徑均已生成。如生成V1到V5的最短路徑<V1,V4,V3,V5>時,<V1,V4,V3>的路徑已經生成。這是因為<V1,V4,V3>的路徑比<V1,V4,V3,V5>的最短路徑長度短。根據(jù)這個思路,首先求出有向圖的帶權重的鄰接矩陣W
01030100
050
W=
0
10
20060
0其中W[i,j]表示有向邊<Vi,Vj>上的權重值。若<Vi,Vj>不存在,則取W[i,j]=。若i=j則取W[i,j]=0。天津理工大學按上圖所示,從V1源出發(fā)的各邊中選出取權重值最小的邊,作為源點V1出發(fā)的最短路徑。而下一個次短路徑Vk可能是<V1,Vk>,也可能是<V1,Vj>和<Vj,Vk>權重值之和。這樣每求出某個頂點的最短路徑之后,就可能對其它尚未最終確定最短路徑的頂點的最短路徑長度產生影響。這里引入一個N維輔助向量distance(N個頂點),它的每個分量distance[i]表示當前找到從始點V到每個終點Vi的最短路徑的長度,S為已求得的最短路徑的終點的集合。算法描述可歸納成如下步驟:①求從V出發(fā)到圖上各頂點Vi(終點),可能達到的最短路徑長度的初值distance[i]。②選擇Vj,使得distance[j]=Min{distance[i]|Vi
V—S}
Vj為當前的一條從V出發(fā)的最短路徑的終點。③修改V出發(fā)到集合V—S上的所有頂點Vk可能達到的最短路徑長度。如果
distance[j]+W[j,k]<distance[k]
即找到了更短的路徑則修改
distance[k]為distance[k]=distance[j]+W[j,k]
天津理工大學④重復②和③,直到求得V到圖上的各個頂點的最短路徑長度遞增序列為止。該算法求單源最短路徑的示例如圖示。根據(jù)鄰接矩陣對有向圖執(zhí)行該算法,得下表。從V1點到其余各頂點的最短距離路徑以及運算過程中,distance向量的變化情況為:從V1開始由(a)得,最短路徑V1V2=10;由(b)得,次短路徑V1V4=30;由(c)得,更次短路徑V1V4V3=50;由(d)得,最次短路徑V1V4V3V5=60;(e)為最短路徑全貌圖。天津理工大學Dijkstra算法的執(zhí)行過程
終點V1點到各終點的值及最短路徑V10V2<V1,V2>,10distance[k]的變化情況V3
<V1,V2,V3>,60<V1,V4,V3>,50V4<V1,V4>,30<V1,V4>,30V5<V1,V5>,100<V1,V5>,100<V1,V4,V5>,90<V1,V4,V3,V5>,60VjV2,10,V4,30V3,50V5,60天津理工大學圖中W權重值矩陣Wi,j為從頂點i到j的權重值K源點(起始點)點號L終止結點點號N頂點(結點)數(shù)目數(shù)組LA(N):最短路徑長度。先記錄各結點的暫時標號,后為標號的值數(shù)組LV(N):結點定標標識。定標的置1,否則置0數(shù)組LB(N):最短路徑結點序列。記錄j點被定標時,它的上一個點i的標號,即LB(j)=i。由此可回溯求出從起點K到任意一結點最短路徑經由的點。
天津理工大學上述最短路徑分析是從某源點出發(fā)求到其它各點的最短路徑。若要求每對頂點之間的最短路徑,只要每次以一個頂點為源,重復執(zhí)行上述算法。Dijkstra算法描述和實現(xiàn)在許多教參可見:《地理信息系統(tǒng)實習教程》P146~148《地理信息系統(tǒng)實用教程》P102~105《應用地理信息系統(tǒng)設計與實現(xiàn)》P104~105天津理工大學定位-配置分析
定位-配置分析是指根據(jù)中心地理論框架,通過對供給系統(tǒng)和需求系統(tǒng)兩者空間行為相互作用的分析,來實現(xiàn)網絡設施布局的最優(yōu)化。1、若已設定需求點(如居民區(qū)),求供給點(消防站),則涉及定位問題(location);2、若已設定供給點,求需求分配點,則涉及配置問題(allocation);3、若同時求供給點和需求分配點,則涉及定位-配置問題(location-allocation)。天津理工大學定位-配置分析的算法包括P一中心問題:是要在m個候選點中,選擇P個供應點,為n個需求點服務,并使得從服務中心到需求點之間的總距離(或時間、費用)為最小。中心服務范圍的確定:中心服務范圍是指一個服務設施在給定的時間或距離內,能夠到達的區(qū)域。中心資源的分配范圍:資源分配就是將空間網絡的邊或結點,按照中心的供應量及網絡邊和結點的需求量,分配給一個中心的過程,它用來模擬空間網絡上資源的供需關系。天津理工大學設一個帶中心的空間網絡G=(V,E,C),其中:V表示空間網絡結點的集合,E表示邊的集合,C為該網絡的一個中心。若已知:1、該中心的阻值為cw,2、網絡邊eij的費用為wij,3、r表示空間網絡上任何結點到中心的(vi,ve)間的一條路徑,4、ric是該路徑的費用,那么在不考慮貨源量和需求量的情況下,中心的服務范圍應為滿足下列條件的網絡邊和結點的集合F:天津理工大學為確定該中心的服務范圍,須依次求出到服務中心費用不超過中心最大阻值的路徑,于是組成這些路徑的網絡結點和邊的集合,就構成該中心的服務范圍。天津理工大學例1天津理工大學例2天津理工大學例3天津理工大學爆管分析定義管網中某一點出現(xiàn)故障后,分析應關閉的閥門和影響的管段、用戶區(qū)域等。水、油、氣等物質網絡上管道或點設備(法門、儀表等)發(fā)生故障的分析問題。目的
對該點斷流,即檢索出全部與該點直接相連的各種斷流設備算法基于矢量數(shù)據(jù)的爆管算法基于柵格數(shù)據(jù)的爆管算法例4天津理工大學天津理工大學弧段最佳游歷方案求解(中國郵遞員問題):給定一個邊的集合和一個結點,使之由指定結點出發(fā)至少經過每條邊一次而回到起始結點。結點最佳游歷方案求解(旅行推銷員問題):給定一個起始結點、一個終止結點和若干中間結點,求解最佳路徑,使之由起點出發(fā)遍歷(不重復)全部中間結點而到達終點。例5最佳游歷方案的求解天津理工大學18世紀,東普魯土的哥尼斯城堡中有七座橋,當時有人提出:怎樣才能一次走遍七座橋,不重復,最后返回出發(fā)點。1736年,大數(shù)學家歐拉用數(shù)學方法嚴格證明了這個問題提出的走法是不可能的。天津理工大學泰森多邊形分析
GIS和地理分析中經常采用泰森多邊形進行快速插值和分析地理實體的影響區(qū)域,是解決鄰接度問題的又一常用工具。天津理工大學泰森多邊形及其特性 荷蘭氣候學家A·H·Thiessen提出了一種根據(jù)離散分布的氣象站的降雨量來計算平均降雨量的方法,即將所有相鄰氣象站連成三角形,作這些三角形各邊的垂直平分線,于是每個氣象站周圍的若干垂直平分線便圍成一個多邊形。用這個多邊形內所包含的一個唯一氣象站的降雨強度來表示這個多邊形區(qū)域內的降雨強度,并稱這個多邊形為泰森多邊形。如圖,其中虛線構成的多邊形就是泰森多邊形。泰森多邊形每個頂點是每個三角形的外接圓圓心。泰森多邊形也稱為Voronoi圖,或dirichlet圖。天津理工大學Piabcdefa'b'c'd'e'f'Pi的鄰近范圍天津理工大學Piabcdefa'b'c'd'e'f'天津理工大學泰森多邊形的特性是:
1、每個泰森多邊形內僅含有一個離散點數(shù)據(jù);
2、泰森多邊形內的點到相應離散點的距離最近;
3、位于泰森多邊形邊上的點到其兩邊的離散點的距離相等。4、泰森多邊形的邊數(shù)和其周圍離散點的個數(shù)一致。5、泰森多邊形的任意一個頂點周圍存在三個離散點,將其連成三角形后其外接圓的圓心即為該頂點,該三角形稱泰森三角形天津理工大學 泰森多邊形可用于定性分析、統(tǒng)計分析、鄰近分析等。(1)可以用離散點的性質(數(shù)據(jù))來描述泰森多邊形區(qū)域的性質;(2)判斷一個離散點與其它哪些離散點相鄰時,可根據(jù)泰森多邊形直接得出,且若泰森多邊形是n邊形,則就與n個離散點相鄰;(3)當某一數(shù)據(jù)點落入某一泰森多邊形中時,它與相應的離散點最鄰近,無需計算距離。
天津理工大學應用某一地區(qū)內有7個氣象站,測得降雨量分別為R1、R2、R3、R4、R5、R6、R7,求該地區(qū)平均降雨量。解:根據(jù)該區(qū)域圖及7個離散點,求出7個泰森多邊形,面積分別為:A1、A2、A3、A4、A5、A6、A7,平均降雨量為:天津理工大學空間數(shù)據(jù)的統(tǒng)計分析常規(guī)統(tǒng)計分析:屬性數(shù)據(jù)的集中特征數(shù)屬性數(shù)據(jù)的離散特征數(shù)空間自相關分析回歸分析趨勢分析專家打分模型統(tǒng)計數(shù)據(jù)的分類分級系統(tǒng)聚類法最優(yōu)分割分級法
天津理工大學屬性數(shù)據(jù)集中特性的參數(shù):頻數(shù)和頻率(frequency)平均數(shù)(mean)(算數(shù)平均數(shù))數(shù)學期望中數(shù)(median)眾數(shù)(MODE)、和(sum)天津理工大學數(shù)學期望以概率為權值的加權平均數(shù)稱為數(shù)學期望,用于反映數(shù)據(jù)分布的集中趨勢。計算公式為:其中Pi為事件發(fā)生的概率天津理工大學中數(shù)對于有序數(shù)據(jù)集X,如果有一個數(shù)x,能同時滿足以下兩式:
則稱x為數(shù)據(jù)集X的中數(shù),記為Me。奇數(shù)和偶數(shù)數(shù)據(jù)集的中數(shù)不同。1,3,5,6,71,2,5,6,8,9
天津理工大學眾數(shù)(mode)眾數(shù)是具有最大可能出現(xiàn)的數(shù)值。如果數(shù)據(jù)X是離散的,則稱X中出現(xiàn)最大可能性的值x為眾數(shù);如果X是連續(xù)的,則以X分布的概率密度P(x)取最大值的x為X的眾數(shù)。顯然,眾數(shù)可能不是唯一的。天津理工大學屬性數(shù)據(jù)的離散特征數(shù)標準差
(standarddeviation)方差(variance)極差
全距
(range)最大值與最小值標準誤差(standarderrormean)變差系數(shù)
離差、平均離差與離差平方和天津理工大學方差與標準差(與樣本有區(qū)別)方差是均方差的簡稱,是以離差平方和除以變量個數(shù)求得的,記為σ2,即:
標準差是方差的平方根,記為:總體樣本天津理工大學極差(表達了變量的取值范圍)極差是一組數(shù)據(jù)中最大值與最小值之差,即:天津理工大學離差、平均離差與離差平方和一組數(shù)據(jù)中的各數(shù)據(jù)值與平均數(shù)之差稱為離差,即若把離差求平方和,即得離差平方和,記為若將離差取絕對值,然后求和,再取平均數(shù),得平均離差,記為天津理工大學標準誤差(standarderrormean)是指均值的標準差,,一般來說,標準誤差是指點估計的標準差。有助于確定樣本均值與總體均值之間的偏離程度。標準差(standarddeviation)是一個樣本中各個觀測值的標準偏離程度。也就是某變量個體觀察值變異的大小天津理工大學變差系數(shù)變差系數(shù)用來衡量數(shù)據(jù)在時間和空間上的相對變化的程度,它是無量綱的量,記為Cv其中,σ為標準差,為平均數(shù)。天津理工大學分布特性指標(distribution)K階中心距偏度系數(shù)(Skewness)峰度系數(shù)(Kurtosis)天津理工大學偏度系數(shù)(Skewness)描述變量的非對稱性方向和程度,g1<0表示負偏度,均值在小于峰值的一邊,左邊有一條長尾:g1>0表示正偏度,均值在大于峰值的一邊,右邊有一條長尾:g1=0表示表示數(shù)據(jù)均勻分布或正態(tài)分布。天津理工大學Skewness=1.741天津理工大學Skewness=-1.555天津理工大學峰度系數(shù)(Kurtosis)表示密度函數(shù)圖形的凸尖度,意義為在均值附近的集中程度,峰度系數(shù)g2越大,表示數(shù)據(jù)分布越集中,即多數(shù)觀測值在均值附近,峰度系數(shù)g2越小,表示數(shù)據(jù)分布越離散,峰的形狀越平坦,標準正態(tài)分布的g2=0.天津理工大學g2=2.476.天津理工大學g2=3.849.天津理工大學空間自相關分析空間自相關分析是認識空間分布特征、選擇適宜的空間尺度來完成空間分析的最常用的方法。目前,普遍使用空間自相關系數(shù)—MoranI指數(shù),其計算公式如下:其中,N表示空間實體數(shù)目;xi表示空間實體的屬性值;x是x的平均值;Wij=1表示空間實體i與j相鄰,Wij=0表示空間實體i與j不相鄰。
I的值介于-1與1之間,I=1表示空間自正相關,空間實體呈聚合分布;I=-1表示空間自負相關,空間實體呈離散分布;I=0則表示空間實體是隨機分布的。Wij表示實體i與j的空間關系,它通過拓撲關系獲得。
天津理工大學回歸分析回歸分析用于分析兩組或多組變量之間的相關關系,常見回歸分析方程有線性回歸、指數(shù)回歸、對數(shù)回歸、多元回歸等。天津理工大學趨勢分析通過數(shù)學模型模擬地理特征的空間分布與時間過程,把地理要素時空分布的實測數(shù)據(jù)點之間的不足部分內插或預測出來。天津理工大學專家打分模型 專家打分模型將相關的影響因素按其相對重要性排隊,給出各因素所占的權重值;對每一要素內部進行進一步分析,按其內部的分類進行排隊,按各類對結果的影響給分,從而得到該要素內各類別對結果的影響量,最后系統(tǒng)進行復合,得出排序結果,以表示對結果影響的優(yōu)劣程度,作為決策的依據(jù)。其數(shù)學表達式為:Gp=WiCip 式中,Gp表示點的最終復合結果值,Wi表示第i個要素的權重,Cip表示第i個要素在p點的類別的專家打分分值。天津理工大學統(tǒng)計數(shù)據(jù)的分類分級 為了把GIS地理數(shù)據(jù)中的統(tǒng)計數(shù)據(jù)用專題地圖的形式表示出來,通常需要對統(tǒng)計數(shù)據(jù)進行分類和分級(土地分等定級、水土流失強度分級)。分類和分級的方法很多,常用到的算法有:系統(tǒng)聚類法天津理工大學系統(tǒng)聚類法基本思想統(tǒng)計數(shù)據(jù)的標準化距離系數(shù)最短距離法系統(tǒng)聚類系統(tǒng)聚類法類間距離計算的統(tǒng)一公式天津理工大學基本思想 首先是n個樣本各自成一類,然后規(guī)定類與類之間的距離,選擇距離最小的兩類合并成一個新類,計算新類與其它類的距離,再將距離最小的兩類進行合并,這樣每次減少一類,直到達到所需的分類數(shù)或所有的樣本都歸為一類為止。天津理工大學統(tǒng)計數(shù)據(jù)的標準化 每個樣本單元有多種變量的原始數(shù)據(jù),各種變量的量綱和數(shù)量大小是很不一致的,變化的幅度也不一樣。假如直接用原始數(shù)據(jù)進行計算,就會突出絕對值大的變量的作用,而壓低絕對小的變量的作用。為了給每種變量以統(tǒng)一量度,在進行模型的統(tǒng)計計算前,往往需要對原始數(shù)據(jù)進行標準化變換?!獦藴驶旖蚶砉ご髮W數(shù)據(jù)標準化處理方法有①
總和標準化。分別求出各聚類要素所對應的數(shù)據(jù)的總和,以各要素的數(shù)據(jù)除以該要素的數(shù)據(jù)的總和,即這種標準化方法所得到的新數(shù)據(jù)滿足(3.4.1)天津理工大學②
標準差標準化,即由這種標準化方法所得到的新數(shù)據(jù),各要素的平均值為0,標準差為1,即有(3.4.2)
天津理工大學
③極大值標準化,即經過這種標準化所得的新數(shù)據(jù),各要素的極大值為1,其余各數(shù)值小于1。
④極差的標準化,即
經過這種標準化所得的新數(shù)據(jù),各要素的極大值為1,極小值為0,其余的數(shù)值均在0與1之間。
(3.4.3)(3.4.4)天津理工大學表某地區(qū)九個農業(yè)區(qū)的七項經濟指標數(shù)據(jù)
區(qū)代號人均耕地X1(hm2/人)勞均耕地X2(hm2/個)水田比重X3(%)復種指數(shù)x4(%)糧食畝產x5(kg/hm2)人均糧食x6(kg/人)稻谷占糧食比重x7(%)G10.2941.0935.63113.64510.51036.412.2G20.3150.9710.3995.12773.5683.70.85G30.1230.3165.28148.56934.5611.16.49G40.1790.5270.391114458632.60.92G50.0810.21272.04217.812249791.180.38G60.0820.21143.78179.68973636.548.17G70.0750.18165.15194.710689634.380.17G80.2930.6665.3594.93679.5771.77.8G90.1670.4142.994.84231.5574.61.17天津理工大學x1x2x3x4X5X6X7G10.911.000.070.150.181.000.14G21.000.870.000.000.000.240.00G30.200.150.070.440.440.080.07G40.440.380.000.130.180.130.00G50.030.031.001.001.000.451.00G60.030.030.610.690.650.130.59G70.000.000.900.810.840.131.00G80.910.530.070.000.100.430.09G90.380.260.040.000.150.000.00表3.4.3極差標準化處理后的數(shù)據(jù)天津理工大學距離的計算對樣本進行分類時,個體之間的相似性程度往往用“距離”來度量。它是將每個樣本看成是高維空間的一個點,點與點之間用某種法則規(guī)定距離,距離近的點歸為一類。常用的計算方法天津理工大學
設有n個樣本,每個樣本測得m項指標,則每個變量記為Xij,i=1,2,…n;j=1,2,…m。若在標準化變量互不相關時采用歐氏距離。兩樣本i和j的距離記為dij,則:表示數(shù)據(jù)點i與j之間的距離,x為相應點的變量k數(shù)據(jù)。距離越小,表明兩者的相似性越大。采用絕對值距離天津理工大學最短距離法系統(tǒng)聚類在最短距離法中,定義兩類之間的距離用兩類間最近樣本的距離來表示。用dij表示樣本i和j的距離,用G1,G2,…表示類,用Dpq表示類Gp和類Gq的距離,則有:天津理工大學最短距離法聚類的步驟:
①計算每兩個樣本的距離。由于樣本i和樣本j的距離dij與樣本j和樣本i的距離dji是相等的,所以只要計算一個。開始時每個樣本自成一類,則類之間的距離Dpq就等于樣本之間的距離dpq。②找出最小的類間距,設為Dpq,則把Gp的Gq合并為一個新類,記為Gr。③計算新類與其它類的距離。新類Gr和某一類Gk的距離為Drk,則Drk可用下面公式計算出:Drk=min{Dpk·Dqk}天津理工大學④重復第②、③步,直到所有元素都成為一類或達到設定的分類數(shù)。天津理工大學例:絕對值距離公式式計算得到九個農業(yè)區(qū)之間的絕對值距離矩陣如下:
①在9×9階距離矩陣D中,非對角元素中最小者是d94=0.51,首先將第4區(qū)與第9區(qū)并為一類,記為即G10={G4,G9}。按照公式分別計算G1,G2,G3,G5,G6,G7,G8與G10之間的距離得:d1,10=min{d14,d19}=min{2.19,2.62}=2.19d2,10=min{d24
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高端醫(yī)用耗材項目合作計劃書
- 2025年甘肅省平涼市靈臺縣梁原中學中考模擬化學試題(含答案)
- 怎制作系統(tǒng)操作指引
- 企業(yè)管理責任與擔當
- 中考數(shù)學高頻考點專項練習:專題15 圓綜合訓練 (2)及答案
- 護士護理工作禮儀培訓
- 小學科學老師培訓
- 2025年輕水堆核電站及配套產品項目發(fā)展計劃
- 甘肅省武山一中2025屆高三適應性調研考試化學試題含解析
- 2025年證券經紀代理與營業(yè)部服務項目合作計劃書
- 房屋租賃合同 (三)
- 2025年北京電子科技職業(yè)學院高職單招職業(yè)適應性測試歷年(2019-2024年)真題考點試卷含答案解析
- 2024年安徽寧馬投資有限責任公司招聘10人筆試參考題庫附帶答案詳解
- 《變頻器原理及應用》課件
- 第16課《有為有不為》公開課一等獎創(chuàng)新教學設計
- 新生兒腭裂喂養(yǎng)護理
- 攝像服務行業(yè)品牌建設研究-深度研究
- 中醫(yī)養(yǎng)生保健培訓
- 2024年職業(yè)素養(yǎng)培訓考試題庫(附答案)
- 第20課 聯(lián)合國與世界貿易組織-(說課稿)2023-2024學年九年級下冊歷史部編版(安徽)
- 《光電對抗原理與應用》課件第1章
評論
0/150
提交評論