




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第五章 時空數(shù)據(jù)分析本章的主要內(nèi)容第1節(jié) 空間數(shù)據(jù)基本知識第2節(jié) 空間統(tǒng)計介紹第3節(jié) 探索性空間數(shù)據(jù)分析第4節(jié) 空間自相關分析第5節(jié) 時空掃描統(tǒng)計分析第6節(jié) 空間回歸分析第7節(jié) 空間面板分析第8節(jié) 貝葉斯時空模型第9節(jié) 空間估算第10節(jié) 空間分析的綜合應用發(fā)病率數(shù)據(jù)第11節(jié)空間分析的綜合應用企業(yè)創(chuàng)新數(shù)據(jù)第1節(jié) 空間數(shù)據(jù)基本知識空間數(shù)據(jù)定義(場,對象概念模型)有空間坐標或相對位置的數(shù)據(jù)通稱空間數(shù)據(jù)。如發(fā)病率在縣區(qū)、鄉(xiāng)村的分布;氣象臺監(jiān)測的氣溫、降水;大氣污染物分布;土壤重金屬在區(qū)域各抽樣點的數(shù)值;全國各省、直轄市、自治區(qū)的GDP,區(qū)域社會經(jīng)濟調(diào)查(抽查或普查數(shù)據(jù))等。用來描述來自于現(xiàn)實的目標,將
2、數(shù)據(jù)統(tǒng)一化,從而來表明空間實體的形狀大小以及位置和分布特征。定位是指在已知的坐標系里空間目標都具有唯一的空間位置;定性是指有關空間目標的自然屬性,它伴隨著目標的地理位置;空間數(shù)據(jù)定義(場,對象概念模型)時間是指空間目標是隨時間的變化而變化;空間關系通常一般用拓撲關系表示??臻g數(shù)據(jù)是一種用點、線、面以及實體等基本空間數(shù)據(jù)結構來表示人們賴以生存的自然世界的數(shù)據(jù)。是數(shù)字地球的基礎信息,數(shù)字地球功能的絕大部分將以空間數(shù)據(jù)為基礎。矢量數(shù)據(jù)結構和柵格數(shù)據(jù)結構矢量數(shù)據(jù)結構就是通過記錄坐標的方式,將抽象的點、線、面等地理實體精確地表達為計算機可以識別、存儲和處理的格式。柵欄數(shù)據(jù)結構是指將地理實體表面劃分為均勻
3、分布、大小相等、緊密相鄰的網(wǎng)格陣列,每個網(wǎng)格作為一個像元或柵格,由行、列號確定其位置,即用二維坐標中的(x,y)來表示,并包含一個代碼,表示該像元的屬性類型??臻g數(shù)據(jù)類型點數(shù)據(jù)(piont data)連續(xù)數(shù)據(jù)(continuous data)面數(shù)據(jù)(areal data),也稱格數(shù)據(jù)(lattice data)線數(shù)據(jù)空間數(shù)據(jù)特性空間數(shù)據(jù)的分析還必須研究空間數(shù)據(jù)的特殊性質。研究表明,空間數(shù)據(jù)的特殊性質是多方面的,包括空間異質性、空間自相關、可塑性面積單元問題、不確定性等,這些性質直接影響了空間數(shù)據(jù)分析和建模的方法??臻g依賴性空間依賴性由于空間數(shù)據(jù)的聚集性及空間相互作用的存在,一個空間位置上的樣本
4、數(shù)據(jù)會依賴于其他位置上的觀測值。空間依賴程度是通過空間自相關測度的,可以認為空間自相關就是空間依賴性概念的數(shù)學表達,空間自相關的指標多樣,可分為兩種類型:全局測度和局部測度。全局方法對研究區(qū)域的整體給出一個參數(shù)或指數(shù),而局部方法提供數(shù)據(jù)觀測點等量的參數(shù)或指標??臻g異質性異質性源于各地方的獨特性質,表示空間數(shù)據(jù)的變化缺少平穩(wěn)性??臻g異質性與空間上行為關系缺乏穩(wěn)定性有關,這一特征也成為空間非平穩(wěn)性,意味著功能形式和參數(shù)所研究領域的不同個地方是不一樣的,但在區(qū)域局部,變化是一致的。空間非平穩(wěn)性是空間數(shù)據(jù)這一特征的數(shù)學表達,對大部分空間數(shù)據(jù)而言,假設空間過程非平穩(wěn)和各向異質性能更為真實地反映地理問題的
5、實質??臻g異質性空間異質性可塑性面積問題數(shù)據(jù)分析的結果隨著面積單元的定義不同而發(fā)生變化,就是所謂的可塑性面積單元問題。面積單元對于分析結果的影響來源于兩類效應:其一是尺度效應,即當空間單元經(jīng)過聚合而變化改變其尺度大小時,空間數(shù)據(jù)的統(tǒng)計分析結果也會相應發(fā)生變化,由于從精細空間尺度聚集到大的空間單元的組合途徑通常很多不同聚集到大的空間單元的組合途徑通常很多,不同聚集方案得到的結果是不同的。其二是劃區(qū)效應,即在同一粒度或聚合水平上,由于聚合方式的不用或劃分方案的不同導致的分析結果的變化??伤苄悦娣e問題概而言之,可塑性面積單元問題(MAUP)是由區(qū)域的數(shù)量、規(guī)模、形狀對空間數(shù)據(jù)分析的結果所產(chǎn)生的不確定
6、性影響。不確定性問題空間數(shù)據(jù)的不確定性關心的主要問題是空間數(shù)據(jù)的質量因為空間數(shù)據(jù)的質量對于建模分析、表示、結果以及決策的正確性等都有十分重要的影響。空間數(shù)據(jù)質量的特殊性在于它包括兩個方面:屬性數(shù)據(jù)的質量和空間對象的質量,而兩者之間又是相互依賴的。由于數(shù)據(jù)還具有時間坐標,記錄的時間誤差也隱含在數(shù)據(jù)集中,因此空間數(shù)據(jù)包括空間和時間坐標上的屬性值,三者之間相互影響。不確定性分類至少有4種類型:空間不確定性對象定義的不確定性關系不確定性分區(qū)問題空間不確定性當對象不具有離散、確定的范圍時,就會產(chǎn)生空間的不確定性這種不確定性是因為對象定義的主觀性而產(chǎn)生的,可能存在不清晰的邊界(例如濕地在哪里精確終止),其
7、影響超出了它們的邊界,或者空間對象僅僅是統(tǒng)計上的實體。對象定義的不確定性當不能清晰或嚴格定義對象時,就會導致模糊性的產(chǎn)生,如在治安管理中,管區(qū)犯罪發(fā)生率為多少時才能定義為高犯罪地域,這些都依賴于一些人為的規(guī)定。關系不確定性地理要素之間通常具有各種關系,當y被用作x的替代或指示器時,因為x不可用,此時就會產(chǎn)生模糊性,可分為直接指示器或間接指示器兩種情況。直接指示器表明現(xiàn)象之間的聯(lián)系是直接的和相當清晰的,例如土壤的養(yǎng)分水平(y)是作物產(chǎn)量(x)的直接指示器。非直接的指示器趨向于更加模糊和不透明,例如濕地(y)是動物多樣性(x)的非直接指示器。分區(qū)問題區(qū)域是為了識別地理現(xiàn)象,分析研究或管理的需要而進
8、行的定義,所以產(chǎn)生了分區(qū)問題,例如氣候類型區(qū)的劃分問題,專家對于哪些特征的組合定義一個類型區(qū)域的觀點并不一致,這些特征如何加權生成一個復核指標,以及確定區(qū)域最小規(guī)模的閾值是多少,都會影響類型的劃分。在GIS中涉及空間數(shù)據(jù)的獲取,表示和分析等系列過程,而在這個過程的各個階段都會產(chǎn)生不確定性。從來源上看可歸結為測量的不確定性,空間數(shù)據(jù)表示的不確定性和空間數(shù)據(jù)分析的不確定性,其中分析的不確定性主要是和空間尺度依賴有關的MAUP問題。分區(qū)問題地理現(xiàn)象刻度的不確定性主要是空間數(shù)據(jù)和屬性數(shù)據(jù)獲取過程中產(chǎn)生的誤差,包括對象的物理測量誤差、社會經(jīng)濟屬性記錄誤差,數(shù)字化數(shù)據(jù)的誤差,以及不同來源數(shù)據(jù)集整合時的誤差
9、。地理現(xiàn)象的表示的不確定性表示與測量之間密切相關,表示絕非僅僅是分析的輸入,而且還是分析的結果,主要包括柵欄數(shù)據(jù)表示的不確定性和矢量數(shù)據(jù)表示的不確定性。第2節(jié) 空間統(tǒng)計介紹空間統(tǒng)計由來應用空間統(tǒng)計分析思想最早可以追溯到150多年前一次重大的公共衛(wèi)生事件,1854年英國倫敦霍亂大流行。在這次事件中,John Snow博士利用基于地圖的空間分析原理,將死亡病例標注在倫敦地圖上,同時還將水井的信息也標注在地圖上,通過相關分析,最后將污染源鎖定在城中心的一個水井的抽水機上。在他的建議下市政府將該抽水機停用,此后霍亂大幅度下降,并得到有效的控制??臻g統(tǒng)計由來John Snow利用空間分析思想控制疫情這件
10、事具有重要的里程碑意義,它被看成了空間統(tǒng)計分析和流行病學兩個學科的共同起源;但是此后相當長的一段時間內(nèi)由于缺乏刻畫數(shù)據(jù)的空間相關性和異質性的方法,人們在分析空間屬性的數(shù)據(jù)時,往往把所涉及的數(shù)據(jù)自身空間效應作為噪聲或者誤差來處理,這種缺乏對空間自相關和異質性的刻畫,限制了以地圖為基礎的空間屬性數(shù)據(jù)在公共衛(wèi)生領域中應用的深入研究。空間統(tǒng)計由來直到1950年Moran首次提出空間自相關測度來研究二維或更高維空間隨機分布的現(xiàn)象,1951年南非學者Krige提出了空間統(tǒng)計學萌芽思想,后經(jīng)法國數(shù)學家Matheron完善,于1963年和1967年提出了地統(tǒng)計學和克里金技術。1973年, Cliff和Ord發(fā)
11、表了空間自相關(Spatial Autocorrelation)的分析方法,1981年出版了Spatial Process:Model and Application專著,形成了空間統(tǒng)計理論體系,以及GetisG和Lisa提出的空間異質性的局部統(tǒng)計使空間統(tǒng)計理論日趨成熟。空間統(tǒng)計由來近年來隨著空間分析技術以及空間分析軟件(如GIS、Geoda、SaTScan、Winbugs等)的迅速發(fā)展,與疾病分布有關的空間統(tǒng)計分析也得以較快發(fā)展。空間統(tǒng)計與經(jīng)典統(tǒng)計區(qū)別空間統(tǒng)計具有明顯的多學科交叉特征,其顯著特點是思想多源、方法多樣、技術復雜,并隨著相關學科如計算機軟硬件技術的發(fā)展而發(fā)展??臻g統(tǒng)計分析是以地理
12、實體為研究對象,空間統(tǒng)計模型為工具,以地理實體空間相關性和空間變異性為出發(fā)點,來分析地理對象空間格局、空間關系、時空變化規(guī)律,進而揭示其成因的一門新科學。從研究變量類型來看首先從研究變量類型來看,經(jīng)典統(tǒng)計學研究的是純隨機變量,該隨機變量的取值遵循某種概率分布變化而空間統(tǒng)計學研究的是區(qū)域化變量,該區(qū)域化變量根據(jù)其在一個區(qū)域內(nèi)的空間位置不同而取不同的值,即隨機變量是與位置有關的隨機函數(shù)。因此,空間統(tǒng)計學研究的變量具有隨機性和結構性特點。從假設前提來看在經(jīng)典統(tǒng)計學中,待分析的變量一般應具有獨立性。而空間統(tǒng)計學的區(qū)域化變量是在不同空間位置上的抽樣,因而鄰近的樣本之間通常不獨立,存在某種程度的空間相關性
13、。從研究樣本來看經(jīng)典統(tǒng)計學以頻率分布圖為基礎,研究樣本的各種數(shù)字特征(如均值、方差),并對總體進行推斷。而空間統(tǒng)計學主要考慮變量空間分布理論和估算方法。從研究結果來看經(jīng)典統(tǒng)計學與GIS結合不緊密,而空間統(tǒng)計學能與GIS有效結合,很容易實現(xiàn)空間可視化。此外,試驗次數(shù)不同,經(jīng)典統(tǒng)計學所研究的變量理論上可以無限次重復或進行大量重復觀測試驗。而空間統(tǒng)計學所研究的區(qū)域化變量一旦在某一空間位置上取得樣品后,就不可能再在同一位置取得該樣品,即區(qū)域化變量取值只有一次。當然空間統(tǒng)計并不是拋棄所有的經(jīng)典統(tǒng)計學理論,而是對這些理論加以完善,以便更適用于空間數(shù)據(jù)統(tǒng)計分析??臻g統(tǒng)計學應用綜述目前空間統(tǒng)計學技術主要基于3
14、S技術,即GIS(Geographic Information System)、RS(Remote Sensing )、GPS(Global Positioning System)。3S技術就好比人的兩只眼睛和一個大腦,一只眼睛GPS進行定位,另外一只眼睛RS采集周邊環(huán)境信息,GIS對采集過來的數(shù)據(jù)進行統(tǒng)一存儲、加工與處理。GIS具有功能完善空間分析模塊,可以進行疾病的探索性和證實性分析,進行疾病或傳播媒介與潛在地理、氣候、社會、經(jīng)濟等因素之間的關聯(lián)分析??臻g統(tǒng)計學應用綜述例如通過環(huán)境因素與疾病的疊加分析、空間相關分析和空間回歸分析、疾病的遙感模型、傳染病模型等來探索和描述疾病的傳播規(guī)律和尋求
15、病因,評估潛在的環(huán)境和特定時空交互行為對疾病發(fā)生的影響這一方面對決策人員制定科學的防治策略、確定防范重點、分配有限醫(yī)療資源等具有重要的指導意義另一方面,也有助于衛(wèi)生領域的研究人員設計合理的科學實驗進行傳染病的病毒學和分子流行病學研究,加速徹底戰(zhàn)勝傳染病的進程。疾病的空間插值分析在疾病預防研究中,疾病空間樣點資料是有限的,如何利用有限的空間樣點資料去掌握整個區(qū)域的全局流行特征,突破人為行政區(qū)劃的限制,從一種整體宏觀全局角度來把握疾病和健康的空間分布格局,從而為公共衛(wèi)生資源的配置和防控策略的制定提供依據(jù)??臻g插值數(shù)據(jù)是根據(jù)相鄰樣點的相似原理來生成表面,即用已知的樣點的值生成表面來預測整個研究區(qū)域內(nèi)
16、每個位置的值,并評估預測表面的誤差和變異性。疾病的空間插值分析克里金插值又稱之為地統(tǒng)計學,以空間自相關為前提,區(qū)域化變量理論為基礎,以變異函數(shù)為主要工具的一門新學科。其實質是利用區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)的結構特點,對未采樣點的區(qū)域化變量的取值進行線性無偏、最優(yōu)估計。半變異函數(shù)主要塊金值、變程、基臺值、偏基臺值幾部分組成。半變異函數(shù)圖詳解塊金基臺比塊金基臺比C0C0+C1,其大小反映空間自相關部分引起疾病空間異質性程度的大小。如果塊金基臺比較大,說明隨機部分引起的疾病空間異質性起主要作用,空間自相關弱。反之,塊金基臺比較小,說明空間自相關部分引起的疾病空間異質程度起主要作用,空間自相關性強
17、。疾病的空間插值分析描述污染物空間分布是風險評估的一個重要組成部分Cattle等人采用指示克里金技術基于已知抽樣點污染物濃度去估計非抽樣點污染物濃度。Asmarian等人采用泊松克里金插值對2003-2007年336個縣食道癌發(fā)病數(shù)據(jù)進行分析,得出了Ardebil、 Mazandaran 、 Kordestan三省與其他省相比有較高的風險。Adhikar等人采用指標和概率克里格方法描述印度德里市Najafgarh街區(qū)地下水銅、鐵、錳污染情況。疾病空間聚集性研究疾病的聚集性分析目的在于研究潛在危險因素的時空聚集性,從整體上檢驗疾病的空間分布是隨機還是聚集?如果是聚集分布,進一步回答:聚集在什么地
18、方?疾病聚集程度高低及與周邊地區(qū)關系如何?聚集在多大的空間尺度才有效?這些與地點相關的聚集因素可以是未知的感染因子、地方污染物等。疾病空間聚集性研究Xiao等人采用局部GetisG熱點探測發(fā)現(xiàn)了中國大陸2008-2011年在縣區(qū)水平上手足口病空間聚集性及隨時間的變化趨勢。于石成等利用時空掃描技術對全國重癥手足口病例進行了時空聚集性分析,發(fā)現(xiàn)重癥病例聚集區(qū)域,為進一步研究重癥病例成因奠定了基礎。Wang等采用Satscan時空掃描工具探測北京2008-2012年手足口病時空聚集模式。同時在其他傳染病分析中也得到廣泛應用,如細菌性痢疾、丙型肝炎、出血熱病 、HFRS 、H7N9等疾病分析。疾病空間
19、聚集性研究同樣在癌癥研究中,研究人員使用空間聚集分析確定地理區(qū)域的高危人群,然后篩選人群疾病可以改善癌癥控制。疾病時空預警分析通過時空模型分析不同時期疾病或媒介的空間動態(tài)變化,了解疾病隨時間的變化規(guī)律,對疾病未來的發(fā)展趨勢做出分析、預測和評估,從而在疾病的預警系統(tǒng)中發(fā)揮作用。在這些時空模型中,Kulldorff于1998年提出了時空掃描統(tǒng)計量,以及在2001年提出的前瞻性時空重排掃描統(tǒng)計量,在傳染病暴發(fā)預警中具有較好的應用前景。疾病時空預警分析前瞻性時空重排掃描統(tǒng)計量以動態(tài)變化的掃描窗口對不同的時間和區(qū)域進行掃描,可以有效地對未知的時空聚集性進行探索性分析,達到早期預警的目的。該方法最大的優(yōu)勢
20、在于,由于采用了重排算法,該模型在建模過程中不需要使用人口數(shù)據(jù)。而基于Poisson分布的時空掃描統(tǒng)計量,在計算過程中需要各區(qū)域的人口數(shù)據(jù),但確切的人口數(shù)據(jù)常常很難獲得。疾病時空預警分析Mostashari等利用死禽數(shù)據(jù)進行空間統(tǒng)計掃描分析對西尼羅病毒暴發(fā)進行早期預警。Mugglin等采用貝葉斯時空模型通過對蘇格蘭流行性感冒病例資料進行分析和預測,可以讓醫(yī)院在應診能力準備上做得更好。疾病制圖和病因探索疾病制圖是空間統(tǒng)計學的基本功能其目的是將疾病的危險的空間變異或時空變異在地圖上呈現(xiàn)出來,為進一步病因學研究或其他研究提供線索。地理環(huán)境相關性研究是研究與環(huán)境有關的地理變量(如空氣、水體、土壤等)或
21、生活方式等因素與健康之間的相互關系,能夠環(huán)境危險因素的研究提供必要的信息。自然與社會環(huán)境、營養(yǎng)、基因、行為、病媒生物等是許多疾病的致病因子,通常具有空間分布。疾病制圖和病因探索疾病分布如同自然景觀的概念一樣,不同疾病的分布結構來自于不同的病因分布結構,這種結構的變化同樣影響著疾病的發(fā)生、傳播和消長的變化。通過分析這些要素和疾病空間分布之間的關系,可以探測是否存在威脅健康的環(huán)境危險因素,這些危險因素是否存在交互作用地理探測器“地理探測器”(GeoDetector)方法基于空間方差分析來分析來探測環(huán)境風險因子。主要包括四個方面的功能:風險探測器可以指示風險區(qū)域;因子探測器可以定量評價不同的環(huán)境因子
22、的風險程度;生態(tài)探測器可以分析不同的環(huán)境因子的影響是否有顯著差異;交互探測器可以分析環(huán)境因子是獨立作用還是多種因子交互作用的結果。自從地理探測器問世以來,在公共衛(wèi)生領域得到了廣泛的應用。地理探測器Wang等利用了地理探測器發(fā)現(xiàn)了引起山西省和順縣神經(jīng)管畸形的環(huán)境致病因子以及致病因子之間的相互關系。Wu等(2004)等人通過空間探索分析為獲得導致出生缺陷的環(huán)境致病因子,為進一步分析致病因子奠定了基礎。HU等利用地理加權回歸分析了氣象因子對我國手足口病影響在地理空間上的異質性。Deng等采用空間面板模型分析廣東氣象因素對手足口病的影響。層次貝葉斯時空模型方法在疾病制圖及分析疾病的影響因素方面取得較好
23、的效果,獲得了疾病危險的空間及時空變異的信息。第3節(jié) 空間模型應用實例探索性空間數(shù)據(jù)分析探索性空間數(shù)據(jù)分析指基于數(shù)據(jù)的空間屬性,利用空間統(tǒng)計學原理和圖表相結合,對空間數(shù)據(jù)的性質進行探索性分析。ESDA提供直方圖、QQ圖、變異云圖、趨勢圖、地區(qū)分布圖、泰森多邊型(voroni map),對數(shù)據(jù)的離群值、正態(tài)性、趨勢性及變異性進行分析。通過地區(qū)分布圖和三維趨勢分析,可直觀描述疾病分布的趨勢性及不均勻性。疾病地區(qū)分布圖疾病地區(qū)分布圖是一種常用的空間數(shù)據(jù)可視化方法。將疾病數(shù)據(jù)根據(jù)區(qū)域進行統(tǒng)計,使每個區(qū)域得到一個描述疾病發(fā)生的聚合信息;然后根據(jù)該信息通過不同的填充顏色或圖案對各個地區(qū)進行渲染,最后得到的
24、圖即為疾病地區(qū)分布圖。疾病地區(qū)分布圖用不同的顏色或圖案把疾病高發(fā)區(qū)、低發(fā)區(qū)直觀描述出來,揭示空間分布趨勢,為疾病進一步研究提供線索。趨勢分析趨勢分析生成數(shù)據(jù)的三維趨勢圖,可識別數(shù)據(jù)的全局趨勢。x軸、y軸分別代表疾病采樣點對應的經(jīng)度和緯度,z軸表示采樣點的疾病指標。三維趨勢圖中與y軸對應的線條表示在南北方向上趨勢值的變化,與x軸對應的線條表示在東西方向上趨勢值的變化。三維趨勢圖可直觀展示疾病的空間分布趨勢。三維趨勢圖第4節(jié) 空間自相關分析空間自相關分析空間自相關,指一個區(qū)域單位上的某種屬性值(如發(fā)病率)與鄰近區(qū)域單位上的同一屬性值間的相關程度,其基本度量指標是空間自相關系數(shù),用空間自相關系數(shù)來檢
25、驗區(qū)域單位的某一屬性值是否高高相鄰,低低相鄰或者高低間錯分布,即有無聚集性。空間自相關分為三種情況一種是正相關,指鄰近區(qū)域有相同或相似的屬性值。如果某變量屬性值在空間分布上呈現(xiàn)出高的地方周圍也高,低的地方周圍也低,稱為空間正相關,表明此變量屬性值具有空間擴散特性;另一種是負相關,指鄰近區(qū)域有不同的屬性值。如果在空間分布上呈現(xiàn)出高的地方周圍低,低的地方周圍高,則稱為空間負相關,表明此變量屬性值具有空間極化特性;第三種是無相關,指變量屬性值在空間分布上呈現(xiàn)出隨機性,表明空間自相關不明顯,是一種隨機分布的現(xiàn)象。I0,正相關, INew,即打開一個空白的窗口(如下圖6-8所示)。在這個窗口中可以通過編
26、寫代碼的方式建立模型、導入數(shù)據(jù)和設置迭代初始條件。(三)通過事例學習使用WinBugs WinBUGS中自帶很多事例,可供初學者學習。在這里我們提供一個處理空間數(shù)據(jù)的事例,該事例屬于GeoBUGS模塊。點擊菜單欄中的Map-Manual,進入如下界面(該界面是GeoBUGS的手冊,界面中可能有少量亂碼,但一般不影響閱讀): 在Contents下的目錄中,點擊Examples,進入以下界面:WinBUGS代碼 要在WinBUGS建立并求解模型,首先通過輸入必要的代碼。代碼分為三部分:建立模型的代碼、導入數(shù)據(jù)的代碼和設定迭代初始條件的代碼。首先輸入建立模型的代碼。在蘇格蘭唇癌發(fā)病率的事例中,找到建
27、立模型的代碼(下圖紅框中),將其復制到之前新建的空白窗口中。以下解釋上述代碼的含義。首行的model表示建立模型。模型的內(nèi)容全部寫在model下的大括號中。for (i in 1 : N) Oidpois(mui) log(mui)-log(Ei)+alpha0+alpha1*Xi/10+bi RRiSpecification高亮代碼首行的model,然后點擊對話框中check model,此時程序界面左下角會出現(xiàn)“model is syntactically correct”。再高亮代碼中表示數(shù)據(jù)的list,然后點擊對話框中的load data,此時程序界面左下角會出現(xiàn)“data loade
28、d”。 再點擊對話框中的compile,程序界面左下角會出現(xiàn)“model compiled”。對話框中的num of chains表示抽樣時馬爾科夫鏈的數(shù)量,這里保持默認值1。再高亮代碼中表示迭代初始條件的list,然后點擊對話框中的load inits,程序界面左下角會出現(xiàn)“model is initialized”。然后關閉對話框。迭代抽樣點擊菜單欄中的Inference-Samples,彈出如下對話框。上述步驟執(zhí)行完畢后,關閉目前的對話框。再點擊菜單欄中的Model-Update對話框中的updates表示迭代次數(shù),可以將其改為更大的數(shù),比如10000。確定迭代次數(shù)后,點擊update按
29、鈕,軟件開始執(zhí)行迭代。執(zhí)行完畢后,關閉該對話框。查看結果點擊菜單欄中的Inference-Samples,再次彈出下圖所示的對話框。點擊node旁文本框右端的下拉鍵,這樣就可以選擇待估的參數(shù),以查看估計結果。比如我們選擇alpha1,然后點擊history,可以查看其迭代計算的過程點擊density,可以看到估計出的alpha1的概率密度函數(shù)圖點擊stats,可以看到alpha1的期望、標準差等數(shù)值從這個估計結果,我們可以看出農(nóng)林漁業(yè)從業(yè)人口比例對唇癌發(fā)病率有顯著正影響(2.5%分位數(shù)大于0)。說明農(nóng)林漁業(yè)生產(chǎn)可能易引發(fā)唇癌。當然,通過上述模型能得出的結論不止這一條,需要研究者仔細分析。而分析
30、可能需要更多的工具。而WinBUGS的GeoBUGS模塊可以是進一步分析中所用的工具之一。GeoBUGS專門用于分析空間數(shù)據(jù),通過GeoBUGS可以借助地圖工具進一步分析模型結果,比如分析變量的空間分布。使用GeoBUGS分析變量的空間分布點擊菜單欄中的Map-Mapping Tool,彈出如下圖所示的對話框。第9節(jié)空間估算空間估算疾病區(qū)域化變量當一個變量在空間上與其位置有關時稱為區(qū)域化變量。在醫(yī)學領域,諸如疾病發(fā)病率、地理危險因子、某地微量元素的本底值等指標都與地位位置有關,稱之為疾病區(qū)域化變量。疾病區(qū)域化變量與普通隨機化變量不同,它是隨機變量在地理空間內(nèi)某確定位置上的特定取值,是與位置有關
31、的隨機函數(shù)。疾病變異函數(shù)疾病變異函數(shù)以疾病區(qū)域化變量理論為基礎,分析變量的空間變異性及空間關聯(lián)性的統(tǒng)計學方法。它指當點x在空間上變化時,疾病區(qū)域化變量Z(x)在點x和x+h處的值 Z(x)與Z(x+h)之差的方差的一半,記為:疾病變異函數(shù)參數(shù)及流行病學意義疾病變異函數(shù)模型的擬合實際工作中,需要根據(jù)疾病變異云圖及數(shù)據(jù)特性來擬合疾病變異函數(shù)模型。常用模型分為三類:一是有基臺值模型,包括球狀模型、指數(shù)模型、高斯模型、線型有基臺模型和純塊金效應模型;二是無基臺模型,包括冪函數(shù)模型、線性無基臺模型、拋物線模型;三是孔穴模型。擬合這些模型的基本步驟是確定曲線類型,通過一定的變量變換將曲線線性化,用距離加權
32、最小二乘法進行參數(shù)估計。其中,球狀模型和指數(shù)模型為最常用模型。球狀模型實際應用中,對變異函數(shù)模型的選擇依據(jù)變異函數(shù)云圖的特征:有基臺而且在ha時半方差云圖的形狀是完全水平的則用球狀模型,否則用指數(shù)模型。兩者變異云圖如下:球狀模型變異云圖 指數(shù)模型變異云圖疾病變異函數(shù)的向異性如大氣污染物的擴散,在不同風向上其濃度大小和擴散距離也不同。順風方向上表現(xiàn)出高濃度大范圍聚集性;其它方向上可能表現(xiàn)出離散性分布,沒有明顯的聚集性。又比如生物地球化學性疾病的空間異質性常常是各向異性的,疾病地理危險因素在不同方向上控制著不同程度的疾病空間變異性,明顯地影響疾病的空間結構;例如,克山病由于受地理環(huán)境中微量元素硒的
33、影響,其空間異質性常常各向異性的。向異性分為結構向異性、幾何向異性、完全向異性,三類向異性的變異函數(shù)曲線見下圖如果不同方向上的疾病區(qū)域化變量表現(xiàn)出基臺值相同,自相關閾值不同時,疾病區(qū)域化變量具有幾何向異性(上圖中的r與r2)。如果不同方向上的疾病區(qū)域化變量表現(xiàn)出自相關閾值相同,而基臺值不同時,疾病區(qū)域化變量具有帶狀向異性(上圖中的r1和r3)。如果不同方向上的疾病區(qū)域化變量表現(xiàn)出自相關閾值和基臺值都不同時,疾病區(qū)域化變量具有完全向異性(上圖中的r2與r3)。實際工作中,當疾病空間采樣點較少(n100)時,不宜做疾病變異函數(shù)向異性分析。第10節(jié) 空間分析的綜合應用-發(fā)病率數(shù)據(jù)動態(tài)地圖繪制打開Ar
34、cMap軟件,創(chuàng)建新的空白地圖,將全國區(qū)縣圖拖入空白地圖中變量選擇選擇區(qū)縣圖層,右鍵打開屬性表,選擇文件按屬性選擇,由于長三角地區(qū)的區(qū)縣行政編碼在310000340000之間,因此我們給屬性CNTY_CODE賦予條件310000,34000,選擇長三角地區(qū)的區(qū)縣數(shù)據(jù)導出右鍵選擇導出數(shù)據(jù),并將數(shù)據(jù)形成的新圖層導入到地圖中,取消選中全國區(qū)縣地圖,我們得到了單獨的長三角區(qū)縣地圖數(shù)據(jù)連接將疾病數(shù)據(jù)與長三角地圖連接,“動態(tài)數(shù)據(jù)”中二月、五月、八月、十一月的數(shù)據(jù)應依次分別與長三角地圖連接將疾病數(shù)據(jù)進行區(qū)域可視化在changsanjiao2圖層上,右鍵圖層屬性選擇符號系統(tǒng),可以對于數(shù)量設置不同顏色,對于范圍
35、可以設置格式化,自定義設置范圍的數(shù)位、對齊方式等地圖合并及動態(tài)地圖制作合并四張地圖數(shù)據(jù)在菜單欄,地理處理中選擇“合并”進入合并對話框,將之前導出的4個月份的疾病數(shù)據(jù)選入框內(nèi),合并處理后輸出新的數(shù)據(jù)集為hebing25811.shp,并將數(shù)據(jù)導入圖層中。啟用時間在合并成的hebing25811.shp圖層中,右鍵設置屬性,在符號系統(tǒng)中設置顏色以表示數(shù)量,同時啟用時間屬性創(chuàng)建動態(tài)地圖選擇工具欄時間滑塊按鈕,啟用合并圖層的時間滑塊,選項中可以設置切換速度等,即得到動態(tài)地圖。點擊播放按鍵鈕,我們可以看到長三角地區(qū)各區(qū)縣4個時間戳的疾病變化情況。美化地圖及導出視頻空間自回歸分析及熱點探測1.地圖導入2.
36、創(chuàng)建權重文件3.繪制權重直方圖4.分析全局自相關5.分析局部自相關6.繪制其他三季度第11節(jié)空間分析的綜合應用企業(yè)創(chuàng)新數(shù)據(jù)數(shù)據(jù)說明本節(jié)數(shù)據(jù)源于2014年的全國企業(yè)創(chuàng)新調(diào)查項目,以其中長江三角洲城市群的數(shù)據(jù)為分析對象。長江三角洲城市群共包括上海、南京、無錫、常州、蘇州、南通、鹽城、揚州、鎮(zhèn)江、泰州、杭州、寧波、嘉興、湖州、紹興、金華、舟山、臺州、合肥、蕪湖、馬鞍山、銅陵、安慶、滁州、宣城26市,舟山是島嶼城市,經(jīng)濟結構與其他地區(qū)差異很大,因此不作為分析對象模型假設模型假設空間統(tǒng)計方法的R實現(xiàn)要運用R軟件實行空間分析,首先我們應該建立適用于R語言環(huán)境的空間數(shù)據(jù)集。對一般的研究需求來說,主要是將已有的經(jīng)濟社會數(shù)據(jù)與地理空間數(shù)據(jù)合并。#1.設置合并數(shù)據(jù)集時的匹配列city$NAME_2chr-as.character(city$NAME_2)#字符city$NAME_2chr14-SuzhouA#安徽宿
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保設施改造工程合同范本
- 公寓續(xù)租合同協(xié)議
- 校企合作導師聘任合同示例
- 企業(yè)員工境內(nèi)旅游活動合同
- 市場營銷顧問短期委托合同
- 11-2《我們這里的民間藝術》(教學設計)統(tǒng)編版道德與法治四年級下冊
- 就業(yè)合同范本
- 6 聞一聞嘗一嘗 教學設計-2023-2024學年科學一年級上冊青島版
- 度臨時聘請合同協(xié)議
- 度煙葉種植收購合同范本
- 高中主題班會 借哪吒精神燃開學斗志!課件-高一下學期開學第一課班會
- 2024年12月2025浙江湖州市長興縣綜合行政執(zhí)法局公開招聘輔助執(zhí)法人員8人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 濰坊2025年山東濰坊市產(chǎn)業(yè)技術研究院招聘7人筆試歷年參考題庫附帶答案詳解
- 《南非綜合簡要介紹》課件
- 2023六年級數(shù)學下冊 第2單元 百分數(shù)(二)綜合與實踐 生活與百分數(shù)說課稿 新人教版
- 2024年山東力明科技職業(yè)學院高職單招語文歷年參考題庫含答案解析
- 《災害的概述》課件
- 國產(chǎn)氟塑料流體控制件生產(chǎn)企業(yè)
- 貨物學 課件2.1貨物的分類
- 中國糖尿病防治指南(2024版)解讀2
- 2025年奇瑞汽車招聘筆試參考題庫含答案解析
評論
0/150
提交評論