版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
《數(shù)學(xué)地質(zhì)》教案
地質(zhì)工程系
2014年6月
目錄
第一部分多元統(tǒng)計分析方法.................................1
第一節(jié)一元線性回歸....................................1
第二節(jié)趨勢面分析.....................................11
第三節(jié)聚類分析......................................20
第四節(jié)判別分析(DiscrimnantAnalysis)....................................32
第二部分MatLab地學(xué)運算基礎(chǔ)............................48
第一節(jié)MATLABL操作基礎(chǔ)...............................48
第二節(jié)MATLABL矩陣及其運算........................52
第三節(jié)MATLABL程序設(shè)計...............................56
第三部分人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用.........................65
第一節(jié)人工神經(jīng)網(wǎng)絡(luò)原理..............................65
第二節(jié)BP神經(jīng)網(wǎng)絡(luò)應(yīng)用方法............................69
第一部分多元統(tǒng)計分析方法
一、學(xué)習(xí)目的意義
多元統(tǒng)計方法是數(shù)學(xué)地質(zhì)的基礎(chǔ),熟練掌握常見的地質(zhì)分析多遠(yuǎn)統(tǒng)計方法,
可以培養(yǎng)學(xué)生利用先進的技術(shù)手段解決生產(chǎn)、科學(xué)研究中遇到難題的能力,提高
工作效率。
二、重點、難點
1.回歸分析方法及在預(yù)測和控制中的應(yīng)用;
2.趨勢面分析、剩余值分析及其在構(gòu)造定量研究中的應(yīng)用;
3.聚類分析、判別分析及其在地質(zhì)分類中的應(yīng)用;
第一節(jié)一元線性回歸
1.基本概念
一元線性回歸是處理兩個變量x與y之間的關(guān)系,即根據(jù)由試驗、分析取
得的數(shù)據(jù)提出兩者之間的經(jīng)驗公式。兩個變量之間的關(guān)系有線性和非線性兩種,
線性回歸討論的是線性關(guān)系;有些非線性關(guān)系可以轉(zhuǎn)化成線性關(guān)系處理。
設(shè)隨機變量y與變量x間存在著某種相關(guān)關(guān)系,這里,x是可以控制或可以
精確觀察的變量,如年齡、試驗時的溫度、施加的壓力、電壓等。換句話說,我
們可以隨意指定n個值xl,x2,...,xn。因此,為方便計,我們干脆不把x看成
隨機變量,而當(dāng)作通常的自變量.
由于y的隨機性,對于x的每一確定的值,y有它的分布。因此,若y某些
數(shù)字特征存在的話,則它們的值隨x取確定值而確定。顯然,我們可以通過一組
樣本來估計數(shù)字特征(特別是數(shù)學(xué)期望),從而,我們可以解決如下問題:
(1)預(yù)測問題:在一定置信度下,估計出當(dāng)x取某一值xO時,隨機變量y
取值的情況。
(2)控制問題:在一定置信度下,控制自變量x的取值范圍,使y在給定
的范圍內(nèi)取值。
這里的樣本是指:對于x的取定的一組不全相同的值xl,x2,...,xn作獨
立試驗,得到n對觀察值(xl,yl),(x2,y2),???,(xn,yn),其中yi是在x=xi時
隨機變量y所取的值,這n對觀察值就是一組樣本。
ixy=汽(七一元Xy—y)=文七y一'封
Z=1,=1H
3線性假設(shè)的顯著性檢驗
回歸分析的顯著性檢驗,就是用統(tǒng)計分析的方法來檢驗x與y之間的線性關(guān)
系是否密切,也就是檢驗回歸方程是否顯著。
觀察值yl,y2,...,yn之間所存在的差異,是由兩個因素引起的:一個是變
量x的取值不同,另一個是試驗誤差等其它因素的影響。
F檢驗:
回歸方程是否顯著,或線性關(guān)系是否密切,判別標(biāo)準(zhǔn)是SD的大小,即SD
越小越好。同時,在總波動(ST)不變的條件下,SD小,SR就大,SR/SD也
就大;反之,SD大,SR就小,SR/SD也就小,這是一種直觀的看法。
假設(shè)Ho:y與X無線性關(guān)系(b=0),可證統(tǒng)計量
F檢驗:
對確定的顯著性水平1檢驗水平),查F分布表得到F(l,n-2),
若F>F(l,n-2),就拒絕原假設(shè),即認(rèn)為線性回歸效果顯著;
若FF(l,n-2),就接受原假設(shè),即認(rèn)為線性回歸效果不顯著。
F檢驗:
F=62.961,若取顯著性水平為0.05,查得F(),05(1,16)=今49,故在在顯
著性水平0.05下,拒絕假設(shè)H0,即認(rèn)為線性回歸效果是顯著的?;蚩烧J(rèn)為在95%
的置信度下,認(rèn)為線性回歸效果是顯著的。
2.4一元線性回歸應(yīng)用舉例一一預(yù)報和控制y的取值
所謂預(yù)報,就是對任一給定的x0值,可以利用經(jīng)驗公式來推斷在這點的觀察
值(試驗值)y0大致在什么范圍內(nèi),其置信水平為(l-a)0
置信區(qū)間上、下限所形成的曲線對稱地落在經(jīng)驗直線的兩側(cè),且呈喇叭形。
思考題:
背景知識:一項建筑工程在設(shè)計中需要考慮建筑地基土的承載力,而建筑
地基土的承載力受多種指標(biāo)的影響,其中影響較大的指標(biāo)是抗剪強度指標(biāo),即建
筑地基土的凝聚力C和內(nèi)摩擦角6,這兩個指標(biāo)反映了抗剪強度(應(yīng)力)的大小。
剪應(yīng)力T隨垂直壓力P的大小變化而變化,它們之間的關(guān)系為經(jīng)驗公式:
T=C+P?tg<i>
式中C------凝聚力,
*------內(nèi)摩擦角
垂直壓力p/KPa剪應(yīng)力VKPa
10025.6
20030.4
30035.3
40046.5
問題:某房產(chǎn)開發(fā)區(qū)對某建筑地基土樣進行4次試驗,其結(jié)果如下:
求地基土的內(nèi)摩擦角6及凝聚力C,檢驗其效果,并預(yù)報當(dāng)垂直壓力p0=600
所對應(yīng)的剪應(yīng)力的范圍,置信水平(ba)為0.95。
解;n=4
44
£pi=10\Xl=1.378x1O9
i=1i=I
444
Xpd=3.783X104,Xpi?=
i=Ii=Ii=1
1.378xIO5
Sp?=3xIO,ST?=4.99x1O3(Zpi)也
is1is1is1
4
106(Xl-=1.9x104
i=1
7=2.50x102T=3.445x101
4
4.99X103
£=1
72=6.25x104T2=1.19x103
Lpp=S/4-*Epi)2=2.5X105
i=1i-I
LTT=f%-十(右叼2二2.4X102,
i=I4i=1
444
LpT=Xp"A(El)i)(Xu=
i-1-i=1i=1
3.38x103
所以;tg@=7^=
Lpp
3.783x1爐一4x2.5xIO2x34.45八”「
3x*4x6.25x104=°-6676
所求內(nèi)摩擦角牛二3.9°
凝聚力C=T-tg<P-7=
34.45-0.0676x2.5x102=17.55(kPa)
相關(guān)系數(shù)
EiPi\-npT
17R3xlfl4-4x2.5xlQ2x34.45
J3X|05-4X6.25X104.^4.99x103-4x1.19x103
0.997
而當(dāng)顯著水平a=0.05,n=4時查相關(guān)系數(shù)表
知
Yo.05=0.950Yo.oi=0.990
得Y>YO.O5且Y>YO.OI
所以,p與1的相關(guān)性是顯著的,并且是高度顯
著的。(注.?可信度高、效果好漪度高)
又:
b.4x123.38X1O3二一
I9。x/]_(?-----------z--------------U]
N2J2.5X105X2.4X102
9.86
當(dāng)1-a=0.95時,號⑵:4.3027(查表得)
025(4-2)-0-J1+十+叫F=56
所以,置信水平為0.95時,垂直壓力po二
600所對應(yīng)的剪應(yīng)力的范圍為,58.11-56,
58.11+56J,亦[2.11,114.11;o
這就是說,當(dāng)po=600時,在100次試驗
中,剪應(yīng)力T值平均有95次落在區(qū)間/2.11,
114.11/內(nèi)。
當(dāng)然,置信水平越高,預(yù)報區(qū)間就越長。
此例所得結(jié)果雖然預(yù)報區(qū)間長,不盡理想,但對生產(chǎn)實踐仍具有指導(dǎo)意義,它
提供了一種估值方法和預(yù)報范圍。此例之所以置信區(qū)間拉得如此寬,究其原因在
于試驗的次數(shù)n=4太少,樣本容量太小,造成如果結(jié)果,如果把樣本容量提高到
n=20或n=50,則所得結(jié)果可信度將更高,置信區(qū)間將極大地縮短。
4.多元線性回歸模型
設(shè)觀察得到容量為n的樣本(m個自變量,1個應(yīng)變量):
X1PX]?,???,xlm;丫1
X2PX22,?一,x2m;丫2
xnPxn2,,,,?xnm;yn
Y1=Po+PiXH+P2x12+...+pmxIm+€I
丫2=Po~*-PlX21_,_P2X22+,--+PmX2m+e2
7n=Po+PlXnl+p2Xn2+-+PmXnm+£n
假定y與Xj,(j=l,2,...,m)之間存在著線性關(guān)系:
+x+2
尸0J#2*2+…+mm?N(。,)
是隨機項。
我們的任務(wù)是從樣本數(shù)據(jù)來估計參數(shù),即由下式:
Y1=Po+PlXll+P2X12+---+PmXlm+ei
Y2=Po+PlX21+p2X22+---+PmX2m+82
<
=+XX++X+£
YnPoPlnl+p2n2-PInnmn
估計參數(shù)0,1,2,?…,m;而1,2,…,n相互獨立且服從相
同的分布N(0,2),(未知)。
AZyTBo+B1Xji+02X/2+...+PmX/m)]
/=1
5.應(yīng)用實例-影響煤層瓦斯賦存規(guī)律的多地質(zhì)因素回歸分析研究
影響煤層瓦斯賦存及分布的因素是多種多樣的,通過對瓦斯地質(zhì)規(guī)律的研究
可知,影響淮南潘一礦13-1煤瓦斯含量和分布規(guī)律的地質(zhì)因素主要有:煤層埋藏
深度、地質(zhì)構(gòu)造、煤層頂?shù)装鍘r性、煤層厚度和煤的變質(zhì)程度等。
為了研究各因素與瓦斯賦存的關(guān)系,便于建立預(yù)測數(shù)學(xué)模型,把地質(zhì)構(gòu)造、
頂?shù)装鍘r性這些通常定性化描述因素,根據(jù)其本身的特性和對瓦斯賦存的影響進
行科學(xué)地量化,轉(zhuǎn)化為定量因素。
(1)煤層埋藏深度
煤層的埋藏深度越深,煤層中的瓦斯向地表運移的距離就越長,散失就越困
難。同時,深度的增加也使煤層在上覆壓力的作用下降低了透氣性,有利于保存瓦
斯。
在研究區(qū)內(nèi)新生界直接不整合在二疊系上石盒子組煤系之上,中間的地層全
部缺失,影響煤層瓦斯含量應(yīng)與不整合面(即基巖面)距煤層以下的深度有較大關(guān)
系,因此煤層埋深因素取值為各鉆孔13-1煤層頂板距基巖面的距離。
(2)地質(zhì)構(gòu)造
地質(zhì)構(gòu)造中的斷層破壞了煤層的連續(xù)性,使煤層瓦斯排放條件發(fā)生了變化,
張扭性斷層有利于瓦斯的排放,壓扭性斷層對瓦斯的排放起阻擋作用,成為逸散
屏障。褶曲類型和褶皺復(fù)雜程度對瓦斯的賦存有影響,封閉的背斜有利于瓦斯的
存儲,是良好的儲氣構(gòu)造。
研究區(qū)潘一井田位于潘集背斜南翼及東西部傾伏轉(zhuǎn)折端南翼,井田內(nèi)以斜切
張扭性斷層為主,壓扭性斷層次之。由于井田內(nèi)次一級褶皺構(gòu)造不發(fā)育,所以在研
究區(qū)內(nèi)考慮地質(zhì)構(gòu)造因素時,主要針對斷層因素。據(jù)地質(zhì)資料統(tǒng)計:研究區(qū)斷層中
張扭性斷層54條,壓扭性斷層21條。
由于區(qū)內(nèi)斷層眾多,考慮到斷層對瓦斯的賦存影響程度不同,在對斷層因素
進行參數(shù)量化時,以落差大于10m,水平延伸大于500m,切割13-1煤層至基巖面的
斷層作為統(tǒng)計依據(jù),分別統(tǒng)計各鉆孔距見煤點最近的張扭性正斷層的水平距離作
為構(gòu)造參數(shù)。
(3)煤層頂、底板巖性
煤層生成的瓦斯在漫長的地質(zhì)年代有不同程度的遺散,而瓦斯的遺散與煤層
圍巖有密切關(guān)系。當(dāng)煤層的頂、底板巖性為致密完整的巖石,如泥巖、油頁巖時,
煤層中的瓦斯比較容易保存;頂板為多孔隙或脆性裂隙發(fā)育的巖石,如礫巖、砂巖,
瓦斯就容易逸散。
研究區(qū)內(nèi)13T煤層頂、底板巖性主要有泥巖、炭質(zhì)泥巖、砂質(zhì)泥巖、粉砂
巖和中砂巖。根據(jù)研究區(qū)頂、底板巖性特征,綜合考慮含砂率和砂質(zhì)顆粒粒度大
小對頂、底板巖性因素進行量化,把粒度最大,含砂率最高的中砂巖記為1,含砂
率最低的泥巖記為5,粉砂巖、砂質(zhì)泥巖、炭質(zhì)泥巖分別記為2、3、4。
(4)煤層厚度
煤層的厚度與瓦斯的分布有一定的關(guān)系,一般說來,同一煤層隨著厚度的增
加,瓦斯生成量大瓦斯含量增加。區(qū)內(nèi)鉆孔13-1煤層厚度1?43飛-39m,平均
4?25m,煤層結(jié)構(gòu)較復(fù)雜,半數(shù)以上見煤點有廠2層夾砰。煤厚因素取鉆孔取煤的
真厚,包括煤的厚度和夾砰的厚度。
(5)煤的變質(zhì)程度
在成煤的變質(zhì)階段,成煤的有機物在地層深處的高溫、高壓作用下,最著煤化
程度的加深,固定碳增加,揮發(fā)分因轉(zhuǎn)化成瓦斯而減少,瓦斯生成量增多。煤的變
質(zhì)程度可以用揮發(fā)分表示,所以在研究中以揮發(fā)分來表示變質(zhì)程度因素。
(6)其它地質(zhì)因素的影響
研究區(qū)內(nèi)煤層煤質(zhì)變化不大,在總體上對瓦斯含量的變化影響可以忽略。而
且煤系水義地質(zhì)條件較為簡單,未見地下水對煤層瓦斯賦存具有明顯影響的塊段,
因此在預(yù)測模型中可以忽略這些因素。解:樣本選擇和回歸模型的建立
根據(jù)上述地質(zhì)因素的分析篩選,確定煤層到基巖深度(xD、煤厚(x2)、離張
扭性正斷層平距(x3)、頂板巖性(x4)、底板巖性(x5)、和揮發(fā)份Vdaf(x6)等六
個影響因變量瓦斯含量(y)的自變量。統(tǒng)計潘一礦歷年勘探中具13-1煤瓦斯含量
測定值的鉆孔資料,選取其中53個鉆孔作為回歸分析樣本,各指標(biāo)的數(shù)據(jù)見表
1(因篇幅關(guān)系只列出部分?jǐn)?shù)據(jù))。同時,選取不參加回歸的15個不同深度、不同
頂?shù)装鍘r性和不同構(gòu)造特性的鉆孔數(shù)據(jù)作為檢驗樣本。
表1淮南潘礦13-1煤層瓦斯含量及控制因素
基巖深度/m煤厚扁離正斷層平距/bn頂板巖性底板巖性dal瓦斯含量/???L
樣號
x
x3A5%y
1307.272.0210.993337.005.34
2284.832.996.503339.805.57
3297.914.0515.005341.505.52
4253.73.0213.01354tt905.72
5238.784.238.514541.006.2
6240.393.127.512541.006.83
7232.063.083.021238.005.68
53438.664.861.15344a905.2
得到潘一礦13-1煤層瓦斯含量回歸方程為:
y=10.2769+0.004k,+0.7155%+0.1037r3+
0.110女4+0.229與-0.3307X6
由于模型中的變量具有不同的計量單位,因此回歸系
數(shù)的大小并不說明對因變量的影響程度。
通過結(jié)果表明,回歸結(jié)果顯著性水平較好,利用該模型計算煤層瓦斯含量確
定性系數(shù):R=0.855881;復(fù)相關(guān)系數(shù):『0.9251。說明瓦斯含量與上述因素線性關(guān)
系比較密切。通過對未參加回歸計算的15個鉆孔利用回歸模型進行進一步檢驗,
煤層實測瓦斯含量和預(yù)測的瓦斯含量關(guān)系折線圖,見圖lo從圖中可以看出,兩條
折線基本一致,說明利用上述模型進行預(yù)測是可信的。
6.思考題
1、查閱資料,論述回歸分析在地質(zhì)學(xué)中的應(yīng)用;
2、下載SPASS軟件,思考用SPASS實現(xiàn)回歸分析的方法。
第二節(jié)趨勢面分析
1.趨勢面分析的概念及類型
趨勢面分析是擬合空間曲面(或超曲面)的一種統(tǒng)計方法,是回歸分析的直接
推廣。在地質(zhì)上,趨勢面分析可將地質(zhì)變量(特征)區(qū)分為區(qū)域性變化分量和局
部性變化分量,從而研究地質(zhì)變量(特征)的空間分布和變化規(guī)律。
(1)趨勢:指事物發(fā)展或變化的主體,受總的規(guī)律的支配。在地質(zhì)上往往由
區(qū)域構(gòu)造、區(qū)域巖相等大區(qū)域因素所決定。
(2)局部異常:受局部因素支配,為事物發(fā)展的特殊部分。在地質(zhì)上往往是注
意的重點。以成礦為例,元素的平均值是很低的,唯有成礦(富集)才能形成可開
采的礦。這些富集點往往被看作局部異常點。
(3)隨機性變化:由隨機因素形成的偏差(白噪聲),包括取樣和分析誤差。
%地=尤區(qū)+X局+式隨
工區(qū)一趨勢部分
%偏一偏差部分
x局一局部偏差
X隨一隨機偏差
工地=入?yún)^(qū)+X偏
元偏=工局+X隨
(4)趨勢面:反映地質(zhì)變量在空間趨勢變化的曲面。一般指二元函數(shù),如煤
層厚度、煤層頂?shù)装鍢?biāo)高、構(gòu)造面高程等,這是一個真正的由面。但也有指三元
函數(shù)的,此時稱為超曲面。
(5)趨勢面分析:對于空間一組觀察值,排除隨機性干擾,找出反映主要變
化規(guī)律的趨勢(面)方程,求出局部異常。利用得出的結(jié)果結(jié)合地質(zhì)條件,分析趨
勢變化和局部異常的地質(zhì)意義,從而指導(dǎo)進一步的地質(zhì)工作(勘探或找礦)或?qū)Φ?/p>
質(zhì)過程作出合理解釋。
4=z,.一斗
⑸趨勢面分析:對于空間一組觀察值,排除隨機性干擾,找出反映主要變
化規(guī)律的趨勢(面)方程,求出局部異常。利用得出的結(jié)果結(jié)合地質(zhì)條件,分析趨
勢變化和局部異常的地質(zhì)意義,從而指導(dǎo)進一步的地質(zhì)工作(勘探或找礦)或?qū)Φ?/p>
質(zhì)過程作出合理解釋。
趨勢面分析一般作兩種圖,趨勢圖和偏差圖(剩余圖)。直接用原始數(shù)據(jù)插值
得到的稱為實測圖,實測圖減趨勢圖就得到偏差圖。
據(jù)用于擬合趨勢面的函數(shù)劃分:
(1)多項式趨勢分析(常用)
(2)調(diào)和趨勢分析(Fourier趨勢面分析)
(3)其它函數(shù)趨勢分析(指數(shù)、對數(shù)、察函數(shù)等)
根據(jù)多項式函數(shù)中自變量的個數(shù),可分為一元、二元、三元趨勢分析,每一
種又可分為一次、二次、三次、…等。
(1)一元趨勢分析
反映平面上曲線的變化趨勢。
23
z=bQ+blx+b2x+b3x
2
2=%+b[x+b2x
z=b()+b}x
(2)二元趨勢分析
反映三維空間曲面變化趨勢,是“真正的”趨勢面分析。
z=bG+b1x+b2y
22
z=%+b[x+b2y-\-b3x+b4xy+b5y
z=b()-^-b}x+b2y+b3x+"孫+仇y
+3?+b[Wy+b^xy2+/79y3
一、二、三元趨勢方程的次數(shù)、自變量個數(shù)(不含bO)與極值數(shù)關(guān)系表
次數(shù)自變量數(shù)極值最大數(shù)
曲線曲面超曲面
11230
22591
339192
4414343
5520554
6627835
???????????????
PPp(p+3)/2p-1
p(p2+6p+ll)/6
各種趨勢圖形
2.1二元一次趨勢面方程及計算
設(shè)某一地質(zhì)變量,在平面上有n個觀測值與地理橫坐標(biāo)、縱坐標(biāo)具有相
關(guān)關(guān)系,其表達(dá)式為:Z=f(x,y)=
構(gòu)成趨勢面分析的基本數(shù)據(jù),一次趨勢面方程為:
0=%+。1才+b2y(1)
各觀察點的趨勢值為:
zi=b^+bxxi+b2yi
2多項式趨勢面分析的數(shù)學(xué)模型及計算
以二元二次趨勢面方程為例,二元二次趨勢面方程為:
Z=%+4七+4/+a%:+a%/+45y2
i=1,2,...^
各觀察點的趨勢值為:
22
i—1,2,
據(jù)最小二乘原理,要求所配曲面與實測數(shù)據(jù)的離差平方和:
2
e=X(z/-z/)
1=1
=Z[(4一%一4七一%勢一么西2_九七巧一/??;)[2=min(8)
i=i
字=0"=0,1,234,5)(9)
ob.
整理得六元一次方程組:"
Xn
t"z*"£
2z一d
yLX
zr=lZ
xn丁
riL
”l=lr'zx
z"E?3z2
仇
內(nèi)
〃Za%
z2y/2Z-
r-lr'2
“"yf-lI-I
Z7Ann
z)z%
>/>yyJ匕z
Ef>fnH
yy.=l尸
2”
"/yzX"
3>2-442
y七Z
仇
Z毛A%%
7EZAJ.
尸3
l=l%I=1一
<==I〃""
2'y
?A3
犯JMvX2:2ZW4
uz-
Z-T.3.ZT-:
}27
tr”
”l=l?"%1
z、
222zz;
M.-必x4
%3-r4
-XrZL
/=l<=1l=lr=l
r
一r
“
”
"”
ZZZ22o
馬
自
-ZAb馬%'
——T
TEI2r/Tz.yi
一-
解方程組(10)得趨勢面方程并可計算出各觀察點的趨勢值為:
22
豆=%+2七十4乂+2七+々%,+4乂(i=l,2???,〃)(11)
3.趨勢面分析的擬合度
不同次數(shù)的趨勢面對原始資料逼近程度顯然是不一樣的,趨勢面對原始資料
的逼近情況,在數(shù)學(xué)上可用離差平方和的變化來表示:
M=」xioo%
cST
當(dāng)Nc=ioo隊則趨勢值在所有數(shù)據(jù)點上和觀察值完全吻合,這種擬合很少出
現(xiàn)。但當(dāng)數(shù)據(jù)點數(shù)與趨勢函數(shù)的項數(shù)(含bo)相同時,就會得到完全的擬合。這
樣的擬合是沒有什么必要的,因為趨勢面分析的一個重要方面就是求偏差值。
擬合度只是一個參考指標(biāo),這是因為擬合度只與觀察點的趨勢值及偏差有
關(guān)。至于觀察點分布是否合理,是否控制了測區(qū),那是另一回事,擬合度不能反
映。擬合度一般取40?60%即可。
4.實例分析
例1.在范圍內(nèi),選擇15個觀測點測量某沉淀物的粒徑,其數(shù)據(jù)如下表(坐
標(biāo)單位:千米;粒徑單位:毫米)。根據(jù)表中數(shù)據(jù),求出一次趨勢面方程,并計
算各點的一次趨勢值和偏差值。
點123456789101112131415
Xi222455778101112121215
Yi3101318143611813361013
zi1.92.31.12.62.21.83.53.11.31.21.41.71.81.21.0
例2.趨勢面分析在東歡坨井田構(gòu)造研究中的應(yīng)用
知識背景:1)趨勢面分析方法由計算機來實現(xiàn)。趨勢面反映的是區(qū)域曲面
(地形)的總體變化趨勢,適用于查明區(qū)域的趨勢;剩余面反映的是與大趨勢對
應(yīng)的局部變化,適用于查明局部異常。
知識背景:2)偏差值是用實際值減去趨勢值。因此,對于斷層而言,其一
盤表現(xiàn)為正異常,另一盤則表現(xiàn)為負(fù)異常,正、負(fù)異常帶之間的零值線,基本上
就是斷層的位置。正斷層一般上盤表現(xiàn)為正異常,下盤表現(xiàn)為負(fù)異常,斷層的傾
向則是由正異常帶向負(fù)異常帶。
在次數(shù)較高的偏差圖中,由于趨勢面擬合程度較高,這種規(guī)律則不太明顯。
另外,在1次偏差圖中,根據(jù)正、負(fù)異常條帶兩側(cè)的正、負(fù)異常值的大小,可大
致推斷斷層的斷距,一般情況下,正異常帶中的最高值與負(fù)異常帶中的最低值之
差,大致相當(dāng)于斷層的斷距。
8煤底板標(biāo)高二次趨勢面(a)及二次偏差圖(b)
8煤底板標(biāo)高三次趨勢面(a)及三次偏差圖(b)
5、思考題
1、思考二元P次趨勢面方程及計算方法?
2、嘗試用VB實現(xiàn)二元p次趨勢面方程的求解。
實測圖(曲面樣條函數(shù)插值)
14.00
12.00
10.00
8z二S
£288^
2.0010.0012.0014.00
二次趨勢面圖
二次趨勢面偏差圖(剩余圖)
第三節(jié)聚類分析
1.概述
聚類分析是一種數(shù)字分類方法。對分類對象間的關(guān)系用某些相似性度量進行
刻劃,根據(jù)相似性度量進行分類。也有稱群分析、簇群分析、簇分析、點群分析、
絲分析等,在1975年(蘇州)概率統(tǒng)計會上,決定使用聚類分析這一名稱。
1.1兩種不同的模式識別
有訓(xùn)練集:如判別分析,在己知樣本分類的情況下設(shè)計判別函數(shù)。這些己
知分類的樣本稱為訓(xùn)練集,也稱為有人管理或有教師的分類法。
無訓(xùn)練集:如聚類分析,在設(shè)計分類器時,所選用的樣本預(yù)先不知所屬的
類別,需要根據(jù)樣本間的距離或其它相似性的程度來自動地進行分類,也稱為無
人管理的分類。
1.2聚類分析的兩種類型
根據(jù)分類對象不同,分為Q型(Q-mode)和R型(R-mode)o
Q型一一對樣品進行分類。即把不同的物體(如巖石標(biāo)本、樣品等物種或
人種)進行比較,目的是要確定不同物體之間的關(guān)系,從而將物體進行歸類分群。
R型一一對變量進行分類。即屬于同一物種的各種屬性,即各類變量(如
巖石厚度、巖石成分及各種化驗觀測數(shù)據(jù))進行比較,目的是要不同變量之間的
關(guān)系,從而對變量進行分類。
1.3兩種不同的聚類方法(步驟)
根據(jù)聚類的方法,分為系統(tǒng)聚類法和分解法兩種。
系統(tǒng)聚類法(HierachicalClusteringMethods)是從少到多的聚類法,開始
各個樣本都各自為一類,以后逐步歸并,直至全部樣本變成一類。
分解法則相反,開始時全部樣本為一類,以后分解,直至各個樣本自成一類。
例L在煤田地質(zhì)勘探過程中,有時煤系含有多個煤層,如果標(biāo)志層不明顯,
只用宏觀的標(biāo)志進行煤層對比較為困難,這時就可用聚類分析進行煤層的數(shù)字分
類,從而達(dá)到對比煤層的目的。
做法是在一個煤田或勘探區(qū)內(nèi),選擇若干個煤鉆孔,對所有煤層進行工業(yè)
分析、光譜分析等取得一批實驗觀測數(shù)據(jù)(如下表)。
指標(biāo)AgsQg煤灰成分
化瞼號SiOFe2()3A1CaOMgOS0
22°33
143.466.3952.625.7015.249.955.829.60
237.037.836.105.2023.352.742.861.36
313.9010.1330.3633.5928.213.090.891.58
439.846.5671.904.0014.592.331.041.55
536.785.1253.581.8037.843.231.091.80
629.738.5155.807.8023.894.193.112.23
736.387.7867.905.4015.844.392.962.19
838.616.1751.063.8037.403.331.422.06
921.729.9553.6410.3025.942.722.661.31
(1)煤的灰分(Ag)表示出來為:
(2)如果每個煤層化驗兩個指標(biāo)(變量),如煤的灰分[Ag)和硫分(SQg),
則Ag和SQg為各點的二維坐標(biāo),如下圖:
A[%)
多維空間的點就不能用圖形直觀的表現(xiàn)出來。表示多維空間點與點之間的疏
密關(guān)系的量,稱為相似性度量(相似性統(tǒng)計量),如相似系數(shù),相關(guān)系數(shù),距離系
數(shù)、離差平方和增量等。
2數(shù)據(jù)的規(guī)格化處理
為了使觀測數(shù)據(jù)以等同的量級出現(xiàn),必須規(guī)格化處理,通常的方法有:標(biāo)準(zhǔn)
化、正規(guī)化、均值化及對數(shù)變換等。
2.1數(shù)據(jù)標(biāo)準(zhǔn)化
設(shè)有n個樣品,每個樣品測量了m項指標(biāo)(變量),得出如下原始數(shù)據(jù)矩陣,
為
-XllX12…X;
X=(x「)=泡】'22…X2m
????????????
_Xn!Xn2…Xnm.
f=l,2,(樣品個數(shù))
)=1,2,…,相(變量個數(shù))
為表示第i個樣品、第j個變量的觀測值。
設(shè)變換后的數(shù)據(jù)記為為,則
zLj=----—(i=1,2,…,n,j=1,2,…,m)
Iw1n
其中可?=汽與,3=J—
〃i=iY〃一】i=i
寫成矩陣形式為
則稱為Z=(zJ為標(biāo)準(zhǔn)化數(shù)據(jù)。
注:若所取樣品構(gòu)成的變量服從正態(tài)分布,則標(biāo)準(zhǔn)化后的數(shù)據(jù)Z)~N(O,1)。
2.2.數(shù)據(jù)正規(guī)化
所謂數(shù)據(jù)正規(guī)化,就是通過極差變換,把原始數(shù)據(jù)矩陣中的任何一列
的最小值化為0,最大值化為1,其余介于0與1之間。記
Zij(1<j<m)
max{xj-min{xj
其中皿乂比卜方口卜)分別為第j個變量的最大值與最小值。
寫成矩陣形式為:
Z11Z12
ZZ
Z?=(Zij/\=..2...1..............2..2.
_ZnlZn2
3.相似性度量
能夠度量變量(或樣品)之間相似性程度的數(shù)量指標(biāo),稱為相似性度量(統(tǒng)
計量)。常用的有:相似系數(shù)、相關(guān)系數(shù)、距離函數(shù)、誤差(距離)平方和增量
等。
3.1相關(guān)系數(shù)
在R型分析中,定義第j個變量和第1個變量之間的相關(guān)系數(shù)為:
Cov(Xj,xj
%】=(理論相關(guān)系數(shù))
OjO:
Cov為協(xié)方差,5為標(biāo)準(zhǔn)差。
實際應(yīng)用中,定義相關(guān)系數(shù)為:
Z(xij-K)(Xil-xj
i=l
0
£(Xij-又-Xj2
i=li=l
1n1:1
其中,瑪=一ZXjj,氏=一ZXi](j,1=1,2,…,m)
ni=ini=i
相關(guān)系數(shù)矩陣為:
G62…rx,n
用一%rr
I\—22…2.n
???????e????
_rn.\加…"
為一mXm階矩陣。
在Q型分析中,定義第i個樣品和第k個樣品之間的相關(guān)系數(shù)為:
m
E(Xij-xj(xkj-xk)
r=.j=i
ikn;
(X"-凡)?£(Xkj-4)2
V>i
1m1m
其中,X.=—yXj“xk=-yXkj(i,k=1,2,…,n)
m高m高
相關(guān)系數(shù)矩陣為:
\1ri2…rin-
rr…r
R=21222n
????????????
_rnlrn2…rnn.
為一nXn階矩陣。-14rV1。卜|大f關(guān)系密切c
3.2相似系數(shù)Sos。)
Q型:Q型中相似系數(shù)(cos。)用于樣品間的比較,夾角。愈小,表示兩個樣品
愈相似;夾角夕愈大,表示兩個樣品愈疏遠(yuǎn)。下面討論m=2情形。
若有n個樣品,每個樣品測得兩個變量區(qū),%),則每個樣品可用在西辦2坐
標(biāo)系中的點表示出來。若任取A、B兩個樣品,則A、B在司以2坐標(biāo)系中用相應(yīng)
的A、B兩點表示出來:.
設(shè)方、歷的模長分別為a、b,夾角為。,貝ij:
cos。=cos(q-乙)=cosRcos%+sin用sin02
sin。]=^-,sin^=—,cos^)=—,cos^)=—,
abaa
cos9=
a-ba?b
推廣到ID維空間,即每個樣品測得m個變量(再,%2,…,4),,(再1,項2,…工加)、
X式知,占2,…,X6")為m維空間中的兩個向量,由于(陽.,8)=|Ar.IIxkICOX0ik(內(nèi)
積)
(x〃xj
COX0ik
州J/WIw
據(jù)內(nèi)積定義即I陽」"柩及"x/二》/
7=1Vj=lVJ=1
代入(3)式中,得
m/|rn二m
cosOik=EXijX<j/Zxkji,k=l,2,…,n
/V>1
令sik=cos0ik(i,攵=1,2,…
由于cos盤為向量七和占的夾角,在標(biāo)準(zhǔn)化條件下,其取值范圍是0,~360°,
因此相似系數(shù)(cos%)的取值范圍為一1一1之間;在正規(guī)化條件下,其取值范
圍是0~90,因此相似系數(shù)(cos%)的取值范圍為0—1之間。
顯然,s汝大,表示i,火兩個樣品相似系數(shù)愈大。
對n個樣品可得
S11S12…Sln
^21S22S2n
S=(s)=
ik????????????
_SnlSn2…Snn_
為一nXn階矩陣。
R型:
R型中相似系數(shù)(cos。)用于變量間的比較。
cosXijxii/1ExijSxii上片1,2,…,m
/Vi=
此時組成一個mXm階矩陣。
在標(biāo)準(zhǔn)化數(shù)據(jù)下,由于云j一苞—0,q-%-1,則有:
n
Zxijxii
r"=1尸n=COS
Vi=li=l
即R型標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)等于相似系數(shù)。
4系統(tǒng)聚類法(HierachicalClustingMetjods)
4.1一般步驟
系統(tǒng)聚類法首先認(rèn)為n個樣本(樣品或變量)自成一類,此時各樣本之間的相
似性度量為初始相似性度量矩陣;然后選擇最相似的兩類合并成一個新類,計算
新類和其它類的相似性度量,再將最相似的兩類并成一類,這樣每次減少一類(相
似性度量矩陣縮小一階),直至所有的樣品合并成一類為止。
它的一般步驟為:
1.開始時每個樣本自成一類,共有n類,用數(shù)1,2,…,n分別標(biāo)記這n類。
2.從相似性度量矩陣中我出最相似的兩類,分別用p和q(p〈q)記這兩類,
用Spq記它們之間的相似性度量。
3.將p、q合并,新類記為p(保留p行p列),刪除矩陣中屬于q的行與列
(q行q列),標(biāo)記P的合并結(jié)果并刷新(更新)相似性度量矩陣中類P和所有其余
現(xiàn)存類之間的相似性度量。
4.重復(fù)第2步和第3步,總共講行nT次,此時全部成員都包括在一個類
內(nèi)。每次將合并的類和聯(lián)接它們的相似性度量記錄下來,得到聚類分析的一份完
整記錄。
各種不同的系統(tǒng)聚類法的區(qū)別無非在于第3步中刷新相似性度量矩陣的方
法而已。所謂最相似的兩類,對于距離類度量,是距離最小的兩類;對于相關(guān)系
數(shù)和相似系數(shù),是相關(guān)系數(shù)或相似系數(shù)最大的兩類。
3.2系統(tǒng)聚類法各論
3.2.1.最短距離法(近鄰連接法)
以兩類中最相似的兩個樣本的相似性度量作為該兩類的相似性度量。
一般公式:
1)對歐氏(斜交)距離
Smin
tr=(Spr,Sqr)
2)對相關(guān)系數(shù)和相似系數(shù)
Str=max(Sp「,Sqr)
遞推公式:
1)對歐氏(斜交)距離
111I
Str-Spr+2Sa。-21spe
2)對相關(guān)系數(shù)和相似系數(shù)
3.2.2.最長距離法(遠(yuǎn)鄰連接法)
以兩類中最不相似的兩個樣本的相似性度量作為該兩類的相似性度量。
一般公式:
1)對歐氏(斜交)距離
str=max(spr,sqr)
2)對相關(guān)系數(shù)和相似系數(shù)
s
tr=min(Sp〃sqr)
遞推公式:
1)對歐氏(斜交)距離
11
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版購銷簡單的合同范本
- 2025年度建筑照明材料采購合同范本3篇
- 杭州公司合作合同范本
- 2024酒店勞動合同模板
- 2025年度GRC構(gòu)件生產(chǎn)與裝配安全責(zé)任合同3篇
- 影視作品海外發(fā)行與推廣2025年度合同2篇
- 二零二五年度跨區(qū)域LNG管道運輸及倉儲服務(wù)合同3篇
- 2025年度電機維修智能化改造升級合同3篇
- 2025年度電子元器件專用紙箱采購與倉儲管理合同3篇
- 2024珠寶首飾租賃與購買合同
- TD/T 1060-2021 自然資源分等定級通則(正式版)
- 人教版二年級下冊口算題大全1000道可打印帶答案
- 《創(chuàng)傷失血性休克中國急診專家共識(2023)》解讀
- 倉庫智能化建設(shè)方案
- 海外市場開拓計劃
- 2024年度國家社會科學(xué)基金項目課題指南
- 供應(yīng)鏈組織架構(gòu)與職能設(shè)置
- 幼兒數(shù)學(xué)益智圖形連線題100題(含完整答案)
- 七上-動點、動角問題12道好題-解析
- 2024年九省聯(lián)考新高考 數(shù)學(xué)試卷(含答案解析)
- 紅色歷史研學(xué)旅行課程設(shè)計
評論
0/150
提交評論