![第五章 判別分析_第1頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/17/15d425c2-1330-47b9-94c9-2855370c1a89/15d425c2-1330-47b9-94c9-2855370c1a891.gif)
![第五章 判別分析_第2頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/17/15d425c2-1330-47b9-94c9-2855370c1a89/15d425c2-1330-47b9-94c9-2855370c1a892.gif)
![第五章 判別分析_第3頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/17/15d425c2-1330-47b9-94c9-2855370c1a89/15d425c2-1330-47b9-94c9-2855370c1a893.gif)
![第五章 判別分析_第4頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/17/15d425c2-1330-47b9-94c9-2855370c1a89/15d425c2-1330-47b9-94c9-2855370c1a894.gif)
![第五章 判別分析_第5頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/17/15d425c2-1330-47b9-94c9-2855370c1a89/15d425c2-1330-47b9-94c9-2855370c1a895.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1第五章第五章 判判 別別 分分 析析1 1 兩總體判別分析2 2 多總體判別分析3 3 逐步判別分析4 4 應(yīng)用算例簡介2v引言引言 地學(xué)領(lǐng)域內(nèi)有很多屬于歸類判別的問題,如地學(xué)領(lǐng)域內(nèi)有很多屬于歸類判別的問題,如: :儲儲層是否含油、巖樣屬于什么沉積相層是否含油、巖樣屬于什么沉積相 、生油巖處于、生油巖處于什么演化階段什么演化階段等,從定量角度看,它們都是對個體等,從定量角度看,它們都是對個體進行歸類判別的問題。進行歸類判別的問題。 為敘述方便,將個體稱為為敘述方便,將個體稱為樣品樣品,個體所屬的類稱,個體所屬的類稱為為總體總體。在此基礎(chǔ)上給出判別分析的一般概念。在此基礎(chǔ)上給出判別分析的一般概
2、念: 判別分析判別分析:根據(jù)已知的根據(jù)已知的G個總體中取出的個總體中取出的G組樣品組樣品的觀測值,建立總體與樣品變量之間定量關(guān)系的觀測值,建立總體與樣品變量之間定量關(guān)系(判判別函數(shù)別函數(shù)),并據(jù)此判別未知類屬樣品類別的一種多,并據(jù)此判別未知類屬樣品類別的一種多元統(tǒng)計分析方法。元統(tǒng)計分析方法。 3 設(shè)設(shè)ag(g=1,2,G)表示表示 G 個總體,每個總體中分個總體,每個總體中分別有別有ng個樣品,每個樣品有個樣品,每個樣品有m個變量。個變量。 當當G = 2時,叫做時,叫做兩總體判別兩總體判別,又稱為線性判別,又稱為線性判別;當當G 2時,叫做時,叫做多總體判別多總體判別;篩選變量建立判別;篩選
3、變量建立判別函數(shù)的方法叫做函數(shù)的方法叫做逐步判別分析逐步判別分析。 判別分析的基本步驟:判別分析的基本步驟:(1)搜集來自搜集來自G個總體的個總體的G組已知觀測值組已知觀測值(m個變量個變量);(2)根據(jù)已知數(shù)據(jù)建立判別函數(shù)根據(jù)已知數(shù)據(jù)建立判別函數(shù);(3)利用判別函數(shù)判別未知總體的樣品類屬。利用判別函數(shù)判別未知總體的樣品類屬。4 簡單說,兩總體判別就是確定樣品簡單說,兩總體判別就是確定樣品X是屬于總體是屬于總體A還是屬于還是屬于B 的統(tǒng)計分析方法。的統(tǒng)計分析方法。1 兩總體判別分析兩總體判別分析 判定樣品判定樣品X是屬于是屬于A 還是屬于還是屬于B 的判別函數(shù)一般的判別函數(shù)一般是是線性判別函數(shù)
4、線性判別函數(shù)。x1x2AB判別指數(shù)判別指數(shù)yc 右圖是一個簡單的判別過右圖是一個簡單的判別過程。判別樣品歸屬依賴于變程。判別樣品歸屬依賴于變量量x1,變量,變量x2對判別不起作對判別不起作用。用。y=x1即線性判別函數(shù)。即線性判別函數(shù)。圖圖5-1 示例示例5圖圖5-2 兩總體判別分析示意圖兩總體判別分析示意圖 A B abdx1x2yc新變量是原變新變量是原變量的線性組合量的線性組合2211xcxcy一、線性判別函數(shù)的一般形式一、線性判別函數(shù)的一般形式2211xcxcy 若樣品若樣品X 有有x1、x2兩個變量,總體兩個變量,總體A、B的樣品分別落在的樣品分別落在兩個橢圓內(nèi),如圖所示。兩個橢圓內(nèi)
5、,如圖所示。 若直接用若直接用 x1、x2的觀測值確的觀測值確定定X所屬的總體,則當觀測值所屬的總體,則當觀測值x1、x2分別落在區(qū)間分別落在區(qū)間(c,d)和和(a,b)內(nèi)時內(nèi)時,不能確定樣品屬于不能確定樣品屬于A或?qū)倩驅(qū)儆谟贐。但若把坐標系旋轉(zhuǎn)。但若把坐標系旋轉(zhuǎn)角角,變?yōu)樾伦鴺讼底優(yōu)樾伦鴺讼?y、z,變量,變量y 則則可把可把A、B分開,變量分開,變量y稱為判稱為判別函數(shù),其形式為:別函數(shù),其形式為:6 1原始數(shù)據(jù)原始數(shù)據(jù) 若總體若總體A、B各有各有na、nb個樣品觀測值個樣品觀測值,分別為分別為: x ij (a) ( i = 1, 2, , na; j = 1 , 2 , m) xkj
6、(b) (k = 1, 2, , nb; j = 1 , 2 , m)mmxcxcxcy2211(5-1) 稱上式為稱上式為線性判別函數(shù)線性判別函數(shù),它是空間中的平面。稱,它是空間中的平面。稱c1,c2,cm為為判別系數(shù)。判別系數(shù)。 一般,設(shè)樣品有一般,設(shè)樣品有m個變量,那么判別函數(shù)的一般個變量,那么判別函數(shù)的一般形式為:形式為: 二、判別系數(shù)的確定二、判別系數(shù)的確定這是建立判別函數(shù)所需要的數(shù)據(jù)。這是建立判別函數(shù)所需要的數(shù)據(jù)。7mjaijjiniaxcay1),2, 1()()(mjbkjjinkbxcby1),2, 1()()( 把把xij(a)、xkj(b)分別代入分別代入(5-1)得判別
7、函數(shù)值:得判別函數(shù)值:2. 費歇爾費歇爾(Fisher)準則下的判別函數(shù)準則下的判別函數(shù)2)()(byayQbankkniibybyayayH1212)()()()(animjjjiaaxcaynay11)()(1)(bnkmjjjibbxcbynby11)()(1)(記:記:兩組判別函數(shù)點的中心距兩組判別函數(shù)點的中心距 組內(nèi)判別函數(shù)組內(nèi)判別函數(shù)點的離散度點的離散度 8 費歇爾準則費歇爾準則: 使使Q 達到最大、達到最大、H 達到最小。達到最小。 Q達到最大,表明達到最大,表明兩組判別函數(shù)點的中兩組判別函數(shù)點的中心距最大;心距最大;H達到最達到最小,判別函數(shù)點的分小,判別函數(shù)點的分布最集中。滿
8、足以上布最集中。滿足以上條件的判別函數(shù)可最條件的判別函數(shù)可最大限度地把大限度地把A和和B區(qū)區(qū)分開分開(如圖所示如圖所示)。它的含義是:它的含義是:圖圖5-3 兩總體樣品點在平面兩總體樣品點在平面y上的投影上的投影yx2x19 V是是cj (j = 1 , 2 , m)的二次函數(shù)的二次函數(shù),且且V0,令:,令: 要求要求Q達到最大,達到最大,H 達到最小,則等價于要求達到最小,則等價于要求 達到最大。達到最大。),2, 1(0mjcVj整理后可得:整理后可得:V = Q / H), 2 , 1(1mjdCsmkjkjk10banikikjijnikikjijjkbxbxbxbxaxaxaxaxs
9、11)()()()()()()()(), 2 , 1()()(mjbxaxdjjj), 2 , 1,(mkj (5-2)mmxcxcxcy2211由上述線性方程組解出由上述線性方程組解出cj,從而確定判別函數(shù),從而確定判別函數(shù):11 若若A、B差異不明顯,那么由觀測值建立的判別差異不明顯,那么由觀測值建立的判別函數(shù)就無實際意義。為此,需要對函數(shù)就無實際意義。為此,需要對A、B的差異性的差異性進行檢驗。進行檢驗。 檢驗方法:利用建立的判別函數(shù)對檢驗方法:利用建立的判別函數(shù)對N(na+nb)個樣個樣品的總體重新判定,若判對了品的總體重新判定,若判對了n (n N )個,定義個,定義R=n/N為為判
10、對率判對率。R值越大,值越大,A、B差異就越明顯。差異就越明顯。三、顯著性檢驗及樣品判別三、顯著性檢驗及樣品判別在檢驗顯著的條件下,定義:在檢驗顯著的條件下,定義:1.顯著性檢驗顯著性檢驗2.判別指數(shù)判別指數(shù)babacnnbynayny)()(12為判別未知樣品所屬總體的為判別未知樣品所屬總體的判別指數(shù)判別指數(shù)。mjjjxcy1當當y D*時,否定假設(shè),即擬定的時,否定假設(shè),即擬定的m個變量能夠區(qū)分個變量能夠區(qū)分已知的已知的G個總體個總體 。否則接受假設(shè),即擬定的。否則接受假設(shè),即擬定的m個變個變量不能對樣品的歸屬做出正確的判別,此時應(yīng)剔量不能對樣品的歸屬做出正確的判別,此時應(yīng)剔除其中區(qū)分能力
11、小的或者引入一些更有效的變量,除其中區(qū)分能力小的或者引入一些更有效的變量,重新建立判別函數(shù)重新建立判別函數(shù) 。其中其中223 逐步判別分析逐步判別分析一、逐步判別的提出及其基本思想一、逐步判別的提出及其基本思想1. 逐步判別的提出逐步判別的提出 在擬定的判別變量之間在擬定的判別變量之間,既有相對的獨立性既有相對的獨立性,又存又存在著一定的成因聯(lián)系。對于區(qū)分已知總體來說在著一定的成因聯(lián)系。對于區(qū)分已知總體來說,具具有成因聯(lián)系的那些變量似乎各自的區(qū)分能力都較有成因聯(lián)系的那些變量似乎各自的區(qū)分能力都較強強,但當把它們都選入判別函數(shù)后但當把它們都選入判別函數(shù)后,又使得先選入的又使得先選入的變量區(qū)分能力
12、變?nèi)?。另外變量區(qū)分能力變?nèi)酢A硗?建立判別函數(shù)時需要求建立判別函數(shù)時需要求出出S-1,若存在區(qū)分能力不顯著的變量若存在區(qū)分能力不顯著的變量,可能導(dǎo)致可能導(dǎo)致S-1不不存在存在,故求不出判別函數(shù)。鑒于上述原因故求不出判別函數(shù)。鑒于上述原因,提出類似提出類似逐步回歸中逐步回歸中“篩選篩選”變量的方法變量的方法,即挑選那些判別即挑選那些判別能力真正強的變量建立判別函數(shù)。能力真正強的變量建立判別函數(shù)。23 如如3個總體各有個總體各有5個樣品,每個樣品有個樣品,每個樣品有2個變量,個變量,它們的觀測值如下:它們的觀測值如下: 對上述三個總體來說,對上述三個總體來說,x1的區(qū)分能力遠不如的區(qū)分能力遠不如x
13、2大大,若存在這樣的變量,就若存在這樣的變量,就求不出判別函數(shù)求不出判別函數(shù)。 總體總體樣品樣品a1(x1 , x2)a2(x1 , x2)a3(x1 , x2)11.0 2.51.2 4.01.4 5.021.0 2.61.2 4.21.4 5.231.0 2.41.2 4.11.4 5.141.0 2.31.2 4.31.4 5.351.0 2.71.2 4.21.4 5.2注注意意變變量量特特點點24156. 0000. 0000. 0000. 0SS-1不存在,故求不出判別函數(shù)。不存在,故求不出判別函數(shù)。 逐個檢驗擬定變量的區(qū)分能力,把區(qū)分能力強逐個檢驗擬定變量的區(qū)分能力,把區(qū)分能力強
14、的變量的變量“引入引入”判別函數(shù),在引入變量的過程中判別函數(shù),在引入變量的過程中,隨時隨時“剔出剔出”已引入判別函數(shù)中的區(qū)分能力變?nèi)跻岩肱袆e函數(shù)中的區(qū)分能力變?nèi)醯淖兞康淖兞?直到既沒有區(qū)分能力強的變量引入,又沒直到既沒有區(qū)分能力強的變量引入,又沒有區(qū)分能力變?nèi)醯淖兞刻蕹秊橹?。有區(qū)分能力變?nèi)醯淖兞刻蕹秊橹埂?.逐步判別的基本思想逐步判別的基本思想25 假設(shè)總體假設(shè)總體a gN (g , ) , g = 1 , 2 , G 。為了檢。為了檢驗變量的區(qū)分能力,定義驗變量的區(qū)分能力,定義總體內(nèi)離差矩陣總體內(nèi)離差矩陣W、總體總體間離差矩陣間離差矩陣B、總離差矩陣總離差矩陣T。記。記二、逐步判別分析方法
15、原理二、逐步判別分析方法原理 1. 原始數(shù)據(jù)原始數(shù)據(jù)與一般多總體判別分析相同。與一般多總體判別分析相同。 2. Wilks統(tǒng)計量統(tǒng)計量(檢驗變量區(qū)分能力的指標檢驗變量區(qū)分能力的指標)mmjimmjimmjitTbBwW,26Ggjgnkjgkigigkj ixxxxwg1)(1)()()()(Ggjjgiiggjixxxxnb1)()()()()(Ggnkjjgkiigkjigxxxxt11)()()()()(gnkigkgigGgxnx1)()(),2, 1(1可以證明可以證明: T = W + B27Wilks 統(tǒng)計量統(tǒng)計量: U=|W|/|T| 例例2 有有3個總體,樣品有個總體,樣品有
16、2個變量,其觀測值如下表:個變量,其觀測值如下表:特點:特點:第二個第二個變量差變量差異明顯異明顯,故總,故總體差異體差異大大 U是檢驗是檢驗m個變量個變量綜合區(qū)分能力綜合區(qū)分能力的指標。的指標。U 越小越小總體內(nèi)部差異越小,而總體之間差異越大??傮w內(nèi)部差異越小,而總體之間差異越大。 總體總體樣品樣品a1(x1 , x2)a2(x1 , x2)a3(x1 , x2)11.0 2.51.1 4.01.1 5.021.1 2.61.0 4.21.0 5.231.3 2.41.3 4.11.4 5.141.2 2.31.2 4.31.2 5.351.1 2.71.0 4.21.3 5.2288752
17、. 0TWU例例3 有有3個總體,樣品有個總體,樣品有2個變量,樣品觀測值下表:個變量,樣品觀測值下表: 2040. 00460. 00460. 02200. 0W2560.182980. 02980. 02373. 0T0101. 0TWU在本例中:在本例中:6120. 00700. 00700. 02200. 0W6299. 00353. 00353. 02373. 0T特點:特點:變量差變量差異不明異不明顯,故顯,故總體差總體差異不大異不大 總體總體樣品樣品a1(x1 , x2)a2(x1 , x2)a3(x1 , x2)11.0 2.51.1 2.11.1 2.121.1 2.61.0
18、 2.31.0 2.331.3 2.41.3 2.71.4 2.141.2 2.31.2 2.51.2 2.751.1 2.71.0 2.41.3 2.629 上述結(jié)果說明:上述結(jié)果說明:U越大變量的區(qū)分能力越弱,即越大變量的區(qū)分能力越弱,即總體之間的差異越小??傮w之間的差異越小。(5-8)1()1()0()1()1()0(2211221121mrrrrrrmrrrrrrrrrmmmmmtttwwwU 這里的這里的 Wilks統(tǒng)計量統(tǒng)計量U是檢驗是檢驗m個變量個變量綜合判別綜合判別能力能力的統(tǒng)計量。如果按列號的統(tǒng)計量。如果按列號r1,r2,rm的順序的順序?qū)和和T的行列式進行消去計算,并表
19、示出消去次的行列式進行消去計算,并表示出消去次序,那么序,那么U可以改寫為:可以改寫為: 從式從式(5-8)可導(dǎo)出檢驗可導(dǎo)出檢驗?zāi)硞€變量某個變量x(r)判別能力的判別能力的Wilks 統(tǒng)計量。統(tǒng)計量。30)()()(21prrrxxx類似式類似式(5-8)可得可得(5-9)1()1()0()1()1()0(2211221121prrrrrrprrrrrrrrrppppptttwwwU (1)“引入引入”變量變量x(r)的的Wilks 統(tǒng)計量統(tǒng)計量若在判別函數(shù)中再引入變量若在判別函數(shù)中再引入變量x(r),則有,則有: 設(shè)逐步判別進行了設(shè)逐步判別進行了p步,共引入了步,共引入了p個變量個變量(前前
20、p個個都是判別能力強的變量,沒有被剔除都是判別能力強的變量,沒有被剔除),記為:,記為:(p個變量個變量) 3. “引入引入”與與“剔除剔除”變量的統(tǒng)計量變量的統(tǒng)計量31 因此,因此,wrr(p)/trr(p)是引入變量是引入變量x(r) 后后U 的改變因子的改變因子,記為記為),(21)()(pprrprrrrrrrtwU(5-11) Ur越小,變量越小,變量x(r) 使總體之間的差異越明顯,它使總體之間的差異越明顯,它的判別能力就越強。的判別能力就越強。)()(2121prrprrrrrrrrrtwUUpp(5-10)()()1()1()0()1()1()0(2211221121prrpr
21、rprrrrrrprrrrrrrrrrtwtttwwwUppppp(p+1個變量個變量)322040. 00460. 00460. 02200. 0W2560.182980. 02980. 02373. 0T0101. 0TWU例例2中:中:U1= 0.22/0.2373=0.93U2=0.204/18.256=0.011 可見,第可見,第2個變量的區(qū)分能力比第個變量的區(qū)分能力比第1個變量大,因個變量大,因為從統(tǒng)計量來說,為從統(tǒng)計量來說,U2小于小于U1。33)()()(1) 1()()/() 1/()1 (prrprrprrrrwGwtpGNpGNUGUF(5-12) 因此用因此用Ur做為檢
22、驗變量做為檢驗變量x(r)判別能力的判別能力的Wilks 統(tǒng)計量。是否能夠引入,還需進行假設(shè)檢驗。統(tǒng)計量。是否能夠引入,還需進行假設(shè)檢驗。式中式中N=n1+n2+ng,即樣品的總數(shù)即樣品的總數(shù)。 F1服從自由度為服從自由度為(G-1)和和(N-G-p)的的F分布。對于給分布。對于給定的檢驗水平定的檢驗水平 ,查查F(G-1,N-G-p)分布表分布表, 得臨界值得臨界值F,若,若F1F, 變量變量x(r)的判別能力強。的判別能力強。統(tǒng)計量:統(tǒng)計量:假設(shè)假設(shè)H0:1=2 =G (總體間無差異總體間無差異)34 (2)“剔除剔除”變量變量x(r) 的的Wilks 統(tǒng)計量統(tǒng)計量 設(shè)逐步判別進行了設(shè)逐步
23、判別進行了p步,共引入了步,共引入了p個變量個變量(前前p個個都是判別能力強的變量,沒有被剔除都是判別能力強的變量,沒有被剔除),記為:,記為:)()()(21prrrxxx 它的第它的第p+1步擬剔除變量步擬剔除變量x(r) (r(r1,r2,rp) ,此此時,將時,將x(r) 的判別能力的判別能力視為第視為第p步要引入步要引入x(r) 的判別的判別能力能力,即,即:)1()1(*prrprrrtwU35 統(tǒng)計量統(tǒng)計量F2服從自由度為服從自由度為(G 1)和和(N G p + 1)的的F分布。對于給定的檢驗水平分布。對于給定的檢驗水平 ,查,查F(G-1,N-G-P+1)分布表得臨界值分布表
24、得臨界值F* ,若,若F2 F* , 變量變量x(r) 的判別能的判別能力小,應(yīng)剔除變量力小,應(yīng)剔除變量x(r)。統(tǒng)計量統(tǒng)計量*2) 1()1)(1() 1/() 1/()1 (rrrrUGUpGNpGNUGUF(5-13)36 逐步判別建立判別函數(shù)的過程與逐步回歸相似,逐步判別建立判別函數(shù)的過程與逐步回歸相似,不同之處是逐步判別分析要對不同之處是逐步判別分析要對W、T 兩個矩陣進行兩個矩陣進行變換。它的第變換。它的第p+1步不論是引入還是剔除變量步不論是引入還是剔除變量x(r),都是對都是對W和和T 矩陣進行一次變換。矩陣進行一次變換。),(/.),(/),(/),(/1)()()()()(
25、)()()()() 1(rlrkwwwwrlrkwwrlrkwwrlrkwwprrprlpkrpklprrpkrprrpklprrpkl(5-14) 第第p+1步消去步消去W、T 矩陣第矩陣第r列的變換公式為:列的變換公式為:3. 逐步判別的變換公式逐步判別的變換公式37),(/.),(/),(/),(/1)()()()()()()()()()1(rlrkttttrlrkttrlrkttrlrkttprrprlpkrpklprrpkrprrpklprrpkl(5-15) 1. 判別函數(shù)的系數(shù)判別函數(shù)的系數(shù) 若逐步判別分析進行了若逐步判別分析進行了p步結(jié)束,共引入了步結(jié)束,共引入了v個個變量變量
26、 (v m),那么按下式計算判別函數(shù)的系數(shù):,那么按下式計算判別函數(shù)的系數(shù):三、判別函數(shù)的系數(shù)和對樣品的判別三、判別函數(shù)的系數(shù)和對樣品的判別viigigogvjjgpijigGgxccGgvixwGNc),2, 1(21),2, 1(,)()()()()()(38viogiigggcxcqXF)()(ln)(),2, 1(Gg 2. 對樣品的判別對樣品的判別 樣品樣品 屬于屬于a g的函數(shù)值為的函數(shù)值為Fg(X),若,若 , 則樣品則樣品Xak 。TmxxxX)()()2()1()(max)(1XFXFgGgk 判別函數(shù)為判別函數(shù)為:Xak 的條件概率為:的條件概率為:GjjkkXFxFP1)
27、(exp/)(exp(),2,1(Gk39圖圖5-5 判判 別別 分分 析析 流流 程程 圖圖輸入輸入n、m、G和樣品觀測值和樣品觀測值輸入先驗類型、輸入先驗類型、PP值值剔除變量否?剔除變量否?變換矩陣變換矩陣W和和T,引入變量數(shù),引入變量數(shù)L=L-1計算類內(nèi)均值、總均值、類內(nèi)離差矩陣計算類內(nèi)均值、總均值、類內(nèi)離差矩陣W和總離差矩陣和總離差矩陣T,引入變量數(shù),引入變量數(shù)L=0變換變換W、T矩陣,計算判別系數(shù)和判別矩陣,計算判別系數(shù)和判別矩陣,輸出中間結(jié)果,引入變量數(shù)矩陣,輸出中間結(jié)果,引入變量數(shù)L=L+1L=0?改變改變PP ?引入變量否?引入變量否?開開 始始輸入臨界值輸入臨界值F1和和F
28、2結(jié)結(jié) 束束NYNNNYYY404 應(yīng)用算例簡介應(yīng)用算例簡介 例例1 判定生油巖熱演化階段判定生油巖熱演化階段 基本思想:視不同熱演化階段的生油巖為不同基本思想:視不同熱演化階段的生油巖為不同的總體。建立判別函數(shù),可用來判定生油巖樣品的的總體。建立判別函數(shù),可用來判定生油巖樣品的熱演化階段。熱演化階段。(詳見教材詳見教材)。 根據(jù)目前研究,可把生油巖的熱演化過程分為四根據(jù)目前研究,可把生油巖的熱演化過程分為四個階段,即未成熟、成熟、高成熟和過成熟階段個階段,即未成熟、成熟、高成熟和過成熟階段,因此可視為四個總體。因此可視為四個總體。 (1)在上述總體中取在上述總體中取66塊生油巖樣品,統(tǒng)計它們
29、塊生油巖樣品,統(tǒng)計它們地層年齡地層年齡(t)、現(xiàn)今地層溫度、現(xiàn)今地層溫度(T)和埋藏深度和埋藏深度(H)。(2)擬定判別變量擬定判別變量41 (3)建立四個總體的判別函數(shù)建立四個總體的判別函數(shù) 取引入和剔除臨界值取引入和剔除臨界值F1=F2=1.0,共引入,共引入x1, x2, x3和和x5四個變量,得判別函數(shù):四個變量,得判別函數(shù):在此擬定在此擬定6個變量,它們是:個變量,它們是:9 .5104382 .20029826. 040. 468.431)(53211xxxxXF1 .5129245 .20078226. 040. 468.432)(53212xxxxXF7 .5158272 .2
30、0134526. 041. 483.433)(53213xxxxXF3 .5176066 .20168126. 041. 445.434)(53214xxxxXF未成熟未成熟成成 熟熟高成熟高成熟過成熟過成熟x1=T+273,x2=t ,x3=H, x4=1/H, x5=ln(T+273),x6=1/(t+273)42引入順序引入順序變量號變量號變量名變量名1x5ln(T+273)2x1T+2733x2t4x3H變量引入順序變量引入順序問:變量的引入順序說明了什么?問:變量的引入順序說明了什么? 某種程度上說明了變量區(qū)分總體能力的強某種程度上說明了變量區(qū)分總體能力的強弱順序。弱順序。43 (4
31、)應(yīng)用應(yīng)用 珠江口盆地第三系生油巖為中新世至晚漸新世珠江口盆地第三系生油巖為中新世至晚漸新世沉積沉積,地層絕對年齡為地層絕對年齡為1630百萬年,埋藏深度為百萬年,埋藏深度為2200米,現(xiàn)今地層溫度為米,現(xiàn)今地層溫度為104。取地層絕對年齡。取地層絕對年齡為為25百萬年百萬年,按上述判別函數(shù)計算按上述判別函數(shù)計算,得:得:6 .514572)(1XF3 .514581)(2XF5 .514582)(3XF8 .514570)(4XF 其中其中F3(X)=514582.5最大,因此最大,因此判珠江口盆地第三判珠江口盆地第三系生油巖處在熱演化高成熟階段,系生油巖處在熱演化高成熟階段,與實際情況相與
32、實際情況相符。符。449645. 72213.362762.336060. 1)(4934. 79479.253407.451325. 1)(3050.106390.403609.352841. 2)(321332123211xxxXFxxxXFxxxXF 東濮凹陷西部沙三段有三角洲、濁流和風暴流東濮凹陷西部沙三段有三角洲、濁流和風暴流三種沉積相。在上述三種沉積相中取了三種沉積相。在上述三種沉積相中取了45塊巖樣,塊巖樣,鏡下統(tǒng)計其成份成熟度指標鏡下統(tǒng)計其成份成熟度指標x1(石英石英/(長石長石+巖屑巖屑)、雜基含量雜基含量x2和膠結(jié)物含量和膠結(jié)物含量x3三項參數(shù)。建立判定三三項參數(shù)。建立判定
33、三角洲、濁流和風暴流沉積相的判別函數(shù)為:角洲、濁流和風暴流沉積相的判別函數(shù)為: 例例2 識別沉積相識別沉積相 把某沉積環(huán)境下形成的巖石看成總體,對不同的把某沉積環(huán)境下形成的巖石看成總體,對不同的總體取樣,可建立判別巖樣沉積相的判別函數(shù),用總體取樣,可建立判別巖樣沉積相的判別函數(shù),用以識別碎屑巖的沉積相。以識別碎屑巖的沉積相。45 應(yīng)用實例應(yīng)用實例: 資料:某地區(qū)有資料:某地區(qū)有30余口井,僅有余口井,僅有1口井完整的巖口井完整的巖心,其余各井均有測井資料。心,其余各井均有測井資料。 利用上述已知井的資料建立了巖性識別函數(shù),反利用上述已知井的資料建立了巖性識別函數(shù),反演了演了30余口無巖心井的巖
34、性剖面。余口無巖心井的巖性剖面。 具體做法如下:具體做法如下: 例例3 識別巖性識別巖性 基本思想:視不同巖性的巖石為不同的總體,對基本思想:視不同巖性的巖石為不同的總體,對總體取樣,以不同巖性的巖石所對應(yīng)的測井參數(shù)為總體取樣,以不同巖性的巖石所對應(yīng)的測井參數(shù)為判別變量,建立巖性識別判別函數(shù),用于識別無巖判別變量,建立巖性識別判別函數(shù),用于識別無巖心井的巖性剖面。心井的巖性剖面。46 (1)觀察描述現(xiàn)有巖心,觀察描述現(xiàn)有巖心,結(jié)果有結(jié)果有礫巖、砂巖和泥礫巖、砂巖和泥巖巖,即有,即有3個巖性總體。個巖性總體。 (2)在測井圖上按不同在測井圖上按不同巖性對應(yīng)的深度讀取測巖性對應(yīng)的深度讀取測井參數(shù)值
35、,獲得建立判井參數(shù)值,獲得建立判別函數(shù)的原始數(shù)據(jù)。別函數(shù)的原始數(shù)據(jù)。圖圖5-6 某井實際巖性剖面某井實際巖性剖面 47 (3)建立巖性識別的判別函數(shù)建立巖性識別的判別函數(shù)3920.2052027. 05060.147561. 16036.231558. 06465. 07856. 1)(98764311xxxxxxxXF8605.1974299. 28695.148732. 17496.161506. 04794. 01269. 1)(98764312xxxxxxxXF9940.2875427. 48578.176158. 29497.182032. 03135. 00545. 0)(9876
36、4313xxxxxxxXF礫礫巖巖砂砂巖巖泥泥巖巖 x1-微電極微電極2; x2-2.5m梯度梯度; x3- 4m梯度梯度; x4- 感應(yīng)電導(dǎo)感應(yīng)電導(dǎo); x5-聲聲波波; x6- 淺測向淺測向; x7- 補償中子補償中子; x8-井徑井徑; x9-微電極差。微電極差。在判別函數(shù)中沒有引入在判別函數(shù)中沒有引入x2 和和x5。48(4) 判別結(jié)果判別結(jié)果圖圖5-7 巖性剖面及部分電測曲線示意圖巖性剖面及部分電測曲線示意圖2274222622302234223822422246225022542258226222662270深深度度巖巖心心剖剖面面預(yù)預(yù)測測剖剖面面微微電電極極24米米梯梯度度感感應(yīng)應(yīng)
37、電電導(dǎo)導(dǎo)淺淺測測向向補補償償中中子子微微電電極極差差井井徑徑49例例4 氣、水層判別氣、水層判別 大慶長垣南部黑帝廟油氣層分為大慶長垣南部黑帝廟油氣層分為氣層氣層、氣水層氣水層、含氣水層含氣水層、差氣層差氣層和和水層水層5類,作為建立判別函數(shù)類,作為建立判別函數(shù)時的時的5個總體。個總體。 選取常規(guī)測井的選取常規(guī)測井的7個參數(shù)作為判別指標,分別是:個參數(shù)作為判別指標,分別是:深測向深測向x1 、淺測向、淺測向x2 、聲波時差、聲波時差x3 、微電極、微電極x4 、微電位微電位x5 、2.5m電阻率電阻率x6、自然電位、自然電位x7 。 選取該地區(qū)氣藏典型井的氣層、氣水層、含氣水選取該地區(qū)氣藏典型
38、井的氣層、氣水層、含氣水層、差氣層和水層樣品分別為層、差氣層和水層樣品分別為46、83、14、20、33個,總共個,總共196個已知樣品。在此基礎(chǔ)上,應(yīng)用逐步個已知樣品。在此基礎(chǔ)上,應(yīng)用逐步判別分析建立了該區(qū)的氣、水層判別函數(shù):判別分析建立了該區(qū)的氣、水層判別函數(shù): 50氣層氣層F1(x)=332.509x1149.538x2+85.343x3+223.248x4+121.791x6+78.242x7 51.838氣水同層氣水同層F2(x) =266.472x178.156x2+84.501x3+210.524x4 1.879x6+34.774x7 27.497含氣水層含氣水層F3(x) =3
39、17.019x1101.174x2+65.514x3+91.535x4+ 25.578x6+83.621x7 39.848差氣層差氣層F4(x) =321.165x1109.990 x2+72.239x3+152.130 x42.474x6+85.940 x7 43.447水層水層F5(x) =228.842x195.139x2+91.373x3+276.140 x4+ 6.387x6+80.724x7 49.940其中微電位其中微電位x5判別效果不顯著,未引入判別函數(shù)。判別效果不顯著,未引入判別函數(shù)。51 所建立的判別模型對氣層、含氣層、氣水層、所建立的判別模型對氣層、含氣層、氣水層、干層和
40、水層的判別效果相當顯著干層和水層的判別效果相當顯著, 除氣層外所有層除氣層外所有層的正判率均達到的正判率均達到90%以上以上,氣層也達到氣層也達到89%??偟?。總的正判率達正判率達92.86%,說明該判別模型可用。,說明該判別模型可用。 利用所建判別模型對該地區(qū)其它井進行氣、水利用所建判別模型對該地區(qū)其它井進行氣、水層判別,優(yōu)選出層判別,優(yōu)選出2口試氣井,結(jié)果均獲得工業(yè)產(chǎn)能,口試氣井,結(jié)果均獲得工業(yè)產(chǎn)能,表明了判別模型的可用性。表明了判別模型的可用性。 52例例5 預(yù)報油氣勘探成功率預(yù)報油氣勘探成功率 四川盆地侏羅系自流井群大安寨組評價區(qū)劃分為四川盆地侏羅系自流井群大安寨組評價區(qū)劃分為675個單元。有鉆探資料的單元有個單元。有鉆探資料的單元有139個,其中個,其中57個個單元獲得了工業(yè)油氣井,把這些單元記為單元獲得了工業(yè)油氣井,把這些單元記為A組,其組,其勘探成功率為勘探成功率為1。未獲得工業(yè)油氣井、并經(jīng)過研究。未獲得工業(yè)油氣井、并經(jīng)過研究認為也不可能獲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藝術(shù)展覽設(shè)計師的空間布局與藝術(shù)呈現(xiàn)
- 年產(chǎn)100萬套轉(zhuǎn)椅配件及15萬套成品生產(chǎn)線項目可行性研究報告模板-立項拿地
- 2025年全球及中國自鎖平頭螺母行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球自由式風帆板行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球鈣鈦礦太陽光模擬器行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球生命科學(xué)服務(wù)行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球無人機測繪系統(tǒng)行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國碳捕獲與利用技術(shù)行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球汽車空調(diào)電機行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國家用前置過濾器行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 二零二五版電力設(shè)施維修保養(yǎng)合同協(xié)議3篇
- 最經(jīng)典凈水廠施工組織設(shè)計
- VDA6.3過程審核報告
- 2024-2030年中國并購基金行業(yè)發(fā)展前景預(yù)測及投資策略研究報告
- 2024年湖南商務(wù)職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫帶答案
- 骨科手術(shù)中常被忽略的操作課件
- 《湖南師范大學(xué)》課件
- 2024年全國各地中考試題分類匯編:作文題目
- 2024年高壓電工操作證考試復(fù)習題庫及答案(共三套)
- 《糖拌西紅柿 》 教案()
- 彈性力學(xué)數(shù)值方法:解析法:彈性力學(xué)中的變分原理
評論
0/150
提交評論