资源预览内容
第1页 / 共59页
第2页 / 共59页
第3页 / 共59页
第4页 / 共59页
第5页 / 共59页
第6页 / 共59页
第7页 / 共59页
第8页 / 共59页
第9页 / 共59页
第10页 / 共59页
亲,该文档总共59页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第五章第五章 判判 别别 分分 析析1 1 两总体判别分析2 2 多总体判别分析3 3 逐步判别分析4 4 应用算例简介1v引言引言 地学地学领领域内有很多属于域内有很多属于归类归类判判别别的的问题问题,如,如: :储层储层是否含油、岩是否含油、岩样样属于什么沉属于什么沉积积相相 、生油岩、生油岩处处于什么演化于什么演化阶阶段段等,从定量角度看,它等,从定量角度看,它们们都是都是对对个个体体进进行行归类归类判判别别的的问题问题。 为为叙述方便,将个体称叙述方便,将个体称为为样样品品,个体所属的,个体所属的类类称称为为总总体体。在此基。在此基础础上上给给出判出判别别分析的一般概念分析的一般概念: 判判别别分析分析:根据已知的根据已知的G个个总总体中取出的体中取出的G组样组样品品的的观测值观测值,建立,建立总总体与体与样样品品变变量之量之间间定量关系定量关系(判判别别函数函数),并据此判,并据此判别别未知未知类类属属样样品品类别类别的一种多的一种多元元统计统计分析方法。分析方法。 2 设设ag(g=1,2,G)表示表示 G 个个总总体,每个体,每个总总体中分体中分别别有有ng个个样样品,每个品,每个样样品有品有m个个变变量。量。 当当G = 2时时,叫做,叫做两两总总体判体判别别,又称,又称为线为线性判性判别别;当当G 2时时,叫做,叫做多多总总体判体判别别;筛选变筛选变量建立判量建立判别别函数的方法叫做函数的方法叫做逐步判逐步判别别分析分析。 判判别别分析的基本步分析的基本步骤骤:(1)搜集来自搜集来自G个个总总体的体的G组组已知已知观测值观测值(m个个变变量量);(2)根据已知数据建立判根据已知数据建立判别别函数函数;(3)利用判利用判别别函数判函数判别别未知未知总总体的体的样样品品类类属。属。3 简单说简单说,两,两总总体判体判别别就是确定就是确定样样品品X是属于是属于总总体体A还还是属于是属于B 的的统计统计分析方法。分析方法。1 两两总总体判体判别别分析分析 判定判定样样品品X是属于是属于A 还还是属于是属于B 的判的判别别函数一般函数一般是是线线性判性判别别函数函数。x1x2AB判判别别指数指数yc 右右图图是一个是一个简单简单的判的判别过别过程。判程。判别样别样品品归归属依属依赖赖于于变变量量x1,变变量量x2对对判判别别不起作不起作用。用。y=x1即即线线性判性判别别函数。函数。图图5-1 示例示例4图图5-2 两两总总体判体判别别分析示意分析示意图图 A B abdx1x2yc新新变变量是原量是原变变量的量的线线性性组组合合一、一、线线性判性判别别函数的一般形式函数的一般形式 若若样样品品X 有有x1、x2两个两个变变量,量,总总体体A、B的的样样品分品分别别落在落在两个两个椭圆椭圆内,如内,如图图所示。所示。 若直接用若直接用 x1、x2的的观测值观测值确确定定X所属的所属的总总体,体,则则当当观测值观测值x1、x2分分别别落在区落在区间间(c,d)和和(a,b)内内时时,不能确定不能确定样样品属于品属于A或属于或属于B。但若把坐。但若把坐标标系旋系旋转转角角,变为变为新坐新坐标标系系 y、z,变变量量y 则则可把可把A、B分开,分开,变变量量y称称为为判判别别函数,其形式函数,其形式为为:5 1原始数据原始数据 若若总总体体A、B各有各有na、nb个个样样品品观测值观测值,分分别为别为: x ij (a) ( i = 1, 2, , na; j = 1 , 2 , m) xkj (b) (k = 1, 2, , nb; j = 1 , 2 , m)(5-1) 称上式称上式为为线线性判性判别别函数函数,它是空,它是空间间中的平面。称中的平面。称c1,c2,cm为为判判别别系数。系数。 一般,一般,设样设样品有品有m个个变变量,那么判量,那么判别别函数的一般函数的一般形式形式为为: 二、判二、判别别系数的确定系数的确定这这是建立判是建立判别别函数所需要的数据。函数所需要的数据。6 把把xij(a)、xkj(b)分分别别代入代入(5-1)得判得判别别函数函数值值:2. 费费歇歇尔尔(Fisher)准准则则下的判下的判别别函数函数记记:两两组组判判别别函数点的中心距函数点的中心距 组组内判内判别别函数函数点的离散度点的离散度 7 费费歇歇尔尔准准则则: 使使Q 达到最大、达到最大、H 达到最小。达到最小。 Q达到最大,表明达到最大,表明两两组组判判别别函数点的中函数点的中心距最大;心距最大;H达到最达到最小,判小,判别别函数点的分函数点的分布最集中。布最集中。满满足以上足以上条件的判条件的判别别函数可最函数可最大限度地把大限度地把A和和B区区分开分开(如如图图所示所示)。它的含它的含义义是:是:图图5-3 两两总总体体样样品点在平面品点在平面y上的投影上的投影yx2x18 V是是cj (j = 1 , 2 , m)的二次函数的二次函数,且且V0,令:,令: 要求要求Q达到最大,达到最大,H 达到最小,达到最小,则则等价于要求等价于要求 达到最大。达到最大。整理后可得:整理后可得:V = Q / H9 (5-2)由上述由上述线线性方程性方程组组解出解出cj,从而确定判,从而确定判别别函数函数:10 若若A、B差异不明差异不明显显,那么由,那么由观测值观测值建立的判建立的判别别函数就无函数就无实际实际意意义义。为为此,需要此,需要对对A、B的差异性的差异性进进行行检验检验。 检验检验方法:利用建立的判方法:利用建立的判别别函数函数对对N(na+nb)个个样样品的品的总总体重新判定,若判体重新判定,若判对对了了n (n N )个,定个,定义义R=n/N为为判判对对率率。R值值越大,越大,A、B差异就越明差异就越明显显。三、三、显显著性著性检验检验及及样样品判品判别别在在检验显检验显著的条件下,定著的条件下,定义义:1.显显著性著性检验检验2.判判别别指数指数11为为判判别别未知未知样样品所属品所属总总体的体的判判别别指数指数。当当y D*时时,否定假,否定假设设,即,即拟拟定的定的m个个变变量能量能够够区分区分已知的已知的G个个总总体体 。否。否则则接受假接受假设设,即,即拟拟定的定的m个个变变量不能量不能对样对样品的品的归归属做出正确的判属做出正确的判别别,此,此时应时应剔剔除其中区分能力小的或者引入一些更有效的除其中区分能力小的或者引入一些更有效的变变量,量,重新建立判重新建立判别别函数函数 。其中其中213 逐步判逐步判别别分析分析一、逐步判一、逐步判别别的提出及其基本思想的提出及其基本思想1. 逐步判逐步判别别的提出的提出 在在拟拟定的判定的判别变别变量之量之间间,既有相既有相对对的独立性的独立性,又存又存在着一定的成因在着一定的成因联联系。系。对对于区分已知于区分已知总总体来体来说说,具具有成因有成因联联系的那些系的那些变变量似乎各自的区分能力都量似乎各自的区分能力都较较强强,但当把它但当把它们们都都选选入判入判别别函数后函数后,又使得先又使得先选选入的入的变变量区分能力量区分能力变变弱。另外弱。另外,建立判建立判别别函数函数时时需要求需要求出出S-1,若存在区分能力不若存在区分能力不显显著的著的变变量量,可能可能导导致致S-1不不存在存在,故求不出判故求不出判别别函数。函数。鉴鉴于上述原因于上述原因,提出提出类类似似逐步回逐步回归归中中“筛选筛选”变变量的方法量的方法,即挑即挑选选那些判那些判别别能能力真正力真正强强的的变变量建立判量建立判别别函数。函数。22 如如3个个总总体各有体各有5个个样样品,每个品,每个样样品有品有2个个变变量,量,它它们们的的观测值观测值如下:如下: 对对上述三个上述三个总总体来体来说说,x1的区分能力的区分能力远远不如不如x2大大,若存在若存在这样这样的的变变量,就量,就求不出判求不出判别别函数函数。 总总体体样样品品a1(x1 , x2)a2(x1 , x2)a3(x1 , x2)11.0 2.51.2 4.01.4 5.021.0 2.61.2 4.21.4 5.231.0 2.41.2 4.11.4 5.141.0 2.31.2 4.31.4 5.351.0 2.71.2 4.21.4 5.2注注意意变变量量特特点点23S-1不存在,故求不出判不存在,故求不出判别别函数。函数。 逐个逐个检验拟检验拟定定变变量的区分能力,把区分能力量的区分能力,把区分能力强强的的变变量量“引入引入”判判别别函数,在引入函数,在引入变变量的量的过过程中程中,随随时时“剔出剔出”已引入判已引入判别别函数中的区分能力函数中的区分能力变变弱的弱的变变量量,直到既没有区分能力直到既没有区分能力强强的的变变量引入,又没有区分能量引入,又没有区分能力力变变弱的弱的变变量剔除量剔除为为止。止。2.逐步判逐步判别别的基本思想的基本思想24 假假设设总总体体a gN (g , ) , g = 1 , 2 , G 。为为了了检检验验变变量量的的区区分分能能力力,定定义义总总体体内内离离差差矩矩阵阵W、总总体体间间离差矩离差矩阵阵B、总总离差矩离差矩阵阵T。记记二、逐步判二、逐步判别别分析方法原理分析方法原理 1. 原始数据原始数据与一般多与一般多总总体判体判别别分析相同。分析相同。 2. Wilks统计统计量量(检验变检验变量区分能力的指量区分能力的指标标)25可以可以证证明明: T = W + B26Wilks 统计统计量量: U=|W|/|T| 例例2 有有3个个总总体,体,样样品有品有2个个变变量,其量,其观测值观测值如下表:如下表:特点:特点:第二个第二个变变量差量差异明异明显显,故,故总总体差异体差异大大 U是是检验检验m个个变变量量综综合区分能力合区分能力的指的指标标。U 越小越小总总体内部差异越小,而体内部差异越小,而总总体之体之间间差异越大。差异越大。 总总体体样样品品a1(x1 , x2)a2(x1 , x2)a3(x1 , x2)11.0 2.51.1 4.01.1 5.021.1 2.61.0 4.21.0 5.231.3 2.41.3 4.11.4 5.141.2 2.31.2 4.31.2 5.351.1 2.71.0 4.21.3 5.227例例3 有有3个个总总体,体,样样品有品有2个个变变量,量,样样品品观测值观测值下表:下表: 在本例中:在本例中:特点:特点:变变量差量差异不明异不明显显,故,故总总体差体差异不大异不大 总总体体样样品品a1(x1 , x2)a2(x1 , x2)a3(x1 , x2)11.0 2.51.1 2.11.1 2.121.1 2.61.0 2.31.0 2.331.3 2.41.3 2.71.4 2.141.2 2.31.2 2.51.2 2.751.1 2.71.0 2.41.3 2.628 上述上述结结果果说说明:明:U越大越大变变量的区分能力越弱,即量的区分能力越弱,即总总体之体之间间的差异越小。的差异越小。(5-8) 这这里的里的 Wilks统计统计量量U是是检验检验m个个变变量量综综合判合判别别能力能力的的统计统计量。如果按列号量。如果按列号r1,r2,rm的的顺顺序序对对W和和T的行列式的行列式进进行消去行消去计计算,并表示出消去次算,并表示出消去次序,那么序,那么U可以改写可以改写为为: 从式从式(5-8)可可导导出出检验检验某个某个变变量量x(r)判判别别能力的能力的Wilks 统计统计量。量。29类类似式似式(5-8)可得可得(5-9) (1)“引入引入”变变量量x(r)的的Wilks 统计统计量量若在判若在判别别函数中再引入函数中再引入变变量量x(r),则则有有: 设设逐逐步步判判别别进进行行了了p步步,共共引引入入了了p个个变变量量(前前p个个都是判都是判别别能力能力强强的的变变量,没有被剔除量,没有被剔除),记为记为:(p个个变变量量) 3. “引入引入”与与“剔除剔除”变变量的量的统计统计量量30 因此,因此,wrr(p)/trr(p)是引入是引入变变量量x(r) 后后U 的改的改变变因子因子,记为记为(5-11) Ur越小,越小,变变量量x(r) 使使总总体之体之间间的差异越明的差异越明显显,它,它的判的判别别能力就越能力就越强强。(5-10)(p+1个个变变量量)31例例2中:中:U1= 0.22/0.2373=0.93U2=0.204/18.256=0.011 可可见见,第,第2个个变变量的区分能力比第量的区分能力比第1个个变变量大,因量大,因为为从从统计统计量来量来说说,U2小于小于U1。32(5-12) 因此用因此用Ur做做为检验变为检验变量量x(r)判判别别能力的能力的Wilks 统计统计量。是否能量。是否能够够引入,引入,还还需需进进行假行假设检验设检验。式中式中N=n1+n2+ng,即即样样品的品的总总数数。 F1服从自由度服从自由度为为(G-1)和和(N-G-p)的的F分布。分布。对对于于给给定的定的检验检验水平水平 ,查查F(G-1,N-G-p)分布表分布表, 得得临临界界值值F,若,若F1F, 变变量量x(r)的判的判别别能力能力强强。统计统计量:量:假假设设H0:1=2 =G (总总体体间间无差异无差异)33 (2)“剔除剔除”变变量量x(r) 的的Wilks 统计统计量量 设设逐步判逐步判别进别进行了行了p步,共引入了步,共引入了p个个变变量量(前前p个个都是判都是判别别能力能力强强的的变变量,没有被剔除量,没有被剔除),记为记为: 它的第它的第p+1步步拟拟剔除剔除变变量量x(r) (r(r1,r2,rp) ,此此时时,将,将x(r) 的判的判别别能力能力视为视为第第p步要引入步要引入x(r) 的判的判别别能力能力,即,即:34 统计统计量量F2服从自由度服从自由度为为(G 1)和和(N G p + 1)的的F分布。分布。对对于于给给定的定的检验检验水平水平 ,查查F(G-1,N-G-P+1)分布表得分布表得临临界界值值F* ,若,若F2 F* , 变变量量x(r) 的判的判别别能能力小,力小,应应剔除剔除变变量量x(r)。统计统计量量(5-13)35 逐逐步步判判别别建建立立判判别别函函数数的的过过程程与与逐逐步步回回归归相相似似,不不同同之之处处是是逐逐步步判判别别分分析析要要对对W、T 两两个个矩矩阵阵进进行行变变换换。它它的的第第p+1步步不不论论是是引引入入还还是是剔剔除除变变量量x(r),都是都是对对W和和T 矩矩阵进阵进行一次行一次变换变换。(5-14) 第第p+1步消去步消去W、T 矩矩阵阵第第r列的列的变换变换公式公式为为:3. 逐步判逐步判别别的的变换变换公式公式36(5-15) 1. 判判别别函数的系数函数的系数 若逐步判若逐步判别别分析分析进进行了行了p步步结结束,共引入了束,共引入了v个个变变量量 (v m),那么按下式,那么按下式计计算判算判别别函数的系数:函数的系数:三、判三、判别别函数的系数和函数的系数和对样对样品的判品的判别别37 2. 对样对样品的判品的判别别 样样品品 属于属于a g的函数的函数值为值为Fg(X),若,若 , 则样则样品品Xak 。 判判别别函数函数为为:Xak 的条件概率的条件概率为为:38图图5-5 判判 别别 分分 析析 流流 程程 图图输输入入n、m、G和和样样品品观测值观测值输输入先入先验类验类型、型、PP值值剔除剔除变变量否?量否?变换变换矩矩阵阵W和和T,引入,引入变变量数量数L=L-1计计算算类类内均内均值值、总总均均值值、类类内离差矩内离差矩阵阵W和和总总离差矩离差矩阵阵T,引入,引入变变量数量数L=0变换变换W、T矩矩阵阵,计计算判算判别别系数和判系数和判别别矩矩阵阵,输输出中出中间结间结果,引入果,引入变变量数量数L=L+1L=0?改改变变PP ?引入引入变变量否?量否?开开 始始输输入入临临界界值值F1和和F2结结 束束NYNNNYYY394 应应用算例用算例简简介介 例例1 判定生油岩判定生油岩热热演化演化阶阶段段 基本思想:基本思想:视视不同不同热热演化演化阶阶段的生油岩段的生油岩为为不同的不同的总总体。建立判体。建立判别别函数,可用来判定生油岩函数,可用来判定生油岩样样品的品的热热演化演化阶阶段。段。(详见详见教材教材)。 根据目前研究,可把生油岩的根据目前研究,可把生油岩的热热演化演化过过程分程分为为四四个个阶阶段,即未成熟、成熟、高成熟和段,即未成熟、成熟、高成熟和过过成熟成熟阶阶段段,因此可因此可视为视为四个四个总总体。体。 (1)在上述在上述总总体中取体中取66块块生油岩生油岩样样品,品,统计统计它它们们地地层层年年龄龄(t)、现现今地今地层层温度温度(T)和埋藏深度和埋藏深度(H)。(2)拟拟定判定判别变别变量量40 (3)建立四个建立四个总总体的判体的判别别函数函数 取引入和剔除取引入和剔除临临界界值值F1=F2=1.0,共引入,共引入x1, x2, x3和和x5四个四个变变量,得判量,得判别别函数:函数:在此在此拟拟定定6个个变变量,它量,它们们是:是:未成熟未成熟成成 熟熟高成熟高成熟过过成熟成熟x1=T+273,x2=t ,x3=H, x4=1/H, x5=ln(T+273),x6=1/(t+273)41引入引入顺顺序序变变量号量号变变量名量名1x5ln(T+273)2x1T+2733x2t4x3H变变量引入量引入顺顺序序问问:变变量的引入量的引入顺顺序序说说明了什么?明了什么? 某种程度上某种程度上说说明了明了变变量区分量区分总总体能力的体能力的强强弱弱顺顺序。序。42 (4)应应用用 珠江口盆地第三系生油岩珠江口盆地第三系生油岩为为中新世至晚中新世至晚渐渐新世沉新世沉积积,地地层绝对层绝对年年龄为龄为1630百万年,埋藏深度百万年,埋藏深度为为2200米,米,现现今地今地层层温度温度为为104。取地。取地层绝对层绝对年年龄为龄为25百万年百万年,按上述判按上述判别别函数函数计计算算,得:得: 其中其中F3(X)=514582.5最大,因此最大,因此判珠江口盆地第判珠江口盆地第三系生油岩三系生油岩处处在在热热演化高成熟演化高成熟阶阶段,段,与与实际实际情况情况相符。相符。43 东东濮凹陷西部沙三段有三角洲、濮凹陷西部沙三段有三角洲、浊浊流和流和风风暴流三暴流三种沉种沉积积相。在上述三种沉相。在上述三种沉积积相中取了相中取了45块块岩岩样样,镜镜下下统计统计其成份成熟度指其成份成熟度指标标x1(石英石英/(长长石石+岩屑岩屑)、杂杂基含量基含量x2和胶和胶结结物含量物含量x3三三项项参数。建立判定三角参数。建立判定三角洲、洲、浊浊流和流和风风暴流沉暴流沉积积相的判相的判别别函数函数为为: 例例2 识别识别沉沉积积相相 把某沉把某沉积环积环境下形成的岩石看成境下形成的岩石看成总总体,体,对对不同的不同的总总体取体取样样,可建立判,可建立判别别岩岩样样沉沉积积相的判相的判别别函数,用函数,用以以识别识别碎屑岩的沉碎屑岩的沉积积相。相。44 应应用用实实例例: 资资料料:某某地地区区有有30余余口口井井,仅仅有有1口口井井完完整整的的岩岩心,其余各井均有心,其余各井均有测测井井资资料。料。 利利用用上上述述已已知知井井的的资资料料建建立立了了岩岩性性识识别别函函数数,反反演了演了30余口无岩心井的岩性剖面。余口无岩心井的岩性剖面。 具体做法如下:具体做法如下: 例例3 识别识别岩性岩性 基本思想:基本思想:视视不同岩性的岩石不同岩性的岩石为为不同的不同的总总体,体,对对总总体取体取样样,以不同岩性的岩石所,以不同岩性的岩石所对应对应的的测测井参数井参数为为判判别变别变量,建立岩性量,建立岩性识别识别判判别别函数,用于函数,用于识别识别无岩无岩心井的岩性剖面。心井的岩性剖面。45 (1)观观察描述察描述现现有岩心,有岩心,结结果有果有砾砾岩、砂岩和泥岩、砂岩和泥岩岩,即有,即有3个岩性个岩性总总体。体。 (2)在在测测井井图图上按不同上按不同岩性岩性对应对应的深度的深度读读取取测测井参数井参数值值,获获得建立判得建立判别别函数的原始数据。函数的原始数据。图图5-6 某井某井实际实际岩性剖面岩性剖面 46 (3)建立岩性建立岩性识别识别的判的判别别函数函数砾砾岩岩砂砂岩岩泥泥岩岩 x1-微微电电极极2; x2-2.5m梯梯度度; x3- 4m梯梯度度; x4- 感感应应电电导导; x5-声声波波; x6- 浅浅测测向向; x7- 补偿补偿中子中子; x8-井径井径; x9-微微电电极差。极差。在判在判别别函数中没有引入函数中没有引入x2 和和x5。47(4) 判判别结别结果果图图5-7 岩性剖面及部分岩性剖面及部分电测电测曲曲线线示意示意图图2274222622302234223822422246225022542258226222662270深深度度岩岩心心剖剖面面预预测测剖剖面面微微电电极极24米米梯梯度度感感应应电电导导浅浅测测向向补补偿偿中中子子微微电电极极差差井井径径48例例4 气、水气、水层层判判别别 大大庆长庆长垣南部黑帝垣南部黑帝庙庙油气油气层层分分为为气气层层、气水气水层层、含气水含气水层层、差气差气层层和和水水层层5类类,作,作为为建立判建立判别别函数函数时时的的5个个总总体。体。 选选取常取常规测规测井的井的7个参数作个参数作为为判判别别指指标标,分,分别别是:是:深深测测向向x1 、浅、浅测测向向x2 、声波、声波时时差差x3 、微、微电电极极x4 、微微电电位位x5 、2.5m电电阻率阻率x6、自然、自然电电位位x7 。 选选取取该该地区气藏典型井的气地区气藏典型井的气层层、气水、气水层层、含气水、含气水层层、差气、差气层层和水和水层样层样品分品分别为别为46、83、14、20、33个,个,总总共共196个已知个已知样样品。在此基品。在此基础础上,上,应应用逐步用逐步判判别别分析建立了分析建立了该该区的气、水区的气、水层层判判别别函数:函数: 49气气层层F1(x)=332.509x1149.538x2+85.343x3+223.248x4+121.791x6+78.242x7 51.838气水同气水同层层F2(x) =266.472x178.156x2+84.501x3+210.524x4 1.879x6+34.774x7 27.497含气水含气水层层F3(x) =317.019x1101.174x2+65.514x3+91.535x4+ 25.578x6+83.621x7 39.848差气差气层层F4(x) =321.165x1109.990x2+72.239x3+152.130x42.474x6+85.940x7 43.447水水层层F5(x) =228.842x195.139x2+91.373x3+276.140x4+ 6.387x6+80.724x7 49.940其中微其中微电电位位x5判判别别效果不效果不显显著,未引入判著,未引入判别别函数。函数。50 所建立的判所建立的判别别模型模型对对气气层层、含气、含气层层、气水、气水层层、干干层层和水和水层层的判的判别别效果相当效果相当显显著著, 除气除气层层外所有外所有层层的正判率均达到的正判率均达到90%以上以上,气气层层也达到也达到89%。总总的的正判率达正判率达92.86%,说说明明该该判判别别模型可用。模型可用。 利用所建判利用所建判别别模型模型对该对该地区其它井地区其它井进进行气、水行气、水层层判判别别,优选优选出出2口口试试气井,气井,结结果均果均获获得工得工业产业产能,能,表明了判表明了判别别模型的可用性。模型的可用性。 51例例5 预报预报油气勘探成功率油气勘探成功率 四川盆地侏四川盆地侏罗罗系自流井群大安寨系自流井群大安寨组评组评价区划分价区划分为为675个个单单元。有元。有钻钻探探资资料的料的单单元有元有139个,其中个,其中57个个单单元元获获得了工得了工业业油气井,把油气井,把这这些些单单元元记为记为A组组,其,其勘探成功率勘探成功率为为1。未。未获获得工得工业业油气井、并油气井、并经过经过研究研究认为认为也不可能也不可能获获得工得工业业油气井的油气井的单单元有元有38个,把个,把这这些些单单元元记为记为B组组,其勘探成功率,其勘探成功率为为0。以。以14个地个地质质变变量量对对两两组单组单元作逐步判元作逐步判别别分析,得到勘探成功率分析,得到勘探成功率为为1的的组组的判的判别别函数和勘探成功率函数和勘探成功率为为0的的组组的判的判别别函函数:数: 52x2:早第三早第三纪纪前大安寨前大安寨组组底面古构造六次底面古构造六次趋势趋势剩余剩余值值,m;x3:大安寨大安寨组组底面底面现现今构造海拔高度今构造海拔高度,m ;x4:早第三早第三纪纪前大安寨前大安寨组组底面古构造六次底面古构造六次趋势值趋势值,mx5 :介屑灰岩、介屑灰岩、页页岩沉岩沉积积韵律数;韵律数;x7 : (页页岩厚度岩厚度+介屑灰岩厚度介屑灰岩厚度)/组组厚度,厚度,%;53 利用利用FA(X)和和FB(X)、对对A、B两两组单组单元的回判元的回判结结果果为为: A组组的的57个个单单元判元判对对了了54个,个,B组组的的38个个单单元判元判对对了了36个,判个,判对对率大于率大于94%,判,判别别函数是高度函数是高度显显著的。著的。 将其它未知的将其它未知的评评价价单单元元对应对应的的5个个变变量量值值代入代入FA(X),计计算出属于算出属于A组组的的后后验验概率概率,也就是,也就是单单元元的勘探成功率,在此基的勘探成功率,在此基础础上上绘绘出勘探成功率出勘探成功率预测预测等等值线图值线图。结结合其它合其它资资料,料,应应在此在此图图上上选择选择成功成功率相率相对对高的区高的区块优块优先勘探。先勘探。54图图5-8 大安寨大安寨组组勘探成功概率勘探成功概率预报图预报图(据据陈陈立平,立平,陈陈子恩子恩)55 本章复本章复习习要点要点1. 判判别别分析的概念分析的概念;2. 两两总总体判体判别别的的费费歇歇尔尔准准则则;3. 线线性判性判别别函数确定及两函数确定及两总总体判体判别别方法方法;4. Bayes准准则则下建立下建立正正态态多多总总体体判判别别函数的基本原理函数的基本原理;5. 逐步判逐步判别别分析的基本分析的基本过过程程;6. 实际应实际应用。用。56思考与思考与练习题练习题 1. 什么是判什么是判别别分析?分析?2. 试试述建立述建立线线性判性判别别函数的函数的费费歇歇尔尔准准则则。3. 如何用如何用线线性判性判别别函数函数对样对样品所属的品所属的总总体判体判别别?4. 试试述述Bayes准准则则下建立多下建立多总总体判体判别别一般判一般判别别函数的基函数的基本原理。本原理。5. 为为何提出逐步判何提出逐步判别别分析?分析?6. 试试述逐步判述逐步判别别分析的基本思想和及其基本分析的基本思想和及其基本过过程。程。57 作作 业业P67 1、3、4、5P56 1、2、3、4、6注:下周一上注:下周一上课课准准时时交。交。5859
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号