资源预览内容
第1页 / 共78页
第2页 / 共78页
第3页 / 共78页
第4页 / 共78页
第5页 / 共78页
第6页 / 共78页
第7页 / 共78页
第8页 / 共78页
第9页 / 共78页
第10页 / 共78页
亲,该文档总共78页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第六章 空间统计学分析,空间统计分析方法由来 空间统计分析方法组成,空间统计分析方法由分析空间变异与结构的半变异函数和用以空间局部估计的克立格插值法两个主要部分组成,是GIS空间分析的一个重要技术手段。,由于空间现象之间存在不同方向、不同距离成分等相互作用,使得传统的数理统计方法无法很好地解决空间样本点的选取、空间估值和两组以上空间数据的关系等问题,因此,空间统计分析方法应运而生。,Contents,6.1.1 空间统计分析的概念,20世纪60年代,法国统计学家Matheron G通过大量理论研究,形成了一门新的统计学分支,即空间统计学。,空间统计学是以区域化变量理论为基础,以变异函数为主要工具,研究具有地理空间信息特性的事物或现象的空间相互作用及变化规律的学科。,自相关 空间统计分析的重要任务,空间统计分析方法假设研究区中所有的值都是非独立的,相互之间存在相关性。在空间或时间范畴内,这种相关性被称为自相关。,揭示空间数据的相关规律和利用相关规律进行未知点预测。由于空间统计分析包含这两个显著的任务,所以涉及两次使用样点数据,第一次用作估计空间自相关,第二次用作未知点预测。,6.1.2 空间统计分析中的理论假设,1. 区域化变量,区域化变量的两重性表现在观测前把它看成是随机场,依赖于坐标(Xu,Xv,Xw),观测后是一个普通的空间三元函数值或一个空间点函数。,区域化变量是一种在空间上具有数值的实函数,它具有以下属性:,其它属性:, 区域化变量在一定范围内呈一定程度的空间相关,当超出这一范围之后,相关性变弱甚至消失。, 对于任一区域化变量,特殊的变异性可以叠加在一般的规律之上。,2. 协方差函数 CovZ(t1),Z(t2)=EZ(t1)EZ(t1)Z(t2)EZ(t2) (6.1),在随机函数中,当只有一个自变量x时称为随机过程,随机过程Z(t)在时间t1和t2处的随机变量Z(t1)、Z(t2)的二阶混合中心矩定义为随机过程的协方差函数记为CovZ(t1),Z(t2),即,CovZ(x),Z(x+h)=EZ(x)Z(x+h)EZ(x)EZ(x+h) (6.2) Cov(x,x+0)=EZ(x)2EZ(x)2 (6.3),当随机函数依赖于多个自变量时,Z(x)=Z(Xu,Xv,Xw)称为随机场,而随机场Z(x)在空间点x和x+h处的两个随机变量Z(x)和Z(x+h)的二阶混合中心矩定义为随机场Z(x)的自协方差函数,即,随机场Z(x)的自协方差函数亦称为协方差函数,一般地,协方差函数依赖于空间点x和向量h。当h=0时,协方差函数变为,3. 变异函数 (x,h)=1/2*VarZ(x)Z(x+h)2 =1/2*EZ(x)Z(x+h)21/2*EZ(x)EZ(x+h)2 (6.4),变异函数在一维条件下,当空间点x在一维x轴上变化时,区域变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差一半定义为区域变量Z(x)在x轴上的变异函数,记为(x,h),即,在二阶平稳假设条件下对任意h有 EZ(x+h)=EZ(x) 因此,式(6.4)可改写为 (x,h)=1/2*EZ(x)Z(x+h)2 (6.5) 从式(6.5)可知,变异函数依赖于x和h,当变异函数仅依赖于h,与x无关时,变异函数(x,h)可改写成(h),即 (h)=1/2*EZ(x)Z(X+h)2 (6.6),4. 平稳性假设及内蕴假设 (1)平稳性假设,设某一随机函数Z(x),其空间分布律不因平移而改变,即若对任一向量h,关系式 G(z1,z2,x1,x2,)=G(z1,z2,x1+h,x2+h,) 成立时,则该随机函数为平稳性随机函数。,确切的说,无论位移向量h多大,两个k维向量的随机变量Z(x1),Z(x2),Z(xk)和Z(x1+h),Z(x2+h),Z(xk+h)有相同的分布律。,当区域化变量满足下列两个条件时,称该区域化变量满足二阶平稳:, 在整个研究区内,区域化变量Z(x)的数学期望对任意x存在且等于常数,即EZ(x)=m(常数),任意x。, 在整个研究区内,区域化变量的空间协方差函数对任意x和h存在且平稳,即 CovZ(x),Z(x+h)=EZ(x)Z(x+h)-m2=C(h),任意x,h,(2)内蕴假设 一些自然现象和随机函数具有无限离散性,这时区域化变量Z(x)的增量Z(x)-Z(x+h)满足下列两个条件时,就称该区域化变量满足内蕴假设:,在整个研究区内随机函数Z(x)的增量的数学期望为0,即 EZ(x)-Z(x+h)=0, 任意x,h,对于所有矢量的增量的方差函数存在且平稳 VarZ(x)-Z(x+h)=EZ(x)-Z(x+h)2 =2(x,h)=2(h),任意X,h 即要求Z(x)的半变异函数存在且平稳。,内蕴假设可以理解为:,随机函数Z(x)的增量Z(x)-Z(x+h)只依赖于分隔它们的向量h,而不依赖于具体位置x,这样,被向量h分割的每一对数据Z(x),Z(x+h)可以看成是一对随机变量Z(x1),Z(x2)的一个不同现实,而半变异函数(h)的估计量*(h)为 (h)=1/2N(h)*Z(xi)-Z(xi+h)2 式中,N(h)是被向量h相分隔的试验数据对的数目。,准平稳假设,如果随机函数只在有限大小的邻域内是平稳的,则称该随机函数服从准平稳假设。,准平稳(或准内蕴)假设是一种折中方案,它既考虑到某现象相似性的尺度,也顾及到有效数据的多少。,6.2.1 空间自相关理论,空间自相关性,在空间统计分析中,相关分析可以检测两种现象的变化是否存在相关性,若所分析的统计量为不同观察对象的同一属性变量,则称之为自相关。,通过检测一个位置上的变异是否依赖于邻近位置的变异来判断该变异是否存在空间自相关性,根据变异的性质可以将变异分为三种类型:绝对型变异,等级型变异和连续型变异,空间自相关 各向同/异性,空间自相关是针对同一个属性变量而言的,当某一测样点属性值高,而其相邻点同一属性值也高时,为空间正相关;反之,为空间负相关。,当空间自相关仅与两点间距离有关时,称为各向同性;否则为各向异性。,6.2.2 空间自相关分析方法,空间自相关方法按功能大致分为两类: 全域型自相关、区域型自相关,最为常用的计算空间自相关方法是:Morans I、Gearys C、Getis、Join count以及空间自相关系数图等,1. Morans I法,若在区域内有n个空间单元,每个空间单元皆有一个观察值X,空间单元i与空间单元j的空间关系构成Wij的空间相邻矩阵,以1表示i和j相邻,以0表示i和j不相邻。,其简单定义为 Wijnn 其中,Wij为表示区位相邻矩阵,Wij=1表示区位相邻,Wij=0则表示区位不相邻。,Moran Index值是应用较广泛的一种空间自相关性判定指标,其计算式为 式中, , 。Wij表示区位相邻矩阵;Cij表示属性相似矩阵;Xi和Xj分别为i和j空间单元属性数据值,Wij=1代表空间单元相邻,Wij=0代表不相邻,ij,Wii=0。,(6.16),若母体为随机分配,常采用统计验证的方式进一步判定Moran Index的期望值和变异数。I的期望值为 其变异数为 其中, ; ; ;,(6.17),;Wi和Wi为相关权重矩阵i及j行的总和。,I值结果一定介于-1到1之间; I0为正相关,数值越大表示空间分布的相关性越大,即空间上聚集分布的现象越明显; I0为负相关,数值越小代表示相关性小; I趋于0时,代表空间分布呈现随机分布的情形。,根据各空间间隔自相关值的计算,Morans I公式可改写为 其中,d代表空间间隔;Wij代表区位相邻矩阵。d=1代表空间单元是相邻的;d=2定义为与间隔一个的空间单元相接邻,而与原来的空间单元不相邻。,(6.19),区域空间自相关的定义为 其中,Ii为Local Moran Index,Wij为区位相邻矩阵。,(6.20),2. Gearys Contiguity Ratio C法 与Morans I类似,其表达式为,(6.21),C = 1,表示不相关;0 1表示负相关。,3. Getis统计法 Anselin曾归纳各种空间聚集的研究方法,该方法经常表达为 其中,Wij代表i与j的空间关系,即类似上述空间相邻权重矩阵Wij;而yij则是i与j的观察式。,(6.22),全域型Getis 其中,wij(d)为距离d内的空间相邻权重矩阵。 若i与j相邻,wij(d)=1;若i与j不相邻,wij(d)=0。 区域型Getis 可量测每一个i在距离d的范围内,与每个j的相关程度。,(6.23),(6.24),4. 空间自相关系数图分析法(以某地区为例),图6.2 某地区某种空间自相关系数图,(1)图中有两处隆起处,代表微视尺度及宏观尺度上,存在显著的聚集分布现象,但聚集现象不存在于中观尺度上。,(2)空间间隔为2时,空间自相关值有波峰,即在空间间隔为2时,其空间分布有最大的自相关性。,空间局部估计 常见的克立格插值模型有: 插值一般分为两步:,空间局部估计也称空间局部插值,它是利用在地表不同位置采集的样点生成一个连续表面。,普通克立格、简单克立格、泛克立格、概率克立格、指示克立格、析取克立格及协同克立格等,(1)样点空间结构量化分析; (2)对未知点进行预测,6.3.1 半变异函数分析,1. 半变异函数及其性质 半变异函数是一个关于数据点的半变异值与数据点间距离的函数,设区域化变量Z(xi)和Z(xi+h)分别是Z(x)在空间位置xi和xi+h上的观测值(i=1,2,N(h),则半变异函数可由下式进行估计 其中,N(h)是分隔距离为h的样本量。,(6.25),主要的理论半变异函数模型有: 常见的分析半变异模型包括:,球状模型、指数模型、高斯模型、幂函数模型和抛物线模型等,有基台值模型、无基台值模型、孔穴效应模型,2. 影响半变异函数的主要因素 (1)样点间的距离和支撑的大小,为了使建立的半变异函数模型能准确地反映各种尺度上的变化特征,要确定采样的最小尺度。,在采样之前,首先需要在满足精度的前提下确定最佳的采样尺度。用块段取样时,要考虑支撑的大小,一般采用正则化变量消除其影响。,(2)样本数量的大小 (3)异常值的影响,样本数量在对地统计学中主要指计算实际半变异函数值时的点对数目,实际取样工作中点对数目不能无限,一般要求在变程a以内各距离上的点对数目不应小于20对。在小尺度距离上相对要多一些,大尺度距离相对少一些。,如果异常值比较多,块金值C0要增大,随机成分的影响加强,而空间自相关的影响消弱。对于半变异函数的模型来讲,块金效应值C0越小越好。,(4)比例效应的影响,如果平均值和标准差之间存在明显的线性关系,则比例效应存在,反之亦然。,当样品方差随着平均值的增加而增加时,称正比例效应,反之亦然。,比例效应的存在会使实际半变异函数值产生畸变,消除比例效应的方法主要是通过对原始数据取对数,或者通过相对半变异函数的求解。,(5)漂移的影响,当漂移存在时,半变异函数值不再是半变异函数的无偏估计。要消除漂移对半变异函数的影响,主要通过建立合适的漂移形式,即
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号