赵 永 河南大学环境与规划学院 Off:room 507# Tel:0378-2868833-2096 Email:zhaoyhenu.edu.cn 2009年9月,空间统计与建模,搜索引擎:http:/www.google.cn/trends 搜索日期:2009-8-27,课程提纲,第一讲:概论(2节) 第二讲:探索性空间数据分析(ESDA)(4节) 第三讲:空间点模式分析(4节) 第四讲:网络分析(2节) 第五讲:空间格数据分析(2节) 第六讲:空间插值/地统计(2节) 第七讲:空间回归(4节) 第八讲:扫描统计量(2节) 第九章:多水平模型(2节) 第十讲:空间建模(4节),Some history,Regression (Galton, Bartlett) Mining engineers (Krige 1951, Matheron, 60s) Spatial models (Whittle, 1954) Forestry (Matrn, 1960) Objective analysis (Grandin, 1961) More recent work Cressie (1993), Stein (1999),参考教材,参考教材,JohnWiley & Sons, Inc. 2003,Longman Group Limited 1995,第一讲 概论,一、什么是空间统计 二、空间统计 VS. 经典统计 三、为什么要用空间统计 四、空间/属性数据的类型 五、空间统计分析方法与框架 六、空间统计陷阱 七、模型分类 八、空间统计工具,一、什么是空间统计 (what),Are they randomly distributed?,Identifying “Hot Spots”,空间数据 spatial data,Spatial Data: Such data can be the structure of biological cells, the distribution of plants and animals in a geographic region, the occurrence of diseases in a county or state, economic data in different administrative districts, climate data such as temperature or precipitation over geographic regions, and the distribution of galaxies in space. Spatial data often are not independent. Temperature and precipitation measurements at two locations that are 10 km apart will be more similar than such measurements at two locations that are 1000 km or even 100 km apart. Infectious diseases often occur in spatial clusters. One region of a country may encounter hundreds of cases while another region may encounter only very few cases. If there is an additional temporal component, we speak of spatio-temporal data.,zek, P., W. Hrdle, and J. Symanzik, Spatial Statistics, in Statistical Methods for Biostatistics and Related Fields. 2007, Springer. p.285-304.,Liu and Brown(1999),时空数据(spatio-temporal data):示例,空间数据(spatial data): Throughout this class, we will be dealing with a two-dimensional area of interest, and not the spatio-temporal data, but only the spatial data.,“Statistics, the science of uncertainty, attempts to model order in disorder.” Cressie (1991,p.1),统计 Statistics,Spatial Statistics = Spatial Data + Statistics Definition: A distinction may be made between spatial statistics and statistics in general. The most obvious difference is that spatial statistics are used to analyze data which have a spatial location. Spatial statistics give explicit consideration to spatial properties such as location, spatial patterns, spatial arrangement, distance, etc. This spatial dimension tends to make spatial statistics more complex than ordinary non-spatial statistics.,空间统计 Spatial Statistics,They are exploratory tools that help you measure spatial processes, spatial distributions, and spatial relationships. There are a lot of different types of spatial statistics, but they are all designed to examine spatial patterns and processes.,空间模式(spatial pattern)是一个静态概念,它所显示的仅仅是地理对象在给定时间的分布情况。 空间过程(spatial process)是一个动态概念,它所描述和说明的是地理对象的分布情况是如何形成的,以及如何随时间推移而变化的。,通过对空间模式(spatial pattern)的识别和描述,进而力图对引起观测模式的空间过程(spatial process)予以理解和建模。-地理空间分析-原理、技术与工具p.47 De Smith et al.著,杜培军等译.,空间分析( Spatial Analysis) 空间分析是基于地理对象的位置和形态特征的空间数据分析技术,其目的在于提取和传输空间信息。 郭仁忠 The process of examining the locations, attributes, and relationships of features in spatial data through overlay and other analytical techniques in order to address a question or gain useful knowledge. Spatial analysis extracts or creates new information from spatial data. ESRI, “GIS字典”,空间数据分析与传统统计分析主要有两大差异: (1)空间数据间并非独立,而是在维空间中具有某种空间相关性,且在不同的空间分辨率下呈现不同之相关程度; (2)地球只有一个,大多数空间问题仅有一组(空间分布不规则的)观测值,而无重复观测数据。因此,空间现象的了解与描述是极为复杂的,而传统方法,尤其是建立在独立样本上的统计方法,不适合分析空间数据。,二、空间统计 VS. 经典统计,二、空间统计 VS. 经典统计,经典统计:独立性、随机性假设空间统计:自相关、依赖性、异质性,地理学第一定律(FLG): everything is related to everything else, but near things are more related than distant things (Tobler,1970).,空间统计的基本思想:,Waldo Tobler(born in 1930) receiving a plaque for his contributions to geography. On the event of his November 2000 birthday.,http:/en.wikipedia.org/wiki/Waldo_R._Tobler,Tobler, W. R. (1970). “A computer movie simulating urban growth in the Detroit region“. Economic Geography, 46(2): 234-240.,FLG的一般性: 自然地理、人文地理、社会经济,空间自相关是普遍存在的,否则地理分析便没有多大意义。 经典统计:独立空间自相关的存在,使得经典统计学所要求的样本独立性假设不满足。 如果地理学从根本上值得研究,必然是因为地理现象在空间上的变化不是随机的。 经典统计:随机,三、为什么要用空间统计 (Why ),一句话:尽可能地利用已知信息。,可以借助空间统计更好地理解地理现象。 或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么样”,更想知道“哪里怎么样” 空间统计学可以帮助我们准确地判断具体地理模式的原因。 John Snow的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可能是病源。 空间统计学可以帮助我们处理大的复杂数据集, 这是GIS经常面对的事情。,三、为什么要用空间统计,四、空间/属性数据的类型,空间数据的类型点数据(Point Data) 线数据(Line Data Network) 面数据(Areal Data) 地统计数据(Geostatistical Data),来源:http:/ua.t.u-tokyo.ac.jp/okabelab/freesat/ FreeSAT:Free Spatial Analysis Tools,2. 属性数据的类型,属性(Attribute):与空间数据库中一个独立对象(记录)关联的数据项。属性已成为描述一个位置任何可记录特征或性质的术语。 名义(Nominal)量 次序(Ordinal)量 间隔(Interval)量 比率(Ratio)量,Stevens S. S. On the Theory of Scales of MeasurementJ. Science, 1946, 103(2684): 677-680.,名义(Nominal)量 定性数据。如,一个城市的名字。 知道其名称,但不知道各名义量之间的次序。 次序(Ordinal)量 定性数据,且有等级顺序。如,事故发生危险程度的级别由大到小被标为1,2,3, 知道其次序,但不知道各次序量之间的差别 。 间隔(Interval)量 按间隔表示的定量数据,没有真零值。 如,温度。 除了具有次序量的特点外,间隔量相互之间还可以比较大小,并且它们之间的差值大小是有意义的。 比率(Ratio)量 除了具有间隔量的特点外,其初始零值有意义。如,身高 定量数据,且有真零值。,
