资源预览内容
第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
第9页 / 共9页
亲,该文档总共9页全部预览完了,如果喜欢就下载吧!
资源描述
国外空间数据库技术现状、存在问题与发展趋 势学号:逸 摘要:随着计算机技术日益成熟,以及“数字城市”理念逐步深入人心,空间数 据库技术在20 世纪 60 年代后迅速发展。本文论述了国外空间数据库技术的发展 现状,罗列了一些尚存问题,展望了空间数据库的发展方向,希望能对笔者的空 间数据库课程的学习打下认知基石。关键词:空间数据库技术一、国外空间数据库现状1.1空间数据库管理模式发展历程管理模式经历了纯文件模式、文件结合关系型数据库的管理模式、全关系型数据库管理 模式和面向对象的数据库管理模式四个阶段。1.2 当下空间数据库主流类型1.2.1 混合模型数据库所谓混合模型数据库其基本思想是将地理空间信息按照专题特性进行分层,每个图层由 一类相同或相似的空间实体构成,如在一个城市中,道路、旅游景点、大专院校等不同特性的 空间实体构成不同专题的图层,然后对这些图层进行分层存储和处理。对于图层中的每个空 间实体,其属性数据被分为两部分: 空间属性和非空间属性,空间属性存储在文件系统中,非空 间属性则存储在关系数据库中,两者通过一个全局唯一的标识符进行关联。其示意图如下图 所示。图11.2.2 对象-关系型数据库近年来,结合关系数据库和面向对象思想的对象关系数据模型渐渐成为 GIS 应用中构 建数据库系统的主流技术。由于这种技术更为逼真地模拟了现实世界中空间实体的结构和相 互关系,并且采用单一系统进行存储, 因而消除了传统混合模型的缺点 , 更有利于对空间数 据进行管理和维护。该类型数据库有如下优点: 采用对象-关系数据模型的商业化数据库产品技术上已经比较成熟 ,这就使得采用对 象-关系模型构造的数据模型可以直接在一个对象-关系数据库中进行存储、管理,并且由于 采用了符合行业标准的开放式数据接口,使得数据的共享更加方便有效; 由于采用了单独的数据库进行数据管理 , 使得对空间数据进行操作更加简单和方便, 效率也大大提高; 通过采用开放式的SQL平台以及大量空间操作函数的使用,能够开发岀功能更加强大 的应用系统,扩展了 GIS 应用的围1。1.2 空间数据库技术现状 近些年,空间数据库技术在索引、数据更新、多源数据获取方面获得了一些进展,以下 举岀例子。1.2.1 空间数据库索引技术2(1)空间数据库索引技术的定义 数据索引是指在磁盘上组织数据记录的一种数据结构,是对存储在存储介质上的数据位置信息的描述。它用于优化某类数据检索的操作,是提高系统对数据获取效率的一种重要手 段。(2)空间数据库索引技术分类2 简单格网空间索引 格网空间索引的原理简单,即把目标空间实体集合所在的空间围划分成一系列大小相同的格。基于格网索引的查找思路也较简单,在数据分布较均匀的情况下,查询效率较高。但 格网的大小直接影响了索引表的大小,格网太小,索引表会急剧膨胀,维护索引表本身的花 费增加,查询效率随之下降;反之,落在一个格的空间实体可能会过多;因此格的大小严重 制约着查询效率的提高。 K-D树空间索引K-D 树是早期用于索引多维空间数据的数据结构之一。 K- D 树的每层都把空间划分为 两个部分,沿着树的根结点进行一维划分;依次划分下一层结点,尽量保证左右子树中的结 点数目均衡,当结点中包含的点数少于叶子结点中包含的最大点数时停止划分。为了平衡 K-D树的深度,可结合B树来得到K-D-B树索引结构,但此类索引树对于占据一定空间围 的空间实体而言(如线和多边形),构造空间索引仍然不方便。因为当使用数据库表构造K-D 树的索引表时,树型结构的递归层次深,导致查询效率降低。 R树空间索引R 树是 B 树在多维空间上的自然扩展,是由 Guttman 提岀的最早支持多维空间存取的方 法之一R树是一种高度平衡树,可控制树的深度,采用对象的最小外包矩形(MBR,来近 似表示空间实体。R树有如下几条特性:1)叶结点中存储该结点对应的空间要素的MBR和 空间要素标识;(2)MBR二维上是矩形,三维上是长方体,以此类推到高维空间;(3)非叶结 点存放其子女结点集合的整体外包络矩形和指向其子女结点的指针。 R 树是一种动态索引 结构,其查询、插入、删除可同时进行,而且不需要定期的对树结构重新组织。 R 树适合 于多维空间查询,不过由于空间数据分布的偶然性,使得各层节点 MBR 容易重叠,导致实 际执行空间查询时,会产生多个查询分支,很大程度上降低了空间查询的效率。在最坏的情 形下,一个空间查询会退化成线性搜索。若使用外部数据库来描述 R 树,在缺乏特定的快 速物理数据块访问接口情况下,效率也会大打折扣。 四叉树空间索引在基于固定网格划分的四叉树空间索引机制中,工作空间在 X、Y 方向上进行 2N 等 分,形成2Nx2N的网格,并以此建立N级四叉树。在四叉树中,空间要素标识记录在其 外包络矩形所覆盖的每一个叶结点中。但当同一父亲的四个兄弟结点都要记录该空间要素标 识时,则只将该空间要素标识记录在该父亲结点上,并按这一规则向上层推进。层次型的树 状结构并不适合使用数据库表来直接描述,可通过对四叉树的各层节点进行编码,来反映四 叉树的层次结构。四叉树索引在存中的层次型树状结构,其查询效率较高。(3)空间数据库索引技术的应用3 Oracle Spatial的空间数据索引可以通过用户定义的功能和索引方式,对用户定义的数 据类型进行存储、恢复和操作,弥补了以往关系数据库管理的不足; IBM空间数据刀片(Spatial DataBlade): IBM DB2 Spatial Extender提供基于网格的三层 空间索引,该索引技术是基于传统的分层B树索引形成的; MySQL空间数据扩展:MySQL Spatial Extensions用自己的Geometry数据类型存储空间 数据,符合和遵循OpenGIS中的Geometry模型; ERSI空间数据引擎:这是一种处于应用程序和数据库管理系统之间的中间件技术, 在用户和异构空间数据库之间提供了一个开放接口。1.2.2 数据更新技术4(1)国外空间数据库更新技术发展动态 国外美国地质调查局测绘部从 2001年开始计划建立近实时数据更新机制,将数据的现势性 保持在几天或数月之。英国军械测量局根据其实际情况,建立了推扫式和散点式相结合的更 新机制。日本采用基于栅格的更新方法,先更新1:2. 5万地形图,再用1:2. 5万图更新1 : 5 万图,城市地区每3 年更新一次,郊区每5 年更新一次,山区每10年更新一次。加拿大 测绘署地形信息中心2001年启动了一项利用Landsat - 7影像更新1 : 5万地形数据的计 划,每年使用Landsat-7影像更新1 000幅以上地形数据。 国我国一些经济发展较快的省、市在建立更新机制、利用遥感影像获取变化信息、历史数 据存取、增量更新、多尺度级联更新等方面进行了许多有益的尝试,并取得一定成效。省测 绘局在2006年 2007年已完成1:10 000地形图快速更新试验,并已开始规模性试生产。 市、市、市从2007年开始1:500城市空间数据库增量更新试验,目前已逐步形成了各自地 方特色的更新模式。2008年清华山维公司推岀了基于时态的动态更新软件EPSW 2008,市、 市、市、等城市正在使用中。由于现实世界空间实体及其相互关系随时间不断发生变化,使地理空间数据库的持续更 新既是一项长期艰巨任务,又是一个复杂的系统工程。本文以下仅对空间数据库数据更新的 相关技术进行探讨,而对与更新有关的政策层面问题不予论述。(2)空间数据库更新关键技术与方法5 区域整体更新区域整体更新按规模可分为两种:a.大规模区域整体更新。三到五年一个周期,进行大 面积的修测和补测。更新区域通常是行政区单元(权属单位)。区域整体更新成本较高,更 新投入由地方财政安排,一般用在区域空间要素变更很大、数据现势性很差的情况下; b. 小围区域整体更新。利用竣工测量或其他方法对区域发生变化的某组织单元(图幅或网格) 进行的更新,这种方法适用于区域空间要素变更较小的情况。 增量更新 地理空间数据更新的实质是空间实体状态改变的过程,即实现由现实世界中的现状实体转变为数据库中的现状实体,及由数据库现状实体转变为数据库历史实体两个状态的转变。 因此地理空间数据更新不是简单删除替换。而增量更新采用面向对象数据模型存储空间要 素,空间实体相互独立而完整(实体之间拓扑关系是隐含存在的,一般在分析时临时建立), 原则上对单个实体增加、删除、修改不影响其他要素实体,因此,历史数据只需要保留发生 变化的要素(即增量信息)。“增量更新”是今后的发展方向。但技术上比较复杂,存在一定 的技术风险。1.2.3异构、多源空间数据库的互操作技术6(1)名词解释 异构是指不同历史时期、不同格式、不同存在形式的空间数据,如矢量数据和栅格数 据; 多源是指来源不同,如同为栅格形式,遥感影像与DE M数据来源不同。 互操作:异构多源空间数据的共享和GIS应用系统的无缝集成。(2)异构、多源空间数据库的互操作技术分析 目前,空间信息领域常用的空间数据格式已超过1 00种,而综合信息系统应用中的各部 门由于需求差异和历史等原因,往往会采用不同厂商的不同格式数据,部门之间的通信(互 联互访)成为一个棘手的问题。面对诸多不同格式的数据,如何使已有的数据得到更充分的 利用,成为当前GIS发展中亟待解决的问题。异构、多源空间数据共享与互操作技术方案, 主要有数据格式转换模式、直接数据访问模式、关系数据库空间扩展模式,以及Web Service 的数据集成技术。这些方法在一定程度上解决了空间数据共享与互操作的问题,但也存在一 定的局限性。数据格式转换模式可以美国国家空间数据协会(NSDI )制定的统一空间数据格 式规SDTS ( Spatial Data Transformation Standard )来实现,在一定程度上提供了不同数据格 式之间统一空间对象描述方案,但难以为数据的集中和分布式处理提供解决方案,也难以实 现自动同步更新。直接数据访问模式可以在一个GIS系统中直接访问不同格式的空间数据, 避免了繁琐的数据转换步骤,也避免了数据存储两份而导致的数据不一致的问题。但这种模 式依赖于GIS平台对不同格式空间数据的解析与支持能力,同时,由于一些数据格式没有公 开格式文档,格式升级变化难以保障。关系数据库空间扩展模式以包含空间位置的矢量栅格 数据查询检索定义和结构化查询语言SQL的拓展规SQL Multimedia (SQL/MM),提供了面向 空间数据及多媒体数据的查询描述,支持数据库后端定义的空间函数算子调用,以及在查询 操作中实现空间分析功能。这种模式为不同GIS软件的互访与互操作提供了统一的数据存储 与访问机制,但由于其是以面向对象的思路在关系数据库中实现,在性能上有比较大的损失 基于 WebService 的数据共享与互操作模式,以美国开放地理信息系统协会 (Open GIS Consortium, OGC)制定的数据共享规,用统一协议的方式使数据客户能够读取任意数据服务 器提供的空间数据。目前,统一协议对空间数据的支持尚不全面,还存在大量非标准空间数 据难以用统一协议高效表达。鉴于此, GIS 软件厂商提出了多源空间数据无缝集成框架 (Seamless Integration of Multi-source Spatial Data, SIMS)和虚拟空间数据引擎、通用空间数据引 擎(Universal Spatial Data Engine, USDE )、异构空间数据库集成技术(Open Grid ServicesArchitecture-data Access and Integra
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号