资源预览内容
第1页 / 共37页
第2页 / 共37页
第3页 / 共37页
第4页 / 共37页
第5页 / 共37页
第6页 / 共37页
第7页 / 共37页
第8页 / 共37页
第9页 / 共37页
第10页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第3章 空间数据的 采集与质量控制,主要内容,3.1 概述 3.2 地理参照系和控制基础 3.3 空间数据的分类和编码 3.4 空间数据的采集 3.5 GIS的数据质量,3.1 概述,现实世界,3.1 概述,一、数据源 地图数据 ,遥感数据, 文本数据,统计数据 实测数据,多媒体数据,已有系统的数据 二、数据采集 将现有的上述类型数据转换成GIS可以处理与接收的数字形式,通常要经过验证、修改、编辑等处理。 三、数据质量控制 GIS的数据质量是指GIS中空间数据(几何数据和属性数据)的可靠性,通常用空间数据的误差来度量。 误差是指数据与真值的偏离。 研究GIS数据质量对于评定GIS的算法、减少GIS设计与开发的盲目性都具有重要意义。精度越高,代价越大。GIS数据质量对保证GIS产品的可靠性有重要意义。,3.2 地理参照系和控制基础,一、地理空间的数学建构 最自然的面 包括海洋底部、高山、高原在内的固体地球表面,起伏不定,难以用一个简洁的数学式描述。 相对抽象的面,即大地水准面 假设一个当海水处于完全静止的平衡状态时从海平面延伸到所有大陆下部,而与地球重力方向处处正交的一个连续、闭合的水准面。 可用水准仪完成地球自然表面上任一点的高程测量。但地球的重力方向处处不同,处处与重力方向垂直的大地水准面显然不可能是一个十分规则的表面,且不能用简单的数学公式来表达,因此,大地水准面不能作为测量成果的计算面。 椭球体模型 为了测量成果计算的需要,选用一个同大地体相近的、可以用数学方法来表达的旋转椭球来代替地球-三轴椭球体。,3.2 地理参照系和控制基础,二、地理参照系 经纬度坐标系(地理坐标) 对空间定位有利,但难以进行距离、方向、面积量算。 笛卡儿平面坐标系 便于量算和进一步的空间数据处理和分析。 高程系统 描述空间点在垂直高度上的特性-高程由高程基准面起算的地面点的高度。 1956年黄海高程系,1985年国家高程基准,地图投影,椭球体模型,3.2 地理参照系和控制基础,三、GIS的地理基础-控制基础 各种GIS的数据源、服务目的和各自特征可以不同,但均有自身统一的地理基础。,3.2 地理参照系和控制基础,四、GIS与地图投影的关系,3.2 地理参照系和控制基础,五、GIS中地图投影设计与配置的一般原则 所配置的投影系统应与相应比例尺的国家基本图(基本比例尺地形图,基本省区图或国家大地图集)投影系统一致。 系统一般只考虑至多采用两种投影系统,一种应用于大比例尺的数据处理与输出、输入,另一种服务于小比例尺。 所用投影以等角投影为宜。 所用投影应能与网格坐标系统相适应,即所采用的网格系统(特别是一级网格)在投影带中应保持完整。,3.2 地理参照系和控制基础,六、我国GIS常用的地图投影配置 我国基本比例尺地形图(1:100万、1:50万、1:25万、1:10万、1:5万、1:2.5、1:1万、1:5000),除1:100万外均采用高斯克吕格投影为地理基础; 我国1:100万地形图采用了Lambert投影,其分幅原则与国际地理学会规定的全球统一使用的国际百万分之一地图投影保持一致。 我国大部分省区图以及大多数这一比例尺的地图也多采用Lambert投影和属于同一投影系统的Albers投影(正轴等面积割圆锥投影); Lambert投影中,地球表面上两点间的最短距离(即大圆航线)表现为近于直线,这有利于地理信息系统中空间分析量度的正确实施。,3.3 空间数据的分类和编码,一、空间数据的组织,分层,区域分块,空间数据库,GIS应用,大范围 地理区域,合理组织,面向对象组织,矩形分块,经纬度分块,3.3 空间数据的分类和编码,二、地理数据的分层 空间数据可按某种属性特征形成一个数据层,通常称为图层(Coverage)。 1、空间数据分层方法: 专题分层 每个图层对应一个专题,包含某一种或某一类数据。如地貌层、水系层、道路层、居民地层等。 时间序列分层 即把不同时间或不同时期的数据作为一个数据层。 地面垂直高度分层 把不同时间或不同时期的数据作为一个数据层。,时间序列,专题分层,3.3 空间数据的分类和编码,三、空间数据的分类与编码,分类、编码,点、线、面 特征码、坐标,信息世界,三、空间数据的分类与编码,1.属性数据编码 在属性数据中,有一部分是与几何数据的表示密切有关的。例如,道路的等级、类型等,决定着道路符号的形状、色彩、尺寸等。在GIS中,通常把这部分属性数据用编码的形式表示,并与几何数据一起管理起来。 编码 是指确定属性数据的代码的方法和过程。 代码 是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。 编码的直接产物就是代码,而分类分级则是编码的基础。,三、空间数据的分类与编码,2.分类编码 分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。 分类是人类思维所固有的一种活动,是认识事物的一种方法。 分类的基本原则: 科学性、系统性、可扩性、实用性、兼容性、稳定性、不受比例尺限制、灵活性,三、空间数据的分类与编码,3、分类码和标识码,分类码示例,标识码示例,一、输入前准备 1、 资料准备,区域标定 基础原始数据的确定 数据分类项目的确定 数据标准的准确性的确定 2、进行三个统一:即确定投影、比例尺、分类分级编码 3、所用软件的检查、试用菜单准备及其它辅助工作。 4、硬件检查。 5、精度试验。 6、试验,样区、单项试验。,3.4 空间数据的采集,3.4 空间数据的采集,二、几何图形数据的采集 手工数字化 数字化仪数字化 扫描数字化 解析测图法 已有数据转入,扫描转换,拼接子图块,裁剪地图,屏幕跟踪矢量化,矢量图合成、接边,矢量图编辑,纸质地图,空间 数据库,扫描数字化流程,屏幕跟踪矢量化流程,选择投影和单位 输入控制点 编辑控制点,三、属性数据采集,1、键盘,人机对话方式 2、程序批量输入。,001,002,程序,空间 数据库,四、属性和几何数据的连接,1、可手工输入 2、由系统自动生成(如用顺序号代表标识符),标识码,属性数据,几何数据,3.4 空间数据的采集,五、空间数据的编辑和检核 1、空间数据输入的误差 1)几何数据的不完整或重复。2)几何数据的位置不正确。3)比例尺不正确。4)变形。5)几何数据与属性数据的连接有误。6)属性数据错误、不完整。键盘输入错误,漏输数据或属性错误分类、编码等。 2. 空间数据的检查 1)通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误; 2)在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误; 3)把数字化的结果绘图输出在透明材料上,然后与原图叠加以发现错漏; 4)对等高线,通过确定最低和最高等高线的高程及等高距,编制软件来检查高程的赋值是否正确; 5)对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多边形与多边形内点的匹配来检查等; 6)对于属性数据,通常是在屏幕上逐表、逐行检查,也可打印出来检查; 7)对于属性数据还可编写检核程序,如有无字符代替了数字,数字是否超出了范围,等等8)对于图纸变形引起的误差,应使用几何纠正来进行处理。,3.4 空间数据的采集,1、GIS数据质量 1)位置(几何)精度:如数学基础、平面精度、高程精度等,用以描述几何数据的误差。 2) 属性精度:如要素分类的正确性、属性编码的正确性、注记的正确性等,用以反映属性数据的质量。 3) 逻辑一致性:如多边形的闭合精度、结点匹配精度、拓扑关系的正确性等,由几何或属性误差也会引起逻辑误差。 4) 完备性:如数据分类的完备性、实体类型的完备性、属性数据的完备性、注记的完整性,数据层完整性,检验完整性等。 5) 现势性:如数据的采集时间、数据的更新时间等。,一、GIS的数据质量的内容,3.5 GIS的数据质量,逻辑误差,资料来源于张超主编的地理信息系统实习教程所配光盘,2、误差产生的主要原因,具体分析,原因,一、GIS的数据质量的内容,3、误差的具体来源,一、GIS的数据质量的内容,4、误差传播,误差传播可分为三类: 1)代数(算术)关系 如差、倍数、线性关系,有一套成熟的经典测量误差理论处理。 2)逻辑关系 a、布尔逻辑关系:GIS中存在大量的逻辑运算,如 叠置分析。 b、不精确推理关系: 如专家系统中的不精确推理。 逻辑关系下的误差传播正处于研究中,需要借用信息论,模糊数学、人工智能、专家系统等学科有望解决。,一、GIS的数据质量的内容,二、 GIS数据质量的评价方法,1、直接评价法 1)用计算机程序自动检测 某些类型的错误可以用计算机软件自动发现,数据中不符合要求的数据项的百分率或平均质量等级也可由计算机软件算出。此外,还可检测文件格式是否符合规范、编码是否正确、数据是否超出范围等。 2)随机抽样检测 2、间接评价法-(地理相关法和元数据法) 指通过外部知识或信息进行推理来确定空间数据的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生产的方法、误差传递模型等。 3、非定量描述法 通过对数据质量的各组成部分的评价结果进行的综合分析来确定数据的总体质量的方法。,三、数字化的误差评价和质量控制,1)自动回归法 由于跟踪数字化不仅是一个随机序列,而且是一个时间序列,因此可用数理统计中的时间序列分析法来确定数字化的误差。 2)Band法 该方法适用于任何类型的GIS数据,关键是如何给出合理的值。,1、评价数字化误差的方法,3)对比法 把数字化后的数据,用绘图机绘出,与原图叠合,选择明显地物点进行量测,以确定误差。除了几何精度外,属性精度、完整性、逻辑一致性等也可用对比法进行对照检查。,Band,2、数字化过程中的质量控制,1)数字化预处理工作: 包括对原始地图、表格等的整理、清绘。 2)数字化设备的选用:根据手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数的进行挑选,这些参数不应低于设计的数据精度要求。 3)数字化对点精度(准确性):数字化时数据采集点与原始点的重合程度,一般要求对点误差小于0.1mm。 4)数字化限差:包括:采点密度(0.2mm)、接边误差(0.02mm)、接合距离(0.02mm)、悬挂距离(0.007mm)等。 5)数据的精度检查:输出图与原始图之间的点位误差,一般要求对直线地物和独立地物,误差小于0.2mm,对曲线地物和水系,误差小于0.3mm,对边界模糊的要素应小于0.5mm。,三、数字化的误差评价和质量控制,四、数据处理中数据质量的评价,主要受原始资料的精度(采样密度、测量误差、地形类别、控制点等)和内插的精度(内插方法、地形类型、原始数据的密度等)的影响。 DEM的内插精度主要受原始采样点的采样密度的影响,与不同的插值方法的关系不很大。但在DEM精度评定的标准方面、地貌逼真度方面、DEM的粗差探测等方面仍没有得到圆满的解决。 目前,对DEM精度的评价常采用原始等高线与再生等高线叠合评价的方法。,1、数字高程模型(DEM)的精度,原始等高线,DEM,重新生成等高线,原始等高线与 重新生成等高线叠加,内插,自动追踪,2、矢量数据栅格化的误差,属性误差:在矢量数据转换为栅格数据后,栅格数据中的每个象元只含有一个属性数据值,它是象元内多种属性的一种概括。象元越大,属性误差越大。 几何误差:是指在矢量数据转换成栅格数据后所引起的位置的误差,以及由位置误差引起的长度、面积、拓扑匹配等的误差。几何误差的大小与象元的大小成正比。 误差分析的一种方法:假设存在一幅理想的矢量地图,图上不同属性的制图单元由很细的线分开;对理想地图进行观测采样得到一幅具有规则格网的栅格地图,把这两幅图进行叠置比较。,A,B,C,行政区划,B,A,四、数据处理中数据质量的评价,3、
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号