第三节 空间数据质量
五、空间数据质量控制
数据质量控制是个复杂的过程,要控制数据质量应从数据质量产生和扩散的所有过程和环节入手,分别用一定的方法减少误差。空间数据质量控制常见的方法有:
(1)传统的手工方法 质量控制的人工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其它比较方法。
(2)元数据方法 数据集的元数据中包涵了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪无数据可以了解数据质量的状况和变化。
(3)地理相关法 用空间数据的地理特征要素自身的相关性来分析数据的质量。例如,从地表自然特征的空间分布着手分析,山区河流应位于微地形的最低点,因此,叠加河流和等高线两层数据时,若河流的位置不在等高线的外凸连线上,则说明两层数据中必有一层数据有质量问题,如不能确定哪层数据有问题时,可以通过将他们分别与其它质量可靠的数据层叠加来进一步分析。因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征要素的相关分析之用。
数据质量控制应体现在数据生产和处理的各个环节。下面以地图数字化生成地图数据过程为例,说明数据质量控制的方法。数字化过程的质量控制,主要包括数据预处理、数字化设备的选用、对点精度、数字化误差和数据精度检查等项内容。
(1)数据预处理工作 主要包括对原始地图、表格等的整理、誊清或清绘。对于质量不高的数据源,如散乱的文档和图面不清晰的地图,通过预处理工作不但可减少数字化误差,还可提高数字化工作的效率。对于扫描数字化的原始图形或图像,还可采用分版扫描的方法,来减少矢量化误差。
(2)数字化设备的选用 主要根据手扶数字化仪、扫描仪等设备的分辨率和精度等有关参数进行挑选,这些参数应不低于设计的数据精度要求。一般要求数字化仪的分辨率达到0.025mm,精度达到0.2mm;扫描仪的分辨率则不低于0.083mm。
(3)数字化对点精度(准确性)是数字化时数据采集点与原始点重合的程度。一般要求数字化对点误差应小于0.1mm。
(4)数字化限差 限差的最大值分别规定如下:采点密度(0.2mm)、接边误差(0.02mm)、接合距离(0.02mm)、悬挂距离(0.007mm)、细化距离(0.007mm)和纹理距离(0.01mm)。
接边误差控制,通常当相邻图幅对应要素间距离小于0.3mm时,可移动其中一个要素以使两者接合;当这一距离在0.3mm与0.6mm之间时,两要素各自移动一半距离;若距离大于0.6mm,则按一般制图原则接边,并作记录。
(5)数据的精度检查 主要检查输出图与原始图之间的点位误差。一般要求,对直线地物和独立地物,这一误差应小于0.2mm;对曲线地物和水系,这一误差应小于0.3mm;对边界模糊的要素应小于0.5mm。