伴随人类对数字地理信息重要性认识的加深,Metadata标准化这一问题便逐渐成为共享地学信息的热点,而要研究Metadata体系,则首先要对Metadata的理论基础有一正确的分析。
事实上Metadata标准依赖于地理空间信息共享标准的理论,它与自然科学中的许多学科都有交叉,几乎涉及到数、理、化,天、地、生中的所有方面,并依赖于现代科技的发展。计算机是它的基础平台,网络是它的通讯基础,没有数学模型和对各学科的综合认识,也就谈不上用遥感等技术研究地球机理。因此,从宏观角度来看,地理信息标准化涉及到许多领域,似乎它的理论也枚不胜举;但从微观角度来考虑,数字地理信息所研究的共享体系理论则主要应包括地理信息的模型建立理论、表示理论、空间参照系理论、质量体系理论以及计算机通讯技术等方面的理论,它们是我们共享体系依赖的基础,也是我们首先要考虑的内容。当然,其他能够促使地理信息共享的理论也将成为基于数字地球的Metadata体系的有力支柱。
1.地理信息的模型建立理论
人类对地理对象的认识是一个复杂的过程,它需要把一系列具体的对象抽象为我们在计算机上能够表示的信息。地理空间信息事实上是我们在浏览地图时所获取的一切信息,它的主要目的是告诉人们“某处有何物”;而数字地理空间信息则是用计算机编码和显示方式对地理空间现象的表示。地图是我们对地球实体的简单抽象,因此,我们既可以把地球影像认为是一幅地图,也可以把用任何简单仪器采集的不太完备的地球现象的集合认为是地图。这样不同的人对地球现象的认识,将因随方法、时间等的差异便有明显的不一致。对于数字信息更是如此,随着不同的数据结构、存储方式、分析模型等的存在,便产生了数字地理空间信息领域的混乱现象,给信息的共享带来了很大的不便。
为了促使地理信息的共享,便需要对地理信息的整个认知过程有一个总体的了解,即对地理要素之间的关系应比较清楚。这里的要素是指地理空间信息的基本单位,它可通过回归的方法逐渐由简单要素组成复杂的要素,比如一幅卫星影像,影像中的一个像素、非规则三角网、叠加在天气图上的温度等都是要素。
对地理对象的抽象过程通常认为有9个层次,在这九个层次之间通过8个接口与它们连接,实现了由现实世界到地理要素集合世界的转换。这9个层次依次为现实世界、概念世界、地理空间世界、尺度世界、项目世界、点世界、几何世界、地理要素世界以及要素集合世界。连接它们的8个接口分别为认识接口、GIS学科接口、局域几何接口、群体接口、空间参照系接口、几何结构接口、要素结构接口及项目结构接口。
2.地理信息的表示方法
1)几何要素的表示
坐标系统是GIS中表示要素的重要部分,通常由地球坐标系统和GIS坐标系统组成,其中当GIS采用大地坐标系时,这两个坐标系便等价。但对于大多数GIS系统,对几何要素的表示都采用GIS坐标系统,这样人们便可把现实世界中的对象抽象为点、线、多边形等不同的几何形状,并按照点连接成线,线连接成多边形,多边形再组成多面体等递归的方法用GIS坐标系统表示地理实体。
利用几何方式构建GIS关系时,拓扑理论是它的基础,被用于分析几何关系。这样我们可以利用拓扑学知识分析数据集质量的完备性、逻辑一致性等特征,以正确评价数据集的质量。在使用时,通常通过空间几何接口实现。
2)地理信息的存储方式
利用GIS表示现实世界时,大多数信息是通过一定的数学模型,即存储函数方式存储在计算机中的,因此GIS其实是一种模型地理空间信息。按照这种方式,人们便可以利用GIS揭示自然界中许多用人类视觉难以发觉的信息,比如城市中鸟类居住的变迁情况、发生龙卷风后土地的盐碱化情况以及地震等许多复杂的自然现象。对于这些信息,随着数学模型的不同,所模拟或得出的结果一般是有一定差异的。
利用存储函数反映地理现象时,涉及到两大部分的内容,即取值范围和结果范围,它们之间通过数学模型接口来实现。最简单的数学模型便是参照系,通过它,便可以实现现实世界到数字地理空间世界的映射。
当然,在整个地理空间表示中,涉及到许多存储或转换函数,它们的变量也是千差万别的,比如,摄影测量便是由三维到二维再到三维的过程,在这种转换中涉及到亮度函数、坐标几何函数,以及误差传播等多方面的函数。因此,在利用Metadata表示它们时,便需要通过继承关系等把它们反映出来。
3)地理信息的图层表示
图层(Coverage)的产生是一个复杂的过程,它通常由图层产生函数实现。比如航天遥感和航空遥感影像等,都是通过特定的方程使它们由现实世界转变为图像以及数字世界的。
对于产生函数来说,在由现实世界到地理空间世界的转变过程中,需要考虑的影响因子比较多,包括成像时的动态补偿、地形起伏、大气折射、地图投影转换等诸多因素,因此在实际应用中通常根据不同的阶段采取分段函数的方法,逐步实现由现实世界到所需目的世界的转换。另外,也可以根据Metadata不同模型中的一些相似属性实现,包括通讯(或传递)参数、误差估计参数、影像支持参数、像素的小数位,以及计算方向等参数。通过这些约束参数以及它们的子集,便可以用Metadata全面记录下数据的整个传递过程,使数据集的形成和使用更加容易理解。
4)图层的几何匹配
图层集合或影像立体像对等内容对数据集也是非常重要的,人们可以通过同一几何范围内不同内容的图层集进行相互叠加,以分析不同要素之间的关系,而这种叠加也符合人类对现实世界的认识过程。因此,对Metadata描述时,需要记录影像的匹配像对、数据集图层范围以及所对应的属性集等相关元素,同时对描述它们各自的参数、单位、以及数学模型等也要做一定的阐述。