第四节 空间数据的元数据
三、空间数据元数据的获取与管理
空间数据的地理特征(包括空间特征和属性特征)要求对数据的各种操作,从数据获取、数据处理、数据存储、数据分析、数据更新等方面应有一套面向地理对象的方法,相应的空间数据元数据的内容及相关的操作也就具有了不同于其它种类数据元数据的特点。
1.空间数据元数据的获取
空间数据元数据的获取是个较复杂的过程,相对于基础数据(Primary Data)的形成时间,它的获取可分为三个阶段:数据收集前、数据收集中和数据收集后。对于模型元数据,这三个阶段分别是模型形成前、模型形成中和模型形成后。第一阶段的元数据是根据要建设的数据库的内容而设计的元数据,内容包括:①普通元数据,如:数据类型、数据覆盖范围、使用仪器描述、数据变量表达、数据收集方法等;②专指性元数据,即针对要收集的特定数据(如中国1950~1980年30年间的逐旬降水数据)的元数据,内容包括数据采样方法、数据覆盖的区域范围、数据表达的内容、数据时间、数据时间间隔、空间上数据的高度(或深度)、使用的仪器、数据潜在利用等。第二阶段的元数据随数据的形成同步产生,例如,在测量海洋要素数据时,测点的水平和垂直位置、深度、温度、盐度、流速、海流流向、表面风速、仪器设置等是同时得到的。第三阶段的元数据是在上述数据收集到以后,根据需要产生的,它们包括:数据处理过程描述、数据的利用情况、数据质量评估、浏览文件的形成、拓扑关系、影像数据的指示体及指标、数据集大小、数据存放路径等。
空间数据元数据的获取方法主要有五种:键盘输入、关联表、测量法、计算法和推理法。键盘输入一般工作量大且易出错,如有可能应尽量避免,但对某些元数据而言(如数据变量表达的内容)只能由键盘输入。关联表方法是通过公共项(字段)从已存在的元数据或数据中获取有关的元数据,例如,通过区域的名称从数据库中得到区域的空间位置坐标等,测量方法容易使用且出错较少,如用全球定位系统(GPS)测量数据空间点的位置等。计算方法指由其它元数据或数据计算得到的元数据,例如,水平位置可由仪器设置及时间计算得到,区域的面积可由多边形拓扑关系计算出来,该方法一般用于获取数量较大的元数据。推理方法指根据数据的特征获取元数据。
在元数据获取的不同阶段,使用的方法也有差异。在第一阶段主要是键入方法和关联表方法;第二阶段主要采样测量方法;第三阶段主要方法是计算和参考方法。
2.空间数据元数据的管理
空间数据元数据管理的理论和方法涉及到数据库和元数据两方面。由于元数据的内容、形式的差异,元数据的管理与数据涉及的领域有关,它是通过建立在不同数据领域基础上的元数据信息系统实现的。国外在元数据方面已有许多成功经验,下面列举其中一例。
Francis P.Bretherton(1994)等人认为元数据管理可通过元数据库(Metadatabase)实现(见图2.28)。在该系统中,物理层存放数据与元数据,该层由一些软件(如WAIS)通过一定的逻辑关系与逻辑层关联起来。在概念层中用描述语言及模型定义了许多概念,如:实体名称、别名、允许属性值的类型、缺省值、允许输出及输入的内容、临时实体的作用、元数据的变化、操作模型等。通过这些概念及其限制特征,经过与逻辑层关联可获取、更新物理层的元数据及数据。
另外,全球信息源字典采用两步实体关系模型(Two-stages-Entity-Relationship-Model)来管理元数据。