1.Metadata层次结构
1)Metadata软件需求
数字地球中Metadata标准的主要功能是如何快速地通过网络获取 Metadata,并从它所描述的地理空间信息世界中获取所需信息,因此,Metadata的软件实现便是该标准体系研究的重要组成部分。
由于信息化社会中的数据交换涉及到众多的软硬件平台,因此在软件实现上应采取通用的编码方法,使用户能够通过PC机或大中型机的终端沿网络在不同数据管理系统之间交换Metadata、用不同的格式和语言表示Metadata,并可以评价和获取Metadata内容。按照这一需求目的,软件实现者便可以在计算机上实现Metadata标准,使Metadata的输入、查询、返回和表示等成为现实。
2)Metadata软件层次结构
地理信息的复杂性是地理数据与其他数据区别的一个很重要方面,它不仅涉及到三维的真实世界,而且现实世界又是多变的,使我们始终面对的是一个人文与自然交织在一起的复杂巨系统。Metadata所描述的正是这样的一个世界,而数据集系列便是这种复杂体的具体体现。
传统图纸地图中,对系列地图的分类是比较常见的,并且也容易描述,而在数字空间数据中,由于不同软件对数据集的概念和定义各有千秋,则变得比较复杂。另外,Metadata在数据集系列中具有继承关系,使许多内容可能在它的各个数据集中是相同的,比如坐标系统、Metadata参照系等内容。因此,软件设计者应充分考虑这种因素,使Metadata元素的输入、更新以及形成的报告或结果更加方便、简单。
数据集系列中的Metadata层次按数据系列Metadata、数据集Metadata、要素类型和要素实例Metadata、属性类型和属性实例Metadata等几个方面进行描述。其中数据集Meta-data模块是软件必须具备的内容,其他则为可选模块。
2.Metadata软件逻辑模型
1)Metadata逻辑组成
Metadata是空间数据基础设施或地学信息高速公路上共享信息资源的“探路石”,因此,为保证能够方便地查询地学信息,任何Metadata标准软件系统必须具备Metadata的输入、查询,以及返回和表示等四个方面的功能。图10.2所表示的是Metadata的基本逻辑模型。
在这一模型中,中间正方形部分是Metadata内容,它与空间数据以及属性之间是通过空间数据引擎链接在一起的,这样便可以保证在数据库更新时,Metadata内容也随之更新。
空间数据集合和外界是通过应用接口,并经通讯接口最后和用户接口连接在一起的。在这一过程中,客户端和服务器端是在分布式网络环境下发生联系的,并通过图10.2中的许多具体功能模块,实现了空间Metadata的功能体系。
2) Metadata的存储、编码和链接
Metadata存储管理是标准实现部分要考虑的内容之一,在软件实现上,通常有一般文件和数据库两种管理方式。一般文件存储方式在数据集较少时还可以适应应用需求,但对于大规模数据集,则最好采用数据库的管理方式,以便于Metadata的查询。
编码是按照国际标准化组织的SGML等语言,使Metadata的输入和输出标准化,以支持数据的传输和表示。按照这一标准建立的Metadata体系,它的每一输入便可形成一个SGML文档实体,便于Metadata的管理。
Metadata和空间数据的链接也是Metadata标准软件要考虑的因素之一。通常有三种方式的链接,即离线空间方式、空间数据位于Metadata服务器上、以及空间数据与Metada-ta不在同一服务器上三种形式。因此,软件实现时,应考虑到这些不同的方式,以采取相应的措施使Metadata能够定期更新或实时更新,以使Metadata与数据集保持一致。
3.Metadata软件功能模块
1)输入功能
输入功能由输入结构、输入Metadata,以及输入空间数据三部分组成。其中输入结构是描述Metadata在数据库中组织方式的信息,它是客户端解码的依据;输入Metadata是Metadata元素信息的核心部分,通过该输入界面,数据集生产者便可以充分地描述数据集内容;输入空间数据信息是用于链接空间数据库的依据,这部分内容是可选界面,在数据库处于在线状态时,具有非常重要的意义。当然这些模块应当遵循前面所讲的层次关系,使输入Metadata元素时,避免多余的重复。
2)查询功能
查询功能由初始化查询和返回结果两部分组成。当用户在客户端提交查询内容和算法时,服务器将对该规则进行解译,并按照所需信息返回给客户端,形成返回结果清单。
在软件设计时,查询和返回的清单项目至少应包括Metadata标识码、中文标题,以及数据集的范围信息(比如东西南北四个边界坐标点)等内容,其中Metadata标识码主要用于Metadata内容之间的链接,一般不用于显示。
传输协议应采用TCP/IP或OSI标准,数据的搜索和查询协议采用 ISO 10163:1995标准(搜索/检索标准),客户端的查询表格可采用基于ISO 8879:1985(SGML)的 HTML等标准。
3)返回功能
返回功能由请求Metadata、返回Metadata、返回结构、请求空间数据、返回空间数据等内容组成。
当用户发出一个请求时,它便伴随Metadata标识码沿客户端传输给服务器,这时服务器便对请求作出响应,并从空间数据集合中寻找合适的信息。一旦满足条件,服务器将按照 ISO 8879:1985的协议对 Metadata结果元素进行编码,并按照 ISO 10163:1995支持的语法结构用SGML对该信息进行封装,返回给客户端。客户端接收到结果信息时,通过文档类型声明(DTD)可以将返回信息解译为自己系统支持的显示格式,比如HTML格式等。Metadata的存储结构信息可通过返回结构的方式了解到,它对于系统地了解Metadata的组织方式等具有一定的意义。请求空间数据和返回空间数据是用户用于获取空间数据时的操作,通常按照Metadata内容中所描述的链接地址,按照统一资源定位器(URL)的规范与数据集进行联系,并返回所需的信息。
这样,按照上述方式,并利用Metadata标准软件系统,便可以通过网络完成地理空间信息的输入、查询、返回等操作,实现数字地球对Metadata所需的基本功能。
4.Metadata软件实现方法
Metadata的软件实现方法是Metadata标准走向实用化的通道,它与计算机技术、通讯技术等的发展是密切相关的,诸如数据库系统、网络以及Web浏览器等技术。通过这些技术以及前面所提的一些协议,软件人员便可以利用面向对象等技术描述管理Metadata体系,利用Web等技术设计Metadata的查询和返回页面,利用网络技术实现客户/服务器之间的通讯等。
当然,随着信息革命的到来,其他一些新的技术也会接踵而来,被用于Metadata标准的实现上。因此,本文将对实现Metadata标准软件的具体技术不一一列举,在使用时,凡是能够满足前面Metadata功能要求的技术均可以用于Metadata软件设计上。本文后面所列举的已实现了的基于国家空间数据基础设施的Metadata标准软件模块,是面向对象技术、网络技术以及Web技术等的有机结合,是基于分布式网络系统和客户/服务器体系的Metadata软件系统。
伴随电子技术的广泛使用,全球范围内对数字地理信息的需求已越来越大,并且越来越多的地理科学和信息技术学科之外的个人也涉入到这一领域,开始生产、处理和修改数字地理信息;另外,由于数字地理空间数据是通过信息的计算机分析和图形显示方法对现实世界进行建模和描述的,因此受数据的局限性,在利用假定的模型对地理实体作研究时,为了确保信息不被误用,应对影响数据获取的过程通过Metadata作详细地描述。这样,不仅可以使数据生产者能够充分描述数据集,用户也能够理解这种假定和限制,并可以估计数据集对他们应用目的的适用性。所以,随着地理空间数据生产者和用户数量的增加,利用Metadata来描述数据,将成为数据生产、存储、更新和再利用的必然趋势。
对地理信息Metadata的研究,人们最初是持怀疑态度的,因为地理空间信息涉及到地理世界的各个方面,要建立一个统一的标准模式,的确有一定的困难。然而通过人们的不断探索,目前对Metadata已有了一个比较全面地认识,并且也形成了一系列草案。因此,我们现在已处于一个可以比较系统地对Metadata进行研究的时代了。
从信息高速公路的提出到全球空间信息基础设施的问世,以及从Teledisk、第二代In-ternet到数字地球,人类正经历着地学界的另一个文艺复兴。然而,不管这些发展计划多么令人振奋,如果没有标准化技术作为其技术支柱,这一切便会成为泡影。因此,空间数据共享和数据标准化技术便成为地学信息革命首先要解决的难题,而Metadata则作为它们的重要方面,成为数字地球研究与应用的核心内容。