在地理信息系统中,为了把大量反映地理特征的空间数据和属性数据存贮到计算机中,无疑,需要使用数据库管理系统。
由于地理信息自身的特点,决定了地理信息系统数据库既要遵循和应用通用数据库原理和方法来解决,又要考虑自己的特点,采取特殊的技术和方法。为此,首先要分析一下地理数据库的特点。
4.4.1 地理信息系统数据库的特点
1.数据库的复杂性。地理数据库比常规数据库复杂得多,其复杂性首先反映在地理数据种类繁多。从数据类型看,不仅有空间位置数据,这些空间位置数据具有拓扑关系,还有属性数据,不同的数据差异大,表达方式各异,但又紧密联系;从数据结构看,既有矢量数据又有栅格数据,它们的描述方法又各不相同。地理数据库中数据复杂性还表现在数据之间关系的复杂性上。即在地理数据中空间位置数据和属性数据之间既相对独立又密切相关,不可分割。这样,给地理数据库的建立和管理增加了难度。例如,在以地块为单位的土地类型数据库中,要增加一地块,决不是简单插入一个地块属性数据,它涉及到边界位置数据的增加,拓扑关系的修改,以及几何数据如面积、周长的修改,甚至影响到空间位置数据和属性数据之间连结关系的修改。
2.数据库处理的多样性。常规关系数据库,其处理功能主要是查询检索和统计分析,处理结构的表示以表格形式及部分统计图为主。而在地理信息系统中其查询检索必须同时涉及属性数据和空间位置数据。更主要的是当利用空间数据和属性数据进行查询、检索和统计时,常引入一些算法和模型。例如:用数学表达式在DTM模型上查询地面坡向因子时,需引入相应的坡向分析模型,这已超出传统数据库查询概念。
3.数据量大。地理信息系统中所描述的各种地理要素,尤其是空间位置数据,数据量往往十分庞大。加上空间数据记录长度的多变性,为了获得高速数据贮存和运算,必须选择合理的算法和数据结构及编码方法,以提高数据库的工作效率。
4.4.2 地理信息系统数据库及其管理
数据库的数据组织和管理是地理信息系统的核心问题之一,它直接影响其工作效率和用户的使用。
在地理信息系统中,数据模型是描述数据内容和数据之间联系的工具,也是数据库及管理的基础。由于地理信息系统数据库涉及图形数据和属性数据的组织和管理,严格地说,单纯选择一种商品化数据模型,如关系型数据库很难理想地实现对空间数据的存储和操作。尤其是无法处理具有复杂目标的空间数据。因此,选用通用商品化关系数据库系统作为地理信息系统的数据库管理系统,管理空间和属性数据并不理想。但由于一些通用数据库管理系统在数据定义、数据更新、数据运算及结构修改扩充方面效率较高,特别是通用性强,所以,目前很多地理信息系统中仍以通用关系型数据库管理系统作为技术支持。下面介绍几种地理信息系统中数据库管理方法。
一、基于关系型数据库和文件系统的管理方法
采用这种方法的地理信息系统中,分别用两个子系统管理空间数据和属性数据。其中的属性数据存储在关系型数据库中,空间数据则存储在文件系统中。在分析处理目标时分别访问两个子系统,再把它们结合起来得出结论。这种系统的缺点是数据完整性差,由于采用了两个系统有时会出现空间数据子系统中已删除的目标,在属性数据库中却仍存在此目标,或相反。此外,由于两个子系统的存在,使查询操作难以优化。其优点是由于它基于关系型数据库,结构简单,通用性强。通常在两个系统中采用下述连结方法。
1.标识码连结法。标识码连接法中,属性数据和空间数据子系统之间,通过建立的标识码来联结如图4-4所示。
2.指针表连结法
这种方法通过建立自定义指针表,记录空间数据和属性数据的相关索引,对涉及到的空间数据和非空间数据的操作都通过指针表来实现。例如删除一个目标的步骤如下:
1)从空间数据库中删除该目标;
2)从指针表中找对应此目标的属性数据库的指针,根据上面指针删除属性值。
图4-5为这种连接方式结构。
总之,在这种系统中检索目标时必须同时查询两个子系统,然后将两者的结果联系起来。如图4-6(a)所示。