一、数据的种类与形式
地理信息系统建立数据库的第一步是要确定该系统的数据源。地理信息系统的数据源是多种多样的,从总体上可分为图形图像数据与文字数据二大类。
图形图像数据包括现有的地图、工程图、规划图、照片、航空与遥感影像等。目前各种类型的地图是重要的信息源。这不仅是因为地图的内容直观与丰富,而且是由于在地理信息系统诞生以前,地图是表示空间与非空间信息强有力的手段,从某种意义上说,一册完备的专题地图集是一个很好的人工操作地理信息系统。遥感影像是地理信息系统中一个极其重要的数据源,它至少具有下列一些特点:①能取得大面积、综合的信息;②速度快;③降低数据储存冗余和不连续性;④能提供各类专题所需要的信息。各种文字数据包括各类调查报告、文件、统计数据、实验数据与野外调查的原始记录等,如人口数据、经济数据、土壤成份、环境数据。确定应用哪些类型的数据是由系统的功能所确定的,例如要建立一个土地的适宜性和承载力的信息系统,所需要的数据有地形、土壤类型、降雨、地下水位、运输条件等。
按照数据的储存形式,可将数据源分为图形、图表与数字化形式。图形、图表数据包括现有的地图、照片、记录及各类文件。而计算机的磁盘、磁带等是以数字化的形式来保存数据的。目前许多空间数据以及人口统计、地形等数据均是以数字化形式向用户提供,数字化形式的数据可以方便地输入地理信息系统内,便于用户使用。
二、数据的精度与误差来源
数据获取是空间信息自动化项目经费中最昂贵的部分。据统计,在地理信息系统中数据获取的代价是整个GIS代价的50%—80%。初学者往往认为,因为我们采用了现代化的计算机技术,因此所获取的数据是高精度甚至于是无误差的。其实不然,即使是最优秀的地理信息系统操作人员,在数据搜集并将其输入到系统内时,均会产生这样那样的误差。
GIS使用数字化数据,因而便关系到数字制图数据的标准。美国数字比制图数据标准全国委员会(NCDCDS,1988)确定了六个基本的数字化制图数据,如线状、位置精度、属性精度、逻辑的连贯性、完整性和时间精度,对每种元素均确定了检验其精度的标准。
对于误差的来源,有不同的分类方法。P. A. Burrough在土地资源评价地理信息系统原理(Principles of Geographical Information System for Land Resources Assessment)一书中,认为误差一词的概念是广义的,它不仅包含错误,也具有误差,平均“方差”的统计概念。他将误差分为三组共14类。
第一组为明显的误差,是最明显和最容易觉察到的,它包括:
1.数据的年代:出于经费与时间的限制,在同一研究项目中往往采用了不同年代的数据,如在使用现有的地图和数据的同时,又使用了最新的遥感影像和现场调查的数据,其实有时候某些原有数据已不适合现有的标准或现有状况已有所变化。
2.区域误差:在所研究的区域所要提取的某种数据,如土壤类型,已在部分地域内有现存的数据,对缺乏数据的另一部分地区重新获取数据时,由于标准与人员的不同,而产生了区域间数据的误差。
3.地图比例尺:由于同一研究中采用不同比例尺底图所造成的误差。
4.观察的密度不同而产生的误差。
5.相关:由于经费太昂贵或其它原因对所需要的数据难以获取时,采用相关数据而造成的误差。
6.格式:有两类重要的数据格式。第一类是指安排数据方式,也就是指数据的结构,数据是以矢量还是以栅格形式来安排的,如是以栅格形式,便与其像元的大小有关。第二类是指数据的本身,它们的比例尺、投影和分类方式。在一种格式向另一种格式转换,或一个系统向另一个系统转换时,往往不是绝对无误的。