一、格式转换
格式转换分为二大类:不同数据介质之间的转换,即它是将各种不同的源材料信息如地图、照片、各种文字及表格转换为计算机兼容的格式,这在上一节中已经说明;第二类是数据结构间的转换。而数据结构间的转换又包括同一数据结构不同组织形式间的转换和不同数据结构间的转换。
对于栅格结构,如果栅格GIS数据库要记录高程、降水和土地利用类型三种信息(图2-4),其数据的组织形式可以是不同的。第一种组织形式可以是每一层次记录一种数据集,即每一个文件记录包含不同的要素变量,每一个文件中的每一栅格单元记录一个数字;第二种组织形式可以是每一个单元内顺序记录不同的要素;第三种组织形式可以是以行的形式按顺序记录各要素的数据。当同时要使用二种及二种以上组织形式的数据时,便要将其转换为对当前工作适用的统一的格式。
对于矢量结构,也有弧、节点组织形式、全多边形组织形式等之间的转换。
矢量和栅格结构之间的转换是地理信息系统中的一个重要问题,这将在下一章中详细说明。
二、图形单元的修改与增删
无论是采用任何方式输入数据,都会出现误差,因此在任何信息系统中,均要具有检查数据库误差的设备。
如对多边形进行数字化,可能出现的误差有多边形不闭合,相邻多边形出现重叠和裂口等。造成多边形不闭合的原因可能是输入错误的代码,如将多边形物体定义为弧段,也可能是数字化时引起的误差如忽略了点与点之间的连结。
当相邻的多边形的共同边界要数字化二次时,便会出现重叠和裂口,这便要在数字化以后进行修正和编辑,目前一些地理信息系统软件采用弧结点数据库结构时便能避免这类错误,因为这种结构形式公共点和线只记录一次,如ARC/INFO地理信息系统。
三、图幅拼接
当对底图进行数字化或扫描后,由于图幅比较大或采用小型数字化仪时,难以将研究区域的底图以整幅的形式来完成,如上海市区1∶25000的地图便有九幅1/2开大的地图,即便采用上述最大号的A00幅面(1118mm×1524mm)的数字化仪也不能完成整幅输入,在分幅输入完成并经过误差检查和编辑后虽然对每一分幅图来说错误订正是完成了,当在二幅图进行拼接时一般仍然会出现边缘不匹配的情况,如图2-6所示。因此便要进行图幅数据边缘匹配处理,一般可采用二种方法来调整边界,第一种方法是小心地修改空间数据库中点和矢量的坐标,以维护数据库的连续性;第二种方法是先对准两幅图的一条边缘线,然后再小心地调整其它线段使其取得连续。目前各种商业化的GIS软件均有图幅拼接的功能,拼接技术各有不同。
为了能便于相邻图幅的识别及计算机处理,在对图幅进行编号时可用十位数来指示图幅的横向顺序而以个位数来表示图幅的纵向顺序。
四、坐标转换
地球是一个近似的椭球体,用平面形状来表示地球表面其真实的形状便会出现差异。有大量地图投影的方法,也有各种分类方法,如可将地图投影分为方位角投影、圆锥投影和圆柱投影。最常用的是平面参考系统,其中又以全球变换墨卡托系统最为著名,在这个系统中每6度经度,8度纬度组成一个四边形,每一四边形均被标号。有关地图投影的知识读者可参阅有关地图学的参考书。
在地理信息系统中要对各不同投影进行坐标转换的原因是多方面的,最常见的情况有二种:一种是输入的地图是一种投影,而要求输出的地图产物是另一种投影;另一种是输入的底图是照片底图,而输出则要按一定比例的矢量方式。一般来说可通过原始影像坐标和订正后坐标之间的数字坐标转换未完成订正处理,计算两者相应坐标回归方程的多项式方法最为常用,其表达式为:
Lo=h+by+cx+dy2+eyx+fx2
La=g+hy+ix+jy2+kyx+lx2
式中:Lo:经度;La:纬度:h和g为截距;b-f和h-l为回归方程的系数。
这一多项式计算可由地理信息系统自身来完成,也可以用统计软件计算后输入x,y数据。目前一些地理信息系统软件均有多种地图投影输入变换与输出变换的功能。