由于户籍登记统计资料只统计上海市在户人口,而对无户口登记的人没有统计。所以除了户籍资料外,又收集到上海市第三次和第四次人口普查的资料,作为户籍资料的补充。这些资料包括人口的自然、社会经济构成如性别、年龄、职业、行业、文化程度、婚姻状况、家庭构成、不在业状况等。共377个街道和乡镇。为了研究人口增长与产业发展的关系,还收集了上海市工业分布1987和1990年的资料。
为了研究人口分布与住房、土地利用的关系,搜集到了华东师范大学根据上海市1988年11月对上海市区的航空像片解译的上海市中心城土地利用现状图,比例尺为1∶10000,共14幅图,土地类型共计42种。此外还有82年上海市第三次住房调查资料,包括市区各类住房及各类居住面积的户数、人口数和面积,共120个街道。
2.数据预处理:数据预处理主要包括地图数据和属性数据的规范化和标准化。
(1)属性数据的标准化:由于人口户籍统计资料共有21年,在这些年中,行政区划、街道和乡镇名称和排列顺序发生了很大变化。再者为了便于人口各方面分析的一致,便于进行对比、连接和图形显示。因此各类数据在输入以前,应按照行政单元统一编号,同时修改手抄资料的错误,查缺补漏。
(2)图片的标准化:是为图形数字化作准备的,因为高质量的地图能减少数字化后的工作,省时省工。首先将所需图片转绘到不易变形的聚脂薄膜上,这一过程既纠正原图上的错误,又要确保所绘特征符合各种制图标准,点、线与原图一致,并且位置准确,连接点清晰、确切。
(三)地图数字化和图形拼接
地图数字化选择了三张行政区划图,即1984年上海市行政区划图(1∶10000)、1984年上海郊县行政区划图(1∶425000)、1989年上海市市区行政区划图(1∶155000)。对于其它年份行政区划的变动可以这三张图为基础,进行修改。
数字化过程首先把地图上已知坐标的明确地物作为控制点,每幅图选4—9个控制点,随后将点、线、面各要素分别输入计算机,得到一个Coverage,然后建立拓扑结构,修改数字化错误,重建拓扑结构,直到没有错误为止。
图形拼接的过程如下:首先将相邻图幅的对应控制点进行配准,以其中一幅图为基准,转换另一幅图。为此专门建立了一个BASIC文件进行控制点转换,随后进行相邻图幅对应属性要素配准,最后将相邻图幅拼接起来,建立拓扑结构,形成一张完整的图片。
(四)要素属性追加与数据库管理
在ARCEDIT中追加各Coverage所需的要素属性,如在上海市行政区划图中弧段属性文件中加入行政边界类型,共分三种,即省界、区县边界和街道、乡镇边界。在多边形属性文件中加入各街道、乡名称或代码、人口数、工业状况等数据项。
在土地利用图中加各种土地类型。这种操作是在输完一个Coverage后就进行的,然后再拼接成一张完整的土地利用图。
对于属性数据的加入,是通过FOXBASE数据库系统进行的。因为属性数据,包括1970—1990年户籍统计资料,人口普查资料和住房资料,工业分布资料以及手工得到的土地利用资料,都是以行政单元进行统计的。在FOXBASE状态下,按照行政单元代码建立数据库,便于操作和编辑,可以很方便地实现数据库的连接,最后按照标准格式与ARC/INFO系统进行转换,实现图形属性数据的追加。
在FOXBASE状态下,建立了上海市1970—1990年户籍统计数据库,上海市1982年人口普查数据库,上海市1987、1990工业状况数据库和上海市中心城土地利用数据库。这些库的数据容量达十万之多。
(五)空间操作、统计和模型分析
空间分析主要包括Coverage的更新、特征提取和合并、图形叠加、空间连接和建立缓冲区等。这里主要利用了图形叠加分析来估计行政区划变动前后的人口变化,用行政区划图和土地利用图叠加,得到各街道土地利用的状况。还可根据需要选取住房、商业和工业用地等进行特征提取与显示,把一些相近土地类型进行合并。利用缓冲区分析,把城市从市中心开始分成一个一个同心环,在此基础上分析比较环内人口、产业和土地利用的特征与变化。另外,还可利用PCARC/INFO分别提取各类属性要素,如人口密度、工业密度、人口增长指数、各类住房用地分布等进行各类图形的显示与绘制。