依次求出任何两个点的距离系数dij(i,j=1,2,…,n)以后,则可形成一个距离矩阵:
它反映了地理单元的差异情况,在此基础上就可以根据最短距离法或最长距离法或中位线法等进行逐步归类,最后形成一张聚类分析谱系图,如图(4—3)。
除上述的欧氏距离外,定义相似程度的还有绝对值距离、切比雪夫距离、马氏距离、兰氏距离、相似系数和定性指标的距离等。
四、判别分析
判别分析与聚类分析同属分类问题,所不同的是,判别分析是预先根据理论与实践确定等级序列的因子标准,再将待分析的地理实体安排到序列的合理位置上的方法,对于诸如水土流失评价、土地适宜性评价等有一定理论根据的分类系统定级问题比较适用。
判别分析依其判别类型的多少与方法的不同,可分为两类判别、多类判别和逐步判别等。
判别分析要求根据已知的地理特征值进行线性组合,构成一个线性判别函数Y,即
式中,ck(k=1,2,…,m)为判别系数,它可反映各要素或特征值作用方向、分辨能力和贡献率的大小。只要确定了ck,判别函数Y也就确定了。xk为已知各要素(变量)的特征值。为了使判别函数Y能充分地反映出A、
而各类内部的离差平方和尽可能小。只有这样,其比值Ⅰ才能达到最大,从而能将两类清楚地分开。其表达式为:
判别函数求出以后,还需要计算出判别临界值,然后进行归类。不难看出,经过二级判别所作的分类是符合区内差异小而区际差异大的划区分类原则的。
目前在地理信息系统中发展了一种多因素模糊评价模型,相当于模糊评判分析,该方法首先根据标准类别参数的指标空间确定各因素各类别对目标的隶属度,作为判别距离的度量,再结合要素的权重指数,采用适当的模糊算法,计算各地理实体的归属等级类别,作为评价的基础。该方法通过隶属度表达人们对目标与因素之间关系的模糊性认识,用适当的算法将这种认识量化并反映到结果的分类中,对于地理学中的评价与规划问题非常有效。