(二)熵与地理信息
所谓某个地理事件的信息量,应当理解为由地理信息所描述的这种事件的出现概率。在大多数情形下,只研究单独的某种地理信息是不符合实际的,应该知道的是地理系统中整个信息系列的总体性质。地理熵就是为了了解总体的平均地理信息量而引入的。
假设有3种地理信息,随机地依照不规则的次序出现,出现的总数共有m个,而且统计出此3种地理信息出现的概率分别为P1,P2和P3。此种出现总数为m个的地理信息中,可以按如下方式分别得出其信息量:
地理信息 每个地理信息 总数m个中 各类地理
出现概率 的信息量 所占的信息数 信息的信息量
P1 -logP1 mP1 -mP1logP1
P2 -logP2 mP2 -mP2logP2
P3 -logP3 mP3 -mP3logP3
全部3类地理信息的总信息量为各自信息量之和,用符号Q表示:
Q=-mP1logP1-mP2logP2-mP3logP3 (2.23)
而其“平均地理信息量”则为:
Q/m=-P1logP1-P2logP2-P3logP3 (2.24)
地理熵的数值定义,即为单位信息的地理信息量,亦即式2.24所表达的平均地理信息量。如用S代表地理熵,并且依照一般的表达方式,可以写成:
由于地理信息量具有统计特性,按照大数法规,地理信息总数目m必定是很大的值才具有意义。
根据前述,假如我们知道了地理系统的大状态,同时也知道了系统内的微状态,则地理熵可以测出所得的信息量,我们建议使用申农指数进行度量。在一个地理系统中,常会有许多波动,这些波动如果超出某种确定的界限,则可以导致整个地理系统的行为发生改变。因此,系统除开处于静止状态或准静止状态的稳定性之外,还应当确定出可能发生波动的“事先概率”,以及一个波动扩展的范围、概率及所包括的某个大振幅的基本特征。
这些概率的确定,属于地理系统的随机理论。围绕着静止态波动的概率W,同以爱因斯坦方程所描述的熵的二次变差δ2S相联系,可以得到下式:
式中KB为波尔兹曼常数。式2.26为地理系统稳定性的判别,提供了一个统计基础,很显然它是从地理熵的处理中寻求解答的。
在理论地理研究中,有时会遇到地理风险决策这样的难题,它是人文地理研究和应用的一个重要方面。此时,首先应该准确地推断某个地理区域中的地理熵,即知道该区域的平均地理信息量。试举一地理区域中的基本天气状况判断为例。
某温带季风区:
晴天(F)概率占4/8
阴天(C)概率占2/8
雨天(R)概率占1/8
大雨(P)概率占1/8
某温带荒漠区:
F 7/8
C O
R 1/8
P O
试求上述二区的地理熵:
温带季风区:
温带荒漠区:
地理熵S2小,意味着该地理区域中某特定地理事件以很高的概率出现,表现在天气状况上,温带荒漠区出现的形式比较单调,或者说所具有的地理信息量小。对S1恰好作与此相反的结论。这就是说,人们用心关注的是那些地理信息量大的地区,这在风险决策中将有更大的意义,因它与未来的事件发生有着极大的关系。