2.2.1 地球信息的基本概念
1.信息的一般概念
信息(Information)最早出现在通讯科学中,后来用于生物学、医学及许多科学技术领域及社会科学领域。尤其处在“社会信息化”和“信息社会化”的今天,信息这个术语已被广泛应用。关于它的定义,至少有40种以上,大体可以归纳为三类:
第一类,语言学的定义:如《辞源》中指出,信息就是指音讯、消息。在一般汉语字典中,它被解释为消息、情报、新闻等。但也有称为资讯的。
第二类,哲学定义:主要有:信息存在于物质和意识过程中,在本质上是统一于物质的。信息是人和物质的精神实体的特性。信息是由物质到精神的转化,信息既是非物质,又非精神的独立的第三态等。
第三类,自然科学定义。
1)经典自然科学定义
·狭义信息:可以推信息论的创始人R.V.L.Hartly和C.E.Shannon作为代表。R.V.L.Hartly(1928)是从“有多少个可能性”出发来建立信息论的。他建议,“信息是消息的不确定性的消除”。C.E.Shannon指出,“信息就是两次不定性之差”,即人们对某一事物先后两次认识的差别,或某人对某一事物获得了新的知识、新的消息。目前持有这种观点的,有清华大学的常迥院士,他认为信息有两个特征:
第一,只有变化着的事物才有信息;
第二,只有尚未确定的事物才有信息。
因此,可以简单归纳为:信息是指对某一事物的新认识、新知识。
·广义信息:可推控制论的创始人 Norbert Winer作为代表。他认为:信息是指主体(人、生物或机器)与外部客体(环境、或其他人,其他生物或其他机器)之间相互联系的一种形式,即主体对客体的有关情况的消息或知识。当主体得到了客体消息或知识后,加以识别、评价和采取相应的措施。因此 Norbert Winer认为,信息就是主体对客体的所掌握的全部知识。他不强调这知识是新的,还是旧的;是已知的,还是过去所未知的。支持这种观点的人也很多,如联合国粮农组织(FAO)于1985年指出:“信息是为一定目的服务的,一切有用的知识。”又说:“信息是表征事物特征的一种普遍形式。”因此可以归纳为:信息是指为某一目的服务的,或是有关某一事物的一切有用知识。
2)一般自然科学的定义
一般自然科学的关系信息的定义说法就多了。但主要有:“信息是物质和能量在时间和空间分布的不均匀度和运动状态的直接或间接的表达”。“信息是物质和能量状态的表象(征)”。“信息是物质和能量的形态、结构和状态的表征”。“信息是物质和能量的普遍属性”。“信息是事物的表征”。“信息是表征(象)事物状态和运动特征的一种普遍形式”,(方华飞、吴维熊等),信息是物质能量外在表现(周戟,1999)。
作者认为处于信息社会的今天,应接受广义信息的概念和现代自然科学给信息下的定义。因此,认为信息的定义可简单归纳为:信息是指一切事物的性质、特征和状态的表征,是有关某一事物的一切有用知识的集合。信息是物质和能量的性质、特征和状态的表征的知识,它是由物质和能量产生的,但又独立于物质和能量而存在的第三态。因此,物质、能量和信息是客观世界的三大要素。
2.地球信息的定义
地球信息是指有关地理实体,如资源、环境、经济和社会诸要素的物质和能量的性质、特征和状态表征的知识。性质是指它们的物理、化学、生物、经济和社会等方面的组成成分、结构及属性等;特征是指它们的形状、大小及时空分布及变化规律等。状态是指它们所处于相对动态或静态等;物质是指资源、环境、经济和社会等的实体;能量是指它们的力学(重力)、磁学、电学、电磁波及生物学的、社会经济学的无形的能量。所以,地球信息是有关资源、环境、经济和社会的物质和能量的性质、特征和状态的表征或一切有用知识的描述。
3.地球信息载体
地球信息虽然是由地理实体,如资源、环境、经济和社会的物质和能量所产生的,但它又不等于地球实体,它是独立于地球实体的物质和能量而存在的第三态,即信息以独特形式而存在。而信息又是无形的,是看不见和摸不着的。它又必须依附于一定的物质和能量而存在,这种运载或负荷信息的物体(质)或能量就称为地球信息载体(Geo-Information Carrier)。因此,有关地理实体,如资源、环境、经济和社会诸要素的实体或现象、物质或能量的表征,都是信息的载体。
例如:“梧桐落叶、柳色飞黄、大雁南飞、阳光和煦、微风送爽”等是深秋天气来临的信息。梧桐落叶是地理实体的性质、特征和状态的表征,是“秋天来临”信息的载体。“深秋天气来临”的信息必须依附于“梧桐落叶、柳色飞黄、大雁南飞阳光和煦、微风送爽”物质特征而存在,而且还必须是五个特征同时的存在时,才能构成信息。如果,只有“梧桐落叶”或任何一个都不能成为信息,只能作为“资料”(Data),因为它可能含“病态”或其他“噪声”在内。
又如束状针叶、鳞状树皮、鳞状坚果和乔木是松树信息的载体,也是松树的识别标志。松树信息是离不开上述四个形状特征载体的。因此,“束状针叶、鳞状树皮、鳞状坚果和乔木为松树”构成了完整的松树信息。
一切地球实体,如资源、环境、经济和社会诸要素的物质和能量均可以作为地球信息的载体,但这种载体有的是有形的,还有的是无形的。例如,它们的能量特征,如重力、磁力或电磁波、甚至音响(声波)等,都可以成为地理实体的息载体;但这些载体称为基础载体,它们不能被利用,只有将它们转化为文字、数字、图形、影像、磁带等,即将无形转化为有形后,才能被利用、传输。地球信息的载体可以分为:
(1)地球信息的第一载体:指地理实体的物质本身和能量本身,包括物体的成分、结构、形状、空间分布以及重力、磁力、电磁波和声波的性质、特征和状态等。
(2)地球信息的第二载体:指描述地理事物的文字、数字、图形、影像、音响等的描述及其纸质、磁带、光盘等的载体。
(3)地球信息的第三载体:指描述地球事物的各种专题地图、影像专题图及其纸质、胶质、磁带、光盘等的载体。
4.地球信息的基本类型
地理实体和其他实体一样,具有物质特征和能量特征。因此,地理信息也和其他事物的信息一样,有两个基本类型:
(1)物质信息:指有关地理实体的物质成分、结构、形状、时间和空间分布的性质、特征和状态的表征或一切知识,是常规地理科学的研究对象。
(2)能量信息:指有关地理实体的能量特征,如重力、磁力、电磁波谱声学等的性质、特征和状态的表征或一切知识,是物理勘探和遥感科学研究的对象。
5.地球信息源
地球信息源(Geo-Information Sources)是指实体的本身,包括地理实体、过程和现象等的本身,即产生地理信息的源泉和基地。
2.2.2 地球信息模型
地球信息熵(Geographic Information Entropy)是指地球信息载体的信息量。地球信息熵是指信息载体中的信息与噪声(Noise)之比,简称“信噪比”。C.E.Shannon以熵作为信息载体的平均信息量的度量。熵是描写不肯定性的大小的量;熵越大,不确定性越大,因此信息就是负熵。C.E.Shannon指出,如果一个信息中某种信号出现的概率为Pi,那么它所带的信息量就是-PilogPi,因此,这一信息所含的全部信息量是-∑PilogPi,用H表示,于是得
作为地理信息的载体,包括地理的数据或资料(Data)、影像(Image)、图形(Picture)等中都可能含有噪声。因此
Data=Information + Noise
Information=Data-Noise
Noise= Data-Information
地理信息熵是用来对地理信息载体质量评估的标准。
同时,根据上述信息熵的原理,不难可以看出,信息(Information)和数据(Data)的关系。数据是信息的载体,当数据中的“噪声”(Noise)被排除之后,它就成为信息。因此信息和数据的关系十分密切。
2.2.3 地球空间数据的基本概念
地球空间数据(Geospatial Data)是数字地球的基础。但是地球数据是比较复杂的,决不是拿来就可以用,就可以任意分析的。必须充分了解地球数据,才能用好地球数据,或才能获得应有的效果。
1.定义
数据(Data)是信息载体(Information Carrier),但它不是信息(Information),它包括数字、文字、图像、音响等。
空间数据(Spatial Data)是数据的一种特殊类型。它是指凡是带有空间坐标的数据,如建筑的设计图、机械设计图、X光片、照片及各种地图等。
地学空间数据(Geo-Spatial Data)是空间数据的一种特殊类型。它是指带有地理坐标,即经纬网坐标的数据,包括资源、环境、经济和社会等领域的一切带有地理坐标的数据。据统计资料表明地学空间数据占总数据量的80%左右,可见它是主要的数据类型。
2.地学空间数据三要素
“属性、空间和时间”是任何地学空间数据所必须具备的三要素。缺少其中之一或二,都不能成为空间数据,至少不是完整的信息。例如:“1999年北京香山(含地理坐标)的枫树林”,具有属性、空间和时间三个要素,是一个完整的信息。若只说“枫树林”,既没有时间也没有空间,至少是不完整的信息。若只说“北京香山一片枫树林”,虽然有属性和空间位置,但没有时间,它可能不是现在的,而是清朝时期的,甚至是明朝时期的,因此它也不是完整的信息。只有属性而没有时、空概念的信息,都不是完整的地学信息。
2.2.4 地球空间数据的特征
地学空间数据的复杂性表现在:既有十分精确的数据,也有十分模糊的数据两者并存;还有数据的动态性,而增加了它的复杂程度。
(1)地学空间数据的精确性:凡是经过测量得到的数据及经过精确计算的数据,如地球与月球之间的距离是精确的。
(2)地学空间数据的模糊性或不确定性(Uncertainty),包括以下几方面的原因:
·有些地球的不同类型要素之间是逐渐变化、逐渐过渡的,两个类型之间本身就不存在明确的界线,如相邻的不同土壤类型之间、相邻的气候带和自然地理带之间等,都是逐渐过渡的,不存在明确的界线,而所划的界线则是人为的。这样的现象在地球科学的领域内是很多的。
·定义有争论,或定义的界线难以精确划分。如林地的定义,在林业部与农业部之间就存在着分歧。如按林业部门的定义,“凡是林冠垂直投影的面积占60%以上的为林地”。但在划界时却很困难,没法切实执行,只能是大概的。又如,对于土地类型的划分来说,各种土地类型都不是纯的,水田中包含了部分属地埂、灌溉毛渠、甚至是房屋等地类。且随着比例尺的不同,对它们分类的“纯度”也有所不同;比例尺越大,则分类的纯度越高。
(3)动态性的特征。地球科学领域中不少对象是具有动态性的特点,数据具有强烈的时间和空间特征。例如,描述人口只能是限定某一特定时间才有意义;同样对于耕地的数量也是只有限定在特定的时间内才有意义。因为耕地随时、随地都处在不断的变化之中;林地、草地等也是如此。很多土地利用类型都是动态的。
1.地球空间数据的原生数据与派生数据
在我们日常工作与生活中常常遇到的是一些原生的空间数据,还有的则是由其派生的或次生的数据。如每天的温度,每天、每小时、每分钟的降雨量等为原生数据;而月平均温度、季平均温度、年平均温度,月最高温度、月最低温度,年最高温度、年最低温度;月平均、年平均降水量等则都是属于派生的和次生的。最重要的是基础数据、原生数据。
(1)用统计方法产生的派生数据:如各种气象、气候、水文、海洋及产量数据等原生数据,可以通过统计的方法产生很多生产、科研及管理部门所需的派生数据。
(2)数据挖掘(Data mining):也是属于可派生或可次生数据的一种类型,但它不是一般统计方法能产生的。如将数字地形数据通过分析,可产生地质类型、地质岩性、地质构造、气候状况及气候变化等派生数据。又如通过对水文原生数据的平水位时河流形状数据(图形、影像)与洪水时期的河流数据进行对比所获得洪水泛滥的数据等,也是派生数据,是通过数据挖掘(Data mining)方法产生的数据。
2.数据、信息与知识之间的关系
一般来说,数据产生信息,信息产生知识,因此数据具有极大的潜力。信息在数据范围之外还有特点的,尤其是具有人类解释的特点,具有超信息的某种东西。数据和信息适用于进行技术处理,而知识则能靠人的分析和解释进行处理。据世界银行1998年的“世界发展报告”中对数据、信息和知识三者的关系阐述时指出:数据是未经组织的数字、文字、声音和图像等;信息是以有意义的形式加以排列和处理的数据(有意义的数据);知识是用于生产的信息(有价值的信息)。