地理首页
地理教学
地理科普
地理试题
地理课件
地理教案
地理学案
地理复习
地理图片
地理课本
地理书库
中国地图
世界地图
地理新闻
行政区划
小故事
作文素材
作文大全
范文大全
黑板报
手抄报
地理资料
中国旅游
世界各地

空间数据仓库模型与数据挖掘理论研究

时间:2010-01-29  归属:数字地球导论

1.研究现状

基于虚拟地球的应用具有数据量巨大、包含多维空间属性和时空属性及相关的特殊操作等特点,对虚拟地球的数据进行系统的整理、管理和深入的分析是虚拟地球基础研究的一个重要内容,是虚拟地球的基础研究及应用的重要前提之一。

具体来说,虚拟地球的空间数据仓库模型与数据挖掘研究理论的研究的目的是:综合运用数据库系统、统计学、人工智能、机器学习、模式识别等领域的理论和研究方法,深入研究以虚拟地球为对象的空间数据仓库模型与数据挖掘理论,建立空间数据仓库、空间数据联机分析和空间数据挖掘的基础理论框架及三者有机集成的基本原理,探索有效可行的关键技术,为虚拟地球的基础研究和应用提供前提和有力的支持,为空间信息的开发应用提供理论和核心技术。

虚拟地球的空间数据仓库模型与数据挖掘理论研究具有重要的理论意义和深远的应用潜力和价值。具体来说,至少有以下几个方面:

·空间数据仓库模型与数据挖掘理论是空间信息资源开发的重要支柱,大量的调查研究和预测表明,在即将到来的21世纪,空间信息资源将成为倍受重视的关键战略资源,对空间信息资源开发程度将在一定程度上影响一个国家的综合实力,决定一个国家的竞争力。

·大规模的空间信息的深入分析能力对未来的自然资源开发与利用、自然灾害预测与防治、国防与战争、国民经济建设与管理、政治与空间开发等多个方面都是至关重要的,而空间数据仓库与空间数据挖掘是对大规模空间信息进行深入分析的主要途径。

2.研究内容

空间数据仓库模型与数据挖掘研究的主要内容包括以下五个方面:

(1)支持虚拟地球的空间数据仓库模型与体系结构,根据虚拟地球对多维度和时空特性的要求,研究如何运用数据仓库技术高效地支持以虚拟地球为对象的数据分析的挖掘。主要包括以下方面:

·空间数据仓库的概念模式;

·空间数据仓库的存储模式;

·空间数据仓库的设计模型;

·空间数据仓库的体系结构。

(2)支持虚拟地球的空间数据联机分析处理技术,根据虚拟地球的联机分析要求,研究如何高效地进行空间数据的联机分析。主要包括以下方面:

·空间数据Cube的高效计算方法;

·运用空间数据Cube的联机分析处理技术。

(3)支持虚拟地球的空间数据挖掘技术,根据虚拟地球深层次数据分析和知识获取的需要,研究如何高效地进行与空间有关的数据挖掘。主要包括以下方面:

·空间数据关联分析;

·空间数据聚集分析;

·空间数据分类算法;

·空间数据联机集成挖掘。

(4)空间数据仓库和空间数据联机分析的联机网上发布,研究把空间数据仓库中的信息和空间数据联机分析、空间数据挖掘的结果通过Internet进行发布。主要包括以下方面:

·Web空间数据仓库的模型与机制;

·基于Web的联机空间数据分析处理。

(5)空间数据仓库、数据联机分析处理和数据挖掘的原型研制,把有关基础理论和技术的研究成果用原型加以检验和集成,为产业化奠定基础。主要包括以下方面:

·基于三层客户机/服务器体系结构,面向Web和客户端浏览器应用的空间数据仓库原型;

·基于Web的联机分析处理系统原型;

·空间数据联机集成挖掘工具原型。

空间数据的知识挖掘(Knowledge Mining)也叫数据挖掘(Data Mining)是数字地球科学的主要内容之一。空间数据的知识挖掘是指由已知的空间数据经过分析、对比或其他处理,产生新的空间数据或新的空间知识的过程。空间数据的知识挖掘是一种计算机分析方法,包括:空间数据深层挖掘、空间数据的关联分析、空间数据的聚集分析、空间数据的分类算法、空间数据的联机集成挖掘、知识模型、知识代理结构模型及智能技术等方法。由于这是一种全新的计算机的科学计算方法,尤其是与空间数据相结合,存在着许多不完善之处,尚待进一步研究。

空间联机分析处理(Spatial Online Analytical Processing, SOLAP)和空间数据挖掘(Spatial Data Mining, SDM)是网络条件下的分布式数据库的空间信息处理和知识开发领域的一个新的方向。由于空间数据量大、结构复杂、难于理解,如果能从大量的空间数据中,自动或半自动地提取所需信息,以容易理解的方式表达,将具有巨大的应用价值。尤其是多媒体空间数据的空间联机分布处理和数据挖掘,或知识开发,更为主要,而至今远未解决。

(1)空间数据的深层挖掘。某些空间数据除了它的显露的或明显的含义外,它还有丰富的隐含的意义,需要通过分析或挖掘才能显示。例如数字高程模型(DEM)属最常见的空间数据。它除了反映或荷载高度(程)状况的知识外,经过分析,它还具有或荷载了地质岩性与构造方面的知识。对于数字高程模型来说,它反映的高度状况是显露的知识,而它反映的地质岩性与构造等则是隐含的知识,需要经过挖掘才能认识。同样,以土壤或植物来说,它们的种类或类型是显露的知识,容易认识;但它们还反映了气候状况的知识,则需要通过挖掘才能获得。

(2)空间数据的关联分析。有些空间数据的隐含的知识需要通过关联分析后才能获得,即它不可能从单个类型通过挖掘而获得隐含的知识,而是需要通过若干个不同类型的物体的组合关系,经关联分析后才能获得隐含的知识。如在对遥感影像分析时,位于河边的建筑物可能是码头(河与建筑物相关联),位于山顶的建筑物可能是天文台(山顶与建筑物相关联)。又如铁路、公路一定有车站,道路过河一定有桥梁或渡船,学校一定有操场(至少多数学校有操场)等都是关联分析的知识挖掘。

(3)空间数据的聚类分析。它具有三层含义:第一,某些不同属性的空间数据之间差别不大,单类难识别,只有将它们放在一起,进行对比分析,才能将它们区别。如马尾松与油松,外形相似,只有将其对比后,才发现它们的针叶有长有短,虽然差别不大,但是有差别。第二,在遥感影像上判别一条河流是否发生了洪水,单凭一个时相影像难以确定,它需要通过与枯水期、平水期的影像进行对比分析,叠加比较才能获得。第三,就是一般图像处理中,或模式识别中的聚类分析的含义。

(4)空间数据的分类算法。在遥感影像的模式识别或自动分类中,都介绍了详细的算法,包括:最小距离分类、相似分类、线性判别分析、最大自然比分类、比较识别分类及集群分析等算法,都可以认为是知识挖掘方法。

(5)空间数据的联机集成挖掘。在WebGIS,ComGIS环境与OpenGIS规范的支持下,对分布式的数据库与信息系统进行集成挖掘。一种是WebGIS,ComGIS正常运行过程中的知识挖掘,另一种为了进行空间数据的知识挖掘而进行的,特地从分布数据库或信息系统中进行提取所需的数据进行关联分析,聚集分析和各种分类算法,以达到知识挖掘的目的。

(6)空间数据的知识挖掘的智能代理。在空间数据的知识挖掘过程中,一般要用以下的方式:①知识模型。大多数的空间数据的知识挖掘具有知识模型的特征。如空间数据DEM的数据挖掘,需要有关知识建立DEM知识挖掘的模型,主要是概念模型或物理模型,如 DEM与岩性的关系、与构造的关系、与地貌的关系、与气候的关系,以及与土地利用的关系模型等。②知识代理结构模型。③智能技术。

    加载更多内容...
  • 关键词:空间数据理论研究仓库模型数据挖掘
  • 上一篇:数字地球无级比例尺数据管理技术
  • 下一篇:地学空间数据引擎和联机分析技术
  • 猜你喜欢()