空间数据挖掘技术在地质灾害预警预报的应用.doc

上传人:来看看 文档编号:3625882 上传时间:2019-09-18 格式:DOC 页数:7 大小:124KB
返回 下载 相关 举报
空间数据挖掘技术在地质灾害预警预报的应用.doc_第1页
第1页 / 共7页
空间数据挖掘技术在地质灾害预警预报的应用.doc_第2页
第2页 / 共7页
空间数据挖掘技术在地质灾害预警预报的应用.doc_第3页
第3页 / 共7页
空间数据挖掘技术在地质灾害预警预报的应用.doc_第4页
第4页 / 共7页
空间数据挖掘技术在地质灾害预警预报的应用.doc_第5页
第5页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《空间数据挖掘技术在地质灾害预警预报的应用.doc》由会员分享,可在线阅读,更多相关《空间数据挖掘技术在地质灾害预警预报的应用.doc(7页珍藏版)》请在三一文库上搜索。

1、精品论文大全空间数据挖掘技术在地质灾害预警预报的应用孙志东,丛威青北京大学地球与空间科学学院地质信息系统实验室(100871) Email: 摘 要:本文简要论述了空间数据挖掘技术的理论方法,基于 GIS 强大的数据处理、可视化 表达和空间分析等功能,利用空间数据挖掘技术对 GIS 平台进行了扩展,并应用于 地质灾害的预警预报系统建设中,提高了地理信息系统的智能性,取得了较好的效果。关键词:空间数据挖掘,地理信息系统,地质灾害,预警预报1 引言我国是世界上地质灾害最严重的国家之一,地质灾害的发生,具有区域空间上的规律性 和时间上的突发性特点。据中国地质环境监测院不完全统计,19952003 年

2、,滑坡、崩塌、 泥石流、岩溶地面塌陷等突发性地质灾害,共造成10499 人死亡和失踪、65356 人受伤、575 亿元财产损失,平均每年死亡和失踪1167 人,财产损失64 亿元1。因此,我国对地质灾害 预警预报的研究十分重视。近30年来,地质灾害的研究已经从单个灾害体的现象描述、分类 及治理发展到以定性和定量描述为基础的定量预测预报阶段,同时伴随软硬件技术的飞速发 展,一方面,3S技术被广泛应用于空间信息的采集和生产处理,我国许多单位经过多年的 建设,积累了大量勘察、测绘和统计数据,导致了有关地质灾害的空间和属性数据爆炸性增 长;另一方面,却出现了空间知识的贫乏,比如,尽管人们知道某些地质灾

3、害发生与地形、 地质构造、降水等存在关联,但面对大量的数据,还是无能为力,即缺少从海量数据中发现 和获取知识的机制,因此迫切需要发展和利用空间数据知识发现技术,提高人们对地质灾害 发生机理的认识。空间数据挖掘技术作为当前数据库技术最活跃的分支与知识获取手段,而GIS是分析、 处理空间数据最强大的工具,将空间数据挖掘应用到GIS,提高GIS的专业分析和决策能力, 将推动着GIS朝智能化的方向发展,成为从海量空间数据中提取知识的重要方法。本文结合 地质灾害评价预警决策支持系统的建立,将空间数据挖掘技术应用到地质灾害的预警预报 中,通过实时收集和快速处理空间数据对区域危险性进行评估,辅助人们进行科学

4、决策,从 而减少滑坡、泥石流等主要地质灾害所带来的经济损失和人员伤亡。2 空间数据挖掘技术2.1 基本概念空间数据挖掘(Spatial Data Mining,简称SDM),又称空间数据挖掘和知识发现,是7为了解决空间数据海量特性而扩展的一个新的数据挖掘研究分支,是指从空间数据库中提取隐含的、用户感兴趣的空间或非空间的模式和普遍特征的过程2。这一学科起源于国际GIS 会议。1994年,我国学者李德仁院士在加拿大渥太华举行的GIS 国际学术会议上提出了从 GIS 数据库中发现知识的概念,并系统分析了空间知识发现的特点和方法。空间数据挖掘的对象主要是空间数据库,而空间数据库中不仅存储了空间事物或对

5、象的 几何位置、形状数据、属性数据之外,而且还包含了空间事物或对象之间的空间拓扑关联关 系;不仅存在大量历史数据信息,而且还有实时数据获取方式的支持,因此其处理方法有不 同于一般的数据挖掘方法。空间数据挖掘的过程大致可分为以下多个步骤,即数据准备、数据选择、数据预处理、 数据缩减或者数据变换、确定数据挖掘目标、确定知识发现算法、数据挖掘、模式解释、知 识评价等步骤3。它与传统的地学数据分析方法的本质区别在于空间数据挖掘是在没有明确 假设的前提下去挖掘信息、发现知识,挖掘出的知识应具有事先未知、有效和实用3个特征。2.2 空间数据挖掘的主要方法目前,常用的空间数据挖掘方法包括:基于概率论的方法、

6、空间分析方法、统计分析方 法、归纳学习方法、空间关联规则方法、聚类分析方法、神经网络方法、决策树方法、粗集 理论、基于模糊集合论的方法、空间特征和趋势探测方法、基于云理论的方法、基于证据理 论的方法、遗传算法、数据可视化方法、计算几何方法、空间在线数据挖掘等等4。3 地质灾害预警预报在“三峡工程库区滑坡灾害预警系统”和“鞍山市泥石流地质灾害预警预报”项目中,我们 基于GIS平台进行系统的研发,结合滑坡和泥石流地质灾害发生的本质特征,引入了层次分 析、人工神经网络、Logistic回归、统计量等空间数据挖掘方法,并形成了多关联复合评价 模型,建立起基于GIS的滑坡、泥石流灾害危险性区划预警预报系

7、统。3.1 层次分析法层次分析法(Analytical Hierarchy Process,简称AHP)是美国运筹学家T.L.Saaty教授于 二十世纪七十年代提出的一种实用的多方案或多目标的决策方法。它能把复杂系统的决策思 维进行层次化,把决策过程中定性和定量因素有机结合起来。运用AHP法进行决策时,需要 经历以下步骤5:1、建立系统的递阶层次结构;2、构造两两比较判断矩阵;3、针对某一 个标准,计算各备选元素的权重;4、计算当前一层元素关于总目标的排序权重。5、进行一 致性检验。层次分析法把定性和定量方法结合起来,能处理许多用传统的最优化技术无法着手的实 际问题,应用范围很广,同时,这种方

8、法使得决策者与决策分析者能够相互沟通,决策者甚 至可以直接应用它,这就增加了决策的有效性5。同时,如果所选的要素不合理,其含义混淆不清,或要素间的关系不正确,都会降低AHP法的结果质量,甚至导致AHP决策失败。在构造判断矩阵时,由于决策者很难掌握标度的标准,因此往往做出的判断不能满足一致性检验。这会导致计算收敛较慢,迭代次数较多, 从而增加了计算量。系统采用了判断平均特性修正矩阵的方法对判断矩阵进行一致性改进, 采用该方法可以有效地改善矩阵的一致性,从而提高了排序权向量的稳定性。3.2 人工神经网络人工神经网络(Artificial Neural Network,简称ANNs)也简称为神经网络

9、(NNs)或称 作连接模型(Connectionist Model),是对人脑或自然神经网络(Natural Neural Network) 若干基本特性的抽象和模拟,即通过大量神经元构成的网络来实现自适应非线性动态系统, 它具有如下主要特点6:1)可以充分逼近任意复杂的非线性关系;2)所有定量或定性的信息 都等势分布贮存于网络内的各神经元,故有很强的鲁棒性和容错性;3)采用并行分布处理方 法,使得快速进行大量运算成为可能;4)可学习和自适应不知道或不确定的系统;5)能够同 时处理定量、定性知识。系统采用了三层有指导学习模型,学习规则采用反推学习规则(BP算法)。同时,人 工神经网络对输入层和

10、输出层有着严格的要求,而在地质灾害评价中输出层(危险性等级) 很难和实际数据(灾害是否发生)一致,使得在地质灾害中应用人工神经网络技术的难点集 中在训练样本的选择上,针对这一点,系统采用反演权值方法加以解决。系统选用的数据是 灾害“发生”和“不发生”两种情况的训练数据,在经过训练后,通过内部数学方法的反演,得 到因子变量的均一化权值,再进行计算。这样,既保证了数据的客观性,又保证了结果的可 信度。3.3 Logistic 回归模型Logistic 回归模型(Logistic regression model)是针对二分类或多分类响应变量建立的 回归模型,其自变量可为定性或定量数据。当有多个自变

11、量时,其对应的Logistic 的回归模 型为:其中,事件发生即研究对象的反应结果为1时的概率为,事件不发生的概率为1-。与自变量之间的回归关系式,即为Logistic回归模型7。 对于地质灾害而言,各因子数据可以作为自变量,而灾害的发生的概率可以作为因变量。由于不是连续变量,线性回归将不适用于推导此类自变量和因变量之间的关系。这种 情况下,通常采用对数线性模型(Log-linear Model),而Logistic回归模型就是对数线性模 型的一种特殊形式,因此可以很好的应用于灾害预测中的区域危险性等级分类。3.4 统计量统计量法是一种二元统计模型,其思想来源于信息量模型,通过该方法能发现每一

12、个评 价因子与地质灾害之间的一一对应关系,并且能指导影响因子的选择和因子区段的划分。公式为:mFk = i I kii=1式中: Fk 单元 k 地质灾害危险性区划值; i 利用相关性分析获得的因子i 的相关性 系数; I ki 单元 k 因子i 出现区段的敏感性数值; m 评价因子总数。统计量法,也是对原始数据进行检查对比的一种方法。通过考察经由不同因子计算得到的图层,可以非常直观的观察到数据处理的情况,包括数据的可信度、区间划分的合理性等 信息,从而利于提前发现问题,并及时做出调整。统计量法将地质灾害每个影响因子的信息 以”白箱”的形式展现出来,明确了各个因子在灾害发生中所起作用的大小。3

13、.5 复合模型为了充分吸收现有各种评价模型的长处,同时避免其缺陷,系统形成了复合关联评价模 型,即在评价中既可以选择各种方法进行单一评价,又可以采用多方法进行综合分析。比如 神经网络和统计量方法结合,既可以发挥神经网络的自适应学习机制,同时避免了神经网络 方法的“黑箱”性,帮助人们理解神经网络的学习和决策过程。4 空间数据挖掘流程4.1 数据准备首先要获得研究区的空间和属性数据,针对不同的挖掘方法,对多源数据进行不同的过 滤筛选,有些数据还需要进行标准化、均一化等处理,从而避免无关因子和错误数据的干扰; 接着,需要对评价区域单元进行空间划分,将属性数据和空间数据进行相应映射,从而完成 数据的准

14、备。3.1.1 评价单元划分根据不同的精度要求,需要将研究区的空间矢量数据划分为不同的专题因子图层,对每 个评价因子图层,进行规则或不规则单元划分,从而将整个评价区域分成数量众多的单元, 然后对每一个单元按不同评价因子分别赋予相应的专题属性值。单元的划分方法包括网格单元、地域单元、均一条件单元、子流域单元以及斜坡单元, 其中除第一种单元外,其他均可以理解成不规则单元划分。目前最为实用的是规则和不规则 单元划分并行使用的方案。由于滑坡体的长宽比较小,可采用规则网格单元进行划分。而泥 石流发生区大多较为狭长,采用基于流域的不规则单元进行分析评价效果更好。3.1.2 单元属性数据处理由于属性和空间数

15、据是基于图层概念进行组织的,诱发因子自变量可能保存在多个图层 中,并且一个图层中可能包含有多个因子,这需要用户对其进行指定。而且某些因子的数值 只有基于单元面积才能计算得到,如沟谷密度等。并且,由于在划分单元的过程中,难免存 在属性不均一的情况,所以需要将单元中各因子值进行均一化。均一化的方法有平均值法、 面积最优法、重心法、面积加权平均法等。实践证明面积加权平均法效果较好。此外,还需 要对网格中是否发生过滑坡、泥石流灾害进行统计,对没有按照分级标准进行分级的数据进 行分级处理等。4.2 挖掘模式选择经过多次探讨和调研,系统最终采用了空间数据挖掘中的基于决策树的层次分析法,基 于统计的Logi

16、stic回归和统计量法以及人工神经网络方法应用于灾害预测。图1是在三峡滑坡 灾害危险性评价各种方法的效果对比图。横轴代表最终的危险性等级,等级越高,说明区域 越危险,更容易发生滑坡等单体或者多体地质灾害。纵轴代表采用不同方法时,预测出的各 等级灾害点所占百分比。45层次分析法40Logistic回归35人工神经网络 统计量302520151050123454.3 后期处理图 1 三峡滑坡灾害危险性评价各方法效果对比通过计算后,针对计算结果需要进行危险性分级,传统方法是人为给定分段阈值,这种方法存在着较大的主观因素,本系统采用面积比例的方法对危险区进行划分。系统中利用GIS功能实现了等值线追踪模

17、块,得到的结果更加形象直观。如图2所示4.4 结果分析图 2 鞍山泥石流灾害危险性评价图(神经网络+统计量法)应用选定的各种空间数据挖掘方法,对三峡库区的滑坡灾害进行了危险性评价,最终得到下表的统计结果:表 1 各种数据挖掘方法在三峡滑坡灾害危险性评价中的结果区划 结果层次分析法Logistic 回归模型法人工神经网络法统计量法面积百灾害点百面积百灾害点百面积百灾害点百面积百灾害点百分比分比分比分比分比分比分比分比1 级15%4%16%3%15%3%15%1%2 级28%22%28%17%29%15%28%7%3 级35%37%34%32%35%39%35%29%4 级17%24%17%31%

18、17%30%16%36%5 级5%12%5%17%5%13%5%26%从表1中可以看出,层次分析法以专家经验为主的方法效果略差,Logistic回归模型、神经网络模型的结果比较接近,统计量法效果最好,在四五级高危险区中落入了63%的灾害点, 一二级低危险区中仅有8%的灾害点。根据泥石流灾害的特点,鞍山市泥石流灾害危险性区划采用流域单元,运用了Logistic 回归模型和神经网络模型进行分析,各种方法计算得到的各危险区面积也较为接近。其中, 四、五级高危险区约占全区面积20%,而其中发生的泥石流灾害数占全区总灾害数的55%。 其中,统计量法的效果要优于其他模型,这与在三峡库区的实验结果是一致的。

19、5 小结地理信息系统、数据挖掘、统计学、人工智能等相关领域科学研究的发展,使空间数据挖掘技术在广度和深度上必将不断深入,帮助人们获取海量空间数据中所隐藏的知识和规则,从而直接服务于人类的生活,促进灾害预测等与人类密切相关领域的发展,提高人们科 学、准确认识事物的能力。6 致谢特别感谢丛威青师兄在地质灾害预警预报专业知识方面的无私指导,其学识渊博,作风 严谨都是我学习的榜样。参考文献:1 王哲,易发成我国地质灾害区划及其研究现状J 中国矿业,2006(15):47-502 邸凯昌空间数据挖掘和知识发现的理论与方法D武汉:武汉测绘科技大学,1999. 3 毛国君、段立娟、王实数据挖掘原理与算法M

20、北京:清华大学出版社,2003.4 安德智空间数据挖掘技术J 河北理工学院学报,2006(28):50-555 XU Jianhua. Mathematical Methods in Contemporary GeologyM. Beijing: Higher Education Press,2002:37250(in Chinese).6 SARO Lee, JOO-HYUNG Ryu, MOUNG-JIN Lee, et al. Use of an artificial neural network for analysis of the susceptibility to landsli

21、des at Boun, KoreaJ. Environmental Geology, 2003, 44:820-833.7 王济川,郭志刚. Logistic回归模型方法与应用M. 北京:高等教育出版社,2001.8 SHI Zhong-zhi. Neural ComputingM. Beijing: Publishing House of Electronics Industry, 1993:55102(inChinese).Using Spatial Data Mining In The Predication And EarlyWarning Of Geological Hazards

22、Sun Zhidong,Cong WeiqingGSIS Lab, School of Earth and Spatial Science, Peking University, Beijing, PRC, 100871AbstractThis paper briefly discusses the theory of spatial data mining technology, using spatial data mining technology in Geography Information System, which has powerful data processing, V

23、isual expression and spatial analysis functions, a Geological hazards predication system is built. Some results show that the spatial data mining technology is useful, which extend the intelligence of GIS.Keywords: Spatial data mining, geographic information systems, geological hazards, predication作者简介:孙志东:男。1982 年生。硕士研究生。主要研究方向是空间数据库,3D GIS。 丛威青:男。1980 年生。博士研究生。主要研究方向是地理信息系统、应用地质。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1