两种模型在广州市空气污染指数研究中的应用.doc

上传人:吴起龙 文档编号:1593539 上传时间:2018-12-26 格式:DOC 页数:8 大小:17.67KB
返回 下载 相关 举报
两种模型在广州市空气污染指数研究中的应用.doc_第1页
第1页 / 共8页
两种模型在广州市空气污染指数研究中的应用.doc_第2页
第2页 / 共8页
两种模型在广州市空气污染指数研究中的应用.doc_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《两种模型在广州市空气污染指数研究中的应用.doc》由会员分享,可在线阅读,更多相关《两种模型在广州市空气污染指数研究中的应用.doc(8页珍藏版)》请在三一文库上搜索。

1、两种模型在广州市空气污染指数研究中的应用空气对人们的身体健康起着直接的作用,而空气环境质量间接影响着人们的生活质量。空气环境质量通常采用空气污染指数(Air Pollution Index,简称“API”)这一指标对空气质量进行评估。空气污染预报是在未来的空气质量状况不明确的情况下对其作出的预测,正如天气预报一样。很早之前,其他国家已经开展了空气污染预报工作,比如加拿大、美国、英国等。 近几年,国内外的许多学者对此作了很多学术研究并取得一定的预报效果。比如Boznar M等在1993年提出利用人工神经网络方法对绍什塔尼最大热电厂周围的污染物SO2浓度进行预测;荷兰的Var Der Wal利用主

2、成分分析法与时间序列分析法对PM10的浓度变化进行预测;王宁等通过分析API与各种气象因子之间的关系,找出影响总悬浮颗粒物扩散的因子并给予相应的权值,于是得出相应的判定准则对空气质量等级进行预报;董亚龙等通过对铜川市区、新区的3种污染物进行CAPPS模式预报,得出不同污染物的预测准确率存在较大的区别,不同季节的预测准确率也各不相同。其中,PM10SO2NO2。 然而在此之前,这种方法还没有被提出并应用于大气污染预报。在过去大气污染预测领域的应用中,往往选取大气污染物的浓度作为预测因子进行预测。鉴于大气污染物存在一定的不可预测性,本文不同于之前的大气污染预测主要表现为:针对目前天气预报的精确度越

3、来越高这一特点,尝试选取气象因子作为API的预测,并且建立逐步回归分析和BP神经网络两种预测模型。通过对这两种模型的预报效果进行分析比较,寻找一种有效的预报方法。 1 相关理论 1.1 逐步回归分析 逐步回归的主要工作是根据全部自变量中按其对y的显著程度来提取变量,剔除对因变量显著程度小的变量,剩余的逐 步引入回归方程,其目的是建立“最优”回归方程。逐步回归分析的实施过程由以下步骤完成:计算每一步引入的变量的偏回归平方和。取使得偏回归平方和最小的变量并对其进行显著性检验。如果在预先设定的水平下显著相关,则不剔除该变量,当然回归方程的其他变量也会被保留下来;反之,则需要把该变量剔除。需要按照偏回

4、归平方和从小到大依次检验回归方程的其他变量。总之,被保留的都是显著的。要分别对第2步和第3步中未被引入到回归方程的变量计算偏回归平方和,选取使得其最大的变量并对其再次进行显著性检验。在第2步设定的水平下,如果不显著,则不剔除该变量,而是将它引入回归方程。循环第2,3,4步,直至既不产生新变量,又无变量被剔除则结束。 1.2 BP神经网络 神经网络(Neural Network)一般也被称为人工神经网络(Artificial Neural Network,ANN),是科学家们从生物学和信息处理的角度出发,通过借助数学和物理的方法对人脑神经网络进行抽象后建立的简化模型。在此之前,他们不仅在对人脑的

5、结构、组成和基本工作单元方面取得了深刻的认识,还对生物的神经元、神经系统等研究方面也有了突破性的进展。BP神经网络的算法流程为:初始化网络权重,设定误差函数、计算精度值及最大学习次数;向前传播输入(前馈型网络);反向误差传播;网络权重与神经元偏置调整;判断结束。算法结束的条件是学习次数大于设定值或者误差满足预设精度。如果条件不成立,则进入下一轮学习。 2 广州市空气质量特征分析 本文综合运用了生态环境学、大气污染学、数学、统计学等学科原理,重点分析了广州20082012年这4年逐日的API值的资料以及同期的气象因子监测资料。以空气污染指数为数据基础,初步分析了广州的环境空气质量及空气污染特征;

6、同时利用API数据以及同期的气象因子数据资料进行相关性分析,确定影响API的气象因子。 2.1 广州市空气质量统计分析 选取广州市20092011年API值及相应的空气质量等级数据进行基本的统计分析。图1为广州市各月份良好天数分布。 由图1知,1月到5月份处于增长状态,5月到10月处于基本的稳定状态,到11,12月份出现明显降低的情况。 图2为广州市分季节污染天数分布。由图2可知,20092011年广州市夏季的污染天数最少,证明该地区夏季的空气质量较优,冬季的空气质量明显较差。不同的季节气候导致不同的空气质量,为了更好地对广州市空气污染指数进行预报,在第4部分将对广州市分季节建立预报模型。 2

7、.2 气象因子的相关性分析 上述已经对广州市2008-04-012012-03-31的空气质量分季节进行了统计分析,发现不同季节的空气质量有很大的差别。本文收集了广州市4年的气象数据,共有17个气象因子。表1为广州市各气象因子符号及意义。 虽然17个气象因子代表不同的信息,但是并不是所有的气象因子都对API值的预测有意义。反而如果将不起作用的因子拿来预测API,会影响预报准确率。于是为了更好地预测API值,本节针对气象特点,采用软件SPSS对API值与各气象因子进行相关性分析,寻找API与各气象因子的联系。在这里,通过计算Pearson相关系数和Spearman秩相关系数来描述API与各个气象

8、因子的线性相关程度。表2为广州市四季与API显著相关的气象因子。 3 逐步回归和BP神经网络模型预报API 本部分采用逐步回归分析方法和BP神经网络对API值进行分季节预报。考虑到篇幅,下面只对夏季分别建立两种模型及检验。其他三个季节的模型建立与夏季一样。 3.1 数据的准备及预处理 建立模型的数据库包括2008-04-012012-03-31广州市17个气象因子值和API值,分春、夏、秋、冬季节建立4个数据集。将空值和缺失值删除后,广州市春、夏、秋、冬四季样本个数分别为360,354,356,361,其中,测试样本春季60个,夏季54个,秋季56个,冬季61个,其余作为训练样本。另外,为了将

9、气象因子数据去掉量纲的影响,把17个气象因子数据归一化。 3.2 逐步回归模型的建立及检验 3.2.1 逐步回归模型的建立 本部分利用SPSS软件对广州市的17个气象因子和API值进行逐步回归分析,得出广州市春、夏、秋、冬四季相关性较大的气象因子。其中,与夏季相关的因子有7个,分别是x1,x6,x8,x9,x10,x11,x14. 对夏季的数据建立多元回归模型如下: 最后,为了比较实际值与预测值之间的精确误差,采用两种评价指标,即平均绝对百分比误差( )和均方百分比误差( )以及预报准确率。 其中,平均绝对百分比误差为: 均方百分比误差为: API值预报的准确率为: 式(4)中:yi和 分别为

10、实际值和预测值;n为测试样本的个数。 3.2.2 夏季逐步回归模型预报结果分析 图3和图4分别为夏季API拟合曲线和夏季API预测误差曲线。 由表3可以看出,逐步回归预报夏季API值的准确率高达85%以上,由于夏季的测试样本API值波动小,逐步回归预报对平稳数据的预测较好。 3.3 BP神经网络模型的建立及检验 3.3.1 神经网络的设计 BP神经网络是否能有效、便捷地逼近非线性函数,关键由网络的结构、初始值的选取以及网络参数3部分决定。由于初始值包括初始权值和初始阈值,它们的选取都是随机的,不能控制。所以在使用BP神经网络时,只有调整网络结构,确定网络参数,才能提高训练精度。表4为预测API

11、神经网络结构。 本文采用传统的BP神经网络方法预测广州市四季的API值,将广州市1 200 d的气象数据作为网络的输入数据导入。同时进行了误差检验,用Matlab软件绘制了预测值与实际值的拟合曲线和误差曲线。预测结果如图5和图6所示。 由图5和图6可以看出,对夏季54个样本数据的BP网络预测值与API实际值的拟合度很高,大体趋势拟合较准确,只有个别样本的预测值与实际值的误差较大。该季节预测样本数据的实际API值极差较小,这是BP模型效果较好的一个原因。预测值与实际值的误差在-10,10之间不断波动,波动较小。 从定量的角度去分析与预测模型的准确率如表5所示。 由表5可以直观地看出,夏季模型预报准确率达到88%左右,平均绝对百分比误差低于13%,均方百分比误差也在3%以下,预报效果较好。由第3部分相关性分析中可以发现夏季的特征因子有7个,而且与API的相关性都较强,BP网络模型效果佳。 4 结论 本文采用逐步回归分析和BP神经网络对广州市夏季的API值进行预测的结果都比较理想,MAPEA的值控制在12%左右,MSPE的值控制在3%以下,预报的正确率较高。但总体来说,与逐步回归分析预测API值对比,神经网络的效果明显比较好。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1