冠心病月就诊人数的预测模型_数学建模竞赛论文.doc

上传人:小小飞 文档编号:3912936 上传时间:2019-10-10 格式:DOC 页数:29 大小:426.02KB
返回 下载 相关 举报
冠心病月就诊人数的预测模型_数学建模竞赛论文.doc_第1页
第1页 / 共29页
冠心病月就诊人数的预测模型_数学建模竞赛论文.doc_第2页
第2页 / 共29页
冠心病月就诊人数的预测模型_数学建模竞赛论文.doc_第3页
第3页 / 共29页
冠心病月就诊人数的预测模型_数学建模竞赛论文.doc_第4页
第4页 / 共29页
冠心病月就诊人数的预测模型_数学建模竞赛论文.doc_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《冠心病月就诊人数的预测模型_数学建模竞赛论文.doc》由会员分享,可在线阅读,更多相关《冠心病月就诊人数的预测模型_数学建模竞赛论文.doc(29页珍藏版)》请在三一文库上搜索。

1、冠心病月就诊人数的预测模型摘要:冠心病已成为对人类危害最大的疾病之一,与人类的生命安全息息相关。本文首先对数据进行分析、统计,建立person相关性模型,得到冠心病与环境因素之间的关系,其次通过主成分分析对八种环境因素进行降维,再通过对两个主成分进行多项式回归,建立冠心病预测模型。对于问题一,由于冠心病的产生与环境的影响存在着紧密的联系,故我们运用相关分析法,分析各环境因素与就诊人数,以及各环境因素之间的正负相关性,同时利用相关分析得到的主要因素与月就诊人数画出近8年的变化情况折线图,得出冠心病的就诊人数呈现一定的周期变化,在第1、12月份最多,并且逐年呈递增趋势。其次通过对原始数据进行处理,

2、得到每年的就诊人数和20022010这8年各环境因素的月平均数的折线图。通过图表分析得到各个环境因素随月份增加的变化都是同周期的,但平均气压与平均湿度、平均温度的步调相反,与月就诊人数步调一致。而线性相关性表格如下:平均气压最高气压最低气压平均湿度最低湿度平均温度最高温度最低温度就诊数.054.058.049-.154-.140-.150-.167-.158从该表可以看出月就诊数主要受大气的平均气压,平均湿度和最高温度的影响,其相关性系数分别为0.054,-0.154,-0.167(在0.01水平双侧上显著相关),即月就诊人数与平均气压成正相关,与平均湿度和最高温度成负相关,即高气压,低湿度,

3、低温度情况下月就诊数越高。 对于问题二,由于八种环境因素可以进行降维简化处理,且检验和检验的取样足够度的 Kaiser-Meyer-Olkin 度量为0.687,而小于0.05。故可以用主成分因子分析法进行处理。对应数据分析可得:数据可以由两个主成分进行分析。这两个主成分子对总方差的贡献率分别为67.919%和24.315%,得到主成分模型为:然后用Matlab进行多项式回归,得到预测模型为:根据以上结论,查阅相关资料,对卫生行政部门和医疗机构提出具体的预警和干预的建议方案。我们指出,受低温和高压的影响,冠心病病例数会出现上升态势,所以应对相应的气候变化做好预警。关键词:相关分析 主成分分析

4、多项式回归 预测 一问题重述冠心病是目前威胁人类生命的严重疾病之一,这种疾病的诱发已经被证实与环境因素,包括温度和气压之间存在密切的关系。对冠心病中的发病环境因素进行分析,其目的是为了对冠心病就诊人数的进行预测,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。数据(见MWQS.xls)来源于南昌市某医院2002年至2010年间共96个月的冠心病发病病例信息以及相应期间当地的气象资料。请你们根据题目提供的数据,回答以下问题:1根据数据基本信息,对月就诊人数及环境因素进行统计描述。2研究冠心病月就诊人数与环境因素间的关系

5、,建立冠心病月就诊人数的预测模型。3结合1、2中所得结论,对卫生行政部门和医疗机构提出预警和干预的建议方案。二问题分析本问题是针对南昌的月冠心病就诊人数,通过对平均气压、最高气压、最低气压、平均湿度、最低湿度、平均温度、最高温度、最低温度这8个与其相关的环境因素进行研究,探究疾病发病率的规律,对冠心病就诊人数进行预测,以提出最优解决方案。对于问题一,要求我们根据基本信息,对就诊人数及环境因素进行统计描述。由于对冠心病起影响作用的因素涉及到诸多方面,因此一方面我们对基本信息进行相关分析,分析各环境因素与就诊人数,以及各环境因素之间的正负相关性,得到不同因素对就诊人数的影响情况以及各因素之间的相关

6、情况,并利用相关分析得到的主要因素与月就诊人数画出近8年的变化情况,直观的对规律进行描述。另一方面通过对原始数据进行处理,得到每年的就诊人数和8年每月平均最高气压、最低气压、平均气压、平均湿度、最低湿度、平均温度、最高温度以及最低温度。利用图表分析20022010这8年的病例数以及各环境因素随月份变化的趋势,通过分析对就诊人数及环境因素进行统计描述。对于问题二,需要确定冠心病月就诊人数与环境因素间的关系,得出它们的函数关系式,建立冠心病月就诊人数的预测模型。现实中,各个环境因素相互影响,八种环境因素通过检验和检验,(KMO检验统计量是用于比较变量间简单相关系数和偏相关系数的指标。主要应用于多元

7、统计的因子分析,而 用于检验相关阵是否为单位阵,即检验各个变量是否各自独立。)可以用主成分因子分析法进行降维处理。通过得到的因子再进行多项式回归,得到环境因素与冠心病月就诊人数间的函数关系,利用函数关系式对月就诊人数进行预测。 对于问题三,要求我们对问题一、二所得结果进行整理分析,对未来冠心病的发病人数进行预测并提出有效的预警及干预方案。我们查阅相关资料,根据前面得到的结果和建立的模型,对卫生行政部门和医疗机构提出具体的预警和干预建议。三符号说明与假设3.1符号说明: 符号说明环境影响因素,分别表示为“平均气压”“最高气压”“最低气压”“平均湿度”“最低湿度”“平均温度”“最高温度”“最低温度

8、”主成分,置信度月就诊数3.2符号假设:(1)假设仅考虑给出的环境因素对冠心病月就诊人数的关系,其他因素忽略不计;(2)假设环境不会发生灾害性突变;(3)假设不存在重复就医的情况。四模型建立与求解4.1问题一 由于原始数据具有很强的直观性与研究价值,且就诊人数与八种环境因素具有很强的关联性,故探究就诊人数必先从原始数据入手4.1.1基于原始数据统计描述 通过对原始数据进行处理,得到每年的就诊人数和20022010这8年的每月平均最高气压、最低气压、平均气压、平均湿度、最低湿度、平均温度、最高温度以及最低温度,数据统计得到以下图表:图2 冠心病年就诊人数柱状图由图2可得8年间冠心病就诊人数逐年增

9、加,前五年上升趋势缓慢,2006至2007年间涨幅剧增,后又趋于平缓。图3 月平均病例数折线图 图4 气压变化折线图图5 湿度变化折线图图6 温度变化折线图由上图可得病例数在一年中的1月、11月、12月明显高于其他月份;气压变化随着月份呈现U形,两头气压较高;湿度随时间变化不明显,两端略低于中间部分;温度随着月份波动变化,两端也略低于中间,即高气压,低湿度,低温度情况下月就诊人数较高。可见就诊人数与八种环境具有较强的相关性,为了验证这个结论,我们建立了相关性模型,用spss中的person相关性表格来进一步探究各因素对月就诊人数的影响。4.1.1 基于相关分析法统计描述 相关分析法在计算因素间

10、的相关关系方面有较大的可靠性,同时由于它是对因素间阵列的比较,较好地解决了数据初值化改变原有联系的问题。所以我们用数理统计中的相关性理论描述月病例数与环境因素之间的相关程度。为了找到月就诊数和各个环境因素之间的相关关系,先求出月就诊数与各个环境因素的相关系数。相关分析法的计算公式为:其中x和y分别表示两个样本数列的平均值。计算结果表示两要素之间相关程度的统计指标,其值介于-1,1,大于0时正相关,小于0时负相关。的绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。 Person相关系数()又叫相关系数或线性相关系数。它一般用字母r表示。它是由两个变量的样本取值得到,这是一

11、个描述线性相关强度的量,取值于-1和1之间。当两个变量有很强的线性相关时,相关系数接近于1(正相关)或-1(负相关),而当两个变量不那么线性相关时,相关系数就接近0。表1 病例数与各环境因素的相关分析person相关性平均气压最高气压最低气压平均湿度最低湿度平均温度最高温度最低温度就诊数平均气压1.999*.998*-.283*-.138-.913*-.778*-.782*.054最高气压.999*1.995*-.271*-.131-.923*-.783*-.788*.058最低气压.998*.995*1-.294*-.144-.897*-.771*-.774*.049平均湿度-.283*-.

12、271*-.294*1.943*.106.077.096-.154最低湿度-.138-.131-.144.943*1-.020-.034.001-.140平均温度-.913*-.923*-.897*.106-.0201.852*.850*-.150最高温度-.778*-.783*-.771*.077-.034.852*1.994*-.167最低温度-.782*-.788*-.774*.096.001.850*.994*1-.158就诊数.054.058.049-.154-.140-.150-.167-.1581*. 在 .01 水平(双侧)上显著相关。由person相关性表格可以看出,气压因素

13、与就诊数相关系数分别为0.054、0.058、0.049呈现正相关性,湿度因素和温度因素与就诊数呈现负相关性,其中湿度因素与就诊数的相关系数为-0.154、-0.140,而温度因素与就诊数的相关系数为-0.0150、-0.167、-0.158,即气压越高,湿度和温度越低对就诊数的影响越大。并且由上表可知平均气压、最高气压、最低气压之间具有很强的相关性,平均湿度与最低湿度也具有很强的相关性,平均温度与最高温度、最低温度之间具有较高的相关性。因此,可以选取平均气压、最低湿度和最高气温作为影响月病例数的主要环境因素。对于这三种环境因素:平均气压、最低湿度和最高气温,利用原始数据得到就诊人数与其的关系

14、得到如下图形:图1 月病例数与主要环境因素变化情况散点图由相关分析所得的主要环境因素作图,分析图1可得平均气压,平均湿度,最高气温,就诊数都呈现周期性变化,且四者大致是同周期的。但平均气压与平均湿度,平均温度的步调相反,与就诊数步调一致,即高气压,低湿度,低温度情况下月就诊数越高。综合图形以及线性相关性表格可以得出:1. 由于环境等因素影响,月就诊人数逐年上升。2. 平均气压,平均湿度,最高气温呈现一定的周期变化,且对于平均气压, 第1、12月份高,中间月份低,而温度在1、12月份低,湿度呈波动变化, 气压因素与就诊数相关系数分别为0.054、呈现正相关性,湿度因素和温 度因素与就诊数呈现负相

15、关性,分别为-0.154,-0.167。4.2问题二 对于该问题,由于八种环境因素较多,故我们首先通过主成分分析法对这八种因素进行降维处理,用得到的两种新成分数据取代原有的八种环境因素数据,再对其进行多项式回归,建立冠心病月就诊人数的预测模型。4.2.1主成分分析主成分分析是根据软件中的降维分析因子分析主成分分析得到多个新的成分的一种多元统计分析方法。它是设法将原来众多具有一定相关性的指标,重新组合成一组新的互相无关的综合指标来代替原来的指标,是研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。对题目中

16、给出的8种环境因素数据进行检验和检验,我们得到如下表:表2 检验和检验和的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.687Bartlett 的球形度检验近似卡方2358.592df28Sig.000一般的度量值大于0.5,的值小于0.05时使用主成分分析法可以得到比较好的数据和结果。依照本题数据,值为0.687,值小于0.05,两项数据都在正常范围内。因而,本题可以用主成分分析法对影响冠心病就诊人数的8个环境因素进行分析。对数据进行主成分分析,得到解释的总方差的图表如下:表3 解释的总方差解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %

17、15.43467.91967.9195.43467.91967.91921.94524.31592.2341.94524.31592.2343.4795.98698.2204.0901.12899.3485.046.57399.9216.004.05599.9777.002.023100.00083.765E-5.000100.000提取方法:主成份分析。通过表3,我们知道这些数据主要由两个主成分。这两个主成分子对总方差的贡献率分别为67.919%和24.315%,累计贡献率达到92.234%,从而我们可以以92.234%的精度将变量的有效维数从8维降至2维,因此可以将前2个因子作为主成分。另

18、外,对两个主成分的意义进行解释。表4给出了原变量与第一、第二主成分的相关系数:表4 成分矩阵成份矩阵a成份12平均气压-.970-.034最高气压-.973-.022最低气压-.965-.044平均湿度.272.949最低湿度.137.972平均温度.949-.157最高温度.898-.202最低温度.902-.175 提取方法 :主成分分析法。 a. 已提取了 2 个成份。图7 成分图通过图表,可以分析出第一主成分,与原变量(平均气压)、(最高气压)、(最低气压)(平均温度)、(最高温度)、(最低温度)的相关系数的绝对值都超过了0.897,因此它是一个反映气温和气压的综合因子,我们称之为气压

19、温度因子。 第二主成分,与原变量(平均湿度)的相关系数为0.949、(最低湿度)的相关系数为0.972,其余的都不超过0.202,因此它是一个反映相对湿度的因子,称为湿度因子。 为确定主成分函数表达式模型,成分得分系数矩阵如下所示:表5 成分得分系数矩阵成份得分系数矩阵成份12平均气压-.179-.017最高气压-.179-.011最低气压-.178-.023平均湿度.050.488最低湿度.025.500平均温度.175-.081最高温度.165-.104最低温度.166-.090提取方法 :主成分分析法。 构成得分。设两个主成分分别为,则建立模型为:4.2.2 因子拟合,模型求解由主成分分

20、析得到两个主成分,多次拟合,建立如下模型:模型求解:直接利用Matlab统计工具箱中的命令regress求解,使用格式为其中输入y为模型中的数据,x为对应于回归系数的数据矩阵,alpha为置信水平(alpha=0.05)。将其数据代入模型计算得到如下统计回归模型:,其中,为月就诊数,为两个主成分,表示第一成分,表示第二个成分。五模型检验与分析 在检验主成分模型中,我们可以获得协方差矩阵,见表6:表6 成分得分协方差矩阵成份得分协方差矩阵成份1211.000.0002.0001.000提取方法 :主成分分析法。 构成得分。 从图看出,主成分得分的协方差矩阵为单位矩阵,说明提取的2个主成分是互不相

21、关的.满足假设的条件,模型和结果有效。 表7 模型二计算结果参数参数估计值参数估计区间 46.514032.7534 60.2745 18.96667.8616 30.0717 =0.6118 F=42.0383 p0.0001 =6961.0 从表中分析=0.6118,即因变量(病例数)的61.18%可由模型确定,F值远远超过F检验的临界值,p远小于,因而模型整体上是有用的。 根据已有资料以及预测模型可得出冠心病患者与温度影响程度呈显著负相关,冠心病的发生率在冬季较高,此时温度处于全年最低。其次气压的变化也对冠心病起着一定的影响作用,气压高,冠心病的发病率较高,同时,季节变化也影响着冠心病的

22、月就诊人数,在季节交替的月份,由于气温变化对心脏的影响以及人们生活季节性的改变等因素,冠心病的发生率也往往呈现较高的趋势。六模型评价与推广6.1 优点1.本文对第一问进行相关分析并且利用数据统计分析得出最终结论,提高了准确性;2. 采用主成分分析法将八个变量转变为两个新综合变量,大大降低了统计的强度,简便了计算。3. 利用matlab进行了多次数据拟合,减小误差。6.2 缺点1. 数据量较少,题目中只给出八年数据,不具有很强的代表性。2. 题目只给出环境因素,而冠心病的产生与多种复杂的因素都有关联,故得到的模型只适用与环境有关的病种数的预测。 6.3 模型推广 该模型根据八种环境与冠心病人数的

23、关系,建立相关的预测模型,可用于其他病种人数的预测,比方艾滋病与环境因素的预测,禽流感与环境因素的预测等,并可根据预测模型控制冠心病的发生,提前做好干预工作。 7、 预警与干预7.1预警 随着社会的发展和人们生活水平的提高, 冠心病已成为对人类危害最大的疾病之一。大量流行病学研究表明, 冠心病的发生、发展与多种因素有关, 其中环境因素对冠心病的发生有着密切的关系。 结合所给数据,对其进行分析,我们得出冠心病患者与温度影响程度呈显著负相关,在温度较低的12月、1月,冠心病的发生率高于其他月份。其次气压的变化也对冠心病的产生起着较为显著的影响,气压高,冠心病的人数也随之增多。同时,季节变化也影响着

24、冠心病的月就诊人数,在季节交替的月份,由于气温变化对心脏的影响以及人们生活季节性的改变等因素,冠心病的发生率也往往呈现较高的趋势。综合以上因素,卫生行政部门和医疗机构要加强对冠心病的检查力度,尤其要加强对老年人的检查;并且由于近年来生态平衡遭破坏,气候越来越变化无常,不能排除极端天气的出现,有些地方甚至气候反常,所以面对这些突发的气候变化,卫生部门也要提醒市民做好防范措施。 根据所给资料,对其进行预测,我们发现冠心病患者逐年增加,且增加速率相对较快,依照现有情形,如果不加强干预,则若干年后很可能成为影响人类健康的几大杀手之一,所以卫生部门和医疗机构以及市民要对其产生警惕。7.2干预 虽然冠心病

25、患者呈增长趋势,但如果卫生部门和医疗机构对其做好干预工作,则其将得到一定的遏制,我们建议如下: 1.加强民众对冠心病的重视,组织冠心病防治宣传活动:卫生部门可以通过制作公益广告或请专门研究人员开设预防知识讲座,或者实施健康教育,普及民众对冠心病的认识和了解,加大宣传力度。 2.为了向广大基层医疗单位(包括城市区医院、社区和县医院等)推广规范化血脂干预技术,缩小临床指南与临床实践之间的差距,为广大冠心病患者造福,卫生部十年百项“冠心病血脂干预推广项目”启动。针对卫生部的项目,各地方部门积极做好相应,贯彻落实该项目。 3.卫生部门要严格做好一级预防和二级预防,对于没有冠心病的人群采取一级预防,控制

26、冠心病致病危险因素。比如高胆固醇饮食、高血压、糖尿病等都是非常重要的危险因素,应积极治疗,降血压、降血糖,将血压控制在标准范围内,延缓糖尿病的进程;严格戒烟;限制钠盐的摄入;对于已患有冠心病的人群,要做好二级预防,保证病情不复发,不向恶化进展。二级预防除包括一级预防的内容外,还要积极进行药物治疗,即使在病情稍有好转的情况下也不能擅自停药。 4.如果冠心病的人数达到不可控制的地步,医疗和卫生部门应加强对冠心病的治疗,并且应启动危机处理模式,对市民正确指导,消除其疑虑和恐惧。 5. 医疗机构应该加强对冠心病的研究,了解其新动向,研制出预防、治疗冠心病的更有效的技术方法。参考文献1姜启源,数学模型(

27、第四版),北京,高等教育出版社,2011;21004-3934( 2008)02-0217 -04,梁晓芳,环境因素对冠心病心脏事件的影响,心血管病学进展,卷期号:2008年第29卷第2期;31001-1986(2012)01-0020-04,杜志强,杨志远,吴 艳,刘钰辉,王相业,煤层含气量评价中灰色关联分析与相关分析法对比,煤田地质与勘探,卷期号:2012年第4卷1期;4冯国双,统计描述简介,中华护理杂志-医学统计学漫谈,卷期号:2011年 8 月第6卷第8期。附录附录1 8年月平均值月份序号平均气压最高气压最低气压病例数平均湿度最低湿度平均温度最高温度最低温度1月1020.141022.

28、7391017.545123.87570.4935153.365935.3294358.5751612.9650812月1016.0491018.8021013.01970.573.5103657.009648.61803612.390185.90753月1012.9821015.8231009.65368.62572.3687953.3271412.3808927.6009320.211654月1008.0761010.7091004.96272.62573.81553.0870818.4645822.932515.099175月1003.3061005.4611000.837474.041

29、953.6896423.4739916.506019.3289526月999.321000.954997.437970.575.3612556.8895826.3133330.0804223.412087月998.2026999.8222996.138588.7570.7491951.8835130.3365334.4914526.928678月999.5481001.236997.489390.62570.2743551.1778229.5628633.7564526.408799月1005.4851007.2031003.47674.62571.5683352.5191726.034583

30、0.2337523.0495810月1012.4651014.5731010.225102.7565.7713347.1387920.7607324.9848817.662911月1016.2531018.5881013.757118.62565.0246.3254214.2504218.3662511.277512月1021.1921023.7271018.58142.2566.5311349.005568.24133112.064235.467944附录2 根据已有8个环境因素数据,通过主成分分析得到的两个新成分的数据:病例数成分1(气压温度因子)成分2(湿度因子)11-1.45780.6

31、04117-0.875912.2258218-0.194851.39965160.066871.74775150.272291.2939171.174651.3535201.36621-0.42714171.305150.15474210.67952-0.413929-0.22951-0.7845735-0.712440.5426774-1.57985-0.9067178-1.512440.1826927-0.94547-0.9295527-0.25915-0.1929340.16114-0.14624250.252380.5732290.989760.90373281.24608-0.490

32、27261.311720.33249190.52971-0.1522322-0.44544-2.4286173-0.77392-0.6578567-1.27128-0.0234177-1.586721.1840232-1.356961.9743642-0.46387-0.2634750-0.01093-0.78327190.434111.5104201.238350.38091261.2394-0.8059211.10746-0.37592210.64979-0.3374533-0.36719-0.8730580-0.571790.5762491-1.76092-1.6656473-1.354

33、180.5398545-1.396471.6703324-0.13563-0.28484220.168250.39724290.130720.60563331.10341.28927271.465270.10517491.1505-0.98704210.36183-0.7679164-0.05053-0.4975177-0.62633-0.2134495-1.55433-0.8002878-1.719130.285781-0.74984-0.1764562-0.121270.2824940-0.19057-0.96511420.1983-0.6687431.103470.81798501.32

34、132-1.11835751.28174-0.41385890.588390.041100-0.26702-1.7836198-1.05051-2.3989490-1.161160.51141104-1.729120.67601122-1.577850.99909144-0.27129-1.63721040.06848-0.608951720.208650.40571730.92709-0.97771891.469760.944791991.18313-0.437691130.7386-0.13158197-0.069520.24786193-0.9831-0.36856240-1.31832

35、0.10689280-1.51808-1.74807110-0.48201-0.932541170.215821.557191900.472471.704941330.25328-0.579761281.49557-0.655621841.60736-0.401771621.50198-0.305931601.032290.079731780.38983-0.06815193-0.93406-2.37697223-1.42127-0.18835290-1.003561.68956130-0.45911.84841150.033630.255081250.142121.227451570.498130.866421211.195130.950341861.56993-0.404171761.36892-1.147941531.042860.66221990.00486-0.45982200-0.48387-1.18127258-1.313090.63826附录3 多项式回归程序Load a.txt;y=a(:,1);%病例数x1=a(:,2);%气压温度因子x2=a(:,3);%湿度因子x=x1.*x1,x2.*x2;b,bint,r,rint,stats=regress(y,x,alpha);29

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1