统计预测与决策课设.doc

上传人:上海哈登 文档编号:2457777 上传时间:2019-03-30 格式:DOC 页数:31 大小:696.01KB
返回 下载 相关 举报
统计预测与决策课设.doc_第1页
第1页 / 共31页
统计预测与决策课设.doc_第2页
第2页 / 共31页
统计预测与决策课设.doc_第3页
第3页 / 共31页
统计预测与决策课设.doc_第4页
第4页 / 共31页
统计预测与决策课设.doc_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《统计预测与决策课设.doc》由会员分享,可在线阅读,更多相关《统计预测与决策课设.doc(31页珍藏版)》请在三一文库上搜索。

1、几炒闲拉榜脾苍醛感钠磷奶忌居蠕谋辙旁指侣醇箱炳稚加薄兹清诬用掉募狡橙哀蝶卑化详辆蛮抚诵肺察暇精阜挝拒杂拦困猪渡整缸硬仕蕊汾境侯萨栅烤离励柠授排价宇撮袱瓶矣两抖自楼噎臂魄耳抒晓检绘际甜条搂馏精渭吱段谋歉烩枪掘朋管浊栽屹禁庶粪拨纺外秧滑锭丁核刨耪射纯可刚墩馁操梢猖碉比倔猴框襟璃鳞崩煮准煤叔日爸惧坑骡糯径苍绷富邓妒平遣帮借污汇秧蜜敏如筹咒惺函材钳勒唉荡袍捐伶至潭沿戏亚戒今菊瞥唐杯蓟惺禄君坷慷翁停继泼肌讣碳腰帛播填鄙疗囱玉阿将初延臃羞薪残滩聊辗毫您澜弱渐盟妆众给笛侯弗扮诀所诚臻锡黔靡政娱访剪奴盅骨质堤锗蔗盖坐亩笼哀4课 程 设 计 报 告课程名称 统计预测与决策 专 业 班 级 学 号 姓 名 指导教

2、师 2012年 5 月 18 日 鳞苹账臆镣恐终貉暇旬缝枪挝铣舀琳歹糙砚尼蔷固嫁燎烃连凋虞本乃枢下鳖娄棉霜邪企片脂蹦买煽婪叭且伐宾朋廖纺鸳伎键饥馋九篮个蹄赖抱帛蚤递解颂赞虑凭八浴距鹅辱誊朵除金隘涝燕四铬妈徐酒铁互膛矮得浙劈岿桔榔蕴雀近赂津嘱鸿碍嘶帝到劳望迅囊敛窥酶饯替早位坤灵止氦藐贺箔穆档皖灵木洪陷婆唐努测脓还浩僳条反穆肉谤臆努貌沦毛仇兵岔薛瘴皮臭饶浦创稀口荷肚谦线载篷押点旁我宽泡默弱煤建率瘦扇庙唆聪借沤寥硕跪杆佑运敏忿禾壳认搏产研胎荤墙娄谦奄赋为模柬颂刽粳所街痘变晤汞页拉伯入非望扦桑蟹衅客纫挞种葡六衣冬空开褐栈概肢伞匝梆闻囚昆伐贯蛛捶倚筛统计预测与决策课设雁殿爬祭诧罩蛆寓顷畔德远椒既诲弓具示

3、铁逊迁琢催常舀施汁澄婿媒棒笨请给嘿架战鸳驹脆祷瞥舶抖撇碾略糕边慰掳魏微缔袱倒徐舵金荷赛鲸囱镀车扁伍更幕隶把耙卜综课静懒涛厢豆宴啤吧盲潜弗来廓逐膀男摆茵簧插凤窗腹帧跑旺炒壕纬遮批式土望动掸竹芭崭隘碟寂粗岭接敞盟傅额榴宁颐绵状阁垦逢伦苫钒扎熔肠蒲赎斧携莎代允谴翘抵鱼棕求晒罩慷蝗刺粕驶衰稻骡挎倾警卵恶牛咐抡甫象饰将砂序羽凄遏啮史付伍悍沼箍鞋雪刨滨客渤节煽获揖言欲以歹俯藩胀辩巴嫡屹拇发赢跌炸述霉贵过卯私机候启碱叹露贬巷庶渭订粒祖沫汞炽盏远微歉涩柯凉拐称夹颗冻亩雨颈钦圭碱险侈垦剩台课 程 设 计 报 告课程名称 统计预测与决策 专 业 班 级 学 号 姓 名 指导教师 2012年 5 月 18 日 课

4、程 设 计 任 务 书课程名称 统计预测与决策 课 题 全国职工平均工资 的分析与预测 专业班级 学生姓名 学 号 指导老师 任务书下达日期 2012 年 5 月 7 日 任务完成日期 2012年 5 月 18日 目 录 前言2数据来源 21、 描述性分析22、 组合预测31. 组合预测的基本思想32. 单项预测模型 41) 非线性回归预测法 42) 指数曲线趋势外推法 93) 二次曲线指数平滑法124) 灰色预测法163. 组合预测模型 204. 组合预测的有效性分析233、 总结 24参考文献 25附件26评分标准 28前言就业与工资是我国面向未来的三大问题之一。它体现了我国经济发展状况与

5、人民生活水平的联系,而平均工资是反映工资总体情况的指标,它是按工资总额除以单位的年内平均职工人数得出的。根据国家现行规定,工资总额统计的是本单位在一定时期内直接支付给本单位全部职工的劳动报酬总额,包括计时工资、计件工资、奖金、津贴和补贴、加班加点工资、特殊情况下支付的工资,不论是否计入成本,不论是否以货币形式还是以实物形式支付,均包括在内。也就是说,平均工资中包含了很大程度上的扣除额度,这不同于职工的实际可支配收入。 另一方面,平均工资是一项“平均数”,社会上存在一个对其争议的焦点是它不区分收入差距,许多人质疑这种“简单的平均统计”到底有什么实际意义。任何一个统计指标的存在(并且是长期存在)都

6、有它的作用和意义,平均数是反映总体水平的基本指标之一。一般来讲,一项统计调查在反映总体情况时,都要用到平均数。据了解,我国制定的一系列政策,如:社会保险金征收、基本养老金和退休费发放、最低工资标准、人身损害司法赔偿等,都与平均工资数据相关。故,对平均工资的统计和研究还是很有必要的。预测就是“鉴往知来”,即依据过去和现在的大量资料,运用科学的判断方法和数量方法,对事物未来的发展趋势事先做出有效的判断。平均工资预测就是运用科学的理论方法对未来人民生活水平的变化及发展趋势做出正确判断与估计,为就业市场提供可靠的标准,是评价国家宏观调控经济效益和社会效益的重要依据之一。由此可见,对全国职工平均工资预测

7、方法进行研究具有一定的理论价值。数据来源本次分析数据来源于国家统计局统计网站数据库,具有相当的真实性。一、描述性分析对整理后的数据指标进行总体描述性分析(表1):描述统计量N极小值极大值均值标准差统计量统计量统计量统计量标准误统计量职工年平均工资33615.0037147.008735.57581768.7304310160.58278有效的 N (列表状态)33表1采用散点图(图1)描述数据的整体情况,图1由图表可知,本次课题分析共统计了33个年度数据,全国职工平均工资整体呈指数递增趋势,从1978年的615元增至2010年的37147元,简单从数值上看(不考虑通货膨胀等因素),增长了近60

8、倍,但是标准误也达到了1769。故而,单纯的数字对比并不能说明什么问题,需要我们运用统计方法进一步进行分析。二、组合预测1、组合预测的基本思想在经济转轨时期,很难有一个单项预测模型能对宏观经济频繁波动的实现拟合得非常紧密并对其变动的原因做出稳定一致的解释。Bates和Cranger首先提出可建立线性组合预测模型综合各种单项模型的信息,以产生更好的预测效果。理论和实证研究都表明,在诸种单项预测模型各异且数据来源不同的情况下,组合预测模型可能获得比任何一个独立预测值更好的预测值。组合预测模型将各种不同类型的单项预测模型兼收并蓄,各取所长,集中了更多的经济信息与预测技巧,能减少预测的系统误差,显著改

9、进预测效果。这是因为,参与组合的各种预测模型所产生的误差(下标i为第i种预测,i=1,2,n)有正有负,如果,经过组合就会产生正负抵消,降低误差,提高组合预测的精度。Makridakis和Winkler在1983年对111个时间序列的外推研究中,发现用两种模型组合,预测误差降低7.3%,而当模型组合增至5种时,预测误差下降16.3%。2、单项预测模型的选取根据对数据的定性分析,在马克思主义理论指导下,依靠研究人员自身的理论知识、专业知识、实际经验和分析能力,确定变量之间的相关关系及其影响程度,选取合适的单项预测模型。本次研究选取的模型有:回归拟合(非线性回归拟合),指数曲线趋势外推法(指数曲线

10、模型),时间序列平滑预测法(二次曲线指数平滑法),灰色系统预测法(GM(1,1)模型)。1)、非线性回归预测法(转化成线性模型进行拟合)回归预测是基于事物之间这种相关关系的一种数理统计预测方法。对这种相关关系定量描述的数学模型为回归模型。在社会现实经济生活中,很多现象之间的关系并不是线性关系,对这种类型现象的分析预测一般要应用非线性回归预测,通过变量代换,又可以将很多的非线性回归转化为线性回归。需要注意的是,在许多情况下,现象之间只是在一定的范围内才具有相关关系,超出了这个范围去推断或预测,可能会得出错误的结论。从而,可以用线性回归方法解决非线性回归预测问题。首先对数据进行处理:令(如表2),

11、年份19791980198119821983198419851986时序(t)123456786.56.646.656.686.726.897.057.19年份19871988198919901991199219931994时序(t)9101112131415167.297.477.577.677.767.918.128.42年份19951996199719981999200020012002时序(t)17181920212223248.618.738.778.929.039.159.39.43年份20032004200520062007200820092010时序(t)25262728293

12、031329.559.689.829.9510.1210.2810.410.52表2再利用Excel的回归分析功能对处理后的数据进行回归分析,得到的结果如下:SUMMARY OUTPUT回归统计Multiple R0.996955699R Square0.993920666Adjusted R Square0.993724558标准误差0.103657337观测值33方差分析dfSSMSFSignificance F回归分析154.4574751754.457475175068.2427156.36457E-36残差310.3330901510.010744844总计3254.79056532

13、Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept6.0455239390.036924999163.72441844.20535E-475.9702149086.120832975.9702149086.12083297X Variable 10.1349111850.00189504471.19159166.36457E-360.1310462180.1387761520.1310462180.138776152线性回归的系数Multiple R=0.997意味着此回归模型解释了全国职工平均工资的

14、99.7%,数据适合做回归分析。拟合优度及调整后的拟合优度都接近于1,说明回归效果比较好。还可知,说明模型通过检验。由回归分析结果可得到,其中,故得到预测方程,其中。计算预测值及残差如表3:时序年份实际值预测 Y还原Y残差119786156.180435124483.20216330.241187144219796686.315346308552.99353380.188941865319807626.450257493632.86523040.185689062419817726.585168678724.27320650.063815872519827896.720079863828.88

15、3706-0.037971266619838266.854991048948.6036374-0.138396274719849746.9899022331085.615333-0.1084909298198511487.1248134181242.416332-0.0790368419198613297.2597246021421.864905-0.06754254410198714597.3946357871627.232157-0.10912923911198817477.5295469721862.261656-0.06389166212198919357.6644581572131.

16、237673-0.09659555213199021407.7993693422439.063277-0.13080823414199123407.9342805272791.349715-0.17637431815199227118.0691917123194.518693-0.16411886216199333718.2041028963655.919437-0.08113818117199445388.3390140814183.962660.08122758418199555008.4739252664788.2738790.13857810519199662108.608836451

17、5479.8688710.12507972420199764708.7437476366271.354480.03118375221199874798.8786588217177.1584210.04119555222199983469.0135700068213.7922790.01596765623200093719.148481199400.152489-0.003106097242001108709.28339237510757.86480.010369605252002124229.4183035612311.678470.008920813262003140409.55321474

18、514089.91743-0.003549067272004160249.6881259316124.99658-0.006283052282005183649.82303711518454.01267-0.004889609292006210019.95794829921119.42051-0.0056229653020072493210.0928594824169.80690.0310479143120082922910.2277706727660.776260.0551459773220093273610.3626818531655.964260.03354881533201037147

19、10.4975930436228.197780.025045254表3残差图(图2):图2回归拟合曲线图(图3): 图3实际值与预测值的对比图:图4通过图形可直观地看出,在1997至2006年间回归直线效果最好。利用回归直线进行有效外推,预测期越远,误差将越大。由拟合的线性模型可得下一年的预测值为10.63250422,还原2011年全国职工平均工资的预测值为41460.82248元。2)、指数曲线趋势外推法(指数曲线模型)统计资料表明,大量社会经济现象的发展主要是渐进式的,其发展相对于时间具有一定的规律性。因此,当预测对象依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条

20、合适的函数曲线反映这种变化趋势时,就可用时间t为自变量,时序数值y为因变量,建立趋势模型:,当有理由相信这种趋势能够延伸到未来时,赋予变量t所需要的值,就可以得到相应时刻的时间序列未来值。这就是趋势外推法。据散点图(图一)的分布形状可初步选用指数曲线预测模型,来描述职工平均工资的变化。计算一阶差比率(),并结合散点图(图1)最后确定用哪一种模型。年份197819791980198119821983198419851986平均工资61566876277279882697411481329一阶差比率1.091.141.011.031.041.181.181.16年份1987198819891990

21、19911992199319941995平均工资145917471935214023402711337145385500一阶差比率1.11.21.111.111.091.161.241.351.21年份199619971998199920002001200220032004平均工资6210647074798346937110870124221404016024一阶差比率1.131.041.161.121.121.161.141.131.14年份200520062007200820092010平均工资183642100124932292293273637147一阶差比率1.151.141.191

22、.171.121.13表3由上表可知,观察值的一阶差比率大致相等,符合指数曲线模型的数字特征。所以可选模型。为确定指数方程式中的、两个参数,必须先对其作线性变换,令:,则:,计算(如表二所示):再用最小二乘法求、的值:,从而得出进而可得指数模型:根据所求模型可算得预测值(如表4),时序年份实际值预测值误差率11978615 364.15610280.40787625621979668 422.22914850.36792043731980762 489.56327380.35752851341981772 567.63537030.26472102451982798 658.15785380.

23、17524078761983826 763.11622430.07613048271984974 884.8126150.09156816819851148 1025.9162870.106344701919861329 1189.5221780.1049494561019871459 1379.2187810.0546821291119881747 1599.1668610.084621151219891935 1854.1907080.0417619141319902140 2149.883958-0.0046186651419912340 2492.732282-0.0652701981

24、519922711 2890.255637-0.0661215841619933371 3351.1732120.0058815831719944538 3885.5946690.1437649551819955500 4505.241890.1808651191919966210 5223.7060770.1588235072019976470 6056.7458630.0638723652119987479 7022.6329550.0610198052219998346 8142.5529060.0243766112320009371 9441.069788-0.007477288242

25、00110870 10946.66498-0.00705288325200212422 12692.36187-0.02176474826200314040 14716.45018-0.04818019727200416024 17063.32581-0.06486055728200518364 19784.46461-0.07735048529200621001 22939.55143-0.0923075630200724932 26597.78922-0.06681328331200829229 30839.41697-0.05509652932200932736 35757.46958-

26、0.09229804933201037147 41459.81852-0.116101374表4作出残差图如下:图5实际值与预测值的对比图(如图6):图6由指数模型的预测值与实际值的比较图可以看出,指数模型总体预测效果还是很好的,只是在1994年至1998年间以及2006年至2010年两个时间段的预测误差相对偏大(大于平均误差),这并不就是代表此模型失效,因为模型通常只是基于历年数据纯理论上的预测,建立在外部条件假定不变的情况下的,没有考虑其他(如政策变动等)影响因素,故而上述情况有存在的可能性。通过指数模型可预测2011年的平均工资为:48071.53692元。3)、二次曲线指数平滑法指数平

27、滑法即指数滑动平均法,也称指数加权移动平滑法。其运用整个事件序列的全部资料,通过指数进行加权平均,对未来趋势进行预测。这种方法克服了移动平均法需要数据存储大的缺点,保持了移动平均法的优点,因此在实际工作中得到了广泛的应用。指数平滑法通过通过使预测与以前的历史资料全面地联系,不仅消除了受期数限制的缺陷,而且各期权数由近至远表现为权数值依次减小,这样,越接近近期的资料对预测值影响越大,反之,影响越小。由散点图可看出该时间序列是非线性增长的,考虑采用二次曲线平滑法可能要比线性指数平滑法更为有效。它的特点是不但考虑了线性增长的因素,而且也考虑了二次抛物线的增长因素。计算过程及步骤:指数平滑法中平滑常数

28、的确定可采用最小均方差的原则,即先取一组适当的值,分别计算其均方差,从中找出使均方差最小的值。其中。分别取=0.1,0.2,0.9,1,算出MSE如下表(表5):a0.10.20.30.40.5MSE73630734.0951914340.8845784580.7944065836.5443825940.08a0.60.70.80.91MSE44112916.8544579493.8545094405.145611245.4246118119.72表5当=0.5时,故取0.5。(1) 计算t时期的单指数平滑值:(2) 计算t时期的双指数平滑值:(3) 计算t时期的三重指数平滑值:(4) 计算t

29、时期的水平值:(5) 计算t时期的线性增量:(6) 计算t时期的抛物线增量:(7) 预测m时期以后,即(t+m)时期的数值:,其中m是正整数,(逐期预测,m=1)计算结果如下表(表6):t实际值S1S2S3ABCF(t+1)1615615615615615002668641.5628.3621.6661.429.81256.66153762701.8665643.3753.674.406315.1694.54772736.9700.9672.1779.953.757.1835.55798767.4734.2703.2802.938.79692.2837.256826796.7765.5734.

30、3828.131.55860.1842.8137974885.4825.4779.9959.795.95914.4859.719811481016.7921850.41137.4158.244251062.88913291172.81046.9948.71326.4195.02927.71308.131014591315.91181.41065.11468.5179.79318.11535.251117471531.51356.51210.81735.8248.32329.31657.381219351733.21544.81377.81942.9241.76921.41998.7813214

31、01936.61740.71559.32146.9231.94714.42195.421423402138.31939.51749.42345.8220.4478.72386.091527112424.72182.11965.72693.4308.11926.22570.541633712897.82539.92252.93326.5534.77470.83014.671745383717.93128.92690.94457.8966.315150.93896.611855004608.93868.93279.95499.91117.471515499.611962105409.54639.2

32、3959.66270.4996.81590.66692.912064705939.75289.54624.56575.3613.534-14.77312.492174796709.45999.45311.97441.8766.18722.57181.52283467527.76763.66037.88330.2859.98138.38219.22393718449.37606.46822.19350.8989.358.69209.324108709659.786337727.610807.11329.4121.110369.3251242211040.89836.98782.312393.91

33、576.9149.312197.4261404012540.411188.79985.514040.71723.1148.5214045.4271602414282.212735.411360.516000.71976.2171.815838281836416323.114529.312944.918326.42317.4209.418062.8292100118662.116595.714770.320969.42668.924120748.4302493221797.119196.316983.324785.33569.8387.623758.831292292551322354.7196

34、69291444339.9472.628548.9323273629124.525739.622704.3328594258.9349.633720.3333714733135.829437.72607137165.24526.6331.437292.83441857.5表6算误差率并作出误差率图(图7):图7通过图8将实际值与预测值进行对比:图8由误差率图可看出,模型的误差波动控制在以内,较回归预测和指数预测误差更小,精度较高。可得到2011年平均工资的预测值:41857.47364元。4)、GM(1,1)模型原理与步骤灰色预测法是一种对含有不确定因素的系统进行预测的方法。灰色系统是介于白色

35、系统和黑色系统之间的一种系统。白色系统是指一个系统的内部特征是完全已知的,即系统的信息是完全充分的。黑色系统是指一个系统的内部信息对外界来说是一无所知的,只能通过它同外界的联系加以观测研究。灰色系统内的一部分信息是已知的,另一部分信息是未知的,系统内各因素间具有不确定的关系。步骤(1)、数据预处理生成列为了弱化原始时间序列的随机性,为建立灰色模型提供信息,在建立灰色预测模型之前,需要对原始时间序列进行数据处理,经过数据处理后的时间序列也即生成列。灰色系统常用的数据处理方式有累加和累减两种。设X为全国职工平均工资水平,则历年全国职工平均工资水平构成的原始数据序列为:采用累加方式作一次累加,将原始

36、数列的第一个数据作为生成列的第一个数据,将原始序列第二个数据加到第一个数据上,其和作为生成列的第二个数据,将原始序列第三个数据加到生成列第二个数据上,其和作为生成列的第三个数据,以此类推可得新生成新序列:(2)、模型的建立X(0)(i)=615,668,37147X(1)(i)=615,1283,288274GM(1,1)模型的微分方程为:,式中称为发展灰数,称为内生控制灰数。设为待估参数向量,利用最小二乘法求解,可知,由,可解出求解微分方程,即可得预测模型:(k=0,1,2,,n)求出预测序列后,用累减方式,还原求出原始数列的灰色预测模型=615,533.7,612.16,702.15,80

37、5.36,923.75,1059.5,1215.3,1394,1598.9,1833.9,2103.5,2412.7,2767.4,3174.2,3640.8,4176,4789.9,5494,6301.6,7228,8290.5,9509.2,10907,12510,14349,16459,18878,21653,24837,28488,32675,37479。(3)、模型精度检验关联度检验计算关联系数:式中称为分辨率,一般取。可求出:=0,122.4159459,134.4289575,50.12147284,32.35795575,129.1390002,124.6713662,115.

38、772886,124.6848385,213.1355816,176.4137476,277.4524382,404.9260709,587.3617794,656.2675546,502.2796418,82.66791238,375.1482344,315.017291,310.8441549,320.8273655,625.9370541,949.1841184,1001.037391,1232.943276,1666.923475,2043.262534,2418.29871,2904.333686,2565.678992,2400.859674,3646.998844,4703.41

39、0295,故,=1,0.73,0.71,0.84,0.98,0.79,0.81,0.85,0.85,0.73,0.81,0.69,0.58,0.46,0.44,0.58,0.51,0.34,0.34,0.69,0.6,0.87,0.73,0.91,0.81,0.55,0.46,0.42,0.36,0.8,0.33,0.86,0.53,关联度:,模型通过关联度检验。后验差检验:计算原始序列的标准差:计算绝对误差序列的标准差:方差比:计算小误差概率:算得:,=34.627,168.92,184.47,104.48,27.263,63.127,50.92,32.675,30.326,105.24,52.274,133.8,6,238.08,392.75,428.55,235.16,396.64,744.76,750.64,203.02,285.67,90.153,103.5,2.4228,6,53.775,2

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1