回归分析大作业-北航.doc

上传人:doc321 文档编号:12944882 上传时间:2021-12-08 格式:DOC 页数:16 大小:305KB
返回 下载 相关 举报
回归分析大作业-北航.doc_第1页
第1页 / 共16页
回归分析大作业-北航.doc_第2页
第2页 / 共16页
回归分析大作业-北航.doc_第3页
第3页 / 共16页
回归分析大作业-北航.doc_第4页
第4页 / 共16页
回归分析大作业-北航.doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《回归分析大作业-北航.doc》由会员分享,可在线阅读,更多相关《回归分析大作业-北航.doc(16页珍藏版)》请在三一文库上搜索。

1、应用数理统计第一次课程论文学号: 姓名: 2012年11月北京航空航天大学应用数理统计论文 摘要 摘要农业是我国国民经济的基础,对我国的经济和社会发展至关重要。本论文以1978-2010年间我国农业总产值及相关指标的数据为依据,采用多元线性回归分析的方法对农业总产值的可能影响因素进行了分析,并通过逐步回归建立了较为理想的线性回归模型。关键词: 农业总产值;播种面积;农机总动力;有效灌溉面积;化肥施用总量;受灾面积;从业人数II北京航空航天大学应用数理统计论文 Abstract Abstract:Agriculture is the foundation of our national econ

2、omy, which is vital to the development of our economy and society. This research analyzes the possible factor influencing gross agricultural output value using Multiple linear regression method, and acquire an relatively ideal linear regression model by stepwise regression.Key words: gross agricultu

3、ral output value; sown area; Total power of agricultural machinery; effective irrigation area; amount of chemical fertilizer; affected area; number of employees.III北京航空航天大学应用数理统计论文 目录目录摘要IAbstract:II第1章 引言1第2章 数据的采集与整理3第3章 数据处理及结果分析43.1 数据处理43.2 结果分析5(1)逐步回归过程分析:5(2) 异方差分析:7(3) 多重共线性分析:8第4章 模型分析与讨论9

4、第5章 建议10参考文献11北京航空航天大学应用数理统计论文 第1章 引言 第1章 引言中国是一个农业大国,总耕地面积142439万亩,约占世界的7%,居世界第四位。农业基础的稳固对中国经济的高速发展起着十分重要的作用。因此探索制约农业发展的关键因素并以此为基础提出促进农业发展的有效方法成为了当前农业研究领域。本研究选取的指标解释如下:(1)农业总产值(单位:亿元)农业总产值是一个国家或地区农业生产的总规模和总水平的反映,在此我们以其作为模型分析的因变量来研究不同自变量对它的影响。(2)农作物总播种面积(单位:千公顷)农作物总播种面积是指实际播种或移植有农作物的总面积,显然它与农业总产值具有一

5、定相关性,在此作为一个自变量。(3)农用机械总动力(单位:万千瓦)农用机械总动力指用于农业生产的各种动力机械的动力总和。包括耕作机械、收获机械、排灌机械、植物保护机械等,对农业产量有一定影响。(4)有效灌溉面积(单位:千公顷)有效灌溉面积指具有一定的水源,地块比较平整,灌溉工程或设备已经配套,在一般年景下,当年能够进行正常灌溉的耕地面积。在一般情况下,有效灌溉面积应等于灌溉工程或设备已经配备、能够进行正常灌溉的水田和水浇地面积之和。它是反映我国耕地抗旱能力的一个重要指标。(5)化肥施用总量(单位:万吨)化肥施用总量指本年内实际用于农业生产的化肥数量,包括氮肥、磷肥、钾肥和复合肥,是直接影响农业

6、产量的一个重要指标。(6)受灾面积(单位:千公顷)受灾面积是指由于自然灾害影响而使农作物产量减少一成的地区的总面积。显然其对农业总产值有一定影响。(7)从业人数(单位:万人)从业人数是指从事农业生产的人口总数,是农业生产规模的度量。11北京航空航天大学应用数理统计论文 第2章 数据的采集与整理 第2章 数据的采集与整理通过查阅中国统计年鉴2011,获得了1978至2010年间农业统计的相关数据。以农业总产值为因变量,农作物总播种面积、农用机械总动力、有效灌溉面积、化肥施用总量、受灾面积及从业人数等六个因素为自变量,将所得数据整理见表2-1,具体符号说明见表2-2表2-1 各年份相关数据年份农业

7、总产值/亿元农作物总播种面积/千公顷农用机械总动力/万千瓦有效灌溉面积/千公顷化肥施用总量/万吨受灾面积/千公顷从业人数/万人19781117.515010411749.944965884508072831819801454.114638014745.744888.11269.4500252912219852506.414362620912.544035.91775.8443653113019904954.314836228707.747403.12590.3384743891419915146.414958629388.647822.12805.15547239098199255881490

8、0730308.448590.12930.2513323869919936605.114774131816.648727.93151.9488273768019949169.214824133802.548759.13317.95504636628199511884.614987936118.149281.23593.74582435530199613539.815238138546.950381.43827.94699134820199713852.515396942015.651238.53980.75342734840199814241.915570645207.752295.64083

9、.75014535177199914106.215637348996.153158.44124.34998035768200013873.615630052573.653820.34146.45468836043200114462.815570855172.154249.44253.85221536399200214931.515463657929.954354.94339.44694636640200314870.115241560386.554014.24411.65450636204200418138.415355364027.954478.44636.63710634830200519

10、613.415548868397.855029.34766.23881833442200621522.315214972522.155750.54927.74109131941200724658.115346476589.656518.35107.84899230731200828044.215626682190.458471.752393999029923200930777.515861487496.159261.45404.44721428890201036941.116067592780.560347.75561.73742627931表2-2 符号说明变量符号y农业总产值/亿元x1农作

11、物总播种面积/千公顷x2农用机械总动力/万千瓦x3有效灌溉面积/千公顷x4化肥使用总量/万吨x5受灾面积/千公顷x6从业人数/万人北京航空航天大学应用数理统计论文 第3章 数据处理及结果分析 第3章 数据处理及结果分析3.1 数据处理将原始数据输入到统计分析软件IBM SPSS Statistics 20中进行逐步回归分析,所得结果列于表3-1至3-3。表3-2 方差分析表模型平方和df均方FSig.1回归1880183252.21011880183252.210365.255.000b残差113246845.623225147583.892总计1993430097.833232回归19070

12、72167.3222953536083.661231.875.000c残差86357930.511214112282.405总计1993430097.833233回归1937326296.1453645775432.048230.207.000d残差56103801.688202805190.084总计1993430097.833234回归1929158302.1332964579151.067315.164.000e残差64271795.700213060561.700总计1993430097.83323a. 因变量: yb. 预测变量: (常量), x2c. 预测变量: (常量), x2,

13、 x6d. 预测变量: (常量), x2, x6, x4e. 预测变量: (常量), x6, x4表3-1 模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.971a.943.9412268.829.943365.255122.0002.978b.957.9532027.876.0136.539121.0183.986c.972.9681674.870.01510.785120.0044.984d.968.9651749.446-.0042.912120.103a. 预测变量: (常量), x2b. 预测变量: (常量), x2, x

14、6c. 预测变量: (常量), x2, x6, x4d. 预测变量: (常量), x6, x4e. 因变量: y表3-3 系数模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)-5222.1661119.176-4.666.000x2.395.021.97119.112.0001.0001.0002(常量)6848.6334825.3551.419.170x2.378.020.92919.194.000.8811.135x6-.329.129-.124-2.557.018.8811.1353(常量)16339.2184922.8733.319.003x2.13

15、1.077.3221.706.103.03925.353x6-.732.162-.275-4.509.000.3772.652x44.3251.317.5853.284.004.04422.5614(常量)21898.4233854.9735.681.000x6-.950.105-.357-9.080.000.9901.010x46.522.291.88222.410.000.9901.010a. 因变量: y由上述计算结果可以得出,通过逐步分析获得的最优模型为:y=21898.423+6.522x4-0.95x6。最终模型的复相关系数R=0.984,决定系数R2=0.968,说明回归方程显著

16、。3.2 结果分析(1)逐步回归过程分析:此次逐步回归选定的标准为偏F统计量概率值(即各表中的sig.),当sig. 0.05时选入相应变量,当sig.0.1时剔除相应变量。SPSS给出的回归过程如下表。表3-4 输入移去的变量模型输入的变量移去的变量方法1x2.步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。2x6.3x4.4.x2a. 因变量: y表3-5 已排除的变量模型Beta IntSig.偏相关共线性统计量容差VIF最小容差1x1.126b1.476.155.307.3352.987.335x3.130b.4

17、45.661.097.03131.779.031x4-.023b-.140.890-.030.1049.653.104x5-.032b-.559.582-.121.8161.225.816x6-.124b-2.557.018-.487.8811.135.8812x1.139c1.877.075.387.3332.999.313x3.409c1.545.138.327.02836.214.026x4.585c3.284.004.592.04422.561.039x5-.002c-.042.967-.009.7721.295.7723x1.087d1.314.204.289.3083.246.03

18、9x3.170d.695.496.157.02441.303.021x5-.032d-.729.475-.165.7401.351.0364x1.089e1.282.215.275.3083.246.308x3.297e1.668.111.349.04522.396.045x5-.049e-1.135.270-.246.8001.250.800x2.322e1.706.103.356.03925.353.039a. 因变量: yb. 模型中的预测变量: (常量), x2c. 模型中的预测变量: (常量), x2, x6d. 模型中的预测变量: (常量), x2, x6, x4e. 模型中的预测

19、变量: (常量), x6, x4显然,由于x2与y高度相关,所以逐步回归的第一个模型将x2选入,随后根据偏F概率值的大小依次选入或剔除变量。(2) 异方差分析:SPSS输出的残差分析结果如下。由表3-6可知,标准化残差值基本在±3之间,说明数据稳定,无奇异值。由标准化残差直方图和P-P图可知,残差分布基本符合正态分布特征。表3-6 残差分析极小值极大值均值标准 偏差N预测值756.7131632.2914249.929158.40924残差-2165.1435308.709.0001671.65424标准 预测值-1.4731.898.0001.00024标准 残差-1.2383.0

20、35.000.95624a. 因变量: y图3.1 标准化残差直方图图3.2 标准化残差标准P-P图(3) 多重共线性分析:由表2-3中给出的VIF值可知,在逐步回归分析中建立的这四个模型中,第三个模型存在较为严重的多重共线性问题(VIF2=25.353,VIF4=22.561,均大于10).第四个模型在剔除了变量x2后,多重共线性问题消失。由此推测,第三个模型较第四个模型更为显著的现象(R3R4)可能是由于多重共线性导致的北京航空航天大学应用数理统计论文 第4章 模型分析与讨论 第4章 模型分析与讨论由模型分析结果可以得出:化肥施用总量(x4)和从业人数(x6)对农业总产值有显著影响,并且这

21、种影响可以通过线性方程较好地表达出来。其中,化肥施用总量(x4)系数的绝对值更大,说明其对农业总产值(y)的影响较从业人数(x6)更为明显。与此同时,对于未被纳入回归方程的诸多因素,由逐步回归分析过程可以看出:农作物播种总面积(x1)、有效灌溉面积(x3)及受灾面积(x5)对农业总产值(y)无显著影响,农用机械总动力(x2)对农业生产总值(y)的影响极为显著的,但由于与其它因素的相互作用而不能被纳入线性回归方程。北京航空航天大学应用数理统计论文 第5章 建议 第5章 建议由以上分析结果可知,我国农业的一个突出特点是显著依赖于化肥的使用。虽然施用化肥可以高效地提高产量,但其对环境的破坏和影响却是

22、长远和不可估量的。因此我国应继续优化农业增长结构,将农业增长方式向可持续发展转变。此外,农用机械总动力虽未被纳入线性回归模型,却仍是不可忽视的因素。而在我国,农业生产力水平仍然落后,农业机械应用严重滞后,极大地限制了我国农业的发展。随着世界科技水平的不断提高,农业对科技的依赖程度会持续上升,在农业发展道路上必须要注重科技创新与运用。北京航空航天大学应用数理统计论文 参考文献 参考文献1孙海燕,周梦,李卫国,冯伟. 应用数理统计M. 北京:北京航空航天大学数学系, 2012.2中华人民共和国国家统计局.2011中国统计年鉴M. 中国统计出版社,2011.3何晓群. 实用回归分析M. 高等教育出版社,2008.4卢纹岱. SPSS统计分析(第4版)M .电子工业出版社,2010.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1