应用回归分析实验二.pdf

上传人:tbuqq 文档编号:5467058 上传时间:2020-05-15 格式:PDF 页数:11 大小:140.34KB
返回 下载 相关 举报
应用回归分析实验二.pdf_第1页
第1页 / 共11页
应用回归分析实验二.pdf_第2页
第2页 / 共11页
应用回归分析实验二.pdf_第3页
第3页 / 共11页
应用回归分析实验二.pdf_第4页
第4页 / 共11页
应用回归分析实验二.pdf_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《应用回归分析实验二.pdf》由会员分享,可在线阅读,更多相关《应用回归分析实验二.pdf(11页珍藏版)》请在三一文库上搜索。

1、重 庆 交 通 大 学 学 生 实 验 报 告 实验课程名称应用回归分析I 开课实验室数学实验室 学院理学院年级09 专业班信息与计算科学2 班 学 生 姓 名学号 开 课 时 间2011 至2012 学年第1 学期 评分细则评分 报告表述的清晰程度和完整性(20 分) 程序设计的正确性( 40 分) 实验结果的分析( 30 分) 实验方法的创新性( 10 分) 总成绩 教师签名邹昌文 3.11 研究货运总量 y(万吨)与工业总产值 1 x(亿元) ,农业总产值 2 x (亿元) ,居民非商品支出 3 x(亿元)的关系,数据见表: (1)计算出 123 ,y xxx的相关系数矩阵。 (2)求

2、y 关于 123 ,x xx的三元线性回归方程。 (3)对所求得的的方程做拟合优度的检验 (4)对回归方程作显著性检验 (5)对每一个回归系数作显著性检验 (6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回 归方程再做回归方程的显著性检验和回归系数的显著性检验。 (7)求出每一个回归系数的置信水平为95% 的置信区间 (8)求标准化回归方程 (9)当 010203 75,42,3.1xxx时的 0 ? y ,给定置信水平为95% ,用 SPSS 软件计算精确置信区间,用手工计算近似预测区间 (10)结合回归方程对问题做出一些基本的分析 货运总量 y(万吨) 工业总产值 x1 亿元 农

3、业总产值 x1 亿元 居民非商品之处 x3(亿元) 16070351.0 26075402.4 21065402.0 26574423.0 24072381.2 22068451.5 27578424.0 16066362.0 27570443.2 25065423.0 实验过程: (1)计算出 123 ,y xxx的相关系数矩阵。 将其导入到 SPSS 软件中,得到 123 ,y xxx的相关系数表为: 相关性 y x1 x2 x3 Pearson 相关性 y 1.000 .556 .731 .724 x1 .556 1.000 .113 .398 x2 .731 .113 1.000 .5

4、47 x3 .724 .398 .547 1.000 因此得到 123 ,y x xx的相关系数矩阵为: 1.0000.5560.7310.724 0.5561.0000.1130.398 0.7310.1131.0000.547 0.7240.3980.5471.000 r (2)求 y 关于 123 ,x xx的三元线性回归方程。 系数 模型非标准化系数标准系数 t Sig. B 标准误 差试用版 1 ( 常量 ) -348.280 176.459 -1.974 .096 x1 3.754 1.933 .385 1.942 .100 x2 7.101 2.880 .535 2.465 .0

5、49 x3 12.447 10.569 .277 1.178 .284 由上表可以得出, y 关于 123 ,x xx的三元线性回归方程为: 123 348.2803.7547.10112.447yxxx (3)对所求得的的方程做拟合优度的检验 模型汇总 模型R R 方调整 R方标准估计的误差 1 0.898 0.806 0.708 23.442 得到模型的拟合优度为: 2 0.898R (4)对回归方程作显著性检验 Anovab 模型平方和df 均方F Sig. 1 回归13655.370 3 4551.790 8.283 .015 残差3297.130 6 549.522 总计16952.

6、500 9 从上表我们可以看出,模型的Sig 值为 0.0150.05. 与其等价的 B的 95% 的置信区间为 0.977,8.485其中包含 0 点,则可以认为其和0 没有显 著性差异。 从上表可以看出, 2 x的 Sig 检验值为 0.0490.05. 与其等价的 B的 95% 的置信区间为 13.415,38.310其中包含 0 点,则可以认为其和0 没有 显著性差异。 故此可以断定,以上参数 13 ,x x都没有通过显著性检验。 (6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回 归方程再做回归方程的显著性检验和回归系数的显著性检验。 系数 模型非标准化系数 标准系 数 t

7、 Sig. B 的 95.0% 置信区间 B 标准 误差试用版下限上限 1 ( 常量 ) -348.280 176.459 -1.974 .096 -780.060 83.500 x1 3.754 1.933 .385 1.942 .100 -.977 8.485 x2 7.101 2.880 .535 2.465 .049 .053 14.149 x3 12.447 10.569 .277 1.178 .284 -13.415 38.310 在逐步回归的时候,当有多个自变量对因变量y无显著性影响时,除 了自变量之间的交互作用, 不能一次剔除掉所有不显著的变量,原则 上每次只剔除一个变量,先剔

8、除其中|t| 值最小的变量,然后再对新 的回归方程进行检验。 基于这样的一个原理,首先剔除掉 3 x。得到: 系数 模型 非标准化系数 标准系 数 t Sig. B 的 95.0% 置信区 间 B 标准误 差试用版下限上限 1 ( 常量 ) -459.624 153.058 -3.003 .020 -821.547 -97.700 x1 4.676 1.816 .479 2.575 .037 .381 8.970 x2 8.971 2.468 .676 3.634 .008 3.134 14.808 从上表可以看出, 2 x的 Sig 检验值为 0.0370.05. 与其等价的 B的 95%

9、的置信区间为 0.977,8.485其中不包含 0 点,则可以认为其和0 有显 著性差异。 3 x的 Sig 检验值为 0.0080.05. 与其等价的 B的 95% 的置 信区间为 13.415,38.310其中不包含 0 点,则可以认为其和0 有显著 性差异。 故得到新的回归方程为: 12 459.6244.6768.971yxx (7)求出每一个回归系数的置信水平为95% 的置信区间 系数 模型非标准化系数标准系t Sig. B 的 95.0% 置信区 数间 B 标准误 差试用版下限上限 1 ( 常量 ) -459.624 153.058 -3.003 .020 -821.547 -97

10、.700 x1 4.676 1.816 .479 2.575 .037 .381 8.970 x2 8.971 2.468 .676 3.634 .008 3.134 14.808 由上表可以读出, X1的 95% 的置信区间为: 0.381,8.970 X2的 95% 的置信区间为: 3.314,14.808 (8)求标准化回归方程 系数 模型 非标准化系数 标准系 数 t Sig. B 的 95.0% 置信区 间 B 标准误 差试用版下限上限 1 ( 常量 ) -459.624 153.058 -3.003 .020 -821.547 -97.700 x1 4.676 1.816 .479

11、 2.575 .037 .381 8.970 x2 8.971 2.468 .676 3.634 .008 3.134 14.808 Y由上表可以得出,标准化的回归方程为: 12 0.4790.676yxx (9)当 010203 75,42,3.1xxx时的 0 ? y ,给定置信水平为95% ,用 SPSS 软件计算精确置信区间,用手工计算近似预测区间 y x1 x2 预测值下线上线 160 70 35 181.6541 145.4571 217.8512 260 75 40 249.8871 222.5428 277.2314 210 65 40 203.1308 174.2221 23

12、2.0394 265 74 42 263.1534 238.0455 288.2613 240 72 38 217.9183 193.4869 242.3496 220 68 45 262.0125 227.3334 296.6916 275 78 42 281.8559 243.9733 319.7384 160 66 36 171.9226 137.0271 206.8181 275 70 44 262.3928 234.5796 290.206 250 65 42 221.0727 189.8077 252.3377 75 42 267.829 239.9677 295.6903 由上表

13、可以读出, 0 ? y 的预测值为: 0 ?267.829y 置信水平为 95% 的区间为: 239.9677,295.6903 通过手工计算,得出其近似预测区间为: 00 ? ?2,2 yy 其中: 2 0 0 1 ?() 1 n ii i yy np 通过计算可知: 0 ?24.08112 故得到的近似预测区间为 219.6668,315.9912 (10)结合回归方程对问题做出一些基本的分析 12 0.4790.676yxx 可以看出, 2 x较 1 x对y值的影响较大。故此我们可以通过一定措施增 加农业总产值,比较容易增加货运总量。 3.12 用下表的数据,建立GDP对 1 x和 2

14、x的回归,对得到的二元回归 方程 12 ?2914.60.6071.709yxx ,你能够合理的解释两个回归系数吗? 如果现在不能给出合理解释,不妨在学过第六章后再来解释这个问 题,在学过第七章岭回归后再来改进这个问题。 年份GDP第一产业增加值x1第二产业增加值x2第三产业增加值x3 199018547.95017.0 7714.45813.5 199121617.85288.69102.27227.0 199226638.15800.0 11699.59138.6 199334634.46882.116428.511323.8 199446759.49457.222372.214930.0

15、 199558478.111993.0 28537.917947.2 199667884.613844.233612.920427.5 199774462.614211.237222.723028.7 199878345.214552.438619.325173.5 199982067.514472.0 40557.827037.7 200089468.114628.244935.329904.6 200197314.815411.848750.0 33153.0 2002105172.316117.352980.236047.8 2003117390.216928.161247.139188

16、.0 2004136875.920768.172387.243720.6 (1)计算出 123 ,GDP xxx的相关系数矩阵。 (2)求 GDP 关于 123 ,xxx的三元线性回归方程。 (3)对所求得的的方程做拟合优度的检验 (4)对回归方程作显著性检验 (5)对每一个回归系数作显著性检验 (6)求出每一个回归系数的置信水平为95% 的置信区间 (7)求标准化回归方程 (8)结合回归方程对问题做出一些基本的分析 (1)计算出 123 ,GDP x xx的相关系数矩阵。 将数据导入到 SPSS 软件,通过计算得出: 相关性 y x1 x2 x3 Pearson 相关性 y 1.000 .9

17、78 .999 .997 x1 .978 1.000 .975 .962 x2 .999 .975 1.000 .995 x3 .997 .962 .995 1.000 故此,得到 123 ,GDP xxx的相关系数的矩阵为; 1.0000.9870.9990.997 0.9871.0000.9750.962 0.9990.9751.0000.995 0.9970.9620.9951.000 R (2)求 y 关于 123 ,x xx的三元线性回归方程。 系数 模型 非标准化系数 标准系 数 t Sig. B 的 95.0% 置信 区间 B 标准 误差试用版下限上限 1 ( 常量 ) 6.06

18、0 10.500 .577 .575 -17.050 29.169 x1 .997 .002 .133 469.870 .000 .992 1.001 x2 1.000 .001 .538 690.105 .000 .997 1.003 x3 1.002 .002 .333 521.475 .000 .998 1.006 由上表可以得出, y 关于 123 ,x xx的三元线性回归方程为: 123 6.0600.9971.0001.002yxxx (3)对所求得的的方程做拟合优度的检验 模型汇总 模型 R R 方 调整 R 方 标准估 计的误差 1 1.000 1.000 1.000 7.88

19、908 得到模型的拟合优度为: 2 1.000R (4)对回归方程作显著性检验 Anovab 模型平方和df 均方F Sig. 1 回归18109951117.74 3.00 6036650372.58 96993771.59 0.00 残差684.61 11.00 62.24 总计18109951802.35 14.00 从上表我们可以看出,模型的Sig 值为 0.0000.050. 其通过假 设检验。但是并不能通过这一个Sig 值就认为模型的回归效果是很好 的。接下来必须对单个系数进行讨论。 (5)对每一个回归系数作显著性检验 系数 模型 非标准化系数标准系数 t Sig. B 的 95.

20、0% 置信 区间 B 标准 误差试用版下限上限 1 ( 常 量) 6.060 10.500 .577 .575 -17.050 29.169 x1 .997 .002 .133 469.870 .000 .992 1.001 x2 1.000 .001 .538 690.105 .000 .997 1.003 x3 1.002 .002 .333 521.475 .000 .998 1.006 从上表可以看出, 1 x的 Sig 检验值为 0.0000.05. 与其等价的 B的 95% 的置信区间为0.992,1.001其中不包含 0 点,则可以认为其和0 没有显 著性差异。 从上表可以看出,

21、 2 x的 Sig 检验值为 0.0000.05. 与其等价的 B的 95% 的置信区间为0.997,1.003其中包含 0 点,则可以认为其和0 有显著性 差异。 从上表可以看出, 3 x的 Sig 检验值为 0.0000.05. 与其等价的 B的 95% 的置信区间为 0.998,1.006其中不包含 0 点,则可以认为其和0 有显著 性差异。 故此可以断定,以上参数 123 ,x xx都通过显著性检验。 (6)求出每一个回归系数的置信水平为95% 的置信区间 系数 模型 非标准化系数标准系数 t Sig. B 的 95.0% 置信 区间 B 标准 误差试用版下限上限 1 ( 常 量) 6

22、.060 10.500 .577 .575 -17.050 29.169 x1 .997 .002 .133 469.870 .000 .992 1.001 x2 1.000 .001 .538 690.105 .000 .997 1.003 x3 1.002 .002 .333 521.475 .000 .998 1.006 由上表可以读出, X1的 95% 的置信区间为: 0.992,1.001 X2的 95% 的置信区间为: 0.997,1.003 X3的 95% 的置信区间为: 0.998,1.006 (7)求标准化回归方程 系数 模型 非标准化系数标准系数 t Sig. B 的 95

23、.0% 置信 区间 B 标准 误差试用版下限上限 1 ( 常 量) 6.060 10.500 .577 .575 -17.050 29.169 x1 .997 .002 .133 469.870 .000 .992 1.001 x2 1.000 .001 .538 690.105 .000 .997 1.003 x3 1.002 .002 .333 521.475 .000 .998 1.006 Y由上表可以得出,标准化的回归方程为: 123 0.1330.5380.333yxxx (8)结合回归方程对问题做出一些基本的分析 123 0.1330.5380.333yxxx 可以看出,第二产业值的增加对GDP 的影响是最大,次之是第三产业, 最后是第一产业。 故在采取应对措施的时候, 可以优先考虑对第二产 业的增加。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1