回归分析应用实例讲解.docx

上传人:scccc 文档编号:14114641 上传时间:2022-02-02 格式:DOCX 页数:17 大小:37.78KB
返回 下载 相关 举报
回归分析应用实例讲解.docx_第1页
第1页 / 共17页
回归分析应用实例讲解.docx_第2页
第2页 / 共17页
回归分析应用实例讲解.docx_第3页
第3页 / 共17页
回归分析应用实例讲解.docx_第4页
第4页 / 共17页
回归分析应用实例讲解.docx_第5页
第5页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《回归分析应用实例讲解.docx》由会员分享,可在线阅读,更多相关《回归分析应用实例讲解.docx(17页珍藏版)》请在三一文库上搜索。

1、影响成品钢材量的多元回归分析 故当原油产量为16225.86万吨,生铁产量 为12044.54万吨,原煤产 量为13.87万吨以及发电量为12334.89亿千瓦 时时,成品钢材量预测 值为10727.33875万吨;当原油产量为17453万吨, 生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿 千瓦时 时,成品钢材量预测值为10727.33875万吨。钢材的需求量设为y,作为被解释变量,而原油产量治、生铁产量 X2、原煤产量X3、发电量X4作为解释变量,通过建立这些经济变量的线性模型来研究影响成品钢材需求量的原因。能源转换技术等因素。在此,收集的数据选择与其相关

2、的四个因素:原油产量、生铁产量、原煤产量、发电量,1980-1997的有关数据如下表。理论上成品钢材的需求量的影响因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、原始数据(中国统计年鉴)n分yX1X2X3X419802716.2010595.003802.406.203006.2019812670.1010122.003416.606.203092.7019822902.0010212.003551.006.663277.0019833072.0010607.003738.007.153514.0019843372.0011461.304001.007.893770.001985

3、3693.0012489.504384.008.724107.0019864058.0013068.805064.008.944495.0019874356.0013414.005503.009.284973.0019884689.0013704.605704.009.805452.0019894859.0013764.105820.0010.545848.0019905153.0013830.606238.0010.806212.0019915638.0014009.206765.0010.876775.0019926697.0014209.707589.0011.167539.001993

4、7716.0014523.008739.0011.518395.0019948482.0014608.209741.0012.409281.0019958979.8015004.9410529.2713.6110070.3019969338.0215733.3910722.5013.9710813.1019979978.9316074.1411511.4113.7311355.53将中国成品一、模型的设定设因变量y与自变量x、X2、X3、X4的一般线性回归模型为y = -0 +2X2 3X3 4X4 ;;是随机变量,通常满足 上(;)=o; Var ( ) = -2二参数估计系数a模型非标准化

5、系数标准系数tSig.B标准庆左试用版1(常量)170.287494.572.344.736原油(万吨)-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(亿千瓦时).389.199.4381.952.073a.因变量:成品钢材(万吨)再用spss做回归线性,根据系数表得出回归方程为0.389y=1 70.287 0x 0 4 1 x 554 x 1 7.8 *8再做回归预测,得出如下截图yPREJIRES 12716.2010595.003802.406.203006.

6、2D2899.08766-182.807662670.1010122.003416.606.203092.702738.53110-68.431102902.0010212 003551.006 663277.002372.8151429.104863072.0010E07.00373BOO7 153514 003043.6244328.375573372.0011461.304D01.007.893770.003240 51584131.484163693 0012489.504384.008.7241107.003526.63541166.36459405S.OO13069.805064.

7、008.944495.004026.5661931.433814356.0013414 005503 009 284973.004435.52677-79.526774689.0013704.606704.009 805452004712.05319-23.058194859.0013754.105820.0010545848 004914.01371-55.813716163.0013330.606238.0010.806212.005280.70360-127.703605635.0014009.206765.0010.076775.005783 19465-145.194656697-0

8、0114209.707589 0011.167539 006523.64790173.352107716.0014523.008739 0011.518395007474.80431241 195698482 0014608.209741.0012.409281.008355 43425126.565758979.8015004.9410529.2713.6110070.309061.44200-81.642009330.0215733,3910722.5013.9710813.109421 11147-83.09147997S.9316074.141151141137311355 53100

9、59.53741-SD.6074116225 8612044.54138712334.8910727.33875-17463.0012445.9614.6413457.0011323.87164-故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产 量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿千瓦时 时,成品钢材量预测值为 10727.33875 万吨。三回归方程检验描述性统计量均值标准偏差N成品钢材(万吨

10、)5465.00282460.3492618原油(万吨)13190.63721875.7887318生铁(万吨)6489.95442700.7967618原煤(万吨)9.96832.5401818发电量(亿千瓦时)6220.87942768.1119118相关性成品钢材(万吨)原油(万吨)生铁(万吨)原煤(万吨)发电量(亿千瓦时)Pearson相关性成品钢材(万吨)1.000.909.998.961.997原油(万吨).9091.000.912.973.920生铁(万吨).998.9121.000.962.997原煤(万吨).961.973.9621.000.971发电量(亿千瓦时).997.

11、920.997.9711.00CSig.(单侧)成品钢材(万吨).000.000.000.000原油(万吨).000.000.000.000生铁(万吨).000.000.000.000原煤(万吨).000.000.000.000发电量(亿千瓦时).000.000.000.000N成品钢材(万吨)1818181818原油(万吨)1818181818生铁(万吨)1818181818原煤(万吨)1818181818发电量(亿千瓦时)1818181818由相关系数表看出,因变量与各个自变量的相关系数都很高,都在0.9以上,说明变量间的线性相关程度很高,适合做多元线性回归模型模型汇总b模型RR方调整R方

12、标准估计的误差1a.999.997.997140.71641a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)模型汇总b模型RR方调整R方标准估计的误差1.999 a.997.997140.71641a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)b.因变量:成品钢材(万吨)由R2=0.997以及调整之后的R2 =0.997知,模型对样本观测数据的拟合度很好Anova b模型平方和df均方FSig.1回归1.026E842.566E71296.001.000 a残差257414.4041319801.108总计1.029E8

13、17a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)b.因变量:成品钢材(万吨)由F=1296.001 P值=0.000 =0.05,故拒绝原假设,认为自变量联合起来对因变量有显著影响,通过F检验。系数a模型非标准化系数标准系数tSig.B标准庆左试用版1(常量)170.287494.572.344.736原油(万吨)-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(亿千瓦时).389.199.4381.952.073a.因变量:成品

14、钢材(万吨)因为t3 =-0.154 P值=0.880远远大于:=0.05 ,故接受原假设,认为X3对因变量y没有显著影响,故应剔除X3o用后退法剔除变量后,再做回归线性,得如下表:a.因变量:成品钢材(万吨)Anova d系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)170.287494.572.344.736原油(万吨)-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(亿千瓦时).389.199.4381.952.0732(常量)197.7344

15、45.099.444.664原油(万吨)-.053.045-.041-1.172.261生铁(万吨).564.150.6203.760.002发电量(亿千瓦时).371.153.4172.417.0303(常量)-309.403105.079-2.944.010生铁(万吨).591.150.6493.937.001发电量(亿千瓦时).311.147.3502.125.051模型平方和df均方FSig.1回归1.026E842.566E71296.001.000 a残差257414.4041319801.108总计1.029E8172回归1.026E833.422E71857.513.000 b

16、残差257885.8841418420.420总计1.029E8173回归1.026E825.131E72718.023.000 c残差283174.3241518878.288总计1.029E817a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。b.预测变量:(常量),发电量(亿千瓦时),原油(万吨),生铁c.预测变量:(常量),发电量(亿千瓦时),生铁(万吨)d.因变量:成品钢材 (万最后剔除Xi、X3两个自变量,得出新的回归方程为y = -309.403 0.591x 2 0.311x4F=2718.023 P值=0.000故拒绝原假设,通过 F检验

17、四基本假定检验1、异方差检验等级相关系数检验做abs (e与x的等级相关系数)得出表如下相关系数原油(万吨)生铁(万吨)原煤(万吨)发电量(亿千瓦时)abse原油(万吨)相关系数1.000*.998*.994*.994*.263Sig.(双侧).00 0.000.00C.291N1818181818生铁(万吨)相关系数*.9981.000*.989*.988*.294Sig.(双侧).000.000.000.236N1818181818原煤(万吨)相关系数*.994*.9891.000*.997*.227Sig.(双侧).000.00 0.000.365N1818181818发电量(亿千瓦时)

18、相关系数*.994*.988*.997,1.000.212Sig.(双侧).000.00 0.000.399N1818181818abse相关系数.263.294.227.2121.000Sig.(双侧).291.23 6.365.399N1818181818Spearman 的 rho林在置信度(双测)为 0.01时,相关性是显著的由表中P值全大于0.01 ,故接受原假设,模型中不存在异方差2、自相关检验模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.999a.997.997140.71641.922a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨

19、),生铁(万吨)b.因变量:成品钢材(万吨)DW=0.992 n=18 k=5,查表得出di =0.82,du=1.87 ,故DW落入无法确定的领域。自相关性不明显,由此也看出DW检验的局限性。3、多重共线性系数a,型非标准化系数标准系数tSig.共线性统,B标准误差试用版容差VIF1(常量)170.287494.572.344.736原油(万吨)-.041.090-.031-.457.65 5.04124.672生铁(万吨).554.170.6083.267.006.006180.105原煤(万吨)-17.818115.468-.018-.154.88 0.01473.861发电量(亿千瓦时

20、).389.199.4381.952.073.004261.480a.因变量:成品钢材(万吨)共线性诊断a模型维数特征值条件索引方差比例(常量)原油(万吨)生铁(万吨)原煤(万吨)发电量(亿千瓦时)114.8781.000.00.00.00.00.0(2.1186.435.02.00.00.00.0(3.00437.106.36.03.03.09.004.00188.718.57.46.28.21.165.000137.100.05.51.68.70.84a.因变量:成品钢材(万吨)因为VIF中有两个远远的大于10,故模型存在严重的多重共线性。由共线性诊断表中数据得出,X2、X3、X4之间存在

21、多重共线性。故先剔除变量X4,再做线性回归,得出表如下:系数a模型非标准化系数标准系数tSig.共线性统,B标准误差试用版VIF1(常量)59.520538.378.111.914原油(万吨)-.108.092-.082-1.178.258.04721.142生铁(万吨).871.054.95616.144.000.06615.176原煤(万吨)118.233100.887.1221.172.261.02146.956a.因变量:成品钢材(万吨)共线性诊断a模型维数特征值条件索引方差比例(常量)原油(万吨)生铁(万吨)原煤(万吨)113.9171.000.00.00.00.002.0797.0

22、42.02.00.06.003.00333.686.33.04.66.134.00187.743.64.96.28.87a.因变量:成品钢材(万吨)由于模型中仍然存在多重共线性,故继续剔除VIF最大的变量X3,再做线性回归,得出表如下系数a模型非标准化系数标准系数tSig.共线性统,B标准误差试用版容差VIF1(常量)-282.131458.218-.616.547原油(万吨)-.017.049-.013-.345.735.1685.967生铁(万吨).920.0341.01026.871.000.1685.967a.因变量:成品钢材(万吨)展型维数特征值条件索引方差比例(常量)原油(万吨)生

23、铁(万吨)112.9221.000.00.00.002.0766.204.03.00.193.00238.315.971.00.81共线性诊断aa.因变量:成品钢材(万吨)a.因变量:成品钢材(万吨)模型非标准化系数标准系数tSig.共线性统,B标准庆左试用版容差VIF1(常量)-282.131458.218-.616.547原油(万吨)-.017.049-.013-.345.735.1685.967生铁(万吨).920.0341.01026.871.000.1685.967系数a由于剔除变量X3后,VIF值都小于10,故多重共线性得以消除,得出 新的回归方程:y 二-282.131-0.01

24、7x 0.92x24、异常值和强影响值残差统计量a极小值极大值均值标准偏差N预测值2738.531010059.53715465.00282457.2701318标准预测值-1.1101.870.0001.00C18预测值的标准误差53.220117.71772.28817.05718调整的预测值2770.477510140.25595485.89002473.4477418残差-182.88765241.19569.00000123.0529318标准残差-1.3001.714.000.87418Student化残差-1.7101.887-.0571.02218已删除的残差-316.76953292.42792-20.88723173.8068218Student化已删除的残差-1.8672.128-.0451.07018Mahal。 距离1.48710.9533.7782.41718Cook的距离.002.523.095.14518居中杠杆值.087.644.222.14218a.因变量:成品钢材(万吨)因为p/n=4/18=0.22 表中eg =0.6440.44 故关于x异常

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1