第八章统计回归模型.pdf

上传人:tbuqq 文档编号:5491167 上传时间:2020-05-23 格式:PDF 页数:15 大小:452.22KB
返回 下载 相关 举报
第八章统计回归模型.pdf_第1页
第1页 / 共15页
第八章统计回归模型.pdf_第2页
第2页 / 共15页
第八章统计回归模型.pdf_第3页
第3页 / 共15页
第八章统计回归模型.pdf_第4页
第4页 / 共15页
第八章统计回归模型.pdf_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《第八章统计回归模型.pdf》由会员分享,可在线阅读,更多相关《第八章统计回归模型.pdf(15页珍藏版)》请在三一文库上搜索。

1、实用标准文案 精彩文档 第八章统计回归模型 回归分析是研究一个变量Y与其它若干变量X之间相关关系的一种数学工具. 它是在一组试验或 观测数据的基础上,寻找被随机性掩盖了的变量之间的依存关系. 粗略的讲,可以理解为用一种确定的 函数关系去近似代替比较复杂的相关关系. 这个函数称为回归函数. 回归分析所研究的主要问题是如何利用变量X、Y的观察值 (样本 ),对回归函数进行统计推断, 包括对它进行估计及检验与它有关的假设等. 回归分析包含的内容广泛. 此处将讨论多项式回归、多元线性回归、非线性回归以及逐步回归. 一、多项式回归 (1) 一元多项式回归 一元多项式回归模型的一般形式为 m mx xy.

2、 10 . 如果从数据的散点图上发现y与x呈现较明显的二次( 或高次 ) 函数关系,则可以选用一元多项式 回归 . 1. 用函数 polyfit 估计模型参数,其具体调用格式如下: p=polyfit(x,y,m) p 返回多项式系数的估计值;m 设定多项式的最高次数;x,y 为对应数据点值. p,S=polyfit(x,y,m) S 是一个矩阵,用来估计预测误差. 2. 输出预估值与残差的计算用函数polyval 实现,其具体调用格式如下: Y=polyval(p,X) 求 polyfit 所得的回归多项式在X 处的预测值Y. Y,DELTA=polyval(p,X,S) p,S 为 pol

3、yfit 的输出, DELTA 为误差估计 . 在线性回归模型中,Y DELTA 以 50%的概率包含函数在X 处的真值 . 3. 模型预测的置信区间用polyconf 实现,其具体调用格式如下: Y,DELTA=polyconf(p,X,S,alpha) 求 polyfit 所得的回归多项式在X 处的预测值Y 及预测值的显著 性为 1-alpha 的置信区间YDELTA ,alpha 缺省时为0.05. 4. 交互式画图工具polytool ,其具体调用格式如下: polytool(x,y,m) ; polytool(x,y,m,alpha) ; 用 m 次多项式拟合x,y 的值,默认值为1

4、,alpha 为显著性水平,默认值为0.05. 例 1 观测物体降落的距离s与时间 t 的关系,得到数据如下表,求s. t (s) 1/30 2/30 3/30 4/30 5/30 6/30 7/30 s (cm) 11.86 15.67 20.60 26.69 33.71 41.93 51.13 t (s) 8/30 9/30 10/30 11/30 12/30 13/30 14/30 s (cm) 61.49 72.90 85.44 99.08 113.77 129.54 146.48 解 根据数据的散点图,应拟合为一条二次曲线. 选用二次模型,具体代码如下: %输入数据 实用标准文案 精

5、彩文档 t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; %多项式系数拟合 p,S=polyfit(t,s,2); 则得回归模型为: 1329.98896.652946.489? 2 tts. %y 的拟合值及预测值y 的置信半径delta y,dalta=polyconf(p,t,S); 得结果如下: y= Columns 1 through 11 11.8729 15.7002 20.6148 26.6168 33.7060

6、 41.8826 51.1465 61.4978 72.9363 85.4622 99.0754 Columns 12 through 14 113.7759 129.5637 146.4389 dalta= Columns 1 through 11 0.0937 0.0865 0.0829 0.0816 0.0817 0.0823 0.0827 0.0827 0.0823 0.0817 0.0816 Columns 12 through 14 0.0829 0.0865 0.0937 %交互式画图 polytool(t,s,2); polytool 所得的交互式图形如图8-1 所示 . 图

7、8-1 (2) 多元二项式回归 多元二项式回归模型的一般形式为 mkj kjjkmm xxxxy ,1 110 实用标准文案 精彩文档 多元二项式回归命令:rstool(x,y,model,alpha)x 表示 n m 矩阵; y 表示 n 维列向量; alpha 为显 著性水平 (缺省时为0.05);model 表示由下列4 个模型中选择1 个(用字符串输入,缺省时为线性模型): linear(线性 ): mmx xy 110 ; purequadratic(纯二次 ): n j jjjmm xxxy 1 2 110 ; interaction( 交叉 ): mkj kjjkmm xxxxy

8、 1 110 ; quadratic(完全二次 ): mkj kjjkmm xxxxy ,1 110 . 例 2 设某商品的需求量与消费者的平均收入、商品价格的统计数据如下,建立回归模型,预测平 均收入为1000、价格为6 时的商品需求量. 需求量100 75 80 70 50 65 90 100 110 60 收入1000 600 1200 500 300 400 1300 1100 1300 300 价格5 7 6 6 8 7 5 4 3 9 解 选择纯二次模型,即 2 222 2 11122110 xxxxy. %输入数据 x1=1000 600 1200 500 300 400 130

9、0 1100 1300 300; x2=5 7 6 6 8 7 5 4 3 9; x=x1 x2; y=100 75 80 70 50 65 90 100 110 60; %多元二项式回归 rstool(x,y,purequadratic); 得如下结果: 图 8-2 得到一个如图所示的交互式画面,左边是x1(=1000)固定时的曲线y(x1)及其置信区间,右边 是 x2(=6)固定时的曲线y(x2)及其置信区间. 用鼠标移动图中的十字线,或在图下方窗口内输入, 实用标准文案 精彩文档 可改变x1 ,x2. 在左边图形下方的方框中输入1000,右边图形下方的方框中输入6,则画面左边的 “ Pr

10、edicted Y1” 下方的数据变为88.4791, 即预测出平均收入为1000、 价格为 6 时的商品需求量为88.4791. 在画面左下方单击” Export” ,在出现的窗体中单击” ok” 按钮,则beta、 rmse 和 residuals 都传送到 Matlab 工作区中 . 在 Matlab 工作区中输入命令:beta,rmse,得结果: beta=110.5313 0.1464 -26.5709 -0.0001 1.8475 rmse =4.5362 故回归模型为: 2 2 2 121 8475.10001.05709.261464.05313.110xxxxy, 剩余标准差

11、为4.5362,说明此回归模型的显著性较好. 二、多元线性回归 多元线性回归模型的一般形式为 011 . mm yxx. 在 Matlab 统计工具箱中使用函数regress实现多元线性回归. 具体调用格式为: b=regress(Y,X) b,bint,r,rint,stats=regress(Y,X,alpha) 其中 n Y Y Y Y . 2 1 , nmnn m m xxx xxx xxx X .1 . .1 .1 21 22221 11211 . 对于一元线性回归,取1m即可 . b 为输出向量; b,bint 表示回归系数估计值和它们的置信区间;r 表示残差; rint 表示残差

12、的置信区间;stats 表示用于 检验回归模型的统计量,有四个数值:相关系数 2 R、F值、与F值对应的概率P、 2 s的值 . 相关系数 2 R越接近 1,说明回归方程越显著;)1,( 1 mnmFF 时拒绝 0 H,F越大,说明回归方程越显 著;与F对应的概率P时拒绝 0 H,回归模型成立;alpha 表示显著性水平(缺省时为0.05). 残差及其置信区间可以用命令rcoplot(r,rint) 画出 . 例 3 已知某湖泊八年来湖水中COD 浓度实测值 ( y) 与影响因素,如湖区工业产值( x1) 、总人口数 ( x2) 、捕鱼量 ( x3) 、降水量 ( x4) 的资料,建立y 的水

13、质分析模型. 湖水浓度与影响因素数据表 x1 1.376 1.375 1.387 1.401 1.412 1.428 1.445 1.477 x2 0.450 0.475 0.485 0.500 0.535 0.545 0.550 0.575 x3 2.170 2.554 2.676 2.713 2.823 3.088 3.122 3.262 x4 0.8922 1.1610 0.5346 0.9589 1.0239 1.0499 1.1065 1.1387 y5.19 5.30 5.60 5.82 6.00 6.06 6.45 6.95 解 作出因变量y 与各自变量的样本散点图 实用标准文案

14、 精彩文档 作散点图的目的主要是观察因变量y 与各自变量间是否有比较好的线性关系,以便选择恰当的数学 模型形式 . 图 8-3、图 8-4、图 8-5、图 8-6 分别为 y 与 x1、x2、x3、x4的散点图 . 从图中可以看出这些点 大致分布在一条直线旁边,因此有较好的线性关系,可以采用线性回归. 图 8-3 y 与 x1的散点图图 8-4 y 与 x2的散点图 图 8-5 y 与 x3的散点图图 8-6 y 与 x4的散点图 在 Matlab 中实现回归的具体代码如下: %输入数据 x1=1.376 1.375 1.387 1.401 1.412 1.428 1.445 1.477; x

15、2=0.450 0.475 0.485 0.500 0.535 0.545 0.550 0.575; x3=2.170 2.554 2.676 2.713 2.823 3.088 3.122 3.262; x4=0.8922 1.1610 0.5346 0.9589 1.0239 1.0499 1.1065 1.1387; x=ones(8,1) x1 x2 x3 x4; y=5.19 5.30 5.60 5.82 6.00 6.06 6.45 6.95; %多元线性回归 b,bint,r,rint,stats=regress(y,x); 得如下结果: b = -13.9849 13.1920

16、 2.4228 实用标准文案 精彩文档 0.0754 -0.1897 bint = -26.0019 -1.9679 1.4130 24.9711 -14.2808 19.1264 -1.4859 1.6366 -0.9638 0.5844 r = -0.0618 0.0228 0.0123 0.0890 0.0431 -0.1473 0.0145 0.0274 rint = -0.1130 -0.0107 -0.1641 0.2098 -0.1051 0.1297 -0.2542 0.4321 -0.0292 0.1153 -0.2860 -0.0085 -0.3478 0.3769 -0.

17、1938 0.2486 stats = 0.9846 47.9654 0.0047 0.0123 故回归模型为: 4321 1897. 00754. 04228. 21920.139849.13xxxxy, 此外,由stats的值可知9846.0 2 R,9654.47F,0047.0P。 %残差分析,作残差图 rcoplot(r,rint) 图 8-7 实用标准文案 精彩文档 从残差图可以看出,除第一和第六个数据外,其余数据的残差离零点均较近,且残差的置信区间均 包含零点 . 第一和第六个数据可视为异常点,将其去掉后重新拟合可得新的回归模型. 三、非线性回归 非线性回归模型的一般形式为),(

18、xfy,),( 21m xxxx,),( 21k ,其中 f对回归系数是非线性的 . 非线性回归包括如下几个用于计算回归参数、预测输出、置信区间以及输出交互图像的函数. 1. 非线性最小二乘参数估计 对于非线性方程的的系数估计通常采用最小二乘估计,又叫做非线性最小二乘回归. 在 Matlab 中采 用 nlinfit 实现,其调用格式如下: beta=nlinfit(x,y,fun,beta0) 返回非线性回归方程系数的最小二乘估计值. 非线性方程由fun 给定, fun 为用户提供形如 ),beta(xfy的函数, beta为待估系数;beta0 为回归系数的初值 . beta,r,J=nl

19、infit(x,y,fun,beta0) 返回回归系数beta、残差 r、Jacobi 矩阵 J. 2. 最小二乘估计参数的置信区间 求非线性最小二乘估计的系数的置信区间用nlparci 计算。其输入为nlinfit 函数的输出beta,r,J。 函数具体调用格式如下: ci=nlparci(beta,r,J) 返回系数beta的 95%置信区间 . ci=nlparci(beta,r,J,alpha) 返回系数beta的 100(1-alpha)% 置信区间 . 3. 最小二乘估计模型的预测输出及其置信区间 非线性最小二乘估计模型的预测输出及其置信区间用nlpredci 计算 . 函数具体调

20、用格式如下: ypred,delta=nlpredci(fun,inputs,beta,r,J) 返回模型在对应inputs 处的输出预测值ypred,给出 95%的置信区间 ypred-delta, ypred+delta ; ypred,delta=nlpredci(fun,inputs,beta,r,J,alpha) 返回模型在对应inputs 处的输出预测值ypred ,给出100(1-alpha)% 的置信区间ypred-delta, ypred+delta . 4. 非线性拟合和预测的交互图形工具 nlintool 是非线性拟合和预测的交互图形工具. 函数具体调用格式如下: nli

21、ntool(x,y,fun,beta0) 返回 x,y 的非线性最小二乘法的曲线拟合图,并画出95%的置信区间; 实用标准文案 精彩文档 nlintool(x,y,fun,beta0,alpha) 给出曲线拟合图及100(1-alpha)% 的置信区间; nlintool(x,y,fun, beta0,alpha,xname , yname) 给出曲线拟合图及100(1-alpha)% 的置信区间,标出x,y 变量名称 . 例 4 在化工生产中获得的氯气的级分y随生产时间x下降, 假定在8x时,y与x之间有如下形 式的非线性模型: )8( )49.0( xb eaay 现收集 43 组数据,

22、如下所示 . 要求利用该数据求a,b的值以及它们95%的置信区间 . 并画出拟合曲线. 此处设a,b的初值分别为0.30,0.02. :x8.00,8.00,10.00,10.00,10.00,10.00,12.00,12.00,12.00,14.00,14.00,14.00,16.00,16.00,16.00,18.00,18.00, 20.00,20.00,20.00,20.00,22.00,22.00,24.00,24.00,24.00,26.00,26.00,26.00,28.00,28.00,30.00,30.00,30.00, 32.00,32.00,34.00,36.00,36.

23、00,38.00,38.00,40.00,42.00 :y0.49,0.49,0.48,0.47,0.48,0.47,0.46,0.46,0.45,0.43,0.45,0.43,0.43,0.44,0.43,0.43,0.46,0.42,0.42,0.43,0.41, 0.41,0.40,0.42,0.40,0.40,0.41,0.40,0.41,0.41,0.40,0.40,0.40,0.38,0.41,0.40,0.40,0.41,0.38,0.40,0.40,0.39,0.39 解 首先编写函数fun,表示出需要拟合模型的函数形式. %拟合模型的函数形式 function y=fun(b

24、eta0,x) a=beta0(1); b=beta0(2); y=a+(0.49-a)*exp(-b*(x-8); 编写程序对数据进行最小二乘拟合和处理 %输入数据 x=8.00 8.00 10.00 10.00 10.00 10.00 12.00 12.00 12.00 14.00 14.00 14.00 16.00 16.00 16.00 18.00 18.00 20.00 20.00 20.00 20.00 22.00 22.00 24.00 24.00 24.00 26.00 26.00 26.00 28.00 28.00 30.00 30.00 30.00 32.00 32.00

25、34.00 36.00 36.00 38.00 38.00 40.00 42.00; y=0.49 0.49 0.48 0.47 0.48 0.47 0.46 0.46 0.45 0.43 0.45 0.43 0.43 0.44 0.43 0.43 0.46 0.42 0.42 0.43 0.41 0.41 0.40 0.42 0.40 0.40 0.41 0.40 0.41 0.41 0.40 0.40 0.40 0.38 0.41 0.40 0.40 0.41 0.38 0.40 0.40 0.39 0.39; beta0=0.30 0.02; %系数初值 beta,r,J=nlinfit

26、(x,y,fun,beta0); %系数最小二乘估计值为beta beta ci=nlparci(beta,r,J); %求 95%置信区间 nlintool(x,y,fun,beta0,0.05, 生产时间x,氯气级分y); %显示拟合结果和置信区间 得如下结果: beta= 实用标准文案 精彩文档 0.3896 0.1011 ci= 0.3805 0.3988 0.0771 0.1251 可知a与b的最小二乘估计值分别为0.3896 和 0.1011,它们 95%的置信区间分别为0.3805,0.3988 和0.0771,0.1251 . 所以用最小二乘法对该模型系数进行估计,最终的模型表

27、达式为 )8(1011. 0 1004. 03896.0 x ey 最终得到的拟合图如下所示. 图 8-8 在图 8-8 中,中间的实线为拟合曲线,两侧的虚线标出其95%置信区间 . 四、逐步回归 实际问题中影响因变量的因素可能很多,希望从中挑选出影响显著的自变量来建立回归模型. 这就 涉及到了变量选择的问题. 逐步回归就是一种从众多变量中有效地选择重要变量的方法. 逐步回归的命令是stepwise,它提供了一个交互式画面,通过此工具可以自由地选择变量,进行统 计分析,其调用格式为stepwise(x,y,inmodel,alpha) . 其中 x 表示自变量数据,mn阶矩阵; y 表示因变量

28、数据,1n阶矩阵; inmodel 表示矩阵的列 数指标 (缺省时设定为全部自变量);alpha 表示显著性水平(缺省时为0.5). 运行 stepwise 命令时产生三个图形窗口:Stepwise Plot, Stepwise Table, Stepwise History. 在 Stepwise Plot 窗口, 虚线表示该变量的拟合系数与0 无显著差异, 实线表示有显著差异,红色线 表示从模型中移去的变量,蓝色线表示存在模型中的变量,单击一条会改变其状态. Stepwise Table 窗口中列出了一个统计表,包括回归系数及其置信区间,以及模型的统计量剩余标 准差 (RMSE)、相关系数

29、 (R-square)、F值、与F对应的概率P. 实用标准文案 精彩文档 例 5 水泥凝固时放出的热量y 与水泥中4种化学成分x1、x2、x3、x4 有关,今测得一组数据如下, 试用逐步回归法确定一个线性模型. 序号1 2 3 4 5 6 7 8 9 10 11 12 13 x17 1 11 11 7 11 3 1 2 21 1 11 10 x226 29 56 31 52 55 71 31 54 47 40 66 68 x36 15 8 8 6 9 17 22 18 4 23 9 8 x460 52 20 47 33 22 6 44 22 26 34 12 12 y 78.5 74.3 10

30、4.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4 解 在 Matlab 中实现逐步回归的具体代码如下: %数据输入: x1=7 1 11 11 7 11 3 1 2 21 1 11 10; x2=26 29 56 31 52 55 71 31 54 47 40 66 68; x3=6 15 8 8 6 9 17 22 18 4 23 9 8; x4=60 52 20 47 33 22 6 44 22 26 34 12 12; x=x1 x2 x3 x4; y=78.5 74.3 104.3 87.6 95.9 109.2 10

31、2.7 72.5 93.1 115.9 83.8 113.3 109.4; %逐步回归 %先在初始模型中取全部自变量: stepwise(x,y) 得图 8-9 所示的结果 . 图 8-9 从图 8-9 中可以看出,x3、x4 的P值较大,其对模型影响不显著. 若要移去x3、x4 两个变量,在Matlab 中输入: stepwise(x,y,1,2) 得图 8-10 所示的结果 . 实用标准文案 精彩文档 图 8-10 移去变量x3 和 x4 后模型具有显著性,虽然剩余标准差(RMSE) 没有太大的变化,但是统计量F的 值明显增大,因此新的回归模型更好. 对变量 y 和 x1、x2 作线性回归

32、,在Matlab 中输入: X=ones(13,1) x1 x2; b=regress(y,X) 得结果: b= 52.5773 1.4683 0.6623 故最终模型为:y=52.5773+1.4683x1+0.6623x2 . 讨论题 1.根据经验,在人的身高相等的情况下,血压的收缩压y 与体重 x1,年龄 x2 有关, 现在收集了 13 个男子的有关数据,如下表所示,试建立y 与 x1、x2 的回归模型. x176.0 91.5 85.5 82.5 79.0 80.5 74.5 79.0 85.0 76.5 82.0 95.0 92.5 x250 20 20 30 30 50 60 50

33、 40 55 40 40 20 y120 141 124 126 117 125 123 125 132 123 132 155 147 2. 下表为 1980-1991 年间以 1987 年不变价计算的美国个人消费支出y 与美国国内生产总值x 的数 据(单位: 10 亿美元 ). 1)在直角坐标系下,作x 与 y 的散点图,并判断y 与 x 是否存在线性相关关系? 2)试求 y 与 x 的一元线性回归方程. 3)对所得的回归方程作显著性检验(05.0). 4)若 x0=4500,试求对应的y0的点预测和包含概率为 95%的区间预测 . 实用标准文案 精彩文档 年份y x 年份y x 1980

34、 2447.1 3776.3 1986 2969.1 4404.5 1981 2476.9 3843.1 1987 3052.2 4539.9 1982 2503.7 3760.3 1988 3162.4 4718.6 1983 2619.4 3906.6 1989 3223.3 4838.0 1984 2746.1 4148.5 1990 3260.4 4877.5 1985 2865.8 4279.8 1991 3240.8 4821.0 3. 某地人事部门研究中学教师的薪金与他们的资历、性别、教育程度、及培训情况等因素之间的 关系, 要建立一个数学模型,分析人事策略的合理性,特别是考察女

35、教师是否受到不公正的待遇,以及 她们的婚姻状况是否会影响收入. 为此,从当地教师中随机选中3414 位进行观察,然后从中保留了90 个观察对象,得到关键数据如下表. Z x1 x2 x3 x4 x5 x6 x7 998 7 0 0 0 0 0 0 1015 14 1 1 0 0 0 0 1028 18 1 1 0 1 0 0 1250 19 1 1 0 0 0 0 1028 19 0 1 0 1 0 0 1028 19 0 0 0 0 0 0 1018 27 0 0 0 0 0 1 1072 30 0 0 0 0 0 0 1290 30 1 1 0 0 0 0 1204 30 0 1 0 0

36、0 0 1352 31 0 1 2 0 1 0 1204 31 0 0 0 1 0 0 1104 38 0 0 0 0 0 0 1118 41 1 1 0 0 0 0 1127 42 0 0 0 0 0 0 1259 42 1 1 0 1 0 0 1127 42 1 1 0 0 0 0 1127 42 0 0 0 1 0 0 1095 47 0 0 0 0 0 1 1113 52 0 0 0 0 0 1 1462 52 0 1 2 0 1 0 1182 54 1 1 0 0 0 0 1404 54 0 0 0 1 0 0 1182 54 0 0 0 0 0 0 1594 55 1 1 2 1

37、1 0 1459 66 0 0 0 1 0 0 1237 67 1 1 0 1 0 0 实用标准文案 精彩文档 Z x1 x2 x3 x4 x5 x6 x7 1237 67 0 1 0 1 0 0 1496 75 0 1 0 0 0 0 1424 78 1 1 0 1 0 0 1424 79 0 1 0 0 0 0 1347 91 1 1 0 1 0 0 1343 92 0 0 0 0 0 1 1310 94 0 0 0 1 0 0 1814 103 0 0 2 1 1 0 1534 103 0 0 0 0 0 0 1430 103 1 1 0 0 0 0 1439 111 1 1 0 1 0

38、 0 1946 114 1 1 3 1 1 0 2216 114 1 1 4 1 1 0 1834 114 1 1 4 1 1 1 1416 117 0 0 0 0 0 1 2052 139 1 1 0 1 0 0 2087 140 0 0 2 1 1 1 2264 154 0 0 2 1 1 1 2201 158 1 1 4 0 1 1 2992 159 1 1 5 1 1 1 1695 162 0 1 0 0 0 0 1792 167 1 1 0 1 0 0 1690 173 0 0 0 0 0 1 1827 174 0 0 0 0 0 1 2604 175 1 1 2 1 1 0 172

39、0 199 0 1 0 0 0 0 1720 209 0 0 0 0 0 0 2159 209 0 1 4 1 0 0 1852 210 0 1 0 0 0 0 2104 213 1 1 0 1 0 0 1852 220 0 0 0 0 0 1 1852 222 0 0 0 0 0 0 2210 222 1 1 0 0 0 0 2266 223 0 1 0 0 0 0 2027 223 1 1 0 0 0 0 1852 227 0 0 0 1 0 0 1852 232 0 0 0 0 0 1 1995 235 0 0 0 0 0 1 2616 245 1 1 3 1 1 0 2324 253

40、1 1 0 1 0 0 1852 257 0 1 0 0 0 1 2054 260 0 0 0 0 0 0 实用标准文案 精彩文档 Z x1 x2 x3 x4 x5 x6 x7 2617 284 1 1 3 1 1 0 1948 287 1 1 0 0 0 0 1720 290 0 1 0 0 0 1 2604 308 1 1 2 1 1 0 1852 39 1 1 0 1 0 1 1942 319 0 0 0 1 0 0 2027 325 1 1 0 0 0 0 1942 326 1 1 0 1 0 0 1720 329 1 1 0 1 0 0 2048 337 0 0 0 0 0 0 23

41、34 346 1 1 2 1 1 1 1720 355 0 0 0 0 0 1 1942 357 1 1 0 0 0 0 2117 380 1 1 0 0 0 1 2742 387 1 1 2 1 1 1 2740 403 1 1 2 1 1 1 1942 406 1 1 0 1 0 0 2266 437 0 1 0 0 0 0 2436 453 0 1 0 0 0 0 2067 458 0 1 0 0 0 0 2000 464 1 1 2 1 1 0 表中符号介绍如下: Z-月薪 (元);x1-工作时间 (月);x2=1- 男性, x2=0-女性; x3=1-男性或单身女性,x3=0-已婚女

42、性; x4-学历 (取值 0-6,值越大表示学历越高);x5=1-受雇于重点中学,x5=0-其它; x6=1- 受过培训的毕业生, x6=0- 未受过培训的毕业生或受过培训的肄业生;x7=1- 已两年以上未从事教学工作,x7=0-其它。注意 组合 (x2,x3)=(1,1) ,(0,1),(0,0)的含义 . 进行变量选择,建立变量x1-x7 与 Z 的回归模型 (不一定包括每个自变量),说明教师的薪金与哪些 变量的关系密切,是否存在性别和婚姻状况上的差异. 为了数据处理上的方便,建议对薪金取对数后作 为因变量 . 4. 热敏电阻器的电阻y 与温度 x 之间的关系模型为 3 2 1 x exp

43、y 试根据下表中的数据给出参数 1,2 , 3的估计 . x y x y x y x y 50 34780 70 16370 90 8266 110 4427 55 28610 75 13720 95 7030 115 3820 实用标准文案 精彩文档 60 23650 80 11540 100 6005 120 3307 65 19630 85 9744 105 5147 125 2872 5. 财政收入预测问题:财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固 定资产投资等因素有关.下表列出了1952-1981 年的原始数据,试构造预测模型. 年份国民收入 (亿元) 工业总

44、产 值(亿元 ) 农业总产值 (亿元) 总人口 (万人) 就业人口 (万人) 固定资产投资 (亿元) 财政收入 (亿元 ) 1952 598 349 461 57482 20729 44 184 1953 586 455 475 58796 21364 89 216 1954 707 520 491 60266 21832 97 248 1955 737 558 529 61465 22328 98 254 1956 825 715 556 62828 23018 150 268 1957 837 798 575 64653 23711 139 286 1958 1028 1235 598 6

45、5994 26600 256 357 1959 1114 1681 509 67207 26173 338 444 1960 1079 1870 444 66207 25880 380 506 1961 757 1156 434 65859 25590 138 271 1962 677 964 461 67295 25110 66 230 1963 779 1046 514 69172 26640 85 266 1964 943 1250 584 70499 27736 129 323 1965 1152 1581 632 72538 28670 175 393 1966 1322 1911

46、687 74542 29805 212 466 1967 1249 1647 697 76368 30814 156 352 1968 1187 1565 680 78534 31915 127 303 1969 1372 2101 688 80671 33225 207 447 1970 1638 2747 767 82992 34432 312 564 1971 1780 3156 790 85229 35620 355 638 1972 1833 3365 789 87177 35854 354 658 1973 1978 3684 855 89211 36652 374 691 197

47、4 1993 3696 891 90859 37369 393 655 1975 2121 4254 932 92421 38168 462 692 1976 2052 4309 955 93717 38834 443 657 1977 2189 4925 971 94974 39377 454 723 1978 2475 5590 1058 96259 39856 550 922 1979 2702 6065 1150 97542 40581 564 890 1980 2791 6592 1194 98705 41896 568 826 1981 2927 6862 1273 100072

48、73280 496 810 6. 水泥凝固时放出的热量y 与水泥中 4 种化学成分x1、x2、x3、x4 有关,今测得一组数据如下, 试用逐步回归法确定一个线性模型. 序号1 2 3 4 5 6 7 8 9 10 11 12 x1 7 1 11 11 7 11 3 1 2 21 1 11 x2 26 29 56 31 52 55 71 31 54 47 40 66 x3 6 15 8 8 6 9 17 22 18 4 23 9 x4 60 52 20 47 33 22 6 44 22 26 34 12 y 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1