11回归分析的基本思想及其初步应用习题课.ppt

上传人:peixunshi 文档编号:14169765 上传时间:2022-02-03 格式:PPT 页数:33 大小:723KB
返回 下载 相关 举报
11回归分析的基本思想及其初步应用习题课.ppt_第1页
第1页 / 共33页
11回归分析的基本思想及其初步应用习题课.ppt_第2页
第2页 / 共33页
11回归分析的基本思想及其初步应用习题课.ppt_第3页
第3页 / 共33页
11回归分析的基本思想及其初步应用习题课.ppt_第4页
第4页 / 共33页
11回归分析的基本思想及其初步应用习题课.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《11回归分析的基本思想及其初步应用习题课.ppt》由会员分享,可在线阅读,更多相关《11回归分析的基本思想及其初步应用习题课.ppt(33页珍藏版)》请在三一文库上搜索。

1、我们的梦向往的地方 北京师范大学,用自己的聪明和勤奋,打造一个最优秀的自己,北京师范大学是教育部直属重点大学,是一所以教师教育、教育科学和文理基础学科为主要特色的著名学府。学校的前身是1902年创立的京师大学堂师范馆,1908年改称京师优级师范学堂,独立设校。1912年改名为北京高等师范学校。1923年更名为北京师范大学,成为中国历史上第一所师范大学。1931年、1952年北平女子师范大学、辅仁大学先后并入北京师范大学。,1.1 相关分析的基本思想及其初步应用(习题课),复习回顾:,1.回归直线的方程:,我们又引入相关指数R2来刻画回归的效果:,残差平方和,总体偏差平方和,当R2越接近于1,说

2、明解释变量和预报变量之间的相关性越强,如果同一个问题,采用不同的回归方法分析,我们可以通过选择R2大的来作为回归模型,相关系数,相关系数的性质: (1)|r|1 (2)|r|越接近于1,相关程度越强;|r|越接近于0, 相关程度越弱,如何描述两个变量之间线性相关关系的强弱?,问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?,基本步骤,抽取样本,采集数据,作出散点图,确定类型,求回归方程,残差分析,相关指数,判定拟合程度,案例2 一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中:,(1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。(2)你所建立

3、的模型中温度在多大程度上解释了产卵数的变化?,非线性回归问题,假设线性回归方程为 :=bx+a,选 模 型,由计算器得:线性回归方程为y=19.87x-463.73 相关指数R2=r20.8642=0.7464,估计参数,解:选取气温为解释变量x,产卵数 为预报变量y。,所以,二次函数模型中温度解释了74.64%的产卵数变化。,探索新知,方案1,分析和预测,当x=28时,y =19.8728-463.73 93,一元线性模型,奇怪?,9366 ?模型不好?,方案2,问题3,合作探究,t=x2,二次函数模型,方案2解答,平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为

4、产卵数y和温度的平方t之间线性回归模型y=bt+a,作散点图,并由计算器得:y和t之间的线性回归方程为y=0.367t-202.543,相关指数R2=0.802,将t=x2代入线性回归方程得: y=0.367x2 -202.543当x=28时,y=0.367282-202.5485,且R2=0.802,所以,二次函数模型中温度解释了80.2%的产卵数变化。,产卵数,气温,指数函数模型,方案3,合作探究,对数,方案3解答,当x=28oC 时,y 44 ,指数回归模型中温度解释了98.5%的产卵数的变化,由计算器得:z关于x的线性回归方程为,对数变换:在 中两边取常用对数得,令 ,则 就转换为z=

5、bx+a.,相关指数R2=0.98,最好的模型是哪个?,线性模型,二次函数模型,指数函数模型,比一比,最好的模型是哪个?,回归分析(二),则回归方程的残差计算公式分别为:,由计算可得:,因此模型(1)的拟合效果远远优于模型(2)。,练习:为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:,(1)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图; (2) 描述解释变量与预报变量 之间的关系; (3) 计算残差、相关指数R2.,解:(1)散点图如右所示,(2)由散点图看出样本点分布在一条指数函数y= 的周围,于是令Z=lny,则,由计数器算得 则有,(3),即(解释变量)天数解释

6、了99.99%(预报变量)繁殖细菌得个数,理论迁移,例 1993年到2002年中国的国内生产总值(GDP)的数据(单位:亿元)如下:,(1)作GDP和年份的散点图,根据该图猜想它们之间的关系应是什么?(2)建立年份为解释变量GDP为预报变量的回归模型,并计算残差.(3)根据你得到的模型,预报2003年的GDP,看看你的预报与实际的GDP(117251.9亿元)的误差是多少?(4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由.,GDP与年份近似地呈线性关系.,2003年GDP预报值为112976.4,预报与实际相差4275.5,相关指数R20.974,说明年份能够解释97.4%的G

7、DP值变化,所建模型能很好地刻画GDP和年份的关系.,练习某运动员训练次数与运动成绩之间的数据关系如下:,试预测运动员训练次以及次的成绩,第一步:做散点图,第二步:求回归方程,第三步:残差图,残差图,第四步:计算相关指数,说明了该运动员的成绩的差异有是由训练次数引起的,说明了两个变量的相关关系非常强,第五步:作出预报,由上述分析可知,我们可以用回归方程,一般地,建立回归模型的基本步骤为:,1.确定研究对象,2.画散点图,3.由经验确定回归方程的类型,4.按一定规则估计回归方程中的参数,5. 分析残差图,. 下结论,. 分析残差图,小结:,作业: 假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。,若由资料知,y对x呈线性相关关系。试求:(1)线性回归方程 的回归系数 ;(2)求残差平方和;(3)求相关系数 ;(4)估计使用年限为10年时,维修费用是多少?,解:,(1)由已知数据制成表格。,所以有,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1