2017_2018版高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_.wps

上传人:无敌斩 文档编号:2910589 上传时间:2019-06-04 格式:WPS 页数:27 大小:782.50KB
返回 下载 相关 举报
2017_2018版高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_.wps_第1页
第1页 / 共27页
2017_2018版高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_.wps_第2页
第2页 / 共27页
2017_2018版高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_.wps_第3页
第3页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《2017_2018版高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_.wps》由会员分享,可在线阅读,更多相关《2017_2018版高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案新人教A版选修1_.wps(27页珍藏版)》请在三一文库上搜索。

1、1.11.1 回归分析的基本思想及其初步应用 1了解回归分析的思想和方法(重点) 2掌握相关系数的计算和判断线性相关的方法(重点) 3了解常见的非线性回归模型转化为线性回归模型的方法(难点) 基础初探 教材整理 1 线性回归模型 阅读教材 P2P4“探究”以上内容,完成下列问题 n 1 i1x ixyiy 1在线性回归方程 y a b x 中 b , a y b x .其中x n n i1xix2 n n 1 xi,y yi,(x,y)称为样本点的中心,回归直线过样本点的中心 n i 1 i1 2线性回归模型 ybxae,其中 a 和 b 为模型的未知参数,e 称为随机误差 3随机误差产生的原

2、因主要有以下几种: (1)所用的确定性函数不恰当引起的误差; (2)忽略了某些因素的影响; (3)存在观测误差 设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系根据一组样本 数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为 y 0.85x85.71,则下列结 论中正确的是_(填序号) (1)y 与 x 具有正的线性相关关系; (2)回归直线过样本点的中心(x,y); (3)若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg; 1 (4)若该大学某女生身高为 170 cm,则可断定其体重必为 58.79 kg. 【解析】 回归方程中 x的

3、系数为 0.850,因此 y与 x具有正的线性相关关系,(1)正确; 由回归方程系数的意义可知回归直线过样本点的中心(x,y),(2)正确; 依据回归方程中 b的含义可知,x每变化 1 个单位, y相应变化约 0.85个单位,(3)正确; 用回归方程对总体进行估计不能得到肯定结论,故(4)不正确 【答案】 (1)(2)(3) 教材整理 2 刻画回归效果的方式 阅读教材 P4“探究”以下至 P6“例 2”以上内容,完成下列问题 残差 对于样本点(xi,yi)(i1,2,n)的随机误差的估计值 eiyi yi, 称为相应于点(xi,yi)的残差 利用图形来分析残差特性,作图时纵坐标为残差,横坐标可

4、以选为样本 残差图 编号,或身高数据,或体重估计值等,这样作出的图形称为残差图 续表 残差 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样 图法 的带状区域的宽度越窄,说明模型的拟合精度越高 残差平 方和 n 残差平方和为 yi y i2,残差平方和越小,模型的拟合效果越好 i1 相关指 数 R2 n i1yi y i2 R21 ,R2表示解释变量对于预报变量变化的贡献率,R2 n i1yiy2 越接近于 1,表示回归的效果越好 甲、乙、丙、丁 4 位同学各自对 A、B两变量做回归分析,分别得到散点图与残差平方 n 和 (yi i) 2 如表所示: y i1 甲 乙 丙 丁

5、 散点图 残差平方和 115 106 124 103 _(填“甲”“乙”“丙”“丁”)同学的试验结果体现拟合 A、B两变量关系的模型拟 合精度高 【解析】 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方 2 n 和越小(对于已经获取的样本数据,R2表达式中 (yi )2为确定的数,则残差平方和越小,R2 y i1 越大),由回归分析建立的线性回归模型的拟合效果就越好,由试验结果知丁要好些 【答案】 丁 小组合作型 回归分析的有关概念 (1)有下列说法: 线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法; 利用样本点的散点图可以直观判断两个变量的关系是否

6、可以用线性关系表示; 通过回归方程 y bx a,可以估计和观测变量的取值和变化趋势; 因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验 其中正确命题的个数是( ) A1 B2 C3 D4 (2)如果某地的财政收入 x与支出 y满足线性回归方程 y bx ae(单位:亿元),其 中 b0.8, a2,|e|0.5,如果今年该地区财政收入 10 亿元,则今年支出预计不会超过 _亿. 【导学号:81092000】 【自主解答】 (1) 反映的是最小二乘法思想,故正确反映的是画散点图的作用, 也正确解释的是回归方程 y bx a的作用,故也正确是不正确的,在求回归方程 之前

7、必须进行相关性检验,以体现两变量的关系 (2)由题意可得: y0.8x2e,当 x10 时, y0.8102e10e,又 |e|0.5,9.5 y10.5. 故今年支出预计不会超过 10.5亿 【答案】 (1)C (2)10.5 1在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相 3 关关系,然后利用最小二乘法求出回归直线方程 2由线性回归方程给出的是一个预报值而非精确值 3随机误差的主要来源 (1)线性回归模型与真实情况引起的误差; (2)忽略了一些因素的影响产生的误差; (3)观测与计算产生的误差 4残差分析是回归分析的一种方法 再练一题 1下列有关线性回归的说法

8、,不正确的是_(填序号) 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系; 在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形 叫做散点图; 线性回归方程最能代表观测值 x,y之间的关系; 任何一组观测值都能得到具有代表意义的回归直线方程 【解析】 只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程 【答案】 线性回归分析 为研究重量 x(单位:克)对弹簧长度 y(单位:厘米)的影响,对不同重量的 6 个物 体进行测量,数据如下表所示: x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9

9、11.8 (1)作出散点图并求线性回归方程; (2)求出 R2; (3)进行残差分析 得到x,y有较 【 精 彩 点 拨 】 作散点图 好线性关系 代入公式求得线性回归方程 求出R2进行分析 【自主解答】 (1)散点图如图 1 x (51015202530)17.5, 6 4 1 y (7.258.128.959.9010.911.8)9.487, 6 6 6 x2i2 275, iyi1 076.2, x i1 i1 计算得, b0.183, a6.285, 所求回归直线方程 为 y0.183x6.285. (2)列表如下: yi y i 0.05 0.005 0.08 0.045 0.04

10、 0.025 yiy 2.24 1.37 0.54 0.41 1.41 2.31 6 6 所以 (yi i) 20.013 18, (yi )214.678 4. y y i1 i1 0.013 18 所以,R21 0.999 1, 14.678 4 回归模型的拟合效果较好 (3)由残差表中的数值可以看出第 3 个样本点的残差比较大,需要确认在采集这个数据的 时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看 出残差点比较均匀地落在不超过 0.15的狭窄的水平带状区域中,说明选用的线性回归模型的 精度较高,由以上分析可知,弹簧长度与拉力成线性关系 “相关指数 R

11、2、残差图”在回归分析中的作用 n i1yi y i2 1相关指数 R2是用来刻画回归效果的,由 R21 可知,R2越大,意味 n i1yiy2 着残差平方和越小,也就是说模型的拟合效果就越好 2残差图也是用来刻画回归效果的,判断依据是残差点比较均匀地分布在水平带状区域 中,带状区域越窄,说明模型拟合精度越高,回归方程预报的精度也越高 再练一题 2已知某种商品的价格 x(元)与需求量 y(件)之间的关系有如下一组数据: x 14 16 18 20 22 y 12 10 7 5 3 5 求 y对 x的回归直线方程,并说明回归模型拟合效果的好坏. 【导学号:81092001】 1 【解】 x (1

12、416182022)18, 5 1 y (1210753)7.4, 5 5 x2i1421621822022221 660, i1 5 xiyi14121610187205223620, i1 5 i1x iyi5x y 6205 18 7.4 所以 b 1.15. 5 1 6605 182 i1x2i5x2 a 7.41.151828.1, 所以所求回归直线 方程是 y1.15x28.1. 列出残差表: yi y i 0 0.3 0.4 0.1 0.2 yiy 4.6 2.6 0.4 2.4 4.4 5 5 所以, (yi i) 20.3, (yi )253.2, y y i1 i1 5 i

13、1yi y i2 R21 0.994, 5 i1yiy2 所以回归模型的拟合效果很好 探究共研型 非线性回归分析 探究 1 在研究两个变量的相关关系时,观察散点图样本点集中于某一条指数曲线 y cax(a0 且 a1,c0,a,c为常数)的周围,如何进行适当变换化为线性关系? 【提示】 对 ycax两边取自然对数 ln yln(cax), 即 ln yln cxln a, 令Error!原方程变为 yln cxln a, 然后按线性回归模型求出 ln a,ln c即可 探究 2 已知 x和 y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个? x 1 2 3 6 y 3 5.99 12

14、.01 y32x1; ylog2x; y4x; yx2. 【提示】 观察散点图中样本点的分布规律可判断样本点分布在曲线 y32x1附近所 以模拟效果最好的为. 某地区不同身高的未成年男性的体重平均值如下表: 身高 x(cm) 60 70 80 90 100 110 体重 y(kg) 6.13 7.90 9.99 12.15 15.02 17.50 身高 x(cm) 120 130 140 150 160 170 体重 y(kg) 20.92 26.86 31.11 38.85 47.25 55.05 (1)试建立 y与 x之间的回归方程; (2)如果一名在校男生身高为 168 cm,预测他的体

15、重约为多少? 【精彩点拨】 先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线 性相关的两个变量来求解 【自主解答】 (1)根据表中的数据画出散点图,如下: 由图看出,这些点分布在某条指数型函数曲线 yc1ec2x的周围,于是令 zln y,列表如 下: x 60 70 80 90 100 110 z 1.81 2.07 2.30 2.50 2.71 2.86 x 120 130 140 150 160 170 z 3.04 3.29 3.44 3.66 3.86 4.01 作出散点图,如下: 7 由表中 数据可求得 z 与 x 之间的回归直线方程为 z0.6930.020x,则

16、有 ye0.693 0.020x. (2)由(1)知,当 x168时, ye0.6930.02016857.57,所以在校男生身高为 168 cm,预 测他的体重约为 57.57 kg. 两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变 换的方法转化为线性回归模型,如 yc1ec2x,我们可以通过对数变换把指数关系变为线性关系, 令 zln y,则变换后样本点应该分布在直线 zbxaaln c1,bc2的周围. 再练一题 3在一次抽样调查中测得样本的 5 个样本点,数据如下表: x 0.25 0.5 1 2 4 y 16 12 5 2 1 试建立 y与 x之间的回

17、归方程 【解】 作出变量 y与 x之间的散点图如图所示 由图可知变量 y与 x近似地呈反比例函数关系 k 1 设 y ,令 t ,则 ykt.由 y与 x的数据表可得 y与 t的数据表: x x t 4 2 1 0.5 0.25 y 16 12 5 2 1 作出 y与 t的散点图如图所示 8 由图可知 y与 t呈近似的线性相关关系 5 5 又t1.55,y7.2, iyi94.25, t 2i21.312 5, t i1 i1 5 i1tiyi5t y 94.255 1.55 7.2 b 4.134 4, 5 21.312 55 1.552 i1t2i5t2 a y bt7.24.134 41

18、.550.8, y4.134 4t0.8. 4.134 4 所以 y与 x的回归方程是 y 0.8. x 1下列结论正确的是( ) 函数关系是一种确定性关系;相关关系是一种非确定性关系;回归分析是对具有函 数关系的两个变量进行统计分析的一种方法;回归分析是对具有相关关系的两个变量进行统 计分析的一种常用方法 A B C D 【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故 正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故错误,正确 【答案】 C 2下表是 x和 y之间的一组数据,则 y关于 x的线性回归方程必过点( ) x 1 2 3 4 y 1

19、3 5 7 A.(2,3) B(1.5,4) C(2.5,4) D(2.5,5) 【解析】 线性回归方程必过样本点的中心(x,y), 即(2.5,4),故选 C. 【答案】 C 9 3在两个变量 y与 x的回归模型中,分别选择了 4 个不同的模型它们的相关指数 R2如 下,其中拟合效果最好的模型是( ) A模型 1 的相关指数 R2为 0.98 B模型 2 的相关指数 R2为 0.80 C模型 3 的相关指数 R2为 0.50 D模型 4 的相关指数 R2为 0.25 【解析】 相关指数 R2越接近于 1,则该模型的拟合效果就越好,精度越高 【答案】 A 4对具有线性相关关系的变量 x和 y,

20、由测得的一组数据求得回归直线的斜率为 6.5,且 恒过(2,3)点,则这条回归直线的方程为_. 【导学号:81092002】 【解析】 由题意知x2,y3, b6.5,所以 ay bx36.5210,即回归 直线的方程为 y106.5x. 【答案】 y106.5x 5某零售店近五个月的销售额和利润额资料如下表: 月份 A B C D E 销售额 x(千万元) 3 5 6 7 9 利润额 y(百万元) 2 3 3 4 5 (1)画出散点图观察散点图,说明两个变量有怎样的相关关系; (2)用最小二乘法求利润额 y关于销售额 x的线性回归方程; (3)当销售额为 4(千万元)时,利用(2)的结论估计

21、该零售店的利润额(百万元) 【解】 (1)散点图如下 两个变量呈正线性相关关系 (2)设线性回归方程是 y bx a. 由题中的数据可知y3.4,x6. 5 i1x ixyiy 所以 b 5 i1xix2 10 3 1.41 0.40 0.41 0.63 1.6 9119 10 1 . 20 2 a 1 y bx3.4 60.4. 2 所以利润额 y 关于销售额 x的线性回归方程为 y0.5x0.4. (3)由(2)知,当 x4 时, y0.540.42.4, 所以当销售额为 4 千万元时,可以估计该店的利润额为 2.4百万元 学业分层测评 (建议用时:45分钟) 学业达标 一、选择题 1在画

22、两个变量的散点图时,下面叙述正确的是( ) A预报变量在 x轴上,解释变量在 y轴上 B解释变量在 x轴上,预报变量在 y轴上 C可以选择两个变量中任意一个变量在 x轴上 D可以选择两个变量中任意一个变量在 y轴上 【解析】 结合线性回归模型 ybxae可知,解释变量在 x轴上,预报变量在 y轴上, 故选 B. 【答案】 B 2在回归分析中,相关指数 R2的值越大,说明残差平方和( ) A越大 B越小 C可能大也可能小 D以上均错 n i1yi y i2 【解析】 R21 ,当 R2越大时, n i1yiy2 n (yi yi)2越小,即残差平方和越小,故选 B. i1 【答案】 B 3已知

23、x和 y之间的一组数据 x 0 1 2 3 y 1 3 5 7 则 y与 x的线性回归方程 y bx a必过点( ) 11 3 A(2,2) B.(,0 ) 2 3 C(1,2) D.(,4 ) 2 1 3 1 【解析】 x (0123) ,y (1357)4, 4 2 4 3 回归方程 y x a 必过点( . b ,4 ) 2 【答案】 D 4已知人的年龄 x 与人体脂肪含量的百分数 y 的回归方程为 y 0.577x0.448,如果某 人 36岁,那么这个人的脂肪含量( ) 【导学号:81092003】 A一定是 20.3% B在 20.3%附近的可能性比较大 C无任何参考数据 D以上解

24、释都无道理 【解析】 将x36代入回归方程得 y 0.577360.44820.3.由回归分析的意义知, 这个人的脂肪含量在 20.3%附近的可能性较大,故选 B. 【答案】 B 5若一函数模型为 yax2bxc(a0),为将 y 转化为 t 的线性回归方程,则需作变换 t( ) Ax2 B(xa)2 b C.(x2a)2 D以上都不对 b 【解析】 y 关于 t 的线性回归方程,实际上就是 y 关于 t 的一次函数,又因为 ya(x2a) 4acb2 2 ,所以可知选项 C 正确 4a 【答案】 C 二、填空题 6在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2

25、,xn 不全相等)的 1 散点图中,若所有样本点 (xi,yi)(i1,2,n)都在直线 y x1 上,则这组样本数据的 2 样本相关系数为_ 【解析】 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为 1. 【答案】 1 7已知方程 y 0.85x82.71是根据女大学生的身高预报她的体重的回归方程,其中 x 12 的单位是 cm, y的单位是 kg,那么针对某个体(160,53)的残差是_ 【解析】 把 x160 代入 y0.85x82.71, 得 y0.8516082.7153.29, 所以残差 ey y5353.290.29. 【答案】 0.29 8调查了某地若干户家庭

26、的年收入 x(单位:万元)和年饮食支出 y(单位:万元),调查显 示年收入 x与年饮食支出 y具有线性相关关系,并由调查数据得到 y对 x的回归直线方程: y 0.254x0.321.由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加 _万元 【解析】 以 x1 代 x,得 y0.254(x1)0.321,与 y0.254x0.321相减可得, 年饮食支出平均增加 0.254万元 【答案】 0.254 三、解答题 9关于某设备的使用年限 x和所支出的维修费用 y(万元),有如下的统计资料: x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0 如由资料可知 y对

27、x呈线性相关关系试求: (1)线性回归方程:( a y b x, b n i1xiyin x y i1x 2inx2) n (2)估计使用年限为 10 年时,维修费用是多少? 23456 【解】 (1)x 4, 5 2.23.85.56.57.0 y 5, 5 5 5 x2i90, xiyi112.3, i1 i1 b 5 i1xiyi5x y 112.35 4 5 1.23. 5 905 42 i1x2i5x2 于是 ay b x51.2340.08. 所以线性回归方程为 y1.23x0.08. 13 (2)当 x10时, y1.23100.0812.38(万元), 即估计使用 10年时维修

28、费用是 12.38 万元 10关于 x与 y有如下数据: x 2 4 5 6 8 y 30 40 60 50 70 为了对 x,y两个变量进行统计分析,现有以下两种线性模型:甲模型 y6.5x17.5, 乙模型 y7x17,试比较哪一个模型拟合的效果更好 5 i1yi y i2 155 【解】 R 甲21 1 0.845, 5 1 000 i1yiy2 5 i1yi y i2 180 R 乙21 1 0.82, 5 1 000 i1yiy2 因为 84.5%82%,所以甲模型拟合效果更好 能力提升 1某学生四次模拟考试时,其英语作文的减分情况如下表: 考试次数 x 1 2 3 4 所减分数 y

29、 4.5 4 3 2.5 显然所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为( ) Ay0.7x5.25 By0.6x5.25 Cy0.7x6.25 Dy0.7x5.25 【解析】 由题意可知,所减分数 y与模拟考试次数 x之间为负相关,所以排除 A.考试次 1 1 数的平均数为x (1234)2.5,所减分数的平均数为y (4.5432.5) 4 4 3.5.即直线应该过点(2.5,3.5),代入验证可知直线 y0.7x5.25成立,选 D. 【答案】 D 2已知 x与 y之间的几组数据如下表: x 1 2 3 4 5 6 y 0 2 1 3 3 4 假设根据上表数据

30、所得线性回归直线方程为 y b x a.若某同学根据上表中的前两组 数据(1,0)和(2,2)求得的直线方程为 ybxa,则以下结论正确的是 ( ) 14 A.bb, aa B.bb, aa D.ba. 【答案】 C 3已知 x,y的取值如下表所示,由散点图分析可知 y与 x线性相关,且线性回归方程为 y 0.95x2.6,那么表格中的数据 m的值为_. x 0 1 3 4 y 2.2 4.3 4.8 m 0134 2.24.34.8m 11.3m 【解析】 x 2,y ,把(x, y)代入回归方 4 4 4 11.3m 程得 0.9522.6,解得 m6.7. 4 【答案】 6.7 4某农科

31、所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研 究,他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每 100棵种子中的发 芽数,得到如下资料: 15 日期 12 月 1 日 12月 2 日 12 月 3 日 12月 4 日 12 月 5 日 温差 x() 10 11 13 12 8 发芽 y(颗) 23 25 30 26 16 该农科所确定的研究方案是:先从这 5 组数据中选取 3 组数据求线性回归方程,剩下的 2 组数据用于回归方程检验 (1)若选取的是 12 月 1 日与 12月 5 日的 2 组数据,请根据 12月 2 日至 12 月

32、 4 日的数据, 求出 y关于 x的线性回归方程 y bx a; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2 颗,则认为 得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? (3)请预测温差为 14 的发芽数 【解】 (1)由数据求得,x12,y27, 3 3 x2i434, iyi977. x i1 i1 5 由公式 求得, b , ay bx3. 2 5 所以 y关于 x的线性回归方程为 y x3. 2 5 (2)当 x10时, y 10322,|2223|2; 2 5 当 x8 时, y 8317,|1716|2. 2 所以该研究所得到的线性回归方程是可靠的 5 (3)当 x14时,有 y 14335332, 2 所以当温差为 14 时的发芽数约为 32颗. 16

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1