高考数学大一轮复习第十章统计与统计案例10.3相关性、最小二乘估计与统计案例课件文.ppt

上传人:本田雅阁 文档编号:2284589 上传时间:2019-03-17 格式:PPT 页数:88 大小:4.91MB
返回 下载 相关 举报
高考数学大一轮复习第十章统计与统计案例10.3相关性、最小二乘估计与统计案例课件文.ppt_第1页
第1页 / 共88页
高考数学大一轮复习第十章统计与统计案例10.3相关性、最小二乘估计与统计案例课件文.ppt_第2页
第2页 / 共88页
高考数学大一轮复习第十章统计与统计案例10.3相关性、最小二乘估计与统计案例课件文.ppt_第3页
第3页 / 共88页
亲,该文档总共88页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《高考数学大一轮复习第十章统计与统计案例10.3相关性、最小二乘估计与统计案例课件文.ppt》由会员分享,可在线阅读,更多相关《高考数学大一轮复习第十章统计与统计案例10.3相关性、最小二乘估计与统计案例课件文.ppt(88页珍藏版)》请在三一文库上搜索。

1、10.3 变量间的相关关系、统计案例,第十章 统计与统计案例,基础知识 自主学习,课时作业,题型分类 深度剖析,内容索引,基础知识 自主学习,1.相关性 (1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的 . (2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为 . (3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是 的,若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是 的.如果所有的点在散点图中没有显示 关系,则称变量

2、间是 的.,知识梳理,散点图,曲线拟合,非线性相关,线性相关,任何,不相关,2.线性回归方程 (1)最小二乘法 如果有n个点(x1,y1),(x2,y2),(xn,yn),可以用y1(abx1)2y2(abx2)2yn(abxn)2来刻画这些点与直线yabx的接近程度,使得上式达到最小值的直线yabx就是所要求的直线,这种方法称为最小二乘法.,(2)线性回归方程 方程ybxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的线性回归方程,其中a,b是待定参数.,b,a,3.回归分析 (1)定义:对具有 的两个变量进行统计分析的一种常用方法. (2)样本点的中

3、心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中, 称为样本点的中心.,相关关系,当r0时,表明两个变量 ; 当r0时,表明两个变量 ; 当r0时,表明两个变量 . |r|值越接近于1,表明两个变量之间的线性相关程度 . |r|值越接近于0,表明两个变量之间的线性相关程度越低.,(3)相关系数,正相关,负相关,越高,线性不相关,2,2,4.独立性检验 设A,B为两个变量,每一个变量都可以取两个值, 变量A:A1,A2 变量B:B1,B2 22列联表:,构造一个统计量 2 . 利用统计量2来判断“两个分类变量有关系”的方法称为独立性检验. 当22.706时,没有

4、充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的; 当22.706时,有90%的把握判定变量A,B有关联; 当23.841时,有95%的把握判定变量A,B有关联; 当26.635时,有99%的把握判定变量A,B有关联.,题组一 思考辨析 1.判断下列结论是否正确(请在括号中打“”或“”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. ( ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ),基础自测,1,2,3,4,5,6,(4)某同学研究卖出的热饮杯数y与气温x(

5、)之间的关系,得线性回归方程y2.352x147.767,则气温为2时,一定可卖出143杯热饮.( ) (5)事件X,Y关系越密切,则由观测数据计算得到的2值越大.( ),1,2,4,5,6,3,题组二 教材改编 2.为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力 A.回归分析 B.均值与方差 C.独立性检验 D.概率,答案,解析 “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.,解析,1,2,4,5,6,3,3.下面是22列联表:,答案,解析 a2173, a52.又a22

6、b,b74.,解析,1,2,4,5,6,则表中a,b的值分别为 A.94,72 B.52,50 C.52,74 D.74,52,3,4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y0.67x54.9.,设表中的“模糊数字”为a, 则62a758189755,a68.,解析,答案,1,2,4,5,6,现发现表中有一个数据看不清,请你推断出该数据的值为_.,68,3,题组三 易错自纠 5.某医疗机构通过抽样调查(样本容量n1 000),利用22列联表和2统计量研究患肺病是否与吸烟有关.计算得24.453,经查阅临界

7、值表知P(23.841)0.05,现给出四个结论,其中正确的是 A.在100个吸烟的人中约有95个人患肺病 B.若某人吸烟,那么他有95%的可能性患肺病 C.有95%的把握认为“患肺病与吸烟有关” D.只有5%的把握认为“患肺病与吸烟有关”,解析,答案,1,2,4,5,6,解析 由已知数据可得,有10.0595%的把握认为“患肺病与吸烟有关”.,3,现已知其线性回归方程为y0.36xa,则根据此线性回归方程估计数学得90分的同学的物理成绩为_.(四舍五入到整数),6.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系),解析,答案,1,2,4,5,6,73

8、,3,1,2,4,5,6,3,所以660.3670a,a40.8, 即线性回归方程为y0.36x40.8. 当x90时,y0.369040.873.273.,题型分类 深度剖析,1.观察下列各图形,,解析,答案,题型一 相关关系的判断,自主演练,其中两个变量x,y具有相关关系的图是 A. B. C. D.,解析 由散点图知中的点都分布在一条直线附近. 中的点都分布在一条曲线附近,所以中的两个变量具有相关关系.,A.逐年比较,2008年减少二氧 化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放 显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年

9、排放量与年份正相关,2.(2018广州质检)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的条形统计图.以下结论不正确的是,解析,答案,解析 从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确; 2007年二氧化硫排放量较2006年降低了很多,B选项正确; 虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,C选项正确; 自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.,x,y是负相关关系; 在该相关关系中,若用y 拟合时的相关系数为r1,用ybxa

10、 拟合时的相关系数为r2,则r1r2; x,y之间不能建立线性回归方程.,3.x和y的散点图如图所示,则下列说法中所有正确命题的序号为_.,解析,答案,由散点图知用y 拟合比用ybxa拟合效果要好,则r1r2,故正确;,解析 在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故正确;,x,y之间可以建立线性回归方程,但拟合效果不好,故错误.,判定两个变量正,负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关. (2)相关系数:r0时,正相关;r0时,正相关;b0时,负相关.,典例 (2017全国)为了监控某种零件

11、的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尽寸:,题型二 线性回归分析,师生共研,(1)求(xi,i)(i1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);,解答,由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.,(2)一天内抽检零件中,如果出现了尺寸在 之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,

12、需对当天的生产过程进行检查.,从这一天抽检的结果看,是否需对当天的生产过程进行检查?,解答,解答,解 剔除离群值,即第13个数据,剩下数据的平均数为,因此这条生产线当天生产的零件尺寸的均值的估计值为10.02.,剔除第13个数据,剩下数据的样本方差为,线性回归分析问题的类型及解题方法 (1)求线性回归方程 利用公式,求出回归系数b,a. 待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b. (4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量

13、的线性相关性越强.,跟踪训练 (2018惠州月考)以下是某地收集到的新房屋的销售价格y和房屋的面积x的数据:,(1)画出数据对应的散点图;,解答,解 数据对应的散点图如图所示:,(2)求线性回归方程,并在散点图中画出回归直线;,解答,设所求线性回归方程为ybxa,则,故所求线性回归方程为y0.196 2x1.814 2.,(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.,解答,解 根据(2),当x150时,销售价格的估计值为 y0.196 21501.814 231.244 231.2(万元).,典例 (2017全国)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时

14、各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,题型三 独立性检验,师生共研,(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;,解答,解 旧养殖法的箱产量低于50 kg的频率为 (0.0120.0140.0240.0340.040)50.62. 因此,事件A的概率估计值为0.62.,(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:,解答,解 根据箱产量的频率分布直方图得列联表如下:,由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关.,(3)根据箱产量的频率分布直方图,对两种养殖方法的

15、优劣进行比较. 附:,解答,解 箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.,(1)比较几个分类变量有关联的可能性大小的方法 通过计算2的大小判断:2越大,两变量有关联的可能性越大. 通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大. (2)独立性检验的一般步骤 根据样本数据制成22列联表.,比较2与临界值的大小关系,作统计推断

16、.,跟踪训练 (2017石家庄质检)微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有 是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22列联表:,解答,解 由已知可得,该公司员工中使用微信的有20090%180(人). 经常使用微信的有18060120(人),,使用微信的

17、人中青年人有18075%135(人), 故22列联表如下:,由于13.33310.828,所以有99.9%的把握认为“经常使用微信与年龄有关”.,(2)根据22列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”?,解答,解 将列联表中数据代入公式可得:,思想方法指导 回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.,求线性回归方程的方法技巧,思想方法,典例 (12分)某地最近十年粮食需求量逐年上

18、升,下表是部分统计数据:,(1)利用所给数据求年需求量与年份之间的线性回归方程ybxa; (2)利用(1)中所求出的线性回归方程预测该地2018年的粮食需求量.,思想方法指导,规范解答,规范解答 解 (1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.,由上述计算结果,知所求线性回归方程为 y2576.5(x2010)3.2, 即y6.5(x2010)260.2. 8分 (2)利用所求得的线性回归方程,可预测2018年的粮食需求量大约为6.5(20182010)260.26.58260.2312.2(万吨). 12分,课时作业,1.两个变量y与x的回

19、归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是 A.模型1的相关系数r为0.98 B.模型2的相关系数r为0.80 C.模型3的相关系数r为0.50 D.模型4的相关系数r为0.25,基础保分练,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析 相关系数r越大,拟合效果越好,因此模型1拟合效果最好.,2.(2018洛阳月考)为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算20.99,根据这一数据分析,下列说法正确的是 A.有99%的人认为该电视栏目优秀 B.有99%的人认为

20、该电视栏目是否优秀与改革有关系 C.有99%的把握认为该电视栏目是否优秀与改革有关系 D.没有理由认为该电视栏目是否优秀与改革有关系,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析 只有26.635才能有99%的把握认为该电视栏目是否优秀与改革有关系,而即使26.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关.故只有D正确.,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16

21、,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,线性回归方程为y4x70. 将x24代入上式,得y42470166.故选C.,假设根据上表数据所得的线性回归方程为ybxa.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是 A.bb,aa B.bb,aa D.bb,aa,5.(2018湖南永州模拟)已知x与y之间的几组数据如下表:,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1,2,

22、3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析 由两组数据(1,0)和(2,2)可求得直线方程为y2x2,b2,a2.而利用线性回归方程的公式与已知表格中的数据,,所以ba.,6.某地2009年至2015年中,每年的人口总数y(单位:万)的数据如下表:,若t与y之间具有线性相关关系,则其回归直线ybta一定过点 A.(3,9) B.(9,3) C.(6,14) D.(4,11),解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,所以回归直线ybta一定过点(3,9).,根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收

23、入与年平均支出有_相关关系.(填“正”或“负”),7.某市居民20102014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,13,解析,答案,解析 中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.,正,8.以下四个命题,其中正确的序号是_. 从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样; 两个随机变量相关性越强,则相关系数的绝对值越接近于1; 在线性回归方程

24、y0.2x12中,当自变量x每增加一个单位时,因变量y平均增加0.2个单位; 对分类变量X与Y的统计量2来说,2越小,“X与Y有关系”的把握程度越大.,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析 是系统抽样; 对于,统计量2越小,说明两个相关变量有关系的把握程度越小.,9.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示22列联表:,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,95%,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,因为

25、5.0244.8443.841, 所以有95%的把握认为选修文科与性别有关.,由表中数据得线性回归方程ybxa中的b2,预测当气温为4 时,用电量约为_度.,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,68,10.某单位为了了解用电量y(度)与气温x()之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,因为回归直线过样本点的中心,所以a40(2)1060, 所以当x4时,y(2)(4)6068,所以用电量约为68度.,11.某地区2009年至2015年农村

26、居民家庭人均纯收入y(单位:千元)的数据如下表:,解答,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,(1)求y关于t的线性回归方程;,解 由所给数据计算得,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,所求线性回归方程为y0.5t2.3.,(2)利用(1)中的线性回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入.,解答,1,2,3,4,5,6,7,8,9,10,11,12,13,1

27、4,15,16,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解 由(1)知,b0.50,故2009年至2015年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元. 将2018年的年份代号t10代入(1)中的线性回归方程,得y0.5102.37.3, 故预测该地区2018年农村居民家庭人均纯收入为7.3千元.,12.(2017西安质检)某省会城市地铁将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1

28、,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解 “赞成定价者”的月平均收入为,“认为价格偏高者”的月平均收入为,“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1x250.5638.7511.81(百元).,(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差异是多少(结果保留2位小数);,解答,解答,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,(2)由以上统计数据填下面22列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.

29、,没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解 根据条件可得22列联表如下:,技能提升练,解析,答案,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,14.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;,解答,1,2,3,4,5,6,7,8,9,10,11,12,1

30、3,14,15,16,(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解答,因为9.9676.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.,(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由. 附:,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解答,解 由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例

31、有明显差异,因此在调查时,先确定该地区老年人中男,女的比例,再把老年人分成男,女两层并采用分层抽样方法,比采用简单随机抽样方法更好.,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,拓展冲刺练,答案,解析,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,12,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解析 设男生人数为x,由题意可得列联表如下:,若有95%的把握认为是否喜欢韩剧和性别有关, 则23.841,,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解得x10.2

32、43.,16.(2017包头一模)如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图. 注:年份代码17分别对应年份20102016.,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解答,(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解 由折线图中的数据得,,因为y与t的相关系数近似为0.935,说明y与t的线性相关程度相当大,所以可以用线性回归模型拟合y与t的关系.,(2)建立y关于t的回归方程,预测2017年该企业的污水净化量;,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,解答,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,所以预测2017年该企业污水净化量约为57吨.,本课结束,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1