黄冈名师2020版高考数学大一轮复习11.3变量间的相关关系与统计案例课件理新人教A.ppt

上传人:白大夫 文档编号:4887481 上传时间:2019-12-30 格式:PPT 页数:115 大小:9MB
返回 下载 相关 举报
黄冈名师2020版高考数学大一轮复习11.3变量间的相关关系与统计案例课件理新人教A.ppt_第1页
第1页 / 共115页
黄冈名师2020版高考数学大一轮复习11.3变量间的相关关系与统计案例课件理新人教A.ppt_第2页
第2页 / 共115页
黄冈名师2020版高考数学大一轮复习11.3变量间的相关关系与统计案例课件理新人教A.ppt_第3页
第3页 / 共115页
黄冈名师2020版高考数学大一轮复习11.3变量间的相关关系与统计案例课件理新人教A.ppt_第4页
第4页 / 共115页
黄冈名师2020版高考数学大一轮复习11.3变量间的相关关系与统计案例课件理新人教A.ppt_第5页
第5页 / 共115页
点击查看更多>>
资源描述

《黄冈名师2020版高考数学大一轮复习11.3变量间的相关关系与统计案例课件理新人教A.ppt》由会员分享,可在线阅读,更多相关《黄冈名师2020版高考数学大一轮复习11.3变量间的相关关系与统计案例课件理新人教A.ppt(115页珍藏版)》请在三一文库上搜索。

1、第三节 变量间的相关关系与统计案例 (全国卷5年2考),【知识梳理】 1.相关关系与回归方程 (1)相关关系的分类 正相关:从散点图上看,点散布在从_到_ 的区域内;,左下角,右上角,负相关:从散点图上看,点散布在从_到_ 的区域内.,左上角,右下角,(2)线性相关关系:如果散点图中点的分布从整体上看大 致在_附近,则称这两个变量之间具有线性相关 关系,这条直线叫做_.,一条直线,回归直线,(3)回归方程 最小二乘法:使得样本数据的点到回归直线的_ _最小的方法叫做最小二乘法.,距离,的平方和,回归方程:两个具有线性相关关系的变量的一组数据: (x1,y1),(x2,y2),(xn,yn),其

2、回归方程为 则,其中, 是回归方程的_, 是在y轴上的_.,斜率,截距,(4)样本相关系数 r= ,用它来衡量两个变量间的线性 相关关系. 当r0时,表明两个变量_; 当r0时,表明两个变量_;,正相关,负相关,r的绝对值越接近1,表明两个变量的线性相关性_; r的绝对值越接近于0,表明两个变量之间几乎不存在线性 相关关系.通常当|r|0.75时,认为两个变量有很强的线 性相关关系.,越强,2.残差分析 (1)残差:对于样本点(x1,y1),(x2,y2),(xn,yn),它们 的随机误差为ei=yi-bxi-a,i=1,2,n,其估计值为 i=yi- i=yi- xi- ,i=1,2,n,

3、i称为相应于点 (xi,yi)的残差.,(2)残差平方和为 (3)相关指数:R2=1- _.,3.独立性检验 (1)22列联表:假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为:,a+b,b+d,(2)K2统计量 K2= (其中n=a+b+c+d为样本容 量).,【常用结论】 1.函数关系与相关关系的区别与联系 (1)区别: 函数关系是一种确定性关系,相关关系是一种非确定性关系. 函数关系是一种因果关系,相关关系不一定是一种因果关系,也可能是伴随关系.,(2)联系:对于线性相关关系,求出线性回归方程后,可以通过确定的函数关系进行两个变量取值的

4、预测.,2.回归直线及其方程的性质 (1)回归直线不一定过样本点,但是一定过样本中心点 ( , ). (2)在回归直线方程 中, 0时,两个变量呈正 相关关系; 0时,两个变量呈负相关关系.,3.22列联表中统计量K2的含义 (1)独立性检验的概率假设是两个变量不相关. (2)K2越大,不相关的概率越小,相关的概率越大.,【基础自测】 题组一:走出误区 1.判断正误(正确的打“”,错误的打“”) (1)回归直线至少过散点图中的一个点. ( ) (2)利用回归直线方程计算出的 值是变量的准确取值. ( ),(3)样本相关系数r越大说明两个变量的相关性越强. ( ),提示:(1).回归直线可能不过

5、散点图中的任何一个点. (2).利用回归直线方程计算出的 值是预测值,不是 准确值. (3).|r|越接近1说明两个变量的相关性越强.,2.在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2, x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi) (i=1,2,n)都在直线y= x+1上,则这组样本数据的 样本相关系数为( ) A.-1 B.0 C. D.1,【解析】选D.所有点均在直线上,则样本相关系数最大即为1.,题组二:走进教材 1.(必修3P90例题改编)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:,y与

6、x负相关且 =2.347x-6.423;y与x负相关且 =-3.476x+5.648;y与x正相关且 =5.437x+8.493; y与x正相关且 =-4.326x-4.578. 其中一定不正确的结论的序号是 ( ),A. B. C. D.,【解析】选D. = x+ ,当 0时,为正相关, 0为 负相关,故错误.,2.(必修3P94T3改编)某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:,则y对x的线性回归直线方程为 ( ) A. =2.3x-0.7 B. =2.3x+0.7 C. =0.7x-2.3 D. =0.7x+2.3,【解析】选C.因为 xiyi=62+83+1

7、05+126 =158, 所以 = =4-0.79=-2.3. 故线性回归直线方程为 =0.7x-2.3.,考点一 相关关系的判断 【题组练透】 1.观察下列散点图,其中两个变量的相关关系判断正确的是 ( ),A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关 C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关,【解析】选D.根据散点图,由相关性可知: 图a各点散布在从左下角到右上角的区域里,是正相关; 图b中各点分布不成带状,相关性不明确,所以不相关; 图c中各点分布在从左上方到右下方的区域里,是负相关.,2.下列命题中正确的为 ( )

8、 A.线性相关系数r越大,两个变量的线性相关性越强 B.线性相关系数r越小,两个变量的线性相关性越弱 C.残差平方和越小的模型,模型拟合的效果越好 D.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好,【解析】选C.线性相关系数|r|越接近1,两个变量的线性相关性越强,所以A,B错误; 残差平方和越小的模型,模型拟合的效果就越好,C正确;相关指数R2来刻画回归效果,R2越大,说明模型的拟合效果就越好,所以D错误.,3.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关,下列结论正确的是 ( ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相

9、关,x与z负相关 D.x与y负相关,x与z正相关,【解析】选C.因为y=-0.1x+1的斜率小于0,所以x与y负 相关,因为y与z正相关,可设z=by+a,b0,则z=by+a= -0.1b+b+a,故x与z负相关.,4.下列关系中,是相关关系的为_.(填序号) (1)学生的学习态度与学习成绩之间的关系. (2)教师的执教水平与学生的学习成绩之间的关系. (3)学生的身高与学生的学习成绩之间的关系. (4)家庭的经济条件与学生的学习成绩之间的关系.,【解析】由相关关系的概念知(1)(2)是相关关系. 答案:(1)(2),【规律方法】 1.判断相关关系的两种方法 (1)散点图法:如果所有的样本点

10、都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. (2)相关系数法:利用相关系数判定,|r|越趋近于1相关性越强.,2.判断拟合效果的两个方法 (1)残差平方和越小,拟合效果越好. (2)相关指数R2越大,越接近于1,拟合效果越好.,考点二 独立性检验 【典例】(1)“人机大战,柯洁哭了,机器赢了”,2017 年5月27日,19岁的世界围棋第一人柯洁03不敌人工 智能系统AlphaGo,落泪离席,但许多人认为这场比赛是 人类的胜利,也有许多人持反对意见,有网友为此进行 了调查,在参与调查的2 600男性中,有1 560人持反对,意见

11、,2 400名女性中,有1 118人持反对意见,在运用这些数据说明“性别”对判断“人机大战是人类的胜利”是否有关系时,应采用的统计方法是 ( ) A.分层抽样 B.回归分析 C.独立性检验 D.频率分布直方图,(2)为了研究“晚上喝绿茶与失眠”有无关系,调查了100名人士,得到下面的列联表:,由已知数据可以求得:K2的观测值k= 4.398,则根据下面临界值表:,可以做出的结论是 ( ) A.在犯错误的概率不超过0.01的前提下认为“晚上喝绿茶与失眠有关” B.在犯错误的概率不超过0.01的前提下认为“晚上喝绿茶与失眠无关”,C.在犯错误的概率不超过0.05的前提下认为“晚上喝绿茶与失眠有关”

12、 D.在犯错误的概率不超过0.05的前提下认为“晚上喝绿茶与失眠无关”,【解析】(1)选C.在参加调查的2 600名男性中有1 560名持反对意见,2 400名女性中有1 118名持反对意见,编写列联表如下:,是针对两个变量,两种判断认定是否有关,因此应该利用独立性检验判断.,(2)选C.由已知数据求得: K2的观测值k= 4.398, 且4.3983.841, 所以在犯错误的概率不超过0.05的前提下认为“晚上 喝绿茶与失眠有关”.,【误区警示】此处容易混淆“有多大的把握”和“犯 错误的概率不超过”两种问法,有多大的把握应为1- P( ),犯错误的概率则是P( ).,【互动探究】 本例(1)

13、中,试判断至少有多大的把握认为性别对判断“人机大战是人类的胜利”有关?,【解析】由本例(1)解析中的列联表可得K2的观测值 k= 90.31710.828,因 此有99.9%的把握认为性别对判断“人机大战是人类的 胜利”有关.,【规律方法】 独立性检验的一般步骤 (1)根据样本数据列出22列联表.,(2)计算随机变量K2的观测值k,查下表确定临界值k0:,(3)如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能推断“X与Y有关”.,【对点训练】 1.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85

14、分以下为非优秀统计成绩,得到如表所示的列联表:,已知在全部105人中随机抽取1人,成绩优秀的概率为 , 则下列说法正确的是 ( ) A.列联表中c的值为30,b的值为35 B.列联表中c的值为15,b的值为50,C.根据列联表中的数据,在犯错误的概率不超过0.05的前提下,能认为“成绩与班级有关系” D.根据列联表中的数据,在犯错误的概率不超过0.05的前提下,不能认为“成绩与班级有关系”,【解析】选C.由题意知,成绩优秀的学生数是30,成绩非 优秀的学生数是75,所以c=20,b=45,选项A,B错误.根据 列联表中的数据,得到K2的观测值k= 6.1093.841,因此在犯错误的概率不超过

15、0.05的前提 下认为“成绩与班级有关系”.,2.某工厂为了调查工人文化程度与月收入之间的关系,随机调查了部分工人,得到如表所示的22列联表(单位:人):,由22列联表计算可知,我们有_以上的把握认为“文化程度与月收入有关系”. 附:K2=,【解析】由表中的数据可得K2的观测值 k= 6.109,由于6.1095.024, 所以我们有97.5%以上的把握认为“文化程度与月收入有关系”. 答案:97.5%,考点三 线性回归方程 【明考点知考法】 线性回归方程是高考的常考知识点,在选择题、填空题、解答题中均有考查,主要考查线性回归方程的求法及应用.,命题角度1 线性回归直线性质的应用 【典例】某食

16、品研究部门为了了解一种酒的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒,并测定了其芳香度(如表).,由最小二乘法得到回归方程 =1.03x+1.13,但不小心 在检测后滴到表格上一滴检测液,污损了一个数据,请 你推断该数据为 ( ) A.6.1 B.6.28 C.6.5 D.6.8,【解析】选A. 由表中数据: = (0+1+4+5+6+8)=4, 回归方程 =1.03x+1.13, 所以 =1.034+1.13=5.25, 所以 = (1.3+1.8+5.6+?+7.4+9.3)=5.25, 解得“?”=6.1.,【状元笔记】 样本中心点的应用 回归直线过样本点中心是

17、回归直线的重要性质,在求回归直线的系数、求未知数据中有着广泛的应用.,命题角度2 回归直线方程的求法 【典例】实验测得四组数对(x,y)的值为(1,2),(2,5), (4,7),(5,10),则y与x之间的回归直线方程是 ( ) A. =1.8x+0.6 B. =1.8x-0.6 C. =1.5x+2.5 D. =-0.5x+7.5,参考公式:,【解析】选A.表中数据 (xi- )(yi- )=(1-3)(2-6)+(2-3)(5-6)+(4-3)(7- 6)+(5-3)(10-6)=18, (xi- )2=(1-3)2+(2-3)2+(4-3)2+(5-3)2=10,所以 =1.8, =6

18、-31.8=0.6. 则回归方程为: =1.8x+0.6.,【状元笔记】 关于回归直线方程的求法 求线性回归方程的关键是计算系数 ,首先要明确公 式中各个因式的含义,其次是充分利用合并、约分等运 算律简化运算.,命题角度3 利用回归直线方程进行预测 【典例】某品牌手机厂商推出新款的旗舰机型,并在某 地区跟踪调查得到这款手机上市时间(x个月)和市场占 有率(y%)的几组相关对应数据:,(1)根据上表中的数据,用最小二乘法求出y关于x的线性回归方程. (2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精准到月).,【解析

19、】(1)根据表中数据,计算 = (1+2+3+4+5)=3, = (0.02+0.05+0.1+0.15+0.18)=0.1, 所以 = =0.042, 所以 =0.1-0.0423=-0.026, 所以线性回归方程为 =0.042x-0.026.,(2)由上面的回归方程可知,上市时间与市场占有率正 相关, 即上市时间每增加1个月,市场占有率都增加0.042个百 分点; 由 =0.042x-0.0260.5,解得x13; 预计上市13个月时,市场占有率能超过0.5%.,【状元笔记】 线性回归方程的应用 求出线性回归方程后可以对变量的取值进行预测,要注意通过回归直线方程求出的数据不同于真实值,是

20、预测值.,【对点练找规律】 1.为了规定工时定额,需要确定加工零件所花费的时间, 为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3, y3),(x4,y4),(x5,y5),根据收集到的数据可知 =20,由 最小二乘法求得回归直线方程为 =0.6x+48,则 yi= ( ),A.60 B.120 C.150 D.300,【解析】选D.由题意, =20,回归直线方程 =0.6x+48, 所以 =0.620+48=60. 则 yi=605=300.,2.登山族为了了解某山高y(km)与气温x()之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:,由表中数据,得到线性

21、回归方程 =-2x+ ( R),由 此请估计出山高为72(km)处气温的度数为 ( ) A.-10 B.-8 C.-4 D.-6 ,【解析】选D.由题意, 代入到线性回归方程 =-2x+ ( R),可得 =60, 所以y=-2x+60,由-2x+60=72,可得x=-6.,3.在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差,班主任为了了解个别学生的偏科情况,为学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行偏差分析,决定从全班40位同学中随机抽取一个容量为8的样本进行分析,得到他们的两科成绩偏差数据如下:,(1)已知x与y之间具有线性相关关系,求y关于x

22、的线性回归方程. (2)若这次考试该班数学平均分为120分,物理平均分为92分,试预测数学成绩126分的同学的物理成绩.,【解析】(1)由题意计算得, = , = , 所以,所以线性回归方程为 = x+ .,(2)由题意,设该同学的物理成绩为, 则物理偏差为-92, 而数学偏差为126-120=6, 则由(1)的结论可得-92= 6+ , 解得=94,所以可以预测这位同学的物理成绩为94分.,数学能力系列27解决相关变量之间的关系时的数学建模能力 【能力诠释】数学建模能力是重要的数学能力,也是核心素养之一,收集数据,建立模型,解决问题是最常用的数学思维和方法.,【典例】如图是我国2011年至2

23、017年生活垃圾无害化处理量(单位:亿吨)的折线图.,注:年份代码1-7分别对应年份2011-2017 (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明. (2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.,附注: 参考数据: yi=9.32, tiyi=40.17,参考公式:相关系数,回归方程 中斜率和截距的最小二乘估计公式 分别为:,【解析】 (1)由折线图中数据和附注中参考数据得 =4, (ti- )2=28, (ti- )(yi- )= tiyi- yi =40.17-49.32=2.89, r= 0.99.,因为y与

24、t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.,(2)由 1.331及(1)得 =1.331-0.10340.92.,所以,y关于t的回归方程为 =0.92+0.10t. 将2019年对应的t=9代入回归方程得 =0.92+0.109=1.82. 所以预测2019年我国生活垃圾无害化处理量约为1.82 亿吨.,【技法点拨】数学建模的过程 (1)建模准备:了解问题的实际背景,明确其实际意义,掌握对象的各种信息. (2)建模假设:根据实际对象的特征和建模的目的,对问题进行必要的简化,并用精确的语言提出一些恰当的假设.,(3)模型建立:在假设的基

25、础上,利用适当的数学工具来刻画各变量常量之间的数学关系,建立相应的数学结构. (4)模型求解:利用获取的数据资料,对模型的所有参数做出计算(或近似计算).,(5)模型检验:将模型分析结果与实际情形进行比较,以此来验证模型的准确性、合理性和适用性.,【即时训练】 棉红铃虫又称红铃虫,是世界性重要害虫,适宜温度为 2530,而温度在20以下,或35以上对红铃虫 均不利,一只红铃虫的产卵数y与温度x有关,现收集了7 组观测数据列于表中,现有模型y=C1x+C2与模型y= 两种模型作为产卵数y和温度x的回归方程来建立 两个变量之间的关系.,参考公式:C1= 21.38, C3= 0.32, =80,

26、3.57,对于一组数据(u1,v1),(u2,v2),(u3,v3),(un,vn),其 回归直线方程为 = u+ . (1)根据表中数据,分别建立两个模型下y关于x的回归 方程.,(2)假设根据模型,计算得出数据 的值 分别为0.33与0.22,试计算模型、的相关指数R2, 并根据相关指数选择出拟合效果较好的模型.,(3)能否用第(2)问选择的模型来预测在零上45摄氏度时一只红铃虫的产卵数,只给出判断不用说明理由.,【解析】(1)对于模型:C1= 21.38, 由y=C1x+C2,可得C2= -C1 =80-21.3826 =-475.88,所以模型的回归方程为: =21.38x-475.88. 对于模型:C3= 0.32. 由 可得C4= -C3 =3.57-0.3226=-4.75,所以模型的回归方程为: =e0.32x-4.75.,(2)在模型中: =1- =1-0.33=0.67, 在模型中: =1- =1-0.22=0.78, 所以R2R1,所以模型拟合效果较好.,(3)不能.(因为样本的取值范围会影响回归方程的使用范围),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1