高考数学一轮复习第十章统计与统计案例10-3变量间的相关关系统计案例学案理练习.pdf

上传人:数据九部 文档编号:10092228 上传时间:2021-04-18 格式:PDF 页数:19 大小:139.04KB
返回 下载 相关 举报
高考数学一轮复习第十章统计与统计案例10-3变量间的相关关系统计案例学案理练习.pdf_第1页
第1页 / 共19页
高考数学一轮复习第十章统计与统计案例10-3变量间的相关关系统计案例学案理练习.pdf_第2页
第2页 / 共19页
高考数学一轮复习第十章统计与统计案例10-3变量间的相关关系统计案例学案理练习.pdf_第3页
第3页 / 共19页
高考数学一轮复习第十章统计与统计案例10-3变量间的相关关系统计案例学案理练习.pdf_第4页
第4页 / 共19页
高考数学一轮复习第十章统计与统计案例10-3变量间的相关关系统计案例学案理练习.pdf_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《高考数学一轮复习第十章统计与统计案例10-3变量间的相关关系统计案例学案理练习.pdf》由会员分享,可在线阅读,更多相关《高考数学一轮复习第十章统计与统计案例10-3变量间的相关关系统计案例学案理练习.pdf(19页珍藏版)》请在三一文库上搜索。

1、欢迎下载。 1 / 19 高考数学一轮复习第十章统计与统计案例10-3 变量间的 相关关系统计案例学案理练习 考纲展示 ? 1. 会作两个相关变量的散点图,会利用散点图认识变量之间的相 关关系 2了解最小二乘法的思想,能根据给出的线性回归系数公式建立 线性回归方程 3了解独立性检验 (只要求22 列联表 )的基本思想、方法及其 简单应用 4了解回归分析的基本思想、方法及其简单应用 考点 1 变量间的相关关系 1. 常见的两变量之间的关系有两类:一类是函数关系,另一类是 _;与函数关系不同, _是一种非确定性关系 答案:相关关系相关关系 2从散点图上看,点散布在从左下角到右上角的区域内,两个变

2、量的这种相关关系称为_,点散布在左上角到右下角的区域 内,两个变量的相关关系为_ 答案:正相关负相关 对回归系数的理解:解释变量;预报变量 欢迎下载。 2 / 19 某工厂工人月工资y( 元)依劳动产值x( 万元) 变化的回归直线方程 为900 x600,下列判断正确的是 _ 劳动产值为 10 000 元时,工资为 500元; 劳动产值提高10 000 元时,工资提高 1 500 元; 劳动产值提高10 000 元时,工资提高 900元; 劳动产值为 10 000 元时,工资为 900元 答案: 解析:回归系数的意义为:解释变量每增加1 个单位,预报变量 平均增加 b 个单位 . 典题 1 (

3、1) 下列四个散点图中,变量x 与 y 之间具有负的线性 相关关系的是 ( ) A B C D 答案 D 解析 观察散点图可知,只有D 选项的散点图表示的是变量x 与 y 之间具有负的线性相关关系 (2) 四名同学根据各自的样本数据研究变量x,y 之间的相关关 系,并求得回归直线方程,分别得到以下四个结论: y 与 x 负相关且 2.347x 6.423 ; y 与 x 负相关且 3.476x 5.648 ; y 与 x 正相关且 5.437x 8.493 ; y 与 x 正相关且 4.326x4.578. 其中一定不正确的结论的序号是( ) 欢迎下载。 3 / 19 A B C D 答案 D

4、 解析 由回归方程 x知,当 0 时,y 与 x 正相关,当 0 时,y 与 x 负相关,一定错误 点石成金 相关关系的直观判断方法就是作出散点图,若散点 图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线 型也是有相关性,若呈图形区域且分布较乱则不具备相关性 考点 2 线性回归分析 1. 回归分析 对具有 _的两个变量进行统计分析的方法叫回归分析其 基本步骤是: ()画散点图; ()求_;()用回归直线方程 作预报 答案:相关关系回归直线方程 2回归直线 如果散点图中点的分布从整体上看大致在_附近,就称这 两个变量之间具有线性相关关系,这条直线叫做回归直线 答案:一条直线 3回归直

5、线方程的求法最小二乘法 设具有线性相关关系的两个变量x,y 的一组观察值为 (xi ,yi)(i 1,2 , n) ,则回归直线方程x的系数为:其中i ,yi , (,) 称为样本点的 _ 答案:中心 欢迎下载。 4 / 19 4相关系数 当 r0 时,表明两个变量 _; 当 r0 时,表明两个变量 _ r 的绝对值越接近于 1,表明两个变量的线性相关性 _ r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关 系通常|r| 大于 0.75 时,认为两个变量有很强的线性相关性 答案:正相关负相关越强 教材习题改编 已知回归直线的斜率的估计值为1.23,样本点的 中心为 (4,5) ,

6、则回归直线方程为 _ 答案: 1.23x 0.08 解析:设回归直线方程为1.23x , 因为回归直线必过样本点的中心(x ,y) , 将点(4,5) 代入回归直线方程得 0.08, 所以所求方程为 1.23x 0.08. 变量的相关关系:散点图;回归直线过( ,) 某工厂经过技术改造后,生产某种产品的产量x( 吨) 与相应的生产 能耗 y( 吨标准煤 )有如下几组样本数据 . x3456 y2.5344.5 据相关性检验, y 与 x 具有线性相关关系,通过线性回归分析,求 得回归直线的斜率为0.7,那么当产量 x10 吨时,估计相应的生产能 耗为_吨标准煤 答案:7.35 解析:先求得 4

7、.5 ,3.5 ,由 0.7x 过点(,) ,得 0.35, 欢迎下载。 5 / 19 所以回归直线方程是 0.7x 0.35. 当 x10 吨时, 70.357.35( 吨标准煤 ) 典题 2 (1) 已知 x,y 的取值如下表,从散点图可以看出y 与 x 线性相关,且回归方程为0.95x ,则 ( ) x0134 y2.24.34.86.7 A.3.25 B2.6 C2.2 D0 答案 B 解析 由已知得 2,4.5, 因为回归方程经过点 ( ,) , 所以 4.5 0.9522.6. (2) 由某种设备的使用年限xi( 年) 与所支出的维修费yi( 万元) 的 数据资料算得如下结果,90

8、,iyi 112,i 20,i 25. 求所支出的维修费y 对使用年限 x 的线性回归方程 x; ( )判断变量 x 与 y 之间是正相关还是负相关; ()当使用年限为 8 年时,试估计支出的维修费是多少 附:在线性回归方程 x中,其中,为样本平均值 解 i 20,i 25, i 4,i 5, 1.2, a 51.240.2. 线性回归方程为 1.2x 0.2. ( )由知, 1.20, 欢迎下载。 6 / 19 变量 x 与 y 之间是正相关 ()由知,当x8 时, 9.8 ,即使用年限为8 年时,支出维 修费约是 9.8 万元 点石成金 1. 正确理解计算,的公式和准确的计算是求线性回 归

9、方程的关键 2回归直线方程 x必过样本点的中心 ( ,) 3在分析两个变量的相关关系时,可根据样本数据作出散点图来 确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通 过线性回归方程来估计和预测. 某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份20062008201020122014 需求量 ( 万吨 )236246257276286 (1) 利用所给数据求年需求量与年份之间的回归直线方程x; (2) 利用(1) 中所求出的回归直线方程预测该地2016 年的粮食需求 量 解:(1) 由所给数据看出,年需求量与年份之间是近似直线上升, 下面来配回归直线方程,为此对数据预处理

10、如下: 年份 2 01042024 需求量 25721 1101929 对预处理后的数据,容易算得, x0,3.2 , b 219429503.2 2242502 6.5 , 3.2. 由上述计算结果知,所求回归直线方程为 欢迎下载。 7 / 19 y 257(x 2 010) a 6.5(x 2 010) 3.2 , 即6.5(x 2 010) 260.2. (2) 利用(1) 中所求回归直线方程,可预测2016 年的粮食需求量为 6.5(2 016 2 010) 260.2 6.56260.2299.2( 万吨) 考点 3 独立性检验 1. 分类变量:变量的不同“值”表示个体所属的不同类别

11、,像这 类变量称为分类变量 2列联表:列出两个分类变量的频数表,称为列联表假设有两 个分类变量 X和 Y,它们的可能取值分别为x1,x2 和y1,y2,其样 本频数列联表 ( 称为 22列联表) 为 22列联表: y1y2总计 x1abab x2cdcd 总计acbdabcd K2(其中 n_ 为样本容量) ,则利用独立性检验判断表来 判断“X 与 Y的关系” 答案: abcd (1) 教材习题改编 为调查中学生的近视情况,测得某校150 名男 生中有 80 名近视, 140 名女生中有 70 名近视在检验这些学生眼睛近 视是否与性别有关时,最有说服力的方法是_(填序号 ) 回归分析;期望与方

12、差;独立性检验;概率 答案: 欢迎下载。 8 / 19 解析:“近视”与“性别”是两个分类变量,其是否有关,应该 用独立性检验来判断 (2) 教材习题改编 在研究吸烟与患肺癌的关系中,通过收集数 据、整理分析数据得出“吸烟与患肺癌有关”的结论,并且有99% 以上 的把握认为这个结论是成立的,有下列四种说法:100 个吸烟者中至 少有 99 人患有肺癌;1个人吸烟,那么这人有99% 的概率患有肺 癌;在 100 个吸烟者中一定有患肺癌的人;在100 个吸烟者中可 能一个患肺癌的人也没有其中正确说法的序号是_ 答案: 对独立性检验的理解: K2的计算;对 P(K2k0)的解释 2017湖南张家界模

13、拟 某高校教“统计初步”课程的教师随机 调查了选该课程的一些学生的情况,具体数据如下表: 专业 性别 非统计专业统计专业 男1310 女720 为了判断主修统计专业是否与性别有关系,根据表中的数据,得 到 K2的观测值 k4.844. 因为 k3.841,所以判定主修统计专业与性别有关系,那么这种判 断出错的可能性为 _ 附表: P(K 2 k0)0.0500.0100.001 k03.8416.63510.828 答案: 5% 解析: k3.841,查临界值表,得P(K23.841) 0.05,故这种 欢迎下载。 9 / 19 判断出错的可能性为5%. 典题 3 (1) 为了判断高中三年级学

14、生选修文理科是否与性别有 关,现随机抽取 50 名学生,得到 22列联表: 理科文科总计 男131023 女72027 总计203050 已知 P(K23.841) 0.05, P(K25.024) 0.025. 根据表中数据,得到K24.844,则认为选修文理科与性别有关 系出错的可能性约为 _ 答案 5% 解析 由 K24.8443.841. 故认为选修文理科与性别有关系出 错的可能性约为 5%. (2)2017 江西九江模拟 某校数学课外兴趣小组为研究数学成绩 是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均 分(采用百分制 ) ,剔除平均分在40 分以下的学生后,共有男生3

15、00 名, 女生 200 名现采用分层抽样的方法,从中抽取了100 名学生,按性 别分为两组,并将两组学生的成绩分为6 组,得到如下所示的频数分 布表. 分数段 40 , 50) 50 , 60) 60 , 70) 70 , 80) 80 , 90) 90 , 100 男39181569 女64510132 估计男、女生各自的平均分( 同一组数据用该组区间中点值作代 欢迎下载。 10 / 19 表),从计算结果看,数学成绩与性别是否有关; 规定 80 分以上为优分 ( 含 80 分) ,请你根据已知条件作出22 列联表,并判断是否有90% 以上的把握认为“数学成绩与性别有关”. 优分非优分总计

16、 男生 女生 总计100 附表及公式: P(K 2 k0)0.1000.0500.0100.001 k02.7063.8416.63510.828 K2. 解 男 450.05 550.15 650.3 750.25 850.1950.15 71.5, x女450.15550.1 650.125750.25850.325950.0571.5 , 从男、女生各自的平均分来看,并不能判断数学成绩与性别有关 由频数分布表可知,在抽取的100 名学生中,“男生组”中的 优分有 15 人,“女生组”中的优分有15 人, 据此可得 22列联表如下: 优分非优分总计 男生154560 女生152540 总计

17、3070100 可得 K21.79, 因为 1.792.706 ,所以没有90% 以上的把握认为“数学成绩与性 别有关” 欢迎下载。 11 / 19 点石成金 1. 独立性检验的关键是正确列出22 列联表,并计 算出 K2的值 2弄清判断两变量有关的把握性与犯错误概率的关系,根据题目 要求作出正确的回答 . 2017广西玉林、贵港联考 某市地铁即将于2015 年 6 月开始运 营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随 机抽查了 50 人,他们的收入与态度如下; 月收入 ( 单位: 百元 ) 15 , 25) 25 , 35) 35 , 45) 45 , 55) 55 , 6

18、5) 65 , 75 赞成定 价者人数 123534 认为价 格偏高 者人数 4812521 (1) 若以区间的中点值为该区间内的人均月收入,求参与调查的人 员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多 少(结果保留 2 位小数 ) ; (2) 由以上统计数据填写下面的22列联表分析是否有99% 的把握 认为“月收入以 55 百元为分界点对地铁定价的态度有差异”. 月收入低于 55 百元的人数 月收入不低于 55 百元的人数 总计 认为价 格偏高者 赞成 定价者 总计 欢迎下载。 12 / 19 附:K2. P(K 2 k0)0.050.01 k03.8416.635 解:(1

19、) “赞成定价者”的月平均收入为 x1 201302403505603704 12 3534 50.56. “认为价格偏高者”的月平均收入为 x2 2043084012505602701 48 125 21 38.75, “赞成定价者”与“认为价格偏高者”的月平均收入的差距是1 250.56 38.7511.81( 百元) (2) 根据条件可得 22列联表如下: 月收入低于 55 百元的人数 月收入不低于55 百元的人数 总计 认为价格 偏高者 29332 赞成 定价者 11718 总计401050 K26.270,故 2007 年至 2013 年该地区农村居民家庭 人均纯收入逐年增加,平均每

20、年增加0.5 千元 将 2015 年的年份代号 t 9 代入(1) 中的回归方程,得 y 0.592.3 6.8 , 故预测该地区 2015年农村居民家庭人均纯收入为6.8 千元 课外拓展阅读 统计案例问题的规范答题 典例 2013福建卷 某工厂有 25 周岁以上 (含 25 周岁)工人 300 名,25 周岁以下工人200 名为研究工人的日平均生产量是否与 年龄有关,现采用分层抽样的方法,从中抽取了100 名工人,先统计 了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上 ( 含 欢迎下载。 18 / 19 25 周岁)”和“25 周岁以下”分为两组,再将两组工人的日平均生产 件数分

21、成5 组:50,60) ,60,70) ,70,80) ,80,90) ,90,100 分 别加以统计,得到如图所示的频率分布直方图 (1) 从样本中日平均生产件数不足60 件的工人中随机抽取2 人, 求至少抽到一名“ 25 周岁以下组”工人的概率; (2) 规定日平均生产件数不少于80 件者为“生产能手”,请你根 据已知条件完成22 列联表,并判断是否有90% 的把握认为“生产能 手与工人所在的年龄组有关”? P(K 2 k0)0.1000.0500.0100.001 k02.7063.8416.63510.828 附:K2. 审题视角 由频率分布直方图列举基本事件,结合古典概型, 求概率利

22、用独立性检验公式计算K2. 解 (1) 由已知得,样本中有25 周岁以上组工人60 名,25 周岁 以下组工人40 名所以,样本中日平均生产件数不足60 件的工人 中,25 周岁以上组工人有600.053(人) ,记为 A1,A2,A3;25 周 岁以下组工人有 400.052( 人),记为 B1,B2. 从中随机抽取2 名工人,所有的可能结果共有10 种,它们是 (A1,A2),(A1,A3),(A2,A3),(A1,B1), (A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1, B2) 其中,至少有1 名“25 周岁以下组”工人的可能结果共有7 种, 它

23、们是 (A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3, B2),(B1,B2) 欢迎下载。 19 / 19 故所求的概率 P. (2) 由频率分布直方图可知,在抽取的100 名工人中,“ 25 周岁以 上组”中的生产能手有600.2515(人) ,“25 周岁以下组”中的生 产能手有 400.37515( 人),据此可得 22列联表如下: 生产能手非生产能手总计 25 周岁以上组154560 25 周岁以下组152540 总计3070100 所以 K2 1.79. 因为 1.792.706 ,所以没有90% 的把握认为“生产能手与工人所 在的年龄组有关” 答题模板 第 1 步:由分层抽样计算两组工人的数目; 第 2 步:由频率分布直方图计算两组不足60 件的人数; 第 3 步:列举 5 人抽取 2 人的基本事件数; 第 4 步,由古典概型计算概率; 第 5 步:统计生产能手与非生产能手,列22列联表; 第 6 步:由公式计算 K2,确定答案 归纳总结 (1) 分层抽样比为,故25 周岁以上有30060(人),25 周岁 以下的 20040(人) ,然后再根据频率计算“不足60 件”的人数, 并设定符号 (2) 列 22 列联表时,其中的数字应先由频率分布直方图算出后 再列表

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1