2019届高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析).pdf

上传人:白大夫 文档编号:4124892 上传时间:2019-10-19 格式:PDF 页数:36 大小:1.33MB
返回 下载 相关 举报
2019届高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析).pdf_第1页
第1页 / 共36页
2019届高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析).pdf_第2页
第2页 / 共36页
2019届高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析).pdf_第3页
第3页 / 共36页
2019届高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析).pdf_第4页
第4页 / 共36页
2019届高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析).pdf_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《2019届高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析).pdf》由会员分享,可在线阅读,更多相关《2019届高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析).pdf(36页珍藏版)》请在三一文库上搜索。

1、问题 42 实际应用中的统计解答题问题 42 实际应用中的统计解答题 一、考情分析 概率统计在高考中扮演着很重要的角色,概率统计解答题是全国卷及多数省市高考数学必考内容,内容主要 涉及古典概型、相互独立事件的概率、条件概率、二项分布、正态分布、频率分布直方图、回归分析、离 散型随机变量的分布列、期望与方差的实际应用等.回顾近几年的高考试题,可以看出概率统计解答题,大多 紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重 要载体,命题者要求考生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模 型,再应用数学原理和数学工具解决实

2、际问题.该类问题阅读量一般比较大,但难度多为中等或中等偏易. 二、经验分享 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的 面积和为 1. 利用分布列中各概率之和为 1 可求参数的值,此时要注意检验,以保证每个概率值均为非负 数对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据 (2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体 和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据一般先比较均值,若均值相同, 再用方差来决定 (3)解决正态分布问题有三个关键点:(1)对称

3、轴x;(2)标准差;(3)分布区间利用对称性可求指 定范围内的概率值;由,分布区间的特征进行转化,使分布区间转化为 3特殊区间,从而求出所 求概率注意只有在标准正态分布下对称轴才为x0. (4)判定两个变量正、负相关性的方法 画散点图 : 点的分布从左下角到右上角,两个变量正相关 ; 点的分布从左上角到右下角,两个变量负相关 相关系数:r0 时,正相关;r0 时,正相关; 0 时,负相关b b (5) 回归分析是处理变量相关关系的一种数学方法主要解决:确定特定量之间是否有相关关系,如果有 就找出它们之间贴近的数学表达式; 根据一组观测值,预测变量的取值及判断变量取值的变化趋势; 求出线性回归方

4、程线性回归分析问题的类型及解题方法 求线性回归方程 利用公式,求出回归系数 ,或待定系数法:利用回归直线过样本点的中心求系数b 利用回归方程进行预测,把线性回归方程看作一次函数,求函数值 利用回归直线判断正、负相关;决定正相关还是负相关的是系数 .b (6)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于 1 时,两变量的线性相关性越强 (7)比较几个分类变量有关联的可能性大小的方法 通过计算K2的大小判断:K2越大,两变量有关联的可能性越大 通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大 (8)独立性检验的一般步骤 根据样本数据制成 22 列联表 根据公

5、式计算K2的观测值k. 比较k与临界值的大小关系,作统计推断 三、知识拓展三、知识拓展 四、题型分析四、题型分析 (一) 期望与方差的应用(一) 期望与方差的应用 数学期望反应的是随机变量取值的平均水平,而方差则是反应随机变量取值在其平均值附近的离散程度.现 代实际生活中,越来越多的决策需要应用数学期望与方差这思想来对事件发生大小的可能性进行评估,通 过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.品种 的优劣、仪器的好坏、预报的准确与否等很多问题都与这两个特征两量有关. (1)若我们希望实际的平均水平较理想,则先求随机变量 12 ,的期望,当 12

6、EE时,不应认为它们一定 一样好,需要用 12 ,DD来比较这两个随机变量的方差,确定它们的偏离程度. (2)若我们希望比较稳定性,应先考虑方差,再考虑均值是否相等或接近. 【例 1】例 3.7(2018 新课标 I 卷理 20)某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在交付用 户之前要对产品作检验,如检验出不合格品,则更换为合格品检验时,先从这箱产品中任取 20 件作检验, 再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各 件产品是否为不合格品相互独立 (1)记 20 件产品中恰有 2 件不合格品的概率为,求的最大值点 (2)现对一箱产品检验了

7、 20 件,结果恰有 2 件不合格品,以(1)中确定的作为 的值已知每件产品 的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每件不合格品支付 25 元的赔偿费用 (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 【分析】【分析】 利用独立重复实验成功次数对应的概率,求得,之后对其求导,利用导数确 定其单调性,再求最大值点,注意; (2)先根据第一问的条件, 确定出, 在解 (i) 的时候,先求件数对应的期望, 之后应用变量之间的关系, 求得赔偿费用的期望;在解(ii

8、)的时候,就通过比较两个期望的大小,得到结果. 【解析】【解析】 (1)20 件产品中恰有 2 件不合格品的概率为.因此 . 令,得.当时,;当时,. 所以的最大值点为. (2)由(1)知,. (i)令 表示余下的 180 件产品中的不合格品件数,依题意知,即 .所以. (ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为 400 元. 由于,故应该对余下的产品作检验. 【点评】随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们 从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据一般先比较均值,若均值 相同,再用方差来决定 【小试牛刀

9、】【广东省江门市 2019 届第一次模拟】甲、乙两家外卖公司,其送餐员的日工资方案如下:甲 公司的底薪元,每单提成 元;乙公司无底薪,单以内(含单)的部分每单提成 元,大于单的部 分每单提成 元,假设同一公司送餐员一天的送餐单数相同,现从两家公司各随机抽取一名送餐员,并分别 记录其天的送餐单数,得到如下频数表: 甲公司送餐员送餐单数频数表 乙公司送餐员送餐单数频数表 (1) 若将大于单的工作日称为 “繁忙日” , 根据以上频数表能否在犯错误的概率不超过的前提下认为 “繁 忙日”与公司有关? (2)若将频率视为概率,回答下列两个问题:记乙公司送餐员日工资为 (单位:元) ,求 的分布列和 数学期

10、望;小王打算到甲、乙两家公司中的一家应聘,你会推荐小王去哪家?为什么? 参考公式和数据: 【解析】 (1)依题意得,公司与“繁忙日”列联表 , ,所以,能在犯错误的概率不超过的前提下认为“繁忙日”与公司有关 . (2)设乙公司送餐员送餐单数为 ,则当时,当时,当 时,当时,当时, . 所以, 的所有可能取值为、, 的分布列为: . 依题意,甲公司送餐员日平均送餐单数为 , 所以甲公司送餐员日平均工资为(元), 因为,故从更高收入角度考虑推荐小王去乙公司应聘;因为乙公司比甲公司繁忙,故从工作闲 适角度考虑推荐小王去甲公司应聘 (二)正态分布的应用 (二)正态分布的应用 正态分布随处可见,处处显现

11、着他神秘的身影.对于某一件事或者某个要达到的目标,很多很多的个体发挥 出来的水平大致上服从正态分布.也就是说,对于大量个体的发挥统计,常常能看到正态分布“冥冥之中” 束缚着整体的状态. 对于某个单独的单位,一般来说,对于“发挥出来的水平”这件事,也往往有波动的 效果,不管是机器、工具还是我们人本身:有的时候,超水平发挥了;有的时候正常发挥;有的时候又会 发挥失常.这种东西应该也可以抽象为围绕期望水平的正态分布. 而对于若干数据,包括发挥水平、排位 情况,但是没有整体数据的时候,如果能推测是正态分布的情形,就可以近似计算出分布函数来,然后去 估计其他的分布情况.这是反向推导的过程. 生产与科学实

12、验中很多随机变量的概率分布都可以近似地用 正态分布来描述.例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生 物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地 区的年降水量;以及理想气体分子的速度分量,等等. 【例 2】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量 其尺寸(单位 :cm) 根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布 2 ,N (1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在3 ,3 之外的零件数,求 1P X及X的数

13、学期望; (2) 一天内抽检零件中,如果出现了尺寸在3 ,3 之外的零件,就认为这条生产线在这一天的生 产过程可能出现了异常情况,需对当天的生产过程进行检查 ()试说明上述监控生产过程方法的合理性; ()下面是检验员在一天内抽取的16个零件的尺寸: 9.9510.129.969.9610.019.929.9810.04 10.269.9110.1310.029.2210.0410.059.95 经计算得 16 1 1 9.97 16 i i xx , 1616 222 11 11 ()(16)0.212 1616 ii ii sxxxx ,其中 i x为抽取的第i 个零件的尺寸,1 216i

14、, , 用样本平均数x作为的估计值,用样本标准差s作为的估计值,利用估计值判断是否需对当天 的生产过程进行检查?剔除 3 ,3 之外的数据,用剩下的数据估计和(精确到0.01) 附:若随机变量Z服从正态分布 2 ,N ,则330.9974PZ, 16 0.99740.9592, 0.0080.09 【分析】 【分析】 (1)先确定 160.0026XB, ,再利用EXnp求期望;(2)(i)判断监控生产过程的方法是否 合理,可通过一天内抽取的16个零件中,尺寸落 33, 之外概率的大小判断,(ii)剔除异常数据, 在利用公式求和. 【解析】 【解析】 (1)由题可知尺寸落在 33, 之内的概率

15、为0.9974,落在 33, 之外的概率 为0.0026 0 016 16 0C1 0.99740.99740.9592P X , 11010.95920.0408P XP X , 由题可知 160.0026XB, ,所以 160.00260.0416E X . (2)(i)尺寸落在 33, 之外的概率为0.0026,由正态分布知尺寸落 33, 之外为小 概率事件,因此上述监控生产过程的方法合理 (ii) 39.9730.2129.334 , 39.9730.21210.606 , 339.33410.606, ,因为 9.229.33410.606, , 所以需对当天的生产过程检查 因此剔除

16、9.22,剔除数据之后: 9.97 169.22 10.02 15 22222 2 9.95 10.0210.12 10.029.96 10.029.96 10.0210.01 10.02 22222 9.92 10.029.98 10.0210.04 10.0210.26 10.029.91 10.02 222221 10.13 10.0210.0210.0210.0410.0210.0510.029.9510.020.008 15 . 所以0.0080.09. 【点评】【点评】正态分布是概率统计中相对较独立的一个考点,且已经从冷点转化为热点,求解此类问题,一般从 , 入手,对于应用问题,要

17、注意从较大的阅读量中提取有用的信息.以下两类问题是正态分布中的基本问 题: (1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x对称,及 曲线与x轴之间的面积为 1. (2)利用 3原则求概率问题时,要注意把给出的区间或范围与正态变量的,进行对比联系,确定它们属 于(,),(2,2),(3,3)中的哪一个. 【小试牛刀】 【山东省济宁市 2019 届高三第一次模拟】某学校为了了解全校学生的体重情况,从全校学生 中随机抽取了 100 人的体重数据,结果这 100 人的体重全部介于 45 公斤到 75 公斤之间,现将结果按如下 方式分为 6 组:第一组45,50)

18、,第二组50,55),第六组70,75),得到如下图(1)所示的频率分布 直方图,并发现这 100 人中,其体重低于 55 公斤的有 15 人,这 15 人体重数据的茎叶图如图(2)所示,以 样本的频率作为总体的概率 (I)求频率分布直方图中的值; (II)从全校学生中随机抽取 3 名学生,记 X 为体重在55,65)的人数,求 X 的概率分布列和数学期望; (III)由频率分布直方图可以认为,该校学生的体重近似服从正态分布,其中若 ,则认为该校学生的体重是正常的试判断该校学生的体重是否正常?并 说明理由 【解析】 解:()由图(2)知,100 名样本中体重低于 50 公斤的有 2 人, 用样

19、本的频率估计总体的概率,可得体重低于 50 公斤的概率为, 则, 在上有 13 人,该组的频率为 0.13,则, 所以,即 c=0.07. ()用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在的概率为 0.0710=0.7,随机抽取 3 人,相当于三次独立重复试验,随机变量 X 服从二项分布, 则, , , , 所以,X 的概率分布列为: X0123 P0.0270.1890.4410.343 E(X)=30.7=2.1 ()由 N(60,25)得 由图(2)知. 所以可以认为该校学生的体重是正常的. (三) 用样本估计总体 (三) 用样本估计总体 频率分布直方图是高考考查的热

20、点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中 档用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计 总体分布;难点是频率分布表和频率分布直方图的理解及应用在计数和计算时一定要准确,在绘制小矩 形时,宽窄要一致通过频率分布表和频率分布直方图可以对总体作出估计频率分布直方图的纵坐标为 频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把 直方图视为条形图是常见的错误 【例 3】2018 年 9 月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达亿元. 某青年志愿者组织调查了某地区的

21、个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五 组:,(单位:元) ,得到如图所示的频率 分布直方图. (1)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表) ; (2) 台风后该青年志愿者与当地政府向社会发出倡议, 为该地区的农户捐款帮扶, 现从这户损失超过 元的农户中随机抽取 户进行重点帮扶,设抽出损失超过元的农户数为 ,求 的分布列和数学期望. 【分析】 (1)根据频率分布直方图计算每个农户的平均损失; (2)根据频率分布直方图计算随机变量 X 的可能取值,再求 X 的分布列和数学期望值 【解析】 (1)记每个农户的平均损失为 元,则 ;

22、(2)由频率分布直方图,可得损失超过 1000 元的农户共有(0.00009+0.00003+0.00003)20005015 (户) ,损失超过 8000 元的农户共有 0.000032000503(户) , 随机抽取 2 户,则 X 的可能取值为 0,1,2; 计算 P(X0), P(X1), P(X2), 所以 X 的分布列为; X012 P 数学期望为 E(X)0+1+2 【点评】用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本 的频率分布去估计总体分布的两种主要方法分布表在数量表示上比较准确,直方图比较直观 【小试牛刀】中国农业银行开始为全国农行

23、ATM 机安装刷脸取款系统.某农行营业点为调查居民对刷脸取款 知识的了解情况,制作了刷脸取款知识有奖调查问卷,发放给 2018 年度该行的所有客户,并从参与调查且年 龄(单位:岁)在25,55内的客户中随机抽取 100 名给予物质奖励,再从中选出一名客户参加幸运大抽奖.调 查结果按年龄分成 6 组,制作成如下的频数分布表和女客户的年龄茎叶图,其中abc=245. 年 龄/ 25,30)30,35)35,40)40,45)45,50)50,55 岁 频 数/ 人 5abc1525 女客户的年龄茎叶图 幸运大抽奖方案如下:客户最多有两次抽奖机会,每次抽奖的中奖率均为 ,第一次抽奖,若未中奖,则抽奖

24、结 束.若中奖,则通过抛掷一枚质地均匀的硬币,决定是否继续进行第二次抽奖.规定:抛出的硬币,若反面朝上, 则客户获得 5000 元奖金,不进行第二次抽奖;若正面朝上,客户需进行第二次抽奖,且在第二次抽奖中,如果 中奖,则获得奖金 10000 元,如果未中奖,则所获得的奖金为 0 元. (1)求a,b,c的值,若分别从男、女客户中随机选取 1 人,求这 2 人的年龄均在40,45)内的概率; (2)若参加幸运大抽奖的客户所获奖金(单位:元)用X表示,求X的分布列与数学期望E(X). 【解析】(1)由频数分布表知,a+b+c=100-45=55. 因为 abc=245, 所以 a=55=10,b=

25、55=20,c=55=25,由茎叶图可知年龄在25,30)内的女客户有 2 人,年龄在 30,35)内的女客户有 4 人,年龄在35,40)内的女客户有 8 人,年龄在40,45)内的女客户有 10 人,年龄在 45,50)内的女客户有 6 人,年龄在50,55内的女客户有 10 人, 故年龄在40,45)内的男客户有 15 人,在 100 名客户中,男客户有 60 人,女客户有 40 人,所以从男客户中随 机选取 1 人,年龄恰在40,45)内的概率P1=, 从女客户中随机选取 1 人,年龄恰在40,45)内的概率P2=, 则分别从男、女客户中随机选取 1 人,这 2 人的年龄均在40,45

26、)内的概率P=P1P2=. (2)由题意可知,X的所有可能取值为 0,5000,10000,则 P(X=0)=, P(X=5000)=, P(X=10000)=. X的分布列为 X05 00010 000 P E(X)=0+5000 +10000=5200(元). (四) 回归分析(四) 回归分析 回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直 线方程才有实际意义,否则无意义根据回归方程进行的估计仅是一个预测值,而不是真实发生的值 用最小二乘法求回归方程,关键在于正确求出系数 ,由于 , 的计算量较大,计算应仔细小心a b a b 【例 4】 【湖

27、北省黄冈市 2019 届模拟】某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.根据过去 50 周的资 料显示,该基地周光照量 (小时)都在 30 小时以上,其中不足 50 小时的有 5 周,不低于 50 小时且不超 过 70 小时的有 35 周,超过 70 小时的有 10 周.根据统计,该基地的西红柿增加量 (千克)与使用某种液 体肥料的质量 (千克)之间的关系如图所示. (1) 依据上图, 是否可用线性回归模型拟合 与 的关系?请计算相关系数 并加以说明 (精确到 0.01).(若 ,则线性相关程度很高,可用线性回归模型拟合) (2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照

28、控制仪,但每周光照控制仪运 行台数受周光照量 限制,并有如下关系: 周光照量 (单位:小时) 光照控制仪运行台数321 若某台光照控制仪运行,则该台光照控制仪周利润为 3000 元;若某台光照控制仪未运行,则该台光照控制 仪周亏损 1000 元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台? 附:相关系数公式, 参考数据:,. 【分析】(1)根据公式得到相关系数的值,通过比较得到判断;(2)分别求出安装一台,两台,三台时的 利润均值,得到结果. 【解析】 (1)由已知数据可得,. , , . 相关系数 . ,可用线性回归模型拟合 与 的关系. (2)记商家周总利润为

29、元,由条件可知至少需安装 1 台,最多安装 3 台光照控制仪. 安装 1 台光照控制仪可获得周总利润 3000 元. 安装 2 台光照控制仪的情形: 当时,只有 1 台光照控制仪运行,此时周总利润(元) , , 当时,2 台光照控制仪都运行,此时周总利润(元) , , 故 的分布列为 20006000 0.20.8 (元). 安装 3 台光照控制仪的情形: 当时,只有 1 台光照控制仪运行, 此时周总利润(元) , , 当时,有 2 台光照控制仪运行,此时周总利润(元) , , 当时,3 台光照控制仪都运行, 周总利润(元) , , 故 的分布列为 100050009000 0.20.70.1

30、 (元). 综上可知,为使商家周总利润的均值达到最大,应该安装 2 台光照控制仪. 【点评】判断两个变量是否具有相关关系的常用方法:(1)利用散点图进行判断;(2)利用相关系数 r 进行 判断 【小试牛刀】 【江西省临川第一中学等九校 2019 届高三 3 月联考】某商场营销人员进行某商品市场营销调 查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到以下表: 反馈点数12345 销量(百件)/天0.50.611.41.7 (1)经分析发现,可用线性回归模型拟合当地该商品销量 (千件)与返还点数 之间的相关关系.请用最小 二乘法求 关于 的线性回归方程,并预测若

31、返回 6 个点时该商品当天销量; (2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研 机构对其中的 200 名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表: 返还点数预期值区间(百分比) 频数206060302010 (i)求这 200 位拟购买该商品的消费者对返点点数的心理预期值 的样本平均数及中位数的估计值(同一 区间的预期值可用该区间的中点值代替;估计值精确到 0.1) ; (ii)将对返点点数的心理预期值在和的消费者分别定义为“欲望紧缩型”消费者和“欲望膨 胀型”消费者,现采用分层抽样的方法从位于这两个区间的 30 名消

32、费者中随机抽取 6 名,再从这 6 人中随 机抽取 3 名进行跟踪调查,设抽出的 3 人中“欲望膨胀型”消费者的人数为随机变量 ,求 的分布列及数 学期望. 参考公式及数据:,;. 【解析】 (1)易知, , , . 则 关于 的线性回归方程为,当时,即返回 6 个点时该商品每天销量约为 2 百件. (2) (i)根据题意,这 200 位拟购买该商品的消费者对返回点数的心里预期值 的平均值 ,及中位数的估 计值分别为:,中位数的估计值为 . (ii)抽取 6 名消费者中“欲望紧缩型”消费者人数为,“欲望膨胀型”消费者人数为. , 故随机变量 的分布列为 123 . (五) 独立性检验 (五)

33、独立性检验 独立性检验的一般步骤 (1)假设两个分类变量 x 与 y 没有关系;(2)计算出 K2的观测值,其中 K2;(3)把 K2的值与临界值比较,作出合理的判断 n(adbc)2 (ab)(cd)(ac)(bd) 【例 5】 【福建省莆田市 2019 届高三下学期教学质量检测】为推进“千村百镇计划” ,年 月某新能源公 司开展“电动莆田绿色出行”活动,首批投放台 型新能源车到莆田多个村镇,供当地村民免费试用三 个月。试用到期后,为了解男女试用者对 型新能源车性能的评价情况,该公司要求每位试用者填写一份性 能综合评分表(满分为分) 。最后该公司共收回有效评分表份,现从中随机抽取份(其中男、

34、女的 评分表各份)作为样本,经统计得到如下茎叶图: (1)求个样本数据的中位数; (2)已知个样本数据的平均数,记与 的最大值为。该公司规定样本中试用者的“认定类型” : 评分不小于的为“满意型” ,评分小于的为“需改进型” 。 请以个样本数据的频率分布来估计收回的份评分表中,评分小于的份数; 请根据个样本数据,完成下面列联表: 根据列联表判断能否有 99的把握认为“认定类型”与性别有关? 【分析】 (1)取位于中间两个数,计算平均数,即可。 (2)结合茎叶图,完善列联表,计算卡方值,判断, 即可。 【解析】 (1)由茎叶图知 (2)因为m=81,a=80,所以M=81。 由茎叶图知,女性试用

35、者评分不小于 81 的有 15 个,男性试用者评分不小于 81 的有 5 个, 所以在 40 个样本数据中,评分不小于 81 的频率为 可以估计收回的 600 份评分表中,评分不小于 81 的份数为 6000.5=300; 根据题意得 22 列联表: 满意型需改进型合计 女性15520 男性51520 合计202040 由于, 查表得, 所以有 99%的把握认为“认定类型”与性别有关。 【点评】(1)在列联表中注意事件的对应及相关值的确定,不可混淆(2)在实际问题中,独立性检验的结 论仅是一种数学关系表述,得到的结论有一定的概率出错(3)对判断结果进行描述时,注意对象的选取要 准确无误,应是对

36、假设结论进行的含概率的判断,而非其他 【小试牛刀】【重庆市第一中学校 2019 届高三 3 月月考】 党的十九大报告中多次出现的 “绿色” “低碳” “节 约”等词语,正在走入百姓生活,绿色出行的理念已深入人心,骑自行车或步行渐渐成为市民的一种出行 习惯.某市环保机构随机抽查统计了该市 1800 名成年市民某月骑车次数在各区间的人数,统计如下表: 次 数 年龄 0,10)10,20)20,30)30,40)40,50)50,60) 18 岁至 31 岁8122060140150 32 岁至 44 岁12282014060150 45 岁至 59 岁255080100225450 60 岁及以上

37、2510101942 联合国世界卫生组织于 2013 年确定新的年龄分段:44 岁及以下为青年人,45 岁至 59 岁为中年人,60 岁及 以上为老人. (1)若从被抽查的该月骑车次数在的老年人中随机选出两名幸运者给予奖励,求其中一名幸运者该 月骑车次数在之间,另一名幸运者该月骑车次数在之间的概率; (2)若月骑车次数不少于 30 次者被称为“骑行爱好者” ,将上面提供的数据进行统计后,把答卷中的 列联表补充完整,并计算说明能否在犯错误不超过 0.001 的前提下认为“骑行爱好者”与“青年人”有关? 参考数据: 0.1000.0500.0250.0100.001 2.7063.8415.024

38、6.63510.828 ,其中 【解析】 (1)将 6 位老人分别记为和,则所有的抽法有: ,共 15 种, 其中满足条件的抽法有: ,共 8 种, 故其中一名幸运者该月骑车次数在之间,另一名幸运者该月骑车次数在之间的概率为. (2)根据题意,得出如下列联表 骑行 爱好者 非骑行爱好者总计 青年人700100800 非青年人8002001000 总计15003001800 , 故能在犯错误的概率不超过 0.001 的前提下认为“骑行爱好者”与“青年人”有关. 四、迁移运用四、迁移运用 1 【辽宁省大连市 2019 届高三下学期第一次测试】随着电子阅读的普及,传统纸质媒体遭受到了强烈的冲 击某杂

39、志社近 9 年来的纸质广告收入如下表所示: 根据这 9 年的数据,对 和 作线性相关性检验,求得样本相关系数的绝对值为 0.243; 根据后 5 年的数据,对 和 作线性相关性检验,求得样本相关系数的绝对值为 0.984. (1)如果要用线性回归方程预测该杂志社 2019 年的纸质广告收入,现在有两个方案, 方案一:选取这 9 年数据进行预测,方案二:选取后 5 年数据进行预测 从实际生活背景以及线性相关性检验的角度分析,你觉得哪个方案更合适? 附:相关性检验的临界值表: (2)某购物网站同时销售某本畅销书籍的纸质版本和电子书,据统计,在该网站购买该书籍的大量读者中, 只购买电子书的读者比例为

40、, 纸质版本和电子书同时购买的读者比例为, 现用此统计结果作为概率, 若从上述读者中随机调查了 3 位,求购买电子书人数多于只购买纸质版本人数的概率 【解析】 (1)选取方案二更合适,理由如下: 题中介绍了,随着电子阅读的普及,传统纸媒受到了强烈的冲击,从表格中的数据中可以看出从 2014 年 开始,广告收入呈现逐年下降的趋势,可以预见,2019 年的纸质广告收入会接着下跌,前四年的增长趋势 已经不能作为预测后续数据的依据. 相关系数越接近 1,线性相关性越强,因为根据 9 年的数据得到的相关系数的绝对值,我 们没有理由认为 与 具有线性相关关系 ; 而后5年的数据得到的相关系数的绝对值, 所

41、以有 的把握认为 与 具有线性相关关系. (2) 因为在该网站购买该书籍的大量读者中, 只购买电子书的读者比例为, 纸质版本和电子书同时购买 的读者比例为,所以从该网站购买该书籍的大量读者中任取一位,购买电子书的概率为,只 购买纸质书的概率为 , 购买电子书人数多于只购买纸质书人数有两种情况:3 人购买电子书,2 人购买电 子书一人只购买纸质书.概率为:. 2 【黑龙江省齐齐哈尔市 2019 届高三第一次模拟】中学为研究学生的身体素质与体育锻炼时间的关系,对 该校 200 名高三学生平均每天体育锻炼时间进行调查,如表:(平均每天锻炼的时间单位:分钟) 平均每天锻炼的时间/分钟 总人数20364

42、4504010 将学生日均体育锻炼时间在的学生评价为“锻炼达标”. (1)请根据上述表格中的统计数据填写下面的列联表; 锻炼不达标锻炼达标合计 男 女20110 合计 并通过计算判断,是否能在犯错误的概率不超过 0.025 的前提下认为“锻炼达标”与性别有关? (2)在“锻炼达标”的学生中,按男女用分层抽样方法抽出 10 人,进行体育锻炼体会交流, (i)求这 10 人中,男生、女生各有多少人? (ii)从参加体会交流的 10 人中,随机选出 2 人作重点发言,记这 2 人中女生的人数为 ,求 的分布列和 数学期望. 参考公式:,其中. 临界值表 0.100.050.0250.010 2.70

43、63.8415.0246.635 【解析】 (1) 锻炼不达标锻炼达标合计 男603090 女9020110 合计15050200 由列联表中数据,计算得到的观测值为 . 所以在犯错误的概率不超过 0.025 的前提下能判断“锻炼达标”与性别有关. (2) (i)“锻炼达标”的学生有 50 人,男、女生人数比为,故用分层抽样方法从中抽出 10 人,男生有 6 人,女生有 4 人. (ii) 的可能取值为 0,1,2; , , , 的分布列为 012 的数学期望. 3 【江西省南昌市 2019 届高三第一次模拟】市面上有某品牌 型和 型两种节能灯,假定 型节能灯使用寿 命都超过 5000 小时,

44、经销商对 型节能灯使用寿命进行了调查统计,得到如下频率分布直方图: 某商家因原店面需要重新装修,需租赁一家新店面进行周转,合约期一年.新店面需安装该品牌节能灯 5 支 (同种型号)即可正常营业.经了解, 型 20 瓦和 型 55 瓦的两种节能灯照明效果相当,都适合安装.已知 型和 型节能灯每支的价格分别为 120 元、25 元,当地商业电价为 0.75 元/千瓦时.假定该店面一年周转期 的照明时间为 3600 小时,若正常营业期间灯坏了立即购买同型灯管更换.(用频率估计概率) ()根据频率直方图估算 型节能灯的平均使用寿命; ()根据统计知识知,若一支灯管一年内需要更换的概率为 ,那么 支灯管

45、估计需要更换支.若该商家 新店面全部安装了 型节能灯,试估计一年内需更换的支数; ()若只考虑灯的成本和消耗电费,你认为该商家应选择哪种型号的节能灯,请说明理由. 【解析】 ()由图可知,各组中值依次为,对应的频率依次为,故型节 能灯的平均使用寿命为小时. () 由图可知, 使用寿命不超过小时的频率为, 将频率视为概率, 每支灯管需要更换的概率为 ,故估计一年内支型节能灯需更换的支数为. ()若选择型节能灯,一年共需花费元; 若选择型节能灯,一年共需花费元. 因为,所以该商家应选择 A 型节能灯. 4 【山东省潍坊市 2019 届高三一模】某水果种植基地引进一种新水果品种,经研究发现该水果每株

46、的产量 (单位 :) 和与它 “相近” 的株数 具有线性相关关系 (两株作物 “相近” 是指它们的直线距离不超过) , 并分别记录了相近株数为 0,1,2,3,4 时每株产量的相关数据如下: 01234 15121198 (1)求出该种水果每株的产量 关于它“相近”株数 的回归方程; (2)该种植基地在如图所示的长方形地块的每个格点(横纵直线的交点)处都种了一株该种水果,其中每 个小正方形的面积都为,现从所种的该水果中随机选取一株,试根据(1)中的回归方程,预测它的产 量的平均数. 附:回归方程中斜率和截距的最小二乘法估计公式分别为:,. 【解析】 (1)由题意得:, , , , 所以, ,

47、所以. (2)由回归方程得: 当时, 当时, 当时, 故平均数为:. 所以一株产量的平均数为. 5 【贵州省贵阳市普通中学 2019 届高三年级第一学期期末】如今我们的互联网生活日益丰富,除了可以很 方便地网购,网络外卖也开始成为不少人日常生活中不可或缺的一部分市某调查机构针对该市市场占有 率最高的两种网络外卖企业 以下简称外卖A、外卖的服务质量进行了调查,从使用过这两种外卖服务的 市民中随机抽取了 1000 人,每人分别对这两家外卖企业评分,满分均为 100 分,并将分数分成 5 组,得到 以下频数分布表: 分数 人数 种类 外卖A50150100400300 外卖B100100300200

48、300 表中得分越高,说明市民对网络外卖服务越满意若得分不低于 60 分,则表明该市民对网络外卖服务质量评 价较高现将分数按“服务质量指标”划分成以下四个档次: 分数 服务质量指标0123 视频率为概率,解决下列问题: 从该市使用过外卖A的市民中任选 5 人,记对外卖A服务质量评价较高的人数为X,求X的数学期望 从参与调查的市民中随机抽取 1 人,试求其评分中外卖A的“服务质量指标”与外卖B的“服务质量 指标”的差的绝对值等于 2 的概率; 在M市工作的小王决定从外卖A、外卖B这两种网络外卖中选择一种长期使用,如果从这两种外卖的 “服务质量指标”的期望角度看,他选择哪种外 卖更合适?试说明理由 【解析】 对外卖A服务质量评价较高的概率, 从该市使用过外卖A的市民中任选

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1