【湘教考】2016届高三数学(理)一轮复习课件:第10章 统计、统计案例.ppt

上传人:本田雅阁 文档编号:2271893 上传时间:2019-03-14 格式:PPT 页数:118 大小:4.40MB
返回 下载 相关 举报
【湘教考】2016届高三数学(理)一轮复习课件:第10章 统计、统计案例.ppt_第1页
第1页 / 共118页
【湘教考】2016届高三数学(理)一轮复习课件:第10章 统计、统计案例.ppt_第2页
第2页 / 共118页
【湘教考】2016届高三数学(理)一轮复习课件:第10章 统计、统计案例.ppt_第3页
第3页 / 共118页
亲,该文档总共118页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《【湘教考】2016届高三数学(理)一轮复习课件:第10章 统计、统计案例.ppt》由会员分享,可在线阅读,更多相关《【湘教考】2016届高三数学(理)一轮复习课件:第10章 统计、统计案例.ppt(118页珍藏版)》请在三一文库上搜索。

1、3/14/2019,第十章 统计、统计案例,10.1 随机抽样 10.2 用样本估计总体 10.3 变量间的相关关系、统计案例,3/14/2019,3/14/2019,3/14/2019,10.1 随机抽样,1.简单随机抽样 (1)定义:设一个总体含有N个个体,从中 抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会 ,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法: 和 .,3/14/2019,3/14/2019,3.分层抽样 (1)定义:在抽样时,将总体 的层,然后按照 ,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样

2、方法是一种分层抽样. (2)分层抽样的应用范围:当总体是由 . 组成的,往往选用分层抽样. 【思考探究】 三种抽样方法有什么共同点? 提示:抽样过程中每个个体被抽取的机会均等.,分成互不交叉 一定的比例 差异明显的几个部分,3/14/2019,1从2 014名学生中选取10名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样法从2 014人中剔除4人,剩下的2 010人再按系统抽样的方法抽取,则每人入选的概率() A.不全相等 B.均不相等 C.都相等,且为 D.都相等,且为 【解析】从N个个体中抽取M个个体,则每个个体被抽到的概率都等于M/N. 【答案】C,3/14/2019,2将

3、参加英语口语测试的1 000名学生编号为000,001,002,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,019,且第一组随机抽取的编号为015,则抽取的第35个编号为() A.700 B.669 C.695 D.676 【解析】由题意可知,第一组随机抽取的编号l15, 分段间隔数kN/n1 000/5020, 则抽取的第35个编号为a3515(351)20695. 【答案】C,3/14/2019,3.某大型超市销售的乳类商品有4类:鲜奶、酸奶、婴幼儿奶粉、成人奶粉,且鲜奶、酸奶、婴幼儿奶粉、成人奶粉分别有45种、10种、25种、

4、20种不同的品牌,现从中抽取一个容量为20的样本进行三聚氰胺的安全检测,若采用分层抽样的方法抽取样本,则抽取的酸奶与成人奶粉品牌数之和是( ) A.7 B.6 C.5 D.4,3/14/2019,4某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号, 196200号)若第5组抽出的号码为22,则第8组抽出的号码应是若用分层抽样方法,则40岁以下年龄段应抽取人 【解析】由系统抽样知识可知,将总体分成均等的若干部分指的是将总体分段,且分段的间隔相等在第1段内采用简单随机抽样的方法确定一个起始编号

5、,在此编号的基础上加上分段间隔的整数倍即为抽样编号由题意,第5组抽出的号码为22,因为2(51)522,则第1组抽出的号码应该为2,第8组抽出的号码应该为2(81)537.由分层抽样知识可知,40岁以下年龄段的职工占50%,按比例应抽取4050%20(人) 【答案】37 20,3/14/2019,简单随机抽样,简单随机抽样的特点: (1)抽取的个体数较少; (2)逐个抽取; (3)是不放回抽取; (4)是等可能抽取. 【注意】 抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.,3/14/2019,(1)下列抽取样本的方式属于简单随机抽样的个数是. 从无限多个个体中抽取

6、100个个体作为样本 盒子里共有80个零件,从中选出5个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里 从20件玩具中一次性抽取3件进行质量检验 某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛 (2)总体编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第11列和第12列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为,3/14/2019,【解析】(1)不是简单随机抽样由于被抽取的样本总体的个体数是无限的,而不是有限的 不是简单随机抽样由于它是放回抽样 不是简单随机抽样因为这是“

7、一次性”抽取,而不是“逐个”抽取 不是简单随机抽样因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样,3/14/2019,(2)依题意,第一次得到的两个数字为02,由于0220,将它去掉;第三次得到的两个数字为14,由于1420,说明号码14在总体内,将它取出;继续向右读,依次可以取出07,02,01;但由于02在前面已经选出,故需要继续选一个再选一个就是04.故选出来的第5个个体是04. 【答案】(1)0(2)04,3/14/2019,【变式训练】 1.某项大赛举行群众参与活动,现在要从6名入围的幸运观众中抽取三人获得大赛一等奖.问:第一次抽取时,每个个体被抽到的概率是

8、多少?第二次抽取时,余下的每个个体被抽到的概率是多少?第三次抽取时,余下的每个个体被抽到的概率是多少?整个抽样过程中,每个个体被抽取的概率是多少?应当选用什么样的方法抽取获奖观众更公平?,3/14/2019,3/14/2019,系统抽样,3/14/2019,将参加夏令营的600名学生编号为001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为( ) A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,

9、9,3/14/2019,【解析】由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(kN*)组抽中的号码是312(k1) 令312(k1)300得k1034,因此第营区被抽中的人数是25; 令300312(k1)495得1034k42,因此第营区被抽中的人数是422517. 结合各选项知,选B. 【答案】B,3/14/2019,【变式训练】 2.一个总体中的1 000个个体编号为0,1,2,999,并依次将其分为10个小组,组号为0,1,2,9,要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号

10、码,即第k组中抽取的号码的后两位数为x33k的后两位数, (1)当x24时,写出所抽取样本的10个号码; (2)若所抽取样本的10个号码中有一个的后两位数是87,求x的取值范围.,3/14/2019,3/14/2019,分层抽样,分层抽样遵循的原则 (1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则. (2)分层抽样为保证每个个体等可能入样需遵循每层抽样的比相同,即为样本容量与总体数目的比值.,3/14/2019,( 1)(2014兰州模拟)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人): 学校要对这三个小组的活

11、动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为 (2)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为 ,3/14/2019,【解析】(1)因为3045153010a20124515,解得a30. (2)由题意知,青年职工人数中年职工人数老年职工人数350250150753.由样本中青年职工为7人得样本容量为15. 【答案】(1)30 (2)15,3/14/2019,3/14/2019,3/14/

12、2019,3/14/2019,三种抽样方法的比较,3/14/2019,从近两年的高考试题来看,分层抽样是高考的热点,但同时重视系统抽样,题型既有选择题也有填空题,分值占5分左右,属容易题.命题时多以现实生活为背景,主要考查基本概念及简单计算.,3/14/2019,(2013江西卷)总体由编号为01,02,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为() A.08 B.07 C.02 D.01,【规范解答】选出来的5个个体编号依次为:08,02,14,07,01.故选D. 【答

13、案】D,3/14/2019,【阅后报告】(1)为了便于使用随机数表,给总体的每个个体编号时其位数相同:如两位数编号为01,02,三位数编号为001,002,在数表中,每两个数字(每三个数字)连在一起对应一个个体 (2)读数时,从表中随机选取一个数字开始,自左向右,或自右向左选取,有超过总体号码或出现重复的数字舍去,直到找到全体,3/14/2019,1.(2013安徽卷)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是

14、( ) A.这种抽样方法是一种分层抽样 B.这种抽样方法是一种系统抽样 C.这五名男生成绩的方差大于这五名女生成绩的方差 D.该班男生成绩的平均数小于该班女生成绩的平均数,3/14/2019,2(2014重庆卷)某中学有高中生3 500人,初中生1 500人为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为() A.100 B.150 C.200 D.250 【解析】由题意,得70/3 500n/(3 5001 500),解得n100. 【答案】A,3/14/2019,3.(2013陕西卷)某单位有840名职工,现采用系统抽样方法抽取42

15、人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为( ) A.11 B.12 C.13 D.14 【解析】由系统抽样定义可知,所分组距为840/4220,每组抽取一个,因为包含整数个组,所以抽取个体在区间481,720的数目为(720480)2012. 【答案】B,3/14/2019,4(2014湖北卷)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件 【解析】设乙设备生产的产品总数为n,则8050n80/4 800,解得n1

16、800. 【答案】1 800,课 时 作 业,3/14/2019,10.2 用样本估计总体,1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距和组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.,3/14/2019,2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的 ,就得到频率分布折线图. (2)总体密度曲线:随着 的增加,作图时 增加, 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.,中点 样本容量 所分的组数 组距,3/14/2019,原始信

17、息 数据信息 随时记录 记录 表示 平均距离,3/14/2019,5.利用频率分布直方图估计样本的数字特征 (1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积 ,由此可以估计中位数的值. (2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的 . (3)众数:在频率分布直方图中,众数是最高的矩形的中点的 .,3/14/2019,1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有 ( ) A.abc B.bca C.cab D.cba,3/14/2019,2

18、.已知下列说法: 众数所在的组的频率最大; 各组频数之和为1; 如果一组数据的最大值与最小值的差是15,组距为3,那么这组数据应分为5组; 频率分布直方图中每个小长方形的高与这一组的频数成正比例. 正确的说法是( ) A. B. C. D.,3/14/2019,3若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则() A.5,s22 C.5,s25,s22 【解析】18(x1x2x8)5, 19(x1x2x85)5, 5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强,s22,故选A. 【答案】A,3/14/

19、2019,3/14/2019,3/14/2019,5.(2014武汉武昌区联考)已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按140编号,并按编号顺序平均分成5组按系统抽样方法在各组内抽取一个号码 (1)若第1组抽出的号码为2,则所有被抽出职工的号码为 ; (2)分别统计这5名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,则该样本的方差为 【解析】由题意知被抽出职工的号码为2,10,18,26,34.由茎叶图知5名职工体重的平均数x5962707381569,则该样本的方差 【答案】(1)2,10,18,26,34(2)62,3/14/2019,频率分布直方图,频率分

20、布直方图从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.图中各小长方形的面积等于相应各组的频率,它直观反映了数据落在各个小组的频率的大小.,3/14/2019,3/14/2019,【解析】(1)由频率分布直方图得前五组频率为 (0.0080.0160.040.040.06)50.82,后三组频率为10.820.18,人数为0.18509(人),这所学校高三年级全体男生身高在180 cm以上(含180 cm)的人数为8000.18144(人) (2)由频率分布直方图得第八组频率为0.00850.04,人数为0.04502(人),设第六组人数为m,则第七组人数为92m7m.又m2

21、2(7m),m4,所以第六组人数为4人,第七组人数为3人,频率分别为0.08,0.06.频率/组距分别为0.016,0.012(画图如图),3/14/2019,3/14/2019,3/14/2019,3/14/2019,3/14/2019,茎叶图,1.运用茎叶图表示样本数据,有两大突出优点: (1)统计图上没有原始信息的损失,所有数据信息都可以从茎叶图中得到; (2)茎叶图可以随时记录,方便表示与比较. 2.一般制作茎叶图的方法是: 将所有两位数的十位数字作“茎”,个位数字作“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出.,3/14/2019,随机抽取某中学甲、乙两班各10名同学,测

22、量他们的身高(单位:cm),获得身高数据的茎叶图如图.,(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差.,3/14/2019,3/14/2019,3/14/2019,【变式训练】2.(2013洛阳联考)有A,B,C,D,E五位工人参加技能竞赛培训.现分别从A,B二人在培训期间参加的若干次预赛成绩中随机抽取8次,用茎叶图表示这两组数据如图. (1)现要从A,B中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由; (2)若从参加培训的5位工人中选2人参加技能竞赛,求A,B二人中至少有一人参加技能竞赛的概率.,3/14/2019,3/14/

23、2019,用样本的数字特征估计总体的分布,平均数、众数、中位数描述一组数据的集中趋势,方差和标准差描述其波动大小,也可以说方差、标准差反映各个数据与其平均数的离散程度.一组数据的方差或标准差越大,说明这组数据波动越大.,3/14/2019,3/14/2019,3/14/2019,【变式训练】3.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下: 服用A药的20位患者日平均增加的睡眠时间: 0.61.22.71.52.81.82.22.33.23.5

24、 2.52.61.22.71.52.93.03.12.32.4 服用B药的20位患者日平均增加的睡眠时间: 3.21.71.90.80.92.41.22.61.31.4 1.60.51.80.62.11.12.51.22.70.5 (1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成右面茎叶图,从茎叶图看,哪种药的疗效更好?,3/14/2019,【解析】(1)设A药观测数据的平均数为A,B药观测数据的平均数为B, 则A120(0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4)2.3. B

25、120(3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5)1.6. 则AB,因此A药的疗效更好 (2)由观测结果绘制如下茎叶图: 从茎叶图可以看出,A药疗效的试验结果有7/10的叶集中在茎2,3上;B药疗效的试验结果有7/10的叶集中在茎0,1上由上述可看出A药的疗效更好,3/14/2019,1.几种表示频率分布方法的优点与不足 (1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便. (2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的

26、数据模式. (3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线. (4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.,3/14/2019,3/14/2019,从近两年的高考试题来看,频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力.,3/

27、14/2019,(2012陕西卷)假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解它们的使用寿命,现从这两种品牌的产品中分别随机抽取100个进行测试,结果统计如图所示: (1)估计甲品牌产品寿命小于200小时的概率; (2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是甲品牌的概率,3/14/2019,【规范解答】(1)甲品牌产品寿命小于200小时的频率为 用频率估计概率,所以甲品牌产品寿命小 于200小时的概率为 . (2)根据抽样结果,寿命大于200小时的产品共有7570145(个),其中甲品牌产品是75个,所以在样本中,寿命大于200小时的产品是甲品牌的频率是 用

28、频率估计概率,所以已使用了200小时的该产品是甲品牌的概率为 . 【阅后报告】(1)注意本题中的图是频数分布图不是频率分布直方图 (2)弄清楚寿命小于200小时,大于200小时的频数便于求频率,3/14/2019,1(2014山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17将其按从左到右的顺序分别编号为第一组,第二组,第五组,下图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为() A.6 B.8 C

29、.12 D.18 【解析】因为第一组与第二组共有20人,并且 根据图象知第一组与第二组的频率之比是 0.240.1632,所以第一组的人数为203512.又因为第一组与第三组的频率之比是0.240.3623 ,所以第三组有 122318人因为第三组中没有疗效的人数为6,所以第三组中有疗效的人数是18612. 【答案】C,3/14/2019,3/14/2019,3/14/2019,3.(2013辽宁卷)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 .,3/14/

30、2019,4(2014山东卷)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如表所示工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测 (1)求这6件样品中来自A,B,C各地区商品的数量; (2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率,3/14/2019,课 时 作 业,3/14/2019,10.3 变量间的相关关系、统计案例,1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从 到 的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从

31、到 的区域,对于两个变量的这种相关关系,我们将它称为负相关.,左下角 右上角 左上角 右下角,3/14/2019,(3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 【思考探究】 相关关系与函数关系有什么异同点? 提示:相同点:两者均是指两个变量的关系. 不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.,一条直线附近,3/14/2019,3/14/2019,3回归分析 (1)定义:对具有_的两个变量进行统计分析的 一种常用方法 (2)

32、随机误差:线性回归模型用ybxae表示,其中a 和b为模型的_,_称为随机误差,3/14/2019,当r0时,表明两个变量_; 当r0时,表明两个变量_ r的绝对值越接近于1,表明两个变量的线性 相关性_r的绝对值越接近于0时, 表明两个变量之间_通常|r|大于_ 时,认为两个变量有很强的线性相关性,3/14/2019,3/14/2019,3/14/2019,5.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的_,像这样的变量称为分类变量 (2)列联表:列出两个分类变量的_,称为列联表 假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列

33、联表)为,22列联表,3/14/2019,构造一个随机变量K2_,其中 n_为样本容量,(3)独立性检验 利用随机变量、_来确定是 否一定有把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,3/14/2019,1判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是() A.三维柱形图 B.二维条形图 C.等高条形图 D.独立性检验 【解析】前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度独立性检验通过计算得出相关的可能性,较为准确 【答案】D,3/14/2019,【解析】 据相关指数的定义可知,相关指数R2的值越大,残差平方和越小,即模型的拟合

34、效果越好. 【答案】 A,3/14/2019,【解析】散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强. 【答案】D,3/14/2019,3/14/2019,3/14/2019,5某超市为了了解热茶的销售量y(单位:杯)与气温x(单位:)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表: 由表中数据算得线性回归方程ybxa中的b2,预测当气温为5 时,热茶销售量为 杯,3/14/2019,3/14/2019,相关关系的判断,3/14/2019,3/14/2019,【变式训练】 1.下面是水稻产量与施化肥量的一组观测数据: 施化肥

35、量:15 20 25 30 35 40 45 水稻产量:320 330 360 410 460 470 480 (1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?,3/14/2019,3/14/2019,回归方程的求法及回归分析,3/14/2019,为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系: 小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 ,【解析】小李这5天的平均

36、投篮命中率 y(0.40.50.60.60.4)/50.5,可求得小李这5天的平均打篮球时间3.根据表中数据可求得 b0.01, a0.47,故线性回归方程为y 0.470.01x,将x6代入得6号打6小时篮球的投篮命中率约为0.53. 【答案】0.5 0.53,3/14/2019,【变式训练】2.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下: (1)在给定的坐标系中画出表中数据的散点图; (2)求出y关于x的线性回归方程x,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时? (注: ),3/14/2019,【解析】(1)散点图如图,

37、3/14/2019,独立性检验,3/14/2019,3/14/2019,3/14/2019,3/14/2019,【变式训练】3.某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的5/6,女生喜欢看NBA的人数占女生人数的1/3. (1)若被调查的男生人数为n,根据题意建立一个22列联表; (2)若有95%的把握认为是否喜欢看NBA和性别有关,求男生至少有多少人? 附:,3/14/2019,3/14/2019,1.线性相关关系的理解:相关关系与函数关系不同,函数关系中的两个变量间是一种确定性关系.例如正方形面积S与边长x之间的

38、关系S=x2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提. 2.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同),3/14/2019,3.回归分析是处理变量相关关系的一种数学方法.主要解决: (1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式; (2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势; (3)求出回归

39、直线方程. 4.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K22.706应判断为没有充分证据显示X与Y有关系,而不能作为小于90%的量化值来判断.,3/14/2019,本部分内容是新课标数学的新增内容,在目前高考中时有出现,2012年全国各地高考都有考查本小节内容,今后的复习中应引起重视.,3/14/2019,(2013福建卷)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周

40、岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70), 70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图. (1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率; (2) 规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?,3/14/2019,3/14/2019,3/14/2019,1(2014湖北卷)根据如下样本数据 得到的回归方程为ybxa,则( ) A.a0,b0 B.a0,b0 C.a0,b0 D.a0,b0 【解析】作出散点图如下: 由图象不难得出,回归直线ybxa的斜率b0,所以a0,b0.故选A. 【答案】A,3/14/2019,3/14/2019,3/14/2019,4(2014辽宁卷)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示: (1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”; (2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率,3/14/2019,课 时 作 业,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1