用样本估计总体要点梳理频率分布直方图通常.ppt

上传人:本田雅阁 文档编号:2664874 上传时间:2019-05-02 格式:PPT 页数:55 大小:1,013.01KB
返回 下载 相关 举报
用样本估计总体要点梳理频率分布直方图通常.ppt_第1页
第1页 / 共55页
用样本估计总体要点梳理频率分布直方图通常.ppt_第2页
第2页 / 共55页
用样本估计总体要点梳理频率分布直方图通常.ppt_第3页
第3页 / 共55页
用样本估计总体要点梳理频率分布直方图通常.ppt_第4页
第4页 / 共55页
用样本估计总体要点梳理频率分布直方图通常.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《用样本估计总体要点梳理频率分布直方图通常.ppt》由会员分享,可在线阅读,更多相关《用样本估计总体要点梳理频率分布直方图通常.ppt(55页珍藏版)》请在三一文库上搜索。

1、11.2 用样本估计总体 要点梳理 1.频率分布直方图 (1)通常我们对总体作出的估计一般分成两种, 一种是用 .另一种 是用 . (2)在频率分布直方图中,纵轴表示 ,数据 落在各小组内的频率用 表示. 各小长方形的面积总和 .,样本的频率分布估计总体的分布,样本的数字特征估计总体的数字特征,各小长方形的面积,等于1,基础知识 自主学习,(3)连结频率分布直方图中各小长方形上端的中 点,就得到频率分布折线图.随着 的增 加,作图时所分的 增加,相应的频率分布折 线图就会越来越接近于一条光滑的曲线,统计中 称之为 ,它能够更加精细的反映出 . (4)当样本数据较少时,用茎叶图表示数据的效 果较

2、好,它不但可以 ,而且可以 ,给数据的 和 都带来方便.,样本容量,组数,总体密度曲线,各个范围内取值的百分比,总体在,保留所有信息,随时,记录,记录,表示,2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数 的数据叫做 这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的 . 平均数:样本数据的算术平均数.即 = . 在频率分布直方图中,中位数左边和右边的直方 图的面积应该 .,最多,最中,间,中位数,相等,(2)样本方差、标准差 标准差s= 其中xn是 ,n是 , 是 . 是反映

3、总体波动大小的特征数,样本方差是 标准差的 .通常用样本方差估计总体方差,当 时,样本方差很接近总体方差.,样本数据的第n项,样本容量,数,平均,标准差,本容量接近总体容量,平方,样,基础自测 1.一个容量为32的样本,已知某组样本的频率为 0.375,则该组样本的频数为 ( ) A.4 B.8 C.12 D.16 解析 频率= .频数=频率容量= 0.37532=12.,C,2.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为 ( ) A.5,24 B.5,24 C.4,25 D.4,25 解析 中位数为5,5= ,x=6. s2=

4、 (5+1)2+(5-0)2+(5-4)2+(5-6)2+(5-7)2+(5-14)2=24 .,A,3.某雷达测速区规定:凡车速大于或等于70 km/h的 汽车视为“超速”,并将受到处罚,如图是某路段 的一个检测点对200辆汽车的车速进行检测所得结 果的频率分布直方图,则从图中可以看出被处罚 的汽车大约有 ( ),A.30辆 B.40辆 C.60辆 D.80辆 解析 由图可知,车速大于或等于70 km/h的汽车的 频率为0.0210=0.2,则将被罚的汽车大约有 2000.2=40辆. 答案 B,4.甲、乙两位同学参加了由学校举办的篮球比赛,它 们都参加了全部的7场比赛,平均得分均为16分,

5、 标准差分别为5.09和3.72,则甲、乙两同学在这次 篮球比赛活动中,发挥得更稳定的是( ) A.甲 B.乙 C.甲、乙相同 D.不能确定 解析 平均数相同,看谁的标准差小,标准差小的 就稳定.,B,5.一个容量为20的样本数据,分组后,组别与频数如下:,则样本在(20,50上的频率为 . 解析 =60%.,60%,题型一 频率分布直方图在总体估计中的应用 【例1】 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为24171593,第二小组频数为12.,题型分类 深度剖析,(1)第二小组的频率是多少?样

6、本容量是多少? (2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?,利用面积求得每组的频率求样本容量 求频率和求达标率 解 (1)由已知可设每组的频率为 2x,4x,17x,15x,9x,3x. 则2x+4x+17x+15x+9x+3x=1 解得 x=0.02. 则第二小组的频率为0.024=0.08, 样本容量为120.08=150. (2)次数在110次以上(含110次)的频率和为 170.02+150.02+90.02+30.02 =0.34+0.3+0.18+0.06=0.88. 则高一学生的达标率约为0.88100%=88%.,思维启迪,探究提高

7、用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距.(2)频率分布直方图中各长方形高的比也就是其频率之比.(3)直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.,知能迁移1 有一容量为100的样本,数据的分组及各组的频数如下: 12.5,15.5),6;15.5,18.5),16; 18.5,21.5),18;21.5,24.5),22; 24.5,27.5),20;27.5,30.5),10; 30.5,33.5),8. (1)列出样本的频

8、率分布表; (2)画出频率分布直方图; (3)估计数据小于30.5的概率.,解 (1)样本的频率分布表如下:,(2)频率分布直方图如下图所示.,(3)数据大于等于30.5的频率是0.08,所以小于 30.5的频率是0.92,所以数据小于30.5的概率约为 0.92.,题型二 茎叶图的应用 【例2】 某班甲、乙两学生的高考备考成绩如下: 甲:512 554 528 549 536 556 534 541 522 538 乙:515 558 521 543 532 559 536 548 527 531 (1)用茎叶图表示两学生的成绩; (2)分别求两学生成绩的中位数和平均分. (1)将十位与百位

9、数字作为茎,个位数字作为叶,逐一统计;(2)根据茎叶图分析两组数据,得出结论.,思维启迪,解 (1)两学生成绩的茎叶图如图所示. (2)将甲、乙两学生的成绩从小到大排列为: 甲:512 522 528 534 536 538 541 549 554 556 乙:515 521 527 531 532 536 543 548 558 559 从以上排列可知甲学生成绩的中位数为 = 537.,乙学生成绩的中位数为 =534. 甲学生成绩的平均数为 500+ =537, 乙学生成绩的平均数为 =537. (1)茎叶图的优点是保留了原始数据, 便于记录及表示,能反映数据在各段上的分布情况. (2)茎叶

10、图不能直接反映总体的分布情况,这就需 要通过茎叶图给出的数据求出数据的数字特征,进 一步估计总体情况.,12+22+28+34+36+38+41+49+54+56 10,15+21+27+31+32+36+43+48+58+59 10,500+,探究提高,知能迁移2 (2008海南,宁夏理,16)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下: 甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284

11、292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356,由以上数据设计了如下茎叶图:,根据以上茎叶图,对甲、乙两品种棉花的纤维长度 作比较,写出两个统计结论: ; .,解析 由茎叶图可以看出甲棉花纤维的长度比较分 散,乙棉花纤维的长度比较集中(大部分集中在312 337之间),还可以看出乙的平均长度应大于 310,而甲的平均长度要小于310等,通过分析可得 到以下结论. 答案 乙品种棉花的纤维平均长度大于甲品种棉 花的纤维平均长度(或:乙品种棉花的纤维长度普

12、遍大于甲品种棉花的纤维长度).,甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大). 甲品种棉花的纤维长度的中位数为307 mm,乙品种棉花的纤维长度的中位数为318 mm. 乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.,题型三 用样本的数字特征估计总体的数字特征 【例3】(12分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.,(1)分别求出两人得分的平

13、均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩 作出评价. (1)先通过图象统计出甲、乙二人的 成绩; (2)利用公式求出平均数、方差,再分析两人的成 绩,作出评价. 解 (1)由图象可得甲、乙两人五次测试的成绩分 别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. 2分,思维启迪,5分 (10-13)2+(13-13)2+(12-13)2+(14-13) 2 +(16-13)2=4, (13-13)2+(14-13)2+(12-13)2+(12-13)2+ (14-13)2=0.8. 8分 (2)由 可知乙的成绩较稳定. 10分 从

14、折线图看,甲的成绩基本呈上升状态,而乙的成 绩上下波动,可知甲的成绩在不断提高,而乙的成 绩则无明显提高. 12分,探究提高 (1)平均数与方差都是重要的数字特征, 是对总体的一种简明的描述,它们所反映的情况有 着重要的实际意义,平均数、中位数、众数描述其 集中趋势,方差和标准差描述波动大小. (2)平均数、方差的公式推广 若数据x1,x2,xn的平均数为 ,那么 mx1+a,mx2+a,mx3+a,mxn+a的平均数是m +a. 数据x1,x2,xn的方差为s2. a.s2= b.数据x1+a,x2+a,xn+a的方差也为s2; c.数据ax1,ax2,axn的方差为a2s2.,知能迁移3

15、甲、乙两台机床同时加工直径为10 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm): 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100 (1)分别计算上述两组数据的平均数和方差; (2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.,解 (1) (99-100)2+(100-100)2+(98-100)2+ (100-100)2+(100-100)2+(103-100)2= . (99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100

16、-100)2=1. (2)因为 ,说明甲机床加工的零件波动比较大,因此乙机床加工的零件更符合要求.,方法与技巧 1.用样本频率分布来估计总体分布的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计. 2.几种表示频率分布的方法的优点与不足: (1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.,思想方法 感悟提高,(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能

17、够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了. (3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线. (4)用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图显得不太方便了.,3.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在

18、刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差. 失误与防范 不要把直方图错以为条形图,两者的区别在于条形 图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这 是密度.连续随机变量在某一点上是没有频率的.,一、选择题 1.在样本的频率分布直方图中,共有11个小长方形,若 中间一个小长方形的面积等于其他10个小长方形的面 积和的 ,且样本容量为160,则中间一组的频数为 ( ) A.32 B.0.2 C.40 D.0.25 解析 中间一个占总面积的 ,即,A,定时检测,2.10名工人某天生产同一零件,生产的件数是 15,17,14,

19、10,15,17, 17,16, 14,12,设其平均数 为a,中位数为b,众数为c,则有 ( ) A.abc B.bca C.cab D.cba 解析 平均数a= (15+17+14+10+15+17+17+16+14 +12)=14.7.中位数b=15,众数c=17.cba.,D,3.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图),已知从左到右各长方形高的比为235631,则该班学生数学成绩在(80,100)之间的学生人数是 ( ),A.32 B.27 C.24 D.33 解析 80100间两个长方形高占总体的比例: 即为频数之比. x=3

20、3. 答案 D,4.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为 ( ),A.64 B.54 C.48 D.27 解析 前两组中的频数为100(0.05+0.11)=16. 后五组频数和为62,前三组为38. 第三组为22.又最大频率为0.32的最大频数为0.32 100=32,a=22+32=54. 答案 B,5.(2009山东理,8)某工厂对 一批产品进行了抽样检测,右 图是根据抽样检测后的产品净 重(单位:克)数

21、据绘制的频 率分布直方图,其中产品净重 的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是 ( ),A.90 B.75 C.60 D.45 解析 产品净重小于100克的频率为(0.050+0.100) 2=0.300,已知样本中产品净重小于100克的个数 是36,设样本容量为n,则 =0.300,所以n=120, 净重大于或等于98克并且小于104克的产品的频率 为(0.100+0.150+0.125)2=0.750,所以样本

22、 中净重大于或等于98克并且小于104克的产品的个 数是1200.750=90. 答案 A,6.下图是某学校举行的运动会上七位评委为某体操 项目打出的分数的茎叶统计图,去掉一个最高分 和一个最低分后,所剩数据的平均数和方差分别 为 ( ) 7 9 8 4 4 6 4 7 9 3 A.84,4.84 B.84,1.6 C.85,1.6 D.85,4 解析 去掉最高分93,最低分79, 平均分为 (84+84+86+84+87)=85, 方差s2= (84-85)2+(84-85)2+(86-85)2+(84- 85)2+(87-85)2= =1.6.,C,二、填空题 7.甲、乙两名射击运动员参加

23、某大型运动会的预选 赛,他们分别射击了5次,成绩如下表(单位: 环): 如果甲、乙两人中只有1人入选,则入选的最佳人选应是 .,解析 (9-10)2+(9-8)2+ (9-9)2+(9-9)2+(9-9)2= , (9-10)2+(9-10)2+(9-7)2+(9-9)2+ (9-9)2= ,故甲更稳定,故填甲. 答案 甲,8.为了了解“预防禽流感疫苗”的使用情况,某市卫 生部门对本地区5月份至7月份使用疫苗的所有养 鸡场进行了调查,根据下列图表提供的信息,可 以得出这三个月本地区平均每月注射了疫苗的鸡 的数量为 万只.,解析 (201+502+1001.5)=90万只. 答案 90,9.(2

24、009福建理,12)某校开展“爱我海西、爱 我家乡”摄影比赛,9位评委为参赛作品A给出的 分数如茎叶图所示.记分员在去掉一个最高分和 一个最低分后,算得平均分为91,复核员在复核 时,发现有一个数字(茎叶图中的x)无法看清, 若记分员计算无误,则数字x应该是 . 解析 当x4时, x4,则 =91,x=1.,1,三、解答题 10.甲、乙两台机床同时生产一种零件,在10天中, 两台机床每天出的次品数分别是:,分别计算两个样本的平均数与方差,从计算结果看, 哪台机床10天生产中出次品的平均数较小?出次品 的波动较小?,解 (03+12+23+31+41)=1.5, (02+15+22+31)=1.

25、2, (0-1.5)2+(1-1.5)2+(0-1.5)2+ (2-1.5)2+(4-1.5)2=1.65, (2-1.2)2+(3-1.2)2+(1-1.2)2+ (0-1.2)2+(1-1.2)2=0.76. 从结果看乙台机床10天生产出次品的平均数较小, 出次品的波动也较小.,11.下图是某市有关部门根据该市干部的月收入情 况,作抽样调查后画出的样本频率分布直方图, 已知图中第一组的频数为4 000,请根据该图提供 的信息解答下列问题:(图中每组包括左端点, 不包 括右端点,如第一组表示收入在1 000,1 500),(1)求样本中月收入在2 500,3 500)的人数; (2)为了分析

26、干部的收入与年龄、职业等方面的关 系,必须从样本的各组中按月收入再用分层抽样方 法抽出100人作进一步分析,则月收入在1 500, 2 000)的这段应抽多少人? (3)试估计样本数据的中位数. 解 (1)月收入在1 000,1 500)的概率为 0.000 8500=0.4,且有4 000人, 样本的容量n= =10 000; 月收入在1 500,2 000)的频率为0.000 4500 =0.2;,月收入在2 000,2 500)的频率为0.000 3500= 0.15; 月收入在3 500,4 000)的频率为0.000 1500= 0.05. 月收入在2 500,3 500)的频率为

27、1-(0.4+0.2+0.15+0.05)=0.2. 样本中月收入在2 500,3 500)的人数为 0.210 000=2 000. (2)月收入在1 500,2 000)的人数为 0.210 000=2 000,,再从10 000人中用分层抽样方法抽出100人,则月 收入在1 500,2 000)的这段应抽取100 =20(人). (3)由(1)知月收入在1 000,2 000)的频率为 0.4+0.2=0.60.5, 样本数据的中位数为 1 500+ =1 500+250=1 750(元).,12.为了了解中华人民共和国道路交通安全法在学生中的普及情况,调查部门将某校12名学生分为两组进

28、行问卷调查.第一组的得分情况为:5,6,7,8,9,10;第二组的得分情况为:4,6,7,9,9,10. (1)根据以上数据,判断两组中哪组更优秀? (2)把第一组的6名学生的得分看成一个总体.用简单随机抽样方法从这6名学生中抽取2名,他们的得分组成一个样本.求该样本平均数与总体平均数之差的绝对值不超过0.5的概率.,解 (1)第一组的得分平均数为 (5+6+7+8+9+10)=7.5 (5-7.5)2+(6-7.5)2+(7-7.5)2+(8-7.5)2 +(9-7.5)2+(10-7.5)2= 17.5. 第二组的得分平均数为 (4+6+7+9+9+10)=7.5, (4-7.5)2+(6

29、-7.5)2+(7-7.5)2+(9-7.5)2 +(9-7.5)2+(10-7.5)2= 25.5. 所以 说明第一组和第二组的平均得分 相同,但是第一组比第二组更稳定,故第一组比第 二组更优秀.,(2)由(1)知 =7.5. 设A表示事件“样本平均数与总体平均数之差的绝对 值不超过0.5”. 从总体中抽取两个个体的全部可能的基本结果有: (5,6),(5,7),(5,8),(5,9),(5,10), (6,7),(6,8),(6,9),(6,10),(7,8), (7,9),(7,10),(8,9),(8,10),(9,10), 共15个基本结果. 事件A包括的基本结果有:(5,9),(5,10), (6,8),(6,9),(6,10),(7,8),(7,9),共有 7个基本结果. 所以所求的概率为P(A)= .,返回,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1