5用样本的频率分布估计总体分布.ppt

上传人:本田雅阁 文档编号:3468855 上传时间:2019-08-30 格式:PPT 页数:26 大小:327.52KB
返回 下载 相关 举报
5用样本的频率分布估计总体分布.ppt_第1页
第1页 / 共26页
5用样本的频率分布估计总体分布.ppt_第2页
第2页 / 共26页
5用样本的频率分布估计总体分布.ppt_第3页
第3页 / 共26页
5用样本的频率分布估计总体分布.ppt_第4页
第4页 / 共26页
5用样本的频率分布估计总体分布.ppt_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《5用样本的频率分布估计总体分布.ppt》由会员分享,可在线阅读,更多相关《5用样本的频率分布估计总体分布.ppt(26页珍藏版)》请在三一文库上搜索。

1、复习与回顾:,频率分布直方图,应用,1.求极差,2.决定组距与组数,3.将数据分组,4.列频率分布表,5.画频率分布直方图,频率分别直方图与样本原始数据比较: 直方图可以很容易的表示大量数据并且非常直观,如“峰值”、“对称性”; 根据直方图可以大致估计总体的分布情况,但不能保留原来的数据。,一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格。,0.06,0.16,8,0.06,0.14,16,0.46,思考 : 如果当地政府希望使 85% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?,0.04,0.08,

2、0.12,0.28,0.50,0.44,0.30,0.16,0.08,频率分布直方图如下:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,利用样本频率分布对总体分布进行相应估计,(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线。,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。,2、用样本分布直方图去估计相应的总体分布时,一

3、般样本容量越大,组距越小,频率分布折线就会无限接近总体密度曲线。,1、总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具。,关于总体密度曲线的说明:,注:由于样本是随机的,不同的样本得到的频率分布折线图不同;即使对于同一样本,不同的分组情况得到的频率分布折线图也不同。总之,频率分布折线图是随着抽取的样本、样本容量、分组情况的变化而变化的。因此不能由样本的频率分布折线图得到准确的总体密度曲线。,但不是每个总体都存在总体密度曲线,如:投掷骰子得到的总体。,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1)甲运动员得分: 13,51,

4、23,8,26, 38, 16, 33, 14, 28, 39,(1)乙运动员得分: 49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36 , 39,茎叶图,甲,乙,0 1 2 3 4 5,2 5 5 4 1 6 1 6 7 9 4 9 0,8 4 6 3 6 8 3 8 9 1,叶就是从茎的旁边生长出来的数,表示得分的个位数。,茎是指中间的一列数,表示得分的十位数,茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。

5、在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。,练习:P71,3,用样本的数字特征 估计 总体的数字特征,一、众数、中位数、平均数的概念,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。,众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛

6、。,平均数:一组数据的算术平均数,即,练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:,分别求这些运动员成绩的众数,中位数与平均数。,练习:期末考试后,班长算出了全班40个人的数学成绩的平均分M,若把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N,则M : N为 。,练习:当5个整数从小到大排列时,中位数是4,如果这5个数中的唯一众数是6,则这5个数之和的最大值是 。,二 、 众数、中位数、平均数与频率分布直方图的关系,1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,0.1,0.2,0.3,0.4,0.5,O 0.5

7、 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.25,2、中位数在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.02,3、平均数是频率分布直方图的“重心”. 是直方图的平衡点。,X=,n 个样本数据的平均数由公式:,频率分布直方图中的平均数的算法:,平均数=每个矩形框的面积矩形底边中点的横坐标之和,0.1,0.2,0.3,0.4,0

8、.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.02,0.04,0.08,0.12,0.28,0.50,0.44,0.30,0.16,0.08,三、三种数字特征的优缺点,1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。如上例中众数是2.25t,它告诉我们月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少。,2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么

9、它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。,3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,0.020,0.053,0.060,0.073,0.067,0.033,0.027,18.5,21.5,24.5,27.5,30.5,33.5,练习:根据如下频率分布直方图求众数,中位数,平均数。,练习:P74,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1