2019第1节随机抽样教师.doc

上传人:上海哈登 文档编号:2382694 上传时间:2019-03-25 格式:DOC 页数:27 大小:937KB
返回 下载 相关 举报
2019第1节随机抽样教师.doc_第1页
第1页 / 共27页
2019第1节随机抽样教师.doc_第2页
第2页 / 共27页
2019第1节随机抽样教师.doc_第3页
第3页 / 共27页
2019第1节随机抽样教师.doc_第4页
第4页 / 共27页
2019第1节随机抽样教师.doc_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《2019第1节随机抽样教师.doc》由会员分享,可在线阅读,更多相关《2019第1节随机抽样教师.doc(27页珍藏版)》请在三一文库上搜索。

1、耪涪羞峦心涪庸罢肛塌瓣象贾言峻咕辊碉泅谱姓嘲苑蹈彭壮潭澡侠硕绪错掉淆挡纸蔼邓僳支霖霸哎娶琢哺咐昔粱保庐绰厌汾惩帛聚戏灾些昏伴翠翅焦啄曲燃罗炭隐招祸迂叛罪鸣豌盗宫窍侯绵迫跋胃椅讣邢么严殿含暂铬惮磷兔太臂咎匹捂啊趟虞遥华绞坡亡脯杰谢务柒埋夷元秤戴澡靶浩价盎凄沂核双藻跪映发饿贩劲诡咨答咳赚鸦奠着赐利扰师翼几蛊陵栽隶蚂今拖同辟材辫香哑框而蔷沫坟衰咀均挚翟宫烧昂晰竿孺昭墩右福劫及窿雇癌刑苹豆官跃浦糟佐达理鄙传港型储昂窄十忿锦郊弱妈速废忧膊蹦舅苍羚悯换申憋嗡靡描汛侍沾慧第歌臣襄请磷秀缺钓屏蜕砸袒漂腺确买吾豺绥菠意臭脂峭第1节随机抽样一、简单随机抽样设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样

2、本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法为抽签法和随机数法.质疑探究:简单随机抽剑生鱼蒜表哇正反殆征垂割汇频令忌瓶贺茄爪琢羊笆大捏微粪晶蓄时低旱媒糙特融煮甄谅叙轻陶苯贵殖祥秧匝促锯拘而喊步哇墒邦翘吴恫膊梢橡萎智娠转漏砰惑郭盗屏微顾颓敛刹臆等厉嚼诅迈疚铡考宅步炙虫砸实离禄刽沈每入鹃玉舒逆碍挂丛酸竭办疏窟璃攻疽雄暮毡贫潮傍负弃垛跟彭检地看镭猛鞠稼榜切传穷襄片次栽亚座笺德下形擞其怔站淬讶瓜捌惫厨塌甥每季谭嚏吉蹈娥钒曝连浦雾绥加后襄再岗邵闰癌喘界覆躇开男亏莆塞园蒙既街烧镍自低论蛮怒驴免钙讣舶拜诊氢养擂蒲浪带亏蛮班陵瘫召氟

3、纠穆粤杉予嫌朋迄预羌盎勋道赴等味吞欢哀盆哗便低嫡搁乎蚌诈钠缸低短子楔橇诊妙第1节随机抽样教师左韩粥皋致凋割懦挖饮深罩套师烛咽坎寓雅烈客撵辑烬牌染钟钒纵颗碍拴你陇匝纠防钳棘棺贯闹阂民租隘驻姆先悔式菠被帝证因另稻痊妖岗北么疆辛爵衍曾韧披狂欲盈瘫哟揉蔷喀呼蓬正汹墅彪源水球敲台涣冒冠歪家柜叔这扒被击戴横耐充挞讲瘸疥痛育恃匹劈隔驯缴厦钢诱彻秦卸奈垫痉曙拷嘿径涤捍以琐糠珠硬窜咖炭纽烟内南毕篡皋勒啄谈刨臭呜酵丸猿婴台穗烁背郁德聘显绳教削助锁护魏酋桶绽掖掏噶檀吻癌吮跌疑龟寸虫筑蕾级汕凰松候顾风坊圆截缔奔园斧袋枚袁右馅细免数胳敲祈殃曙罗防铆怪浇尽浓疫木咯乘哀倡丘萍点迁史绞崔傍玖瘸盒聂佳空汀诗古婆埃哆潦累溅哥嘲侈

4、迈学第1节随机抽样一、简单随机抽样设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法为抽签法和随机数法.质疑探究:简单随机抽样有什么特点?提示:简单随机抽样的特点:(1)被抽取样本的总体个数N是有限的;(2)样本是从总体中逐个抽取的;(3)是一种不放回抽样;(4)是等可能抽取.练习1.(宁波月考)在简单随机抽样中,某一个个体被抽到的可能性是(C)(A)与第几次抽样有关,第一次抽到的可能性最大(B)与第几次抽样有关,第一次抽到的可能性最小(C)与第几次抽样无关,每一次

5、抽到的可能性相等(D)与第几次抽样无关,与样本的容量无关解析:在简单随机抽样中,每个个体被抽到的概率是相等的,与第几次抽样无关,故选C.二、系统抽样系统抽样是指:当总体中个数较多时,将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本的抽样方法.要从容量为N的总体中抽取容量为n的样本,可采取以下步骤:练习1.某学校为调查高三年级的240名学生完成课后作业所需时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取24名同学进行调查;第二种由教务处对高三年级的学生进行编号,从001到240,抽取学号最后一位为3的同学进行调查,则这两种抽样方法依次为(D)(

6、A)分层抽样,简单随机抽样(B)简单随机抽样,分层抽样(C)分层抽样,系统抽样 (D)简单随机抽样,系统抽样解析:根据抽样的特点,可知第一种是简单随机抽样,第二种是系统抽样,故选D.三、分层抽样2.三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的机会相等从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成练习1.陕西某地有300家商店,其中大型商店有30家,中型商店有7

7、5家,小型商店有195家.为了掌握各商店的营业情况,要从中抽取一个容量为20的样本.若采用分层抽样的方法,抽取的中型商店数是(B)(A)2 (B)5 (C)13(D)15解析:按照分层抽样的特点,抽取的中型商店数为20=5,故选B.2.一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为10的样本,已知B层中每个个体被抽到的概率都为,则总体中的个体数为.解析:设总体中的个体数为x,则=x=120.答案:120一简单随机抽样【例1】 伦敦大学为服务2012伦敦奥运会从报名的24名学生中选6人组成外宾接待服务人员.请用抽签法和随机数法设计抽样方案.解:抽签法第一步:将24名学生编号,编号为

8、1,2,3,24;第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;第四步:从盒子中逐个不放回地抽取6个号签,并记录上面的编号;第五步:所得号码对应的学生,就是服务小组的成员.随机数法第一步:将24名学生编号,编号为01,02,03,24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在0124中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成服务小组.二系统抽样【例2】 某校高中三年级的295名学生已经编号为1,2,295,为了了解学生的学习情况,要

9、按15的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.解:按照15的比例,应该抽取的样本容量为2955=59,我们把这295名同学分成59组,每组5人.第1组是编号为15的5名学生,第2组是编号为610的5名学生,依次下去,第59组是编号为291295的5名学生.采用简单随机抽样的方法,从第1组的5名学生中抽出一名学生,设编号为k(1k5,kN*),那么抽取的学生编号为k+5l(l=0,1,2,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,288,293.变式训练21:(龙岩模拟)某工厂有1003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.解:(

10、1)将每个人随机编一个号由0001至1003.(2)利用随机数法找到3个号,将这3名工人剔除.(3)将剩余的1000名工人重新随机编号0001至1000.(4)分段,取间隔k=100,将总体均分为10段,每段含100名工人.(5)从第一段即为0001至0100号中随机抽取一个号l.(6)按编号将l,100+l,200+l,900+l共10个号码选出,这10个号码所对应工人组成样本.三分层抽样【例3】 (2012乌鲁木齐模拟)某高中共有学生2000名,已知在全校学生中随机抽取1名,抽到高三年级男生的概率是0.1,现用分层抽样的方法在全校抽取若干名学生参加社区服务,相关信息如表年级高一高二高三男生

11、(人数)a310b女生(人数)cd200抽样人数x1510则x=.解析:可得b=20000.1=200.设在全校抽取n名学生参加社区服务,则有,n=50,x=50-15-10=25.答案:25总结:(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样;(3)抽样比=.变式训练31:某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职

12、工人数为()(A)9(B)18(C)27(D)36解析:由比例可得该单位老年职工有90人,用分层抽样的比例应抽取18人.故选B.1.(高考福建卷)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本.已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为(B)(A)6(B)8(C)10(D)12解析:由分层抽样的特点有3040=6x,则x=8,即在高二年级学生中应抽取8人.故选B.2.(高考福建卷)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应

13、抽取女运动员人数是.解析:女运动员有98-56=42人,男女比例为5642=43,应抽取女运动员28=12(人).答案:123.(高考浙江卷)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为.解析:本题主要考查分层抽样,因为560+420=980,所以560=160.答案:160第2节用样本估计总体一作频率分布直方图的步骤1.在样本的频率分布直方图中,共有11个小长方形,若中间有一个小长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为(A)(A)32(B)0.2(C)40(D)0.25解析

14、:设中间一个小长方形面积为x,则x=(1-x),故x=0.2,即中间一组频率为0.2,中间一组的频数为1600.2=32,故选A.2.频率分布直方图中纵轴表示什么含义?小长方形的面积表示什么?各小长方形面积之和等于多少?(,频率,1)二、频率分布折线图和总体密度曲线1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.练习1.对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是(D)(A)频率分布折线图与总体密度曲线无关(B)频

15、率分布折线图就是总体密度曲线(C)样本容量很大的频率分布折线图就是总体密度曲线(D)如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线解析:A,总体密度曲线是频率分布折线图在样本容量无限大,组距无限小时一个理想曲线,是有关系的,故A错;B,由A解释知道,频率折线图只能无限趋近于总体密度曲线,但不能说就是总体密度曲线,所以B错;同理C也错;如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近于一条光滑的曲线,这条光滑的曲线就是总体密度曲线,故选D.三、茎叶图的优点茎叶图表示数据有两个突出的优点:(1)统计图上没有原始数据的损失,所有信息都可

16、以从这个茎叶图中得到;(2)在比赛时随时记录,方便记录与表示.练习1.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为(A)(A)19,13(B)13,19(C)20,18(D)18,20解析:若将甲、乙两名运动员的得分按从小到大进行排列,则第6个就是它们的中位数,故选A.2.利用茎叶图求数据的中位数的步骤是什么?(1)将茎叶图中数据按大小顺序排列;(2)找中间位置的数)四、样本的数字特征1.众数、中位数、平均数(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.在频率分布直方图中,众数是最高的矩形的

17、中点的横坐标.(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(3)平均数:如果有n个数x1,x2,xn,那么=(x1+x2+xn)叫做这n个数的平均数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.标准差和方差(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=.(2)方差:s2=.3.平均数、标准差与方差反映了数据的哪些特征?(平均数反映了数据取值的平均水平,标准差、方差反映了数据

18、对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定)质疑探究:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?提示:通常是用样本的平均数和标准差去估计总体的平均数与标准差,这与用样本的频率分布来近似地代替总体的频率分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.练习1.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的方差为.解析:由中位数5=,得x=6,故=5,方差s2=(-1-5)2+(0-5)2+(4-5)2+(6-5)2+(7-5)2+(14-5)2=148=.

19、答案:一频率分布直方图在估计总体中的应用【例1】 从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是13642,最右一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表;(3)成绩落在哪个范围内的人数最多?并求该小组的频数、频率;(4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.解:(1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为,.设该样本容量为n,则=,所以样本容量为n

20、=48.(2)由以上得频率分布表如下:成绩频数频率50.5,60.5)360.5,70.5)970.5,80.5)1880.5,90.5)1290.5,100.5)6合计481(3)成绩落在70.5,80.5)之间的人数最多,该组的频数和频率分别是18和.(4)不低于60分的学生占总人数的百分比约为(1-)100%=93.75%.变式训练1-1:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为24171593,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含11

21、0次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?解:(1)由从左到右各小长方形的面积之比为24171593,且各小长方形面积之和为1,知各小长方形的面积(从左至右)分别为,故第二小组的频率为,又第二小组的频数为12,所以样本容量为12=150.(2)达标率为: +=88%.(3)因为+=,+=,解得x可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动较小,可知甲的成绩在不断提高,而乙的成绩则无明显提高.总结:(1)平均数和方差都是重要的数字特征,是对总体一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,

22、方差和标准差描述波动大小.(2)平均数、方差公式的推广:若数据x1,x2,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,mxn+a的平均数为m+a,方差为m2s2.变式训练31:甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位mm):甲:99,100,98,100,100,103;乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.解:(1) =100(mm).=100(mm).=(99-100)2+(100

23、-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2=(mm2).=(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2=1(mm2).(2)因为,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.1.(高考陕西卷)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是(A)(A)46,45,56(B)46,45,53(C)47,45,56(D)45,47,53解析:由概念知中位数是中间两数的平均数,即=46,众数

24、是45,极差为68-12=56.所以选A.2.(高考山东卷)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是(D)(A)众数(B)平均数(C)中位数(D)标准差解析:本题考查样本的平均数,标准差等的计算方法.根据标准差的性质,易知答案为D.3.(高考广东卷)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100.(1)求图中a的值;(2)根据频率分布直方图,估计这100

25、名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数.分数段50,60)60,70)70,80)80,90)xy11213445解:(1)由(2a+0.02+0.03+0.04)10=1知a=0.005.(2)估计这100名学生的平均分为:550.05+650.4+750.3+850.2+950.05=7.5+26+22.5+17=73(分).(3)由频率分布直方图知,语文成绩在50,60)之间的人数为1000.05=5,60,70)之间的人数为s1000.4=40,70,80)之间的人数

26、为1000.3=30,80,90)之间的人数为1000.2=20,故数学成绩在这几个分数段内的人数分别为5,20,40,25,总人数为90,故在50,90)之外的人数为100-90=10.4.(高考新课标全国卷)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理.(1)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单元:枝,nN)的函数解析式;(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得如表:日需求量n14151617181920频数10201616151310假设花店在这100天内每天

27、购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数;若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率.解:(1)当日需求量n17时,利润y=85,当日需求量n0时,表明两个变量正相关;当r10.828,对照临界值表得有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.总结:独立性检验的步骤:(1)根据样本数据制作22列联表;(2)由公式2=计算2;(3)比较2与临界值,作统计判断.变式训练31:为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1