k52006年高考第一轮复习数学:12.3统计.pdf

上传人:tbuqq 文档编号:5106374 上传时间:2020-02-02 格式:PDF 页数:7 大小:78.60KB
返回 下载 相关 举报
k52006年高考第一轮复习数学:12.3统计.pdf_第1页
第1页 / 共7页
k52006年高考第一轮复习数学:12.3统计.pdf_第2页
第2页 / 共7页
k52006年高考第一轮复习数学:12.3统计.pdf_第3页
第3页 / 共7页
k52006年高考第一轮复习数学:12.3统计.pdf_第4页
第4页 / 共7页
k52006年高考第一轮复习数学:12.3统计.pdf_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《k52006年高考第一轮复习数学:12.3统计.pdf》由会员分享,可在线阅读,更多相关《k52006年高考第一轮复习数学:12.3统计.pdf(7页珍藏版)》请在三一文库上搜索。

1、知识就是力量 本文为自本人珍藏版权所有仅供参考 12.3 统计 知识梳理 1.抽样 当总体中的个体较少时,一般可用简单随机抽样;当总体中的个体较多时,一般可用系 统抽样; 当总体由差异明显的几部分组成时,一般可用分层抽样,而简单随机抽样作为一种 最简单的抽样方法,又在其中处于一种非常重要的地位.实施简单随机抽样,主要有两种方 法:抽签法和随机数表法. 系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样就显得不方 便,系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均匀分后的每一段 进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样也属于等概率抽样. 分层抽

2、样在内容上与系统抽样是平行的,在每一层进行抽样时,采用简单随机抽样或系 统抽样,分层抽样也是等概率抽样. 2.样本与总体 用样本估计总体是研究统计问题的一种思想方法.当总体中的个体取不同数值很少时, 其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形 图,当总体中的个体取不同值较多,甚至无限时, 其频率分布的研究要用到初中学过的整理 样本数据的知识. 用样本估计总体,除在整体上用样本的频率分布去估计总体的分布以外,还可以从特征 数上进行估计, 即用样本的平均数去估计总体的平均数,用关于样本的方差(标准差)去估 计总体的方差(标准差). 3.正态分布 正态分布在实际生

3、产、生活中有着广泛的应用,很多变量, 如测量的误差、产品的尺寸 等服从或近似服从正态分布,利用正态分布的有关性质可以对产品进行假设检验. 4.线性回归直线 设 x、y 是具有相关关系的两个变量,且相应于n 组观察值的n 个点大致分布在一条直 线的附近,我们把整体上这n 个点最接近的一条直线叫线性回归直线. 特别提示 在三种抽样中, 简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法是建立 在它的基础上的.三种抽样方法的共同点是:它们都是等概率抽样,体现了抽样的公平性.三 种抽样方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法. 点击双基 1.一个总体中共有10 个个

4、体,用简单随机抽样的方法从中抽取一容量为3 的样本,则 某特定个体入样的概率是 A. 3 10 C 3 B. 8910 3 C. 10 3 D. 10 1 解析:简单随机抽样中每一个体的入样概率为 N n . 答案: C 2.( 2004 年江苏, 6)某校为了了解学生的课外阅读情况,随机调查了50 名学生,得到 知识就是力量 他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这 50 名学生这一天平均每人的课外阅读时间为 2 0 1 5 1 0 5 人 数 ( 人 ) 时 间 ( h) 00. 5 1 . 01. 5 A.0.6 h B.0.9 h C.1.0 h

5、 D.1.5 h 解析:一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即 50 50.2105.1100.1205.050 =0.9 h. 答案: B 3.一个年级有12 个班,每个班有50 名同学,随机编号为150 号,为了了解他们在课 外的兴趣爱好,要求每班的33 号学生留下来参加阅卷调查,这里运用的抽样方法是 A.分层抽样法B.抽签法 C.随机数表法D.系统抽样法 答案: D 4.如果随机变量 N( , 2) ,且 E=3,D=1,则 P( 1 1)等于 A.2(1) 1 B.(4) (2) C.(2) (4)D.( 4) ( 2) 解析:对正态分布,=E=3, 2=D=1

6、,故 P(11)=( 13) (1 3)=( 2) ( 4)=(4) (2). 答案: B 5.为考虑广告费用x 与销售额 y 之间的关系,抽取了5 家餐厅,得到如下数据: 广告费用(千元) 1.0 4.0 6.0 10.0 14.0 销售额(千元)19.0 44.0 40.0 52.0 53.0 现要使销售额达到6 万元,则需广告费用为_.(保留两位有效数字) 解析:先求出回归方程y?=bx+a,令y?=6,得 x=1.5 万元. 答案: 1.5 万元 典例剖析 【例 1】 某批零件共160 个,其中,一级品48 个,二级品64 个,三级品32 个,等外 品 16 个.从中抽取一个容量为20

7、 的样本 .请说明分别用简单随机抽样、系统抽样和分层抽样 法抽取时总体中的每个个体被取到的概率均相同. 剖析: 要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每 个个体被取到的概率. 解: (1)简单随机抽样法:可采取抽签法,将160 个零件按1 160 编号,相应地制作 1160 号的 160 个签,从中随机抽20 个.显然每个个体被抽到的概率为 160 20 = 8 1 . (2)系统抽样法:将160 个零件从1 至 160 编上号,按编号顺序分成20 组,每组8 个.然后在第1 组用抽签法随机抽取一个号码,如它是第k 号( 1k8) ,则在其余组中分 别抽取第k+8

8、n(n=1,2,3,, , 19)号,此时每个个体被抽到的概率为 8 1 . 知识就是力量 (3)分层抽样法:按比例 160 20 = 8 1 ,分别在一级品、二级品、三级品、等外品中抽取 48 8 1 =6 个,64 8 1 =8 个,32 8 1 =4 个,16 8 1 =2 个,每个个体被抽到的概率分别为 48 6 , 64 8 , 32 4 , 16 2 ,即都是 8 1 . 综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是 8 1 . 评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了 公平性和客观性. 思考讨论 现有 20 张奖券, 已知只有一张

9、能获奖,甲从中任摸一张,中奖的概率为 20 1 ,刮开一看 没中奖 .乙再从余下19 张中任摸一张,中奖概率为 19 1 ,这样说甲、乙中奖的概率不一样, 是否正确 ? 【例 2】将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ,液体的 温度 (单位:)是一个随机变量,且N(d,0.5 2). (1)若 d=90,求 0 时, f(x)为减函数 . 深化拓展 在实际生活中, 常用统计中假设检验的思想检验产品是否合格,方法是: (1)提出统计 假设:某种指标服从正态分布N( , 2) ; ( 2)确定一次试验中的取值 a; (2)作出统计 推断:若a( 3,+3) ,则接受假设,若a(

10、 3, +3) ,则拒绝假设 . 如:某砖瓦厂生产的砖的“抗断强度” 服从正态分布N(30,0.8) ,质检人员从该厂某 一天生产的 1000 块砖中随机抽查一块,测得它的抗断强度为27.5 kg/cm 2,你认为该厂这天 知识就是力量 生产的这批砖是否合格?为什么 ? 分析:由于在一次试验中落在区间( 3, +3 )内的概率为0.997,故 几 乎必然落在上述区间内.于是把 =30, =0.8 代入, 算出区间 (3,+3 )=(27.6, 32.4) ,而 27.5( 27.6,32.4).据此认为这批砖不合格. 【例3】 已知测量误差N(2, 100) (cm ) ,必须进行多少次测量,

11、才能使至少有 一次测量误差的绝对值不超过8 cm 的频率大于0.9? 解:设 表示 n 次测量中绝对误差不超过8 cm 的次数,则 B(n,p). 其中P=P(|0.9, n 应满足 P(1)=1P(=0)=1( 1p) n0.9, n )5671.01lg( )9.01lg( = 4329.0lg 1 =2.75. 因此, 至少要进行3次测量,才能使至少有一次误差的绝对值不超过8 cm的概率大于 0.9. 闯关训练 夯实基础 1.对总数为 N 的一批零件抽取一个容量为30 的样本,若每个零件被抽取的概率为0.25, 则 N 等于 A.150 B.200 C.120 D.100 解析: N 3

12、0 =0.25, N=120. 答案: C 2.设随机变量 N( ,) ,且 P(C)=P(C) ,则 C 等于 A.0 B.C.D. 解析:由正态曲线的图象关于直线x=对称可得答案为D. 答案: D 3. (2003 年全国, 14) 某公司生产三种型号的轿车,产量分别为1200 辆、6000 辆和 2000 辆,为检验该公司的产品质量,现用分层抽样的方法抽取46 辆进行检验,这三种型号的轿 车依次应抽取 _辆、 _辆、 _辆. 解析:因总轿车数为9200 辆,而抽取46 辆进行检验,抽样比例为 9200 46 = 200 1 ,而三 种型号的轿车有显著区别.根据分层抽样分为三层按 200

13、1 比例分别有6 辆、 30 辆、 10 辆. 答案: 6 30 10 4.某厂生产的零件外直径N(8.0,1.5 2) (mm) ,今从该厂上、下午生产的零件中各 随机取出一个,测得其外直径分别为7.9 mm 和 7.5 mm,则可认为 A.上、下午生产情况均为正常B.上、下午生产情况均为异常 C.上午生产情况正常,下午生产情况异常D.上午生产情况异常, 下午生产情况正常 解析:根据 3原则,在 8+31.5=8.45( mm)与 8 31.5=7.55(mm)之外时为异常 . 答案: C 5.随机变量 服从正态分布N(0,1) ,如果 P(5)=1P(x 5)=1F(5)=1 ( 3 85

14、 )=1( 1)=1 1 (1)= (1) =0.8413. 对第二个方案, 有 xN (6, 2 2) , 于是 P (x5) =1P (x5) =1F (5)=1 ( 2 65 ) =1( 0.5)=(0.5)=0.6915. 相比之下,“利润超过5 万元”的概率以第一个方案为好,可选第一个方案. 探究创新 8.一个容量为100 的样本,数据的分组和各组的一些相关信息如下: 分组频数频率累积频率 12,15) 6 15,18) 0.08 18,21) 0.30 21,24) 21 24,27) 0.69 27,30) 16 30,330.10 33,36) 1.00 合计100 1.00

15、(1)完成上表; (2)画出频率分布直方图和累积频率分布图; (3)根据累积频率分布图,总体中小于22 的样本数据大约占多大的百分比? 解: (1) 分组频数频率累积频率 12,15) 6 0.06 0.06 15,18) 8 0.08 0.14 18,21) 16 0.16 0.30 21,24) 21 0.21 0.51 24,27) 18 0.18 0.69 27,30) 16 0.16 0.85 30,33) 10 0.10 0.95 33,36) 5 0.05 1.00 合计100 1.00 知识就是力量 (2)频率分布直方图及累积频率分布图如下: 数 据 频 率 组 距 10203

16、040152535 1020303540451 52 5 1. 0 0. 8 0. 6 0. 4 0. 2 累 积 频 率 数 据 (3)在这个累积频率分布图上, 横坐标为22, 落在 21 24 的区间内, 折线图在这段区间上的线段所在的直线方程是y 0.3= 2124 3.051.0 (x21) , 即 y=0.07x1.17. 当 x=22 时, y=1.540.17=0.37. 因此,总体中小于22 的数据大约占37%. 思悟小结 1.抽样三种方法比较 类别共同点相互联系适用范围各自特点 简单随机抽样抽 样 过 程 中 每 个 个 体 被 抽 到 的 概 率 相等 总体中的个数较少从总

17、体中逐个抽取 系统抽样 在起始 部分抽 样时 采用简单随机抽样 总体中的个数较多 将总体均分成几部分, 按事先确 定的规则在各部分抽取 分层抽样 每层抽 样时采 用简 单随机 抽样或 系统 抽样 总体由差异明显的几部 分组成 将总体分成几层, 分层进行抽取 2.总体分布估计的两种情况比较 以上两种情况的不同之处在于前者的频率分布表中列出的是几个不同数值的频率,相应 的条形图是用其高度来取各个值的频率的;后者的频率分布表中列出的是在各个不同区间内 取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率. 教师下载中心 教学点睛 简单随机抽样,有以下特点: (1)它要求被抽取样本的

18、总体的个体数有限.这样,就便于对其中各个个体被抽取的概 率进行分析 . (2)它是从总体中逐个地进行抽取,这样,就便于在抽样实践中进行操作. (3)它是一种不放回抽样.由于抽样实践中多采用不放回抽样,使其具有较广泛的实用 性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算. (4)它是一种等概率抽样.不仅每次从总体中抽取一个个体时,各个个体被抽取的概率 知识就是力量 相等, 而且在整个抽样过程当中,各个个体被抽取的概率相等,从而保证了这种抽样方法的 公平性 . 频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无 限缩小时, 频率分布直方图就会演变

19、成一条光滑曲线反映总体分布的频率密度曲线,基 于频率分布与相应的总体分布的关系,且通常我们并不知道一个总体的分布,因此, 我们往 往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布. 统计中假设检验的基本思想是:根据小概率事件在一次试验中几乎不可能发生的原理和 从总体中抽测的个体的数值,对事先所作的统计假设作出判断:是拒绝假设, 还是接受假设 . 拓展例题 【例题】设有一样本x1,x2,, , xn,其标准差为sx,另有一样本y1,y2,, ,yn,其 中 yi=3xi+2(i=1, 2,, , n) ,其标准差为sy,求证: sy=3sx. 证明:x= n xxx n21 , y= n yyy n21 = n xxx n )23()23()23( 21 = n nxxx n 2)(3 21 =3x+2. sy 2 = n 1 (y1 2+y 2 2+, +yn 2) n y 2 = n 1 (3x1+2) 2+(3x 2+2) 2 +, +(3xn+2) 2n(3 x+2) 2 = n 1 9(x1 2 +x2 2 +, +xn 2)+12(x 1+x2+,+xn)+4nn(9x 2+12 x+4) = n 9 (x1 2 +x2 2 +,+xn 2) n x 2 =9sx 2. sx 0,sy0, sy=3sx.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1