公选SAS_5.ppt

上传人:rrsccc 文档编号:9132109 上传时间:2021-02-03 格式:PPT 页数:30 大小:1.20MB
返回 下载 相关 举报
公选SAS_5.ppt_第1页
第1页 / 共30页
公选SAS_5.ppt_第2页
第2页 / 共30页
公选SAS_5.ppt_第3页
第3页 / 共30页
公选SAS_5.ppt_第4页
第4页 / 共30页
公选SAS_5.ppt_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《公选SAS_5.ppt》由会员分享,可在线阅读,更多相关《公选SAS_5.ppt(30页珍藏版)》请在三一文库上搜索。

1、计算中心,正态性的假设与检验,正态分布指的是总体上一种理论分布。判断样本是否来自正态分布的总体,需要有假设和检验。 SAS中进行正态性检验的步骤: 先假设样本的分布式正态的(对样本作一个零假设) 对假设进行检验,得到检验的P值。 对概率值进行判断(对正态性的可拒绝程度),当概率值太小(一般以0.05为标准),拒绝原假设,否则,没有理由拒绝原假设。,计算中心,用程序进行正态检验,Proc univariate data=aa.class normal; Var weight; Run;,假设:体重weight的分布式正态的; Test for normality 正态检验的结果: 概率值为0.6

2、028,很大 ,没有理由拒绝原假设,计算中心,用SAS/INSIGHT进行分布检验,选择解决方案/分析/交互式数据分析命令启动SAS/INSIGHT软件 确定数据所在的数据集 选择分析 /分布(Y)项绘制某连续变量的盒状图和分布图 在分布(Y)对话框右侧的列表框中选择WEIGHT变量,单击按钮 单击按钮,选累积分布 在”分布检验”下方选择”正态” 在置信带下选95%置信水平 依次点击,计算中心,用SAS/INSIGHT进行分布检验,在显示的图形中,中间是经验分布曲线,两侧的是置信限 。 置信水平可用鼠标拖动改变。 检验结果汇总在下方的分布检验表中 并提供了统计量的数值及相应的检验概率值:原假设

3、为总体分布为正态的。 本例相应的p值0.150.05=。所以无法拒绝原假设,可以接受总体分布为正态的,计算中心,简单统计推断,今年武汉房价与去年的6000元/平米是否有显著变化? 有一批袋装食品,标称重量100g,据以往经验,标准公差为5g;现抽100罐,X=102g,问是否可以认为合乎标准? 办法一: 普查,求出m,既可知标称值的差异有多大(或可判定差异是否在给定的许可范围之)? 但费时费力,有时甚至不可行 办法二: 因尚无证据表明存在明显差异,所以取慎重态度,先作假设H0: m = m0 =100 注:此处的“=”是表意的,应理解为“差不多”,计算中心,一、假设检验,提出假设 对样本作一个

4、零假设, 然后通过计算样本的统计量,并根据得到的P值检验数据是否支持零假设。 2. 确定理论的显著性水平 通常取0.05 3.选择用于计算的统计量 4.将SAS计算出来的统计量的P值与值对比 如果p= ,原假设不成立,拒绝原假设;,计算中心,二、假设检验中总体的几种不同情况,大样本,要给定总体方差 单样本总体均值的T检验 单样本总体比例的假设检验 单样本总体方差的卡方检验 两独立样本的T检验 两配对资料的T检验 两总体比例之差的正态检验 两总体方差之比的F检验,计算中心,三、假设检验的应用,1. 样本均数与总体均数差别的显著性检验 例:已知某水样中含CaCo3的真值为20.7mg/L,现用某方

5、法重复测定该水样11次,CaCo3的含量为:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20,23,22。问用该法测水中CaCo3的含量所得的均值与真值有无显著差别?,计算中心,1. 样本均数与总体均数差别的显著性检验,数据集的建立 将数据复制到word中,用查找替换的功能将数据之间的分隔符逗号替换成回车符号 在word中将数据转换成表格,并复制 在excel中用选择性粘贴,粘贴文本,并编辑数据,求出差值,存为文本文件 转成SAS数据集,计算中心,1. 样本均数与总体均数差别的显著性检验,用分析家进行T检验 解决方案/分析/分析家 打开数据集

6、 统计/假设检验/均值的单样本检验 选择变量Variable OK,计算中心,1. 样本均数与总体均数差别的显著性检验,程序实现T检验 DATA T1; INPUT X ;Y=X-20.7; CARDS; 20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20 23 22 proc means mean std stderr t prt data=t1; var y; run;,计算中心,1. 样本均数与总体均数差别的显著性检验,检验结果的分析: 0.3125,按=0.05 水平,不拒绝H0假设。因此,该方法所测出水中CaCo3含量的均值与真值无显

7、著差异。此法可信。,计算中心,1. 样本均数与总体均数差别的显著性检验,【例2】一家食品厂以生产袋装食品为主,每天的产量大约为8000袋,每袋重量规定为100克。为了分析每袋重量是否符合要求,质检部门经常进行抽检。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如表所示。 表 25袋食品的重量(单位:克) 试从抽检的样本数据出发,检验变量WEIGHT的均值与100克是否有显著差异。假定表3-8数据存放在数据集Mylib.spzl中,重量变量名为WEIGHT。 检验结论:均值与100克有显著差异,计算中心,由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表所示。

8、,2. 同一批实验对象前后差异的显著性检验(配对T检验),试从样本数据出发,分析两套试卷是否有显著差异,计算中心,Data t1; Do I=1 to 10;Input x ;output;end; Cards; 78 63 72 89 91 49 68 76 85 55 Data t2; Do I=1 to 10;input y ;output;end; Cards; 71 44 61 84 74 51 55 60 77 39 Data t3;merge t1 t2; D=x-y;run; Proc means mean std stderr t prt; Var d; Run;,2. 同一

9、批实验对象前后差异的显著性检验(配对T检验),计算中心,用SAS/ASSIST来作t检验 点击解决方案/assist/data analysis/anova/t-tests 单击paired comparisons(配对检验) 激活sas数据集 单击 paired colums(配对变量),选用X,Y 单击run/submit 结果分析:有显著差异,2. 同一批实验对象前后差异的显著性检验(配对T检验),计算中心,某公司生产某打印机,它有20个固定的客户,每个客户的需求量都有记录,公司做了大量广告后,这20个客户的需求量发生了变化,现在希望知道广告宣传是否起到了显著的作用。 客户序号:1 2

10、3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 较早的销量:125 265 337 59 69 456 205 302 100 50 92 84 63 49 163 277 25 360 52 88 广告后销量:150 233 386 67 60 400 255 260 120 50 89 99 63 50 180 290 60 350 65 96,2. 同一批实验对象前后差异的显著性检验(配对T检验),计算中心,去年年中和年底购车价格数据如下,3. 独立样本T检验,年中购车价格数据,年底购车价格数据,计算中心,3. 独立样本T检验,数据集的建立(

11、方式a):分组变量与分析变量 数据集的建立(方式b):第1组变量与第2组变量,计算中心,3. 独立样本T检验,启动分析家 ,打开数据集a 选择方差的双样本检验 对话框group are in 部分选one variable(有一分组变量X1)。将变量x选入dependent因变量框中,group选入group分组变量框中 在hypotheses(假设)部分的备选假设栏中使variance1/variance2=1选项被选中 若经检验数据资料满足正方差齐性,则可以用一般t检验法 选择均值的双样本检验 经检验两总体均数之间有无显著性的差别,计算中心,3. 独立样本T检验,启动分析家 ,打开数据集b

12、 选择方差的双样本检验 对话框group are in 部分选two variable。将变量x1选入group1变量框中,x2选入group2变量框中 经检验数据资料是否满足正方差齐性 选择均值的双样本检验 检验两总体均数之间有无显著性的差别,计算中心,3. 独立样本T检验,分析参加体型锻炼的男女体脂有无显著性差异 男:13.3 19 20 8 18 22 20 31 21 12 16 12 24 女: 22 26 16 12 21.7 23.2 21 28 30 23 试检验某班男生和女生数学成绩是否有显著差异。 男生:95 80 84 92 75 77 86 89 女生:90 93 97

13、 82 85 90 89 86,计算中心,四、单样本总体比例的假设检验,检验年中总体中购买车辆在15万元以上者所占比例是否超过30%。 这是一个单样本比例检验问题,若表示总体中购买车辆在15万元以上者所占比例,则检验的是: H0: 0.3,H1: =15和15两个值,计算中心,四、单样本总体比例的假设检验,2) 选择菜单“统计”“假设检验”“单样本比例的检验”,打开并按图左设置“One Sample Test for a Proportion”对话框;检验结果如图右所示。,计算中心,两总体比例的比较,试以95的置信水平推断年底与年中购买私家车在15万元以上的消费者占有比例有无差异。 这是一个双

14、样本比例检验问题,若1和2分别表示总体中年底和年中购买私家车在15万元以上的消费者所占的比例,则检验的是假设: H0:1 2 = 0,H1:1 2 0;,计算中心,两总体比例的比较,在分析家中打开数据集后,选择菜单“统计”“假设检验”“双样本比例检验”,在对话框中,按图左设置双样本比例检验,分析结果如图右所示,计算中心,上机练习 一、为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排一些工人进行操作试验,每个工人组装一件产品所需的时间如表所示。试推断两种方法组装产品所需平均时间有无差异。,两种方法组装产品所需的时间(单位:分钟),计算中心,上机练习,二.某药材生产商要对其仓库中的1000箱药材的平均重量进行估计,药材重量额定值为52kg,随机抽取16箱样本称重后结果如表所示。,求该仓库中药材平均重量与额定值有无显著差异?,计算中心,上机作业,三.已知两只股票深发展(000001)和万科A(000002)在某月21个交易日的收益率如下表所示。试在0.05的显著水平下判断深发展的风险是否高于万科A? 以两方差中较大的为分子,较小的为分母,计算中心,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1