管理资料-其它管理→统计分析方法介绍(PPT 70页).ppt

上传人:本田雅阁 文档编号:3563660 上传时间:2019-09-11 格式:PPT 页数:70 大小:1.71MB
返回 下载 相关 举报
管理资料-其它管理→统计分析方法介绍(PPT 70页).ppt_第1页
第1页 / 共70页
管理资料-其它管理→统计分析方法介绍(PPT 70页).ppt_第2页
第2页 / 共70页
管理资料-其它管理→统计分析方法介绍(PPT 70页).ppt_第3页
第3页 / 共70页
管理资料-其它管理→统计分析方法介绍(PPT 70页).ppt_第4页
第4页 / 共70页
管理资料-其它管理→统计分析方法介绍(PPT 70页).ppt_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《管理资料-其它管理→统计分析方法介绍(PPT 70页).ppt》由会员分享,可在线阅读,更多相关《管理资料-其它管理→统计分析方法介绍(PPT 70页).ppt(70页珍藏版)》请在三一文库上搜索。

1、统计分析方法介绍,二零零四年元月,主要内容,一,区间估计 二,假设检验 三,ANOVA 四,回归分析(比较相关分析 ),区间估计的主要内容,区间估计的基本步骤 置信水平 总体平均值的区间估计 (点估计),区间估计,1, 基本步骤,确定一个与检验参数相关的统计量及其分布 确定置信水平 1-a 置信水平(置信度):样本统计量反映总体特性的水平, 显著性水平,记为 a 根据统计量的分布和置信水平确定置信区间,区间估计,2, 置信水平,例:以下是对总体平均值进行区间估计时,样本平均值的分布,结果解释: (a,b)总体平均值置信水平为95的置信区间,区间估计,3, 总体平均值的区间估计,与总体平均值相关

2、的统计量 样本平均值 样本平均值的分布 总体特性分布 XN(,2) 样本平均值的分布 (n : sample size) Sigma 已知 XN(,2/n) Z=n1/2(X- )/ N(0,1) Sigma 未知 XN(,2/n) t= n1/2(X- )/ st(n-1) 总体平均值的置信区间 Sigma 已知 ZaZZ1-a X+Za n-1/2 X+Z1-a n-1/2 Sigma 未知 tatt1-a X+ta s n-1/2 X+t1-a s n-1/2 Za, Z1-a 为标准正态分布 a, 1-a 分位点 ta, t1-a 为t(n-1)分布 a, 1-a 分位点,现在的问题是

3、 是多少,在什么范围?,区间估计,3, 总体平均值的区间估计,标准正态分布和 t 分布比较,区间估计,3, 总体平均值的区间估计,自由度(degree of freedom) 在计算sigma= (Xi-X)2/(n-1)1/2时 (X1-X)+ (X2-X)+ (Xn-X)=0 所以(X1-X), (X2-X), , (Xn-X)中只有n-1个独立的数据 样本数量越大,自由度越高,估计越准确,区间估计,.(.),.,假设检验的主要内容,基本步骤 两类风险 平均值的假设检验 标准差的假设检验 正态分布的假设检验 合格率的假设检验 离散性数据相关性检验 势 (power), 样本大小,差异计算,

4、假设检验,.(.),.,1, 一般步骤,确定原假设和对立假设 H0: 原假设(零假设) H1: 对立假设 确定一个与检验参数相关的统计量及其分布 根据统计量的分布和风险水平确定临界值和拒绝域 计算结果并判断 P0.05时,拒绝原假设H0 ,对立假设H1成立 P value: 根据实际观测到的结果,当H0成立时,拒绝H0的概率。,例:1, H0: u1=u2 H1:u1 u2 2,H0: u1u2 H1:u1 u2 3, H0: u1u2 H1:u1 u2,与区间估计一致,假设检验,2,两类风险,第一类风险(生产方风险) 当H0成立时,拒绝H0的概率 第二类风险(使用方风险) 当H0不成立时,接

5、受H0的概率 势 (power) 第一类风险与置信水平,假设检验,3,平均值的假设检验,1, 检验总体平均值是否等于指定值u0 2, 原假设和对立假设: H0 U=u0 H1 Uu0 3, 检验统计量及其分布: t=n1/2(X-u0)/s 4, 临界值和拒绝域: t: t t1-a or t t or T-t),假设检验,3,平均值的假设检验,假设检验,3, 平均值的假设检验,假设检验,3, 平均值的假设检验,假设检验,3, 平均值的假设检验,假设检验,3, 平均值的假设检验,MINNTAB中假设检验路径及数据格式,假设检验,3, 平均值的假设检验,假设检验,1-sample Z-test,

6、1-sample t-test,Select data source,Input tested means,Input known sigma,Select data source,Input tested means,.(.),.,3, 平均值的假设检验,Two-sample T-test,假设检验,1, data in one column,2, data in two columns,.(.),.,3, 平均值的假设检验,Paired T-test,假设检验,.(.),.,3, 平均值的假设检验,Option in hypothesis,假设检验,Graph in hypothesis,

7、Alternative hypothesis(H1),.(.),.,4, 标准差的假设检验,1, 检验两组数据的标准差是否相等 2, 原假设和对立假设: H0 1=2 H1 12 3, 标准:P 0.05时, 两组数据的标准差相等 4, Path in MINITAB: StatBasic statisticsVariances,假设检验,.(.),.,5,正态分布的假设检验,定义:检验一组数据是否服从正态分布 假设:H0: 正态分布H1: 非正态分布 标准:P 0.05时, 数据为非正态分布 正态概率图 计算平均值,标准差 将数据从小到大排序,计算各数据对应的累积分布概率 描点(注意纵轴的刻

8、度) Path in MINITAB: StatBasic statisticsNormality test,假设检验,.(.),.,5, 正态分布的假设检验,正态分布下的直方图和正态概率图,假设检验,.(.),.,5, 正态分布的假设检验,非正态分布下的直方图和正态概率图,假设检验,.(.),.,5, 正态分布的假设检验,在数据不服从正态分布时,采用Box-Cox变换改变数据的分布形状 Box-Cox变换 YY (Path: Statcontrol chartsBox-Cox transformation),假设检验,.(.),.,6,合格率的假设检验,类型 一批产品合格率是否小于P 二批产

9、品合格率是否相等 例 1,从生产产品中抽出2000进行检查,52不合格,合格率是否小于98? 2,从一条生产线抽出1500产品检查,17不合格;从另一条生产线抽出1300产品检查,25不合格;它们的合格率是否一样?,假设检验,.(.),.,6,合格率的假设检验,Proportion test in MINITAB,Proportion test for one group,Proportion .parison between two groups,假设检验,.(.),.,6,合格率的假设检验,例 1 (Proportion test for one group),输入检查结果,输入检验对比合

10、格率,选择假设类型,假设检验,.(.),.,6,合格率的假设检验,Test and CI for One Proportion Test of p = 0.98 vs p 0.98 Exact Sample X N Sample p 95.0% Upper Bound P-Value 1 1948 2000 0.974000 0.979580 0.037,例 1 (Proportion test for one group),P0.05, 判断结果合格率小于0.98,假设检验,.(.),.,6,合格率的假设检验,例 2 (Proportion .parison between two grou

11、ps),假设检验,.(.),.,6,合格率的假设检验,例 2 (Proportion .parison between two groups),Test and CI for Two Proportions Sample X N Sample p 1 1483 1500 0.988667 2 1275 1300 0.980769 Estimate for p(1) - p(2): 0.00789744 95% CI for p(1) - p(2): (-0.00129108, 0.0170860) Test for p(1) - p(2) = 0 (vs not = 0): Z = 1.68

12、P-Value = 0.092,P0.05, 判断结果合格率相等。,假设检验,.(.),.,7,离散性数据相关性检验,例 -缺陷严重度(数量)与加工速度关系 MINITAB: stattableschi-square test P0.05时,两个变量间有强的相关性。,假设检验,.(.),.,7,离散性数据相关性检验,Chi-Square Test: C1, C2, C3 Expected counts are printed below observed counts C1 C2 C3 Total 1 30 14 8 52 27.58 16.66 7.76 2 40 29 12 81 42.9

13、6 25.96 12.08 3 26 15 7 48 25.46 15.38 7.16 Total 96 58 27 181 Chi-Sq = 0.212 + 0.426 + 0.008 +0.204 + 0.357 + 0.001 + 0.012 + 0.009 + 0.004 = 1.232 DF = 4, P-Value = 0.873,Chi-square Test 检验结果,P0.05, 缺陷严重度与速度没有相关关系。,假设检验,.(.),.,8, 势 (power), 样本大小,差异计算,假设检验,假设检验判别力-当检验对象与原假设不同时,检验方法进行正确判别的能力,又称功效(po

14、wer) , 计算为 1- 。 例:对两个不同的总体,其样本平均值的分布,N(,2/n),N(,2/n),拒绝域 (风险),接受域 (风险),t,.(.),.,8, 势 (power), 样本大小,差异计算,与假设检验判别力(功效)相关的因素: 样本大小 可接受的差异 假设检验判别力, 样本大小, 检出差异相互关系及计算 三者中任何两个可确定另外一个 样本多,允许差异大时,判别力高 例,假设检验,.(.),.,8, 势 (power), 样本大小,差异计算,计算对应检验的功效,MINITAB 应用,假设检验,.(.),.,8, 势 (power), 样本大小,差异计算,MINITAB 应用(T

15、wo sample t-test),1, 先确定标准差,2, sample size, power, difference,可以根据其中任意二个确定另外一个。,假设检验,.(.),.,8, 势 (power), 样本大小,差异计算,Power and Sample Size 2-Sample t Test Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05 Sigma = 1 Sample Difference Size Power 0.5

16、30 0.4779,MINITAB 应用(Power value in two sample t-test),假设检验,.(.),.,8, 势 (power), 样本大小,差异计算,MINITAB 应用(Sample size in two sample t-test),Power and Sample Size 2-Sample t Test Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05 Sigma = 1 Sample Target

17、 Actual Difference Size Power Power 0.5 86 0.9000 0.9032,假设检验,.(.),.,8, 势 (power), 样本大小,差异计算,MINITAB 应用(Difference in two sample t-test),Power and Sample Size 2-Sample t Test Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05 Sigma = 1 Sample Size

18、Power Difference 30 0.9000 0.8512,假设检验,.(.),.,ANOVA,1,实例-Swage ball size optimize evaluation 2,原理 3,ANOVA in MINITAB,ANOVA,.(.),.,1,实例-介绍,例-Swage ball size optimize evaluation 响应变量(Response): gramload 因子/水平(Factor/level): 1, swage ball size(79/80/81mil, 79/80.5/81.5mil, 79/81/82mil, 79/81.5mil) 2, H

19、eads(HD2, HD3) 试验次数: 20*8=160 平衡设计 方差分析(two-way) MINITAB: StatANOVA,ANOVA,.(.),.,1,实例-方差分析表,Two-way ANOVA: Gramload versus Head, Group Analysis of Variance for Gramload Source DF SS MS F P Head 1 0.02889 0.02889 9.10 0.003 Group 3 0.23875 0.07958 25.08 0.000 Interaction 3 0.05986 0.01995 6.29 0.000

20、Error 152 0.48232 0.00317 Total 159 0.80981,P0.05时,有显著性影响。,误差来源,ANOVA,.(.),.,1,实例- 置信区间估计,Individual 95% CI Head Mean -+-+-+-+- HD2 2.5700 (-*-) HD3 2.5431 (-*-) -+-+-+-+- 2.5350 2.5500 2.5650 2.5800 Individual 95% CI Group Mean -+-+-+-+- Group 1 2.6173 (-*-) Group 2 2.5628 (-*-) Group 3 2.5255 (-*-

21、) Group 4 2.5208 (-*-) -+-+-+-+- 2.5200 2.5550 2.5900 2.6250,ANOVA,.(.),.,1,实例-平均值分布图,ANOVA,.(.),.,1,实例-平均值置信区间分布,ANOVA,.(.),.,1,实例-交互作用分布图,ANOVA,.(.),.,2,原理,方差分解 SST=SSA+SSB+SSAxB+SSE 与随机误差比较,确定因子的显著性,SSE,SSAxB,SSA,SSB,ANOVA,.(.),.,3, ANOVA in MINITAB,方差分析图形,数据格式,ANOVA,.(.),.,3, ANOVA in MINITAB,AN

22、OVA,.(.),.,3, ANOVA in MINITAB (One-way),数据格式,ANOVA,.(.),.,3, ANOVA in MINITAB (One-way-stacked),数据格式,ANOVA,.(.),.,3, ANOVA in MINITAB (Two-way),数据格式,ANOVA,.(.),.,3, ANOVA in MINITAB (Balanced ANOVA),interaction,uncontrolled,ANOVA,.(.),.,3, ANOVA in MINITAB (General Linear Model),ANOVA,.(.),.,3, ANO

23、VA in MINITAB (Fully Nested ANOVA),ANOVA,.(.),.,回归分析的主要内容,实例 最小二乘原理 显著性检验 预测值和预测区间 回归诊断 MINITAB应用 相关分析,回归分析,.(.),.,1, 实例 ( y=ax+b),回归分析,.(.),.,2, 最小二乘原理,原理 Min(Ei)2=min(Yi Yi)2 相关指数 R2=1- (Ei)2/ ( Yi Y )2 比较相关性系数,回归分析,.(.),.,3, 显著性检验,Regression Analysis: MSP versus Kaifa The regression equation is M

24、SP = - 0.360 + 1.44 Kaifa Predictor Coef SE Coef T P Constant -0.3602 0.1312 -2.75 0.010 Kaifa 1.4393 0.1601 8.99 0.000 S = 0.002351 R-Sq = 72.9% R-Sq(adj) = 72.0%,回归分析,常数是否为零,系数是否为零,.(.),.,3, 显著性检验,Analysis of Variance Source DF SS MS F P Regression 1 0.00044631 0.00044631 80.77 0.000 Residual Erro

25、r 30 0.00016577 0.00000553 Total 31 0.00061208 Unusual Observations Obs Kaifa MSP Fit SE Fit Residual St Resid 9 0.828 0.828000 0.831858 0.001533 -0.003858 -2.17RX 23 0.819 0.823000 0.818041 0.000420 0.004959 2.14R R denotes an observation with a large standardized residual X denotes an observation

26、whose X value gives it large influence.,回归分析,.(.),.,4, 预测值和预测区间,回归分析,.(.),.,5, 回归诊断,线性模型-Plot(residual, fit) 误差独立性- Plot(residual, observed order) 误差正态性-Histogram, Normal plot,回归分析,.(.),.,5, 回归诊断,回归分析,.(.),.,6, MINITAB应用,回归分析,可以选择多个变量,.(.),.,6, MINITAB应用,残差分布图形,预测值及预测区间,回归分析,.(.),.,7, 相关分析,相关分析与回归分析差别 相关分析中的变量是随机变量,回归分析中的变量是非随机变量; 相关分析中的变量是相互联系的,回归分析中一个变量(自变量)由另一个变量(因变量)引起。 相关分析是分析两个变量的线性关系,回归分析呈以分析一个变量和多个变量的线性关系和非线性关系。,回归分析,.(.),.,7, 相关分析,相关分析与回归分析联系 相关系数(相关分析)与相关指数(一元回归分析)计算结果一样; 相关方程与回归方程的建立方法一样; 相关方程与回归方程的诊断方法一样;,回归分析,.(.),.,谢谢大家,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1