工程资料分析EDA课件.ppt

上传人:rrsccc 文档编号:11266300 上传时间:2021-07-20 格式:PPT 页数:57 大小:995.50KB
返回 下载 相关 举报
工程资料分析EDA课件.ppt_第1页
第1页 / 共57页
工程资料分析EDA课件.ppt_第2页
第2页 / 共57页
工程资料分析EDA课件.ppt_第3页
第3页 / 共57页
工程资料分析EDA课件.ppt_第4页
第4页 / 共57页
工程资料分析EDA课件.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《工程资料分析EDA课件.ppt》由会员分享,可在线阅读,更多相关《工程资料分析EDA课件.ppt(57页珍藏版)》请在三一文库上搜索。

1、工程数据分析 Engineer Data Analysis,1,工程资料分析EDA,成语教学,【管窥蠡测】,2,东汉班固汉书东方朔传 “以管窥天,以蠡测海,以莛撞钟,岂能通其条贯,考其文理,发其音声哉。” (莛:ting草茎),管:竹管。蠡:贝壳做的瓢。 原意是竹管里看天,用瓢测量海水。 引申意思是比喻对事情的观察了解很狭隘很片面。,2,工程资料分析EDA,3,你是否经常听到这样的话,有没有什么办法可以让你的推论更加准确呢?,给定一组片面的信息或数据,统计学可以摘要并描述这份数据,观察者并以此份数据推论母体。,【统计学的定义】,课程大纲,基础统计学 假设检定 变异数分析(ANOVA) 简单回归

2、分析,4,工程资料分析EDA,基础统计学的模型,母体:具有共同特征之个体所组成的群体。 样本:由母体中抽取之部分个体所组成的小群体。 参数:用来描述母体的特征值。 统计量:由样本计算得出的特征值。,南京广播中心报道: 近日,南京市抽样调查了5000位市民的体重状况,得知目前南京市民中有60%的体重高于标准水平。且超重主要发生在50岁以上人群。,5,工程资料分析EDA,6,基础统计学,误差,减少误差第一要务: 抽样要够随机!,7,基础统计学(统计量符号),抽样方法,三种估计 的方法,三种估计 的方法,8,数据收集(练习),常用统计量EXCEL操作,1.工具数据分析描述统计,2. EXCEL中,

3、Var. 的操作为 VAR() S 的操作为 STDEV() 的操作为 AVERAGE() 的操作为 QUARTILE( ,2) Mo的操作为MODE(),9,工程资料分析EDA,10,通过统计学的计算,我们可能得到 1.第一组人均身高是 2.第三组身高的标准差是 3.某机种12月白班的平均良率是 4.新人的XX周XX周每小时平均产出是,这时,我们需要了解数据母体的分布状态,需要进行对比才能了解真实的状况,课程大纲,基础统计学 假设检定 变异数分析(ANOVA) 简单回归分析,11,工程资料分析EDA,改善的漏斗,八大步骤+品管工具 SPC 统计制程管制 发现问题,运用品管工具加以分析找出要因

4、。,EDA 工程数据分析 将要因以客观的统计手法加以验证其真实性。,DOE 田口实验设计 以实验手法设定要因的水平,找出最佳化组合。,12,工程资料分析EDA,假设检定(目的),假设检定,提供一个以统计理论 做为基础的证据!,1. 请 5 位帅哥、5 位美女上台,2. 大声地报出自己的身高,3. 以直觉或经验看看男女之间的身高是否有差异?,4. 如何证明两者之间的差距?,13,工程资料分析EDA,假设检定(流程),1. 建立虚无假设及对立假设。 (单尾检定或双尾检定),2. 设定显著水准,亦即决定型一误差。,3. 选择合适的检定统计量。,4. 计算检定统计量。,5. 以P-value或显著值判

5、定拒绝或接受。,假设,检定,14,工程资料分析EDA,建立假设,统计假设是将可能的状况划分为二个互斥的集合,而构成二个互斥的假设。 H0:虚无假设 H1:对立假设 检定的种类 单尾检定: 右尾检定:假设群体母数可能变大的检定。 左尾检定:假设群体母数可能变小的检定。 双尾检定: 假设群体母数可能变大或变小的检定。,双尾检定 右尾检定 左尾检定 H0: 5 H0: 5 H0: 5 H1: 5 H1: 5 H1: 5,15,工程资料分析EDA,16,设定显著水准,显著水准,表示的是发生型一误差的机率 即:虚无假设是正确的,但判为拒绝。 相对应的,表示的是发生型二误差的机率 即:虚无假设是错误的,但

6、判为接受。,显著水准,临界值,临界值, 决定了此分配的临界值, 是 “接受”或“拒绝” H0假设之判断基准 值的大小无一定的标准,一般采用=5% 值越小,表示错杀的机率越小 重要的判断 值应设越小(=1%),17,工程资料分析EDA,P-value 检定法,临界值 (Critical Value),接受域,拒绝域,P-Value 拒绝H0,P-Value 不拒绝H0(亦即接受),18,工程资料分析EDA,检定的结果,反之则表示拒绝H0,表即示判定H0可能错误。,如右图所示,当计算出结果P-value时,接受H0,即表示无充分证据显示H0错误。,P-value,19,工程资料分析EDA,检定的应

7、用-T检定,例1:某圈组的改善主题为提高生产力,怀疑新人作业时间长可能是真因,于是测量数据如右表。(已知:标准人均产能为12),结论:计算得出平均值为10.8,与标准人均产能相差不大,故新人效率低不是生产力低的影响因素。,20,工程资料分析EDA,检定的应用-T检定,Ho:A=12 v.s H1: A 12 =0.05,P-value 拒绝H0 新人人均产能不等于标准人均产能,由样本 计算而得,假设,检定,21,工程资料分析EDA,检定的应用-T检定,例2:某厂计划提高机台产出,怀疑不同机台间可能存在差异于是选了A、B两个机台分别测量几个时段的产量,记录如右表,A机台平均值:100 B机台平均

8、值:105,结论:B机台产量比A机台多5,而且整体数据均比A大。所以B机台产出高于A机台。,22,工程资料分析EDA,检定的应用-T检定,假设,检定,H0:A=B v.s H1: AB =0.05,由样本 计算而得,P-value 不拒绝H0 无充分证据说明AB机台有差异,23,工程资料分析EDA,24,接下来,给大家5秒时间仔细 看看刚刚的画面,假设,检定,H0:A=B v.s H1: AB =0.05,由于计算公式有很大的差别,所以在选用时需要借助其它的工具!,P-value 不拒绝H0 无充分证据说明AB机台有差异,找出不同的地方,25,工程资料分析EDA,检定的应用-F检定,例3:某设

9、备厂商声称新款机台的稳定性要远远优于老款机台,分别对各自生产的10个产品某一特性(规格中心1.35)进行测量,结果如右表。,从数据上判断,如果是你,会选择买新款的机台么?,26,工程资料分析EDA,检定的应用-F检定,假设,检定,H0:新= 老 v.s H1: 新 老 =0.05,P-value 不拒绝H0 无充分证据说明新老机台有差异,27,工程资料分析EDA,两母体平均数检定,1.双样本等方差假设,2.双样本异方差假设,T检定,F检定,双样本方差检定,不相等,相等,28,工程资料分析EDA,29,学员实作(15%),Ho:A B v.s H1: A=B =0.05,结论:由于1.430.0

10、5,所以新老人没有差异,找出左边案例的错误,学员实作(15%),Ho: v.s H1: = P-Value =,结论: 会打球的果然比较高 其实没差别,请 5 位有打篮球、5 位没打篮球的男生上台 大声地报出自己的身高 刻板的印象告诉我们,篮球员身高应该比较高 请使用假设检定提供有力的证据!,30,工程资料分析EDA,31,T检定-成对双样本,T检定中较为特殊的一种。 使用条件:检定单一母体成对样本平均数的变化 (例:同一母体改善前后的差异),T检定-成对双样本,例4:某一药剂研究所进了一项降压药的实验,先记录12位大专性学生的初始血压,然后在服用此药个月后,再测其血压。根据观察结果,得出右表

11、的资:,你觉得这种降压药有效吗?,32,工程资料分析EDA,T检定-成对双样本,假设,检定,H0:前=后 v.s H1: 前后 =0.05,由样本 计算而得,P-value 拒绝H0 服药前后血压有差异。,33,工程资料分析EDA,34,学员实作(15%),结论: 有差异 无差异,Ho:前=后 v.s H1: 前后 =0.05,统计检定方法分类,检定 平均数,两组 相关样本,两组 独立样本,检定 变异数,一组 样本,不相等,相等,未知,已知,未知,已知,t test,Z test,双样本同方差T,双样本异方差T,F test,2test,Z test,检定 平均数,检定 变异数,成对双样本T,

12、35,工程资料分析EDA,课程大纲,基础统计学 假设检定 变异数分析(ANOVA) 简单回归分析,36,工程资料分析EDA,变异数分析( ANOVA ),通过前面的学习,假设检定可以判别两母体之间的平均数和变异数是有否差异。当母体为三个或者更多的时候?,变异数分析(Analysis of Variance),变异数分析 用来分析一个因子不同水准之间是否存在差异,以及两因素子中哪个对于特性起显著影响。,用检定的方法,两两检定,37,工程资料分析EDA,38,变异数分析,例5:已知有A、B、C三种机台,计划分析它们之间的每小时产量是否存在差异,分别对其5个时段的产量进行记录。如下表,此例题中,因子

13、是机台; 水准是A、B、C三种; 实验次数是5次。,单因子变异数分析,假设:H0:A=B=C H1:i不全相等 (i=1k) =0.05,使用软件:Excel工具资料分析 单因子变异数分析,39,工程资料分析EDA,40,单因子变异数分析,假设:H0:1=2=K= H1:i不全相等 (i=1k) =0.05 k:水准数。因子为机台,水平有A、B、C三种机台,则 k=3。 n:实验次数。各水平进行5次实验,共15次实验,则 n=15。,公式,41,学员实作(20%),哪一组的男生比较强壮? 请各组指派三位猛男!,俯地挺身(限时10秒),42,变异数分析,例6:已知有A、B、C三种机台,五位作业员

14、。分别对每个作业员在每个机台上作业的产量作记录,如下,此例题中,因子是机台、作业员; 水准是机台是三种,作业员五种; 实验次数是1次。,43,二因子变异数分析,B因子之假设 H0:1=2=3=4=5 H1:Bj不全等 (j=1r) =0.05,A因子之假设H0:A=B=C H1:Ai不全等(i=1k) =0.05,44,二因子变异数分析,B因子之假设H0:B1=B2=Br=H1:Bj不全等 (j=1r) =0.05,A因子之假设H0:A1=A2=Ak= H1:Ai不全等(i=1k) =0.05,公式,二因子变异数分析重复试验,请思考,有没有可能某人在某个机台上就发挥的好?即,人员与机台间可能有

15、交互作用?,此时,实验次数为2次,45,工程资料分析EDA,二因子变异数分析重复试验,P-value 不拒绝H0 无交互作用产生,B因子之假设 H0:1=2=3=4=5 H1:Bj不全等 (j=1r) =0.05,A因子之假设 H0:A=B=C H1:Ai不全等(i=1k) =0.05,交互作用之假设 H0:()ij=0 (i=1k) H1:()ij不全为0 (j=1r) =0.05,46,工程资料分析EDA,47,二因子变异数分析重复试验,A因子之假设H0:A1=A2=Ak= H1:Ai不全等(i=1k)=0.05,B因子之假设H0:B1=B2=Br= H1:Bj不全等 (j=1r)=0.0

16、5,交互作用之假设 H0:()ij=0 (i=1k) H1:()ij不全为0 (j=1r) =0.05,公式,48,变异数分析注意事项,误差项变异过大,P-Value 无任何因子显著,1.规划实验时,需考虑交互作用之影响。 2.无任何因子显著时,误差项变异会过大,表示影响实验结果之主要原因未被考虑到,需重新检讨。,49,变异数分析注意事项(续),异常值需挑出,3.变异数分析前需分析组内之数据是否存有异常值。,4.变异数分析后可探讨何种水平具有较佳结果。 5.信心水平之选择,建议采 5% 或 1%,统计上的含意代表显著与非常显著。,课程大纲,基础统计学 假设检定 变异数分析(ANOVA) 简单回

17、归分析,50,工程资料分析EDA,QC7 图,可看出温度与落尘量的相关性,举手抢答加5分,51,工程资料分析EDA,QC7散布图(相关系数),可得上述案例之相关系数为 r =0.88,52,工程资料分析EDA,QC7散布图(相关性),r = 0.88 其呈现之关系为正相关,53,工程资料分析EDA,负相关,请列举出身边你认为相关的例子。 如:地势越高,气压越低。,54,工程资料分析EDA,散布图与回归分析,散布图可观察其相关性。回归分析可藉由计算两变量之线性关系 求出回归方程式,并据此方程式推估未进行实验之值。,55,工程资料分析EDA,56,回归方程式,由Excel报表可得回归方程式: y = x+= 0.15x-78.82 依据此方程式可进行最佳解的预测。 代入X(温度)可预测Y(落尘量),相关系数,回归方程式(回归线检定), ,P-value 拒绝H0 温度可以解释落尘量,用于检定此模型是否显着。 H0:温度无法解释落尘量 H1:温度可以解释落尘量,用于检定、是否为零。 H0:= 0 v.s H1: 0 H0:= 0 v.s H1: 0,P-value 拒绝H0 不为零,P-value 拒绝H0 不为零,57,工程资料分析EDA,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1