1.2独立性检验的基本思想及其初步应用.ppt

上传人:本田雅阁 文档编号:2434300 上传时间:2019-03-28 格式:PPT 页数:19 大小:507.51KB
返回 下载 相关 举报
1.2独立性检验的基本思想及其初步应用.ppt_第1页
第1页 / 共19页
1.2独立性检验的基本思想及其初步应用.ppt_第2页
第2页 / 共19页
1.2独立性检验的基本思想及其初步应用.ppt_第3页
第3页 / 共19页
亲,该文档总共19页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《1.2独立性检验的基本思想及其初步应用.ppt》由会员分享,可在线阅读,更多相关《1.2独立性检验的基本思想及其初步应用.ppt(19页珍藏版)》请在三一文库上搜索。

1、独立性检验的基本思想 及其初步应用,现实生活中的几个问题 吸烟是否与得肺癌有关系? 性别是否与数学好坏有关? 韩国人比中国人个子高?,1、介绍两个相关的概念,对于性别变量,其取值为男和女两种,这种变量的 不同“值”表示个体所属的不同类别,像这样的变量称为 分类变量,也称为属性变量或定性变量,它们的取值一定是离散的,而且不同的取值仅表示个体所属的类别。,(1)分类变量:,定量变量的取值一定是实数,它们的取值大小有 特定的含义,不同取值之间的运算也有特定的含义。,(2)定量变量:,例如身高、体重、考试成绩等,张明的身高是180cm,李立的 身高是175cm,说明张明比李立高180-175=5(cm

2、)。,独立性检验,本节研究的是两个分类变量的独立性检验问题。,在日常生活中,我们常常关心分类变量的之间是否有关系,为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查 了9965人,得到如下结果(单位:人):,那么吸烟是否对患肺癌有影响?,表1-9 吸烟与患肺癌列联表,1、象这样的两个分类变量的频数表叫列联表. 在不吸烟者中,有0.54%患有肺癌; 在吸烟者中,有2.28%患有肺癌。因此,直观上可以 得到结论: 吸烟者和不吸烟者患肺癌的可能性存在差异。,2、与表格相比,我们一般借助图形,因为图形能更直观地反映 出相关数据的总体状况。常用等高条形图展示列联表数据的频率特征.,上面我们通过分析数据

3、和图形,得到的直观印 象是吸烟和患肺癌有关,那么事实是否真的如此呢? 你得到这个结论有多大的把握呢?,为此先假设 H0:吸烟与患肺癌没有关系, 看看能够推出什么样的结论。,如果“吸烟与患肺癌没有关系”,(即H0 成立) 则在吸烟者中不患肺癌的比例应该与 不吸烟者中相应的比例应差不多,即:,结论: |ad-bc| 越小,说明H0 成立的可能性越大.,如下用字母表示数字得列联表(表1-10),为了统一评判标准,我们构造一个随机变量,因此:若 H0成立,则K2应很小。,利用公式(1)计算得到 K2 的观测值为,(1),如何看待这个值呢?,即在H0成立的情况下,K2的值大于6.635的 概率非常小,

4、近似于0.01。而现在K2的值 56.632远大于6.635, 故它是小概率事件,所以 我们认为H0 是不成立的 .虽然这种判断犯错 误的可能性存在, 但我们有99%的把握认为 H0 是不成立的!(即吸烟与患肺癌有关系),在H0成立的情况下,统计学家研究出如下的 概率,上面这种利用随机变量K2来确定在多大程度 上可以认为“两个分类变量有关系”的方法 称为两个分类变量的独立性检验。,独立性检验的定义:,独立性检验的基本思想:,类似于数学上的反证法,要确认“两个分类变量有关系” 这一结论成立的可信程度,,首先,假设该结论不成立,即假设结论“两个分类变量 没有关系”成立。,其次,在假设下,计算构造的

5、随机变量K2,如果有观 测数据计算得到的K2k0,则我们有1-P(K2k0)*100把握说明假设不合理(即两个分类变量有关系)。 当K2k0,则我们没有1-P(K2k0)*100把握说明假设不合理。,设要判断的结论为:H1:“X与Y有关系”,1、通过等高条形图,可以粗略地判断两个变量是否有关系。,2、可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。,独立性检验的一般步骤:,具体作法是:,根据观测数据计算随机变量K2的值k,其值越大,说明“X与Y有关系”成立的可能性越大。可以通过查阅下表(表1-12)来确定断言“X与Y有关系”的可信程度。,例如: (1)如果

6、k10.828,就有99.9%的把握认为“X与Y有关系”;,(2)如果k6.635,就有99%的把握认为“X与Y有关系”;,(3)如果k2.706,就有90%的把握认为“X与Y有关系”;,(4)如果k=2.706,就认为没有充分的证据显示“X与Y有关系”。,例1.秃头与患心脏病,在某医院,因为患心脏病而住院的665名男性病人中,有214 人秃顶;而 另外772名不是因为患心脏病而住院的男性病人中有 175人秃顶。分别利用 图形和独立性检验方法判断秃顶与患心脏 病是否有关系?你所得的结论在 什么范围内有效?,解:根据题目所给数据得到如下列联表1-13:,根据联表1-13中的数据,得到,所以有99

7、%的把握认为“秃顶患心脏病有关”。,为考察高中生的性别与是否喜欢数学课程之间的 关系,在某城市的某校高中生中随机抽取300名学生, 得到如下联表:,解:在假设“性别与是否喜欢数学课程之间没有关系”的前提 下K2应该很小,并且,例2.性别与喜欢数学课,由表中数据计算K2的观测值k 4.513。在多大程度上可以认 为高中生的性别与是否喜欢数学课程之间有关系?为什么?,而我们所得到的K2的观测值k 4.513超过3.841,这就意味着 “性别与是否喜欢数学课程之间有关系”这一结论错误的可能 性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程 之间有关系”。,思考: 例1、2的结论是否适用于

8、普通的对象?,在掌握了两个分类变量的独立性检验方法 之后,就可以模仿例1中的计算解决实际问 题,而没有必要画相应的图形。,图形可帮助向非专业人士解释所得结果; 也可以帮助我们判断所得结果是否合理,例1这组数据来自住院的病人,因此所得到的结论适合住院 的病人群体例2的结论只适合被调查的学校。 大家要注意统计结果的适用范围(这由样本的代表性所决定),e. 知识结构图,分类变量之间关系,条形图,柱形图,列联表,独立性检验,背景分析,三 维 柱 形 图,二维条形图,等高条形图,1、通过等高条形图,可以粗略地判断两个变量是否有关系。 (1)在三维柱形图中, 主对角线上两个柱形高度的 乘积ad与副对角线上

9、的乘积bc相差越大,H1成 立的可能性就越大。 (2)在二维条形图中,(x1,y1)个体所占的比例 与(x2,y1) 个体所占的比例 , 两个比例相差越大,H1成立的可能性就越大。,例1.秃头与患心脏病,在某医院,因为患心脏病而住院的665名男性病人中,有214人 秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人 秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有 关系?你所得的结论在什么范围内有效?,解:根据题目所给数据得到如下列联表1-13:,相应的三维柱形图如图所示,比较 来说,底面副对角线上两个柱体高度 的乘积要大一些,因此可以在某种程 度上认为“秃顶与患心脏病有关”。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1