509-卡方检验.ppt

上传人:本田雅阁 文档编号:3020958 上传时间:2019-06-25 格式:PPT 页数:54 大小:398.01KB
返回 下载 相关 举报
509-卡方检验.ppt_第1页
第1页 / 共54页
509-卡方检验.ppt_第2页
第2页 / 共54页
509-卡方检验.ppt_第3页
第3页 / 共54页
509-卡方检验.ppt_第4页
第4页 / 共54页
509-卡方检验.ppt_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《509-卡方检验.ppt》由会员分享,可在线阅读,更多相关《509-卡方检验.ppt(54页珍藏版)》请在三一文库上搜索。

1、第七章,检验 (卡方检验),本章主要介绍卡方检验的基本概念、独立性检验方法、适合性检验方法,在科研工作和渔业生产中,我们经常会碰到许多质量性状方面的资料,这些资料可以转化成率后使用 t-test 方法进行检验,但这仅限于一个样本率与总体率的比较、两个样本率间的比较 除此之外,我们还可以用 检验来完成检验工作 特别当有多个样本进行比较时,必须用 检验来完成,第一节 的概念,在第四章中,我们讨论过 分布 有两个定义: 定义一: 定义二: 前一个定义是针对数量性状资料的 而后者主要是针对质量性状资料的,在遗传学中,我们研究某一性状是否受一对等位基因的控制,该性状在后代的分离比例是否符合某种规律 例1

2、 孟德尔的豌豆花试验(红花 705 朵、白花 224朵):这一分离是否符合他自己提出的 3:1 的分离比例的假设? 如果这一 3:1 的理论比例是正确的,那么这一试验所出现的红花和白花的理论比例应当是: 红花:696.75 白花:232.25 显然,实际出现的红花、白花的朵数与理论值之间有一定的差异(如何用 t-test来完成这一检验?),连续进行多次试验,每一次的结果都不会相同,每一次的结果都不会刚好符合理论值 可以这样设想:观察值与理论值之间的差距越小,表示试验结果与理论值越相符;反之,观察值与理论值之间的距离越大,表示试验结果与理论值越不符,当这一差值大到一定程度时,我们就可以认为豌豆花

3、的颜色是不受一对等位基因控制的,可能是另外一种遗传模式 但如何来界定这种相符或不相符?,当我们将这两个差值相加,我们会发现其和为 0,可以说,任何类似的问题其结果都是 0: (705-696.75)+(224-232.25)= 0 差值的平方和相加,其结果不会为 0了,且由于平方,使得原来较大的差变得更大了,因而增大了分析问题的灵敏性 但由于每次试验的样本量不会相等,因而缺乏可比性,以理论值为标准进行比较,问题就解决了,上例中:红花: 白花: 两者之和:,例2 正常情况下,中国婴儿的性别比为:51:49 即每出生 100 个女婴,就有 103105 个男婴 统计某地区连续 3年的婴儿性别比,得

4、:男婴4691人:女婴4159人,试问该地区的新生儿性别比正常吗? 我们用列表的方式检查之: 婴儿性别 实际值(O) 理论值(E) O-E 男婴 4691 4513.5 177.5 6.98 女婴 4159 4336.5 -177.5 7.27 合计 8850 8850.0 0 14.25,显然,这一 值较大 ,有可能这一地区的婴儿出生性别比不太正常(请用 t-test 进行检验,看这一性别比是否符合常规性别比),例3 长翅灰身(LLGG)的果蝇与残翅黑檀体(llgg)果蝇交配,其后代F1全为长翅灰身,F1自群繁育,结果出现了 4 种表现型:长灰(1477)、长黑(493)、残灰(446)、残

5、黑(143),现假定控制翅膀长度和身体颜色的两对基因是相互独立的,且都是显隐性关系,则四种类型的果蝇其比例应当是 9:3:3:1 现需验证这次试验的结果是否符合这一分离比例,长翅灰身(LLGG) 残翅黑檀体(llgg) 长翅灰身(L_G_) 长灰 长黑 残灰 残黑 (1477) (493) (446) (143),1477 + 493 + 446 + 143 = 2559 以上三个例子都要求我们判断观测值与理论值之间是否相符,而我们都可以得到一个 值,检验的一般步骤: 首先作无效假设 其次计算 值 最后根据 值出现的概率判断无效假设是否成立 自由度不同, 分布是不同的 分布的自由度仅与性状的类

6、别有关,而与次数无关,例 1 中有两类花,因此其自由度为 2-1 = 1 例 3 中有 4 类果蝇,因此其自由度为 4-1 = 3,等等,当自由度为 1时, 检验应作连续性校正,校正的 检验公式记作 由于2分布是连续性分布,被检验的资料是离散型的分类资料,而从离散型资料得到的统计量只是近似地服从2分布,因此,为了保证有足够的近似程度,一般要求: 理论频数不少于 5 自由度必须大于 1,当自由度为 1时,进行校正 质量性状的资料作 检验,有两种方法,下面分别进行讨论,第二节 适合性检验,适合性检验适用于某一实际资料是否符合一理论值,因此适合性检验常用于遗传学研究、质量鉴定、规范化作业、一批数据是

7、否符合某种理论分布,等 我们以例 3 来说明适合性检验的一般步骤,设立无效假设, 果蝇的分类观测值与理论值相符 两者不符 计算 值,前面已经得到 Df = 4-1 = 3 查 值表,得 接受无效假设,即果蝇的这四种类型分离符合自由组合定律 9:3:3:1,例 2 的 值需重新计算,因为性别比只有两类,因此其自由度为 1,应作连续性校正 连续性校正公式是: 先作无效假设: 本例男女婴性别比符合常规比例 不符常规比例 计算 值 查 值表,得,否定无效假设,接受备择假设,即该地区婴儿出生的性别比极显著偏离正常性别比,应查找原因 (例 1 是否需要作连续性校正?),上一章中关于鱼药厂销售治疗鱼烂鳃病新

8、药的例题是否可以用 检验?如果可以的话,是否需作连续性校正?(请同学们自行完成之) 又例:将红色鲤鱼与瓦灰色鲤鱼进行杂交,其 F1代全为瓦灰色,F1代自群繁育,得到的后代产生了分离:1738 尾为红色鲤鱼,5504 尾为瓦灰色鲤鱼试分析其遗传规律 显然,从两代鲤鱼的体色变化,可以看出,红色为隐性,瓦灰色为显性,但是否是完全显隐性关系需做遗传学分析,假定这是一对完全显隐性基因在起作用,红色和瓦灰色应当是 1:3 的关系 设H0:鲤鱼体色分离比例为 1:3 VS HA:分离比例不符合 1:3 由于这里只有两种体色变化,因此 df = 2-1 = 1 需作校正性的2检验 1738 + 5504 =

9、7242 1810.53 = 5431.5,接受H0,即鲤鱼体色分离符合 1:3 的理论比例,说明鲤鱼的这一性状是完全的显隐性遗传关系,的分割 有时候,经 检验, 被推翻,而接受了 ,即表示整个资料不符合某一理论比例,但这总的 值不能反映是全部资料均不符合理论比例,还是其中部分资料不符合比例,因此我们应进行 值的分割 下面我们看一个例题,两对性状F2分离的四种表现型观测资料分别为154、43、53、6,试问该批资料是否符合 9:3:3:1? 该例的自由度为 4-1 = 3(不需要进行校正) 先计算理论次数:154 + 43 + 53 + 6 = 256 A-B-:144 A-bb:48 aaB

10、-:48 aabb:16 设立无效假设(略),否定无效假设,接受备择假设,即这批资料与设定的理论分离比例 9:3:3:1 不符 是整批资料都不符?还是部分不符? 我们需作进一步的分析,因此应对 作分割 这种分割是建立在 具有可加性的特点上的,而这种可加性只有在次数资料各部分相互独立、且不作连续性校正的基础上才能成立 该例的四个分值分别为: 0.694 + 0.521 + 0.521 + 6.25 = 7.986,显然,前面三个分值较小,因此先取前三部分的比例作 检验: 154 + 43 + 53 = 250 A-B-:150 A-bb:50 aaB-:50 设立无效假设(该怎么设?) 接受无效

11、假设,即这三部分资料的实际观测值符合9:3:3 的理论比例,再检查余下的 aabb 与这三部分之和是否符合1:15 前三部分之和(理论值):240 aabb:16 这说明 aabb 不符合理论比例,检验中的适合性检验一般要求样本量应大一些,样本较小会影响到检验的正确性,特别是当理论比例中有较小值时(上一例中的 aabb),更应当注意样本容量,这一例即有样本偏小的倾向,第三节 独立性检验,独立性检验是检查两个变量、两个事件是否相互独立的这么一种检验 例如:鱼池清塘与否与鱼病的发生是否有关? 若两者相互独立,即表示清塘无效,清塘后鱼的发病率与没有清塘是一样的;如果清塘后鱼的发病率显著降低了,表示清

12、塘与鱼的发病率这两者间是有关系的 因此,独立性检验的无效假设是两变量相互独立,其备择假设是两变量相关(即两者之间有依存关系),在设立无效假设的前提下,计算 值,当 时,接受无效假设,即两变量相互独立;当 否定无效假设,接受备择假设,即两变量之间存在相关 独立性检验没有理论比率,因此必须用列表的方式从现有的观测值次数来推算理论比值,这种用表的方式来推算理论次数的方法是建立在两因子无关(两因子相互独立), 即两因子齐性的基础上的,下面我们分别各种情况来介绍独立性检验,一、22 表 结合实际例子来说明这种表的使用 将鱼苗放进鱼池前先将鱼池消毒,能否减轻鱼苗的发病情况,在此之前先作一试验,得数据如下:

13、 发病 不发病 合计 消毒 300(a) 920(b) 1220 不消毒 580(c) 630(d) 1210 合计 880 1550 2430,这张表共 2 行、2 列,因此称为 22 表 从这张表中我们可以看出,消毒的鱼池中,有发病的鱼苗,也有不发病的鱼苗;没消毒的鱼池中,鱼也有发病和不发病两种 假设鱼池是否消毒不影响鱼的发病情况(这是无效假设的前提和内容),那么,消毒鱼池和不消毒鱼池中鱼的发病率应当是一样的,所产生的误差是抽样误差,即,得: 同样的道理,我们可得:,我们将上述数据制成一张表: 发病 不发病 合计 消毒 300(441.81) 920(778.19) 1220 不消毒 58

14、0(438.19) 630(771.81) 1210 合计 880 1550 2430 表中,括弧内的就是理论值 需要注意的是,这种结构的 检验其自由度是横行数减 1 乘以纵列数减 1: 因此这里应该使用校正公式 计算 值 同学们先自行计算,设立无效假设 设 鱼苗的发病与鱼池消毒与否无关(或:鱼池消毒与否不影响鱼苗是否发病) 鱼苗的发病与鱼池消毒与否有关(或:鱼池消毒与否直接影响鱼苗的发病) 得:,否定无效假设,即鱼池消毒与否极显著地影响着鱼苗的发病(或鱼苗的发病情况直接受鱼池消毒与否的影响),二、RC表(R:行 C:列) RC 表是 22 表的扩展,反之, 22 表也可以看成是 RC 表的一

15、个特例 当行2、列2 时, 22 表就成为了 RC 表 这样的表称为列联表(contingency table) RC 表的自由度为(R-1)(C-1) 实例:检查鱼的饲养方式与鱼的等级是否有关,设计了如下试验:按不同方式分为三种网箱饲养类型:A、B、C,统计不同饲养方式下鱼的等级情况,得如下数据,试分析,等 饲养方式 合 级 A B C 计 甲 22( 9.32) 18(18.99) 16(17.68) 56 乙 18(16.56) 16(16.28) 14(15.16) 48 丙 11(13.11) 13(12.89) 14(12.0 ) 38 丁 8(10.01) 11( 9.84) 1

16、0( 9.16) 29 和 59 58 54 171 计算上表中各理论值(即括弧内的数值,如何计算?),设 鱼的等级与饲养方式无关 鱼的等级与鱼苗的饲养方式有关 将计算得到的理论值填入上表中,并计算 值: 接受无效假设,即商品鱼的规格与饲养方式无关,独立性检验的公式可以使用简易公式,即不需要计算理论值,但这种公式较难记忆,有兴趣的同学可参看教科书 P202 当样本容量很小(n40、理论次数 E5),进行22 表的检验时,我们可以使用精确概率计算法进行检验,由于小样本的情况不多,即使有小样本的情况,其统计结果的统计学意义也不大,有兴趣的同学可以参看教科书 P203204,第四节 理论分布的检验,

17、我们有时候需要知道,某一个试验其结果是否符合某一理论分布,或希望知道符合什么样的理论分布,这关系到试验的结果是否正常或是否合理 下面我们用一个实例来说明这种检验 显微镜下检查某奶样中结核菌的分布情况,根据视野内小方格中结核菌数进行统计,并将不同结核菌数将格子归类,记录每类的格子数 结果见下表:,格子内结核 菌数(x) a 0 1 2 3 4 5 6 7 8 9 T 格子数 b 5 19 26 26 21 13 5 1 1 1 118 我们先计算每格子内结核菌数的加权平均值: 计算每一种结核菌数目的概率值 P(x)和理论格子数:,将每一类型的概率值和理论格子数填入表下,并计算 值: a 0 1

18、2 3 4 5 6 7 8 9 T b 5 19 26 26 21 13 5 1 1 1 118 c 0.051 0.151 0.225 0.224 0.167 0.100 0.050 0.029 0.008 0.003 1.00 d 5.98 17.83 26.59 26.44 19.71 11.76 5.85 2.49 0.93 0.31 118 e 0.159 0.077 0.013 0.007 0.084 0.131 0.123 0.142 上表中,a为前一表中的“格子内结核菌数(x)” ,b为格子数, c为概率值P(x),d为理论格子数,e为各个 值,最后一个值 0.142 是合并值

19、 得 =0.736 即该样本内结核菌的分布十分符合泊松分布,利用 分布,还可以对样本的方差进行同质性检验: 一个样本的方差与总体方差的同质性检验公式为: 两个样本的方差同质性检验公式为:,三个或以上样本的方差同质性检验公式为: 其中 为合并均方 为校正值 为自由度,思考与习题: 1、什么是适合性检验?什么是独立性检验?二者在无效假设、理论次数的计算、自由度计算和统计推断等方面有何区别? 2、当自由度为 1 时,卡方检验为什么要进行校正?如何进行校正? 3、透明金鱼和非透明金鱼进行杂交,杂交一代全为半透明金鱼(五花鱼),五花鱼和五花鱼交配,后代中出现了分离:透明鱼 130 尾,五花鱼255 尾,

20、非透明鱼 115 尾,请问金鱼的这一性状符合 1:2:1 的遗传规律吗?,4、扬子鳄有自行调节性比例为雄:雌 = 1:5 的繁殖习性,今在某一自然保护区内检查扬子鳄的繁殖情况时发现雄性幼鳄 32 尾,雌性幼鳄 170尾,问这次调查具有代表性吗? 5、某水产所用土法疫苗免疫草鱼烂鳃病,注射了400 尾,其中免疫了 325 尾,死亡了 75 尾,对照 400 尾(未作注射)中免疫了 278 尾,死亡了122 尾,试问这种土法疫苗具有免疫力吗? 6、试对上一章第 6 题进行卡方检验,7、用某药物的三种浓度甲、乙、丙治疗 219 尾病鱼,治疗结果见下表,试分析哪种浓度为最佳: 药物浓度 治愈 显效 好转 无效 甲 67 9 10 5 乙 32 23 20 4 丙 10 11 23 5 8、显微镜下检查水样内某类浮游生物,对视野下118 个小方格内的该类浮游生物进行计数,将格子按浮游生物出现的数目分类,试检验其分布是否符合泊松分布,浮游生物出现数 0 1 2 3 4 5 6 7 8 9 观察格子数 5 19 26 26 21 13 5 1 1 1 (*),end,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1