第10章偏倚及其控制.ppt_三一文库31doc.com

资源描述

《第10章偏倚及其控制.ppt》由会员分享，可在线阅读，更多相关《第10章偏倚及其控制.ppt（54页珍藏版）》请在三一文库上搜索。

1、第十章偏倚及其控制,【案例10-1】一项火柴使用与肺癌关系的研究:某学者进行吸烟与肺癌的关系研究时，分析了火柴使用与肺癌的关系，结果见表9-1。作者认为火柴使用者患肺癌的机会是不使用者的8倍多。,第一节概述,【分析10-1】该研究者的结果解释显然不合理，与现有的知识相违背。其原因是该研究者所进行的是单因单果分析，没有将火柴的效应与其它因素（如吸烟）的效应区分开来，属于混合效应（mixing-effect）。,二、研究中误差的来源,研究效度（validity）指研究收集的数据、分析结果和所得结论与客观实际的符合程度。在流行病学中的定义是：在考虑研究方法、样本的代表性和被抽样总体

2、的性质后，样本的研究结果被推广（generalization）或推断 (inference)到样本外人群的可靠程度。含内部效度和外部效度两个方面,研究结果与研究对象的真实情况相符合的程度。,内部效度,研究效度,研究结果由样本人群推论到目标人群（研究对象以外的人群）的程度，它又被称为普遍性(generalization),外部效度,【案例10-2】一项身高的测量某研究者欲了解云南大理市100 000妇女的平均身高，随机抽取了100名妇女，并用钢卷尺来测量她们的身高。【问题10-2】 1. 请问在该研究中测量结果会受到哪些因素的影响？它们会有什么特征？ 2. 如果钢卷尺被替换成经过热水

3、洗过的布尺来测量，测量结果会受到什么因素的影响，它有什么特征？,反应测量值围绕真值波动情况。与较差的测量精度、抽样误差和测量变异性等因素有关。,随机误差,研究误差,指研究结果或推论系统地偏离真实情况（真实值），以及导致如此偏离的过程,系统误差,误差,样本含量,系统误差,随机误差,图10-1 随机误差、系统误差与样本含量的关系,第二节选择偏倚,【案例10-3】某炼焦厂工人的死亡情况调查：某研究者调查了某炼焦厂19902000年在岗工人的死亡情况，并将计算所得的死亡率与该厂所在城市的一般人群死亡率进行比较，其结果见表10-2。研究者据此结果得出该炼焦厂工人的死亡率低于一般人群的结论。,【问

4、题10-3】请问您是否同意该研究者的结论？为什么？【分析10-3】不同意。因为在岗工人多数为身体健康的人群，而一般人群中包含了没有工作的人群，其中的一些人因为身体健康问题而不能工作。进一步的资料分析也表明没有工作人群的死亡率高于在岗工人。因此，炼焦厂工人的死亡率与一般人群的死亡率之间不能直接比较。否则，会产生选择偏倚。这就是健康工人效应（health worker effect）。,选择偏倚（Selection bias）由于实际参与研究人群（研究样本）的某些特征与有资格参与研究但实际没有参与研究的人群（目标人群）的某些特征之间的系统差异，导致这两组人群在暴露与疾病之间的关联程度不同

5、（系统误差），从而使得研究样本不能代表目标人群。选择偏倚的存在通常是通过推理获得，而不是通过观察获得。,选择偏倚的类型,入院率偏倚（admission rate bias）：利用医院病人作为病例和对照时，由于对照是医院的某一部分病人，而不是全体目标人群的一个随机样本；又由于病例只是该医院或某些医院的特定病例，因为病人对医院及医院对病人双方都有选择性，所以作为病例组的病例也不是全体病人的随机样本，因而难免产生选择偏倚，特别是因为各种疾病在不同级别医院的入院率不同导致病例组与对照组某些特征上的系统差异。,现患新发病例偏倚（prevalence-incidence bias）又称奈曼偏倚（Ney

6、man bias），如果研究对象为现患病例，所得的某些信息可能只与存活有关，而未必与该病的发病有关，从而高估暴露与结局之间的关联程度。另一方面，也有部分现患病例改变了从前的生活习惯，从而降低了暴露与结局之间的关联程度。如果研究对象为新发病例，所得到的信息中很多会与该病的发病有关，可以真实地反映暴露与结局之间的关联。,检出症候偏倚（detection signal bias）又称作暴露偏倚（unmasking bias）。病人常因某些与致病无关的症状而就医，提高了早期病例的检出率，从而高估暴露与结局之间的关联程度。,时间效应偏倚（time effect bias）对于冠心病、恶性肿瘤等慢性病

7、，从开始暴露于危险因素到出现病变，往往经历一个较长的时间过程。因此，在调查研究中那些即将发生病变和早期病变而不能检出的人都会被错误地归为非病例组，而被选入对照组，从而使得研究结果产生偏倚。,无应答偏倚（non-respondent bias）无应答者指调查对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。一项研究工作的无应答者可能在某些重要特征或暴露上与应答者有所区别。如果无应答者超过一定的比例，就会使研究结果产生偏倚。控制方法：采取激励措施提高应答率。,志愿者偏倚（volunteer bias）又称自身选择偏倚（self-selection bias）。志愿者多为身体健康或文

8、化程度较高的人群，他们的某些重要特征或暴露与一般人群可能有所区别，从而产生偏倚。,预防和控制选择偏倚的技术指南,1. 形成一个客观、清晰的病例定义。 2. 纳入某一时间和地区内所有病例。 3. 采用一些激励措施提高研究对象参与调查的积极性，提高应答率。 4. 采用随机抽样等技术，确保样本的代表性。 5. 对于病例：（1）确保所参与的医疗机构能够较好地支持该项工作。（2）形成一个有效的病例证实体系。（3）考虑是否所有病例都需要求医；考虑其它地区的病例被证实的策略。 6. 对于对照：（1）为了评估研究的信度，尽量将研究中对照的暴露率与其它来源的非病例的暴露率进行比较。（2）尽量从不同来源

9、的人群中获取对照。,第三节信息偏倚,【案例10-4】高脂肪膳食与心肌梗死的关系研究：某研究者在研究高脂肪膳食与冠心病的关系时，假定病例组和对照组都存在20%的低脂肪膳食者高报了脂肪摄入量; 假定所有的病例都回忆正确，而对照组有20%的低脂肪膳食者高报了脂肪摄入量。该研究者依据这两个假定的情况所分析的结果见表10-3,【分析10-4】这两种假定情况下的观察结果（OR值）都远低于真实结果，表明这两种假定情况下都产生了偏倚。其原因与暴露因素（膳食脂肪摄入）的系统错误分类有关。这种由于在结局变量或者暴露变量的测量过程中存在系统分类错误（系统测量误差）所致暴露与结局之间的关联受到扭曲的现象，称

10、为信息偏倚，又称测量偏倚或观察偏倚。由于流行病学的暴露和疾病多为分类资料，所以信息偏倚有时又被称为错分偏倚（misclassification bias）。,由于病例组和对照组的暴露情况都发生相同方向和大小的错误分类。通常使得研究效应的估计值偏低,无差异错误分类,信息偏倚,由于病例组和对照组的暴露情况都发生了不同大小或方向的错误分类，可造成高估或低估研究效应值。,差异错误分类,信息偏倚的类型,信息偏倚的常见类型,结局变量测量相关偏倚,信息偏倚的类型,回忆偏倚（recall bias）指由于被调查对象的记忆失真或不完整导致调查结果与真实情况不符，以此得出的结果系统地偏离了真值。多数情况下

11、是病例比对照更可能回忆出准确的过去有关暴露危险因素的情况。,调查者偏倚（interviewer bias）又称摘录者偏倚（abstractor bias）。当调查者询问病例的有关暴露情况比对照更加详细时，可能会产生调查者偏倚。相似的，当摘录者对病例的有关暴露情况的摘录比对照更加详细时，也会产生偏倚，这种偏倚称为摘录者偏倚。,报告偏倚（reporting bias）指研究对象故意夸大或缩小某些暴露因素的信息所导致的偏倚。研究对象在回答某一敏感问题时，会存在高估或低估暴露情况，因此又称说谎偏倚（prevarication (lying) bias）。,与结局变量测量相关的偏倚美国Lowa 所

12、进行的乳腺癌家族史与乳腺癌的关系案例。,预防和控制信息偏倚的技术指南,1.对调查者，应尽可能使用盲法收集资料。 2.对研究对象，应尽量不告诉有关的研究目的和研究对象分类等信息。 3.尽量采用客观指标（如生物标志物）或记录来收集信息，以及利用其它来源的信息加以检查所收集资料的真实性。 4.通过仔细措辞和预实验来确保所询问的问题能使所有研究对象清楚、容易地理解。 5.使用世界卫生组织或全国制定的标准化的调查表。 6.制定标准化调查方案和调查培训课程。,第四节混杂偏倚,【案例10-1续】如果利用该资料，将火柴使用（X1）与肺癌（Y）的关系按吸烟状况（X2）进行分层分析，结果见表10-4。

13、,【分析10-1续】按吸烟分层后的分析表明，吸烟人群中和不吸烟人群中火柴使用与肺癌的关系一致，其OR值都是1。而没有进行分层分析的火柴使用与肺癌的关联效应值为8.8。该现象可以解释为火柴使用对肺癌的效应是通过吸烟来实现的。说明单因单果分析的火柴使用与肺癌的关联效应受到了吸烟的扭曲。,这种暴露与疾病之间的关联程度受到其它因素歪曲或干扰的现象，被称为混杂偏倚（confounding bias）。导致混杂偏倚产生的因素被称为混杂因素（confounding factor）。,混杂因素的特征,混杂因素必需是疾病的独立危险因素。它是病因或者是病因的替代变量（proxy of cause）或者是标志物

14、（marker）,但不是疾病的效应。该因素与暴露因素相关。一定不是暴露因素与疾病病因链上的中间变量。,混杂偏倚的来源,混杂偏倚的来源混杂偏倚在类实验（quasi-experiment）和观察性研究中很容易产生。这是因为这些研究很难做到研究对象的随机分组，从而导致其它的因素（混杂因素）在暴露因素的各个水平中分布不一致，不具备可比性。而在真实验（true experiment）中，由于研究对象能被随机化分配，使得其它的因素（混杂因素）在暴露因素的各个水平分布一致，从而使得混杂因素在设计阶段就能得到较好的控制。,混杂偏倚的判断,混杂偏倚的判断比较混杂因素调控前后的暴露因素的效应估计偏差。如果

15、偏差在10%以上就可以认为产生了混杂偏倚，即：,混杂偏倚的控制技术,在设计阶段，可通过随机化、限制、匹配等方法控制混杂偏倚；在分析阶段，可通过标准化分析、分层分析和多变量分析等方法控制混杂因素。,混杂偏倚的控制技术,随机化法（randomization）：将研究对象随机分配到暴露因素的各个水平组中去（各实验组）。优点：它通过消除暴露与混杂因素的关联来控制混杂偏倚它除了能够控制研究者关注的混杂偏倚外，还能够控制研究者尚未注意的混杂偏倚，即残差混杂（residual confounding）缺点：只适用于实验研究并不能完全消除偏倚,限制（restriction）：指选择的研究对象在可

16、能是混杂因素的变量上具有相同值或接近相同值。优点：容易得到理解它在避免那些被限制因素所造成的混杂方面有更为确定的作用缺点：限制了合格研究对象的数量，造成病例选择的困难限制了研究结果的外推性，即研究结果得到的关联是否适用于与研究人群特征不同的人群,匹配（matching）：是指按照病例的某些特征或因素选择对照，使得病例和对照的这些特征或因素保持相同或基本相同。其包括个体匹配和频数匹配两种形式。所匹配特征或因素被称之为匹配因素。优点：可提高病例和对照的可比性，并控制混杂因素保证了混杂因素的各个水平中病例数量和对照数量的一致，从而提高了统计效率缺点：找到合适的匹配比

17、较难不能分析匹配因素对疾病的效应,标准化（standardization）：通过选择一个已知混杂因素的分布（如年龄、性别和病情程度等）的人群作为标准，形成统一的内部构成，来消除混杂因素在暴露因素各水平中分布的不同，从而控制混杂偏倚。包括直接法和间接法两种形式。优点：适用于二手资料的混杂因素的控制缺点：能控制的混杂因素较少,分层分析（stratified analysis）：是指按混杂因素的水平来分层，然后分析每层的暴露与结局的效应关系，并估计所有层合并后的暴露与结局的效应值。优点：容易理解可分析交互作用缺点：能控制的混杂因素较少,多因素分析（multivariable an

18、alysis）：是利用多元线性回归、Logistic 回归和Cox比例风险模型等模型中偏回归系数的意义来控制混杂因素，即：暴露因素（Xi）对结果变量的效应是在控制其它因素的作用后（令其它的X为0）的单独或直接效应。优点：容易理解可分析交互作用（interaction）可控制的混杂因素较多，特别适用于调查研究和类实验研究资料的分析缺点：所需的样本含量通常较多 24,Mantel-Haenszel分层分析,【案例10-5】某研究者想了解饮酒与冠心病的关系，调查结果见表10-5。现欲对饮酒与冠心病的关系按吸烟因素进行Mantel-Haenszel 分层分析。,【分析10-5】一般来说

19、，有下列六个步骤：（一）计算未分层（未调整）时的暴露因素的效应值（RR值或OR值）本例： (式10-1) （二）按混杂因素分层，并计算每层的暴露因素的效应值(见表6),（三）完成各层之间的暴露与疾病关联的一致性检验（Breslow-Day test） 1、Breslow-Day 检验： H0：各层之间的效应值具有一致性（homogeneous） H1：各层之间的效应值具有不一致性（heterogeneity）, 即存在交互作用。（式10-2）（式10-3）式中 i为混杂因素的第i层，RRMH或ORMH见式10-4或式10-5,2.如果Breslow-Day检验 P0.05，则可以用式

20、10-4或式10-5 将各层的效应值合并，形成一个合并效应值。 3.如果Breslow-Day检验 P0.05，则不能用式10-4或式10-5 将各层的效应值合并，而应该进行交互作用分析。 4. 本例： 2 =0.02, P0.05, 所以可以计算合并的效应值,（四）计算暴露因素的合并效应值，并与未调整的效应值比较 1. 合并或调整（adjusted）效应值公式：（式10-4）（式10-5）上述两式中 i为混杂因素的第i层 2. 比较调整的效应值和未调整的效应值，采用式10-1 3. 本例： ORMH = 0.76 偏差=（0.76-1.17）/ 0.76 = 53.95 %,（五）有关合并效应值是否不同于1的检验 1. Mantel-Haenszel 统计量检验的计算公式：（式10-6） 2. 本例： 2=0.02, p0.05,（六）结果解释本例饮酒与冠心病的关系受到了吸烟的扭曲，但是调整后的效应值与1没有统计学差异，这表明饮酒与冠心病之间没有关联。,谢谢 Thank You,

展开阅读全文

第10章 偏倚及其控制.ppt

第10章偏倚及其控制.ppt