1、 病例对照研究 Case control study12概念病例对照研究病例对照研究是一种常用于探索病因的分析性流行是一种常用于探索病因的分析性流行病学研究方法;通过对一组患有某种疾病人群病学研究方法;通过对一组患有某种疾病人群(病例病例组组)和一组或几组未患该病的对照人群和一组或几组未患该病的对照人群(对照组对照组)既往既往暴露于某个或某些可能危险因素暴露于某个或某些可能危险因素(或保护因素或保护因素)频率频率的比较,来考察这些因素是否与该病存在联系及联的比较,来考察这些因素是否与该病存在联系及联系的程度。系的程度。第一节 病例对照研究的基本原理3设计原理Study objectContro
2、lsCasesExposureNon-exposureExposureNon-exposureabcdTimeNow4表2 病例对照研究资料分析表病例组对照组合 计有暴露史aba+b无暴露史cdc+d合 计a+cb+dN51 1、分析性研究,属观察法分析性研究,属观察法2 2、回顾性研究、回顾性研究3 3、时间顺序:从、时间顺序:从“果果”“”“因因”4 4、通常不能够确证因果关联、通常不能够确证因果关联特点特点6 第二节 病例对照研究的设计类型7病例与对照不匹配病例与对照不匹配在病例和对照人群中,分别抽取一定量的在病例和对照人群中,分别抽取一定量的研究对象,一般对照数目应等于或多于病研究对象
3、一般对照数目应等于或多于病例人数。例人数。8病例与对照匹配病例与对照匹配匹配(匹配(matchingmatching)就是要求对照组在某些就是要求对照组在某些因素或特征上与病例组保持相同,目的是因素或特征上与病例组保持相同,目的是进行两组比较时排除匹配因素的干扰。进行两组比较时排除匹配因素的干扰。如以年龄做匹配因素。如以年龄做匹配因素。9匹配方式匹配方式频数匹配:频数匹配:又称为群体匹配,即在选择好又称为群体匹配,即在选择好一组病例之后,在选择对照组时要求其某一组病例之后,在选择对照组时要求其某些特征或变量的构成比例与病例组的一致些特征或变量的构成比例与病例组的一致(即在两组的总体分布一致)
4、即在两组的总体分布一致)。例如例如性别、年龄构成一致,具体做法上类性别、年龄构成一致,具体做法上类似分层抽样。如病例组中男女各半,似分层抽样。如病例组中男女各半,6565岁岁以上者占以上者占1/31/3,则对照人群也是如此。,则对照人群也是如此。10匹配方式匹配方式个体匹配:个体匹配:就是以病例和对照的个体为单就是以病例和对照的个体为单位进行匹配。选择少数几个特征或变量方位进行匹配。选择少数几个特征或变量方面与病例一致的一个或几个对照者组成一面与病例一致的一个或几个对照者组成一个计数单位或计数和分析单位。一个病例个计数单位或计数和分析单位。一个病例匹配一个对照的(即匹配一个对照的(即1:1
5、1:1匹配)一般称为配匹配)一般称为配对。对。11病例对照研究采用匹配的目的病例对照研究采用匹配的目的n提提高高研研究究效效率率,表表现现为为每每一一研研究究对对象象提提供供的的信息量的增加。信息量的增加。n其其次次,在在于于控控制制混混杂杂因因素素的的作作用用。所所以以匹匹配配的的特特征征或或变变量量必必须须是是已已知知的的混混杂杂因因子子,至至少少也应有充分的理由这样怀疑,否则不应匹配。也应有充分的理由这样怀疑,否则不应匹配。12匹配过头匹配过头匹配过头:匹配过头:把不必要的项目列入匹配,企图使把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,病例与对照尽量一致,就可能
6、徒然丢失信息,增加工作难度,结果反而降低了研究效率。称增加工作难度,结果反而降低了研究效率。称为匹配过头。因为一个因素一旦作为匹配条为匹配过头。因为一个因素一旦作为匹配条件,就不可能作为与疾病有关的因素加以分件,就不可能作为与疾病有关的因素加以分析。析。13衍生类型衍生类型巢式病例对照研究巢式病例对照研究将传统的病例对照研究和队列研究的一些要素进将传统的病例对照研究和队列研究的一些要素进行组合后形成的一种研究方法,也就是在对一个行组合后形成的一种研究方法,也就是在对一个事先确定好的队列进行随访观察的基础上,再应事先确定好的队列进行随访观察的基础上,再应用病例对照研究的设计思路进行研究分析。分为
7、用病例对照研究的设计思路进行研究分析。分为前瞻性和回顾性两种。前瞻性和回顾性两种。14巢式病例对照研究巢式病例对照研究运做开始运做开始是按照是按照队列研究队列研究的方式进行:选择一队的方式进行:选择一队列,收集基线资料,采集所研究的生物学标志的列,收集基线资料,采集所研究的生物学标志的组织或体液标本储存备用,然后组织或体液标本储存备用,然后随访随访到出现能满到出现能满足病例对照研究样本量的病例数为止。将这些病足病例对照研究样本量的病例数为止。将这些病例作为例作为病例组病例组,按病例进入队列的时间、疾病出,按病例进入队列的时间、疾病出现的时间与性别、年龄等其他现的时间与性别、年龄等其他匹配匹配条
8、件,从同一条件,从同一队列中选择队列中选择1个或数个非病例作对照,抽取病例个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本,资料按匹与对照的基线资料并检测收集的标本,资料按匹配病例对照研究处理。配病例对照研究处理。15巢式病例对照研究巢式病例对照研究19921992年年RossRoss报道了上海地区肝癌与尿中黄曲霉素报道了上海地区肝癌与尿中黄曲霉素生物学标志关系的巢式病例对照研究的结果,在生物学标志关系的巢式病例对照研究的结果,在1824418244名中年男性队列中发现名中年男性队列中发现2222例肝癌,每例配例肝癌,每例配5 5或或1010个对照,检测研究开始时的尿样发现,黄曲
9、个对照,检测研究开始时的尿样发现,黄曲霉素霉素B1B1及代谢产物及代谢产物和和DNADNA加成物的加成物的OROR值为值为2.3-6.22.3-6.2,经调整混杂因素后,经调整混杂因素后,OROR值为值为3.83.8。这是至今关于。这是至今关于黄曲霉素作为肝癌致病因素最直接的证据。黄曲霉素作为肝癌致病因素最直接的证据。16 第三节 病例对照研究实例年青女性阴道腺癌与母亲服妊娠期用己烯雌酚的关系年青女性阴道腺癌与母亲服妊娠期用己烯雌酚的关系17第四节 病例对照研究的实施一、复习文献,提出假设二、明确研究目的,选择适宜的对照形式三、病例和对照的来源和选择四、获取研究因素信息18(一)提出假设(一)
10、提出假设 根据以往疾病分布的研究或现况研究的结果,根据以往疾病分布的研究或现况研究的结果,结合文献资料,提出疾病的病因假设。结合文献资料,提出疾病的病因假设。(二)根据研究目的选择对照形式(二)根据研究目的选择对照形式 1 1、广泛探索危险因素,可采用不匹配或频数广泛探索危险因素,可采用不匹配或频数匹配;匹配;2 2、根据提供研究用的病例数量;根据提供研究用的病例数量;3 3、能否以较小的样本获得较高的检验效率。能否以较小的样本获得较高的检验效率。19病例和对照的来源和选择Hospital-based case control studyCommunity-based case control
11、 study20病例的选择病例的选择从医院病人选择从医院病人选择优点:优点:诊断正确、获取方便、诊断正确、获取方便、对象合作、信息较可靠对象合作、信息较可靠缺点:缺点:入院率偏倚、代表性差入院率偏倚、代表性差从某特定人群选择病例从某特定人群选择病例优点:优点:代表性强代表性强缺点:缺点:不易获得不易获得21原则 诊断标准诊断标准 最好是新发病例最好是新发病例 尽最大限度收集某地医院或社区的所有病例尽最大限度收集某地医院或社区的所有病例22 对照选择的原则2、对照一定是未患所研究的疾病,如有可能,应尽对照一定是未患所研究的疾病,如有可能,应尽 可能排除亚临床或处于潜伏期的疾病可能排除亚临床或处于
12、潜伏期的疾病3、对照可为不健康者,但所患疾病病因不应与所研对照可为不健康者,但所患疾病病因不应与所研 究疾病的病因相同究疾病的病因相同4、注意研究因素以外其它因素的均衡性注意研究因素以外其它因素的均衡性5、无应答者事先要有统一合理的更换办法,慎重处理无应答者事先要有统一合理的更换办法,慎重处理1、对照最好是对照最好是全人群的一个无偏样本全人群的一个无偏样本;或者是产生病;或者是产生病 例的例的源人群(源人群(source population)中全体未患该病者中全体未患该病者 的一个随机样本的一个随机样本23来来 源源 研究的总体人群或抽样人群研究的总体人群或抽样人群 医院中患有其它疾病的病人
13、医院中患有其它疾病的病人 亲属、邻居、同事、同学等亲属、邻居、同事、同学等24 样本含量的估计1、人群中暴露者的比例人群中暴露者的比例。如人群中吸烟的比例 比例比例 样本量样本量2、假定暴露造成的相对危险度(假定暴露造成的相对危险度(RR)。可通过既往研 究或查阅文献获得 RR 样本量样本量3、要求的显著性水平,即第一类错误要求的显著性水平,即第一类错误 样本量样本量4、要求的把握度,即要求的把握度,即1-1-样本量样本量决定因素25样本大小计算公式样本大小计算公式n非非匹匹配配设设计计病病例例数数与与对对照照数数相相等等时时每每组组所所需人数需人数n非非匹匹配配设设计计病病例例数数与与对对照
14、照数数不不相相等等时时每每组组所需人数所需人数n1:11:1匹配设计匹配设计n1:R1:R配比病例对照研究设计配比病例对照研究设计26样本大小计算公式样本大小计算公式1 1 非匹配设计病例数与对照数相等时每组非匹配设计病例数与对照数相等时每组 所需人数所需人数式中式中P P0为对照人群估计暴露率,为对照人群估计暴露率,P P1P P0RR/1RR/1P P0(RR(RR1)1),P P的均值的均值为为0.5(P0.5(P1P P0),q q1 1P P。27样本大小计算公式样本大小计算公式2 2 非匹配设计病例数与对照数不相等时每组非匹配设计病例数与对照数不相等时每组 所需人数所需人数 设病例
15、数:对照数设病例数:对照数=1=1:c c,28样本大小计算公式样本大小计算公式3 1:13 1:1匹配设计匹配设计p=OR/(1+OR)=RR/(1+RR)p=OR/(1+OR)=RR/(1+RR)p p0为对照人群估计暴露率为对照人群估计暴露率P P1为暴露组的估计暴露率。为暴露组的估计暴露率。P P1=p=p0RR/1+pRR/1+p0(RR-1)(RR-1),q q1=1-p=1-p1,q q0=1-p=1-p029样本大小计算公式样本大小计算公式4 1:R4 1:R配比病例对照研究设计配比病例对照研究设计 病例数为病例数为N N,对照数为对照数为RNRN30获取研究因素信息Ascer
16、tainment of Exposure Personal interviews Existing records Physical measurements and lab testsExposure Yes/No Intensity Length of exposure变量的选定、规定、测量和如何作到研究变量符合变量的选定、规定、测量和如何作到研究变量符合规定。规定。31 资料的收集资料的收集 主要在研究现场以询问方式,填写调查表而主要在研究现场以询问方式,填写调查表而 收集。有些情况下辅以查阅档案,采取样品收集。有些情况下辅以查阅档案,采取样品 化验等。化验等。32一、资料的整理 1、原
17、始资料的重新核查原始资料的重新核查 2、资料的分组、归纳,或者编码、输入计算机资料的分组、归纳,或者编码、输入计算机 二、数据的分析 1、描述性统计 1)描述研究对象的一般特征)描述研究对象的一般特征 2)均衡性检验均衡性检验 2、关联性的统计推断 第五节 病例对照研究的数据整理与分析33关联性的统计推断步骤(1)将资料整理成将资料整理成表格形式表格形式(2)病例和对照组暴露比例差异的)病例和对照组暴露比例差异的显著性检验显著性检验 即回答即回答E和和D是否有联系?是否有联系?(3)估计暴露因素和疾病之间的联系强度)估计暴露因素和疾病之间的联系强度(4)结果解释)结果解释 可能存在哪些偏倚?得
18、出什么结论?可能存在哪些偏倚?得出什么结论?34资料整理表格病例组暴露比例:病例组暴露比例:对照组暴露比例:对照组暴露比例:显著性检验:显著性检验:2检验检验关联强度?关联强度?35不匹配或成组匹配的资料分析显著性检验36OROR计算与可信限的估计及意义计算与可信限的估计及意义 病例组中暴露人数与非暴露人数的比值除以对照组中病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值暴露人数与非暴露人数的比值 37 与与RRRR一样,优势比反映暴露者患某种疾病的一样,优势比反映暴露者患某种疾病的危险性是无暴露者的倍数。危险性是无暴露者的倍数。前提条件前提条件l所研究疾病的发病率(死
19、亡率)很低所研究疾病的发病率(死亡率)很低l病例对照研究中所选择的研究对象代表性好,病例对照研究中所选择的研究对象代表性好,则则OROR值就很接近甚至等于值就很接近甚至等于RRRR值值3895%confidence interval of OR:Miettinen3995%confidence interval of OR:Woolf40M-HM-H法法 两种方法计算结果一致,表明吸烟与食管癌有联系,两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算但联系强度如何,要计算OROR四格表法四格表法41 结结果果表表明明吸吸烟烟者者患患食食管管癌癌的的危危险险性性是是不不吸吸烟烟
20、者者的的2.872.87倍,倍,95%95%的可信范围是在的可信范围是在2.182.183.783.78之间之间42 不匹配或成组匹配分层数据资料的分析43The tabulation of the i th stratum44l按饮酒与否分层按饮酒与否分层 计算计算OROR值值饮酒者中吸烟的饮酒者中吸烟的OR(2.98)OR(2.98)稍高于不分层稍高于不分层OR(2.87)OR(2.87)不饮酒者中吸烟的不饮酒者中吸烟的OR(1.67)OR(1.67)却低得很多却低得很多表明表明饮酒饮酒是混杂因素,饮酒似可加强吸烟的作用是混杂因素,饮酒似可加强吸烟的作用按饮酒与食管癌的关系列表计算按饮酒与
21、食管癌的关系列表计算 2 2=31.9,RR=2.29=31.9,RR=2.29可见可见饮酒与食管癌有联系饮酒与食管癌有联系45l 进行齐性检验进行齐性检验 l齐性检验齐性检验 合并合并与与OROR值值 OROR值无明显差别,则饮酒是混杂因素值无明显差别,则饮酒是混杂因素 合并合并OROR值值 OROR值有显著差异,则饮酒是明显值有显著差异,则饮酒是明显混杂混杂?合并合并OROR值值本例齐性检验无显著差异,计算合并本例齐性检验无显著差异,计算合并OROR与与2 246l 计算合并计算合并OROR与与2 2值值 公式(公式(M-HM-H法):法):合并合并 合并合并47=37.74=2.42 经
22、饮酒分层调整后,吸烟的经饮酒分层调整后,吸烟的2 2与与OROR(即合并(即合并2 2与合与合并并OROR)虽较未调整的)虽较未调整的2 2(55.5)(55.5)与与OR(2.87)OR(2.87)为低,但仍有为低,但仍有一定强度与统计学上的显著性。一定强度与统计学上的显著性。吸烟与食管癌之间有显著的关联吸烟与食管癌之间有显著的关联 饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用的作用2 2M-H表表5-8 5-8 分层计算结果整理表分层计算结果整理表 48 分级暴露资料的分析(1)将资料整理成列联表将资料整理成列联表(2)各分级的各分级的
23、2 检验检验(3)计算各分级的)计算各分级的OR值值(4)趋势性)趋势性2检验剂量反应关系检验剂量反应关系49男性每日吸烟的支数与肺癌的关系50 1:1配对资料的分析 51 食食管管癌癌发发病病因因素素的的研研究究中中发发现现,吸吸烟烟与与发发病有关,男性的资料归纳成表病有关,男性的资料归纳成表5-55-52 2=11.28,OR=4.33=11.28,OR=4.33表明男性吸烟者患食管癌的危险性是不吸烟者的表明男性吸烟者患食管癌的危险性是不吸烟者的4.34.3倍倍 OR95%OR95%可信限可信限52病例对照研究的偏病例对照研究的偏倚倚选择偏倚选择偏倚 入院率偏倚、现患病例入院率偏倚、现患病
24、例-新发病例偏新发病例偏倚、检出征候偏倚、时间效应偏倚倚、检出征候偏倚、时间效应偏倚 信息偏倚信息偏倚 回忆偏倚和调查偏倚回忆偏倚和调查偏倚混杂偏倚混杂偏倚 53选择偏倚选择偏倚n入入院院率率偏偏倚倚:当当利利用用医医院院病病人人作作为为病病例例和和对对照照时时,因因为为对对照照不不是是全全体体目目标标人人群群的的一一个个随随机机样样本本,同同时病例也不是全体病人的随机样本。时病例也不是全体病人的随机样本。n现现患患病病例例-新新发发病病例例偏偏倚倚:如如果果调调查查对对象象来来自自存存活活病病例例,可可能能得得到到更更多多的的信信息息,但但是是其其中中很很多多信信息息与与存存活活有有关关,未
25、未必必与与疾疾病病有有关关,因因此此高高估估了了某某些暴露因素的病因作用。些暴露因素的病因作用。54选择偏倚选择偏倚n检出征候偏倚:检出征候偏倚:病人因某些与致病无关的症状就病人因某些与致病无关的症状就医,提高早期病例的检出率,高估了暴露程度而医,提高早期病例的检出率,高估了暴露程度而产生系统误差。产生系统误差。n时间效应偏倚:时间效应偏倚:对于一些慢性病来说,病程较长,对于一些慢性病来说,病程较长,在病例对照研究时,有可能将那些已发生早期病在病例对照研究时,有可能将那些已发生早期病变而不能检出的人作为对照组。变而不能检出的人作为对照组。55信息偏倚信息偏倚n回忆偏倚:回忆偏倚:病例对照研究主
26、要调查研究对象既往病例对照研究主要调查研究对象既往的暴露情况,由于被调查者记忆失真或不完整造的暴露情况,由于被调查者记忆失真或不完整造成系统误差。成系统误差。n调查偏倚:调查偏倚:病例与对照调查环境与条件不同,或病例与对照调查环境与条件不同,或调查技术、质量不高以及仪器设备的问题。调查技术、质量不高以及仪器设备的问题。56571 1、特别适用于罕见病的研究特别适用于罕见病的研究2 2、省力、省钱、省时间,易于组织实施、省力、省钱、省时间,易于组织实施3 3、同时调查多个暴露因素与疾病的关系、同时调查多个暴露因素与疾病的关系4 4、不仅用于病因探讨,而且可广泛用于其它方面、不仅用于病因探讨,而且可广泛用于其它方面 第八节 病例对照研究的优点及其局限性优点581 1、不适于研究人群暴露比例很低的因素不适于研究人群暴露比例很低的因素2 2、选择研究对象时,难以避免选择性偏倚、选择研究对象时,难以避免选择性偏倚3 3、暴露和疾病的时间先后常难以判断、暴露和疾病的时间先后常难以判断4 4、获取既往信息时,难以避免信息偏倚、获取既往信息时,难以避免信息偏倚5 5、不能计算发病率和相对危险度、不能计算发病率和相对危险度6 6、通常不能够确证因果关联、通常不能够确证因果关联局限性59