循证医学-证据评价的基本原则与方法-研.ppt

资源描述

《循证医学-证据评价的基本原则与方法-研.ppt》由会员分享，可在线阅读，更多相关《循证医学-证据评价的基本原则与方法-研.ppt（41页珍藏版）》请在三一文库上搜索。

1、循证医学- 证据评价的基本原则与方法,南昌大学公共卫生学院黄鹏,证据评价的意义与基本要素,证据评价的意义证据不一定都是真实的证据不一定都是重要的证据不一定都是适用的,证据评价的基本要素内部真实性 -结果能否/或者在多大程度上反映真实情况？影响因素：（1）研究设计：直接决定结果的内部真实性（2）研究对象：选择偏倚；混杂偏倚（3）研究环境：信息偏倚（4）数据分析：统计方法个别一般,临床重要性 -结果是否具有临床的实际应用价值？新药 VS 传统药物能力的差异的确值得应用吗？新诊断方法 VS 传统诊断方法,外部真实性（适用性） -结果外推到其他人群的能力,一般个别,内

2、部真实性和外部真实性是什么关系？,证据评价的基本内容和方法,证据评价的基本内容研究目的：是否明确、重要、科学、先进、可行？研究设计：是否科学、可行？研究对象：定义是否明确？代表性如何？有无入选和排除标准？观察测量：变量的定义是否明确？指标选择是否合理？测量是否可靠？结果分析：统计方法是否恰当？偏倚的处理是否考虑？质量控制：针对可能的偏倚采取了那些预防措施？结果表达：效果如何？不良反应多大？不足之处？卫生经济：是否进行成本-效果，效益，效用分析？研究结论：是否回答了假说？结论是否可以外推？与他人的结果是否一致？,证据评价的基本方法初筛临床研究证据的真实性和相关性确定研

3、究证据的类型证据评价的注意事项,真实性,1、这篇文章是否来自经同行评审（peer-reviewed）的杂志? 有同行评审的杂志上发表的文章均经过了严格的评审过程，尽可能筛除有严重缺陷的文章，提高了发表文章的质量。 2、这篇文章的研究场所是否与你的医院相似，以便结果真实时可应用于你的患者？这个问题可以通过阅读作者的单位或进行研究的场所确定。如果你在乡村医院工作，阅读的文章是在某个大学的专科病房所进行的研究，你就要考虑其结果应用到你的病人时可能存在环境条件以及患者本身的差异，当然这不是拒绝这篇文章的重要理由，但如果差异太大，应谨慎考虑。,3、该研究是否由某个组织所倡议，导致其研究设计或结果可能

4、受到影响？这个问题主要考虑研究资金的来源可能导致的偏倚。大多数杂志要求研究人员说明研究资金的来源。如果一个研究有药厂或其它商业组织资助，应要求研究人员保证其研究的设计和结果并未因此而受到影响。,下面的三个问题涉及临床相关性，可通过阅读摘要的结论和相关部分获得。临床相关性对医生和病人均很重要。一般来说，如果一篇文章涉及的问题临床很少见，或涉及的治疗或诊断方法在你的医院根本没有开展，这样的文章不值得阅读。即使阅读也只是满足了你的学术好奇心，不会影响你的临床实践。因此，以病人为中心的临床研究证据远比以疾病为中心的研究证据实用。如一篇文章描述了某种方法用于筛选某种癌症的敏感度和特异度（以疾病

5、为中心的证据），而另一篇文章描述经过这种筛选试验可以提高患者的生存质量或寿命（以病人为中心的证据），你应该首先阅读后一篇文章。,相关性,4、如果研究证据提供的信息是真实的，是否为你的患者所关心的问题？对患者的健康有无直接的影响？可以通过阅读文章摘要的结论部分初步解决这个问题。例如，如果某篇文章的结论为通过某种治疗方法，脑卒中患者偏瘫肢体的肌电图有明显改善，并未涉及肌力和活动能力；但对于患者、医生来说，可能更关心的是经过治疗后偏瘫肢体的肌力是否改善、能否活动，因此该研究提供的信息并不是你的患者所关心的问题。,相关性,5、是否为临床实践中常见问题，涉及的干预措施或试验方法在你的医院是否可行？如

6、果文章涉及的问题在临床实践中经常遇到，且研究的干预措施或试验方法在你的医院也有条件实行，这样的文章值得深入阅读。,6、如果研究证据提供的信息是真实的，是否会改变现有的医疗实践？如果文章涉及的干预措施或试验方法，你过去未在类似的病人中使用过，也许新的尝试可能获得意外的收获，因此，有必要继续阅读这篇文章。,以上6条着重于“带着病人的临床问题” 去阅读证据,证据评价的基本方法初筛临床研究证据的真实性和相关性确定研究证据的类型根据研究证据类型进行评价,确定研究证据的类型,要明确该研究的目的和要解决的临床问题是什么？这可通过阅读文章的摘要，必要时文章正文的前言以确定研究的目的。一般来说，原始研

7、究回答的主要临床问题有四类：病因、诊断、治疗和预后。不同的临床问题其研究设计方案是不同的。不同的研究设计其产生证据级别是不同的。,原始研究涉及的主要临床问题及其常用的设计方案,证据评价的基本方法初筛临床研究证据的真实性和相关性确定研究证据的类型根据研究证据类型进行评价 *不同的研究设计采用不同的原则进行评价,证据评价的注意事项方法学评价是基础：研究设计直接决定证据的级别。证据的真实性是评价重点：不真实，就无所谓重要和适用。要选择恰当的评价指标：要做到“门当户对”。评价力求全面系统：针对研究的全过程进行评价。评价要实事求是：任何研究都会有缺陷和不足，应合理评估其作用和不足。正

8、确认识阴性结果：要注意区别真阴性和假阴性。,论文的基本格式（以研究原著为例）,1.文题 2.作者署名 3.研究单位 4.摘要 5.关键词 6.正文：引言；材料与方法；结果；讨论 7.致谢 8.参考文献,文章的研究策略是什么？,该研究策略用于解答作者提出的研究问题是否恰当？如果不恰当，这个研究所产生的结果有多大的价值？常用的研究策略包括病例系列报告（临床分析）：报告经验，不解答问题或验证假说横断面研究：确定某个健康问题的强度队列研究和病例-对照研究：因果关系的推断随机对照试验：判断某干预因素（如治疗）的效果,该研究所演绎的总体人群是什么？,样本结构是什么？样本结构能否准确

9、代表该研究的总体人群？用什么方法抽样？是否存在抽样偏倚？如果有偏倚，它是否危害到研究结果的外部有效性？,研究因素是什么？,研究因素是什么？如何测量这些研究因素？这些测量方法是否有误？如果有误，是否会对结果造成明显的偏倚？,结局因素是什么？,结局因素是什么？是否所有相关的结局因素均被考虑到？如何测量这些结局因素？是否存在测量误差？被遗漏的结局因素是否重要？测量的误差是否使结果产生明显的偏倚？,该研究中是否可能存在偏倚？,有无选择偏倚、信息偏倚、混杂偏倚？在实验性研究，病例如何分组？在队列研究，有多少完成随访？在病例-对照研究，对照组是否合适？是否有什么措施去避免或解

10、决这些偏倚？这些偏倚是否危害到该研究的内部有效性？,该研究是否考虑到样本量的推算？,研究功效是否被阐明？样本量是否足以检测有意义的区别？,统计学方法是否被阐明？,作者使用什么统计方法？该方法是否适合研究的问题和资料？是否提供了可信区间？如果统计学分析的结果支持无效假说，是否提供了该研究的功效？,针对研究的问题，作者作出了什么结论？,研究结论的引述是否根据研究分析的结果？你同意这个结论吗？,举例,原文题目：银屑病发病与血型的关系探讨，原作者对64例银屑病患者进行血型观察，其中O型血30例，A型血17例，B型血17例，AB型血0例。作者通过计算不同血型所占的比例，认为银屑病的发病与血

11、型有明显的关系。,根据常识，正常人群中的血型构成存在较大差异，AB型所占的比例就是最少，作者没有对正常人群的血型分布情况进行调查，仅根据自己调查的银屑病人血型构成相差悬殊的情况，并不能说明银屑病人与正常人群在血型构成上存在差异，作出结论也是没有说服力的。正确的做法应建立正常对照组，调查正常人群的血型分布情况，并与银屑病人的血型分布情况进行比较，如果存在差异，则为银屑病的发病因素提供了某种线索，如果没有差异，则可以认为银屑病发病与血型构成没有关系。,举例,原文题目：补骨1号对大鼠类固醇性骨质疏松的作用，24只大鼠随机分成3组，每组8只。一组：正常对照组（用生理盐水灌胃），二组：激素组（氢化可的

12、松灌胃），三组：补骨1号合用激素组（氢化可的松灌胃的同时加用补骨1号）。实验一段时间后，测定骨小梁面积等定量指标，经分析，认为补骨1号有防治类固醇性骨质疏松的作用。,分析：此实验涉及两个因素，即“激素用与否”和“补骨1号用与否”，如果这两个因素不是互相独立的，存在着交互作用，则第三组的效应就包括激素的效应，补骨1号的效应，以及它们共同作用的效应，本实验只安排了激素组，并没有安排单用补骨1号组，因而在实际分析时就不能将两因素之间可能存在的交互作用的效应反映出来，而有可能将其交互作用的效应归结为单用补骨1号的效应。应再安排一组单用补骨1号组，这样就有四个组，为两个因素各有两个水平的四种组合，这样

13、的设计类型为两因素析因设计，不仅可以分析出各因素单独的效应，而且可以分析出因素之间可能存在的交互作用的效应大小。,举例,原文题目：肝炎灵联合丹参注射液治疗慢性乙型肝炎60例，慢性乙型肝炎病人随机分为两组，治疗组60例，接受肝炎灵与丹参注射液联合治疗，对照组44例，接受肌苷、维生素C的治疗，两组在性别、年龄、病程、病情等方面均无显著性差异。比较两组肝功能指标恢复正常率，得出结论：两药联合应用治疗慢性乙型肝炎有良好的协同作用。,从文中可以看出，原作者的目的是想通过两药合用看是否能增加单用药的疗效，但对照组却选择了不相干的肌苷和维生素治疗。即使通过分析治疗组比对照组疗效好，也不能得出两药合用比单用其

14、中一种药疗效好的结论，因为原作者对对照组的处理与实验设计的目的不符，并没有用单用肝炎灵作为对照。结论仅是作者的主观臆断，是没有说服力的。,举例,原文题目：糖尿病患者血清肌酸激酶变化的意义，随机选择住院的非胰岛素依赖型糖尿病患者110例，根据临床常规检查分为：(1)血管病变组（组），(2)无血管病变组（组），(3) 组中血糖控制良好者（组），(4) 组中血糖控制良好者（组）。测定各组糖尿病患者血清肌酸激酶等指标，并进行比较，说明血管病变及血糖控制对指标的影响。,由上面可以看出，组包含在组里面，组包含在组里面，假如血管病变组中血糖控制良好者较少，而无血管病变组中血糖控制良好者较多，如果两组比较肌酸

15、激酶有差别，则不一定就是血管病变的原因，而可能是两组中血糖控制良好者构成不同而引起的，这样得出结论也是不可信的。,举例,原文题目：酒精对小鼠体质影响的初步研究，目的：探讨酒精对动物体质的影响。方法：选用雌雄昆明小鼠各30只,体重2030。雌雄小鼠随机分为3组。分别以纯水、5%酒精、10%酒精为唯一饮料连续喂养60，然后测算动物的体重增加量。结果：随着酒精浓度提高，雄性小鼠的体重增加量显著变大(0 05),而雌性小鼠变小(0 05)。,分析：根据常识，动物的进食量对体重的增长具有重要作用，如果不同组小鼠进食量不同，即使分析出各组小鼠体重增加量不同，仍不能说明单是酒精的作用。应在实验设计时，结合

16、专业知识，考虑重要的非实验因素对实验结果可能带来的影响，以免因考虑不周，到实验结束时无法弥补而导致整个实验的失败。本资料在实验设计时，应考虑小鼠进食量不同对体重增加量可能带来的影响，在实验时记录小鼠每天的进食量，这样可通过协方差分析，消除各组小鼠进食量不同所造成的影响，从而更清楚地表现不同浓度酒精对小鼠体重增加量的影响。,原文题目：小剂量干扰素加三氮唑核苷治疗流行性乙型脑炎99例分析，有人在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎99例，采用同期的、接受一般治疗的73例该病患者作为对照。治疗组中轻型29例，普通型40例，重型22例，极重型8例；对照组73例，轻型18例，普

17、通型32例，重型17例，极重型6例。两组病人均采用传统降温、镇静、降颅内压、肾上腺皮质激素及抗生素预防感染等对症治疗。在此基础上治疗组选择发病在5天以内的病人，加用干扰素和三氮唑核苷静滴，疗程5-7天。两组比较疗效差别具有显著性意义，结论是在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎的疗效优于一般治疗的疗效。,举例,作者在比较时考虑到了病情的严重程度可能是影响疗效的一个影响因素，因此在两组中对病情严重程度作了安排，经卡方检验，两组在病情严重程度的构成上的差别没有显著性意义，好象具有了可比性。其实不然，作者人为地选择发病在5天以内的病人进入治疗组，而对照组则没有此限制，根据常

18、识，早期治疗对疾病的预后具有重要影响，往往具有较高的治愈率和较低的病死率。因而治疗组和对照组由于人为因素的干扰和影响，在病程这一重要的非实验因素上并没有达到均衡，不具有可比性。,举例,分析：根据病理常识，硬结预后与年龄、病程及硬结本身的大小都有很大关系（年龄小、病程短、硬结小，预后相对好）。从资料可以看出，研究对象年龄跨度大（从18个月到68岁），病程差距大（从1周到15年），并且硬结的大小也存在较大的差距（1cm1cm5cm7cm）。原作者对采取何种方法使重要的非实验因素在各组间达到均衡未作任何说明，只是一味地将三组拿来直接进行比较，如果均衡性原则掌握得不好，则有可能结论的可靠性不高甚至得出

19、错误的结论。在进行试验之前，最好进行完善的试验设计，明确所要考察的实验因素，受试对象，所观察的指标，以及对试验结果可能产生影响的重要的非实验因素，务必使各重要的非实验因素在各组间尽量达到均衡一致，这样得出的结论才具有较强的可信性和说服力。,举例,此资料中原因变量（组别）是名义变量，结果变量（疗效）是有序变量，因而属结果变量为有序变量的单向有序列联表资料。因一般2检验与变量的有序性没有联系，用一般2检验进行分析，得到的结论是两组疗效的频数分布是否相同，而不能得出两组疗效的差别是否具有显著性意义的结论。,举例,原文题目：学习困难儿童视觉-运动整合发育测验分析，目的：探讨学习困难(LD)儿童视觉-

20、运动整合(VMI)发育状况,以及VMI与韦氏总智商、3因子智商相关关系。方法：采用BeeryVMI发育测验及中国韦氏儿童智力量表,对60名年龄在712岁LD儿童进行个体测试。结果：LD儿童均有VMI能力发育落后,比实际年龄落后15%45%；与数学成绩的相关系数为0.305(P0.05)。VMI测验结果与韦氏智力总智商、3因子智商相关性分析,与B因子相关性较高,相关系数为0.384(P0.01)。结论：LD儿童视觉-运动发育明显落后,在智力正常但有学习困难的儿童中进行VMI测试可以判断儿童有关学习能力缺陷的有无和程度。对儿童学习能力的预测和早期干预有较高的价值。,尽管对相关系数作假设检验后认为相

21、关系数有统计意义，但并不意味着这种相关关系就一定具有实际意义，要结合确定系数作出解释，确定系数是相关系数的平方r2,其意义是：因变量的变异（离均差平方和）中有多大比例是与自变量变化有关的。本例中VMI测验结果与数学成绩的相关系数的大小为0.305，其确定系数为0.093，说明VMI测验结果的变化中大约有9%与数学成绩有关，或者说还有约91%与数学成绩无关，可见这种关系并不密切。,举例,原文题目：中老年人脂肪肝与并存病关系，对435例45岁以上受检人员进行B超检查，检出脂肪肝患者102例，非脂肪肝人员333例，原作者据此将受检人员分为两组，即脂肪肝组和非脂肪肝组，同时还对受检人员检测了空腹12h

22、血糖、总胆固醇、甘油三酯、血尿酸。并对两组人员的血糖、总胆固醇、甘油三酯和血尿酸进行比较，采用t检验，脂肪肝组与非脂肪肝组的血脂、血糖和血尿酸水平比较有非常显著性差异（P0.01），表明血脂、血糖和血尿酸的增高程度对脂肪肝的形成产生一定的影响，尤其是甘油三酯的水平起重要作用。,对于观察性研究来说，由于没有或不能对观察对象进行随机分组，单纯假设检验不能解决混杂和偏倚的问题，也不能说明事件的先后顺序，因此不能直接推论因果关系，只能推论关联。本资料中的脂肪肝组和非脂肪肝组，假如存在某些混杂因素，如两组的年龄或生活习惯等不均衡，则在推论时很难说清是混杂因素的存在还是确实是脂肪肝的原因而造成血液指标的不同。另外，根据专业知识，脂肪肝形成后，其血液指标一般也要发生变化，本研究并不能说明血液指标是在脂肪肝形成前发生变化还是脂肪肝形成后发生的变化，而推论因果关系则要求原因在前，结果在后，从这点上来说，也不能主观地推论血脂、血糖和血尿酸的增高对脂肪肝的形成产生一定的影响。,

展开阅读全文