医学统计学总结课件.ppt

上传人:scccc 文档编号:11857004 上传时间:2021-10-01 格式:PPT 页数:49 大小:103KB
返回 下载 相关 举报
医学统计学总结课件.ppt_第1页
第1页 / 共49页
医学统计学总结课件.ppt_第2页
第2页 / 共49页
医学统计学总结课件.ppt_第3页
第3页 / 共49页
医学统计学总结课件.ppt_第4页
第4页 / 共49页
医学统计学总结课件.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《医学统计学总结课件.ppt》由会员分享,可在线阅读,更多相关《医学统计学总结课件.ppt(49页珍藏版)》请在三一文库上搜索。

1、医学统计学总结,1,医学统计学总结,医学统计学总结,2,统计学的任务,结合专业知识和具体要求进行统计研究设计 按照设计要求收集和整理资料 对所收集的资料进行统计处理 对统计处理的结果进行分析和解释,医学统计学总结,3,统计结果是否可靠取决于以下几个方面,调查或实验设计是否周密完善,是否按设计要求实施 所选用的指标是否特异性和客观性强,灵敏度和精确度高 数据是否真实可靠,样本含量是否足够大 所选用的统计方法是否妥当 结果解释是否正确,医学统计学总结,4,选择统计分析方法流程,研究目的,设计类型,资料类型,统计分析目的,病例分析 疗效分析 寻找病因 关系探讨 调查研究:横断面研究 回顾性研究 前瞻

2、性研究 实验研究:完全随机设计 随机区组设计 定量资料 定性资料 等级资料 统计描述 :统计表 统计图 统计指标 统计推断:参数估计 假设检验,医学统计学总结,5,统计分析方法,运算,报告,见后 手工运算 统计软件:SAS SPSS 统计结论 专业结论,医学统计学总结,6,医学统计学学习要点,统计学的基本概念和思维逻辑 各种统计方法适用于什么资料,对于资料所要求的条件 根据资料的性质和分析要求,应选用什么统计方法 如何组织数据,输入数据,建立数据文件 如何运用计算工具或软件进行统计计算 如何阅读软件的输出结果,选择所需要的部分写入论文 如何正确分析统计结论,医学统计学总结,7,单变量定量资料统

3、计描述,频数表(n较大时) 频数分布图(直方图) 统计指标 正态分布或近似正态分布资料:均数标准差 倍数资料;对数正态分布资料:几何均数几何标准差 偏态分布;分布未知;分布末端有不确定数据:中位数四分位数间距 度量衡单位不同或单位相同但均数相差悬殊的多组资料变异度比较:变异系数,医学统计学总结,8,单变量定量资料统计推断参数估计,总体均数点估计: 总体均数区间估计: n较小时: n较大时: 注意可信区间和参考值范围的区别,总体 ,样本,医学统计学总结,9,单变量定量资料统计推断假设检验,1. 样本均数与总体均数比较,样本来自正态 分布或变换后 为正态,t检验,Wilcoxon 符号秩检验,Y,

4、N,医学统计学总结,10,单变量定量资料统计推断假设检验,2. 配对设计两均数比较,差值正态或 变换后正态,配对t检验,Wilcoxon 符号秩检验,Y,N,医学统计学总结,11,单变量定量资料统计推断假设检验,3. 完全随机设计两均数比较,正态性 方差齐性,两样本t检验,近似t检验 Wilcoxon 秩和检验,反应变量为生存时间 且含有截尾数据,log-rank检验,Y,N,医学统计学总结,12,单变量定量资料统计推断假设检验,4. 完全随机设计多均数比较,正态性 方差齐性,完全随机设计 方差分析,Kruskal-Wallis 秩和检验,反应变量为生存时间 且含有截尾数据,log-rank检

5、验,Y,N,医学统计学总结,13,单变量定量资料统计推断假设检验,5. 随机区组设计多均数比较,正态性 方差齐性,随机区组设计 方差分析,Friedman 秩和检验,Y,N,医学统计学总结,14,单变量定量资料统计推断假设检验,6. 多个样本均数的两两比较 完全两两比较:SNK法 部分两两比较: 多个实验组与一个对照组比较 LSD法;Duncan新法,医学统计学总结,15,定量资料分析中常见的错误,误将定量资料判为定性资料 为探讨雌激素受体(ER)、孕激素受体(PR)在小儿皮肤血管瘤发生、发展中的意义,采用免疫组化方法对毛细血管瘤、海绵状血管瘤、淋巴管瘤及正常皮肤组织的ER、 PR受体进行检测

6、。全部标本经10福尔马林固定,常规石蜡包埋。每例选一典型蜡块,4-6m切片,进行免疫组化染色,高倍镜下每例肿瘤区内计数500个细胞,计数ER、 PR阳性细胞百分率,此阳性细胞百分率为定量资料而不是定性资料。,医学统计学总结,16,定量资料分析中常见的错误,忽视t检验、方差分析的前提条件 直肠癌手术前后3项肿瘤标志检测结果 不同时期 CEA CA19-9 CA71-4 术前(n=58) 34.079.0 209.0 739.0 7.2 4.8 术后(n=30) 2.0 1.2 11.0 10.9 4.3 2.8 转移复发(n=19)88.0 107.0 212.0 529.0 9.8 3.2 此

7、资料中若干个单元格中标准差的数值是均值的2倍以上,基本可以认为不服从正态分布,而且不同组间标准差也相差悬殊,也不满足方差齐性的要求,所以不宜采用方差分析。,医学统计学总结,17,定量资料分析中常见的错误,误用多次t检验进行多组均数之间的比较 三菱莪术液抑癌实验的小鼠瘤重(g) 组别 均数标准差 对照组 4.66 1.01 0.5ml 2.50 0.93 1.0ml 2.46 1.18 1.5ml 1.87 1.16,医学统计学总结,18,定量资料分析中常见的错误,误将方差分析结论加以扩展 方差分析结果P0.05,只能认为多组均数总的说来有差别,并不能说明它们两两之间都有差别,须进一步作多组均数

8、的两两比较。,医学统计学总结,19,单变量定性资料统计描述,常用的相对数:率,构成比,相对比 相对数应用注意问题 标准化法,医学统计学总结,20,单变量定性资料统计推断参数估计,总体率的点估计: 总体率的区间估计: 查表法 正态近似法:,医学统计学总结,21,单变量定性资料统计推断假设检验,1. 样本率与总体率比较 n较小时,基于二项分布的精确概率法 n较大时,单样本u检验 2. 配对设计两样本率比较 配对卡方检验(McNemar检验),医学统计学总结,22,单变量定性资料假设检验,3. 完全随机设计两样本率比较 u检验 卡方检验 Fisher精确概率法 4. 完全随机设计多个样本率或两个(多

9、个)构成比的比较 行列表卡方检验,医学统计学总结,23,单变量等级资料假设检验,1. 完全随机设计两组比较 校正的Wilcoxon秩和检验 2. 完全随机设计多组比较 校正的Kruskal-Wallis秩和检验,医学统计学总结,24,RC列联表资料的统计分析,1. 双向无序RC表 行变量、列变量皆为分类变量且属性不同 目的:两分类变量有无相关关系 方法:卡方检验; Fisher精确概率法,医学统计学总结,25,ABO血型 MN血型 M N MN 合计 O 431 490 902 1823 A 388 410 800 1598 B 495 587 950 2032 AB 137 179 325

10、641 合计 1451 1666 2977 6094 两种血型系统之间互相独立,即具有ABO血型系统中某种血型的人,用MN血型系统来划分时,属于M、N、MN血型的可能性几乎相等,没有确定的倾向性。,医学统计学总结,26,2. 单向有序RC表 一个变量为分组变量,其效应变量为有序变量 目的:不同处理因素效应(有序)有无差别 方法:秩和检验 3. 双向有序且属性不同的RC表 行变量、列变量皆为有序变量且属性不同 目的:两变量有无相关关系(两变量地位平等);两变量有无线性变化趋势(一为自变量,一为应变量);多组间效应有无差别 方法: Spearman秩相关分析; 线性趋势检验; 秩和检验,医学统计学

11、总结,27,4. 双向有序且属性相同的RC表 行变量、列变量皆为有序变量且属性相同 目的:两种方法测定结果的一致性 方法:Kappa检验(一致性检验),医学统计学总结,28,两法检查室壁收缩运动的符合情况 对比法 核素法测定结果 测定结果 正常 减弱 异常 合计 正常 58 2 3 63 减弱 1 42 7 50 异常 8 9 17 34 合计 67 53 27 147 两法检查结果具有一致性,医学统计学总结,29,定性资料分析中常见的错误,值计算错误导致结论错误 两种手术并发症的比较 手术方式 例数 并发症例数 并发症发生率 手术I 71 (a) 12 (b) 16.9% 手术II 57 (

12、c) 18 (d) 31.6%,医学统计学总结,30,定性资料分析中常见的错误,误用 检验取代Fisher精确概率法 两种方法治疗急性湿疹病人结果 分组 有效数 无效数 合计 有效率() 试验组 12 1 13 92.31 对照组 3 8 11 27.27 合计 15 9 24 62.50,医学统计学总结,31,定性资料分析中常见的错误,对RC表资料直接分割进行两两比较 误用 检验分析单向有序RC表 误用 检验回答两有序变量的相关性 误用 检验分析双向有序且属性相同的RC表,医学统计学总结,32,双变量统计分析,1. 直线相关(线性关系),双变量 正态分布,Pearson 积差相关分析,Spe

13、arman 秩相关分析,Y,N,医学统计学总结,33,双变量统计分析,2. 直线回归(线性关系) I型回归:Y服从正态分布 X为控制变量 II型回归:Y服从正态分布 X为随机变量 X、Y服从双变量正态分布,医学统计学总结,34,双变量统计分析中常见的错误,误对I型回归资料作相关分析 “高效毛细管电泳法测定血浆中布比卡因的浓度”一文中,采用毛细管电泳法,于0.5ml空白血浆中分别加入0.05、0.1、0.2、0.3、0.4、0.5g的布比卡因进行测定,作者以样品峰的峰面积与内标峰的峰面积之比(Y)对样品量(X)进行统计分析,线性关系良好(r0.99)。 本资料的自变量是人为选定的布比卡因的浓度,

14、并不是随机变量,因而属于I型回归资料,并不适合作直线相关分析。可进行直线回归分析,求出回归方程,并进一步作假设检验,看两变量之间有无直线变化趋势。,医学统计学总结,35,双变量统计分析中常见的错误,散点图并不反映直线趋势,仍作直线相关分析 “高脂餐后内皮依赖性血管舒张功能变化及其影响因素”一文中,作者对75名受试者测定了餐后2h血清甘油三酯(TG)浓度增高值与餐后内皮依赖性血管功能下降值(),经相关分析,认为餐后2h血清TG浓度增高值与餐后内皮依赖性血管功能下降值显著正相关(r=0.459,P0.01)。 进行直线相关分析前,应绘制散点图。本资料散点图无明显的直线变化趋势,并不适合作直线相关分

15、析。另外决定系数R2=0.4592=0.21,说明餐后2h血清TG浓度增高值可解释餐后内皮依赖性血管功能下降值变异的21,即两变量之间的关系实际意义不大。,医学统计学总结,36,多变量统计分析,1. 应变量Y为正态分布数值变量 多重线性回归 2. 应变量Y为二分类(或多分类)定性变量或等级变量 logistic回归 3. 应变量Y为二分类结局变量和生存时间 Cox回归,医学统计学总结,37,多变量统计分析,用途: 多因素分析 平衡(调整)其它影响因素后的组间比较 预测预报,医学统计学总结,38,多变量统计分析中常见的错误,用单因素分析取代多因素分析 多变量筛选的策略错误 多因素分析时,先进行单

16、因素分析,再将有统计意义的变量进行多变量分析,这是一种错误的分析策略。单变量分析中表现的不仅是变量自身的作用,还可能有其它变量的混杂作用,其结果只起参考作用。在多元回归中每个自变量对应变量的贡献也与其它自变量是否被选入模型有关。正确的做法是考虑所有的变量,采用逐步回归方法,必要时多用几种筛选变量的技术,同时还要考虑因素之间的交互作用,综合分析,得出较为可靠的结果。,医学统计学总结,39,多变量统计分析中常见的错误,不会用多因素分析方法平衡混杂因素对结果的影响 例:分析急性白血病患者具有某种不良染色体是否与其缓解有关,可采用logistic回归平衡混杂因素如年龄、性别、骨髓原幼细胞数、cd34表

17、达等对缓解的影响。如同时考虑缓解时间,可采用Cox回归。,医学统计学总结,40,医学论文统计表达的基本要求,摘要 引言 材料与方法 结果 讨论,医学统计学总结,41,一、摘要 摘要是研究核心内容的浓缩,简述研究目的、方法、结果和结论。 摘要中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设检验结果(P值)。如处理组和对照组的均数(中位数)、标准差、率、 P值或两组均数(率)之差、95可信区间、OR(RR)值等。,医学统计学总结,42,二、材料与方法 除专业方面的描述外,统计学描述包括以下两个方面。 1. 清晰地描述研究设计的内容,包括研究类型、观察对象类型、入选和剔除标准、观察方

18、法和测量技术以及实验、试验或调查资料的搜集过程等。尤其应具体地描述研究对象的来源和选择方法、包括观察对象的基本情况、有无随机分组(随机抽样)、样本含量及其估计的依据等。若进行了随机化分组,应说明具体的随机化方法。对于非随机化分组的观察性研究,除要明确说明观察对象的选择方法外,还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。对临床试验,还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、有无失访及失访的比例、有无“知情同意”、是否盲法观察等。,医学统计学总结,43,2. 说明所采用的统计分析方法与统计计算软件。数据处理用到的所有统计方法都要说明。如果用了几种统计方法,必须清

19、楚地指出在何处用了何种方法。常用的统计方法简单说明即可,如t检验、单变量方差分析、卡方检验等,对一些特殊的统计方法,如生存分析、重复测量资料方差分析、协方差分析等,要同时给出相应的参考文献。统计计算软件一般给出名称即可,如SPSS、SAS等,但对于一些特殊的计算,要给出软件的过程名,如重复测量资料方差分析采用SPSS/GLM等。,医学统计学总结,44,三、结果 统计结果主要用统计指标(统计量)表示。统计指标比较多时,如分组比较,要借助统计表和统计图。 假设检验的结果表达 不能仅仅给出P值,还要求给出检验统计量的值,如t值等。由于统计软件的普及,提倡报告P的具体数值,如P=0.018或P=0.4

20、36等。,医学统计学总结,45,四、讨论 统计结果的解释主要集中在论文的“讨论”部分。作者往往要在“讨论”部分引用统计结果作为支持其新发现、新结果、新观点的统计学依据,对统计结果理解和解释上的偏差,可能导致结论上的错误。,医学统计学总结,46,1. 假设检验结果的解释 即使疗效显著,当观察的数据很少时,也极有可能出现无统计学意义的结果;相反,疗效差别很小时(如新药比对照药有效率仅提高了0.1),大样本数据也可能出现有统计学意义的结果。因此,有统计学意义并不等同于临床上的疗效显著。 P值越小,不能说明比较的两均数(或率)之间差别越大;也不能说明两变量的关系越密切。,医学统计学总结,47,2. 关

21、联与因果 在观察性研究中,变量间的关联或组间差别可能是因果关系,也可能是偏倚,确定因果关系需要根据专业知识进行进一步的分析。 在随机对照研究中,变量间的关联和组间差别可以解释为有概率保证的因果关系。 当变量都随时间变化时,变量间很容易出现虚假的相关关系,必须特别加以小心。,医学统计学总结,48,3. 数字变化 对于数字的增加可用倍数和百分数表示。如增加了2倍,即原来为5,现在为15;增加到2倍,即原来为5,现在为10;增加了20,即原来为5,现在为6。 对于数字的减少只能用百分数或分数表示。如降低了20,即原来为5,现在为4;降低到20,即原来为5,现在为1;减少了1/2,即原来为5,现在为2.5。,医学统计学总结,49,4. 缺陷或不足 要指出在研究设计和实施过程中有哪些缺陷或不足。若发现缺陷或不足,则应考虑这些缺陷或不足对结果和解释可能产生的影响。不能对缺陷或不足视而不见,更不能寄希望于不被读者发现。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1