流行病学资料的收集分析与表达.ppt

上传人:本田雅阁 文档编号:2814445 上传时间:2019-05-21 格式:PPT 页数:133 大小:5.85MB
返回 下载 相关 举报
流行病学资料的收集分析与表达.ppt_第1页
第1页 / 共133页
流行病学资料的收集分析与表达.ppt_第2页
第2页 / 共133页
流行病学资料的收集分析与表达.ppt_第3页
第3页 / 共133页
流行病学资料的收集分析与表达.ppt_第4页
第4页 / 共133页
流行病学资料的收集分析与表达.ppt_第5页
第5页 / 共133页
点击查看更多>>
资源描述

《流行病学资料的收集分析与表达.ppt》由会员分享,可在线阅读,更多相关《流行病学资料的收集分析与表达.ppt(133页珍藏版)》请在三一文库上搜索。

1、第八章 流行病学资料的收集分析与表达,内 容,第一节 资料的收集与整理 第二节 资料的描述性分析 第三节 资料的推断性统计分析 第四节 资料的表达,(一)资料的收集,资料的收集(data collection)过程,就是按照研究设计所拟定的方法与过程,通过对研究对象的观察及实验,测量并记录其结果,以形成研究的效应的原始统计数据。,第一节资料的收集与整理,1.资料来源 根据信息来源可将数据分为三类:,2、收集计划包括:,选择收集资料的地点、人员和时间; 收集资料人员的培训方案; 预调查或实验方案的拟定; 资料的记录方式; 调查表的拟定和印刷; 调查或实验仪器、试剂的准备; 调查资料的抽样复核比例

2、和方法; 收集资料所需经费的准备等。,调查表的构成,标题:概括说明调查的主题。应简明扼要,易引起回答者的兴趣。 说明:简短的指导或说明信。目的,意义,填表须知,交表时间,地点。 被访者基本情况:社会人口学特征:性别,年龄,民族,家庭人口,婚姻,文化程度,职业等。 调查主要内容 编码:调查表编码号,调查项目编码,回答选项编号 过录框。 作业证明的记载:调查员:姓名,调查日期,时间等,电话号码,确定每个项目的提问形式和类型 直接性 假设性 问答题 间接性 开放性 问答题 封闭性 半封闭性,直接性问答题:是指在调查表中能够通过直接提问方式得到答案的问答题。直接性问答题通常给被访者一个明确的范围,所问

3、的是个人基本情况或意见。例如:“您的性别?”,“您的文化程度?”,间接性问答题是指那些不便直接询问的问答题(通常是会让被访者产生顾虑、不敢或不愿真实地回答的项目),常采用间接提问的方式得到所需回答。,假设性问答题:是通过假设某一情景或现象存在而向被访者提出的问答题。例如:“有人认为目前医疗费上涨太快,您的看法如何?”,“如果您可以选择,您愿意生一个、两个还是多个孩子?”,开放性问答题:是指所提出的问题并不列出所有可能的答案,而是由被访者自由作答。 如:您没有去看病的原因是什么? 优点:适用于较深层次问题的探讨,有利于调动调查对象的主动性,便于获取更丰富的建设性的信息。 缺点:答案无法预估,种类

4、繁多,容易离题,拒绝回答率较高,费时,费力,所收集的数据不易整理和分析,难以进行相互比较。,封闭性问答题:是指已事先设计了各种可能的答案、被访者只要从中选定一个或几个现成答案的提问方式。 优点:答案统一、标准、易回答,节约时间,拒绝回答率很低,汇总归纳方便。 缺点:被访者只能在规定的范围内回答,可能无法反映其他各种真实的想法。此外,它的设计受设计者相关知识范围影响。,半封闭性问答题:是设计者根据可能情况提出固定答案备选,做出回答后,进一步表述调查对象的看法与认识。如 您生病后去地段医院就诊吗? 是 否 请说明其主要原因,调查表制定中的注意问题,说明要简单明了,打动人心; 避免用不确切的词:如“

5、很久”、“经常”、“一些”等;如:您是否经常生病? 地点?您在哪儿出生? 避免提断定性问题;您一天抽多少支烟? 应在前面加上“过滤性”问题。,调查表制定中的注意问题,避免提双重、双否定的设问:如:您赞成还是反对医疗费用支付方式是投保记账或现金支付?赞成反对 双重设问 正确的是:您对医疗费用改革的态度是赞成反对; 您愿意采纳那种医疗费用支付方式?现金支付投保记账 如:医院管理者不重视医院急诊工作不是一个重要问题,您同意吗? 完全同意同意未决定不完全同意反对 医院管理者是否重视医院急诊工作时一个重要问题,,调查表制定中的注意问题,避免引导性(诱导式)提问:暗示; 如:询问术后病人情况时,问“佩戴这

6、个止痛盒后,疼痛比以前减轻了吧?”有人认为被动吸烟会导致肺癌,您同意吗?”大忌,偏倚 避免令被访者难堪和禁忌的敏感问题 (1)释疑法 (2)假定法 (3)转移法,调查表制定中的注意问题,避免提笼统、抽象或不确切的问题:年龄、收入、家庭人口等; 避免一问多答的问题:您的父母是知识分子吗 注意提问的顺序: 先易后难;从简单到复杂;封闭性问题在前,开放型问题在后;专业性强、敏感性问题在后,注意逻辑顺序。 定量指标最好定量调查,不行的话可设计成半定量指标。,3、收集资料的方式,观察法 采访 询问 直接 开会 询问法 访谈 信访 间接 电话 电子邮件,资料的测量方法,查体法:临床医生凭借生物感觉对病人的

7、体征进行观察,如望闻问切。 仪器测量法:身高计、体重计、血压计、超声波、心电图、CT。 实验室测量:通过化学、生物化学、微生物、血清学、免疫学等实验对病人的生理病理现象进行测量。血液检查、尿液检查、肝功能检查等。 询问法:如疼痛、头昏、失眠、关节僵硬、呼吸困难、咽部不适、忧郁、压抑等,目前尚无较好的客观定量测量方法,主要是通过询问或问卷的方式,由病人根据自己的主观感觉做出回答,4.要求,真实性 系统性和完整性 深刻性,5.基本原则 收集资料要遵循的原则,坚持实事求是 注意分析研究 采用科学的方法和技术 注重研究对象的利益、符合伦理,(二)资料的整理,整理资料(data sorting)是将原始

8、资料进行科学加工,去粗取精,去伪存真,净化原始数据,使其系统化、条理化,便于进一步计算和分析。 在数据分析前需要对原始的流行病学调查研究数据进行一次审查,发现可能存在的错误、遗漏的研究变量取值和其他问题,并采取相应的措施进行处理。,回忆变量的类型,数值变量(计量资料),变量类型,无序分类变量 (计数资料),分类变量,有序分类变量 (等级资料),(一)计量资料(measurement data) 对每个观察单位用定量的方法测定某项指标的具体数值所得资料称为计量资料,又称定量资料(quantitative data),亦称数值变量(anumerical variable)。这类资料一般有度量衡单位

9、。例如每个观察对象的血压(kPa)、脉搏(次/分)、身高(cm)、体重(kg)及临床上诸多定量检测指标的检测结果,都属于计量资料。,离散型变量(discrete variable):只能取整数值的变量,如一月中的手术病人数,一年里的新生儿数 连续型变量(continuous variable):可以取实数轴上的任何数值,多数由测量而得,如血压、身高、体重、ALT等,(二)计数资料(enumeration data) 将观察单位按性质或类别分组,然后清点每组的个数所得资料称为计数资料,又称定性资料( qualitative data ),亦称分类变量 (categorical variable)

10、。这类资料一般没有度量衡单位,所得数据是各组观察单位的个数。例如药物治疗的有效人数与无效人数;化验结果的阳性人数与阴性人数;某病的患病人数与未患病人数;某人群中A、B、AB、O各种血型的人数及临床上诸多定性检测指标的检测结果,都属计数资料。,(三)等级资料(ranked data) 将观察单位按某种属性的不同程度分组计数,得到各组观察单位个数,称为等级资料。等级资料具有计数资料的性质,又兼有半定量的性质,因其按等级大小排序,有人亦称之为有序分类变量(ordinal categorical variable)。例如疗效考核中的治愈、好转、未愈、死亡;症状中的重、中、轻、无;某些检测结果中的、等,

11、都属等级资料。 三种资料可以转化,3.等级资料(ranked data),亦称有序变量(ordinal variables) 是将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数。 等级资料具有计数资料的性质,又兼有半定量的性质,因其按等级大小排序,有人亦称之为有序分类变量(ordinal categorical variable)。例如疗效考核中的治愈、好转、未愈、死亡;症状中的重、中、轻、无;某些检测结果中的、等,都属等级资料。,1.资料核查(data cleaning),完整性核查:对调查表全部项目进行检查,核对填写是否完整无缺,如有漏项,应立即补填。完整性检查应在调查现

12、场进行,否则难于弥补。(随时对资料进行核查) 逻辑核查法:主要检查逻辑上的矛盾。如出生日期与死亡日期的矛盾等。 对数据变量要检查其最小值(minimum)、最大值(maximum)、均数(mean)、中位数(median),并查看是否有异常取值(outlier),如极小值及极大值。 异常值若影响显著时应删除,2. 资料的数量化, 数值变量资料则可以直接用原始数值; 二分类变量一般以0和1表示; 多分类的变量数值化方法比较复杂: 若某多分类变量为有序变量,我们可参照等级变量赋值,但排序时应慎重,应有充分的排序依据。 若多分类为变量为无序变量,可考虑将其拆分成几个二分类变量分别分析。,如:分类变量

13、种族 白人1 黑人2 西班牙裔人3 亚太裔4 其它种族5 注意: 分类变量在进行多因素分析时,必须转换成哑变量(dummy variable),不能直接将前述的取值1、2、3、4、5放入方程中进行分析。,有序变量的数量化顺序合理,则可以直接进行分析 如:教育程度 文盲:0 小学:1 中学:2 高中及中专:3 大学:4 硕士及以上:5,变量的转化: 只能由高级向低级转化,不能作相反方向的转化 连续变量 有序变量 无序变量 二分类变量,3.资料的分组,绝大多数研究都需要对资料进行分组,以便进行组间比较或更细致的描述。 若利用计算机分组,就应在建立数据库时给以相应的数字标识,统计分析时计算机可按指令

14、迅速自动分组,并整理出频数。,分类变量: 按其原有的分类进行分组,若有必要,可将性质相近或差别不大的类别进行合并。如按教育程度、性别分组。,数值变量: 按照实际的生理、病理或临床意义分组,如体重指数:低体重、正常体重、超重和肥胖 按使用的方便程度和专业上惯用的方法分组,如年龄在某一个合适的范围内每5岁或10岁分成一组。 按分位数分组,即首先找出四分位数(quartile)或五分位数(quintile)的界值,然后应用这些界值将研究对象平均分成4组(每组25%的研究对象)或5组(每组20%的研究对象)。,(二)数据的转换 1、非正态数据的变量转换 原理: 正态分布 参数检验(parametric

15、 test) 非正态数据非参数检验(non-parametric test) (不是对原始数据检验)如:秩和检验 (是对原始数据的秩次检验) 检验:正态性检验、方差齐性检验 方法:对数变换;平方根变换;倒数变换,2、分类变量转换成哑变量 原理: 分类变量是二分类尺度及顺序尺度,则可直接应用其原有的数量化数值。 名义尺度因为各类别间没有顺序关系,在进行不同分析(包括多元分析、logistic回归、Cox回归等)时,不能使用原始的计算机录入数值,必经进行变量转换。即将该变量转换成(水平数-1)个哑变量,再将这些新转换的变量放入多因素模型中。,方法: 例如:将种族原始取值转换成哑变量(新变量) 表1

16、. 分类变量转换成哑变量的方法,新变量以白人为参照,X11表示黑人与白人比较,依此类推,统计方法分类,根据研究目的分为: 统计描述 (statistical description) 统计推断(statistical inference),复习,第二节 资料的统计描述,一、统计描述的方法 一、资料基本情况的描述 二、主要研究项目的描述性统计分析,描述数值变量资料的统计指标,复习,描述分类变量资料的统计指标,一、资料基本情况的描述,(一)应答率(response rate) 失访率(loss rate) (二)基本特征,(一)应答率或失访率, 现况调查研究和病例对照研究的资料 应答率反映调查资料

17、的完整性和纳入统计分析样本的代表性。 一般要求应答率在85以上。 队列研究的资料 失访率 由于某种原因导致被试验对象中途退出 失访率最好控制在15以内,(二)基本特征,被观察对象的人口学特征: 性别、年龄别构成、职业分布特点、民族构成等; 其次,描述某种现象或事物的特征:如糖尿病的类型、病情、病程等构成情况,主要研究项目的描述性统计分析,调查研究或实验研究都需要对主要观察项目进行描述性统计分析(descriptive statistical analysis),以便使读者了解主要观察指标的高低及分布情况。 根据研究内容不同,通常描述性统计分析多从疾病或健康状况、研究因素等方面进行描述。,案例1

18、:,刘卓等人在“非典”流行高峰在武汉市四所大学对本科生进行了健康相关行为的调查。鉴于篇幅所限,摘录部分基本特征分析(如表8-18-2)与研究项目分析(见表8-3)。通过阅读这些统计表可以清楚地了解到当时调查的大学生性别、年龄等特征的分布以及健康相关行为特点。,表8-1 大学生性别、年龄分布,表8-1 大学生性别、年龄(岁)分布,表8-2 武汉市大学生各专业年级分布,表8-3 “非典”流行高峰时期的大学生行为,常见错误,双氢青蒿素与磷酸喹哌治疗恶性疟疗效比较,测量1000例高脂血症患者的血脂水平: 单纯高胆固醇血症(80例):患病率8% 单纯高甘油三酯(760例):患病率76% 两者均增高(16

19、0例):患病率16%,常见的统计学错误,描述性分析中常见的错误 计量资料:误用正态分布的描述性统计指标描述呈偏态或几何分布的资料。 计数资料:错误的将构成比当做率使用 错误的计算平均率 计算相对数时分母过小,第三节 资料的推断性统计分析,一、统计推断的方法 单因素分析 多因素分析 二、资料的重复性评价 三、研究结果的解释,一、统计推断,统计推断: 利用样本所提供的信息对总体进行估计或推断,主要包括 参数估计:利用样本指标估计总体参数。常用点估计和区间估计,如均数的可信区间、率的可信区间 假设检验:利用样本提供的信息比较两个或多个总体之间有无差别,如t检验、2检验等,资料的分析方法:,1.比较性

20、研究的数据分析 2.关联性研究的数据分析,1.比较性研究的数据分析,(1)标准比较法 (2)两两比较法 (3)多组比较法,(1)标准比较法,标准比较法,即把研究对象的某一特征与公认的,或者正式颁布的标准进行比较,即样本与总体的比较。比如,空气、水、食物中有害物质的浓度是否超过标准;某个人群的身高体重是否与一般人群不同等。,偏态分布用秩和检验,(2)两两比较法,对于计数资料,当样本含量n较大,样本率P与(1-p)均不太小时,样本率的分布近似正态分布。可用u检验。 当不满足u检验的条件时,若样本含量大于等于40,并且理论频数大于5时,可用卡方检验,若1T5,采用校正卡方检验,若n40或T1,用精确

21、概率法 两组构成比比较,用行乘列卡方检验。 等级资料比较用秩和检验。,案例:,刘永有等人对吸毒患者进行心理干预,比较了干预前后的焦虑状况自评(SAS),见表8-6。从表中可以看出干预前两组的焦虑得分平均值差别无统计学意义,干预后与干预前后的差值的差别均有统计学意义。,(3)多组比较法,根据研究需要,有时要求同时比较某个变量在多个组之间的差异。如比较某种药物对多个不同群体的疗效。,对于计量资料,若为完全随机设计,当任何观察值都是独立地来自具有等方差的正态总体,采用完全随机设计的单因素方差分析; 若为随机区组设计,则采用随机区组设计的方差分析。 需要进行多个样本均数间的两两比较,常用的方法有LSD

22、-t检验、Dunnett-t检验、SNK-q检验等。 若不满足以上条件,则需要考虑非参数方法。,对于分类变量资料多组率或构成比的比较,可采用2K表或RC表的卡方检验资料的卡方检验,单应注意理论数小于1的格子数不能超过1/5,否则应采取增加样本含量等措施。,案例:,刘永有等人研究吸毒组与正常对照组之间职业构成的比较,表8-7。,2.关联性研究的数据分析,确定事物间的关系,定量表述事物间关系的方向、大小或强弱。如分析儿童的年龄与身高之间的关联性,吸烟与肺癌之间因果关系。,对于计量资料,两个变量或因变量服从正态分布,研究一个自变量对一个应变量影响的数量依存关系则用直线回归分析方法,计算回归系数与截距

23、,建立回归方程并进行显著性检验; 若通过绘制散点图发现两者的关系不呈直线关系,可考虑进行数据变换拟合非线性回归。,若需要说明变量间的直线相关关系,两个变量均服从正态分布,则用相关分析,计算Pearson相关系数,并检验相关系数的显著性;非正态双变量资料,可进行等级相关分析,计算Spearman等级相关系数与假设检验。,分类资料采用卡方检验,双向无序多项分类资料(RC表),除了采用卡方检验推测有无关联,还可以利用卡方值计算Pearson列联相关系数反映关联密切程度; 等级资料,采用Spearman等级相关或Kendall等级相关分析;有序分组资料可采用线性趋势检验。,案例:,马小玲等人研究了20

24、06年5月广州市某区的PM2.5(可吸入颗粒物浓度)与同期门诊病人关系,建立了非线性回归模型,见表8-8。从中可以看出病人数与PM2.5的关联程度较强。,表8-8 2006年1-4月各类门诊病人数与PM2.5关系的非线性回归模型,一、资料的组间均衡性检验,各种分析性研究的结论往往是从组间比较中得出的。 只有当各比较组人群之间研究因素以外的各种与研究结果有关的因素在组间都均衡可比时,所得研究因素在组间有无差异的结论才有说服力。,一、资料的组间均衡性检验,常需对某些特征(一般多为主要的混杂因素,如平均年龄、性别构成、病情构成等)进行比较组间的均衡性检验(差异显著性检验)。 通常,单因素显著性检验方

25、法即可满足均衡性检验的需要。,把这些统计学方法用在流行病学研究中,案例:,某研究者对某种违法行为的人进行预防复发的干预试验,评价研究结果时,首先对试验组和对照组的人口学特征进行比较(见表8-4)。从表8-4中可以清楚地看到试验组和对照组的性别构成、平均年龄和婚姻构成方面是均衡可比的。,表8-4 试验组与对照组人口学特征比较,二、单因素分析,寻找相关因素,如某种疾病或现象的发生是否与性别、年龄、职业等因素有关? 临床试验中,在组间均衡可比的前提下将试验组和对照组的统计指标进行单因素分析可判断试验效应是否由于试验因素所致。 常常采用多因素分析方法来分析各种因素的作用大小。,二、单因素分析,通常先将

26、所有变量做单因素分析,筛出可能的影响因素(P值小于某个界值的变量)纳入多因素分析。 此时的单因素分析不要求比较组间的均衡,因为混杂因素的干扰可在多因素分析中被排除,但要求放宽纳入变量的多因素分析标准,如规定P值小于0.10者可进入多因素分析,以防范负混杂的干扰。,案例:,何倩等人对某市大学生毒品尝试情况进行了调查,进行单因素分析,寻找尝试毒品的可能相关因素,见表8-5。从单因素分析表中可以看出性别、年龄、身体健康状况、睡眠状况等都可能与毒品尝试有关系。但是还需要进行多因素分析以判定在排除了其它因素的影响外,哪些因素仍然与毒品尝试有关系。,不同的影响因素下大学生毒品尝试率及其单因素分析结果,单因

27、素分析主要了解因素与结果之间有无统计学关联,并确定关联强度的大小。 计算关联强度指标,如相关系数、回归系数等;病例对照研究计算比值比(OR),队列研究计算相对危险度(RR)、和归因危险度(AR)等,计算可信区间和进行差异显著性检验。 等级资料,可对暴露效应随暴露级别的变化而变动的趋势做趋势性检验。,三、多因素分析,多因素分析可一次观察多个变量分别与因变量之间的独立关系以及变量之间的交互作用。 以多因素分析方法控制各种影响因素的作用,完成资料的统计分析。 该类分析方法多种多样,具体使用时一定要根据资料的特点、研究目的来选择适当的方法。,1.研究多个变量之间的相互关系,多元相关分析: 多个自变量与

28、一个因变量的相关关系; 计算复相关系数和偏相关系数并进行假设检验。 典型相关分析: 一组自变量(体质指标)与一组因变量(体能指标)之间的关系。,2.研究多个变量之间的依存关系,3.研究多个变量的内在结构,对于涉及到多因素的医学研究,常常需要了解所研究的多个变量之间的内在联系。通过变量内在结构的分析,就可以把这些变量依据它们内在的关系,客观地归纳为若干类。,并估计潜在因子对可测变量的影响程度以及潜在因子之间的关联性时,例如研究家庭环境、社会环境和学校环境对儿童智商的发育影响时,可以用因子分析;将样本个体或指标变量按其具有的特性进行分类的研究,可以用聚类分析。,4.研究变量之间的关系网,事物的特征

29、通过不同的变量体现出来。因此客观事物之间的关系就体现为多变量之间的、无比复杂的网状关系。对于这类分析,可以借用 路径分析方法和结构方程分析方法。,典型错误,统计推断中常见的统计学错误 计量资料: 忽视了t检验的使用条件 多个样本均数比较时错误的使用了t检验 误用t检验分析重复测量设计资料,计数资料 错误的选择了四格表卡方检验方法-未选用fisher精确检验法:n40,或理论频数1 错误选择了四格表卡方检验方法-未选用配对卡方检验,某研究者用反向血凝法和elisa法分别对230份乙肝病人的血液标本进行检测,反向血凝法检测得55份样本呈阳性结果,elisa法检测得到45份标本为阳性结果。,错误分析

30、等级变量资料 忽视了内部构成对两个或多个总率比较的影响,相关与回归分析常见错误,经样本求得的相关、回归系数要做假设检验判断两变量线性关系的密切程度要看r2的大小 两事物间有数量关系,可能是因果关系,也可能不存在因果关系,而仅仅是伴随关系。例如,调查某地区的电视机拥有量和肺癌死亡率,这些年来,每百家庭的电视机拥有量在不断增加,该地区的肺癌死亡率也在不断上升,两者在数量上是相关的,但看电视不见得是肺癌发病的原因。,多因素分析时常见的错误,多因素分析中常见的错误就是选用方法不当,如多元线性回归要求因变量呈正态分布,如果不符合正态分布则要用对数等方法进行转换以使符合或接近正态分布。而二分类变量要选用l

31、ogistic回归,如果因变量受时间的影响,则要考虑用cox回归。 再者在多元线性回归因素分析中,自变量高度相关时,应考虑多重共线性的问题。,四、资料的重复性评价,计数资料可计算两次调查结果的符合率或Kappa值,上述数值愈大表示一致性越好。 一般认为Kappa值在0.40.75时为有中、高度一致,大于0.75时为有极好的一致性。 计量资料,则可用相关系数表示两次调查结果的符合程度。相关系数越大,一致性越好。,五、研究结果的解释,P值(P value) 检验假设中的一个概率,它只能解释该统计分析结果支持无效假设成立的概率有多大 P值越小,推翻无效假设的概率就越大,即接受备择假设的概率就越大,无

32、论在哪个水平上接受无效假设( nullhypothesis) 还是备择假设( alternativehypothesis),都意味着要犯第一类错误(type error)或第二类错误(type error)的风险。 犯上述错误的概率,用a和b表示。也就是说,在a0.05水平上认为某治疗方法有效的同时,该疗法还有5的可能是无效的。,某人在北京郊区调查居民被狗咬伤的情况,结果显示:各年龄组中被狗咬伤的百分率是不同的,即:年龄由小到大,被狗咬伤饿百分率依次为:很小、较小、较大、很大、较大、较小、很小、较大。原作者的一个惊人的发现是:年龄与百分率之间的相关系数r=0.9956,p0.0001,因此拟合

33、的直线回归方程也是有非常统计学意义的。故原作者认为:在所调查的市郊,被狗咬者的年龄与被狗咬伤的百分率之间有很好的线性关系,可用此直线回归方程来预测该地任何一位居民被狗咬伤的概率,以便提醒人们外出时携带必要的防身器械,要加倍小心,尽可能减少被狗咬的机会。,第四节资料的表达,一、恰当选择统计图和统计表 二、论文撰写,一、恰当选择统计图和统计表,统计图(statistical chart)是将统计资料以几何图形形象化的表述,常以点的位置、线段的升降、直条的长短或面积的大小等形式直观表示事物间的数量关系,但表达比较粗略,常附相应的统计表。 统计表(statistical table)则能客观、准确、全

34、面、简捷地表达具体数据。统计图、表的有机结合可使文章简明易读、图文并茂,使读者印象清晰。,统计表,表格是用数字来代替复杂的文字叙述 统计表的结构,61,18,43,合计,32,14,18,甲硝唑,29,4,25,替硝唑,合计,未愈,治愈,分组,表1不同药物治疗急性冠周炎效果比较,标题,纵标目,横标目,表值,顶线,分隔线,底线,统计表种类 简单表:只按单一变量分组 组合表:将两个或两个以上变量组合起来分组,列表原则和基本要求 标题:概括说明表的内容,包括表的编号。标题应位于统计表的最上部 标目:分为纵标目与横标目。纵标目标示相应一列(或数列)的内容;横标目标示相应行的内容;文字简明,有单位的标目

35、要注明单位 线条:不宜过多,不允许使用竖线与斜线。表格上下用粗线,两端不封口,横线不超过四条 数字:一律用阿拉伯数字表示,同一指标的小数位数应一致,位次对齐,表内数字不宜留空格,可用“或”表示 注释:一律列在表的下方,可用“ * ”号等表示,表11.5 两个治疗组对比,表11.5 西药与中西药结合治疗急性心肌梗死并发休克患者的疗效比较,统计图,用形象化的资料补充文字之不足 制图原则: 按资料的性质和分析目的,正确选择图形 标题:位于图正下方,扼要说明资料的内容 条图、散点图、线图和直方图都有纵轴与横轴,每个坐标均有标目名称和单位 纵、横坐标比例应适当,以5:7为佳 比较不同事物时,用不同的线条

36、或颜色表示,要附图例说明。,各种图形的选择及应用 类型 资料的性质 目 的 线图 连续性 观察升降趋势 条图 间断性 观察大小高低 构成图(圆饼图) 整体性 观察构成比例 直方图(点状图) 连续性 观察分布状态 相关图 相关性 观察变量相互关系,线图(line graph),常用于研究某一事物的反应,有连续性,随时间的进展呈动态性变化,累积病死率,(),追踪年限(年),图31-1 两组高血压病患者5年累积病死率,条图(bar graph),常用于表示某种(些)独立事物的发生率,及其互相比较,脑卒中发病率,(),DBP (mmHg),图31-2 两组患者不同的舒张压水平5年累计脑卒中发病率,圆饼

37、图(circle graph),用于表示全体中各部分的比重,1200例高脂血症患者血脂类型分布,直方图(histogram),用于表示连续变量的频数分布,以横轴表示被观察现象,纵轴表示频数或频率,相关图,发硒(1000ppm),5.14 某克山病区10名健康儿童发硒与血硒含量的散点图,(5)统计地图:表示疾病的地理分布,二、论文撰写,(一) 科技论文的基本要求 (二) 科技论文的结构及要求,(一) 科技论文的基本要求,1.科学性 2.创新性 3.逻辑性 4.可读性 5.规范性,1.科学性,科技论文需要合理的设计、真实的数据、可靠的方法,不能凭主观臆断或个人好恶随意取舍素材或得出结论。论文中提出

38、的论点应是将充足、可靠和精确的数据进行逻辑推理而得出的科学观点。对研究成果的价值也应做出实事求是的评价。,2.创新性,Science认为,创新是指,对自然或理论提出新见解,而不是对已有研究结论的再次论证,内容激动人心并富有启发性,具有广泛的科学兴趣。 科技论文应具有完全创新性或部分创新性。创新性的含义是:探求新理论、新论点、新解释;观察新现象;研究新材料、新工艺、新方法,也包含在现有水平上对研究方法的订正、改进等。,3.逻辑性,一篇好的论文,除了要有好的研究成果外,还应该概念明确、判断恰当、推理严谨。论文内容不需要包含所有研究工作细节及研究数据,只需列举必要而充分的数据或证据即可。表述的内容是

39、否充分、恰当,以是否符合科学性和逻辑性为准。只有这样,方可使文章主题突出、脉络清晰。,4.可读性,写科技文章要用书面语言,不要用口头语、地方话和带有感情色彩的词语。一篇好的科技文章应该文字简洁通顺、层次分明、前后呼应、用词准确、符合语法和修饰的要求。科技论文的篇幅,一般在25003500字左右。 论文的篇幅不是越长越好,也不是越短越好。总的要求是,用尽可能少的篇幅,表达尽可能多的内容。,5.规范性,科技论文中的术语、缩写、符号等均应符合国家或行业的规定标准。如计算单位要按照GB31003120-93量和单位的规定表示;缩略语代表的术语全称应在前言中首次出现时写出并注明缩略语;简化字应以新华字典

40、为准。,(二)科技论文的结构及要求,国内外的生物医学期刊,基本上都按“温哥华格式”书写。该格式主要包括:文题作者摘要关键词引言材料与方法结果讨论总结致谢参考文献等部分。,1、文题:要求不超过20个汉字(最多30个),用一句话写完。标题太长可以加一个副标题,文题应包括文章的主要关键词,不应有标点,尽可能回避缩写、商品名等不常用的词。文题能反映出文章的特定内容和主题。 2、署名:原则上不超过五名,以担负工作的多少及实际贡献大小为序,不以职位高低为序。要用真实姓名,并标上作者单位和邮编;参与论文内容构思、研究、撰稿、答辩等工作人员均可以署名。,3、摘要: 内容包括:目的、方法、结果、结论。 A、一般

41、要求150250个汉字,也可以适当多些。 B、目的:为什么要作本研究 C、方法:研究对象,观察、治疗、护理、统计等 D、结果:研究的结果、效果、数据等 E、结论:对结果进行分析、推理而得的判断 F、结构严谨、表述简明、不分段落、不用图表、不用缩略语,4、关键词: 一篇论文35个为宜,最多不超过8个。关键词之间可用分号分开,也可以空一格,最后一个关键词后不用标点符号。关键词是最能反映文章主要内容的名词或词组,一般在论文中出现次数较多,也可能在文题及摘要中出现。关键词可以是主题词也可以是自由词。,5、前言: 前言也叫引言或序言,为论文开头的一段短文。一般200-300个汉字左右,内容包括立题依据,

42、研究的主要内容、方法、结果、意义等。 不要过多叙述历史、罗列文献、自我评价,要防止前后重复。,6、材料与方法: (1)材料:病例来源与数量,纳入标准、排除标准,病例组与对照一般情况;主要检测仪器等。 (2)方法:临床处理方法,随机化分组方法,疗效评价方法,统计分析方法等。 (3)注意点:本文研究的对象及所用的材料和采用的方法应详细,但要避免繁琐;凡属保证科学性的必要信息均应列出;药物、试剂和器械等要注明生产厂家、批号、型号等;运用别人方法时,应引用文献,若自己方法或改进部分应着重说明;随机和对照应明确介绍其方法;一般用文字叙述,必要时也可以列图表;物理量和单位计量符号应书定法定计量单位和符号。

43、,7、结果: 用文字、图、表等形式表达,重在“摆事实”原则上不做分析和评论,结果是论文的核心,反映论文的水平的高低。结果是结论的依据,为讨论做准备,导出推理。 注意:文字、图、表三者不能重复;照片是某些疾病治疗效果的客观记录,应有治疗前后对比;结果叙述应详细、确切,数据应归纳分析并进行统计学处理;对研究的新发现,新进展应重点介绍;阳性与阴性结果应客观介绍,不能随意摒除;评价结果的标准或疗效的好坏,一定要用国家或国际公认的标准,并注明出处。,8、讨论: 重在“讲道理”,可从理论上进行解释;也可和国内外同类研究结果进行对比分析,并解释异同点产生的可能原因,着重提出你的新发现、创新点。本次研究还存在

44、哪些问题,今后进一步探讨的领域或方向。 讨论是结果的逻辑延伸,是把结果提高到理论认识的部分,要求言之有理,论据充分。 注意:1)紧扣研究结果,不作空泛的讨论和超越限制的引伸;2)一定要突出作者的新发展与新认识;3)不应材料与方法和结果中的内容;4)引用前人的观点,罗列文献时应加以分析;5)讨论最后部分一般应有结论。,9、结论: 应与前言相呼应,一般200300个汉字。论文较短时,也可不写结论,将这部分内容与讨论结合写。 10、致谢:对论文的选题、构思、研究过程、撰写、经费等提供过帮助者,提出诚恳的致谢,致谢可以是单位、团体或个人。,11、参考文献: 1)自己全文读过,不宜转引文献; 2) 5-

45、10篇为宜; 3)引用原著为主,不引内部资料与非公开出版资料; 4)最好是近5年的文献,最主要的资料; 5)注意书写格式: 期刊:序号 作者(作者之间用逗号). 文题J. 刊名,年份,卷(期):起、迄页码 论著:序号 作者. 书名M.版次.出版地:出版社,出版年份;起、迄页码,目的要求,熟悉流行病学资料的统计研究的全过程、资料收集的原则和资料的整理。 掌握资料的分类,及其描述其集中趋势和离中趋势的指标的计算及适用条件;掌握统计图表的正确用法,统计图表的种类和编制的注意事项以及科学论文的结构。 熟练掌握常用的统计分析方法的应用条件;能够根据调查或实验的设计和资料的类型选择适当的统计推断分析方法。 了解其他多元分析方法的适用条件。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1