第四讲分类变量的统计描述率的标准误.ppt

上传人:本田雅阁 文档编号:3029817 上传时间:2019-06-27 格式:PPT 页数:59 大小:1.92MB
返回 下载 相关 举报
第四讲分类变量的统计描述率的标准误.ppt_第1页
第1页 / 共59页
第四讲分类变量的统计描述率的标准误.ppt_第2页
第2页 / 共59页
第四讲分类变量的统计描述率的标准误.ppt_第3页
第3页 / 共59页
第四讲分类变量的统计描述率的标准误.ppt_第4页
第4页 / 共59页
第四讲分类变量的统计描述率的标准误.ppt_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《第四讲分类变量的统计描述率的标准误.ppt》由会员分享,可在线阅读,更多相关《第四讲分类变量的统计描述率的标准误.ppt(59页珍藏版)》请在三一文库上搜索。

1、6/27/2019,1,第四讲 分类变量的统计描述,周 虹 公共卫生学院妇女与儿童青少年卫生学系,6/27/2019,2,基本内容,主要内容,一、分类变量概述 二、分类变量的统计描述 相对数 应用相对数的注意事项 动态数列 率的标准化 三、分类变量的统计推断 率的标准误和可信区间 2检验,分类变量定义 通过确定每个观察单位的某项特征的性质或类别得到的数据。 请大家举出研究中熟悉的分类变量的例子: 特点 变量值是定性的 没有度量衡单位,第一节、分类变量概述,类型 无序分类变量:二项分类变量、多项分类变量 有序分类变量 统计分析中的处理 赋值 数据转换 SPSS程序: Transform Reco

2、de Into different variables,1=“男性”,2=“女性”,出生体重(数值变量) 低出生体重、正常出生体重、巨大儿,练习SPSS中变量转换操作: (出生体重-率.sav数据库) 将出生体重从数值变量变成分类变量(低出生体重、正常出生体重、巨大儿),6/27/2019,7,第二节 分类变量的统计描述,一、常用相对数 二、应用相对数的注意事项 三、动态数列 四、率的标准化,6/27/2019,8,为什么引入相对数? 2008年甲县心脑血管疾病死亡人数253人,乙县为132人,能否说甲县心脑血管疾病的威胁比乙县严重?,6/27/2019,9,2. 在某遗传病的研究中,研究人员

3、发现该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关-更容易遗传给第一个孩子。这个结论是否正确,为什么?,6/27/2019,10,绝对数:实际观察得到的数据,反映真实情况。 相对数:两个有联系的指标(数值)之比,用于比较。,6/27/2019,11,相对数的种类: 1.率 2.构成比 3.相对比 重要区别:分子、分母,一、常用相对数,6/27/2019,12,1. 率,概念:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率大小或强度。 计算公式: 如何选K?使算得的率至少保留12位整数 习惯:IMR ,MMR/10

4、万 注意:不受其它指标的影响;各率相互独立,求和不一定为1(如是则属巧合)。,6/27/2019,13,常用的频率/类频率指标:,6/27/2019,14,6/27/2019,15,6/27/2019,16,例:某地2007年四种常见心血管病死亡率,6/27/2019,17,2.构成比,概念:也叫构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布。 计算公式: 注意:各组成部分的构成比之和为100%; 某一部分比重增大,则其它部分相应减少。 制图:一般用圆图(饼图)或百分条图,6/27/2019,18,例:某市某

5、病患者的地区构成,6/27/2019,19,2002年全国各地城市农村计划生育手术构成(%),城市,农村,27%,46%,12%,13%,2%,6/27/2019,20,练习:,率及构成比的差别?,已婚妇女不同情况下放环失败比较,6/27/2019,22,3.相 对 比,概念:是指两个有关联的指标之比,是对比的最简单形式。 计算公式:A/B(或100%) 表示A是B的若干倍或百分之几。 例如:BMI、性别比、CV等。 注意:1. A、B可以是性质相同的,也可以是性质不同的 2. A、B可以是绝对数,也可以是相对数或平均数,部分国家人口性别比,中国历年报告的出生性别比,1996-2005,127

6、,2006年全国生殖健康调查,6/27/2019,25,例1.在某遗传病的研究中,研究人员发现该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关-更容易遗传给第一个孩子。这个结论是否正确,为什么?,以(构成)比代替率的错误,实例分析,6/27/2019,26,例2.某项目县为提高医疗卫生的服务水平,对卫生人员进行培训,但是,经过3年培训,与培训前相比,该县孕产妇的死亡率却上升,如何解释? 培训前(2001年):2000名孕产妇死亡2人,100/10万 培训后(2004年):2010名孕产妇死亡3人,149/10万,计算率时分母不能太小,6/27/2019,27,例3. 在对肺癌

7、病人的死亡情况进行分析时发现:北医三院肺癌病人的死亡率为65%, 密云县医院为25%,请问哪家医院的治疗水平高?,两个资料要有可比性,6/27/2019,28,例4.某市2007年各区流感的发病率 请问:全市流感的发病率?,总率的计算不能是各分率的直接相加,6/27/2019,29,二、应用相对数时的注意事项,分析时不能以(构成)比代(替)率 计算相对数时分母不能太小 资料的可比性:两个率要在相同的条件下进行(标准化问题) 总率(平均率)的计算:不能直接相加求和 样本相对数的比较应做假设检验:样本相对数存在抽样误差,应进行差别的显著性检验.,按照一定的时间顺序,将一系列描述某事物的统计指标依次

8、排列起来,以便观察和比较该事物在时间上的变化和发展趋势。 这些统计指标可以是绝对数、相对数或平均数等。 动态数列分析是建立在相对比基础上的,采用定基比和环比两种方式。 常用的分析指标有:绝对增长量、发展速度与增长速度、平均发展速度和平均增长速度。,三、动态数列,某大学19922002年本科专业招生动态变化,绝对增长量 说明事物在一定时期增长的绝对值。 累计增长量:报告年的指标与某一固定年(基期水平)指标之差。 逐年增长量:报告年的指标与前一年指标之差。,发展速度与增长速度 定基发展速度:报告期指标的水平相当于基期水平的百分比或倍数。 定基增长速度:相对于基期水平,报告期指标净增加的百分比或倍数

9、。,34,环比发展速度:报告期指标的水平相当于上一期水平的百分比或倍数。 环比增长速度:报告期指标比上一期水平净增加的百分比或倍数。 描述时一定要说清楚比较的基数,以区分定基还是环比速度。,平均发展速度和平均增长速度 平均发展速度:某事物在一个较长时期内逐年平均发展变化的速度。 是环比速度的几何平均数。 平均增长速度:某事物在一个较长时期内逐年平均增长的速度。 平均增长速度平均发展速度1,率及构成比计算的SPSS程序:,相对比计算的SPSS程序:,Analyze Descriptive Statistics Frequencies 选分析变量入Variable(s)框 OK,Transform

10、 Compute Target Variable(新变量名) Numeric Expression(计算方式) OK,SPSS练习 (出生体重-率的计算数据库),某年儿童体检指标中,男孩占体检儿童的比例? 体检儿童的母亲职业分布情况? 体检儿童中,低出生体重的发生率是多少?(出生体重低于2500克为低出生体重) 体检儿童中,出生BMI是多少?,6/27/2019,38,四、率的标准化(standardization),条件:内部构成影响总率;要比较的两组的内部构成不相同;比较两组的总率。 方法: 直接法(适用于已知两组的内部构成) 间接法(略),步骤: 选定标准构成 在比较的资料中任选一组资料

11、的内部构成作为标准构成; 两组资料各部分之和组成的构成作为标准构成; 选择有代表性的、较固定的、数量较大的人群。 2. 计算预期发生数 3. 求标准化率,6/27/2019,40,例:甲乙两厂同工种工人某病的患病率见下表。某领导因发现乙厂的总患病率高于甲厂而认为乙厂的患病情况严重,并批评了乙厂,但是乙厂不服气。请你帮助解释说明真实情况。,6/27/2019,41,甲乙两厂同工种工人某病的患病率,6/27/2019,42,直接法计算甲乙两厂的标准化患病率(%),甲厂标准化患病率 = 105/1000 = 10.5% 乙厂标准化患病率 = 60/1000 = 6.0%,可见,乙厂的患病率低于甲厂,

12、与分工龄组比较的结论一致,消除了工龄构成不同的影响。,6/27/2019,43,注意事项: (1)标化率不能反映实际水平,只能用于比较; (2)选用标准不同,标化率会改变,但比较结果只有一个,不能改变; (3)比较两样本的标化率,也要进行假设检验。,6/27/2019,44,基本内容,6/27/2019,45,第三节 分类变量的统计推断,一、率的标准误和可信区间 二、 2检验 (一)成组设计四格表资料的2检验 (二)配对设计四格表资料的2检验 (三)行x列表x2检验 (四)趋势x2检验,6/27/2019,46,一、率的标准误和可信区间,样本率p,总体率 抽样误差产生的原因、概念,1、率的标准

13、误,6/27/2019,47,x,率的标准误,P1 P2 P3 Pi,p,=0.5时,不同n值对应的二项分布 =0.3时, 不同n值对应的二项分布,在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量 二项分布的图形现状取决于n和的取值。 随n增大,图形逐渐对称分布,6/27/2019,49,率的标准误计算公式: 与样本量的关系:成反比。,6/27/2019,50,例:某市为了解已婚育龄妇女子宫颈糜烂的患病情况,进行了抽样调查,随机抽取2000人,患者80例。试求此患病率的标准误。,51,点估计: 不考虑抽样误差的大小,将样本率直接作为总体率的估计值。 区间估计,

14、2、总体率的区间估计,52,总体率的可信区间 小样本(n50)时,可直接查“百分率的可信区间表”,即可得到总体率的1-可信区间。 样本量不太小,总体率既不太小,也不太大,比如np与n(1-p)均大于5时,样本率p的抽样分布近似正态分布。此时总体率的可信区间为,例:某社区共有12000人。现抽查了800人,发现200人患有蛔虫病。如要作集体驱虫治疗,至少应准备多少份药物?(95%) 要知道准备多少药物,就要知道该人群中蛔虫病的患病率(点估计);要估计至少要准备多少药物,就要估计得到该患病率的可信区间。“至少”就是要保证病人都能得到药物,所以要按最高患病率来准备。,样本率p=200/800=0.2

15、5=25%。因此样本率的标准误为 该人群中蛔虫感染率的95可信区间为 即人群中蛔虫感染率在2228之间。因此至少要准备12000*283360份药物。,6/27/2019,55,例:某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?,两个样本率不同:P1(14%);P2(25%),总体样本;资料性质;绝对数相对数,6/27/2019,56,x,率的标准误,P1 P2 P3 Pi,p,6/27/2019,57,当两个样本率不同时,有两种可能: P1 , P2所代表的总体率相同,由于抽样误差的存在,造成了样本率不同,这种差别在统计上叫差别无统计学意义。 P1 , P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。 用统计学方法进行判断属于那种情况。 x2检验,主要内容,一、分类变量概述 二、分类变量的统计描述 相对数 应用相对数的注意事项 动态数列 率的标准化 三、分类变量的统计推断 率的标准误和可信区间 2检验,6/27/2019,59,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1