《医学统计学方法》12临床统计-6讲.ppt

上传人:scccc 文档编号:15006256 上传时间:2022-03-03 格式:PPT 页数:96 大小:1.60MB
返回 下载 相关 举报
《医学统计学方法》12临床统计-6讲.ppt_第1页
第1页 / 共96页
《医学统计学方法》12临床统计-6讲.ppt_第2页
第2页 / 共96页
《医学统计学方法》12临床统计-6讲.ppt_第3页
第3页 / 共96页
《医学统计学方法》12临床统计-6讲.ppt_第4页
第4页 / 共96页
《医学统计学方法》12临床统计-6讲.ppt_第5页
第5页 / 共96页
点击查看更多>>
资源描述

《《医学统计学方法》12临床统计-6讲.ppt》由会员分享,可在线阅读,更多相关《《医学统计学方法》12临床统计-6讲.ppt(96页珍藏版)》请在三一文库上搜索。

1、吉林大学公共卫生学院,1,医 学 统 计 学,主讲人 刘欣,流行病与卫生统计学教研室,吉林大学公共卫生学院,2,第十三章 直线相关与回归,吉林大学公共卫生学院,3,第一节 直线相关,一、直线相关的概念,直线相关(linear correlation)是描述两个变量间互依关系的一种统计分析方法。此法又称简单相关(simple correlation)。此法通过直线相关系数(linear correlation coefficient)描述两个变量直线关系的大小和方向。此法要求两个变量服从双变量正态分布。,吉林大学公共卫生学院,4,相关系数又称积差相关系数,也称Pearson相关系数,用r 表示。

2、它是说明具有直线关系的两个变量间,相关关系的密切程度和相关方向的指标。用r 的大小表示密切程度,用r 的正负表示相关方向。其计算公式为:,吉林大学公共卫生学院,5,图13-7a 相关系数含义图,吉林大学公共卫生学院,6,图13-7b 相关系数含义图,吉林大学公共卫生学院,7,公式(13-1),相关系数无单位,其取值范围为1r1。r 值为正表示正相关,为负表示负相关,为零表示零相关。r = 1为完全正相关,r = 1为完全负相关。,二、直线相关系数的计算,吉林大学公共卫生学院,8,吉林大学公共卫生学院,9,例 研究者为探讨女性的年龄与收缩压的关系,收集了某地12名妇女的年龄与收缩压数据见下表13

3、-1的(2)、(3)。根据妇女年龄与收缩压的数据计算二者的相关系数。,1. 先根据原始数据绘制散点图,大致判断两变量之间是否有直线趋势。 本例的散点图见图13-1,可见年龄与收缩压呈直线趋势,故可进行直线相关分析。,吉林大学公共卫生学院,10,吉林大学公共卫生学院,11,吉林大学公共卫生学院,12,2. 计算相关系数。由前面计算可知: lXX,lYY,lXY=233.7,代入公式(13-1)得相关系数为:,三、直线相关系数的假设检验,前面所求相关系数r 是样本相关系数,它实为总体相关系数 的估计值。我们知道即使X、Y的总体相关系数为零,由于抽样误差的存在,样,吉林大学公共卫生学院,13,本相关

4、系数r 也不一定为零。因此需要对相关系数r 进行假设检验,以此推断X、Y是否存在直线相关关系。常用t 检验,其检验统计量公式如下:,公式(13-3),式中Sr 为样本相关系数的标准误,自由度=n2。,例 就例1求得的r 值,检验妇女年龄与收缩压间是否存在直线相关关系。,吉林大学公共卫生学院,14,H0: = 0 即年龄与收缩压之间无直线相关关系,H1: 0 即年龄与收缩压之间有直线相关关系, 检验假设,=, 计算检验统计量 本例n = 12, r = 0.8943,代入公式(12-3)求t 。,吉林大学公共卫生学院,15,由=0.05,=n2=122=10,查t 界值表得t ,=t ,10=2

5、.228,今求得t=6.322.228,则P0.05,按=水准拒绝H0,可认为妇女年龄与收缩压之间有直线相关关系。, 确定P值和作出推断结论,吉林大学公共卫生学院,16,一、直线回归的概念,直线回归(linear regression)是描述两个变量间依存数量关系的一种统计分析方法。此法又称简单回归(simple regression)。此法通过直线回归方程(linear regression equation)描述一个变量Y常称为应变量(dependent variable)依存另一个变量X常称为自变量(independent variable),第二节 直线回归,吉林大学公共卫生学院,17

6、,变化的数量关系。由此方程可确定一条回归直线。,二、直线回归方程的求法,线性回归方程的表达式为,公式(13-4),式中X为自变量, 为应变量Y的估计值,a 为回归直线在Y轴上的截距(intercept),b为回归系数(regression coefficient),也即回归直线的斜率(slope)。根据数学上的最小二乘法的原理计算a和b 。计算公式如下:,吉林大学公共卫生学院,18,公式(13-5),式中lXX 和lXY分别表示离均差平方和与离均差积和。,公式(13-6),例1 某研究者为探讨女性的年龄与收缩压的关系,收集了某地12名妇女的年龄与收缩压数据见下表13-1的(2)、(3)。试求年

7、龄与收缩压的直线回归方程。,最小二乘法原理的含义是保证各实测点至直线的纵向距离的平方和最小 。,吉林大学公共卫生学院,19,吉林大学公共卫生学院,20,1. 先根据原始数据绘制散点图(scatter plot),大致判断两变量之间是否有直线趋势。 本例的散点图见下图13-1,可见年龄与收缩压呈直线趋势,故可进行直线回归分析。,吉林大学公共卫生学院,21,2. 计算X、Y、X2、Y2、XY见表13-1中的(2)(6)合计项。,X=628,Y=224.4,X2=34416,Y2 =,XY,3. 计算 和lXX 、lYY、lXY,吉林大学公共卫生学院,22,4. 求回归系数b和截距a 按公式(12-

8、5)求回归系数b,求截距a。,5. 列直线回归方程,为了直观分析或实际需要,可按求出的直线回归方程作图。在X的实测全距范围内任取相距较远且易读数的两个X值,代入方程得到两个Y值,吉林大学公共卫生学院,23,以直线连接两点即得回归直线。本例可取X1=42,得Y1=17.14;取X2=72,得Y2=21.66。连接两点即得本资料的回归直线。见下图13-1a。,吉林大学公共卫生学院,24,三、回归系数的假设检验,我们知道即使X、Y的总体回归系数为零, 由于抽样误差的存在,样本回归系数b 也不一定为零。因此需要对回归系数进行假设检验,以此推断X、Y是否存在直线关系。可用方差分析或t 检验。,吉林大学公

9、共卫生学院,25,检验统计量t的计算公式为:,t 检验,公式(13-7),例3 对例1求得的回归系数进行t 检验。,t 检验的步骤如下:,式中Sb 为样本回归系数的标准误 。,吉林大学公共卫生学院,26,H0: = 0 即年龄与收缩压之间无直线关系,H1: 0 即年龄与收缩压之间有直线关系,=,前已算得lXX,lYY,lXY=233.7, b=0.1507, 代入公式得,吉林大学公共卫生学院,27,由=0.05,=n2=122=10,查t 界值表得t ,=t ,10=2.228,今求得t=6.322.228,则P0.05,按=水准拒绝H0,可认为年龄与收缩压之间有直线关系。,吉林大学公共卫生学

10、院,28,四、直线回归方程的应用,1. 描述两变量间的数量依存关系 2. 利用回归方程进行预测 3. 利用回归方程进行统计控制,吉林大学公共卫生学院,29,五、应用回归分析时应注意的问题,1.两变量作直线回归分析时,要求应变量Y服从正态分布,通常自变量X为可以精确测量或严格控制的因素。 2.作回归分析时要有实际意义,不能把毫无关联的两事物或现象进行回归分析。 3.在进行回归分析前,应绘制散点图。 4.回归方程适用范围一般以自变量X实际取值范围为限,不能任意外推。,吉林大学公共卫生学院,30,第三节 直线相关与回归的区别和联系,吉林大学公共卫生学院,31,回归与相关是两个既有区别又有联系的统计分

11、析方法,若研究目的是想定量地描述两个变量间的依存关系,常用来由一个变量的数值去推算另一个变量的数值,则应作回归分析;若目的是想定量地描述两个变量间互依关系的密切程度和方向,则应作相关分析。, 区别,1. 资料要求不同 回归要求应变量Y 服从正态分布,X 是可精确测量或严格控制的变量,一般称I 型回归。相关要求两个变量服从双变量正,吉林大学公共卫生学院,32,态分布,此时若作回归分析,称II 型回归。,2. 在应用上不同 回归用来描述两个变量间的依存关系,相关用来描述两个变量间的互依关系。, 联系,1. 符号相同 对一组数据若同时计算r 与b , 它们的正负号相同。 r 为正说明两个变量间的相互

12、关系是同向变化的;b 为正说明X 增(减)一个单位,Y 平均增(减) b 个单位。,吉林大学公共卫生学院,33,2. 假设检验等价 对同一样本,样本回归系数b 的t 检验与样本相关系数r 的t 检验的t 值相等,即tb = tr 。由于b 的假设检验较繁,故在实际应用中常用r 的t 检验代替。,3. 用回归解释相关 r 的平方称为决定系数( coefficient of determination),吉林大学公共卫生学院,34,接近1,则回归效果越好。,上式说明当SS总固定不变时,回归平方和SS回的大小决定了r2 的大小。SS回越接近SS总,则r2 越,吉林大学公共卫生学院,35,第十四章 统

13、计表与统计图,统计表与统计图是统计描述的重要方法,是对比、分析事物的重要工具。 在科技报告或论文中,常把统计数据或统计指标用表格的形式列出,称为统计表(statistical table),它常用来集中、浓缩、简洁地概括说明某类被研究事物,代替冗长、单调的文字叙述,并能够鲜明、清晰地表达该事物,便于进一步比较和计算。,吉林大学公共卫生学院,36,第一节 统计表,统计图(statistical chart)是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料的一种方法,它可以把资料的变化趋势、分布特征、数据之间的关联等,以形象直观的方式表现出来。统计图容易理解,能醒目地给读者留下深

14、刻印象。缺点是不能精确地表达数字的大小,故常与统计表一同使用,以达到相辅相成的效果。,吉林大学公共卫生学院,37,一、统计表的基本结构,统计表主要由标题、表线、标目和数字组成。其结构如下图所示:,标题,表号,纵标目,横标目,数字,合计,顶线,分隔线,合计线,底线,吉林大学公共卫生学院,38,统计表分为简单统计表和复合统计表两种。以下是论文和科技报告中常见的统计表的式样,其中表1是简单表,表2、表3和表4是复合表。,二、统计表的种类,吉林大学公共卫生学院,39,吉林大学公共卫生学院,40,吉林大学公共卫生学院,41,三、编制统计表的注意事项,制作统计表总的原则:重点突出,简单实用;逻辑合理,条理

15、清晰。即一个统计表最好只包含一个中心内容,不要面面俱到;纵、横标目的安排既要符合专业要求,又要逻辑分明。,针对统计表的各组成部分,具体的制表基本要求如下:, 标题,用简明扼要的文字说明表的中心内容;必要,吉林大学公共卫生学院,42,时写明时间和地点;标题写在表体的上端中部。注意标题不要过长,也不要太简略,更不要不写。, 表号,一般标于标题的前部,与标题以空格相隔;若文中有多个表,以数字编号表示,如“表1”、“表2”、“表12-1”、“表”等;若文中只有一个表,用“附表”表示。, 表线,表线有顶线、分隔线、合计线、底线等;顶,吉林大学公共卫生学院,43,线和底线一般用粗线,其余用细线;表线只能用

16、横线,不能用竖线,也不能用斜线;表线不宜过多。最基本的统计表一般为三线表、四线表。, 纵标目,常用精炼的文字或术语写明各项指标或某种分类;位于表的上部;有单位的指标要注明单位,如“体重(kg)”、“死亡率(%)”等;纵标目上可以再列总标目,二者用一短线分隔。注意标目不宜过多;纵标目不宜划分过多层次。,吉林大学公共卫生学院,44, 横标目,常为被研究或要说明的事物名称;位于表的左中部;横标目上部常列事物的性质或类别,如“类型”、“年份”、“组别”等;横标目下部可列合计项;合计与横标目之间一般不用短线分隔。, 数字,表内数字一律采用阿拉伯数字;同一指标的数字应该数位对齐,小数位数要一致;数字不标明

17、单位;表内不宜有空项。如遇数据缺失、不详,吉林大学公共卫生学院,45,或未记录时,可用“”表示,不该有数字处可用“”表示。数字是“0”均填“0”。数字应位于所属纵标目的正下方,横标目的右侧同一行;合计数字与分数据之间可用短线分隔。, 备注,当表中有某个对象需附加或特殊说明时,可先在该对象的右上角用“*”或其它特殊符号标示,再在表的底线下面左侧用该符号引导写出具体内容。,吉林大学公共卫生学院,46,统计图是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料的一种方法,它可以把资料的变化趋势、分布特征、数据之间的关联等,以形象直观的方式表现出来。统计图容易理解,能醒目地给读者留下深刻

18、印象。常用的统计图有条图、百分条图、圆图、线图、半对数线图、散点图、直方图、统计地图等。,第二节 统计图,吉林大学公共卫生学院,47,一、绘制统计图的基本要求,统计图与统计表不同,统计表没有固定的模式,需要根据分析目的和资料特点去设计和制作,灵活性强;而统计图有固定的类型和模式,需要按每种统计图的要求去绘制,但在制作每种统计图时,要注意以下几项基本要求:,1. 按资料的性质和分析目的选用适当的统计图 统计图选择的不合理将达不到分析的目的,可能会得到与预期目的相反的效果。掌握和熟悉 每种统计图的特点有利于正确选择合理的统计图。,吉林大学公共卫生学院,48,2. 每个统计图要有标题 用简明扼要的文

19、字说明图的中心内容,必要时写明时间和地点;标题常写在图体的下端中部。,3. 纵、横标目分别代表分析指标和分析事物有单位的标目要注明单位,标目常写在坐标轴的外侧中部。,4. 条图、线图、半对数线图、散点图、直方图都有纵、横坐标轴 坐标轴要注明尺度,纵轴尺度自下而上,横轴尺度自左而右,数量都从小到大,并等距标明。条图与直方图的纵坐标必须从0开始,并标明0点。统计图的纵、横轴比例一,吉林大学公共卫生学院,49, 条图,条图(bar chart) 用等宽直条的长短来表示相,般为5:7,即黄金分割(golden section)的近似值(0.6180339)。,5. 比较不同事物时,应选用不同的图案或颜

20、色区别表示,并附图例(legend)说明 图例放置的位置以不影响图的主要内容为前提,可放在图的空隙处。,二、常用的统计图,吉林大学公共卫生学院,50,互独立的各指标的数值大小。有单式和复式条图两种。单式条图的样例见图14-1 ,图14-10;复式条图的样例见图14-2 ,图14-11。,吉林大学公共卫生学院,51,吉林大学公共卫生学院,52,资料来源见表14-1。,吉林大学公共卫生学院,53,资料来源见表14-10。,吉林大学公共卫生学院,54,吉林大学公共卫生学院,55,资料来源见表14-3。,吉林大学公共卫生学院,56,资料来源见表14-11。,吉林大学公共卫生学院,57,互独立的各指标的

21、数值大小。有单式和复式条图两种。单式条图的样例见图14-1 ,图14-10;复式条图的样例见图14-2 ,图14-11。,条图的绘制方法如下:, 一般以横轴为基线,表示被研究的事物,纵轴表示研究指标。也可颠倒设置,样例见图14-10a 。, 表示指标数值的坐标尺度必须从0开始,一般为等间距,中间不能折断,否则会改变各直条长短的比例,使人产生错觉(见图14-12)。,吉林大学公共卫生学院,58,吉林大学公共卫生学院,59,图14-12 条图的纵轴尺度起点必须为0示意图,吉林大学公共卫生学院,60, 百分条图,百分条图(percent bar chart) 用一个长条的面, 各直条间宽度应相等,间

22、隙宽度也应一致,一般与直条的宽度相同或为直条宽度的一半。, 为了便于对比,一般将被比较的指标按大小顺序排列。, 复式条图每组内的直条间不留间隙,各直条应以不同的图案或颜色区别表示,并附图例说明。,吉林大学公共卫生学院,61,积代表事物的全部,条内分段的面积代表事物的构成比。有单式和复式百分条图两种。单式百分条图的样例见图14-3;复式百分条图的样例见图14-13 ,图14-14。,百分条图的绘制方法如下:, 先绘制一个标尺,一般以横轴为标尺,尺度必须从0到100标记。, 绘制一直条,长度必须与标尺一致,宽度可任意,全长代表全部构成。, 以各自构成比的大小划分各自条宽。,吉林大学公共卫生学院,6

23、2,吉林大学公共卫生学院,63,资料来源见表14-4。,吉林大学公共卫生学院,64,资料来源见表14-13。,吉林大学公共卫生学院,65,吉林大学公共卫生学院,66,资料来源见表14-14。,吉林大学公共卫生学院,67, 圆图, 各条段需用不同的图案或颜色区分,并附图例说明。,圆图(pie chart) 用圆的面积代表事物的全部, 用各扇形的面积代表事物的构成比。有单式和复 式圆图两种。单式圆图的样例见图14-4;复式圆图的样例见图14-15 。,圆图的绘制方法如下:, 先绘制一个圆形,1%相当于3.6,每个构成比乘以圆心角度数。,吉林大学公共卫生学院,68,吉林大学公共卫生学院,69,图14

24、-15 2001年某地流动人口与本地人口的经济状况构成(%),吉林大学公共卫生学院,70, 将每个构成比换算成圆心角度数,利用量角器绘制出各个构成比的扇形面积。, 扇面一般以9点或12点位置作始点,顺时针排列。, 各扇面需用不同的图案或颜色区分,并附图例说明。, 线图,线图(line chart) 用线段的升降表示事物在时间上的变化趋势, 或某现象随另一现象变动的情况。适用于连续型资料。有单式和复式线图两种.,吉林大学公共卫生学院,71,复式线图的样例见图14-5 ,图14-16 ,图14-17 。,线图的绘制方法如下:, 先建立一个坐标系,一般以横轴表示时间,纵轴表示率或数值大小。, 根据每

25、个时间点的指标大小确定点的位置,用短线连接各点即成。一般不把折线绘制成平滑的曲线。, 复式线图需用不同的图案或颜色区分,并附图例说明。,吉林大学公共卫生学院,72,吉林大学公共卫生学院,73,资料来源见表14-5。,吉林大学公共卫生学院,74,吉林大学公共卫生学院,75,资料来源见表14-14。,吉林大学公共卫生学院,76,吉林大学公共卫生学院,77,资料来源见表14-17。,吉林大学公共卫生学院,78, 半对数线图,半对数线图(semi-logarithmic linear chart) 用于表示事物的发展速度。线图的纵、横轴都为算术尺度,半对数线图的纵轴为对数尺度,横轴为算术尺度。适用于比

26、较两组相差悬殊的数据比较变化速度。样例见图14-7 ,图14-18 。,半对数线图的绘制方法如下:, 在半对数坐标纸上按线图绘制方法即可。, 对于普通坐标纸,需先将数据转化为对数,再按线图绘制方法即可。,吉林大学公共卫生学院,79,吉林大学公共卫生学院,80,资料来源见表14-6。,吉林大学公共卫生学院,81,吉林大学公共卫生学院,82,资料来源见表14-18。,吉林大学公共卫生学院,83,线图与半对数线图各自反映数据变化的角度不同,线图体现数据之间的绝对差,半对数线图体现数据之间的对数差。为对比二者,现将同一资料分别用线图与半对数线图绘制,见附图1、附图2、和附图3。,吉林大学公共卫生学院,

27、84,附图1,吉林大学公共卫生学院,85,附图2,吉林大学公共卫生学院,86,附图3,吉林大学公共卫生学院,87, 散点图,线图与半对数线图各自反映数据变化的角度不同,线图体现数据之间的绝对差,半对数线图体现数据之间的对数差。为对比二者,现将同一资料分别用线图与半对数线图绘制,见附图1、附图2、和附图3。,散点图(scatter plot) 用点的密集程度和变化趋势表示两种现象之间的相互关系。适用于双变量资料。散点图的样例见图14-8 。,散点图的绘制方法与线图相同,只是点与点,吉林大学公共卫生学院,88,吉林大学公共卫生学院,89,之间不用连线即可。, 直方图,直方图(histogram)

28、用各矩形的高度或面积代表各组段的频数或频率,各矩形的面积总和为总频数或100%,用以表示连续型资料的频数分布情况。适用于连续型的频数分布表资料。横轴表示组段,纵轴表示频数或频率。样例见图14-9 。,绘制直方图应注意:, 纵轴的刻度必须从0点开始。,吉林大学公共卫生学院,90,吉林大学公共卫生学院,91, 各矩形的高度为频数或频率,宽度为组距。各组段的组距必须相等,若不等,要折合成等组距,只能由多化少。, 各矩形(直条)之间不留空隙,可用直线分隔,也可不绘制分隔直线。, 统计地图,统计地图(statistical map) 用于表示某现象的数量在地域上的分布。适用于跨地区的大型调查资料.常用来

29、表达某种疾病在不同地区的发病率、死亡率或患病率的大小分布,有助于分析该种疾,吉林大学公共卫生学院,92,病的地理分布特征。样例见图14-19 ,图14-20 ,图14-3-14 。,除以上介绍的常用统计图之外,统计图还有箱式图(box plot),误差条图(error bar plot)等等,,吉林大学公共卫生学院,93,图14-19 1999年中国及南亚AIDS阳性患者的地区分布,吉林大学公共卫生学院,94,图14-20 1993年中国各省(区、市)人口平均密度的分布,吉林大学公共卫生学院,95,吉林大学公共卫生学院,96,病的地理分布特征。样例见图14-19 ,图14-20 ,图14-3-14 。,除以上介绍的常用统计图之外,统计图还有箱式图(box plot),误差条图(error bar plot)等等,其样例分别见图14-21 ,图14-22 。,C,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1