医学统计知识点整理.doc

上传人:scccc 文档编号:11246651 上传时间:2021-07-17 格式:DOC 页数:16 大小:252.50KB
返回 下载 相关 举报
医学统计知识点整理.doc_第1页
第1页 / 共16页
医学统计知识点整理.doc_第2页
第2页 / 共16页
医学统计知识点整理.doc_第3页
第3页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《医学统计知识点整理.doc》由会员分享,可在线阅读,更多相关《医学统计知识点整理.doc(16页珍藏版)》请在三一文库上搜索。

1、医学统计学知识点整理第一节 统计学中基本概念一、同质与变异同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。“同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的二、总体与样本1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。2、样本:是从总体中随机抽取的部分观察单位变量值的集合。三、参数与统计量总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。卩.S . n样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。总

2、体参数一般是不知道的, 抽样研究的目的就是用样本统计量来推断总体参数, 包括区间估 计和假设检验四、误差:实测值与真值之差1. 随机误差:是一类不恒定的、 随机变化的误差,由多种尚无法控制的因素引起。 随机测量 误差、抽样误差。2. 系统误差:是一类恒定不变或遵循一定变化规律的误差, 其产生原因往往是可知的或可能 掌握的。3. 非系统误差:过失误差,可以避免或清除。五、概率是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值01。统计上一般将 PW或PW的事件称为小概率事件,表示其发生的概率很小, 可以认为在一次抽样中不会发生。第二节统计资料的类型变量:确定总体之后,研究者应对每个观察

3、单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。一、数值变量资料又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。 表现为数值 大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。二、无序分类变量资料分组又称为定性资料或计数资料: 将观察对象按观察对象的某种类别或属性进行分组计数, 汇总各组观察单位后得到的资料。分类:二分类:+ -;有效,无效;多分类:ABO血型系统特点:没有度量衡单位,多为间断性资料【例题单选】某地 A B、O AB血型人数分布的数据资料是 ()A. 定量资料B. 计量资料C.计数资料D.等级资料【答案】 C

4、【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照 变量的血型分类,血型表现为互不相容的属性。所以本题选C。【例题单选】测量正常人的脉搏数所得的变量是()A. 二分类变量 B. 多分类变量 C. 定量变量 D. 定性变量【答案】 C【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。三、有序分类变量资料半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计 数,分组汇总各组观察单位后得到的资料。特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例: - + + +第三节 统计工作的基本步骤 1. 统

5、计设计2. 收集资料3. 整理资料4. 分析资料:统计描述:是利用统计指标、 统计表和统计图相结合来描述样本资料的数量特征及分布规律。 统计推断:是使用样本信息来推断总体特征。统计推断包括区间估计和假设检验。第四节 统计表与统计图 、统计表统计表的基本结构与要求 标题:高度概括表的主要内容,时间、地点、研究内容,位于表的上方,居中摆放,左侧加 表的序号。标目:横标目和纵标目。线条:通常采用三线表和四线表的形式。没有竖线或斜线。数字:表内数字一律用阿拉伯数字。 同一指标, 小数位数应一致, 位次对齐。 无数字用 “” 表示。暂缺用“”表示。“ 0”为确切值。备注:位于表的下面,通常是对表内数字的

6、注解和说明,必要时可以用“*”等标出。一张统计表的备注不宜太多。二、制表原则重点突出,一个表一个中心内容主谓分明,层次清楚简单明了,一切文字数字线条尽量从简【例题单选】统计表内不列的项是 ()()A.标目 B. 线条 C. 数字D.备注【答案】 D【解析】统计表内备注位于表的下面,不列在统计表内,所以本题选择D。三、统计图1. (1)标题 (2)标目( 3)刻度(4)图例:不同颜色或者不同线条表示,需要说明。2. 常用统计图的适用条件与要求(1)条图:适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标。(2)圆图和百分比条图:构成比的比较(3)线图:描述某统计量随另一连续性数值变量变

7、化而变化的趋势。(4)直方图:数值变量的频数分布。(5) 散点图:用点的密集程度和趋势描述2 个变量间的数量关系(6)箱式图:多组数据分布的比较(7)统计地图:用不同的颜色和花纹表示统计量的在地理分布上的变化,适宜描述研究指 标的地理分布。【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制 图。答案】线图数值变量资料的统计分析第一节数值变量资料的统计描述一、频数分布表1. 编制步骤(1)计算全距(2)确定组距(3)划分组段(3)统计频数(4)确定频率与累计频率2. 频数分布表的主要用途:(1)揭示资料的分布类型(2)观察资料的集中趋势和离散趋势(3)便于发现某些特大或特小离群值(4)便于进

8、一步计算统计指标和作统计处理二、集中趋势指标数值变量资料的集中趋势指标是用平均数来描述的,代表一组同质变量值的平均水平。常用的有算术均数、几何均数和中位数。1. 算数均数适用于对称分布(正态分布)或者近似对称分布的资料。习惯上以卩表示总体均数,以表示样本均数。2. 几何均数数值变量呈倍数关系或者呈对数正态分布,如抗体效价及抗体滴度,某些传染病的潜伏期、细菌计数等,宜用几何均数(G。几何均数常用于等比资料或对数正态分布 资料。3中位数 是指将一组变量值从小到大排列,位次居中的观察值就是中位数。适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值 ;资料类型不明。

9、4. 百分位数是一种位置指标,以 Px表示,把一组数据从小到大排列后,理论上有X%的变量比Px小,有(100-X) %的变量值比 Px大。【例题单选】描述正态分布资料集中趋势的指标是()A.中位数B.几何均数C.算术平均数D.标准差【答案】C【解析】算数均数适用于对称分布或者近似对称分布的资料。几何均数常用于等比资料或对数正态分布资料。中位数适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。标准差描述数据的离散趋势指标。所以本题选择C。三、离散趋势指标1. 极差和四分位数间距极差:简记为R,亦称全距,即一组变量值中最大值与最小值之差,反应变量

10、值的离散范围。四分位数间距Q: 般和中位数一起描述偏态分布资料的分布离散趋势。3.方差和标准差:方差表示样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。标准差是方差的正平方根。x x 221 2 X1 x用途:S n 11n 1(1)用于表示正态或近似正态分布资料的离散度;(2)反映均数的代表性标准差越小,数据离散程度越小,均数的代表性越好。(3)确定医学参考值范围95%医学参考值范围x 1. 96s3. 变异系数(CV适用条件:观察指标单位不同,如身高、体重 同单位资料,但均数 相差悬殊四、正态分布与参考值范围的制定(一)正态分布1. 概念:也称高斯分布,是医学和生物学最常见、最

11、重要的一种连续性分布。2. 特征: 在直角坐标的横轴上方呈钟型曲线,两端与X轴永不相交,且以 X=y为对称轴左右完全对称(2)在x=卩处,f(X)取最大值(3)正态分布有两个参数,即均数和标准差b 均数卩描述了正态分布的集中趋势位置,若固定厂 改变值,曲线沿着X轴平行移动,其形状不变,故卩称为位置参数。标准差b描述了正态分布的离散程度,若固定卩,6越小,曲线越陡峭;反之,b越大,曲线越平坦.故b称为形状参数或离散度参数。(4)正态曲线下的面积分布有一定的规律。4. 正态曲线下面积的分布规律(二)医学参考值范围的制定医学参考值:是指绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数

12、,也称正常值。表3.2百分位恢袪Jb艰单!只有下柬只有上泉只有下限只有上限90X+I.64SX-1 28.SXH 28SPE95X + 1.9&SX-1.645右 1.645P1 厂 Pr j珂F99X + 2.58SX-233SX12血P1第二节数值变量资料的统计推断 一、均数的抽样误差与标准误抽样误差:由于个体变异和抽样造成的样本统计量与总体参数和样本统计量之间的差异。SxS?n(CT未知)均数的抽样误差:由于抽样造成的样本均数与总体均数和样本均数间的差异。标准误:样本均数的标准差,用 来表示。、t分布Sxt分布曲线以0为中心,t分布为一簇单峰分布曲线,U不同,曲线形状不同 t分布与U有关

13、,U越小, t值越分散,t分布的峰部越低,而两侧尾部翘得越高t界值表中一侧尾部面积称单侧概率(a )两侧尾部面积之和称双侧概率(a /2)如:2,9= , ,9=在相同自由度时,丨t I值增大,a减小在相同a 时,单尾a 对应的t值比双尾a的小三、总体均数的区间估计统计描述统计分析参数估计-用样本指标估计总体指标统计推断彳假设检验总体均数置信区间(可信区间)的计算区间估计:是按预先给定的概率(1- a )所确定的包含未知总体参数的一个范围。(一) 小样本或 d未知-按t分布(x -ta/2r vsf討上动八(二) 1.已知 d - u 分布(x- VCJ52. d未知,但大样本(n60 )-按

14、U分布四、假设检验的意义和基本步骤假设检验:先对总体的参数或分布做出某种假设,再用适当的统计方法根据样本对总体提 供的信息,推断此假设应当拒绝或不拒绝。基本步骤:1. 建立检验假设,确定检验水准(1)H 0:(无效假设)卩=口 0(2)H i:(备择假设)口工 口 0 , 口 口 0 或 口 60 且 n260)X 1 X 2完全随机设计的两样本均数的比较。五、假设检验应注意的问题1、假设检验应有严格的抽样设计-同质2、要注意选用的假设检验方法的应用条件3、正确区分差别有无统计意义与有无专业上的实际意义4、结论不能绝对化5、假设检验的单侧检验与双侧检验的选择假设检验的两类错误第I类错误:拒绝实

15、际上成立的犯第I类错误的概率大小为a。第H类错误:不拒绝实际上不成立的H),犯第H类错误的概率为3当样本含量n 定时,a越小,3越大;若想同时减少 a和3,只有增大样本含量。1- 3称为假设检验的功效当所研究的总体与 H)确有差别时,按检验水准a能够发现它(拒绝Ho)的概率。分类变量资料的统计分析第一节分类变量资料的统计描述、常用相对数率:说明某现象发生的频率或强度。构成比:说明某一事物内部各组成部分所占的比重或分布。相对比:说明一个指标是另一个指标的几倍或百分之几。【例题单选】某医院住院病人中有15%的胃癌患者,该15%是( )A.患病率B.发病率C.构成比D.相对比【答案】C【解析】15%

16、的胃癌患者指的是胃癌患者占住院病人的15%所以是构成比。【例题填空】构成比是说明 或分布指标。率是说明 或强度的指标。【答案】比重;频率二、应用相对数时应注意的问题(简答题)1. 计算相对数时,观察单位数应足够多2. 分析时不能以构成比代替率3. 相对数的相互比较应注意可比性,不具有可比性应进行标准化4. 样本率或构成比的比较应做假设检验第二节分类变量资料的统计推断一、率的抽样误差与标准误p二、总体率的区间估计1. 查表法:当n较小,如nw 50,特别是p接近与0或1时(小概率事件),按二项分布原 则估计总体率的可信区间。2. 区间估计 正态近似法:当样本含量n足够大,样本率p或1-p均不太小

17、时如np和n(1-p)均大于5,样本率的分布近似正态分布,总体率可信区间在(1-a )可信度下,估计为: P U a /2 Sp例:总体率95%勺可信区间:P 土;总体率99%勺可信区间:P 三、两总体率之差的区间估计条件:当样本含量 n足够大,样本率p或1-p均不太小时,即np和n(1-p)均大于5,样本率的分布近似于正态分布(p 1-p 2 -U a /2 Sp1-p2,(p 1-p 2 + U a /2 Sp1-p2)SpiP2Xi X2(1X1 X2)(1 1)ni压nin2四、率的u检验(一)样本率与总体率比较的 u检验I 戸 L 氏 II p - n |u = = * _ 一 =写

18、/逑二卫y n(二)两样本率比较的 u检验1 pi - P2 1兀+ x2* / 1 1 =巧 + ri2第三节 x检验2一、四格表资料的 x检验(一)四格表资料的 x 2检验的基本思想假设两组资料率的差异来自抽样误差,用x2值反映实际频数和理论频数吻合的程度。在H) (n i=n 2)成立的条件下,实际频数与理论频数相差不应该很大,若实际算出的x 2值较大,超过了设定的检验水准,则有理由怀疑 H)的真实性,从而拒绝 H,接受Hi ( Hi:n 1工 n 2)应用:推断两个(或多个)总体率或构成比之间是否有差别和多个样本率间的多重比较、四个表资料的卡方检验处理属性-合计阳性阴性1组砒S)叫(固

19、定值)2组曲巾(固定值)合计m2/!四个表 2检验基本公式:A为实际频数, T为理论频数2四个表兀2检验专用公式:2(ad be) n(a b)(a e)(b d)(e d)适用条件:两样本率比较时,总例数n 40且所有格子T 5(二)四格表资料的兀2检验的校正公式2(|A T 0.5)222 (ad be n /2)2 n T或(a b)(e d)(a e)(b d)1当n40且所有的T 5时,用x 2检验的基本公式或四格表资料x 2检验的专用公式;当P a时,改用四格表资料的Fisher确切概率法。2当n40但有 K T5时,用四格表资料 x 2检验的校正公式或改用四格表资料的Fisher

20、确切概率法3当nv 40,或Tv I时,用四格表资料的 Fisher确切概率法。(三) 四格表资料的确切概率法四格表资料的Fisher确切概率法是一种直接计算概率的方法,理论依据是超几何分布,四 格表资料的确切概率法不属于x 2检验的范畴,常作为四格表资料假设检验的补充。配对四格表资料的x 2检验% II. 10 配刑四格表璐式配对设计四个表卡方检验公式:若b+e40若 b+ev 40乙甲2醫计*-a-b-b卩a圧tr+rf-合计;a+chdn三、行X列表资料的兀2检验用于多个样本率的比较,两个或多个构成比的比较理论频数不应小于 1,K T5的格子数不应超过总格子数1/5多个样本率比较,若所得

21、统计推断为拒绝 H0,接受H1时,只能认为各总体率之间总的来说 有差别,但不能说明任两个总体率之间均有差别。一般的x 2检验不适用于有序分类资料(等级资料)一一“等级”、“程度”、“优劣”的比较分析。因为检验只利用了两组构成比提供的信息,损失了有序指标包含的“等级”信 息。第四节秩和检验秩和检验是将定量数据从小到大、等级从弱到强或从强到弱转换成秩后,求秩和,计算检 验统计量一一秩统计量,做出统计推断。应用:不满足t检验条件的数值变量资料 有序分类变量资料(等级资料) 分布类型不明一端或二端无确定数值任何分布类型的资料秩和检验应用中的注意事项(1) 秩和检验一方面由于其方法的稳健性而具备不受总体

22、分布限制,适用范围广的优点,但另一方面,在秩转换的过程中损失了原数据的部分信息。如果已知计量资料满足 (或近似满足)t检验应用条件,这时若选秩和检验,由于没有充分利用资料提供的信息,会降低检验效能。即当 H不真时,秩和检验将不如 t检验能较灵敏的拒绝犯第2类错误的概率要比t检验大。(2) 对于计量资料,若满足正态和方差齐性条件,应选t检验对总体均数作假设检验;当资料偏离假定条件时,选用秩和检验才是可靠的。(3) 对于大样本资料,通过把原变量值或等级转换成秩后,可采用t检验方法对平均秩次进 行检验。【例题填空】等级资料的比较宜选用 检验。【答案】秩和【例题简答】秩和检验的优点【答案】秩和检验适合

23、任何分布的资料;具有较好的稳健性。第十八章直线回归和直线相关第一节直线回归用于分析两变量间依存变化的数量关系一、直线回归方程Y a bX式中的X为自变量;式中的?是由自变量X推算应变量Y的估计值。a是回归直线在 丫轴上的截距,即 X=0时的Y值;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。a和b的估计常用最小二乘法原则所有的点离回归线的纵向距离最近;回归线必然通过(X,Y)求回归方程的的步骤: 在普通坐标系中作散点图,看是否有直线趋势。 求X、Y的离均差乘积和Ixy及X、Y的离均差平方和Ixx、lyy求a和b b %I xx(XY)(X X)2X YXYn

24、2列出回归方程:?=a+bX X)Xn【例题填空】直线回归是分析 a Y bX间数量关系的统计方法。()【答案】两个变量二、总体回归系数的假设检验b 0Sbn 2 S(丫 Y?)2% n 2SbSy.X.Ixx22丫 丫|丫丫1xy /1XXlYY blXY三、直线回归方程的应用1. 描述变量间数量关系2. 统计预测3. 统计控制第二节直线相关 用于描述两变量间线性关联程度与相关方向,适用于双变量正态分布一、相关系数它反映具有直线关系的两个变量之间,相关密切程度与相关方向的指标。样本相关系数用r来表示,总体相关系用p来表示其取值范围是-1 r 1。r为正表示正相关关系,x与y同向变化;r为负表

25、示负相关关系,x与y反向变化。r的绝对值越接近1,线性关系越密切;r的绝对值越接近0,线性关系越不密切;r绝对值=1,为完全相关;r=0 ,为零相关。二、相关系数的计算1 XX1丫丫(X X)(Y Y)(X2X)2(Y Y)XYXX 1YYX2Y2XY n 、相关系数的假设检验(总体相关系数为p)1 xyr 0r1 n 2Vr?Sr1 r2 1 r2n 2=n_2t五、直线回归与相关应用的注意事项(1)注意事项:根据分析目的选择变量及统计方法: 直线相关: 两变量之间直线关系的方向与密切程度,XY 无主次之分;直线回归:应变量对自变量在数值上的依存关系,一般把易于测量的作为 自变量, 另外根据

26、专业知识确定。 进行相关回归分析要有实际意义, 不可把毫无关系的两个 事物或现象用来作相关回归分析。 进行相关、回归分析前应绘制散点图 相关与回归的应用条件: 直线相关分析一般要求 X、Y 服从二元正态分布, 又称为双变量 正态分布。 结果的解释及正确应用 线性关系存在不能直接解释为因果关系; 直线回归用于预测 时,自变量范围尽量不要外延。(2)关系:直线相关与回归既有区别又有联系。区别主要体现在:反映两个变量间数量关 系的目的不同。 对变量的分布要求不同。 联系主要体现在: 同一资料同时作相关与回归 分析时,其相关系数r与回归系数b的符号相同。同一资料r和b的假设检验等价。相关与回归可以相互解释。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1