基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc

上传人:yyf 文档编号:5020980 上传时间:2020-01-29 格式:DOC 页数:15 大小:382KB
返回 下载 相关 举报
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc_第1页
第1页 / 共15页
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc_第2页
第2页 / 共15页
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc_第3页
第3页 / 共15页
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc_第4页
第4页 / 共15页
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc》由会员分享,可在线阅读,更多相关《基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc(15页珍藏版)》请在三一文库上搜索。

1、各专业全套优秀毕业设计图纸基于非参数分析法研究某型淋巴癌患者生存时间的影响因素摘要探讨某淋巴肿瘤的手术治疗疗效影响因素。对两组来自某医学论坛的某淋巴肿瘤病人两年内生存时间的观察数据进行生存分析。其中,实验组26例,对照组14例。本文通过SAS软件来实现非参数分析法中乘积极限法拟合给定数据的生存曲线、生存率、死亡率、生存率的标准误、死亡例数和该时间点前的生存例数等数值;以及关于生存时间的描述性统计量,包括75%,50%和25%分位数以及相应的95%的可信区间,还有均数和标准误,从结果可以看出平均生存时间为144.428和95.929天;列出了完全数据,截尾数据的例数,以及截尾数据占全部数据的百分

2、比;以及两组的生存曲线图。用Kaplan-Meier法计算两组的生存率并作生存率曲线图,从两组的生存率曲线可以发现两条样本估计的生存率曲线大约在40天处交叉,在40天之前对照组的患者生存率高于实验组,而40天之后则实验组生存率高于对照组,并且两条生存曲线的差异是比较明显的,这两条交叉生存曲线提示对照组治疗有可能不会很快死亡,但实验组手术不太成功者很快死亡,而实验组手术成功能够存活35天以上的对象可能生存期会较长。log-rank检验是一种假设检验来比较存活两个样品的分布,它是一种非参数检验。本文通过对已知实验数据进行log-rank检验通过对两组生存曲线的比较,得知两组实验中病人的生存时间有很

3、大差异。cox模型用于研究各种因素(称为协变量,或伴随变量等)对于生存期长短的关系,进行多因素分析。本例中sex和age两个变量对生存时间的影响都显著。关键词:淋巴肿瘤 生存分析 log-rank检验 cox模型一、数据来源本文收集了2期的某型淋巴瘤患者的生存时间(天)。分别是:实验组:198,165,105,36,24,64,38,69,84,109,148,176,126,96,192,159,120+,240+,730+,730+,730+,730+,730+,730+,730+,730+,对照组:126,109,76,58,69,63,59,88,65,210+,730+,730+,7

4、30+,730+。以及两组生存时间的影响因素:sex及age。其中sex分为1,2两组,男性为1,女性为2;age分为两个年龄层,小于40岁为1,大于等于40岁为2。二、模型解释生存分析主要包括三种分析方法:非参数分析、半参数分析和参数分析。非参数方法不引入任何的外生变量,仅和确诊后存活时间有关;半参数分析方法,一部分和确诊后存活时间有关,另外一部分和某些外生变量有关,但不依赖于特定的分布假设;而参数分析方法则依赖于特定分布的假设。用表示生存时间,即确诊后存活的时间,则的分布函数为:生存函数定义为生存时间大于给定时间t的概率,其数学表达式为:式中为生存函数或生存率,本文中指的是确诊后存活的时间

5、大于t的概率。生存函数的估计量为:该统计量称为K-M估计量(Kaplan-Meierestimator)。累积风险函数估计量(Nelson-Arden estimator)为:另外一个重要的概念是风险函数,它是指当确诊后存活的时间达到的条件下,在时刻瞬间存活的概率,即:考虑一个离散的情况,设为样本可观察的离散寿命时间。定义是确诊后存活时间在时刻结束的样本个数。在随访时间结束时某些个体还没有发生确诊后存活的称为审查数据。定义是在区间发生右审查的样本个数。定义是在时刻之前处在可能迁移风险中的样本个数,即设是在时刻发生迁移的瞬时概率,一个明显的估计是用确诊后存活时间在时刻结束的样本个数除以时刻之前处

6、在可能发生确诊后存活的样本个数,即:在以上非参数分析方法中,迁移的风险函数只和时间有关,但是在现实生活中影响迁移的因素还有很多,因此还需要考虑其他变量对迁移的影响。可用半参数模型(也称为Cox比例风险模型)进行分析。cox模型假定自变量具有参数形式,而允许基准风险函数不具备特定的形式,常被用来说明变量对生存时间的影响效果。一般形式为:各参数意义:为基准风险函数,表示时点t的本底死亡率,是不确定的;是时点t的死亡率;为回归系数,X为自变量向量。如反映因素x1的作用,使死亡率由增加到。是总体回归系数的估计值,若x1对生存无影响,则理论上=0,=1。(假设:风险率不随时间变化)Kaplan-Meie

7、r估计是常用来估计存活曲线的方法,其乃是用每一事件发生时间点及设限点来设定区间,较适用于一般临床相关研究。三、SAS程序1.非参数法data example1_1;input t c;if t26 then group=2; else group=1;cards;198 1 165 1 105 1 36 1 24 1 64 1 38 1 69 1 84 1 109 1 148 1 176 1 126 1 96 1 192 1 159 1 120 0 240 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 126 1 109 1 76 1 58

8、 1 69 1 63 1 59 1 88 1 65 1 210 0 730 0 730 0 730 0 730 0 ;proc lifetest plots=(s);time t*c(0);strata group;run;2.Kaplan-Meier估计proc lifetest plots=(s) method=pl;time t*c(0);strata group;run;3.log-rank检验data example1_1;do c=1 to 2;input n;do i=1 to n;input time censor ;output;end;end;cards;26198 1 1

9、65 1 105 1 36 1 24 1 64 1 38 1 69 1 84 1 109 1 148 1 176 1 126 1 96 1 192 1 159 1 120 0 240 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 14126 1 109 1 76 1 58 1 69 1 63 1 59 1 88 1 65 1 210 0 730 0 730 0 730 0 730 0 ;proc lifetest plots=(s);time time*censor(0);strata c;run;4.cox模型data example1_

10、1;do c=1 to 2;input n;do i=1 to n;input time censor sex age ;output;end;end;cards;26198 1 1 1 165 1 1 1 105 1 2 1 36 1 2 2 24 1 2 2 64 1 2 1 38 1 2 2 69 1 1 2 84 1 1 2 109 1 2 1 148 1 1 2 176 1 1 1 126 1 2 1 96 1 1 2 192 1 1 1 159 1 1 1 120 0 1 2 240 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730

11、 0 1 1 730 0 1 1 730 0 1 1 730 0 1 114126 1 1 1 109 1 2 1 76 1 1 2 58 1 2 1 69 1 2 1 63 1 1 2 59 1 1 2 88 1 1 1 65 1 1 2 210 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1;proc phreg plots=(s);model time*censor(0)=sex age;strata c;run;四、输出结果及分析1.用乘积极限法估计了生存率(Survival);死亡率(Failure),生存率的标准误(Survival St

12、andard Error),死亡例数(Number Failed)和该时间点前的生存例数(Number Left)。其中带有*号的表示截尾。给出了关于生存时间的描述性统计量,包括75%,50%和25%分位数以及相应的95%的可信区间(95% Confidence Interval),还有均数(Mean)和标准误(Standard Error)从结果可以看出平均生存时间为144.428和95.929天;LIFETEST 过程层 1: c = 1乘积极限生存估计值time生存失效生存标准误差失败数目剩余数目0.0001.00000002624.0000.96150.03850.037712536.

13、0000.92310.07690.052322438.0000.88460.11540.062732364.0000.84620.15380.070842269.0000.80770.19230.077352184.0000.76920.23080.082662096.0000.73080.26920.0870719105.0000.69230.30770.0905818109.0000.65380.34620.0933917120.000*.916126.0000.61300.38700.09601015148.0000.57210.42790.09791114159.0000.53120.

14、46880.09911213165.0000.49040.50960.09951312176.0000.44950.55050.09931411192.0000.40870.59130.09831510198.0000.36780.63220.0966169240.000*.168730.000*.167730.000*.166730.000*.165730.000*.164730.000*.163730.000*.162730.000*.161730.000*0.36780.6322.160时间变量“time”的汇总统计量四分位数估计值百分比点 估计值95% 置信区间变换下限上限)75.LO

15、GLOG192.000.50165.000LOGLOG105.000.2596.000LOGLOG36.000148.000均值标准误差144.42812.183LIFETEST 过程层 2: c = 2乘积极限生存估计值time生存失效生存标准误差失败数目剩余数目0.0001.00000001458.0000.92860.07140.068811359.0000.85710.14290.093521263.0000.78570.21430.109731165.0000.71430.28570.120741069.0000.64290.35710.12815976.0000.57140.428

16、60.13236888.0000.50000.50000.133677109.0000.42860.57140.132386126.0000.35710.64290.128195210.000*.94730.000*.93730.000*.92730.000*.91730.000*0.35710.6429.90时间变量“time”的汇总统计量四分位数估计值百分比点 估计值95% 置信区间变换下限上限)75.LOGLOG88.000.5098.500LOGLOG63.000.2565.000LOGLOG58.00088.000均值标准误差95.9298.169删失值和未删失值个数汇总层c总计失败

17、删失删失百分比1126161038.4622149535.71总计40251537.50列出了完全数据(Failed),截尾数据(Censored)的例数,以及截尾数据占全部数据的百分比(Percent Censored)。LIFETEST 过程检验 t 在层之间的生存曲线的齐性秩统计量group对数秩Wilcoxon10.9750039.0002-0.97500-39.000对数秩统计量的协方差矩阵group1210.024375-.0243752-.0243750.024375Wilcoxon 统计量的协方差矩阵group12139.0000-39.00002-39.000039.0000

18、层间等效检验检验卡方自由度Pr 卡方对数秩39.00001.0001Wilcoxon39.00001卡方对数秩0.339110.5603Wilcoxon0.807710.3688-2Log(LR)0.138810.70953.log-rank检验的输出结果。这里只给出了两个(c=1,2)总体生存率之间是否有差异的检验结果,其他的输出结果与前面类似,不再列出。由结果可以发现两组的log-rank秩统计量分别为-1.3320和1.3320,检验统计量为0.3391,p值为0.5603,所以在为0.05的显著性水平下,拒绝,接受,可认为两个(c=1,2)总体生存率之间存在差异。LIFETEST 过程

19、检验 time 在层之间的生存曲线的齐性秩统计量c对数秩Wilcoxon1-1.3320-60.00021.332060.000对数秩统计量的协方差矩阵c1215.23197-5.231972-5.231975.23197Wilcoxon 统计量的协方差矩阵c1214457.16-4457.162-4457.164457.16层间等效检验检验卡方自由度Pr 卡方对数秩0.339110.5603Wilcoxon0.807710.3688-2Log(LR)0.138810.7095Log-rank检验输出两组数据生存曲线图:4.Cox模型输出结果。Phreg过程输出结果:模型总的检验有统计学意义,各个回归系数的P 卡方似然比49.22652.0001评分51.99452 卡方危险比sex14.144881.0727014.93030.000163.110age14.356681.0784116.3209.000177.997用于绘图的协变量的参考集Stratumcsexage11.0000001.2692311.30769222.0000001.2142861.285714

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 商业贸易


经营许可证编号:宁ICP备18001539号-1