资源预览内容
第1页 / 共49页
第2页 / 共49页
第3页 / 共49页
第4页 / 共49页
第5页 / 共49页
第6页 / 共49页
第7页 / 共49页
第8页 / 共49页
第9页 / 共49页
第10页 / 共49页
亲,该文档总共49页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
多元统计分析方法,The Methods of Multivariate Statistical Analysis,生存分析,Survival Analysis,第十章,主要内容,什么是生存分析? 生存分析的基本概念 生存分析的基本方法 非参数分析方法 Cox比例风险回归分析方法 生存分析的注意事项,数据的收集方式: 横断面数据(cross-sectional data) 在同一个时间点上收集的数据; 纵断面数据(longitudinal data) 在连续的若干个时间点上收集的数据。 - 随防数据:50个人的术后存活时间 - 时间序列数据:近20年每年的肺癌死亡率,在医学研究中,常常用追踪(follow up)的 方式来研究事物发展的规律。例如: 了解某药物的疗效 了解手术后的存活时间 了解某医疗仪器设备的使用寿命 这种研究的特点是追踪研究的现象都要经过一段时间,统计学上将这段时间称为生存时间。,生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法。,一、什么是生存分析?,二、生存分析的基本概念,生存时间 生存时间数据的类型 生存时间数据的特点 生存分析资料的收集方法 描述生存时间分布规律的函数 生存分析的主要研究内容,A) 生存时间 (survival time): 从某起始事件起到某终止事件止所经历的时间跨度称为生存时间。例如, 在临床研究中,急性白血病患者从骨髓移植治疗开始到复发为止之间的时间间隔。 冠心病患者在两次发作之间的时间间隔。 在流行病学研究中,从开始接触某危险因素到发病所经历的时间。 在动物实验研究中,从开始给药到发生死亡所经历的时间。,B) 生存时间数据的类型 完全数据(complete data):它准确地度量了观察对象实际生存的时间。 截尾数据(censored data):它没有准确地度量观察对象实际生存的时间。例如, 在随访过程中某些观察对象失访; 或死于其它原因; 或在规定的研究过程结束时观察对象的终止事件还未发生。,C) 生存时间数据的特点: 1)所有观察值取值非负 2)存在截尾数据 生存分析资料的收集方法: 1)确定随访内容(指标变量) 2)确定随访人数(样本数) 3)确定随访的起始和终止时间 同时开始,同时结束 不同时间开始,同时结束 不同时间开始,不同时间结束,E) 描述生存时间分布规律的函数: 1、生存函数 2、 死亡函数 3、 死亡密度函数 4、 风险函数,生存函数S(t):观察对象的生存时间T大于某时刻 t 的概率称为生存函数(survival function)。S(t)满足条件:S(0)=1, S()=0,且0S(t)1。,死亡函数F(t):观察对象的生存时间T不大于某时刻 t 的概率称为死亡函数(failure function)。F(t)满足条件:F(0)=0, F()=1,且0F(t)1。,死亡密度函数f(t):观察对象在某时刻t 的瞬时死亡率称为死亡密度函数(failure density function)。,风险函数h(t):生存到时刻 t 的观察对象在时刻t 的瞬时死亡率称为风险函数(hazard function)。,F) 生存分析的主要研究内容: 1、描述生存过程 2、比较生存过程 3、分析危险因素 4、建立数学模型,1、描述法 2、非参数分析法 3、参数分析法 4、半参数分析法,三、生存分析的基本方法,1、描述法:根据样本观察值提供的信息,直接用公式计算出每一时间点或每一个时间区间上的生存函数、死亡函数、风险函数等,并采用列表或绘图的形式来显示生存时间的分布规律。 优点:方法简单,且对数据的分布无要求。 缺点: 1) 不能比较两组或多组生存时间分布函数的区别; 2) 不能分析危险因素对生存时间的影响; 3) 不能建立生存时间与危险因素之间的关系模型。,例1、某研究者收集了两组急性淋巴细胞性白血病患者治疗后的随访资料,其中,有淋巴结浸润组(LA)18人,无淋巴结浸润组(NLA)25人。生存时间T (月)的数据如下。 协变量为淋巴结状态(SLN),负数代表截尾数据。LA组: 1,2,3,4,5,7,8,9,10,11,13,14,15,18,-19,-20,-21,23 NLA组:1,2,3,4,5,7,8,9,10,11,13,14,15,18,19,-20,21,23, 26,28,31,37,66,73,-124,Standard Number Number T Survival Failure Error Failed Left 0.000 1.0000 0 0 0 18 1.000 0.9444 0.0556 0.0540 1 17 2.000 0.8889 0.1111 0.0741 2 16 3.000 0.8333 0.1667 0.0878 3 15 4.000 0.7778 0.2222 0.0980 4 14 5.000 0.7222 0.2778 0.1056 5 13 7.000 0.6667 0.3333 0.1111 6 12 8.000 0.6111 0.3889 0.1149 7 11 9.000 0.5556 0.4444 0.1171 8 10 10.000 0.5000 0.5000 0.1179 9 9 11.000 0.4444 0.5556 0.1171 10 8 13.000 0.3889 0.6111 0.1149 11 7 14.000 0.3333 0.6667 0.1111 12 6 15.000 0.2778 0.7222 0.1056 13 5 18.000 0.2222 0.7778 0.0980 14 4 19.000* . . . 14 3 20.000* . . . 14 2 21.000* . . . 14 1 23.000 0 1.0000 0 15 0,LA组生存时间分布规律,Standard Number Number T Survival Failure Error Failed Left 0.000 1.0000 0 0 0 25 1.000 0.9600 0.0400 0.0392 1 24 2.000 0.9200 0.0800 0.0543 2 23 3.000 0.8800 0.1200 0.0650 3 22 4.000 0.8400 0.1600 0.0733 4 21 5.000 0.8000 0.2000 0.0800 5 20 7.000 0.7600 0.2400 0.0854 6 19 8.000 0.7200 0.2800 0.0898 7 18 9.000 0.6800 0.3200 0.0933 8 17 10.000 0.6400 0.3600 0.0960 9 16 11.000 0.6000 0.4000 0.0980 10 15 13.000 0.5600 0.4400 0.0993 11 14,NLA组生存时间分布规律,Standard Number Number T Survival Failure Error Failed Left 14.000 0.5200 0.4800 0.0999 12 13 15.000 0.4800 0.5200 0.0999 13 12 18.000 0.4400 0.5600 0.0993 14 11 19.000 0.4000 0.6000 0.0980 15 10 20.000* . . . 15 9 21.000 0.3556 0.6444 0.0966 16 8 23.000 0.3111 0.6889 0.0942 17 7 26.000 0.2667 0.7333 0.0906 18 6 28.000 0.2222 0.7778 0.0857 19 5 31.000 0.1778 0.8222 0.0793 20 4 37.000 0.1333 0.8667 0.0708 21 3 66.000 0.0889 0.9111 0.0596 22 2 73.000 0.0444 0.9556 0.0433 23 1 124.000* . . . 23 0,NLA组生存时间分布规律(续),Survival Function Estimates 1.0 + * | * SDF | *N | L*N | L*NN 0.5 + LLNNN | LL NNNN | LLL NNN | L-L N-N-N | | N-N-N 0.0 + L N -+-+-+-+-+-+-+-+-+-+-+- 0 10 20 30 40 50 60 70 80 90 100 Time,无淋巴结浸润患者(N)比有淋巴结浸润患者(L)的平均生存时间长。,两组急性淋巴细胞性白血病患者治疗后的生存时间比较,2、非参数法:估计生存函数时对生存时间的分布没有要求,并且检验危险因素对生存时间的影响时采用的是非参数检验方法。例如,乘积极限法和寿命表法。 优点: 1) 可以估计生存函数; 2) 可以比较两组或多组生存布函数; 3) 可以分析危险因素对生存时间的影响; 4) 对生存时间的分布没有要求。 缺点:不能建立生存时间与危险因素之间依存关系的数学模型。,两种非参数生存分析方法,乘积极限法(PL法):适用于离散数据,它用于建立时刻 t 上的生存函数。PL法是根据 t 时刻及其之前各时间点上的条件生存率的乘积来估计时刻 t 的生存函数S(t)和它的标准误SE(S(t)。,累积生存率:,标准误:,例如:P260, 表18.1,寿命表法(LT)法:LT法适用于区间数据,它用于建立时间区间 t, t +t)上的生存函数。LT法是根据时间区间t, t +t)左端点的生存率及其之前各区间左端点生存率之积来估计区间t, t +t)的生存函数S(t)和它的标准误SE(S(t)。,累积生存率:,标准误:,例如:P263, 表18.3,例1、某研究者收集了两组急性淋巴细胞性白血病患者治疗后的随访资料,其中,有淋巴结浸润组(LA)18人,无淋巴结浸润组(NLA)25人,数据如下。设因变量T为生存时间(月),协变量为淋巴结状态(SLN),截尾指标用censor表示,负数代表截尾数据。试用非参数的PL法进行生存分析,检验患者有无淋巴结浸润对其生存时间长短的影响。 LA组: 1,2,3,4,5,7,8,9,10,11,13,14,15,18,-19,-20,-21,23 NLA组:1,2,3,4,5,7,8,9,10,11,13,14,15,18,19,-20,21,23, 26,28,31,37,66,73,-124,【SAS程序】 data d1; input sln $ n; do i=1 to n; input t ; if t0 then censor=0; else censor=1; t=abs(t); output; end; cards; LA 18 1 2 3
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号