资源预览内容
第1页 / 共34页
第2页 / 共34页
第3页 / 共34页
第4页 / 共34页
第5页 / 共34页
第6页 / 共34页
第7页 / 共34页
第8页 / 共34页
第9页 / 共34页
第10页 / 共34页
亲,该文档总共34页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
,Logistic回归,多元线性回归分析可用来分析多个自变量与一个因变量的关系,模型中因变量Y是连续型随机变量,并要求呈正态分布。但在医学研究中,常碰到因变量为非连续的分类变量。常见的有3类: (1)二项分类,如某种疾病的患与不患,某一治疗的有效和无效,药物实验中动物的死亡或生存等。 (2)多项有序分类,如某一药物的治疗效果是:治愈、显效、有效、无效。,概述,(3)多项无序分类:如研究肝炎的分型,肝炎可分为甲、乙丙、丁、戊型等。 研究分类因变量与多个自变量间的相互关系,进行疾病的病因分析常选用logistic回归分析。 logistic回归分类 按因变量的类型 二分类logistic回归 多分类有序logistic回归 多分类无序logistic回归 按设计的类型 非条件logistic回归 条件logistic回归,第一节 两分类Logistic回归,Logistic回归模型,模型参数的意义,Logistic回归模型的假设检验,Logistic回归的应用,Logistic回归模型的参数估计,Logistic回归模型中自变量的筛选,26例冠心病病人和28例对照者进行病例?对照研究,logistic回归模型,令二分类应变量Y=,1某事件发生 0某事件不发生,对应变量Y有影响的因素有m个(自变量):x1,x2,xm。则有,这种P与自变量之间的回归关系式称为Logistic回归模型。 将P变换为lnP/(1-P)称为logit变换,记为logit(P)。 logit变换使得在0,1范围内取值的P变换到(-,+),当P趋向于0时, logit(P)趋向-;当P趋向于1时, logit(P)趋向+;,logistic回归模型,概率预报模型,(1)截距 的意义:自变量全为0,即各自变量对应变量不产生作用时 发病与不发病的概率之比的自然对数。它反映了疾病的本底状态。 (2)回归系数 的意义:,二、logistic回归模型中参数的意义,令其他自变量固定不变,自变量xj的取值从xj=a变到xj=a+1,则,模型参数的意义,j的意义:在其他自变量固定不变的条件下,xj每改变一个单位,引起优势比ORj自然对数值的平均改变量。 当j =0时, ORj=1, 说明自变量xj对事件是否发生不存在影响; 当j 0时, ORj=exp(j)1, 说明xj是危险因素; 当j 0时, ORj=exp(j)1, 说明xj是保护因素。,三、回归模型的估计与假设检验,模型估计,线性回归,用最小二乘估计(LSE) Logistic回归,用极大似然估计,总体回归系数j的(1-)置信区间为 总体优势比ORj的(1-)置信区间为,目的:检验回归模型中自变量的系数是否为零,等价于总体优势比OR是否为1。 H0: j =0 H1: j 0 A、wald检验: wald检验的卡方值是z的平方 B、likelihood ratio test(似然比检验),偏回归系数的检验,四、回归模型中自变量的筛选,和多元线性回归分析一样,在Logistic回归分析中也须对自变量进行筛选。 方法和多元线性回归中采用的方法一样,有向后剔除法、向前引入法及逐步筛选法三种。 筛选自变量的方法有wald检验、Score test、likelihood ratio test(wald chi-square test)三种。 引入:=0.05;剔除:=0.10,五、logistic回归模型的应用,1.疾病影响因素的研究,病因学研究 病例-对照研究 队列研究 影响因素的研究 横断面调查 临床试验,2.控制和校正混杂因素,一般采用Mantel-Haenszel分层分析 logistic回归分析可综合校正多个混杂因素的影响,3.疾病预后的估计,logistic回归模型作为一种概率模型,可用于预测某事件发生的概率。,例18-1 调查5311例孕妇吸烟及孕前6个月内服用避孕药的新生儿情况,资料如表18-1,分析吸烟对新生儿异常的影响在孕前服与未服避孕药的孕妇中有无差别。,两分类logistic回归的应用,表18-1 5311例孕妇吸烟、孕前服避孕药的新生儿情况,1.建立数据文件,在SPSS数据编辑窗,建立数据文件Li18-1.sav。 自变量:“吸烟” :Values为:1“吸”, 0“不吸” ;“避孕药”,:Values为:1“已服”, 0“未服” ; 应变量:“新生儿情况”,Values为:1“异常”,0“正常” ; 频数变量:“例数”。,2. spss操作过程,(1)在spss中调出数据文件Li18-1.sav (2)变量加权 从菜单选择DataWeight Cases 选中Weight cases by 将例数选入 Frequency Variable框 (3)logistic回归。 从菜单选择 AnalyzeRegression Binary Logistic(两分类Logistic回归),2. spss操作过程,指定 Dependent:新生儿情况 Covariates(协变量):吸烟、避孕药 吸烟*避孕药 击Save按钮:选择Probabilities(发生概率预测值) 击Options按钮:选择CI for expB(优势比的95%置信区间),保存,选项,模型的似然比检验:当前模型2=17.858,P=0.000,回归模型有统计学意义。,模型检验,结果表明:避孕药是新生儿异常的危险因素,OR=1.254,P=0.007。即排除吸烟、吸烟与避孕药的交互影响后,孕前6个月服用避孕药导致新生儿异常是未为服避孕药的1.254倍。,方程中的变量输出结果,概率预报模型,例18-2 为探讨胃癌的有关危险因素和保护因素,对32例胃癌病人及36例对照者进行病例对照研究,收集资料见表18-2 ,用逐步回归分析方法筛选上述因素,进行logistic回归分析。,两分类logistic回归的应用,表8-2 32例胃癌病人和36例对照者病例?对照研究,2. spss操作过程,(1)在spss中调出数据文件Li18-3.sav (2)logistic回归。从菜单选择 AnalyzeRegression Rinary Logistic(两分类Logistic) 指定 Dependent:Y Covariates(协变量):X1、X2、X3、X4、X5、X6 在Method(方法)中:指定Forward LR(似然比向前) 击Save按钮,选择Probabilities(概率预测值) 击Options按钮,在Display(输出)中:At last step(在最后一个步骤中),偏似然比估计向前法,选项,模型的似然比检验:当前模型:2=59. 589,P=0.000,回归模型有统计学意义,即6项指标中至少有一个的作用是有统计学意义的.,最后结果的模型检验,方程中的变量输出结果,方程中的变量:X1、X4、X5、X6的wald统计量=3.512、8.871、6.275、6.158,概率P0.1,其偏回归系数在0.10水平上有统计学意义。,结果分析,优势比ORj=exp(bj)=1.112、5.589、9.006、3.825均大于1,这4个因素都是胃癌的危险因素,年龄大、吃盐渍食物及嗜重盐饮食和精神心理因素不良,对胃癌的影响都很大。,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号