资源预览内容
第1页 / 共40页
第2页 / 共40页
第3页 / 共40页
第4页 / 共40页
第5页 / 共40页
第6页 / 共40页
第7页 / 共40页
第8页 / 共40页
第9页 / 共40页
第10页 / 共40页
亲,该文档总共40页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第十二章第十二章 LogisticLogistic回归回归Logistic regression主要内容 1. Logistic回归分析的数学模型 2. Logistic回归模型的建立和检验 3. Logistic回归模型系数的解释 4. 条件Logistic回归什么情况下采用Logistic回归 医学研究中经常需要分析定性分类数据,例如,生存与死亡、发病与未发病、阳性与阴性、治愈与未治愈、暴露与未暴露等二分类变量;又如,疾病程度(轻度、中度、重度)、治疗效果(治愈、显效、好转、无效)等多分类变量。显然这类资料不满足多元回归的条件 。 其根本原因是:因变量是分类变量 logistic回归(logistic regression)是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法。 不是直接分析因变量y与x的关系,而是分析y取某个值的概率p与x的关系,是概率型非线性回归。12.1 Logistic回归分析的数学模型 1.一元Logistic回归模型 假设因变量y是一个取值为1和0的二值变量,x是一个影响y的危险因子。令在x条件下y=1的概率是P= P(y=1|x)(1) 2.多元Logistic回归模型假设因变量y是一个取值为1和0的二值变量,变量 都是影响y的危险因子。其中 是待估计的回归系数。(2) 3.Logistic回归模型的另外一种形式Logit(逻辑)变换对(1)的概率p取Logit变换得:对(2)的概率p取Logit变换得:12.2 Logistic回归模型的建立和检验 1.估计参数 Logistic回归参数的估计通常采用最大似然法(maximum likelihood,ML)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。 假设有由N个案例构成的总体, 。从中随机抽取n个案例作为样本,观测值标注为 设 为给定 的条件下得到结果 的条件概率;而在同样条件下得到结果 的条件概率为 于是,得到一个观测值的概率为: 其中极大似然估计(maximum likelihood estimate, MLE) 2.检验参数检验Logistic回归模型参数的统计假设:统计量其中 的标准误,Z为标准正态分布统计软件中采用Wald检验,公式为 3.检验总体模型统计假设常用方法:(1)AIC检验法用于比较同一数据下的不同模型(含自变量个数不同)AIC值越小,模型越合适。其中L是最大似然函数;g是因变量取值个数;k是模型中自变量个数(2)SC检验法(和AIC一样)(3)似然比检验法(4)计分检验(score)3.Logistic回归模型系数的解释 优势比OR (odds ratio)流行病学衡量危险因素作用大小的比数比例指标。计算公式为: 与 logistic P 的关系:例 四格表资料吸烟吸烟 不吸烟病例55(a)128(b)对照19(c)164(d)四格表资料与logistic回归 X=1时 X=0 时四格表资料的logistic回归 X=1 表示吸烟 X=0 表示不吸烟计算结果OR值OR的95%CI对偏回归系数的假设检验由结果可看出,吸烟和饮酒均为食管癌发病的危险因素,吸烟人群发生食管癌的可能性是不吸烟人群的2.42倍,饮酒人群发生食管癌的可能性是不饮酒人群的1.69倍。 概率p值均小于0.05,说明方程有意义。对所拟合模型的假设检验:例2 为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明及资料见表2和表3。试用logistic 逐步回归分析方法筛选危险因素。学会看结果! 表4 例2进入方程中的自变量及有关参数的估计值 标准化回归参数 4. 条件logistic回归
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号