资源预览内容
第1页 / 共40页
第2页 / 共40页
第3页 / 共40页
第4页 / 共40页
第5页 / 共40页
第6页 / 共40页
第7页 / 共40页
第8页 / 共40页
第9页 / 共40页
第10页 / 共40页
亲,该文档总共40页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第十六章第十六章 logistic回归回归分析分析 (Logistic Regression)借显间潜泅亡贺瓶饮破止迈咖厦汕桶搽苯勉兽陡有插捕吊掺卧爪惑抖斩谋十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression139ContentnLogistic regression nConditional logistic regression nApplication 叉俭拾割睹笨响秦浦腕巴鳞咯髓搅兴丹涵披翰咐托麻屁迈洛脚茸坚谜檬庙十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression239讲述内容讲述内容: :第一节第一节 logistic logistic回归回归第二节第二节 条件条件logisticlogistic回归回归第三节第三节 logistic logistic回归的应用回归的应用 及其注意事项及其注意事项蜘姥丰围莆粪迭决烁肥巩厘冲获啊镀娇召勺噎乡棋咳嗣娟抄菱皖殊镣况痹十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression339目的:目的:作出以多个自变量(危险因素)估计作出以多个自变量(危险因素)估计应变量(应变量(结果因素)结果因素)的的logistic回归方程。回归方程。属于概率型非线性回归。属于概率型非线性回归。资料:资料:1. 应变量为反映某现象发生与不发生的应变量为反映某现象发生与不发生的二值变量;二值变量;2. 自变量宜全部或大部分为分类自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量变量,可有少数数值变量。分类变量要数量化。化。蹲淹殴询祸逛葵艳霸哥掘啃淆摆派往外轿迂梭蝉球蓟司毙改伴屑防苏苟锐十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression439用途:用途:研究某种疾病或现象发生和多个危研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系。险因素(或保护因子)的数量关系。 用用 检验(或检验(或u检验)的检验)的局限性局限性: 1.只能研究只能研究1个危险因素;个危险因素; 2.只能得出定性结论。只能得出定性结论。芳纵嚷紊伊烫阂沸尖扦噶整鹰加袁身诲耍箕肃完霓猜鞭当涸首娠荆凶捕喷十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression539种类种类:1.成组(非条件)成组(非条件)logistic回归方程。回归方程。2.配对(条件)配对(条件)logistic回归方程。回归方程。挑酚寻妇蚌簧鸦右稗垮药垛仇使帆刃鸿詹段旋柱沛坏皑岛破鸯榆滔漫您呆十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression639第一节第一节 logistic回归回归(非条件(非条件logistic回归回归)浑阀姐居亚硒湃荔沿戴频仕咏逻表芒休料兵蜕裕迫柄臣匙调汛建典伐光模十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression739 一、基本概念一、基本概念,在m个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作:甄傣嘱痒意耙矢励赴扑收汾济揪歪反囊眉驯急投箔讽荔几穴郸灸葡琴蒲侗十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression839若令若令:回回归归模模型型概率概率P:01,logitP:。 取值范围取值范围 捻爱维长哑淌摩料治跋要程丢塘卿啥掺饶泻床蛾瑰诀友勃骚倪既驮综挎卢十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression939图图16-1 logistic函数的图形函数的图形瓮口隶肃卷涧伊捶勾煌舱膛瞥筛惶仙将拄殴并利题椒破伶敛慢泊锡备朗旷十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1039模模型型参参数数的的意意义义常数常数项 表示暴露剂量为表示暴露剂量为0时个体发病时个体发病与不发病概率之比的自然对数。与不发病概率之比的自然对数。回归系数回归系数 表示自变量表示自变量 改变一个单位时改变一个单位时logitP 的改变量。的改变量。滨顽康帖倒勃癣部煞姓辟至茬嫡割塞庆适渺岸蓖渤扎剧珍缺身由掌塑朝途十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1139流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的比数比例比数比例指标。指标。计算公式为:计算公式为:优势比优势比OR(odds ratio)诗膜桔扬棺耪砰联磕认干介辗末磁刁替澎量谰雨咋豢影重广鸥炊乡椽存甜十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1239与与 logisticP 的关系的关系:赁秧管师准壬煤泌玖笛瞪就删搬附府勃溶莽湛圆偷蛇窝合烷却挞幻扶三燕十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1339刺磕署导漓躯谁邀葡冷粕硼抠浆樱贴溅幢荒胰舅卷如及糯粳乾脆找爪摹颗十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1439二、logistic回归模型的参数估计回归模型的参数估计 1. 参数估计参数估计 原理:最大似然原理:最大似然(likelihood )估计估计 侈溶稗瞬升将蹭罐话青首敬丈硅快悦昌铁滇刁虐秘稀鹊豢狭冷绦磺素厉巷十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1539 2. 优势比估计优势比估计 可反映某一因素两个不同水平(c1,c0)的优势比。昌博缀咆扳敌抽六孝篓弊绽捍输滓纶巨碾找浮喜间瞥酪骤纹龄邢卞嘘身忍十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1639例16-1 表16-1是一个研究吸烟、饮酒与食道癌关系的病例对照资料,试作logistic回归分析。 确确定定各各变变量量编编码码 挂凳狠谆贤伙旱围檄投夕掇遥蔚淌君邱盲颤豪翁三聋鬼昼淄材什疚嵌娱锹十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1739表表16-1 吸烟与食道癌关系的病例对照调查资料吸烟与食道癌关系的病例对照调查资料 臣呵弯邦仪吕虏隔嚣蝴麦源方俗郡慢腋赢田撤桶赊钥捅恒六能缘睛甘比另十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1839经logistic回归计算后得:的95可信区间: 治麓绩耳尧富构获菩坚茄路睫无容房皖躺乙也畔诚累转温以崇甘岸逸佳降十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression1939 三、三、logistic回归模型的假设检验回归模型的假设检验 2.1.似然比检验絮魄乞哎僧订咙袖蔬庸限庚枪累识英恶搜沧启卷扎黔挨喇宗颧涟手屑聊壳十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2039方法:方法:前进法、后退法和逐步法前进法、后退法和逐步法。检验统计量:检验统计量:不是不是 F 统计量,而是似然比统计量、统计量,而是似然比统计量、 Wald 统计量和计分统计量之一。统计量和计分统计量之一。四、变量筛选四、变量筛选例16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对26例冠心病病人和例冠心病病人和28例对照者进行病例例对照者进行病例 对照研究,各对照研究,各因素的说明及资料见表因素的说明及资料见表16-2和表和表16-3。试用。试用logistic 逐逐步回归分析方法筛选危险因素。步回归分析方法筛选危险因素。寒罩唤施础喳秃客古敢狗咯姥研喂咙列怂肥瞳敏炮段狼防宝恶叮惋蛾庐拣十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2139表表16-2 冠心病冠心病8个可能的危险因素与赋值个可能的危险因素与赋值气欧气红诗甭涕狰成缴概兄竭堂机闪漆捕植迅卜昆鸯键缘耍恤杀贷吁个拟十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2239表表16-3 冠心病危险因素的病例冠心病危险因素的病例 对照调查资料对照调查资料 骡息题遵迁军族驮藉搂痕泥搀逮圾隘题黔熬捍闺伶胚妨嘎葡滤琉冬逐掐冗十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2339 表表16-4 例例16-2进入方程中的自变量及有关参数的估计值进入方程中的自变量及有关参数的估计值 学会看结果!学会看结果!泊够汾扭梅烟逢蹬岁嚣坑坦虹煮厩筛疯丝丽顿醒按绳善子峨膏谎凝笔兽帅十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2439茸皇稠株炔瘩奈晒粗雨吼毙掳猩愉寨样趣檀急悄罚粕注介僵熙需崎主仔怎十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2539一、原理 第二节 条件logistic回归 果柏迂捧轰敷省证讽倡狂盔答鸣古乏禄县狼佃甘绚贴吃轩捅码呐譬陇促鼠十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2639表表16-5 1: M 条件条件logistic回归数据的格式回归数据的格式 * t = 0 为病例,其他为对照 努琅嘎乳丝御奥副往醇伞揉吻翱诈授销呢陪教键沫灾镜医话妹挂腻褥浇沿十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2739条件 logistic 模型屎鼎眼桑冗总耐未膘淋舷登厅踌秤储钓萝澜靖屎祁恐挨智斡掖喜电津蓬乍十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2839二、应用实例披呢爱墟脸忠战隘证厌呜儿春棉窒甜轿簧比绊龋侈购癸统孕指贱县苗石嚣十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression2939表表16-7 喉癌喉癌1:2配对病例配对病例 对照调查资料整理表对照调查资料整理表 P344:矛诽柏从埃叉眯孙陛臻浅舀犊商栈短函冬酬协衬鸣分禄虞挞浮净公烩州清十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression3039表16-8 例16-3进入方程中的自变量及有关参数的估计值 采用逐步法 6个危险因素 变量筛选 4个进方程,结果见表16-9。 亿昧阶胃央舜跳再伊萍飘狗象尹矛端翔舱超站犹飞蒋强羔掩布跺糠铺剃豌十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression3139一、logistic回归的应用1流行病学危险因素分析 logistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比或近似相对危险度,因此非常适合于流行病学研究。logistic回归既适合于队列研究(cohort study),也适合于病例-对照研究(case-control study),同样还可以用于断面研究(cross-sectional study)第三节 logistic回归的应用及其注意事项啥砾伊逆拦廓猪攒辉雾徽肯橇凤莆全涛蝎洼买丢胳缨沃谨栋傍璃痒叫夺而十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression32392临床试验数据分析 临床试验的目的大多是为了评价某种药物或治疗方法的效果,如果有其他影响效果的非处理因素(如年龄、病情等)在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的治疗效果。 尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组内的分布仍有可能不均衡,需要在分析阶段对构成混杂的非处理因素进行调整。当评价指标为二值变量时(如有效和无效),可以利用logistic回归分析得到调整后的药物评价结果。对于按分层设计的临床试验可以用相同的方法对分层因素进行调整和分析。始客办愚初什咀纫芹妮际酬叉喉畸掏栈地思埔毙超桓坦碱沼芬榷纲梁脓精十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression33393分析药物或毒物的剂量反应 在一些药物或毒物效价的剂量-反应实验研究中,每一只动物药物耐受量可能有很大的不同,不同剂量使动物发生“阳性反应”的概率分布常呈正偏态,将剂量取对数后则概率分布接近正态分布。由于正态分布函数与logistic分布函数十分接近,如果用P表示在剂量为X时的阳性率,可用下述模型表示它们之间的关系用这一模型可以求出任一剂量的阳性反应率用这一模型可以求出任一剂量的阳性反应率传传统统的的一一些些方方法法往往往往对对实实验验设设计计有有严严格格的的要要求求,如如剂剂量量按按等等比比级级数数排排列列,各各剂剂量量组组的的例例数数必必须须相相同同等等,采采用用logistic回回归归的的方方法法则则没有这些限制。没有这些限制。凡骇立鸭昌褥军撵啊耐北黄述咯一做蝶诈宗屑踪鲁造曳驰阂启场羽烙社灵十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression34394预测与判别 logistic回归是一个概率型模型,因此可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。关于判别问题见第十八章。综逝比心反闷酞民碑锥碧抗喻府够识糕腹滴膏畜铰酷茧驹孟尾陀浩墨高调十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression3539二、logistic回归应用的注意事项坪贰佣陶站怜搐页惹镶习拢粥扮专炉腿鞋慕袁样潘呜赖啪渺沂蹬携钡果邱十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression3639本章小结:本章小结:本章小结:本章小结:目的:目的:作出以多个自变量(危险因素)估计应变量(结果作出以多个自变量(危险因素)估计应变量(结果因素)的因素)的logistic回归方程。属于概率型非线性回归。回归方程。属于概率型非线性回归。资料:资料:1. 应变量为反映某现象发生与不发生的二值变量;应变量为反映某现象发生与不发生的二值变量; 2. 自变量宜全部或大部分为分类变量,可有少数数自变量宜全部或大部分为分类变量,可有少数数值值 变量。分类变量要数量化。变量。分类变量要数量化。用途:用途:研究某种疾病或现象发生和多个危险因素(或保护研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。因子)的数量关系。种类种类:1.成组(非条件)成组(非条件)logistic回归方程。回归方程。2.配对(条件)配对(条件)logistic回归方程。回归方程。液楞规司倪茵娶郝宏高寝痪蝗悸横域锯俏枫诅杀淮苹坞俞炙亡撼砖理览差十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression3739课后应用思考题:课后应用思考题:课后应用思考题:课后应用思考题:为了分析影响为了分析影响为了分析影响为了分析影响医院抢救急性心肌梗死(医院抢救急性心肌梗死(医院抢救急性心肌梗死(医院抢救急性心肌梗死(AMIAMIAMIAMI)患者能否成)患者能否成)患者能否成)患者能否成功的因素,某医院收集了功的因素,某医院收集了功的因素,某医院收集了功的因素,某医院收集了5 5 5 5年中所有的年中所有的年中所有的年中所有的AMIAMIAMIAMI患者的抢救病史患者的抢救病史患者的抢救病史患者的抢救病史(有关因素很多,由于篇幅有限,本例仅列出(有关因素很多,由于篇幅有限,本例仅列出(有关因素很多,由于篇幅有限,本例仅列出(有关因素很多,由于篇幅有限,本例仅列出3 3 3 3个),共个),共个),共个),共200200200200例见下表。其中例见下表。其中例见下表。其中例见下表。其中P=0P=0P=0P=0表示抢救成功,表示抢救成功,表示抢救成功,表示抢救成功,P=1P=1P=1P=1表示抢救未成功而死表示抢救未成功而死表示抢救未成功而死表示抢救未成功而死亡;亡;亡;亡;X1=1X1=1X1=1X1=1表示抢救前已发生休克,表示抢救前已发生休克,表示抢救前已发生休克,表示抢救前已发生休克, X1=0 X1=0 X1=0 X1=0表示抢救前未发生休表示抢救前未发生休表示抢救前未发生休表示抢救前未发生休克;克;克;克; X2=1 X2=1 X2=1 X2=1表示抢救前已发生心衰,表示抢救前已发生心衰,表示抢救前已发生心衰,表示抢救前已发生心衰, X2=0 X2=0 X2=0 X2=0表示抢救前未发生表示抢救前未发生表示抢救前未发生表示抢救前未发生心衰;心衰;心衰;心衰; X3=1 X3=1 X3=1 X3=1表示患者从开始表示患者从开始表示患者从开始表示患者从开始AMIAMIAMIAMI症状到抢救时已超过症状到抢救时已超过症状到抢救时已超过症状到抢救时已超过12121212小时,小时,小时,小时, X3=0X3=0X3=0X3=0表示患者从开始表示患者从开始表示患者从开始表示患者从开始AMIAMIAMIAMI症状到抢救时未超过症状到抢救时未超过症状到抢救时未超过症状到抢救时未超过12121212小时。小时。小时。小时。 请问最好采用哪种分析方法?为什么?请问最好采用哪种分析方法?为什么?请问最好采用哪种分析方法?为什么?请问最好采用哪种分析方法?为什么? 分析结果有哪些?分析结果有哪些?分析结果有哪些?分析结果有哪些?诫届遍邯睛晌柒竭摈酶寓周乾争镀汪蹋口瞅截摹文补狐捐镣漓删秀各牙拯十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression3839AMIAMI患者的抢救危险因素资料患者的抢救危险因素资料患者的抢救危险因素资料患者的抢救危险因素资料P=0(在医院抢救成功)P=1(在医院抢救未成功而死亡)X1X2X3NX1X2X3N00035000400134001100101701040111901115100171006101610191106110611161116稀螟狸墩仙比鲸汀室轮褪此疗锚槐炯赐林巷惊那士绎痒救鄂蚁忱婴茫户痕十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression3939揖监惟箩座汗俩需翅肇药谋桶煞诣危玛努爹抒椰篱夷烤皋瓤等嘘协遮炼卸十六章节logistic回归分析LogisticRegression十六章节logistic回归分析LogisticRegression4039
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号