资源预览内容
第1页 / 共89页
第2页 / 共89页
第3页 / 共89页
第4页 / 共89页
第5页 / 共89页
第6页 / 共89页
第7页 / 共89页
第8页 / 共89页
第9页 / 共89页
第10页 / 共89页
亲,该文档总共89页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
LOGO医药常用统计方法与 统计图表中国药科大学 生物统计与计算药学研究中心主要内容统计基本概念1假设检验2常用统计方法3统计图表4一、统计基本概念v 医学统计工作的内容 统计工作贯穿医学研究中的全过程,医学研究 中的统计工作包括: 研究设计 数据搜集 数据整理 数据分析医学统计工作的内容A.研究设计设计一般包括专业设计和统计设计。专业设计即确定调查题目、 内容等。统计设计包括资料收集、整理与分析。 实验三要素:处理因素、受试对象、实验效应 设计四原则:对照、随机化、重复、盲法B.搜集资料:按照设计要求,原则是及时、准确、完整地收集原始 数据。数据来源:病历、日常医疗工作记录、临床检查与化验记录、 疾病监测报表、专题研究C.数据整理:对数据进行清理、改错、数量化D.数据分析:统计描述、统计推断一、统计基本概念v常用概念A. 同质与变异 在调查研究或实验研究中,除了直接关注的影响因素外,其他非研究因素也会影响研究结果,为了突出研究因素的作用,需要使各比较组之间非研究因素尽可能相同,即同质 即使非研究因素控制在相同条件下,个体的观察值之间也会有所不同,这种差异叫做变异B. 总体与样本 根据研究目的确定的同质研究对象的全体称为总体 按随机化原则从总体中抽取的部分研究对象称为样本C. 抽样和抽样误差 抽样是指从总体选取样本的过程,抽样的目的是用样本信息来推断总体特征 由于抽样所造成的样本指标与总体指标的差异称为抽样误差 D. 概率和小概率事件 概率(probability)是反映某一事件发生的可能性的大小,常用符号P表示。其值在0和1之间。概率等于1的事件是必然事件,概率等于0的事件是不可能事件,随机事件的概率小于1,而大于0。 小概率事件习惯上是指P 2 samplesInterval One way ANOVARepeated measured ANOVAOrdinalKruskal-Wallis testFriedman testNominalChi-square testCochrans Q test (dichotomous data only)三、常用统计方法v生存分析 vLogistic回归分析 v判别分析 v聚类分析 vMeta分析 v主成分分析1、生存分析v医学研究中,为了了解某种疾病的预后、评价 治疗方法的优劣或观察预防保健措施的效果等 ,常需对研究对象进行追踪观察,以获得必要 的数据,这类资料都属于随访资料。 其研究内容主要包括3个方面: 对生存状况进行统计描述(生存概率、生存率、中 位生存期等); 寻找影响生存时间的“危险因素”和“保护因素” ; 估计生存率和生存时间长短,进行预后评价。v传统方法在分析随访资料时的困难 1、时间和生存结局都成为了要关心的因 如果将两者均作为变量拟合多元模型,因为时间分 布不明(一般不呈正态分布,在不同情况下的分布 规律也不同),拟合多元模型极为困难 2、存在大量失访的资料,数据删失 失去联系(病人搬走,电话号码改变) 无法观察到结局(死于其他原因) 研究截止 关于截尾或删失随访开始事件失访 失访 研究截止时仍存活研究截止时点患者进入期间删失的模式图v 1非参数法:其特点是不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行估计,常用的方法有乘积极限法和寿命表法。v 2参数法:参数法的特点是假定生存时间服从于特定的参数分布,根据已知分布的特点对影响生存的时间进行分析,常用的方法有指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法等。v 3半参数法:半参数法兼有非参数法和参数法的特点,主要用于分析影响生存时间和生存率的因素,属多因素分析方法,典型方法为Cox模型分析法。生存分析的方法v乘积极限法(product-limit method) 非参数方法,是由Kaplan和Meier在1958年首先提出,故又称 Kaplan-Meier法(K-M法)。 用于估计生存率 主要适用于样本含量较小的资料。图16-2 两种疗法治疗后白血病患者的生存率曲线 vCox比例风险回归模型 在医学中, 对病人治疗效果的考查. 一方面要看治疗 结局的好坏,另一方面还要看生存时间的长短。 生存 时间的长短不仅与治疗措施有关, 还可能与病人的体 质, 年龄, 病情的轻重等多种因素有关。如何找出其 中哪些因素与生存时间有关、哪些与它无关呢?由于 失访、试验终止等原因造成某些时间的不完全,不能用 多元线性回归分析。 1972年英国统计学家Cox DR. 提出一种比例危险模型 方法, 能处理多个因素对生存时间影响的问题。设含有p个变量x1, x2,xp及时间T和结局C的n个观察对 象. 其数据结构为:编号 X1 X2 . XP T C1 x11 x21 x1p y1 12 x21 x22 x2p y2 0 n xn1 xn2 xnp yp . COX模型:vCox模型的适用范围 Cox模型适用于生存资料的统计分析,属半参数模型, 对资料没有特殊的要求,也可以估计各因素的参数, 并能做多因素的统计分析。该模型的主要优点在于能 从众多的影响因素中排除混杂因素的影响,找出影响 生存时间的因素,根据各因素的参数估计出个体的生 存率。 另外,Cox模型能分析具有截尾数值的生存时间。 Cox模型在临床流行病学分析中,使临床观察的定性指 标又加上定量指标进行分析,提高了分析的效率。 2、logistic回归模型vLogistic回归模型 概念:研究因变量y取某个值的概率变量p与自 变量x的依存关系 模型: 由于概率只能取0到1之间的值,为了把因变量 扩展到整个实数范围,对p做logit变换v回归模型参数数学意义 0(常数项):所有影响因素均为 0 时(记作 X=0),个体发生事件概率与不发生事件的概率 之比的自然对数值。 j 的含义:某因素 Xj 改变一个单位时,个体 发生事件概率与不发生事件的概率之比的自然 对数值。v优势比(odds ratio,OR)或比数比 优势(odds)是指某影响因素控制在某种水平时,事 件发生率与事件不发生率的比值,即P/(1-P)。 某影响因素的两个不同水平的优势的比值称为优势比 ,如某影响因素的一个水平为c1,另一个水平为c0, 则这两个水平的优势比为:v优势比(odds ratio,OR) OR表示影响因素对事件发生的影响方向和影响 能力大小。 OR1表示该因素取值越大,事件发生的概率越 大,又称危险因素。 OR 0,OR 1,影响因素的取值越大, 事件的发生的概率越大。 0.9)0.00.20.40.60.81.00.00.20.40.60.81.0FPRT P RA0.938ROC曲线下面积(Area)与诊断准确度高低 高 0.90-1.00 = excellent (A) 中 0.80-0.90 = good (B) 0.70-0.80 = fair (C) 低 0.60-0.70 = poor (D) 0.50-0.60 = fail (F)空间统计图v 空间统计是20 世纪90 年代以后在经济地理,尤其是城 市和区域研究领域中发展起来的重要研究方法。这一方 法考虑到事物发展的空间依赖性,大大革新了原有经典 统计,并借助于地理信息技术增强了可视化效果,丰富 了在城市和区域研究中对空间的认识和预期。 v 空间统计是分析空间数据资料的统计方法 v 空间统计是针对空间位置关系迅速发展起来的技术领域 ;它最先开始应用于地质学,随后在社会地理学,特别 是在犯罪和疾病空间研究中得到了广泛应用 v 空间统计的出发点是事物在空间上存在关联性,但距离 近的关联性更强。换言之,位置上相近的事物更容易相 互影响并拥有相似的特性空间统计图上海市人口面积箱线图2010年江苏省艾滋病发病 率空间分布LOGO
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号