资源预览内容
第1页 / 共64页
第2页 / 共64页
第3页 / 共64页
第4页 / 共64页
第5页 / 共64页
第6页 / 共64页
第7页 / 共64页
第8页 / 共64页
第9页 / 共64页
第10页 / 共64页
亲,该文档总共64页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
.,医学统计学,总复习,.,绪 论,医学统计学是统计学的一门分支学科,它应用概率论和数理统计的原理和方法,研究医学领域数据资料的收集,整理分析和推断。它是进行医学科学研究所必需的主要手段。,.,医学统计学的主要内容有: 统计描述 参数估计 假设检验 医学科研设计,.,统计学基本步骤,设计,资料搜集,整理,分析,调查设计 实验设计,资料来源 质量控制,审核 合理分组,统计描述 统计推断,.,统计工作的步骤 设计 医学科研设计,调查设计,临床实验设计,., 搜集资料 统计报表 统计资料医疗卫生工作记录 (经常性工作记录) 专题调查或实验 (一时性工作记录),., 整理资料,分组汇总资料,核对检查原始数据,整理资料,.,统计描述 统计指标、统计 图、表 统计分析 参数估计 统计推断 假设检验, 分析资料,., 计量资料 观察单位某项指标测定值的集合。亦称变量值,是定量的指标,一般有单位。,统计资料的类型,., 计数资料 按性质和类别进行分组所得的资料。其变量值是定性的,可分二项分类和多项分类。 等级资料 按某项指标的不同程度进行分组的资料。各组之间有量的差别亦为半定量的资料。,根据分析的需要各类资料可以互相转化。,.,三类数据间的关系,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,定量数据,等级数据,定性数据,.,一、 变量与变异 变 量: 被观察单位的特征(即观察指 标)。观察指标的测定结果则 称变量值。 变 异: 同质个体间测定结果的差异。,医学统计学的几个基本概念,.,二、总体和样本 总 体 (population): 根据研究目的而确定的同质的观察单位某项指标测定值的集合。,有限总体,无限总体,总 体,.,样 本 (sample): 从总体中随机抽取部分观察单位组成 为使样本对总体具有代表性要求: 抽样必须遵循随机的原则 保证足够的样本含量,.,三、 抽样 从总体中抽样必须遵循科学原则 样本应具有: 代表性、随机性、可靠性、可比性,常用随机抽样方法:,机械抽样、分层抽样、随机数字表,.,完全随机设计:(两组或多组比较) 配对设计:(同源或异源两两配对) 随机区组设计:(两个以上受试对象组成一 个配伍组),四、 设计类型,.,五、 误差 (error) 系统误差、随机测量误差、抽样误差 (smapling error):指样本统计量与总体参数之差,由抽样所造成,是不可避免的,但可以控制。,抽样误差产生的原因:,1、个体之间存在变异; 2、样本是总体中的一部分。,.,是描述随机事件发生可能性大小的数值,用P表示。 0 P1 必然事件的概率为1(100%) 不可能发生事件的概率为0 随机事件的概率在01之间,六、 概率 (probability),.,总体 参数: , ,统计学基本概念,样本 统计量:,同质,变异,误差,变量,测量,P(A | B) = P(A and B) P(B),频率,概率,.,计量资料的分析,一、计量资料的统计描述 编制频数表,., 频数分布的特征 集中趋势变量值集中分布的位置 离散趋势变量值围绕集中位置的分布情况 频数分布的类型 对称分布,.,某地区130名正常成年男子红细胞数(1012/L)的频数分布 红细胞数划 记频 数 (1) (2) (3) 3.70| | 2 3.90| | | | 4 4.10正 | | | | 9 4.30正正正 | 16 4.50正正正正 | | 22 4.70正正正正正 25 4.90正正正正 | 21 5.10正正正 | | 17 5.30正 | | | | 9 5.50| | | | 4 5.705.90| 1 合 计 130,.,偏态分布 正偏态分布 238名正常人发汞值(g/g) 的中位数和百分位数的频数表计算 发 汞 值 频 数 累计频数 累计频率(%) (1) (2)(3) (4)=(3)/238 0.3 20 20 8.4 0.7 6686 36.1 1.1 60 146 61.3 1.5 48 194 81.5 1.9 18 212 89.1 2.3 16 228 95.8 2.7 6 234 98.3 3.1 1 235 98.7 3.5 0 235 98.7 3.94.3 3 238 100.0,.,负偏态分布 某地某年恶性肿瘤死亡率的年龄分布 年龄组恶性肿瘤死亡率(1/10万) 0 0.5 10 12 20 15 30 76 40 189 50 234 60 386 70 286,.,二、集中趋势(Central tendency) 的描述 平均数(average)常用于描述一组变量值的集中趋势,是反映同质资料的平均水平或集中位置的特征值。 均数 () 常用平均数 几何均数(G) 中位数(M),.,常用平均数: 均数 (算术均数) (mean) 表示符号总体均数 () 样本均数 () 应 用对称分布资料,尤其是正态分布资料 计算方法 1+ 2+ n 直接法= = n n f 1 1+f 2 2+f kk f 加权法= = f 1 +f 2+f k n,.,常用平均数: 几何均数 (geometric mean) 表示符号 (G) 应 用 变量值呈倍数关系,对数正态分布资料 计算方法 直接法 G = n x1 x2 xn lgx1+lgx2+lgxn lgx 加权法G = lg1 = lg1 n n f1lgx1+f2lgx2+fklgxk f lgx G = lg1 = lg1 n n,.,常用平均数 中位数 (median) 表示符号(M) 偏态分布资料 应 用变量值分布一端或两端无确定数值 分布不明资料 计算方法 直接用变量值计算M = X n+1 (n为奇数时) 2 1 或M= X n + X n+1 (n为偶数时) 2 2 2,.,i n 用频数表计算M = L + ( fL ) fx 2 附:百分位数 ( Percentile,Px ) 描述变量值序列在某百分位位置的水平,多个百分位数结合可更全面地描述变量值的分布特征。 i Px = L + (n x% fL ) fx,.,三、离散趋势 (fendency of dispersion) 描述变量值的离散趋势用变异指标 全距( R ) 常用变异指标 标准差( S ) 变异系数( CV) 四分位数间距( Q),.,常用变异指标 全距 (range, 简记为R) 反映变量值的变异范围 R = 最大值 最小值 各种类型资料都可应用,但只作 参考资料,.,常用变异指标 四分位数间距 ( quartile, 简记为Q) 四分位数间距为特定的百分位数,可看作为中间1/2变量值的全距 Q = Qu QL Qu = P75 (上四分位数) QL = P25(下四分位数) 用途:用于表示偏态分布资料的变异程度,常与中位数配合使用,.,常用变异指标 方差 (variance) 和 标准差(standard deviation) 定义公式 ( ) 2 ( ) 2 2 = = N N ( ) 2 ( ) 2 S2 = S = n 1 n 1,.,应用公式 2 ( ) 2 / n 直接法S = n 1 f2 ( f ) 2 / n 加权法S = n 1,., 方差和标准差 用 途 1. 表示变量值的离散程度,用于两组变量值比较时,要求其性质相同,均数相差不大 2. 与均数结合,表示均数的代表性 (s),.,常用变异指标 变异系数 (coefficient of variation, 简记为CV) 定义:CV = s / 100% 用途:比较两组或多组单位不同 或均数相差较大资料的变 异程度,.,描述性统计小结:,.,正态分布及其应用 正态分布的概念和特征 正态分布是以均数为中心呈对称的钟型分布 正态分布的特征有: 1) 正态分布曲线在均数处最高 2) 正态分布以均数为中心,左右对称且逐渐减少 3) 正态分布曲线的两个参数和,记作N (,) 4) 正态曲线下的面积为1 (或100%),.,正态曲线下的面积分布规律: 1 占正态曲线下面积的68.27% 1.96 占正态曲线下面积的95.00% 2.58 占正态曲线下面积的99.00% 若样本含量较大(n100),则上式可用代替, 用s代替。 则上式可写为: 1S 占正态曲线下面积的68.27% 1.96S 占正态曲线下面积的95.00% 2.58S 占正态曲线下面积的99.00%,.,正态分布、标准正态分布,曲线的高度(概率密度) 面积(概率密度函数积分) 正态分布的特点: 曲线下面积规律:,正态分布 N(,2),标准正态分布 N(0,1),., 标准正态分布 标准正态分布为服从均数为0,标准 差为1,即N(0,1)的正态分布 其转换公式为:u = -/ 标准正态曲线的面积分布规律: -1 u +1占总面积的68.27% -1.96 u +1.96占总面积的95.00% -2.58 u +2.58占总面积的99.00%,., 正态分布的应用与临床参考值的确定 正态曲线面积分布规律可用于估计医学临床参考值与质量控制 临床参考值的确定方法 1) 正态分布法: 用于正态分布的资料 双侧参考值 uS 单侧参考值 - uS 或 + uS,.,2) 百分位数法:,用于偏态分布资料 双侧参考值(= 0.05) P2.5 P97.5 单侧参考值(= 0.05) P5 或 P95,.,医学参考值估计:,基本步骤,抽样 样本含量,“正常人”,测量/控制误差,分组确定?,单or双侧?,分布类型,百分界限,估计方法,正态分布法,对数正态分布法,百分位数法,.,用样本信息推断总体特征,称统计推断(statistical inference) 统计推断包括总体均数估计和假设检验 样本的统计指标和总体指标是有差别的,四、计量资料的统计推断,., 均数的抽样误差和标准误 概念: 由于抽样造成的样本均数与总体均数之差别(-) 抽样误差是不可避免的,但可以控制。 表示方法:标准误(standard error) 标准误为样本均数的标准差,是说明样本均数抽样误差的大小的指标。,.,计算公式 = : 总体标准误 n S S = S :样本标准误, n 为的估计 值,., t分布 概念 从正态总体N(,)中进行无数次样本含量为n的随机抽样,每次均可得 到一个和一个s,通过 式转换,可得无数个t值,t值的分布即 为含量为n的t值的总体或称t分布。,., t分布 特征以0为中心,左右对称 t分布曲线的形状与自由度有关 t分布曲线下面积为1 t分布曲线下面积分布可由t值表中查出: 双侧 P( t -t ) +P( t t) = 单侧 P( t -t ) = 或 P( t t) = ,.
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号