资源预览内容
第1页 / 共65页
第2页 / 共65页
第3页 / 共65页
第4页 / 共65页
第5页 / 共65页
第6页 / 共65页
第7页 / 共65页
第8页 / 共65页
第9页 / 共65页
第10页 / 共65页
亲,该文档总共65页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
医学统计学综合练习三类资料(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标, 如血脂、心率等。 特点: 各观察单位间只有量的差别; 数据间有连续性。 三类资料(2) 定性资料(qualitative data) 以定性方式表达每个观察单位的某项观察指标 ,如血型、性别等。 特点: 各观察单位间或者相同,或者存在质的 差别; 有质的差别者之间无连续性。 三类资料(3) 等级资料(ranked data,ordinal data) 以等级表达每个观察单位的某项观察指标,如 疗效分级、心功能分级等。 特点: 各观察单位间或者相同,或者存在质的差别; 各等级间只有顺序,而无数值大小,故等级之 间不可度量。定量资料的描述集中趋势:算术均数几何均数中位数百分位数离散趋势:极差四分位数间距标准差、方差变异系数集中趋势指标应用注意事项o 算数均数:适用于单峰对称分布资料; o 几何均数:适合于作对数变换后单峰对称分布资料; o 中位数和百分位数:适用于任何分布的资料; o 中位数和百分位数在样本含量较少时不稳定,越靠两 端越不稳定; o 中位数在抗极端值的影响方面,比均数具有较好的稳 定性,但不如均数精确。 o 因此,当资料适合计算均数或几何均数时,不宜用中 位数表示其平均水平。 o 不同质的资料应考虑分别计算平均数。6离散趋势指标应用注意事项 全距:反映资料的分布范围,全距大说明数据 的变异度大,适用于任何资料; 四分位间距:两个特定的百分位数,常用于描 述不对称资料的特征; 方差和标准差:常用来描述正态分布的资料; 变异系数:常用于比较度量衡单位不同的两组或多组资料 的变异度;比较均数相差悬殊的两组或多组资料的变异度。7正态分布o Normal distribution o 德国数学家Gauss发现 o 最早用于物理学、天文学 o Gaussian distribution正态分布的特征 正态分布有两个参数(parameter),即位置参 数(均数)和变异度参数(标准差)。 高峰在均数处; 均数两侧完全对称。 正态曲线下的面积分布有一定的规律。 正态分布和标准正态分布曲线下面积分布规律总结正态分布标准正态分布面积(或概率)-1.64+1.64-1.64+1.6490.00%-1.96 +1.96-1.96+1.9695.00%-2.58 +2.58-2.58+2.5899.00%正态分布的应用 估计频数分布 质量控制 确定临床参考值范围参考值范围的估计方法方法双侧 单侧下限单侧上限正态分布法参考值范围(reference interval) 参考值范围又称正常值范围(normal range)。 什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。 确定参考值范围的意义:用于判断正常与异常。 “正常人”的定义:排除了影响所研究的指标的疾病和有关因素的 同质的人群。 由抽样引起的样本统计量与总体参数间的 差别。 原因:个体变异抽样 表现:样本统计量与总体参数间的差别不同样本统计量间的差别 抽样误差是有规律的! 抽样误差(sampling error)中心极限定理p 从正态总体中随机抽样,样本均数服从正 态分布; p 从偏态分布的总体中随机抽样,当样本含 量足够大时,样本均数也近似服从正态分 布。从任意分布的总体(均数,标准差) 中随机抽样,当样本含量逐渐增大时, 样本均数的分布趋向正态分布, 此分布的均数为 ,标准差为 标准误(standard error)样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。当总体标准差未知时,用样本方差代替,前者称为理论标准误,后者称为样本标准误。标准误与标准差(1) 联系: 都表示变异的大小; 样本含量一定时,标准差越大,标准误越大。标准误与标准差(2) 标准差 含义: 一组变量值离散程度; 标准差越小,均数的代表性越好; 应用: 估计参考值范围; 与n的关系:样本含量越大,标准差越稳定,n 很大 时,标准差趋向于总体标准差。标准误与标准差(3)标准误 含义: 样本统计量的离散程度; 标准误越小,用样本均数来反映总体均数越可靠; 应用: 计算可信区间; 与n的关系: 样本含量越大,均数的标准误越小,n很大时,标 准误趋向于0。统计推断(statistical inference)根据样本所提供的信息,以一定的概率 推断总体的性质。u 总体参数的估计(parameter estimation)u 假设检验(hypothesis test)区间估计(interval estimation)o 按一定的概率或可信度(1-)用一个区间估 计总体参数所在范围,这个范围称作可信度 为1-的可信区间。 o 这种估计方法称为区间估计。 o 理论基础:抽样分布规律假设检验的步骤:u建立假设(在假设的前提下有规律可循) ; u确定检验水准(确定最大允许误差); u计算检验统计量(样本与总体有多大的偏 离); u计算概率P (该样本是否支持零假设); u结论(根据小概率原理)。均数的假设检验p样本均数与总体均数的比较 p配对设计样本均数的比较 p两样本均数的比较均数的假设检验应用条件p独立性、正态性、方差齐性o 方差齐性检验 o 方差不齐时的近似 t 检验 o 大样本时,均数比较的 u 检验I 型错误和 II 型错误实际情况假设检验的结果拒绝 H0 不拒绝 H0H0 成立I 型错误()H0 不成立把握度(1-)II 型错误()P值的意义o 从 H0 总体中随机获得等于或大于现有统计 量值的概率。o 拒绝H0时所冒的风险。界 值界 值tt定性资料o 定性资料的特点 n 离散性,变量仅取有限的几个值; n 资料不含有次序的信息; o 举例 n 血型(A、B、O、AB) n 人群中某病发生与否(发生、不发生)o 描述指标: 率相对数 构成比相对比常用相对数(1)o 率(rate),又称频率指标,说明某现 象发生的频率和强度。(强度相对数)常用相对数(2)o 构成比(proportion),又称构成指标,说 明一种事物内部各组成部分所占的比重 或分布。各部分构成比之和为1或100%常用相对数(3)o 比(ratio),又称相对比,是A,B两 个有关指标之比,说明A为B的若干倍或 百分之几。两个指标可以性质相同,也 可以不同。四格表(fourfold table)的概念这四个格子的频数是整个表的基本数据,其 余数据都是从这四个基本数据推算出来的,这 种资料称为四格表资料。abcd2检验的基本思想o 如果H0假设成立,则实际频数( actual frequency)与理论频数应该比较接近。 o 如果实际频数与理论频数相差较大,超出了 抽样误差所能解释的范围,则可以认为H0假 设不成立,即两样本对应的总体率不等。 理论频数的计算431053401656 8326109实际数 理论频数40.3612.6442.6411.36T11=53 83/109=40.36T12=53 26/109=12.64T21=56 83/109=42.64T22=56 26/109=13.36等级资料的特点o 既非呈连续分布的定量资料,也非仅 按性质归属于独立的若干类的定性资 料;o 比“定量”粗,而比一般的“定性”细;o 等级间既非等距,亦不能度量。 秩次与秩和 o 秩次(rank),秩统计量是指全部观察值按某种顺序排列的位序;o 秩和(rank sum)同组秩次之和。o 两样本比较的秩和检验(基本原理) o Wilcoxon符号秩和检验(基本原理)秩和检验的正确应用秩和检验可用于任意分布的资料; (1)等级资料; (2)计量资料中:n极度偏态资料,或个别数值偏离过大 n各组离散度相差悬殊 n资料中含有不确定值大于5年 、0.001、1:1024 以上 n分布类型尚未确知 (3)兼有等级和定量性质的资料相关与回归o 线性相关 o 等级相关 o 列联相关 o 线性回归相关系数的性质 -1 r 1 r0为正相关 r0为负相关 r0为零相关或无相关 相关系数绝对值越大,两变量间相关程度越密切; 相关系数越接近于0,表示相关越不密切。3.回归系数和回归方程的意义及性质o b 的意义 o a 的意义 o 的意义o 的意义o 意义直线回归与直线相关的区别与联系o 联系 o 均表示线性关系; o 符号相同:共变方向一致; o 假设检验结果相同:是否存在共变关系;直线回归与直线相关的区别与联系o区别 nr 没有单位,b有单位;所以,相关系数与单位无 关,回归系数与单位有关; n相关表示相互关系;回归表示依存关系; n对资料的要求不同: o当X和Y都是随机的,可以进行相关和回归分析; o当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析 ;实验研究的基本要素o 处理因素:作用于受试对象,要求在实验过 程中观察其处理的因素o 受试对象:处理因素作用的对象o 实验效应:受试对象接受试验处理后所出现 的实验结果实验设计的基本原则o 基本原则之一:对照排除“非处理因素”的影响,从而衬托处理因素的作用 o 基本原则之二:随机不仅能控制已知的混杂因素(非研究因素),而且还能 控制未知的混杂因素。是保证非处理因素在各对照组之 间均衡一致的重要条件抽样随机;分组随机;试验顺序随机 o 基本原则之三:重复以提高实验的可靠性研究设计的常见类型o 完全随机分组设计 n 成组设计o 配对设计(目的?)o 正确选择分析方法考试题型o 选择 o 名词解释 o 简答题 o 资料分析题习题1关于正态分布的特征,下面说法错误的是: A高峰位置在均数 = 处 B为位置参数,越大,则曲线沿横轴向右移动;越小,曲线沿横轴向左移动 C为形态参数,表示数据的离散程度,若小,则曲线形态“矮胖”;大,则曲线形 态“瘦高” D正态分布以均数为中心,左右完全对称2. 各观察值均加上同一数后,( ) (A)均数不变,标准差改变(B)均数改变,标准差不变 (C)两者均改变 (D)两者均不变3. 某地5人接种某疫苗后抗体滴度为1:20、1:40、1:80、1:16 0、1:320。为求平均抗体滴度,最好选用( ) (A)中位数 (B)几何均数 (C)算术平均数 (D)标准差4正态分布曲线下,横轴上从均数到( + 1.96)的面积为:A95% B45% C47.5% D90%5. 某人群血糖的正常值范围是指 ( ) (A)该指标在所有人中的波动范围 (B)该指标在所有正常人中的波动范围 (C)该指标在绝大部分正常人中的波动范围 (D)该指标在一个人不同时间的波动范围6假设检验中的第一类错误是指 A拒绝了实际上成立的H0 B不拒绝实际上成立的H0 C拒绝了实际上不成立的H0 D不拒绝实际上不成立的H07. X2.58s包括变量值的 A. 68.3% B. 90.0% C. 95.0% D. 99.0%8. 均数与标准差之间的关系是 A.标准差越小,均数代表性越好
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号