资源预览内容
第1页 / 共22页
第2页 / 共22页
第3页 / 共22页
第4页 / 共22页
第5页 / 共22页
第6页 / 共22页
第7页 / 共22页
第8页 / 共22页
第9页 / 共22页
第10页 / 共22页
亲,该文档总共22页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
医学统计学问答题(含答案)简答题 0.算术均数、几何均数和中位数各有什么适用条 件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态 分布(对数正态分布)的资料,以及等比数列资料。(3)中位数:适用各种类型的资料,尤其以下情况:A资料分布呈明显偏态;B资料一端或两端存在不确定数值 (开口资料或无界资料);C资料分布不明。1. 对于一组近似正态分布的资料,除样本含量n夕卜,还可 计算SX,和SX96. 1,问各说明什么? (1) X为算数均数,说 明正态分布或近似正态分布资料的集中趋势(2) S为标准差,说 明正态分布或近似正态分布的离散趋势(3) SX96. 1可估计正态指 标的95%的医学参考值范围,即此范围在理论上应包含95%的个体 值。2. 试述正态分布、标准正态分布的联系和区别。正态分布标准正态分布原始值X无需转换作u二(X-) / 转换 分布类型 对称 对称 集中趋势=0均数与中位数的关系=M=M参考:标准正态分布的均数为0,标准差为1 ;正态分布的均数则 为,标准差为(为任意数,而为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。3. 说明频数分布表的用途。1)描述频数分布的类型 2)描述频数分布的特征3)便于发现一些特大或特小的可疑值 4 )便于进一步做统计分析 和处理4.变异系数的用途是什么? 多用于观察指标单位不同时, 如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高 与成人身高变异程度的比较。5. 试述正态分布的面积分布规律。(1)X轴与正态曲线所夹的面积恒等于1或100%;(2)区间 的面积为68. 27%,区间1. 96的面积为95. 00%,区间2. 58的面积为99. 00%。6. 试举例说明均数的标准差与标准误的区别与联系。7. 标准正态分布(u分布)与t分布有何不同?t分布为抽样分布,标准正态分布(u分布)为理论分布。t分布比正态分布的峰值低,且尾部翘得更高。随着自由度的增大,t分布逐渐趋近于标准正态分布。即当自由度 时,t分布标准正态分布。8. 均数的可信区间与参考值范围有何不同?9.假设检验时,一般当P0. 05时,则拒绝H0,理论根据是什么?10.假设检验中和P的区别何在?11. t检验的应用条件是什么?12. I型错误与II型错误有何区别与联系?I型错误是指拒绝了实际上成立的0H所犯的弃真 错误,其概率大小用 表示。II型错误则是接受了实际上不成立的0H所犯的取伪 错误, 其概率大小用表示。当样本含量n确定时,愈小,愈大;反之愈大, 愈小。13. 假设检验和区间估计有何联系? 假设检验用于推断质的 不同即判断两个(或多个)总体参数是否不等,而可信区间用于说 明量的大小即判断总体参数的范围。两者既互相联系,又有区别。假设检验与区间估计的联系在于可信区间亦可回答假设检验的 问题,若算得的可信区间包含了 0H,则按 水准,不拒绝0H ;若 不包含0H,则按水准,拒绝0H,接受1H 。也就是说在判断两个(或多个)总体参数是否不等时,假设检 验和可信区间是完全等价的。14. 为什么假设检验的结论不能绝对化? 因为通过假设检验 推断作出的结论具有概率性,其结论不可能完全正确,有可能发生 两类错误。拒H时,有可能犯I型错误;接受0H时可能犯II型错 误。无论哪类错误,假设检验都不可能将其绝0风险降为0,因此 在结论中使用绝对化的字如肯定,一定,必定 就不恰当。15. 方差分析的基本思想和应用条件是什么? 方差分析的 基本思想是:根据研究资料设计的类型及研究目的,把全部观察值 总变异分 解为两个或多个组成部分,其总自由度也分解为相应的几 个部分。例如完全随机设计的方差分析,可把总变异分解为组间变异和 组内变异,即SS总=55组内+SS组间,总的自由度也分解为 相应的两部分,即总二组内+组间。离均差平方和除以自由度得均方MS,组间均方(MS组间)与 误差均方(MS误差)之比为F值;如果各组处理的效应一样,则组 间均方等 于组内均方,即F=1;但由于抽样误差,F值不正好 等于1,而是接近1;如果F值较大, 远离1,说明组间均方 大于误差均方,反映各处理组的效应不一样,即各组均数差别有意 义,至于F值多大才能认为差别有意义,可查F界值表(方差分 析用)来确定。方差分析的应用条件:各样本是相互独立的随机样本且来自正态总体各组总体方 差相等,即方差齐性。16. 在完全随机设计方差分析中SS组 间、SS组 内各表示 什么含义? SS表示组间变异,指各组处理样本均数大小不等,是 由处理因素(如果有)和随机误差造成的;组间组内SS表示组内变 异,指各处理组内变量值大小不等,是由随机误差造成的。17. 随机区组设计的方差分析与完全随机设计方差分析在设 计和变异分解上有什么不同? 区别点完全随机设计随机区组设 计 设计 采用完全随机化的分组方法,将全部试验对象分配到g个 处理组(水平组),各组分别接受不同的处理。随机分配的次数要重复多次,每次随机分配都对同一个区组内 的受试对象进行,且各个受试对象数量相同,区组内均衡。变异分解三种变异:总SS二组间SS+组内SS四种变异:总SS=处理SS+区组SS+误差SS 18.以实例说明为什么不能以构 成比代替率? 19.秩和检验的优缺点?20.简述直线回归与直线相关的区别与联系。联系:1对于既可做相关又可做回归分析的同一组数据,计算 出的b与r正负号一致。2相关系数与回归的假设检验等价,即对于同一样本,tb二tr 3同一组数据的相关系数和回归系数可以互相换算:r=by, x*Sx/Sy 4用回归解释相关:由于决定系数总2r越接近1,说明相关的效果越好。回ssssr/2二,当总和平方和固定时,回归平方和的大小决定 了相关的密切程度,回归平方和越接近总平方和,则二者的区别:(1)资料要求上:相关要求X、Y服从双变量正态分布,这种资料进行回归分析 称为II型回归;胡桂要求Y在给定某个X值时服从正态分布,X 是可以精确测量和严格控制的变量,称为I型回归。(2) 应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的; 而说明两变量间依存变化的数量关系用回归,说明Y如何依赖于X 而变化。(3) 意义上:r说明具有直线关系的两变量间相互关系的方向和密切程度;b 表示X每变化一个单位所导致Y的平均变化量。(4) 计算上:xyxxxylllr/二,xxxy llb/= (5) 取值范围:-1r1, -b.2、 二项分布、Poission分布的应用条件二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传 染病和遗传 病除外),但应用时仍应注意考察是否满足以下应用条 件:(1)每次实验只有两类对立的结果;(2) n次事件相互独立; (3)每次实验某类结果的发生的概率是一个常数。Poisson分布的应用条件:医学领域中有很多稀有疾病(如肿瘤, 交通事故等)资料都符合Poisson分布,但应用中仍应注意要满 足以下条件:(1)两类结果要相互对立;(2) n次试验 相互独立;(3) n 应很大,P应很小。3、极差、四分位数间距、标准差、变异系数的适用范围有 何异同? 答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小 样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布 不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似正态分布 资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料 的离散程度。4. 中位数、均数、几何均数的适用条件有何异同。(1)均数适用于描述对称分布,特别是正态分布的数值变量 资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布, 但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平 均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态), 或分布情况不明,或分布的末端有不确切数值的数值变量资料的平 均水平。5. 第一类错误与第二类错误的区别与联系。当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第 一类错误,其概率用 表示。当假设检验接受实际上不成立的零假设时,所犯的错误称为第 二类错误,其概率用 表示。当样本含量一定时,愈大,愈小,反之,愈小,愈 大。1 称为检验效能或 把握度,其意义是两总体确有差别,按 水准能发现它们有差别的能力。6. 运用相对数时要注意哪些问题? 应用相对数时应注意以 下几个事项(1)计算率和构成比时观察单位不宜过 小;(2)注 意正确区分构成比和率,不能以比代率;(3)对率和构成比进行 比较时,应注意资料的可比性;(4)当比较两个总率时,若其内 部构成不同,需 要进行率的标准化;(5)两样本率比较时应进行 假设检验。7方差分析后进行两两比较能否用t检验?为什么? t检 验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设 计(给出一组数据和一个标准值的资料)的定量资料的均值检验场 合;而方差分析用在 单因素k水平设计(K3)和多因素设计的定 量资料的均值检验场合。方差分析有十几种,不同的方差分析取决于不同的设计类型。t检验进行两两比较 其一,将多因素各水平的不同组合、简 单地看作单因素的多个水平(即视为单因素水平), 混淆了因素与 水平之间的区别,从而错误地确定了实验设计类型;其二,分析 资料时,常错 误用单因素多水平设计或仍采用多次t检验进行两 两比较。误用这两种方法的后果是,不仅 无法分析因素之间的交互作用 的大小,而且,由于所选用的数学模型与设计不匹配,易得出错 误的结论。参数检验与非参数检验的区别何在?各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计 或检验。非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。(2)优缺点:参数检验:优点是符合条件时,检验效能高。缺点是对资料要求严格,如等级资料、分布不明或末端有不明 确数据的资料不能用参数检验,要求资料的分布类型已知且总体方 差相等。非参数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料, 如果用非参 数统计会造成资料信息的丢失,致使检验效能下降,犯 第二类错误的概率增大。故符合参数 统计条件的资料,要首先选用参数统计的方法。当参数统计的应用条件得不到满足时,应选用非参数统计。11. 对于同一资料,又出自同一研究目的,用参数检验和非 参数检验所得结果不一致时,应以何种结果为准。当资料满足参数检验方法的条件时,应使用参数检验方法,当 资料不满足参数检验方法的条件时,必须采用非参数检验方法。12、常见的统计图有哪些?如何根据资料的性质选用适当的 统计图? 常用的统计图及适用条件是:条图,适用于相互独立 的资料,以表示其指标大小; 百分条图及远圆图,适用于构成 比资料,反映各组成部分的大小;普通线图:适用于连续 性资 料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变 迁的情况。 半对数线图,适用于连续性资料,反映事物发展速度(相对 比)。 直方图:适用于连续性变量资料,反
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号