资源预览内容
第1页 / 共57页
第2页 / 共57页
第3页 / 共57页
第4页 / 共57页
第5页 / 共57页
第6页 / 共57页
第7页 / 共57页
第8页 / 共57页
第9页 / 共57页
第10页 / 共57页
亲,该文档总共57页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章第二章计量资料的统计描述计量资料的统计描述王晓莉http:/www.qingis.com/wang.htmxlwangbjmu.edu.cn1基本内容基本内容 统计描述统计描述统计推断统计推断(1)统计推断统计推断(2)计量资料计量资料 频数分布频数分布集中趋势集中趋势离散趋势离散趋势统计图表统计图表抽样误差标准误 t u F检验秩和检验可信区间直线相关与回归偏相关多元线性回归计数资料计数资料相对数统计图表u 、 2检验秩和检验可信区间Logistic回归2本章在临床资料处理中的用途n资料整理阶段,判断资料适合何种方法n分析的初步阶段,对变量的特点进行描述n(求出均数和标准差)为假设检验做准备3 为了比较国产药和进口药对治疗更年期妇女骨质疏松效果是否相同,研究人员采取随机双盲的试验方法,对39名病人进行随机分组,国产药组20例,进口药组19例,评价指标为第2-4腰椎骨密度的改变值(骨密度.sav)。1 -5.00 1 64.00 1 63.00 1 77.00 1 74.00 1 25.00 1 38.00 1 68.00 1 45.00 1 29.00 1 9.00 1 77.00 1 -2.00 1 89.00 1 77.00 1 63.00 1 70.00 1 36.00 1 82.00 1 -14.00 2 -17.00 2 48.00 2 47.00 2 60.00 2 58.00 2 11.00 2 23.00 2 52.00 2 30.00 2 15.00 2 -4.00 如何建立数据库?(注意:在研究的设计和分析阶段都用到统计学)4常用的设计类型常用的设计类型1.一组样本与总体的比较2.2.两组样本的比较(成组和配对两组样本的比较(成组和配对t t、 2检验检验 )单因素多组样本的比较(单因素单因素多组样本的比较(单因素F F分析,分析, 2检验检验 ) 双因素多组样本的比较(配伍组双因素多组样本的比较(配伍组F F方差分析)方差分析) 三因素三组及以上设计(拉丁方设计)三个或以上因素并交互作用(正交设计)5计量资料的统计描述计量资料的统计描述:群体与个体 人们对客观世界的认识往往是从个别事物开的,但是当人们对一类事物积累了若干个体的认识后而想把握对其总体的认识时,逐渐会发现个体与总体的性质之间有一定差异;(1)总体具有个体所不具备的某些性质。(2)总体的性质可以与个体的性质联系起来。(3)无规律运动的个体可以组成有规律运动的整体。6主要内容主要内容第一节第一节 计量资料的频数分布计量资料的频数分布第二节第二节 集中趋势集中趋势第三节第三节 离散趋势离散趋势第四节第四节 正态分布正态分布第五节第五节 医学正常值范围的估计医学正常值范围的估计7第一节第一节 频数分布频数分布n什么是频数n频数分布的特点n频数分布的类型89SPSS建立数据库n进入SPSS操作窗口n进入数据编辑窗口(data editor)nVariable View 变量名 类型 整数位 小数位n输入数据:Data View10n检查输入的数据(打开数据库)n找出最大值、最小值(数据排序)data View窗口datasort cases身高sort by-身高n身高主要集中在什么阶段?(这个程序能否看得出来大多数人身高在何处?应该怎么办?)1112n变量变换:将身高转化成一个新变量(组段)nTransform-recode-into different variables(身高组段)-changeold and new-old value (range)-new value (value)-oldnewaddcontinue(可以试用不同的分组方法,例如“5”“2”)n产生新变量(组段)131998年年100名名18岁健康女大学生身高的频数分布岁健康女大学生身高的频数分布身高组段身高组段(1)划记划记频数频数 f (2) 1541121561111415811111,11111,11116011111,11111,1111316211111,11111,11111,11111,112216411111,11111,11111,11111916611111,11111,111111516811111,111191701111417217411合合 计计10014产生频数表nAnalyze-Descriptive Statistics-Frequencies组段display frequency table15频数表计量资料计量资料等级资料等级资料1617 频数:当汇总频数:当汇总大量大量的原始数据时,把数的原始数据时,把数据按类型分组,其中每个组的数据个数,据按类型分组,其中每个组的数据个数,称为该组的称为该组的频数频数。 频数表(频数分布):表示各组及它们频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数对应的组频数的表格称为频数表或频数分布。分布。(见前两张幻灯)(见前两张幻灯)18频数分布的两个特征:频数分布的两个特征: 集中趋势与离散趋势集中趋势与离散趋势(共性与个性)频数分布的类型:频数分布的类型: 对称分布与偏态分布(集中位置偏向小的一侧叫对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态)正偏态,反之叫负偏态)频数表的主要用途:频数表的主要用途: 1. 揭示分布类型揭示分布类型 2. 发现特大值和特小值发现特大值和特小值 3. 计算集中趋势指标与离散趋势指标计算集中趋势指标与离散趋势指标总结前面19第二节第二节 集中趋势集中趋势 集中位置集中位置的描述,即大多数数值落在什么位置上。(针对一个变量的若干个数值)描述集中趋势的几种指标(用不同的方法将不同类型数值的集中位置表示出来)1.算术均数(均数)2.几何均数3.中位数201.算术均数(均数算术均数(均数)n意义:一组性质相同的观察值在数量上的平均水平。n表示 (总体) X(样本)(spss:“mean”)n特征: (X- X)=0n应用:正态分布或近似正态分布n注意:合理分组,才能求均数,否则没有意义。21 用SPSS计算均数 File-Open-Data-身高-Analyze-Descriptive Statistics-Frequencies-Statistics-Mean-Continue-OK22n有一组血中抗体滴度数据:32,2,4, 8, 4,16,1,1,4,1,1,2,2,2,4, 8,16,2,4, 32,4, 8,4,求它们的平均水平23n首先看这组数据的频数分布,大概集中在什么位置。n用“mean”求,看结果如何。nFile-Open-Data-抗体滴度-Analyze-Descriptive Statistics-Frequencies-Statistics-Mean-Continue-OK242.几何均数几何均数n意义:N个数值的乘积开N次方即为这N 个数的几何均数。n表示:G (SPSS: Grouped Median) n应用:原始数据分布不对称,经对数转换后呈对称分布的资料。数值范围跨越多个数量级。例如抗体滴度。25SPSS计算几何均数 File-Open-Data-抗体滴度-Analyze-Reports-Case Summaries-抗体滴度Statistics-Geometric Mean-Continue-OK26Case Summariesa1.001.001.001.002.002.002.002.002.004.004.004.004.004.004.004.008.008.008.0016.0016.0032.0032.00234.001234567891011121314151617181920212223NGrouped MedianTotal抗体滴度Limited to first 100 cases.a. 273.中位数、百份位数中位数、百份位数n意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。(身高排队) data editordatasort casesn表示:M 、PXn百分位数:将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。n应用:偏态资料,开口资料28n偏态资料用算术均数处理会产生什么样的结果?n大家试举一个偏态资料的例子。2503 1283560001500152016001680192020002300230025302580 9501300030004210310031203210321041024520681202930SPSS计算中位数、百分位数 File-Open-Data-收入(抗体滴度)-Analyze-Descriptive Statistics-Frequencies-Statistics-Median(mean)-Continue-OK31三个指标的区别与联系1.算术均数2.几何均数3.中位数 32第三节第三节 离散趋势离散趋势n描述一组数据参差不齐的程度描述一组数据参差不齐的程度33n全距n四分位数间距n方差n标准差标准差n变异系数 常用指标常用指标34标准差标准差n相关概念:离均差、离均差之和、离均差平方和、方差(2 S2 )n 标准差的符号: S (SPSS:Std. deviation) n 意义:全面反映了一组观察值的变异程度 (大小)n应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围35 用SPSS计算标准差 File-Open-Data-身高-Analyze-Descriptive Statistics-Frequencies-Statistics-Std.deviation-Continue-OK36变异系数变异系数n意义:标准差与均数之比用百分数表示。n符号: CVn计算: CV=(S/X)100%n无单位n应用:单位不同的多组数据比较 均数相差悬殊的多组资料37第四节第四节 正态分布正态分布(Normal distribution)主要内容:1、图形形状2、图形特征3、正态曲线下面积分布规律38什么是正态分布什么是正态分布? 德国数学家高斯高斯(C.F.GaussC.F.Gauss,17771855)。调查、观察或测量中的误差,不仅是不可避免的,而且一般是无法把握的。 高斯以他丰富的天文观察和在18211825年间土地测量的经验,发现观察值x x与真正值的误差变异,大量服从现代人们最熟悉的正态分布。称高斯分布曲线,也就是正态分布曲线。 3940正态曲线正态曲线(Normal cure):是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线钟形曲线。41正态分布的特征正态分布的特征n均数处最高(说明什么?);n均数为中心左右对称;n2个参数 N(,)决定了图形的位置和形状; n曲线下的面积有一定规律。4243n标准正态分布:N(0 ,1);n标准正态变换标准正态变换(变换公式变换公式); n例题:一次统计测验的平均分是72,标准差是15,求60分、93分、72分的标准分数。44标准正态变换后标准正态变换后454647正态曲线下的面积分布规律正态曲线下的面积分布规律l附表1(不同位置上数的意义,图示)l横轴上、曲线下的面积为1;l曲线下,横轴上对称于0的面积相等lu(z) 与所对应的面积与所对应的面积P成反比成反比。48SPSS绘制正态曲线 File-Open-Data-身高:两个路径-Analyze-Descriptive Statistics-Frequencies- Chart Type-With normal Cure- Continue-OK-Graphs-Histograms-Display Normal Curve-Continue-OK4950第五节第五节 医学正常值范围的估计医学正常值范围的估计n概念:又称参考值范围,是指特定健康人群概念:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括习惯上是确定包括95%95%的人的界值。的人的界值。n单双侧:单双侧: 根据指标的实际用途,有的指标有根据指标的实际用途,有的指标有上下界值(双侧);某些指标只需确定上限上下界值(双侧);某些指标只需确定上限(单);某些指标只需确定下限(单)。(单);某些指标只需确定下限(单)。51估计的方法:估计的方法:1 1、正态分布法、正态分布法2 2、百分位数法、百分位数法52应用条件应用条件 :正态分布或近似正态分布资料 计算(双侧):计算(双侧): 95% 正常值(医学参考值)范围公式: (x1.96 S,x1.96 S ) 即(x1.96 S ) 1、正态分布法、正态分布法532、百分位数法、百分位数法n应用条件 : 任何分布资料 n计算公式: 双侧界值: P 2.5 P 97.5 单侧上界: P 95 单侧下界: P 5 54SPSS求正常值范围(百份位数法) File-Open-Data-收入-Analyze-Descriptive Statistics-Frequencies-Statistics-Percentile Values-Continue-OK55本章在临床资料处理中的用途n资料整理阶段,判断资料适合何种方法n分析的初步阶段,对变量的特点进行描述n(求出均数和标准差)为假设检验做准备56谢谢!57
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号