资源预览内容
第1页 / 共73页
第2页 / 共73页
第3页 / 共73页
第4页 / 共73页
第5页 / 共73页
第6页 / 共73页
第7页 / 共73页
第8页 / 共73页
第9页 / 共73页
第10页 / 共73页
亲,该文档总共73页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第二章第二章 定量资料的统计描述定量资料的统计描述流行病与卫生统计学教研室流行病与卫生统计学教研室 乔慧教授乔慧教授第五节第五节 统计表和统计图统计表和统计图v学习目的和要求学习目的和要求v学习重点学习重点v学习难点学习难点 v教学方法教学方法 v授课时数授课时数 v基本内容基本内容本章要求:v重点掌握:重点掌握:1.统计表的结构、制表原则及要求;统计表的结构、制表原则及要求;2.常用的统计图有哪些?它们分别适用于什么常用的统计图有哪些?它们分别适用于什么资料类型?资料类型?v熟悉理解:熟悉理解: 统计表和统计图的概念及其作用统计表和统计图的概念及其作用1. 统计表的正确编制;统计表的正确编制;2. 根据资料的性质和分析目的选择最合适根据资料的性质和分析目的选择最合适的统计图。的统计图。 重点及难点重点及难点本节教学本节教学时数时数v1学时学时统计统计分析分析统计描述统计描述统计推断统计推断 用统计指标、统计表、统计图等方用统计指标、统计表、统计图等方法,对资料的数量特征及分布规律进法,对资料的数量特征及分布规律进行测定和描述。行测定和描述。 统计表和统计图是描述资料特征、呈统计表和统计图是描述资料特征、呈现统计分析结果的重要工具,广泛应用现统计分析结果的重要工具,广泛应用于资料的收集、整理以及研究结果的对于资料的收集、整理以及研究结果的对比分析。比分析。(一)概念:在研究报告和科研论文中,常将统计分析(一)概念:在研究报告和科研论文中,常将统计分析的指标及其结果用表格的形式列出,称为的指标及其结果用表格的形式列出,称为统计表统计表。1 避免繁杂的文字叙述避免繁杂的文字叙述 2 使数据条理化,便于计算使数据条理化,便于计算3 便于事物间的比较分析和理解便于事物间的比较分析和理解作用:作用:(二)(二)一、一、 统统 计计 表表(三)统计表的结构(三)统计表的结构 从从外形外形上看统计表由标题、标目(包括横标上看统计表由标题、标目(包括横标目、纵标目)、线条、数字及必要的文字说明和目、纵标目)、线条、数字及必要的文字说明和备注五部分构成。其形式如下表所示:备注五部分构成。其形式如下表所示: 顶线顶线底线底线表5 -1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病1、标题v位于统计表的上方中央;位于统计表的上方中央;v标题要注明资料收集的时间和地点;标题要注明资料收集的时间和地点;v标题内容简明扼要,不能过于简单,也不能标题内容简明扼要,不能过于简单,也不能过于繁琐,而且要与表中内容相符,通常要过于繁琐,而且要与表中内容相符,通常要求标题不超过求标题不超过20个字。个字。表表4-1 某地区某地区2004年年婚前检查检出疾病情况婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病2、标目v横标目:位于表的左侧,用来说明各横行数字的涵义,相当于“主语主语”v纵标目:说明各纵栏数字的涵义,相当于 “谓语谓语”表4-1 某地区2004年婚前检查检出疾病情况 疾疾 病病病例数 百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病表4-2 某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性男性女性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.677.58胆结石5.885.166.586.46冠心病6.705.894.594.033.线条v包括三条基本线:顶线、底线、纵标目分割线,所包括三条基本线:顶线、底线、纵标目分割线,所以有时我们把统计表也称为以有时我们把统计表也称为“三线表三线表”;v表格中如有合计也用横线隔开;表格中如有合计也用横线隔开;v如果在表中有总标目,在总标目和纵标目之间用短如果在表中有总标目,在总标目和纵标目之间用短横线隔开;横线隔开;v表的左上角不宜有斜线,表内不应有竖线,统计表表的左上角不宜有斜线,表内不应有竖线,统计表的左右两则也不应有边线的左右两则也不应有边线。表4-2 某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性男性女性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.677.58胆结石5.885.166.586.46冠心病6.705.894.594.03表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病4、数字v准确无误,用阿拉伯数字表示;v同一指标的小数位数要一致,上下要对齐;v表内不留空格,数字暂缺或未记录用“”表示,无数字用“”表示,数字若是“0”,则应填写“0”;v有相对数时,将对应的绝对数也同时列出,以便读者了解和核算。5、备注v表格一般不列备注或其他文字说明表格一般不列备注或其他文字说明,如果需要对某个数字或指标加以说明,可以在数字或指标右上方用“*”之类的符号标注,并在统计表的下方用文字加以说明。表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病表4-2 某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性男性女性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.677.58胆结石5.885.166.586.46冠心病6.705.894.594.03 从从内容内容上看,每张表都有主语和谓语。上看,每张表都有主语和谓语。主语指被研究的事物,一般置于表的左侧主语指被研究的事物,一般置于表的左侧(横标目);谓语指说明主语的各项指标,(横标目);谓语指说明主语的各项指标,一般置于表的右侧(纵标目),主语和谓语一般置于表的右侧(纵标目),主语和谓语结合起来构成一个完整的句子。结合起来构成一个完整的句子。表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病(四)统计表的种类v简单表:由一组横标目和一组纵标目组成v复合表:由一组横标目和两组及以上纵标目结合起来作为“主语”表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病表4-2 某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.677.58胆结石5.885.166.586.46冠心病6.705.894.594.03 将疾病种类、性别和时间结合起来分组,可以反映不同疾病、不同性别以及不同年代的患病率(五)编制统计表的注意事项v简明扼要,重点突出,即一张表只包括一个中心内容,表达一个主题v合理安排主语和谓语的位置v表线是否过多过密v表内数据要认真核对、准确可靠统计表制作是否良好,可以从以上几方面检查:统计表制作是否良好,可以从以上几方面检查: 某医院用麦芽根糖浆治疗慢性肝炎161例,疗效资料如表4-6,指出其缺点并加以改进。表4-6 麦芽根糖浆治疗慢性肝炎疗效观察效果总例数有效无效小计近期痊愈好转例%例%例%例%108 67.1 70 43.53823.65332.9v表4-6 存在的问题:1.标题过于简单;2.主谓安排不合理;3.标目组合重复;4.表内出现斜线和竖线;表4-7 某年某医院麦芽根糖浆治疗慢性肝炎的疗效观察疗效例数百分比无效5332.9好转3823.6近期痊愈7043.5合计161100.0表表4-8 流行病学有关的主要因素流行病学有关的主要因素季季 节8月上旬月上旬8月中旬月中旬8月下旬月下旬9月上旬月上旬人数人数%人数人数%人数人数%人数人数%76.37063.12825.265.4年年 龄15岁以下以下15-25-45岁以上以上人数人数%人数人数%人数人数%人数人数%1210.82421.67164.043.6职 业农民民学生学生待待业青年青年其他其他人数人数%人数人数%人数人数%人数人数%10695.510.932.710.9 某地1974年111例钩端螺旋体病患者发病季节、年龄和职业构成资料如表4-8所示,检查此表编制是否合适,如不合适,请指出并修改。 表表4-8 4-8 存在问题:存在问题:v标题不够明确,而且未注明时间、地点。v发病季节、年龄和职业三项指标无可比性,放在一起,内容繁杂。v标目设计不合理,“人数”、“%”多次重复,不便于比较分析。v表内文字和线条过多。内容较多,层次复杂,表格中数据罗列无条理,较难读懂。表4-9 某地1974年钩端螺旋体病患者发病季节分布季节人数%8月上旬76.38月中旬7063.18月下旬2825.29月上旬65.4合计111100.0表4-10 某地1974年钩端螺旋体病患者发病年龄分布年龄(岁)人数%15以下1210.8159585.645及以上43.6合计111100.0表4-11 某地1974年钩端螺旋体病患者发病职业分布职业人数%农民10695.5学生10.9待业青年32.7其他10.9合计111100.0第二节第二节 统计图(统计图(statistical chart)v(一)概念:是用点的位置、线段的升降、直条的长短、面积的大小等来表达统计数据的一种形式。v(二)作用:统计图比统计表更能直观地表达资料的特征,在科研论文中常被采用。v(三)常用统计图:(三)常用统计图:描述定量变量的统计图:直方图、累计频描述定量变量的统计图:直方图、累计频率分布图、箱式图率分布图、箱式图描述定性变量的统计图:百分条图、圆图、描述定性变量的统计图:百分条图、圆图、线图、统计地图线图、统计地图即可描述定量变量又可描述定性变量的统计图:即可描述定量变量又可描述定性变量的统计图:直条图直条图(四)绘制统计图的基本要求(四)绘制统计图的基本要求1.1.根据资料的性质和分析的目的选择适当的图形。根据资料的性质和分析的目的选择适当的图形。 2.每一张统计图都要有标题,简明扼要地说明图形要表达的主要内容,必要时应注明资料收集的时间和地点。标题一般位于图的下方。图图1 2005年某地年某地96名妇女产前检查次数分布名妇女产前检查次数分布 3.涉及坐标系的统计图(条图、散点图、线图和直方图)要等距表明尺度。条图和直方图纵坐标从0开始。纵横坐标长度的比例一般为57。线线图图散点图散点图直方图直方图条条图图4.4.比较不同事物时,宜选用不同的线条或颜色表示,并附图例加以说明。图例图例(五)(五) 常用统计图的绘制方法及注意事项常用统计图的绘制方法及注意事项 1 1、条图、条图(bar chart):适用于性质相似而不连续的资料。用):适用于性质相似而不连续的资料。用等宽直条的长短表示等宽直条的长短表示相互独立相互独立的各项指标数值大小。的各项指标数值大小。 可以分为单式条图和复式条图。可以分为单式条图和复式条图。 1)单式条图)单式条图 只有一个统计指标,一个分组因素只有一个统计指标,一个分组因素 。如图。如图4-1。其中统计指标是三甲医院数,因素指的是不同省市。其中统计指标是三甲医院数,因素指的是不同省市。纵坐标的尺度必须从从0开始开始,否则会改变各对比组间的比例关系。 2)复式条图)复式条图 有一个统计指标,两个及以上分组因素。如有一个统计指标,两个及以上分组因素。如图图4-24-2,按年龄分老中青三组,每组有两个直条,分别代表男女。,按年龄分老中青三组,每组有两个直条,分别代表男女。无论男女,随着年龄的增大,高血无论男女,随着年龄的增大,高血压的患病率增高,各个年龄段男性压的患病率增高,各个年龄段男性的患病率均高于女性,但是男女之的患病率均高于女性,但是男女之间患病率的差距随年龄的增加而减间患病率的差距随年龄的增加而减小小 绘制条图时应注意:绘制条图时应注意: 1纵轴纵轴表示各个项目相应的数据要等距,而且尺度必须尺度必须从从0开始开始,否则会改变各对比组间的比例关系。 2宽度:宽度:各直条的宽度应相等,各直条的间隔也应一致。条间隔应为条宽的一半或等宽条间隔应为条宽的一半或等宽。 注意:注意:复式条图中组内各直条排列次序要前后一致,同一组内直条间不留间隙,并加以图例图例。2 2、 百分条图百分条图(percent bar graph)(percent bar graph) 百分条图:适用于构成比资料。特别适合作多个构成比的比较,将不同组别,不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。用矩形长条的面积表示事物全部,而用其中各段表示各构成部分。 图图8 两种脱落牙再植效果的比较两种脱落牙再植效果的比较绘制百分条图时应注意以下几点:绘制百分条图时应注意以下几点: 1将全体数量绘制成一长条,长度和宽度可以任意选择,将长条全长分为10格,每格代表10%,总长为100%。2绘制一直条,长度与标尺一致,以直条的长度表示数量的百分比。3将直条全长按构成比分为几段,在图上标出各部分构成比的数值,并用图例说明各部分的名称。4两种或多种类似的构成比资料相互比较时,可以绘制两个或多个长度、宽度都相等的直条,在同一起点上依次平行排列,各直条之间留有一定空隙,一般为直条宽度的一半。 百分条图特别适合作多百分条图特别适合作多个构成比的比较个构成比的比较 图图4-4 20世纪世纪70年代和年代和80年代某地常见恶性肿瘤发病构成比较年代某地常见恶性肿瘤发病构成比较 图图4-34-3是根据某地是根据某地2020世纪世纪7070年代和年代和8080年代恶性肿瘤发病登记年代恶性肿瘤发病登记资料绘制成的百分比条图。资料绘制成的百分比条图。由图可见不同年代主要恶性肿瘤中,肺癌明显增加,鼻咽癌和肝癌构成减少由图可见不同年代主要恶性肿瘤中,肺癌明显增加,鼻咽癌和肝癌构成减少3、圆、圆 图图(pie chart)圆图:是一种构成图,适用于构成比资料。圆图:是一种构成图,适用于构成比资料。恶性肿瘤、心脏病和恶性肿瘤、心脏病和呼吸系统疾病为前三呼吸系统疾病为前三位死因。位死因。 绘制圆图时注意以下几点:绘制圆图时注意以下几点:1)扇形内要注明简要文字和百分比。2)两种或多种类似的构成比资料相互比较时,可在同一水平线或同一竖线上作直径相等的圆图,并注意各构成部分排列次序要一致。 图图9 某地不同时期居民死因的百分比构成图某地不同时期居民死因的百分比构成图图图3 某地某地1950-1966年伤寒与结核病死亡率(年伤寒与结核病死亡率(1/10万)万) 变化情况变化情况 适用于连续性变量的资料。用线段的升降来表示统计指标的变化趋势,如某事物在时间上的发展变化,或某现象随另一现象变迁的情况。 4、 普通线图普通线图 line chart绘制线图时应注意以下几点:绘制线图时应注意以下几点: 1)横轴代表分组标志,纵轴代表统计指标。横轴和纵轴都是算术尺度横轴和纵轴的刻度都可以不从“0”开始。 2)相邻两点用直线连接,也就是说线图应按实际数字绘制成折线,而不能任意修改为光滑曲线。 3)同一图内不应绘制太多的曲线,一般不宜超过4-5条。若有几根线,应用不同颜色或不同图线表示,并附图例说明。 4)在绘图时,一定要注意纵横轴比例,由于比例不同,给人的印象也不同。 表表4-10 某地居民某地居民1950-1966年伤寒与结核病死亡率(年伤寒与结核病死亡率(1/10万)万)年份伤寒死亡率结核病死亡率年份伤寒死亡率结核病死亡率195031.3174.519603.871.3195222.4157.119621.659.2195418.0142.01964.846.019569.2127.219660.337.519585.697.7图图3 某地某地1950-1966年伤寒与结核病死亡率(年伤寒与结核病死亡率(1/10万)万) 变化情况变化情况伤寒和结核病的死亡率均逐年下降,伤寒的死亡率低于结核病 5 5、半对数线图、半对数线图(semi-logarithmic line chart) 用来比较两种或多种事物的相对变化速度。在比较几组数据变化速度,特别是两组数据相差悬殊时,宜选用半对数线图。 绘制半对数线图时应注意:横轴用算数尺度表示各分组标志,纵轴用对数尺度表示指标数值的大小。图图4 某地某地1950-1966年伤寒与结核病死亡率(年伤寒与结核病死亡率(1/10万)万) 变化情况变化情况图图4-7 某地某地1950-1966年伤寒与结核病死亡率(年伤寒与结核病死亡率(1/10万)万) 变化情况变化情况普通线图发现两条折线普通线图发现两条折线坡度相差悬殊,结核病坡度相差悬殊,结核病死亡率折线下降幅度大。死亡率折线下降幅度大。这是对比前后死亡率这是对比前后死亡率绝对绝对差值差值得到的印象得到的印象半对数线图得到伤寒半对数线图得到伤寒死亡率下降较快的印死亡率下降较快的印象,这是对前后死亡象,这是对前后死亡率率比值比值得到的印象得到的印象算术尺度对数尺度,说明的是事物发展的速度 图4-8为利用20对父子身高的绘制的散点图,从散点的趋势中可以看出,父亲身高和儿子身高之间有关联。一般来说,父亲个子高,儿子的个子也较高。6、 散点图散点图(scatter diagram) 以点的密集程度和趋势来表示两种现象的相关关系。适用于双变量资料,主要用于相关回归分析。7、直方图、直方图 (histogram) 适用于连续变量的频数分布资料。常用横轴表示变量(即被观察对象),纵轴表示频数或频率。直方图用矩形面积代表各组频数或频率,各矩形面积总和代表各组频数或频率的总和。绘制直方图应注意以下几点:绘制直方图应注意以下几点: 1纵轴的刻度必须从“0”开始,而横轴的刻度可按实际范围制定。 2作图时,各直条的宽度应等于组距,高度应等于该组的频数或频率。 3.各直条之间不留空隙,可用直线分隔,也可不绘制分隔直线。 8 、统计地图、统计地图(statistical map) 统计地图主要用于表示某种现象在地域空间上的分布,根据不同地方某种现象的数值大小,采用不同密度的线条或不同颜色绘在地图上,有助于分析该现象的地理分布特征,为进一步研究提供线索。 图图7 2003年广东省某急性传染病发病数的地理分布年广东省某急性传染病发病数的地理分布 9 9、 箱式图箱式图(box plot) 适用于描述连续型变量的分布特征,一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制 。 由P25和P75构成箱式图的“箱体”部分, P25和扣除异常值以外的最小值之间、 P75和扣除异常值以外的最大值之间分别构成“箱子”的上下两条“触须”。 异常值又称离群值,指大于1.5倍四分位数间距的数值,在图中常用圆圈“”表示。大于3倍四分位数间距的数值称为极端值,在图中常用星号“”表示。 箱式图分简单(图4-11)和复式(图4-12)两种。图图4-12 1985年某省农村年某省农村120例例67岁正常男童胸围(岁正常男童胸围(cm)测量值)测量值中位数中位数四分位四分位间距间距异常值异常值图图4-13 某年某地某年某地300名中、青年居民收缩压(名中、青年居民收缩压(mmHg)分布情况)分布情况变量分布有偏变量分布有偏中年组收缩压高于青年组常用统计图的比较图形资料性质分析目的条图 相互独立资料用直条长短表示数值大小百分条图构成比用长条各段长度(面积)表达内部构成圆图构成比用圆的扇形面积表达内部构成线图连续性资料用线段升降表示事物的动态变化半对数图连续性资料用线段升降表示事物的发展速度直方图数值变量的频数表资料用直方面积表示各组段频数和频率散点图双变量资料用点的密集程度和趋势表示两种现象间的相关关系箱式图数据直观比较和分析统计地图地区性资料用不同纹或颜色代表指标高低,说明地域分布1.欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用( D ) A 普通线图 B 直方图 C 条图 D 半对数线图 2. 调查某地6-15岁学生近视情况,需描述近视学生的年龄分布可选用( D ) A 普通线图 B 百分条图 C 条图 D 直方图3. 比较某地在两个年份几种传染病的发病率可用( B )1. A 百分条图 B 复式条图 C 线图 D直方图练练 习习 题题4. 表示7岁男孩体重与胸围的关系,宜绘制( C )A 条图 B 复式条图 C 散点图 D 线图5. 关于统计图的制作,正确的叙述是( C )A 统计图的标题放在图的上方 B 线图中的线条越多越好C 条图的纵轴必须从零开始D 直方图的组距不必相等6. 表示某地区某年各种死因的构成比,可绘制( B )A 条图 B 圆图 C 直方图 D 统计地图7. 关于统计表的制作,不正确的叙述是(C )A 统计表的标题放在表的上方B 统计表包含的内容越多越好C 统计表中的数字按小数点位对齐 D 统计表一般用纵标目和横标目说明数字的意义和单位思考题:1、统计表和统计图的作用?2、统计表的制表原则和要求?3、常用的统计图有那些?各适用于什么类型的资料?
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号