资源预览内容
第1页 / 共36页
第2页 / 共36页
第3页 / 共36页
第4页 / 共36页
第5页 / 共36页
第6页 / 共36页
第7页 / 共36页
第8页 / 共36页
第9页 / 共36页
第10页 / 共36页
亲,该文档总共36页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
脑卒中发病环境因素分析及干预模型(总17页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL -本页仅作为文档封面,使用请直接删除脑卒中发病环境因素分析及干预摘要目前,脑卒中(俗称脑中风)是威胁人类生命的严重疾病之一,它的发生是一个漫长的过程, 一旦得病就很难逆转。该病的诱发已被证实与环境因素,包括气压、气温和湿度之间存在密切的 关系。本文旨在进行疾病的风险评估,对脑卒中高危人群及时采取干预措施,也让尚未得病的人 了解自己得脑卒中的风险程度,做好预防。分析了脑卒中的发病环境因素;同时,通过建立数据 模型,掌握该病发病率的变化规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊 治疗环境、配置床位和医疗药物等都具有实际的指导意义。针对问题一,首先,根据处理附件中所给的数据统计不同性别的发病人数,绘制出发病人数 的性别分布饼图,发现女性脑中风发病率低于男性;其次,将不同年龄段的发病人数统计出来, 绘制出发病人数的年龄分布直方图,基本符合正态分布,表明患病人群的年龄主要集中于5090 岁,为高危发病人群;再次,将8类职业的发病人数统计出来,绘制出发病人数的职业分布直方 图,显示发病人群中农民的发病率明显高于其他7类职业,为高危发病人群;最后,将20072010 年的各月的发病人数统计出来,绘制出了各年发病人数随月份变化的折线图,直观显现各年发病 率的变化趋势。针对问题二,首先,以2007年为例,分别绘制出该年各月的发病率和该月的平均气压、平均 气温以及平均相对湿度的折线图,直观上得出发病率和气压、温度以及相对湿度的关系;再次, 分别建立非标准化和标准化的面板数据(Panel Data)回归模型,得到2007年发病率受气温、气 压、相对湿度的影响程度依次递减;最后,利用MATLAB统计工具箱建立并比较3种多元二项式回 归模型及多元线性回归模型,分别根据2007 2010年的数据建立剩余标准差最接近于0的多元二项式回归模型,依次为多元交叉二项式回归 模型、完全二次多元二项式回归模型、完全二次多元二项式回归模型和纯二次多元二项式回归模 型,显着性均比面板数据回归模型(即多元线性回归模型)好。针对问题三,我们充分运用各种资源查阅和搜集脑卒中高危人群的重要特征和关键指标,根 据这些重要特征和关键指标,并结合问题一、二中所得结论,对高危人群提出了预警和干预的具 体建议方案,以便预防和控制脑卒中的发生,抑制该疾病的不合理增长。关键词统计描述 正态分布 面板数据回归模型多元二项式回归模型MATLAB软件1 问题重述脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一 旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素,包括气温、气压和湿度之间存在密 切的关系。对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高 危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程 度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和 医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意 义。数据(见Appendix-Cl)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病 病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。要求根据题目提供的数据,回答下列 问题:问题一:根据病人基本信息,对发病人群进行统计描述。 问题二:建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。问题三:查阅和搜集文献中有关脑卒中高危人群的重要特诊和关键指标,结合问题一、二中 所得结论,对高危人群提出预警和干预的建议方案。2 问题分析2.1 问题一的分析从附件Appendix-C 1中的数据表,可以看出:病人信息包括性别、年龄、职业、发病时间以及 诊断报告时间。通过分析,诊断报告时间意义不是很大,因此只需对病人的性别、年龄、职业和 发病时间进行统计描述即可。处理附件datal.xls、data2.xls、data3.xls以及data4.xls中的数据,将不同性别的发病人数统计出 来,绘制出发病人数的性别分布饼图;将年龄划分为8个年龄段,将不同年龄段的发病人数统计出 来,绘制出发病人数的年龄分布直方图;将每个职业的发病人数统计出来,绘制出发病人数的职 业分布直方图;将20072010年的每个月的发病人数统计出来,绘制出每一年发病人数随月份变 化的折线图。观察分布图,分析统计出来的各项数据是否服从正态分布。2.2 问题二的分析问题一中,已经将20072010年每个月的发病人数统计出来了,再处理附件data5.xls中的数 据,分别将 20072010年的每个月的平均气压、平均气温、平均相对湿度统计出来。发病率计算方 法如下:第i年第j月份的发病率=第i年第j月的发病人数三第i年总的发病人数分别绘制出 2007年各月的发病率和该年各月的平均气压、平均气温以及平均湿度的折线图, 同理可以绘制出 2008年、 2009年和 2010年的折线图。由此可以直观地看出发病率和气压、温度 以及相对湿度的关系。建立三个模型,第一个模型:以第i年(i=20072010)的平均气压、平均气温和平均相对湿度 作为自变量,第i年的发病率作为因变量,建立第i年的非标准化面板数据模型,求解模型可以得 到第i年的发病率和该年的平均气压、平均温度以及平均相对湿度之间的多元线性回归关系;第 二个模型:将平均气压、平均温度以及平均湿度分别进行标准化,运用上述方法得到第i年的标 准化面板数据模型;第三个模型:建立上述因变量和三个自变量的多元二次二项式回归模型。根 据以上建立的三个模型,可以从数值理论上分析出脑卒中发病率和三个环境因素的之间的关系, 并对得到的模型进行显着性检验2.3 问题三的分析充分运用各种资源查阅和搜集脑卒中高危人群的重要特征和关键指标,根据这些重要特征和关键指标,并结合问题一、二中所得结论,对高危人群提出预警和干预的建议方案。3 模型假设假设1: 忽略缺失数据和错误数据的影响;假设2: 这里所有时间衡量以发病时间为准,不考虑诊断报告时间;假设3: 某年某月的脑卒中发病率为该年该月的发病人数/该年全年的发病人数;假设4: 每月的平均气压、平均气温、平均相对湿度是该月每天的气压、气温、相对湿度的平均值的平均;假设5: 把发病人群分为8个年龄段:30岁以下、3140岁、4150岁、5160岁、6170岁、7180岁、8190岁和90岁以上。4 符号说明符号说明发病人群按照年龄分布的均值发病人群按照年龄分布的标准y - y , y,,y T, y .表示某年第j月的发病率1212jx - x, x ,., x T , x表示某 年第j月的平均气压11,11,21,121, jx x , x ,., xT, x表小某 年第j月的平均气温22,12,22,122, jx x ,x ,., x T , x表小某 年第j月的平均相对湿度33,13,23,123, jA a ,a ,a ,a t , a 表小非标准化面板模型的第i个回归系数0123iy丿 200712*1的矩阵,第i行表小2007年第i各月的发病率y200812*1的矩阵,第i行表小2008年第i各月的发病率2008年的发病率y丿 200912*1的矩阵,第i行表小2009年第i各月的发病率2009年的发病率y丿 201012*1的矩阵,第i行表小2010年第i各月的发病率2010年的发病率R2回归模型统计量中的相关系数F回归模型统计量中的方程显着性检验a回归模型统计量中的显着性水平,本文默认值为0.05RMSE回归模型统计量中的均方误差y y , y,,y t , y表小某 年第j月标准化后的发病率1212jx x,x ,., x T , x表小某 年第j月标准化后的平均气压11,11,21,121, jx - x ,x,,x t , x表小某 年第 j月标准化后的平均气温22,12,22,122, jx x ,x ,., x t , x表小某 年第j月标准化后的平均相对湿33,13,23,123, j度A a ,a ,a ,a t , a表小非标准化面板模型的第i个回归系数0123iy数组的均值x.的均值,其中,i=1,2,3iy数组的标准差x.数组的标准差,其中,i=1,2,3i5 模型的建立与求解5.1 问题一的求解5.1.1 按照性别对发病人群进行统计描述先用 EXCEL 处理附件 data1.xls、data2.xls、data3.xls 以及 data4.xls 中的数据,将发病人数按照男、女分别进行统计,得到数据见表 1:表 1 男性和女性的发病人数 (单位:人 )性别男性女性发病人数3338528526再根据统计出来的数据,运用MATLAB软件编程(源程序代码见附录1)绘制出发病人群按照 性别分布的饼状图1,2,如图 1所示。图 1 发病人群的性别分布饼状图图 2 发病人群的职业分布直方图由此可见:脑卒中发病人群中,女性发病率低于男性。这与文献3中所给结论一 致。5.1.2 按照职业对发病人群进行统计描述运用EXCEL对附件Appendix-C1中的数据进行处理,将脑卒中发病人群按照8 类职业(农民、工人、退休人员、教师、渔民、医务人员、职工、离退人员)进行统 计,所得数据见表 2:表2 8类职业的发病人数(单位:人)职业农民工人退休人员(3)教师发病人数2974248476644216职业渔民(5)医务人员(6)职工离退人员(8)发病人数66907351751根据表2,使用MATLAB软件(源程序代码见附录1)绘制出发病人数按照上述8类职业分布的统计直方图1,2,如图 2所示。图2直观地反映出,在所有发病人群中农民的发病率明显高于其他7类职业;退 休人员的发病率仅次于农民,但约为农民工的 1/4;工人的发病率稍低于退休人员; 其他五类职业从业人员的发病率较低,从高至低依次为:离职人员-职工-教师-医 务人员-渔民。农民的工作环境相对恶劣,加之发病率受环境因素(例如,空气质量) 影响较大,因此农民的发病率很高。5.1.3 按照年龄段对发病人群进行统计描述将发病人群的年龄分为 8个年龄段:30岁以下、3140岁、4150岁、5160岁、6170岁、7180岁、8190岁和90岁以上。再运用EXCEL处理附件Appendix-Ci 中的数据,将脑卒中发病人群按照8个年龄段分别进行统计,所得数据见表3:表3 8个年龄段的发病人数(单位:人)年龄段30岁以下3140 岁(2)4150 岁(3)5160 岁(4)发病人数51386130328427年龄段6170 岁(5)7180 岁(6)8190
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号