资源预览内容
第1页 / 共11页
第2页 / 共11页
第3页 / 共11页
第4页 / 共11页
第5页 / 共11页
第6页 / 共11页
第7页 / 共11页
第8页 / 共11页
第9页 / 共11页
第10页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
福建农林大学计算机与信息学院福建农林大学计算机与信息学院(数学类课程)(数学类课程)课程论文报告课程论文报告课程名称:概率论与数理统计教程实习题目:回归分析在数理统计中的应用实例姓 名:孙莉莉系:应用数学专 业:数学与应用数学年 级:2009 级学 号:091153036指导教师:吴卢荣职 称:副教授2011 年 6 月 25 日1福建农林大学计算机与信息学院数学类福建农林大学计算机与信息学院数学类课程论文报告结果评定课程论文报告结果评定评语:成绩:指导教师签字:评定日期:- 2 -目录摘要摘要 .21、 问题的提问题的提 出出.32、问题的分析问题的分析33、问题的解决问题的解决33.1 问题重述问题重述33.2 建立模型建立模型33.3 模型求解模型求解43.4 模型检验模型检验64、小结小结8参考文献参考文献8附录附录9- 3 -回归分析在数理统计中的应用实例回归分析在数理统计中的应用实例摘要摘要:回归分析是数理统计中重要的一种数据统计分析的思想。它是研究一个随机变量与 一个或多个普通变量之间的相互关系的统计方法。主要是解决从一组数据出发,确立变量 间是否存在相关的关系,如果存在相关关系,确定他们之间合适的数学表达式即经验公式 或回归方程,并对它的可信度作统计检验;还可以针对从共同影响一个变量的许多变量中, 判断哪些变量的影响是显著的,哪些变量是不显著的,并利用所确定的回归方程进行预测 和控制。 本文就是针对实际问题运用回归分析中一元线性回归分析的统计方法,来确定自变量 与另一个变量的相关关系,并确立出较为合理的回归方程,再对其的可信度进行统计检验。关键词关键词:回归分析;回归方程;检验法F4回归分析在数理统计中的应用实例回归分析在数理统计中的应用实例1、 问题的提出问题的提出根据以下 9 组关于营业税税收总额和社会商品零售总额的数据1,确定出两者的关系。yx表表 1 社会商品零售总额和营业税税收总额社会商品零售总额和营业税税收总额序号社会商品零售总额营业税税收总额1142.083.93 2177.305.96 3204.687.85 4242.689.82 5316.2412.50 6341.9915.55 7332.6915.79 8389.2916.39 9453.4018.452、 问题的分析问题的分析营业税税收总额是受很多的因素所决定,但是题目中已经将主要的因素确定为社会商品零售总额,这就大大的减少了在对于自变量的多因素进行分析的过程,从而减少了在计算以及统计上的困难,但是这也在很大的程度上减少了结果的实际意义。在针对本题所给的两个变量之间的关系,作出回归分析以及运用重要的数学软件的实现,从而来确定这两个变量之间的关系,并计算出两者之间的回归方程,再对方程的可信度进行检验。3、 问题的解决问题的解决3.1 问题重述问题重述在本题目中已经明确地给出只有两个变量之间的关系,所有可以忽略影响营业税税收总额除社会商品零售总额之外的其他因素,这对于解决问题减少了难度。只要在运用回归分析的统计方法来比较二者之间的关系以及它们之间的相关性,并运用经验的回归公式,计算出二者之间的数学关系式。3.2 建立模型建立模型根据表中所给的数据初步作出营业税税收总额和社会商品零售总额之间的数据散点图,yx 并在散点图中找出关于二者之间的初步关系。运用数学软件来作出二者的散点图如下: (MATLAB 程序代码如附录一)51001502002503003504004505002468101214161820业 业 业 业 业 业 业 业 x业 业 业 业 业 业 业 y从散点图中可以看出,这 9 个点分布在一条直线 的附近,从而可以初步认为和的关系lyx基本上是线性的,而这些点与直线 的偏离是由其他一切随机因素影响而成的。因此可以假l设表 1 中的数据有以下的关系式:(3-1)10 yx其中表示随的变化而线性变化的部分,是一切随机因素影响的总和,有时也10xyx称随机误差,它是不可观测其值的随机变量,并假定其数学期望,方差,( )0E2( )Var并且服从正态分布。可以是随机变量也可以是一般变量。而在以下的讨论中,2(0,)Nx都假定社会商品零售总额是一般变量,即它是可以精确测量或严格控制的。由式子(3-1)x可知营业税税收总额是一个随机变量,但其值是可以观测的,其数学期望是社会商品零售y总额的线性函数x(3-2)10( )E yx这即是营业税税收总额与社会商品零售总额的相关关系形式。yx对表 1 的几组数据观测值,由式子(3-1)可得(3-3)10,1,2,.9iiiyxi各是相互独立;,并且将式子(3-3)称为一元线性i2( )0,( ),1,2,.9iiEVari回归模型。3.3 模型求解模型求解建立一元线性模型(3-3)后的首要任务就是根据所给数据求出从而确立二个变量10、之间的关系。而通常采用最小二乘估计求模型(3-3)中的的值。令10、6(3-4)2 0101 1(,)() ,nii iQyx应满足10、(3-5) 010101,(,)min(,),QQ 称这样得到的称为的最小二乘估计2。01,01,由于,且对的导数存在,因此最小二乘法估计可以通过求偏导数并令其为零0Q 01,而得到:(3-6)01 1001 112()02()0nii iniii iQyxQyx x 这组方程称为正规方程组,经过整理可得(3-7)012 01 iiinnxnynxxx y记222211,iixyixxiyyiixx yy lx ynx y lxnxlynynn则有式子(3-7)得(3-8)101/xyxxllyx这就是求模型(3-3)的最小二乘估计方法。则可以运用以上的模型将表 1 的数据进行统计计算,利用数学软件算出可得关系如01,下:(程序代码见附录二)(3-9)0.04872.2582yx将这个回归方程的图像图与散点图进行比较,并进行分析。画出二者的图如下:(程序代 见附录三)71001502002503003504004505000510152025业 业 业 业 业 业 业 业 x业 业 业 业 业 业 业 y可以从图中看出表中的 9 个数据都比较稳定在落在直线 的附近,从而可以初步的认为模型l(3-3)所确立而得到的回归方程是有意义的,但是还是要通过科学的检验方法来检验它的可信度。3.4 模型检验模型检验建立经验回归方程的目的在于揭示两个相关变量与之间的内在的关系,然而对于任xy意样本的观测值作出的散点图,即使一眼可以看出与之间根本不存( ,) (1,2,. )iix yinxy在线性关系,也可以通过式子(3-8)求出回归方程,但此时的回归方程是10 yx毫无意义的。所以必须有一种方法去检验回归方程的可信度,在统计中称为回归显著检验3,如果,当越大,随着的变化明显;当越小,随着的变10 yx1yx1yx化趋势不明显;特别当=0,,就意味着与没有线性关系。实质上就是要对假设1yx进行检验。01:0H为了寻找合适的统计量,对关系式进行分解,并称为总的偏差平22 yyilynyyyl方和,它反映的离散程度,由于TS12,.ny yy= (3-10)TSyyl222()()()iiiiyyyyyy8记 (3-11) 22222 010111()()()()RiiixxSyyxxxxl(3-12)2()eiiSyy从而得(3-13)2 1 eyyxxSll所以若回归方程有意义,即引起波动主要是由变化而引起的,其他因素是次要的。即要yx求尽可能大,尽可能小。RSeS为此,在此基础上建立检验,其主要思想如下:在为真时,有F01:0H(3-14)(1,2)/(2)ReSFFnSn:当不为真时,有变大的趋势,因而也有变大的趋势,故应当取单向拒绝域。0H/(2)ReS SnF对给定的显著水平,当时,认为不真,我们称方程是显著的,反(1,2)FFn10之方程是不显著的,这种用检验对回归方程作显著性检验的方法也称为方差分析。其检验F 过程可以由一张“方差分析表”来进行。见表 2.表表 2 方差分析表方差分析表方差来源偏差平方和自由度方差值FF显著性回归 RS1 RMS剩余 eS2n eMSReMSFMS总和 TS1n所以运用以上的检验方法来检验回归方程(3-9)的可信度,具体可以运用回归分析F中的方差分析程序来实现方差分析表的确立。实现的结果如下:建立回归数据分析变量之间的.txt 文件,在利用回归分析程序包来作出如下的回归分析的方
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号