资源预览内容
第1页 / 共14页
第2页 / 共14页
第3页 / 共14页
第4页 / 共14页
第5页 / 共14页
第6页 / 共14页
第7页 / 共14页
第8页 / 共14页
第9页 / 共14页
第10页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
实验13 回归分析【实验目的】1. 了解回归分析的基本原理,掌握MATLAB实现的方法; 2. 练习用回归分析解决实际问题。【实验内容】【题目2】 电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表), 建立回归模型并进行检验,诊断异常点的存在并进行处理。每周收入9690959295959494电视广告费用1.52.01.52.53.32.34.22.5报纸广告费用5.02.04.02.53.03.52.53.02.1 模型分析本题研究电视广告费用与报纸广告费用对电影收入的影响。我们首先尝试线性回归,由R2 值判断回归模型是否合理。如果不合理, 再采取其他方法进行回归分析。设电视广告费用为,报纸广告费用为,每周电影院收入为y。建立如下模型: 2.2 matlab求解y=96 90 95 92 95 95 94 94;x1=1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5;x2=5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0;n=8;m=2;X=ones(8,1),x1,x2;b,bint,r,rint,s=regress(y,X);b,bint,srcoplot(r,rint)得到如下结果:b = 83.2116 1.2985 2.3372bint = 78.8058 87.6174 0.4007 2.1962 1.4860 3.1883s = 0.9089 24.9408 0.0025 0.4897 整理成表格如下:回归系数回归系数估计值回归系数置信区间083.211678.8058 87.617411.29850.4007 2.196222.33721.4860 3.1883R2=0.9089 , F=24.9408 , p=0.0025 , s2=0.4897 在残差及置信区间的图中,第一个点的残差的置信区间不包含零点,以红色标出。残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。2.3 剔除点后重新计算删除第一个点后重新计算,将输出结果同样以表格表示。回归系数回归系数估计值回归系数置信区间081.488178.7878 84.188311.28770.7964 1.779022.97662.3281 3.6250R2=0.9768 , F=84.3842 , 0.0005 , s2=0.1257剔除第一个异常点后,R2=0.97685,相比之前有了增加,拟合的线性性有了提高;相比之前的模型,p值也有了明显的减少,远小于显著性水平,这表示置信概率大大提高了;s2 也有了减小,说明了偏差减小。综合以上几点,说明这个二元线性的模型比较合理,回归效果很好。 拟合公式为y=81.4881+1.2877x1+2.9766x2+=2.4 小结本题是个较为直观的线性回归题,在它的计算中出现了异常点。剔除后计算可以得到一个回归效果相当好的模型。【题目8】汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)18个月的调查资料如表,其中y1是普通型汽车售量(千辆),y2是豪华型汽车售量(千辆),x1是汽油价格(元/gal),x2是贷款利率(%)(1)对普通型和豪华型汽车分别建立如下模型:y1=0(1)+1(1)x1+2(1)x2,y2=0(2)+1(2)x1+2(2)x2给出的估计值和置信区间,决定系数R2,F值及剩余方差等。(2)用x3=0,1表示汽车类型,建立统一模型y=0+1x1+2x2 +3x3 ,给出给出的估计值和置信区间,决定系数R2,F值及剩余方差等。以x3=0,1带入统一模型,将结果与(1)的两个模型的结果比较,解释二者的区别。(3)对统一模型就每种类型汽车分别作x1和x2与残差的散点图,有什么现象,说明模型有何缺陷?(4)对统一模型增加二次项和交互相,考察结果有什么改进。8.1 根据模型分别求解 由题意,对普通型和豪华型汽车分别建立如下模型:y1=0(1)+1(1)x1+2(1)x2,y2=0(2)+1(2)x1+2(2)x2此为二元线性回归,可用matlab编写程序如下:y1=22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3;y2=7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;n=18;m=2;X=ones(n,1),x1,x2;b1,bint1,r1,rint1,s1=regress(y1,X);b2,bint2,r2,rint2,s2=regress(y2,X);subplot(2,1,1)rcoplot(r1,rint1)subplot(2,1,2)rcoplot(r2,rint2)得到如下图:在残差及置信区间的图中,有三个点的残差的置信区间不包含零点,以红色标出。残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。8.2 剔除点后的模型求解(1)对于y1=0(1)+1(1)x1+2(1)x2剔除第14、18个点后继续自此基础上剔除第11个点(2)对于y2=0(2)+1(2)x1+2(2)x2剔除第14个点后继续剔除第七个点,得到残差及置信区间图如下:将输出结果汇总成下表:普通型回归系数回归系数估值回归系数置信区间0(1)107.560175.3160 139.80421(1)-37.9283-57.2842 -18.57232(1)-3.0314-3.7862 -2.2767R2=0.9334 F=84.0758 p0.0001 s2=9.2746豪华型回归系数回归系数估值回归系数置信区间0(2)29.758316.2864 43.23031(2)-6.7738-14.9774 1.42992(2)-1.6367-1.9680 -1.3054R2=0.9450 F=103.1152 p0.0001 s2=1.5413可得模型如下:普通型:y=107.5601-37.9283x1-3.0314x2豪华型:y=29.7583-6.7738x1-1.6367x28.3 建立统一模型 建立统一模型y=0+1x1+2x2 +3x3 ,用x3=0表示普通型,x3=1表示豪华型,此时为三元线性回归,可用matlab编写程序如下:y=22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;x3=zeros(1,18),ones(1,18);n=36;m=3;X=ones(n,1),x1,x2,x3;b,bint,r,rint,s=regress(y,X);b,bint,srcoplot(r,rint)输出如下结果:b = 64.5753 -16.1436 -2.3322 -14.4222bint = 33.5007 95.6499 -35.1193 2.8320 -3.0705 -1.5939 -17.6546 -11.1898s = 0.8366 54.6111 0.0000 22.6642回归系数回归系数估值回归系数置信区间064.575333.5007 95.64991-16.1436-35.1193 2.83202-2.3322-3.0705 -1.59393-14.4222-17.6546 -11.1898R2=0.8366 F=54.6111 p0.0001 s2= 22.6642可得模型为:y=64.5753-16.1436-2.3322x2 -14.4222x3,x3=0表示普通型,x3=1表示豪华型。即:普通型:y=64.5753-16.1436-2.3322x2 豪华型:y=50.1531-16.1436-2.3322x2 可以看出:统一模型相当于将分立模型进行了统一:(1)统一模型的值趋近于给分立模型的“平均”;(2)统一模型的残差较大;(3)统一模型的决定系数较小;(4)统一模型的拒绝概率较小,到达了10的-12次方量级,说明模型更加有效;总体上讲,将两者统一后进行回归分析的结果有其优点,但是仍有许多不理想的成分。8.4 就每种类型汽车分别作x1和x2与残差的散点图y=22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号