资源预览内容
第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
亲,该文档总共6页全部预览完了,如果喜欢就下载吧!
资源描述
管理统计基础操作实验报告班级: 管科 081 姓名:陈望新 学号:5504108003一、线性回归分析1.自变量强行进入的回归说明:已知确切的解释变量与被解释变量,但不清楚他们之间的系数关系。目的:搞清楚他们间的系数,求出确切的回归方程。步骤:打开数据 CH10 回归人均食品支出点击 analyze-regression-linear 按要求点选后,输出结果如下图表 1(现以多元回归为例对结果进行说明)图表 1图表 1 中,常数项的 sig 列概率为 0.1680.05,表示常数项与 0 没有显著性差异,表明常数项不应出现在方程中。人均收入 sig 列的概率为 0.0000.05,表示人均收入的系数与 0 有显著性差异,人均收入应当作为解释变量出现在方程中。粮食单价的解释同上,表明其系数也应出现在方程中。因此,应当采用标准回归方程及其系数(表中的 beta 列)2.逐步回归法说明:本问题已知一些可能与被解释变量有关的解释变量,不确定是不是都有关,不确切知道回归方程是什么,要依靠 spss 来探索。目的:探索出确切的的回归方程。步骤:打开数据 CH6CH9CH10 证券投资额与依据点击 analyze-regression-linear 按要求点选后,输出结果如下两图(图表 2 和图表 3)图表 2图表 2 中 sum of squares 列的 regression 数据从 334.497 增加到 498.043 表明随着回归模型的改进,已解释变差越来越大。表中最后的 sig 列的显著性概率都小于 0.01 说明每个模型的总体回归效果都是显著的。图表 3图表 3 中 sig 列几乎所有的变量的系数都在 0.01 的水平上,显著异于 0。只有最后的受教育程度的显著性概率为 0.016,大于 0.01,但还是小于 0.02,表明在 0.02 的显著性水平上,收教育程度的系数显著异于 0。即,这些变量都可以作为解释变量存在于模型中,解释投资额的变化。3.多重共线性说明:解释变量中多个变量有共同的变化趋势,可能会导致错误地删除变量,或者 r 的平方会趋于 1。判断方法:如果输出的 F 的统计值很大,R 趋于 1,同时,许多 t 统计值小,估计系数的标准差大,则表明纯在多重共线性问题。处理过程:1.删除 t 相对小的解释变量2.用变量比例代替变量3.改变模型结构4.恰当处理滞后变量5.增大样本容量步骤:打开数据 CH10 共线反向逐步服装需求点击 analyze-regression-linear 按要求点选后,输出结果如下两图图表 4图表 5图表 4 中,第一次回归 t 统计值的显著性概率分别为 0.015,0.772,0.078,0.072.除了可支配收入的显著性概率小于 0.05 外,其余都大于 0.05,表明其相应的系数与 0 没有显著性差异。同时图表 5 中总体回归效果 r 与 r 的平方都很接近于 1,说明解释变量之间存在多重共线性。图表 4 中第二次回归剔除了金融资产变量后,除常数项外,t 检验结果都很好了,表明消除了多重共线性。4.异方差问题说明:指随着解释变量的变化,被解释变量的方差存在明显的变化趋势。此时回归参数的估计值仍无偏,但是不再是最小方差,所以不再有效。判断方法:用散点图判断。以标准化残差为纵轴,以标准化预测值为横轴,看图的趋势(具体怎么看还真没搞明白,书上都没怎么说明)还是用未标准化残差的绝对值,计算其与解释变量的 spearman 的相关系数好,看与 0 有没有差异,有显著差异则说明存在异方差性。处理过程:(1)试算异方差的形式,选出回归效果最好的形式(2)用广义最小二乘法及其回归的效果。步骤:(1)初步判断异方差性。打开CH10异方差SI原点击analyze-regression-linear按要求点选后,输出结果如下图表6 图表 6初步看出异方差性(怎么看出来的?我估计应该是同一条竖线上,即标准化预测值相同时,其未标准化残差的值不一致。即没有一种线性的趋势)(2)检验异方差是否存在。点击transform-compute,产生新变量未标准化残差的绝对值。点击analyze-corrrelate-bivariate计算居民收入与绝对值e的spearman 相关系数为0.069,相应的P=0.000 ,与0有显著差异,说明存在异方差性(如下图表7所示)图表 7 (3)用加权最小二乘法估计回归方程的系数。由于我spss 新数值的形成有点问题,下面就不再分析了4.序列相关说明:自相关问题,是指随着不同期的样本值(或不同编号)之间,存在相关关系。基本类似的,省略了二、因子分析说明:因子分析其目的是浓缩数据,通过对诸多变量的相关性研究,可以用假想的少数几个变量来表示原来变量的主要信息。作用:1.寻求基本结构 2.数据化简概述:用spss 做因子分析,读入数据后,点击analyze-data reduction-factor。做如下5件事(1)做kmo测度和巴特利特球体检验,或输出相关系数矩阵,看数据是否适宜做因子分析。(2)指定参与因子分析的变量(3)指定提取公共因子的方法和确定因子个数的方法(4)决定是否旋转,并选定因子旋转方法。(5)决定是否要计算因子值,并把它作为新变量保存起来。步骤:打开CH11主成份企业创汇点击analyze-data reduction-factor,按要求勾选,输出结果。如下几个图表图表 8图表8中结果显示kmo值为0.735 ,适宜做因子分析(大于0.7都适合)。巴特利特球体检验的卡方统计值的显著性概率是0.000,小于0.01,说明数据具有相关性,适宜做因子分析。图表 9图表9中数字,所选两个因子的特征根解释了总体方差的90.772%。图表 10图表 10 是旋转后的因子 1 与因子 2 的负载值表格。表中数据显示,因子 1 对创汇,利润和履约率有较大影响,反映的是总业绩的情况,可以命名为总业绩因子。而因子 2 对人均创汇有较大影响,反映的是人均业绩的情况,可以命名为人均业绩因子。 (数值越接近 1,表明因子对其的影响越大)图表 11图表 11 是计算因子值的系数矩阵,由公式 f=x*B,可以计算出公共因子 f 的因子值。两个因子值都出现在数据窗口中。今后,可以运用这两个变量代表原来的 4 个变量做回归分析。如下图表 12图表 12
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号