资源预览内容
第1页 / 共81页
第2页 / 共81页
第3页 / 共81页
第4页 / 共81页
第5页 / 共81页
第6页 / 共81页
第7页 / 共81页
第8页 / 共81页
第9页 / 共81页
第10页 / 共81页
亲,该文档总共81页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第9章相关分析与回归分析,9.1相关关系 9.2相关分析 9.3线性回归分析 9.4非线性回归分析,9.1相关关系,9.1.1函数关系与相关关系 世界是普遍联系的,孤立的现象或事物是不存在的。事物或现象之间相互联系、相互制约,构成错综复杂的客观世界,构成世界的运动和发展。这种现象之间的关系存在着两种不同的类型:函数关系与相关关系。 (一)函数关系 函数关系反映着现象之间存在着严密的依存关系,在这种关系中,对于某一变量的一个数值,都有另一变量的确定值与之对应,如,表示圆的面积 与半径是函数关系,值发生变化,则有确定的 值与之对应。在客观世界广泛存在着函数关系。,下一页,返回,9.1相关关系,(二)相关关系 相关关系是指现象之间确实存在的、但关系值不确定的相互依存关系,即对于某一变量的每一个数值,另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。如:身高.米的人可以表现为许多不同的体重;施肥量与粮食亩产量之间,一定的施肥量,其亩产量数值也可能各不相同。之所以发生这种情况,是因为体重、亩产量受很多因素的影响。但是,很明显施肥量与亩产量之间、身高与体重之间的关系是非常密切的。,上一页,返回,下一页,9.1相关关系,9.1.2相关关系的特点 (一)现象之间表现为数量的相互依存关系 相关关系表现为数量上的相互依存关系,即一个现象在数量发生变化,另一个现象也会相应地发生数量上的变化。例如,企业劳动生产率的提高,利润就会增多;银行存款利率提高,存款就会增多等现象。因为企业劳动生产率和利润、银行存款利率与存款之间存在着相关关系,当一个现象发生数量上的变化,另一个现象也会随之发生变化。,下一页,返回,上一页,9.1相关关系,(二)现象之间数量上的关系是非确定性的 存在相关关系的两个变量之间,当一个变量取某个值时,另一个变量可能有多个数值与之对应。例如,对于同一个存款利率下有多种存款额与之对应。这是因为任一现象的产生是由于多个原因引起的,就可能产生多种现象。这样变量之间的因果关系就表现为这种非确定性的依存关系。,下一页,返回,上一页,9.1相关关系,9.1.3相关关系的种类 (一)按影响因素的多少分为单相关与复相关 单相关 单相关是指两个变量间的相关关系,如自变量 和因变量 的关系。例如,身高与体重、降雨量与亩产量,等等。 复相关 复相关是指多个自变量与因变量之间的相关关系。例如,销售量、销售价格、采购成本、销售费用与销售利润的相关关系。在社会各种现象之中,许多现象都是相互依存、彼此关联的,它们都是复相关。,下一页,返回,上一页,9.1相关关系,(二)按相关关系的表现形态分为直线相关和曲线相关 直线相关 直线相关又成为线性相关,是指两个变量的对应取值在坐标图中大致呈一条直线。 曲线相关 曲线相关又称为非线性相关,是指两个变量的对应取值在坐标图中大致呈一条曲线,如抛物线、指数曲线、双曲线等。,下一页,返回,上一页,9.1相关关系,(三)按变量之间相关关系的方向分为正相关与负相关 正相关 两个变量的变化方向一致称正相关,或者说它们的相关系数大于零,即,一个变量变大时,另一个变量值也随之变大;反之,当一个变量值变小时,另一个变量值也随之变小。 负相关 两个变量的变化方向相反称负相关,或者说它们的相关系数小于零,即,一个变量变大时,另一个变量值也随之变小;反之,当一个变量值变小时,另一个变量值也随之变大。,下一页,返回,上一页,9.1相关关系,(四)按相关的程度分为完全相关、不完全相关和不相关 完全相关 完全相关是指两个变量之间有确定的函数关系,当一个变量发生变化,则另一个变量发生明显的变化。 不完全相关 不完全相关是指两个变量之间有一定的关系,当一个变量变化时,另一变量也会因此发生变化,但不存在严格的函数关系。 不相关 不相关是指两个变量之间各自独立,当一个变量变化,另一个变量不变化,或呈不规则变化,或者两者之间没有依存关系。,下一页,返回,上一页,9.1相关关系,五)按相关性质分为 “真实相关”和 “虚假相关” “真实相关” “真实相关”是指两种现象之间的相关确实具有内在的联系。例如,需求与价格和收入的相关、消费与收入的相关等都可以说是 “真实相关”。 “虚假相关” “虚假相关”是指两种现象之间的相关只是表面存在,实质上并没有内在的联系。例如,有人通过观察认为 与癌症患者人数存在相当高的正相关,这种相关就是一种比较典型的虚假相关。与癌症患者的关系缺乏实质性科学依据,之所以呈现正相关是由于它们都与另一个因素即人口总量有着内在的相关关系,下一页,返回,上一页,9.1相关关系,9.1.4相关关系与其他关系的联系与区别 (一)相关关系和函数关系的联系与区别 函数关系是指两个变量之间存在着相互依存关系,但是它们的关系值是固定的,而具有相关关系的变量之间的关系值是不固定的。相关关系与函数关系也是有联系的,由于有观察或测量误差等原因,函数关系在实质中往往通过相关关系表现出来。 (二)相关关系与变量之间的联系与区别 相关关系是变量之间关系值不确定的相互依存关系,但在一定条件下,变量之间又可能存在着某种确定的函数关系,要找出这种关系要应用统计中的回归分析与相关分析的方法。,下一页,返回,上一页,9.1相关关系,(三)相关关系与因果关系的联系与区别 从相关关系的内容来讲,有许多是由于因果关系而产生的,如施肥量和亩产量,劳动生产率和成本等;但它也包括互为因果的关系,如身高和体重、生产量和销售量。同时它还包括非直接的因果关系,如哥哥高,妹妹也高,这产生于同一原因,即父母亲的身材比较高。所以相关关系比因果关系的概念要广泛。但是这种关系必须是客观存在的真实关系。,下一页,返回,上一页,9.1相关关系,(四)相关分析与回归分析的联系与区别 相关分析是确定特定变量之间是否存在相关关系,并根据观察资料建立比较合适的回归方程,从而分析变量之间相互关系的密切程度。回归分析是根据一个或几个变量的数值,预测或控制另一个变量的数值,并且了解这种预测或控制的精确度。因此,相关分析是回归分析的基础,回归分析是把变量的相关关系转变为函数关系,并建立变量关系的数学表达式,用数学模型来研究变量之间的这种数量变动关系。,返回,上一页,9.2相关分析,9.2.1相关分析的概念与特点 (一)相关分析的概念 相关分析是研究两个或两个以上变量之间相关关系及其密切程度的分析和检验。判断相关关系及密切程度,一般可以进行定量与定性分析,编制相关图表,计算相关系数等指标,反映相关方向和密切程度。其目的在于对现象之间的依存关系和依存程度及所表现出的规律性作出推断和认识,以便进行预测和决策。,下一页,返回,9.2相关分析,(二)相关分析的特点 相关分析具有以下特点: ()变量之间是对等关系。 ()两个变量之间只能计算出一个相关系数,相关系数的绝对值在,其值大小反映两变量间相关的密切程度。 ()相关系数有正、负之分。,下一页,返回,上一页,9.2相关分析,9.2.2相关分析的步骤 (一)进行定性判断 现象之间有无相关关系,是相关分析的出发点,这是第一步。定性判断就是根据经济理论、专业知识和实践经验判断变量间是否相关。只有判断出变量与变量间确实有相互依存关系,进而才能进行定量分析。不能不加分析地将两个或两个以上的时间数列资料凑合在一起进行定量分析,这样很容易得出虚假相关的结论。,下一页,返回,上一页,9.2相关分析,(二)绘制相关表和相关图 编制相关表,绘制相关图,可以直观地判断现象之间大致上呈现何种关系的形式,进而易于选择何种拟合模型。 (三)计算相关系数 相关表和相关图只能大体上反映变量之间的相关关系,而不能表明相关的密切程度。相关系数正是表明变量之间相关密切程度的一种测度,记为。,下一页,返回,上一页,9.2相关分析,9.2.3相关表和相关图 相关表与相关图是研究相关关系的直观工具。一般在进行详细的定量分析之前,可以先用它们对现象之间存在的相关关系的方向、形式和密切程度做大致的判断。进行相关分析必须具备若干个自变量与因变量对应的实际 (观察)资料,作为相关分析的原始数据,一般来讲,资料越多越全面,越有利于分析和研究。,下一页,返回,上一页,9.2相关分析,(一)简单相关表和相关图 进行相关分析,先要将原始统计资料进行整理。根据总体单位的原始资料,将其中一个变量的数值按一定的顺序排列,同时列出与之对应的其他变量的变量值,这样形成的表格称为简单相关表。例如,某企业年商品销售额与广告费支出的关系见表9-1。,下一页,返回,上一页,9.2相关分析,从上述相关表可以看出,随着广告费支出的增加,其商品销售额有增加的趋势。 相关图也称散点图,是根据原始数据,在直角坐标中绘制出两个变量相对应的观察值的所有点,从这些点的分布情况观察、分析两个变量间的关系,这个图称为相关图。该图表明相关点分布状况,如将表9-1中的资料画在同一坐标系中,以横坐标代表广告费支出,纵坐标代表商品销售额,各点的分布状况如图9-1所示,即散点图 (相关图)。,下一页,返回,上一页,9.2相关分析,(二)分组相关表和相关图 当相关资料包括的对应数值很多时,直接根据两变量各原始数值编制相关表、绘制相关图进而计算各相关指标,工作量很大,且相关表会很长,也不方便,相关图也不好绘制,在这种情况下,可编制分组相关表或绘制分组相关图。分组相关表就是将原始资料进行分组而编制的相关表。根据分组的情况不同,分组相关表有两种:一是单变量分组表,一是双变量分组表。,下一页,返回,上一页,9.2相关分析,单变量分组表 单变量分组表是将自变量分组并计算次数,而对应的因变量不分组。也就是说在具有相关关系的两个变量中,只对自变量进行分组的相关表,见表9-2。根据资料的具体情况,对自变量分组,可以是单项式分组,也可以是组距式分组。如表9-2就是组距式单变量分组表。 双变量分组表 双变量分组表就是对自变量和因变量都进行分组而编制的相关表,见表9-3。这种表形似棋盘,故又称棋盘式相关表。,下一页,返回,上一页,9.2相关分析,9.2.4相关系数的测定及其显著性检验 通过编制相关表和绘制相关图,对现象之间的关系还只是做了初步的了解,它们之间关系的密切程度如何,还需计算相关系数。相关系数是说明两个变量之间有无直线相关关系及相关关系密切程度的统计指标。相关系数计算方法有多种,如积差、等级相关系数,另外还可根据回归方程方差分析来测定相关系数,这里主要介绍积差相关系数和等级相关系数两种相关系数。,下一页,返回,上一页,9.2相关分析,(一)积差相关系数 积差相关系数 (又称积矩相关系数) 这是世纪初英国统计学家皮尔逊 (.)提出的一种计算两个变量线性相关的系数,通常用或表示,它实际上是考察两个变量与组成的二维随机向量 (,)的样本相关系数。若对 (,)作了 次观测,得到 对数据(x1,y1), (x2,y2), (xn,yn),下一页,返回,上一页,9.2相关分析,其计算公式为,下一页,返回,上一页,9.2相关分析,从公式中可以看出相关系数有如下性质: ()取正值或负值决定于分子,当分子为正值,得出 为正,变量 与 是正相关;当分子为负值,得出为负,变量与是负相关。 ()是一个相对数,不受主量单位影响,无论与的计算单位如何,与相关的相关系数只有一个。其数值在,即。 ()当时,表示 与 存在着一定的线性相关。 的数值越接近于,表示与直线相关程度越高;反之, 数值越接近于,表示与直线相关程度越低。,下一页,返回,上一页,9.2相关分析,为判断时有个标准,有人提出了相关关系密切程度的等级,下面介绍一种四级划分法: . 弱相关 .低度相关 .显著相关 .高度相关,下一页,返回,上
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号