资源预览内容
第1页 / 共52页
第2页 / 共52页
第3页 / 共52页
第4页 / 共52页
第5页 / 共52页
第6页 / 共52页
第7页 / 共52页
第8页 / 共52页
第9页 / 共52页
第10页 / 共52页
亲,该文档总共52页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1,相关分析与回归分析,2,学习目的与要求,相关分析是较常用的统计分析方法。本章的目的在于提供从数量上研究现象之间相互联系方法。该章主要讲述了相关分析、回归分析的基本理论和应用方法。学习本章的要求是: 掌握相关关系与函数关系的区别 能够利用相关系数对相关关系进行测定,并且掌握相关系数的性质 明确相关分析与回归分析各自特点以及它们的区别与联系 建立回归直线方程,计算估计标准误差,理解估计标准误差的意义,3,第九章 相关分析与回归分析,第一节 相关分析的意义、种类 第二节 相关系数 第三节 回归分析简单直线回归 实训部分 实训,4,第一节 相关分析的意义、种类,相关关系的性质 相关关系的概念和特点 相关关系具有如下两个特点: 1、现象之间确实存在数量上的相互依存关系。现象之间数量上的相互依存关系表现在:一个现象发生数量上的变化,另一个与之相联系的现象也会相应地发生数量上的变化。 2、现象之间数量上不确定、不严格的依存关系。相关关系的全称为统计相关关系,它属于变量之间的一种不完全确定的关系。,5,相关关系与函数关系的区别和联系 区别 函数关系是变量之间的一种严格、完全确定性的关系,即一个变量的数值完全有另一个(或一组)变量的数值所决定、控制。函数关系通常可以用数学公式确切地表示出来。相关关系难以像函数关系那样,用数学公式去准确表达。,6,联系 由于客观上常会出现观察或测量上的误差等原因,函数关系在实际工作中往往通过相关关系表现出来。当人们对某些现象内部规律有较深刻认识时,相关关系可能变为函数关系。为此,在研究相关关系时,又常常使用函数关系作为工具,用一定的函数关系表现相关关系的数量联系。,7,相关关系的种类,8,根据相关关系的程度划分 1、不相关。 如果变量间彼此的数量变化互相独立,则其关系为不相关。自变量x变动时,因变量y的数值不随之相应变动。例如,产品税额的多少与工人的出勤率、家庭收入多少与孩子的多少之间都不存在相关关系。 2、完全相关。如果一个变量的变化是由其他变量的数量变化所唯一确定,此时变量间的关系称为完全相关。即因变量y的数值完全随自变量x的变动而变动,它在相关图上表现为所有的观察点都落在同一条直线上,这种情况下,相关关系实际上是函数关系。所以,函数关系是相关关系的一种特殊情况。 3、不完全相关。如果变量间的关系介于不相关和完全相关之间,则称为不完全相关。如妇女的结婚年龄与受教育程度之间的一种关系。 大多数相关关系属于不完全相关,是统计研究的主要对象,9,根据相关关系的方向划分 1、正相关。指两个因素(或变量)之间的变化方向一致,都是呈增长或下降的趋势。即自变量x的值增加(或减少),因变量y的值也相应地增加(或减少),这样的关系就是正相关。例如,工业总产值增加,企业税利总额也随之增加;家庭消费支出随收入增加而增加等。 2、负相关。指两个因素或变量之间变化方向相反,即自变量的数值增大(或减小),因变量随之减小(或增大)。 如劳动生产率提高,产品成本降低;产品成本降低,企业利润增加等。,10,根据自变量的多少划分 1、单相关。两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量。 2、复相关。三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量。,11,根据变量间相互关系的表现形式划分 1、直线相关(或线性相关)。当相关关系的自变量x发生变动,因变量y值随之发生大致均等的变动,从图像上近似地表现为直线形式,这种相关通称为直线(或线性)相关。例如,销售量与销售额之间就呈直线相关关系。 2、曲线(或非线性)相关。在两个相关现象中,自变量x值发生变动,因变量y也随之发生变动,这种变动不是均等的,在图像上的分布是各种不同的曲线形式,这种相关关系称为曲线(或非线性)相关。曲线相关在相关图上的分布,表现为抛物线、双曲线、指数曲线等非直线形式。例如,从人的生命全过程看,年龄与医疗费支出呈非线性相关。,12,相关分析和回归分析的任务 相关分析的主要内容 揭示现象之间是否存在相关关系。 确定相关关系的表现形式。 确定现象变量间相关关系的密切程度和方向。 回归分析的主要内容 建立相关关系的回归方程。 测定因变量的估计值与估计值的误差程度。,13,第二节 相关系数,相关关系的判断 定性判断法 这是从定性角度分析和判断现象之间是否具有相关关系,以及相关关系的类型。这种分析和判断所依据的是对现象的了解和对有关的理论知识、专业知识的掌握,以及一定的社会实践经验。,14,相关图表法 在定性判断的基础上,把具有相关关系的两个量的具体数值按照一定顺序平行排列在一张表上,以观察它们之间的相互关系,这种表就称为相关表;把相关表上一一对应的具体数值在直角坐标系中用点标出来而形成的散点图则称为相关图。利用相关图和相关表,可以更直观、更形象地表现变量之间的相互关系。,15,16,17,例2根据420个商店的销售额与流通费用率的资料,编制分组相关表(表92)和相关图(92)。,18,从表92可知,随着商品销售额的增加,流通费用率相应降低。 从图92进一步可知这两个变量之间相关点的分布状况及相关程度,表现为开始阶段流通费用下降较快,随着商品销售额的增加,下降渐趋平缓,两者关系呈近似双曲线相关。,19,相关系数 相关系数的概念 相关图可以帮助我们直观了解相关关系,但这只是初步的判断,是相关分析的开始。为了说明现象之间相关关系的密切程度,就要计算相关系数。相关系数是直线相关条件下说明两个现象之间相关关系密切程度的统计分析指标。,20,相关系数的测定与应用,21,22,23,24,25,26,27,相关关系的分析 相关系数的性质如下: 相关系数的取值范围在-1和+1之间,即:1r 1. 计算结果,若r为正,则表明两变量为正相关;若r为负,则表明两变量为负相关。 相关系数r的数值越接近于1(1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。如果r=1或1,则表示两个现象完全直线性相关。如果=0,则表示两个现象完全不相关(不是直线相关)。 ,称为微弱相关、 ,称为低度相关、 ,称为显著相关、 ,称为高度相关,28,第三节 回归分析简单直线回归,回归分析与相关分析的区别和联系 (一)回归分析的概念 回归分析,是指在相关分析的基础上,把变量之间的具体变动关系模型化,求出关系方程式,就是找出一个能够反映变量间变化关系的函数关系式,并据此进行估计和推算。,29,(二)回归分析与相关分析的区别与联系 1、回归分析与相关分析的区别 (1)相关分析所研究的两个变量是对等关系。 (2)对两个变量x和y 来说,相关分析只能计算出一个相关系数,计算中改变x和y 的地位不影响相关系数的数值;回归分析则不同,有时可以根据研究目的不同分别建立两个不同的回归方程。 (3)相关分析对资料的要求是:两个变量都必须是随机变量。 (4)相关分析只研究变量间是否存在关系以及关系的密切程度。回归分析研究的是变量间存在的是什么关系,比相关关系分析更进一步。,30,2、回归分析与相关分析的联系 (1)相关分析是回归分析的基础和前提。 (2)回归分析是相关分析的深入和继续。 因此,如果仅有回归分析而缺少相关分析,将会因为缺乏必要的基础和前提而影响回归分析的可靠性。如果仅有相关分析而缺少回归分析,就会降低相关分析的意义。只有把两者结合起来,才能达到统计分析的目的。,31,简单直线回归方程的确定 (一)直线回归方程 简单直线回归方程又称一元线性回归方程。它是根据成对的两种变量的数据,寻找一直线方程代替两变量的变化趋势,根据自变量的变动,来推算因变量发展趋势和水平的方法。它是研究相互关联的两种经济现象数量变动依存关系的一种方法。,32,(二)配合直线方程的前提条件 1、两个变量之间确实存在显著的相关关系 2、两种变量之间确实存在着直线相关关系,33,(三)确定直线回归方程 当两变量x、y 之间存在直线相关关系时,可以用直线方程 近似代替x与y的关系。方程中的参数a是回归直线的起点值,表现为当时回归直线的y坐标,即y轴上的一个点,数学上叫截距。参数b 是回归直线的斜率,即回归系数。它代表自变量x每增加一个单位时,因变量y的平均增加值。a和b 数值确定了,直线回归方程也就确定了。确定a、b的数值可用最小平方法,原理如下。,34,35,36,37,3、回归方程的作用 根据回归方程可以推算出已知值的估计值,以便估计误差。例如利用回归方程推求,工龄为8年时,其日产量为 (件),即约为73件。不仅可以推出已知的估计值。而且可以利用回归方程预测未知的值,如当工龄为3年时,其日产量估计值约为50件。,38,回归误差及计算 (一)回归误差的概念 回归直线是在直线相关条件下,反映两个变量之间一般数量关系的平均线。根据直线回归方程,我们知道了自变量的数值,就可以推算出因变量的数值。但是,推算出来的因变量数值并不是精确的数值,它是一个估计值,和实际值有出入。,39,(二)估计标准误差的计算 1、根据因变量实际值和估计值的离差计算 计算公式 (9.5) 计算公式又可写为:,40,从计算公式可以看出,计算的结果实际上也是个平均误差。但不是简单平均的,而是经过乘方、平均、再开方的过程,这和标准差的计算过程一样。它的作用是说明估计的准确程度,所以叫做估计标准误差,也叫做估计标准差或回归标准差。 现在用我们前边的例子(表91)来说明估计标准误差的计算步骤和方法。,41,首先要设计一张计算表,形式如表105,计算表左边三列是原始资料, 是根据直线回归方程推算出来的因变量估计值。根据y和 可以计算出后两栏材料并加以合计。 将计算结果代入公式即得:,42,43,2、根据a、b两个参数值计算估计标准误差 第一种计算方法含义很明显,计算公式和过程都表明了估计标准误差是用平均误差来表现的。但是计算比较麻烦,需要计算出所有的估计值。如果已经有了直线回归方程的参数值,可用一个比较简单的计算公式,即:,44,将表的相应数据和所得a、b的值代入公式,则:,45,估计标准误差的作用 (一)说明以回归直线为中心的所有相关点的离散程度。 (二)说明回归直线的代表性大小。 (三)估计标准误差的第三个作用是在抽样调查条件下,是计算回归抽样误差的一个根据。,46,回归误差与相关系数的关系 回归误差与相关系数,都具有说明现象之间的相关关系密切程度的作用。 相关关系与说明的现象之间的密切程度成正比关系,而回归误差概念比较明确,回归误差用绝对数表示,它所说明的密切程度并不那么明显,也不能说明是正相关还是负相关。,47,48,49,相关系数和估计标准差在数值的大小上表现为相反的关系。 (一)r值越大, 越小。r 值越大,说明相关程度越密切,这时 越小,也就是相关点距离回归直线比较近。当r 值大到时,即完全相关时,则 ,即估计标准误差等于0。从相关图上看,就是说所有的相关点全在回归直线上,这也就是完全相关。,50,(二)r值越小,则 值越大。r值越小,说明相关程度不密切,这时 值越大。从相关图上看,也就是相关点距离回归直线比较远。当r=0时,即不相关时,则估计标准差 ,即估计标准差等于y数列标准差,这说明相关点与回归直线的距离和相关点与y数列的平均线的距离一样,也就是回归直线和y数列的平均线是同一条直线。,51,相关分析应注意的问题 应建立在现象之间确实存在相关关系的基础上 回归方程、相关系数和回归误差应结合使用 要注意现象质的界限及相关关系作用的范围 要具体问题具体分析 要考虑社会现象之间的复杂性,52,实训,一、实训课题:相关与回归分析在经济与企业中的 运用 二、 实训目的 三、 实训资料 四 、实训要求 五 、实训形式:本实训是在学习了相关与回归分析 理论
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号