资源预览内容
第1页 / 共60页
第2页 / 共60页
第3页 / 共60页
第4页 / 共60页
第5页 / 共60页
第6页 / 共60页
第7页 / 共60页
第8页 / 共60页
第9页 / 共60页
第10页 / 共60页
亲,该文档总共60页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第第7章章 相关分析与回归分析相关分析与回归分析4课时课时8/26/20241相关与回归分析(12)课件7.1 7.1 相关分析与回归分析的基本概念相关分析与回归分析的基本概念7.2 7.2 相关分析相关分析包括:定性分析、相关图表、相关系数包括:定性分析、相关图表、相关系数7.3 7.3 一元线性回归分析一元线性回归分析模型的拟合,模型的检验,预测模型的拟合,模型的检验,预测7.4 7.4 多元线性回归分析多元线性回归分析CH7内容体系内容体系狭义的相狭义的相关分析关分析广义的相广义的相关分析关分析广义的相关分析广义的相关分析狭义的相关分析狭义的相关分析回归分析回归分析8/26/20242相关与回归分析(12)课件第一节第一节 相关与回归分析相关与回归分析 的基本概念的基本概念8/26/20243相关与回归分析(12)课件7.1内容体系内容体系n一、经济变量间的数量关系一、经济变量间的数量关系n相关关系相关关系与函数关系与函数关系n二、相关关系的种类二、相关关系的种类n(一)完全相关、不完全相关、完全不相关(一)完全相关、不完全相关、完全不相关n(二)线性相关、非线性相关(二)线性相关、非线性相关n(三)单相关、复相关(三)单相关、复相关n(四)正相关、负相关(四)正相关、负相关n三、相关分析与回归分析三、相关分析与回归分析n(一)相关分析的主要内容(一)相关分析的主要内容n(二)回归分析的主要内容(二)回归分析的主要内容n(三)相关分析与回归分析二者的关系(三)相关分析与回归分析二者的关系8/26/20244相关与回归分析(12)课件前言:相关与回归分析的意义前言:相关与回归分析的意义在生产和经营活动中,经常要对变量之间的关系进在生产和经营活动中,经常要对变量之间的关系进行分析,比如行分析,比如v在企业生产中,要对影响生产成本的各种因素进在企业生产中,要对影响生产成本的各种因素进行分析,以达到行分析,以达到控制成本控制成本的目的的目的v在农业生产中,需要研究农作物产量与施肥量之在农业生产中,需要研究农作物产量与施肥量之间的关系,以便分析施肥量对产量的影响,进而间的关系,以便分析施肥量对产量的影响,进而确定合理的施肥量确定合理的施肥量v在商业活动中,需要分析广告费支出与销售量之在商业活动中,需要分析广告费支出与销售量之间的关系,进而间的关系,进而通过广告费支出来预测销售量通过广告费支出来预测销售量相关与回归分析研究的是相关与回归分析研究的是变量间变量间的一类的一类特定的数量特定的数量关系关系,主要研究各影响因素对结果变量变动的影响,主要研究各影响因素对结果变量变动的影响方向和程度方向和程度8/26/20245相关与回归分析(12)课件 一、经济变量间的数量关系一、经济变量间的数量关系(一)函数关系(一)函数关系(二)统计关系(二)统计关系/相关关系相关关系l相关与回相关与回归分析研归分析研究的内容究的内容8/26/20246相关与回归分析(12)课件(一)函数关系(一)函数关系(Function)1.是一一是一一对应的确定关系对应的确定关系2.设设有有两两个个变变量量 x 和和 y ,变变量量 y 随随变变量量 x 一一起起变变化化,并并完完全全依依赖赖于于 x ;当当变变量量 x 取取某某个个数数值值时时, y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的的函函数数,记记作作 y=f (x),其其中中 x 称称为为自自变变量量,y 称为因变量称为因变量 x xy y各各各各观测点观测点观测点观测点都严格都严格都严格都严格落在一条线上落在一条线上落在一条线上落在一条线上 8/26/20247相关与回归分析(12)课件函数关系函数关系(几个例子几个例子)某时期某商品的销售额某时期某商品的销售额y与销售量与销售量x之间的关系之间的关系 y = px (p 为单价为单价)圆的面积圆的面积S与半径与半径R之间的关系之间的关系 S= R2 企企业业的的原原材材料料消消耗耗额额y与与产产量量x1 、单单位位产产品品原原材材料料消消耗量耗量x2 、原材料价格原材料价格x3之间的关系之间的关系 y = x1 x2 x3 线性线性非线性非线性多自变量多自变量的非线性的非线性关系关系8/26/20248相关与回归分析(12)课件(二)相关关系(二)相关关系/统计关系统计关系(correlation)1.变变量量间间确确实实存存在在相相互互关关系系2.但但其其数数量量关关系系不不能能用用函函数数关关系系精精确确表表达达,即即:一一个个变变量量的的取取值值不不能能由由另一个变量唯一确定另一个变量唯一确定3.同同时时,也也并并非非无无任任何何规规律可循律可循 x xy y 各观测各观测各观测各观测点分布在点分布在点分布在点分布在直线直线直线直线或曲线或曲线或曲线或曲线周围周围周围周围 8/26/20249相关与回归分析(12)课件相关关系相关关系(几个例子几个例子)子女身高子女身高y与父亲身高与父亲身高x之间的关系之间的关系收入水平收入水平y与受教育程度与受教育程度x之间的关系之间的关系粮粮食食亩亩产产量量y与与施施肥肥量量x1 、降降雨雨量量x2 、温温度度x3之之间间的的关关系系商品的消费量商品的消费量y与居民收入与居民收入x之间的关系之间的关系商品销售额商品销售额y与广告费支出与广告费支出x之间的关系之间的关系8/26/202410相关与回归分析(12)课件相关关系区别于:相关关系区别于:l函数关系函数关系函数关系实际上是相关关系的极致函数关系实际上是相关关系的极致l伪伪相关相关/伪回归伪回归变量之间变量之间没有本质联系,只是表面数字的偶然的巧没有本质联系,只是表面数字的偶然的巧合合,比如,比如v上证指数与气温的关系上证指数与气温的关系v古巴哈瓦那的酒价与美国某州牧师工资的关系古巴哈瓦那的酒价与美国某州牧师工资的关系v某地鲸鱼自杀现象与该地物价的关系某地鲸鱼自杀现象与该地物价的关系v海湾石油价格与印度农业产量的关系海湾石油价格与印度农业产量的关系所以:单纯的数量分析有时非常危险;事所以:单纯的数量分析有时非常危险;事先的定性分析非常重要先的定性分析非常重要8/26/202411相关与回归分析(12)课件二、相关关系的分类二、相关关系的分类8/26/202413相关与回归分析(12)课件相相关关关关系系按相关的程度分按相关的程度分按相关的方向分按相关的方向分按相关的形式分按相关的形式分按影响因素的多少分按影响因素的多少分完全相关完全相关不完全相关不完全相关不相关不相关正相关正相关负相关负相关线性线性相关相关非线性相关非线性相关单单相关相关复相关复相关函数关系函数关系本章的研究对象:本章的研究对象:线性不完全单相关线性不完全单相关8/26/202415相关与回归分析(12)课件三、相关分析与回归分析三、相关分析与回归分析l(一)相关分析的主要内容(一)相关分析的主要内容l(二)回归分析的主要内容(二)回归分析的主要内容l(三)相关分析与回归分析二者的关系(三)相关分析与回归分析二者的关系l是本章理论上的重点问题是本章理论上的重点问题8/26/202416相关与回归分析(12)课件(一)相关分析的主要内容(一)相关分析的主要内容u是研究两个或两个以上的变量之间是研究两个或两个以上的变量之间相关程度大小相关程度大小的一种的一种统计方法统计方法n主要内容包括:主要内容包括:确定现象间有无关系存在,以及相关关系的形态,即确确定现象间有无关系存在,以及相关关系的形态,即确定相关关系的类型定相关关系的类型(单单/复、正复、正/负、线负、线/非线性、完全非线性、完全/)确定相关关系的密切程度确定相关关系的密切程度 主要方法是绘制相关图表和计算相关系数主要方法是绘制相关图表和计算相关系数r(第二节第二节)相关系数的检验相关系数的检验 两个变量的相关系数大多是由两个变量的相关系数大多是由样本值样本值计算出来,即计算出来,即用两变量的用两变量的样本相关系数样本相关系数来描述两变量的线性相关性来描述两变量的线性相关性 这样就产生一个问题:样本相关系数的绝对值大到这样就产生一个问题:样本相关系数的绝对值大到什么程度才能断定变量间的线性关系比较显著?什么程度才能断定变量间的线性关系比较显著? 这就需要进行显著性检验这就需要进行显著性检验(假设检验假设检验)8/26/202417相关与回归分析(12)课件(二)回归分析的主要内容(二)回归分析的主要内容n是寻找具有相关关系的变量间的数学表达式并进行统计推是寻找具有相关关系的变量间的数学表达式并进行统计推断的一种统计方法断的一种统计方法n主要内容包括:(第三节主要内容包括:(第三节/第四节)第四节)给出假定:根据定性和定量分析给出假定的回归方程的形式给出假定:根据定性和定量分析给出假定的回归方程的形式进行参数估计进行参数估计 根据样本观测值估计回归模型的参数,从而给出具体的根据样本观测值估计回归模型的参数,从而给出具体的回归方程回归方程进行统计显著性检验进行统计显著性检验 对回归方程、参数估计值进行显著性检验与校正,以便对回归方程、参数估计值进行显著性检验与校正,以便保证回归方程或参数的优良性保证回归方程或参数的优良性进行预测和控制进行预测和控制 根据回归方程进行适当的预测和控制根据回归方程进行适当的预测和控制8/26/202418相关与回归分析(12)课件总结:研究两个变量之间的相互关系总结:研究两个变量之间的相互关系n兴趣点在于:兴趣点在于:n两个两个变量之间是不是存在关系?变量之间是不是存在关系?n如果存在关系,如果存在关系,关系的紧密程度如何?关系的紧密程度如何?n如果存在密切关系,那么关系的具体形式是如果存在密切关系,那么关系的具体形式是什么?什么?n根据一个变量的变动来估计另一变量的变动,根据一个变量的变动来估计另一变量的变动,这种估计的可靠性如何?这种估计的可靠性如何?n如何对未来进行预测和控制?如何对未来进行预测和控制?l回归分析回归分析l定量定量l相关分析相关分析l定性定性/定量定量8/26/202419相关与回归分析(12)课件(三)回归分析与相关分析的关系(三)回归分析与相关分析的关系联系和区别联系和区别8/26/202420相关与回归分析(12)课件1、二者的联系、二者的联系n都是研究和处理变量之间相关关系的数理统计方法都是研究和处理变量之间相关关系的数理统计方法n二者互相补充,密切联系二者互相补充,密切联系回归分析是对具有回归分析是对具有密切相关关系的变量密切相关关系的变量进行深入分进行深入分析,建立变量间的数学关系式,并进行统计推断。析,建立变量间的数学关系式,并进行统计推断。所以,相关分析是回归分析的前提,对于相关程度所以,相关分析是回归分析的前提,对于相关程度低的变量进行回归分析没有实际意义,而回归分析低的变量进行回归分析没有实际意义,而回归分析是相关分析的进一步拓展,所以是相关分析的进一步拓展,所以(1)从分析顺序看,相关分析是回归分析的基础从分析顺序看,相关分析是回归分析的基础(2)从分析结果看,从分析结果看,回归分析回归分析能揭示相关关系能揭示相关关系的具体的具体形式形式(3)从计算的角度看,二者使用的指标形式接近、符从计算的角度看,二者使用的指标形式接近、符号相同,并且存在内在联系号相同,并且存在内在联系相关分析相关分析相关系数相关系数r回归分析回归分析回归系数回归系数b8/26/202421相关与回归分析(12)课件2、二者的区别、二者的区别(教材上的内容教材上的内容)(1)相关分析主要通过相关分析主要通过 r 来判断两变量间是否存在着相来判断两变量间是否存在着相互关系及其关系的密切程度,其前提条件是互关系及其关系的密切程度,其前提条件是两个两个变量都是随机变量变量都是随机变量,且变量之间不必区别自变量,且变量之间不必区别自变量和因变量;而回归分析研究和因变量;而回归分析研究一个随机变量一个随机变量(y)与另与另一个非随机变量一个非随机变量(x)之间的相互关系,且变量之间之间的相互关系,且变量之间必须区别自变量和因变量必须区别自变量和因变量(2)相关系数只能观察变量间相关关系的密切程度和方相关系数只能观察变量间相关关系的密切程度和方向,不能估计推算因变量的具体数值;而回归分向,不能估计推算因变量的具体数值;而回归分析可以根据回归方程,已知自变量数值推算因变析可以根据回归方程,已知自变量数值推算因变量的估计值量的估计值(3)互为因果关系的两个变量,可拟合两个回归方程,互为因果关系的两个变量,可拟合两个回归方程,且互相独立、不能互相替换;而相关系数却只有且互相独立、不能互相替换;而相关系数却只有一个,即自变量与因变量互换相关系数不变一个,即自变量与因变量互换相关系数不变8/26/202422相关与回归分析(12)课件二者的区别二者的区别(归纳归纳)1.变量的地位不同变量的地位不同相关相关分析中,变量分析中,变量 x 、变量、变量 y 处于平等的地位处于平等的地位回回归归分分析析中中,变变量量 y 称称为为因因变变量量,处处在在被被解解释释的的地地位位,x 称为自变量,用于解释和预测因变量的变化称为自变量,用于解释和预测因变量的变化2.变量的性质不同变量的性质不同相相关分析中所涉及的变量关分析中所涉及的变量 x 和和 y 都是随机变量都是随机变量 回回归归分分析析中中,因因变变量量 y 是是随随机机变变量量,自自变变量量 x 可可以以是随机变量,也可以是非随机的确定变量是随机变量,也可以是非随机的确定变量3.分析的目的不同分析的目的不同相相关分析主要描述两变量间关分析主要描述两变量间线性关系的密切程度线性关系的密切程度回回归归分分析析揭揭示示变变量量之之间间数数量量变变动动的的统统计计规规律律性性(不不仅仅可可以以由由回回归归方方程程揭揭示示变变量量 x 对对变变量量 y 的的影影响响大大小小,还还可以由回归方程进行预测和控制可以由回归方程进行预测和控制) 7.1结束结束8/26/202423相关与回归分析(12)课件第二节第二节 相关分析相关分析l(一)定性分析(一)定性分析l(二)相关图表(二)相关图表l(三)相关系数(三)相关系数8/26/202424相关与回归分析(12)课件一、定性分析一、定性分析n相关与回归分析的目的:相关与回归分析的目的: 从从数量上数量上研究社会经济现象的依存关系研究社会经济现象的依存关系n但是,首先要进行定性分析:但是,首先要进行定性分析: 研究者凭借自身的科学知识、判断能力,依据事研究者凭借自身的科学知识、判断能力,依据事物之间的普遍联系和相互作用等进行定性分析,避免物之间的普遍联系和相互作用等进行定性分析,避免对虚假的相关现象拿来进行相关、回归分析,否则,对虚假的相关现象拿来进行相关、回归分析,否则,其研究就会变成抽象的数字游戏,其结果将导致预测其研究就会变成抽象的数字游戏,其结果将导致预测和决策失误和决策失误伪相关伪相关/伪回归伪回归8/26/202425相关与回归分析(12)课件二、相关表和相关图二、相关表和相关图l相关分析的主要方法:相关分析的主要方法:l相关表相关表l相关图相关图l相关系数相关系数l以统计图表的形式来形象以统计图表的形式来形象地反映变量之间相关关系地反映变量之间相关关系的类型和紧密程度的类型和紧密程度l定量地表示变量之间相关关定量地表示变量之间相关关系的类型和紧密程度系的类型和紧密程度8/26/202426相关与回归分析(12)课件(一)相关表(一)相关表 相关表是一种反映变量之间相关关系的统计表相关表是一种反映变量之间相关关系的统计表有简单相关表和分组相关表有简单相关表和分组相关表1 1、简单相关表、简单相关表资料未经分组的相关表资料未经分组的相关表将其中一个变量按取值由小到大排列,然后,再将与将其中一个变量按取值由小到大排列,然后,再将与其相关的另一变量的对应值平行排列,即可其相关的另一变量的对应值平行排列,即可8/26/202427相关与回归分析(12)课件居民家庭编号居民家庭编号123458796101112月收入月收入X91315171820222226283033月储蓄月储蓄Y3546778109111012居民消费和收入的简单相关表居民消费和收入的简单相关表 单位:百元单位:百元 可看出:可看出:1. 两者之间存在明显的正相关关系两者之间存在明显的正相关关系 2.是不完全相关关系是不完全相关关系 12户家庭的月收入与月储蓄额数据户家庭的月收入与月储蓄额数据 单位:百元单位:百元居民家庭编号居民家庭编号123456789101112月收入月收入30132218172622201528933月储蓄月储蓄1051076987411312举例举例8/26/202428相关与回归分析(12)课件2、分组相关表、分组相关表(1)单变量分组表)单变量分组表只对具有相关关系的两变量中的一个进行分组,另一只对具有相关关系的两变量中的一个进行分组,另一个汇总出各组总量或计算各组相对数或平均数即可个汇总出各组总量或计算各组相对数或平均数即可一般是一般是自变量自变量企业规模与流通费用率相关表企业规模与流通费用率相关表 随着企业规模扩大,流通费用率有下降的趋势,是负相关随着企业规模扩大,流通费用率有下降的趋势,是负相关 但对应关系不十分严格,是不完全相关但对应关系不十分严格,是不完全相关8/26/202429相关与回归分析(12)课件(2)双变量分组表)双变量分组表/棋盘式分组表棋盘式分组表是对自变量和因变量都进行分组的相关表是对自变量和因变量都进行分组的相关表纵栏标题为纵栏标题为自变量自变量的分组资料的分组资料( (从小到大从小到大) ),横行标题,横行标题为为因变量因变量的分组资料的分组资料( (从大到小从大到小) )8/26/202430相关与回归分析(12)课件(二)相关图(二)相关图相关图相关图 也称散点图也称散点图,是描述变量之间关系的一种直观方法,是描述变量之间关系的一种直观方法 将实验观察或调查的成对将实验观察或调查的成对数据数据(xi,yi)(i=1,2,n)在在坐标图上坐标图上描描点形成的图点形成的图散点图可以反映的信息散点图可以反映的信息l变量之间有无联系变量之间有无联系l相关关系的类型和方向相关关系的类型和方向l相关关系的紧密程度相关关系的紧密程度8/26/202431相关与回归分析(12)课件散点图散点图(scatter diagram) 不相关不相关不相关不相关不相关不相关 不完全负线性相关不完全负线性相关不完全负线性相关不完全负线性相关不完全负线性相关不完全负线性相关 不完全正线性相关不完全正线性相关不完全正线性相关不完全正线性相关不完全正线性相关不完全正线性相关 不完全非线性相关不完全非线性相关不完全非线性相关不完全非线性相关不完全非线性相关不完全非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 8/26/202432相关与回归分析(12)课件散点图散点图(例题分析例题分析)l【例例】一一家家大大型型商商业业银银行行在在多多个个地地区区设设有有分分行行,其其业业务务主主要要是是进进行行基基础础设设施施建建设设、国国家家重重点点项项目目建建设设、固固定定资资产产投投资资等等项项目目的的贷贷款款。近近年年来来,该该银银行行的的贷贷款款额额平平稳稳增增长长,但但不不良良贷贷款款额额也也有有较较大大比比例例的的增增长长,这这给给银银行行业业务务的的发发展展带带来来较较大大压压力力。为为弄弄清清不不良良贷贷款款形形成成的的原原因因,研研究究者者希希望望利利用用银银行行业业务务的的有有关关数数据据做做些些定定量分析,以便找出控制不良贷款的办法量分析,以便找出控制不良贷款的办法l下面是该行所属下面是该行所属25家分行某年的有关业务数据家分行某年的有关业务数据 8/26/202433相关与回归分析(12)课件散点图散点图(例题分析例题分析)8/26/202434相关与回归分析(12)课件散点图散点图(例题分析例题分析)8/26/202435相关与回归分析(12)课件相关图的使用相关图的使用相关图能检验标志之间的关系与理论假设的某种相关图能检验标志之间的关系与理论假设的某种关系是否一致关系是否一致但是,在观察值的个数相对较少的情况下,相关但是,在观察值的个数相对较少的情况下,相关点的分布状态会随分组情况的改变而改变,还会点的分布状态会随分组情况的改变而改变,还会受到坐标轴设置的影响,此时受到坐标轴设置的影响,此时不能过于相信相关不能过于相信相关图图所以,相关图表只是辅助工具,不能单纯依据相所以,相关图表只是辅助工具,不能单纯依据相关图表下结论关图表下结论8/26/202436相关与回归分析(12)课件三、三、相关系数相关系数l定量地表示变量之间相关关系的定量地表示变量之间相关关系的类型和紧密程度类型和紧密程度8/26/202437相关与回归分析(12)课件(一)相关系数的定义和计算公式(一)相关系数的定义和计算公式8/26/202438相关与回归分析(12)课件1、定义:相关系数、定义:相关系数(correlation coefficient)1.对对变变量量之之间间相相关关方方向向及及程程度度的的度度量量指指标标,分分为为单单相相关关系数、复相关系数和偏相关系数系数、复相关系数和偏相关系数2.对对两两个个变变量量之之间间线线性性相相关关程程度度的的度度量量称称为为简简单单相相关关系系数数3.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称称为为总总体体相相关系数关系数,记为,记为 4.若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系系数数,记记为为 r8/26/202439相关与回归分析(12)课件2、计算公式(积差法公式)、计算公式(积差法公式)n 样本相关系数的计算公式样本相关系数的计算公式8/26/202440相关与回归分析(12)课件n显示显示x与与y是正相关还是负相关是正相关还是负相关n显示显示x与与y相关程度的大小相关程度的大小(1)分子是协方差)分子是协方差(2)分母是两个标准差)分母是两个标准差两个标准化两个标准化的随机变量的随机变量r实际上是两个标准化随机变量的实际上是两个标准化随机变量的协方差协方差8/26/202441相关与回归分析(12)课件为什么要标准化处理?为什么要标准化处理?xy 是有名数是有名数,不同现象的性质不同,变异情况不同,不同现象的性质不同,变异情况不同,不能直接以协方差大小比较不同现象的相关程度不能直接以协方差大小比较不同现象的相关程度 标准化的过程将协方差化为无名数,就可以进行标准化的过程将协方差化为无名数,就可以进行不同现象的相关程度高低的比较了不同现象的相关程度高低的比较了xy 数值可无限增多或减少数值可无限增多或减少 将变量离差标准化的结果使相关系数的绝对值不将变量离差标准化的结果使相关系数的绝对值不超过超过1,即相关系数在,即相关系数在-1与与+1之间变动之间变动8/26/202442相关与回归分析(12)课件(二)相关系数的性质(二)相关系数的性质-1.0+1.00-0.5+0.5完全负相关完全负相关完全负相关完全负相关无无无无线性线性线性线性相关相关相关相关完全正相关完全正相关完全正相关完全正相关负线性相关程度增加负线性相关程度增加负线性相关程度增加负线性相关程度增加r正线性相关程度增加正线性相关程度增加正线性相关程度增加正线性相关程度增加8/26/202444相关与回归分析(12)课件相关程度的判断标准相关程度的判断标准n|r|0.3 微弱线性相关,可视为不相关微弱线性相关,可视为不相关 n0.3|r|0.5 低度线性相关低度线性相关 n0.5|r|0.8 显著线性相关显著线性相关n0.8|r|1.0 高度线性相关高度线性相关注意注意vr是对变量之间是对变量之间线性相关关系线性相关关系的度量的度量v当当两两个个变变量量之之间间非非线线性性相相关关程程度度较较大大时时,有有可可能能导导出出r=0。因因此此,在在r=0或或很很小小时时,只只能能说说两两个个变变量量之之间间不不存存在在线线性性相相关关关关系系,而而不不能能轻轻易易得得出出不不存存在在相相关关关关系系的结论,应配合散点图作出合理的解释的结论,应配合散点图作出合理的解释v以上判断标准必须建立在对以上判断标准必须建立在对r进行进行显著性检验显著性检验的基础上的基础上8/26/202445相关与回归分析(12)课件实际计算公式实际计算公式n实际计算相关系数时常用下面的公式实际计算相关系数时常用下面的公式n公式来历:将定义公式中的离差平方按完全平公式来历:将定义公式中的离差平方按完全平方式展开,离差乘积也展开,再合并同类项即方式展开,离差乘积也展开,再合并同类项即可可8/26/202446相关与回归分析(12)课件相关系数的计算相关系数的计算(例题分析例题分析)nx,yxyx2,y28/26/202447相关与回归分析(12)课件Excel计算相关系数计算相关系数方法方法1:函数函数correl(array1,array2)方法方法2:“工具工具”“数据分析数据分析”“相关系数相关系数”1.确定输入区域,指定逐行或逐列计算相关系数确定输入区域,指定逐行或逐列计算相关系数2.确定输出区域,单元格、新工作表或工作薄确定输出区域,单元格、新工作表或工作薄8/26/202448相关与回归分析(12)课件相关系数相关系数(例题分析例题分析)n用用Excel计算相关系数计算相关系数8/26/202449相关与回归分析(12)课件案例:红楼梦的作者究竟是谁?案例:红楼梦的作者究竟是谁?n首先,将红全书首先,将红全书120回以每回以每40回为一个单回为一个单元进行划分:其中元进行划分:其中140回称作回称作A部分;部分;4180回称作回称作B部分;部分;81120回称作回称作C部分。部分。在三部分内根据具体规则对在三部分内根据具体规则对980个副词进行统个副词进行统计、计算、分析计、计算、分析n运用检索程序对各部分进行检索统计,统计数运用检索程序对各部分进行检索统计,统计数据见表据见表1(节选)(节选)8/26/202450相关与回归分析(12)课件表表1 红楼梦各部分副词出现次数表红楼梦各部分副词出现次数表副词出现次数(次)副词出现次数(次) 原文词汇数(个)原文词汇数(个) A B Cn1 265 188 198n2 62 56 77n3 35 19 47n4 20 35 16 n5 18 18 16n6 16 12 16n7 12 15 14n8 10 14 7n9 5 3 6n10 33 32 33n10以上以上 45 39 36n合计合计 528 432 481n单词出现次数单词出现次数 6763 6888 5763n平均比值平均比值 13.804 14.144 13.902n标准方差标准方差 48.951 50.132 49.6588/26/202451相关与回归分析(12)课件表表2 副词相关系数副词相关系数部分部分 E(X) s(X) XY r A 13.809 48.951 AB=1443011 ab=0.5204 B 14.144 50.132 BC=1464271 bc=0.5212 C 13.902 49.658 AC=1428373 ac=0.5206n nN=9808/26/202452相关与回归分析(12)课件结论结论n相关系数的测试结果表明:相关系数的测试结果表明:AC、AB、BC的相关系数相差不大,的相关系数相差不大,A、B、C三部三部分相关程度接近,基本说明三部分在副分相关程度接近,基本说明三部分在副词的用词手法上接近词的用词手法上接近8/26/202453相关与回归分析(12)课件(三)相关系数的显著性检验(三)相关系数的显著性检验8/26/202454相关与回归分析(12)课件问题的提出问题的提出一般情况下,总体相关系数一般情况下,总体相关系数 未知,通常根据未知,通常根据样本计算样本相关系数样本计算样本相关系数 r 作为总体相关系数作为总体相关系数的估计值的估计值而而r 是随机变量,抽取的样本不同,是随机变量,抽取的样本不同,r 的取值的取值也不同也不同能否根据某一样本的能否根据某一样本的 r 来说明总体的相关程度来说明总体的相关程度呢?呢?这就需要考察样本相关系数的可靠性这就需要考察样本相关系数的可靠性 r 的显著性检验的显著性检验8/26/202455相关与回归分析(12)课件相关系数的显著性检验相关系数的显著性检验(检验的步骤检验的步骤)1.检验两个变量之间是否存在检验两个变量之间是否存在线性线性相关关系相关关系2.等价于对回归系数等价于对回归系数 b b1的的检验检验3.采用采用R.A.Fisher提出的提出的 t t 检验检验4.检验的步骤为检验的步骤为n提出假设:提出假设:H0: ;H1: 0n n 计算检验的统计量值计算检验的统计量值:n n 确定显著性水平确定显著性水平 ,并作出决策,并作出决策 若若tt,拒绝拒绝H0; 若若 t t,不能拒绝不能拒绝H07.2结束结束8/26/202457相关与回归分析(12)课件
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号