资源预览内容
第1页 / 共83页
第2页 / 共83页
第3页 / 共83页
第4页 / 共83页
第5页 / 共83页
第6页 / 共83页
第7页 / 共83页
第8页 / 共83页
第9页 / 共83页
第10页 / 共83页
亲,该文档总共83页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Ch7 相关与回归分析,统计学原理,7.1 相关与回归的基本概念7.2 相关分析7.3 一元线性回归分析7.4 多元线性回归分析(new)7.5 回归诊断与残差分析(new),主要介绍: 相关分析,回归技术,回归诊断方法。,Ch7 主要内容,Ch7 相关与回归分析7.1 相关与回归的基本概念7.2 相关分析7.3 一元线性回归分析7.4 多元线性回归分析(new)7.5 回归诊断与残差分析(new),Ch7 学习目的,1,掌握相关与回归的基本概念2,掌握相关分析技术3,掌握一元线性回归方法4,掌握多元线性回归方法5,掌握回归诊断方法,Ch7 相关与回归分析7.1 相关与回归的基本概念7.2 相关分析7.3 一元线性回归分析7.4 多元线性回归分析(new)7.5 回归诊断与残差分析(new),Ch7 相关与回归分析,统计学原理,7.1 相关与回归的基本概念7.2 相关分析7.3 一元线性回归分析7.4 多元线性回归分析(new)7.5 回归诊断与残差分析(new),7.1 相关与回归的基本概念,7.1.1 确定性关系与相关关系7.1.2 回归函数与经验方程7.1.3 相关与回归分析7.1.4 相关表与相关图7.1.5 相关关系的种类,Ch7 相关与回归分析7.1 相关与回归的基本概念7.2 相关分析7.3 一元线性回归分析7.4 多元线性回归分析(new)7.5 回归诊断与残差分析(new),返回,7.1.1 确定性关系与相关关系,确定性关系也叫函数关系。 Y (X=X t), (7.1.1)即只要给定一个X,就可以确定一个Y,Y值随X的值变化,则变量Y, X之间,就是一种确定性的函数关系。Y (X=X t)是这两个变量之间的函数表达式。这个函数表达式,对应着一个具体的因果数学定理。 相关关系也叫统计关系或者经验关系。相关关系的特征是,“2个以上变量的变化方向大致是规则的”,变量Y , X之间的某种近似规则关系,不是一种精确的确定性关系,只是一个经验关系 Y (X=X t) +; (7.1.2)是Y与 (X=X t) 的偏差,且总假定E ()= 0。这种经验关系就是统计相关关系。统计相关关系,常常表现为一种统计定律。统计定律和相关关系,是相关回归分析的主要研究对象。,Ch7 相关与回归分析7.1 相关与回归的基本概念,返回,7.1.2 回归函数与经验方程,存在统计相关关系的变量Y , X之间,有Y (X=X t) +; (7.1.2)因为, E ()= 0 ,所以, E (Y |X= X t ) (X t) 是给定X=X t条件下Y的期望值, (X t) 就是Y关于X的期望函数。它实际反映的是Y,X之间存在的统计规律。因为统计规律,总是可以在日常的实践过程中,不断回归重现。于是,期望函数,也称为Y关于X的回归方程或回归函数,记为 (X=X t) E (Y |X= X t ) (7.1.3)回归函数的具体表达式,通常也叫经验函数或者经验公式。,Ch7 相关与回归分析7.1 相关与回归的基本概念,返回,7.1.3 相关与回归分析,相关与回归分析:是研究相关关系的一种有力数学工具。它是建立在对客观事物进行大量试验和观察的基础上,在不确定的现象中,寻找隐藏的统计规律性的数理统计方法。具体步骤是:第一步,根据研究的目的,通过观察和实验取得资料。第二步,整理资料。分组编制相关表,以便进行分析。第三步,绘制相关图。把成对的相关资料,绘成散布图或曲线图,从图形中,初步判断变量之间是否存在相关关系,以及相关的基本形式。第四步,相关关系的解析。建立回归方程,计算估计标准误差、相关系数等,以反映变量之间的关系、误差大小及密切程度,并运用数理统计方法,进行检验和评价。,Ch7 相关与回归分析7.1 相关与回归的基本概念,返回,7.1.4 相关表与相关图,相关表与相关图,是研究相关关系的直观工具。一般在进行详细的定量分析之前,可以先利用它们,对现象之间存在的相关方向、形式和密切程度,作大致的判断。相关表,是一种反映变量之间相关关系的统计表。将某一变量,按其取值的大小顺序排列,然后再将与其相关的另一变量的值,对应排列,便可得到简单的相关表。利用相关表,便可得到相关图。相关图又称散布图。它是以直角坐标系的横轴代表变量X,纵轴代表变量Y ,将两个变量的值,用坐标点 (Xt, Y t) 的形式描绘出来,用来反映两变量之间相关关系的图形。,Ch7 相关与回归分析7.1 相关与回归的基本概念,7.1.4 相关表与相关图,【例7-1】利用某国1951-1970年的消费Y 和可支配收入X数据,可整理得相关表与相关图。,Ch7 相关与回归分析7.1 相关与回归的基本概念,返回,7.1.5 相关关系的种类,按相关的程度可分为完全相关、不完全相关、不相关 按相关的方向可分为正相关、负相关 按相关的形式可分为线性相关和非线性相关 按所研究的变量的多少可分为单相关、复相关和偏相关,Ch7 相关与回归分析7.1 相关与回归的基本概念,返回,7.2 相关分析,7.2.1 相关系数7.2.2 相关系数与相关程度7.2.3 相关系数的检验7.2.4 等级相关系数及其检验,Ch7 相关与回归分析7.1 相关与回归的基本概念7.2 相关分析7.3 一元线性回归分析7.4 多元线性回归分析(new)7.5 回归诊断与残差分析(new),返回,7.2.1 相关系数,相关系数也叫单相关系数。它是在线性相关的条件下,用来测定变量Y , X之间相关程度的一个重要指标。通常以表示总体的相关系数,以表示样本的相关系数。存在线性相关的变量总体(Y , X), 定义为 (7.2.1)式中:Cov(X,Y)是变量X和Y的协方差,Var(X)和Var(Y)分别是X和Y的方差。对来自总体(Y , X)的n组样本观察值(Y t, X t),t=1,2,3,n-1,n,记为 (7.2.2)其中SX,Y=Cov(Xt,Yt)是样本(Y t, Xt)的协方差,SX和SY分别是X和Y 的样本标准差。样本相关系数,是根据样本观察值计算的。,Ch7 相关与回归分析7.2 相关分析,7.2.1 相关系数,总体值为常数,在很多情况下,是无法直接按定义计算的,只能通过样本相关系数,去估计值。容易证明,样本相关系数,是总体相关系数的一致估计量。可以证明,存在线性相关的变量之间,不论是总体相关系数,还是样本相关系数,均有0|1,0|1。为便于计算,引进如下符号: (7.2.3),Ch7 相关与回归分析7.2 相关分析,7.2.1 相关系数,【例7-2】利用某国1951-1970年的消费Y和可支配收入X数据,计算它们之间的相关系数。解:根据相关系数的公式,有 于是,Ch7 相关与回归分析7.2 相关分析,返回,7.2.2 相关系数与相关程度,如果|=1,表明(Y , X )之间是完全线性相关,完全线性相关,是一种精确的线性函数关系;如果|=0,表明(Y , X )之间没有关系或者线性无关;如果0|1,(Y , X )是一种线性统计关系,线性统计关系,是最常见的相关关系;01是正的线性相关;-10是负的线性相关。|值越大,则线性关比较系密切,反之,则线性关系不密切。同理,|=1,表示样本(Y t ,X t)为完全线性相关;=1,表示(Y t, X t)为完全正线性相关,样本的所有点(Y t, X t)都在一条直线上;=-1,表示(Y t, X t)为完全负线性相关,样本的所有点(Y t ,X t)也都在一条直线上;=0,表示样本点(Y t ,X t)在散点图上的分布是杂乱无章的,(Y t,X t)之间无相关关系;0|t/2,拒绝H0,表示Y, X之间相关显著。,Ch7 相关与回归分析7.2 相关分析,7.2.3 相关系数的检验,F统计量检验作统计假设零假设H0:=0,备择假设H1:0。计算样本相关系数的F值,选择显著性水平,取=1%或者=5%。根据和自由度1,n-2,求F分布的两个临界值F1-/2(1,n-2),F/2(1,n-2),且F1-/2(1,n-2) F/2(1,n-2)或F F1- /2(1,n-2),拒绝H0,表示Y, X之间相关显著。说明: F检验是双侧检验,有两个临界值F1-/2(1,n-2),F/2(1,n-2),且F1-/2(1,n-2)F/2(1,n-2),即接受零假设H0的临界区域为F1-/2(1,n-2)FF/2(1,n-2) FF/2(1,n-2)、1/F1/F1-/2(1,n-2);由于有FF(1,n-2)和1/FF (n-2,1),于是可以证明,在H0成立的条件下,F双侧检验等价于两个统计量F、1/F的单侧检验,两个统计量中只要有一个满足检验的要求即可,即F F/2(1,n-2)或者1/FF1-/2(1, n-2) =1/ F/2(n-2, 1)就接受H0。通常的做法是检验FF/2(1,n-2),且统一记FF/2。,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号