资源预览内容
第1页 / 共57页
第2页 / 共57页
第3页 / 共57页
第4页 / 共57页
第5页 / 共57页
第6页 / 共57页
第7页 / 共57页
第8页 / 共57页
第9页 / 共57页
第10页 / 共57页
亲,该文档总共57页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第十一章 两变量间相关与回归分析 两变量间相关与回归分析课件 对一个变量的每个可能取值,另一个变量都有完全确定的值与之对应,则称这两个变量之间的关系呈现函数关系,称确定性关系。若两变量之间确实存在着某种关系,但这种关系不是一一对应的函数关系,称非确定性关系。 两变量间相关与回归分析课件 第一节第一节 直线相关直线相关 一、直线相关的概念一、直线相关的概念 描述两个变量相互关系最简单的统计方法描述两个变量相互关系最简单的统计方法就是直线相关分析:两个变量是否有直线相关就是直线相关分析:两个变量是否有直线相关关系关系?如果有直线相关关系,那么它们之间的如果有直线相关关系,那么它们之间的关系是正相关还是负相关关系是正相关还是负相关? 相关程度如何?相关程度如何? 两变量间相关与回归分析课件 散点图散点图 图图11-1 两变量相关关系示意图两变量相关关系示意图两变量间相关与回归分析课件二、相关系数的定义与计算二、相关系数的定义与计算 相关系数(相关系数(correlation coefficientcorrelation coefficient)又称为积差)又称为积差相关系数(相关系数(coefficient of product moment coefficient of product moment correlationcorrelation)、皮尔逊相关系数()、皮尔逊相关系数(Pearsons Pearsons correlation coefficientcorrelation coefficient)、简单相关系数)、简单相关系数(simple correlation coefficientsimple correlation coefficient)等)等, ,以符号以符号r r表表示样本相关系数,示样本相关系数,表示总体相关系数。它说明具有表示总体相关系数。它说明具有直线关系的两个变量,相关关系的密切程度与相关方直线关系的两个变量,相关关系的密切程度与相关方向的指标。向的指标。其值为其值为r。 两变量间相关与回归分析课件 计算公式计算公式 两变量间相关与回归分析课件三、相关分析的步骤三、相关分析的步骤 例例11-1某医师测得某医师测得10名名3岁儿童的体表岁儿童的体表面积面积(m2)与体重与体重(kg)原始资料见表原始资料见表11-1第第2、3栏栏,试分析三岁儿童体表面积与体重间试分析三岁儿童体表面积与体重间的相关关系。的相关关系。两变量间相关与回归分析课件 两变量间相关与回归分析课件计算步骤如下:计算步骤如下: 1、绘制散点图:、绘制散点图:两变量间相关与回归分析课件2 2、相关系数的计算、相关系数的计算 两变量间相关与回归分析课件4、相关系数的假设检验、相关系数的假设检验两变量间相关与回归分析课件四、相关分析中应注意的问题四、相关分析中应注意的问题(1) 进行相关分析的资料应有实际意义。(2)相关系数的计算适用双变量正态分布资料(3) 进行相关分析前应先绘制散点图。 图图11-3 异常点对相关分析的影响异常点对相关分析的影响 两变量间相关与回归分析课件(4)相关关系不完全等同于因果关系。(5)实际工作中计算出的相关系数仅是样本 相关系数(6)不要把相关系数的假设检验结果误认为 两事物或现象间相关的密切程度。 两变量间相关与回归分析课件(7)要注意资料的同质性。)要注意资料的同质性。 图图11-4样本来自不同总体时对相关性的影响样本来自不同总体时对相关性的影响两变量间相关与回归分析课件ndata li11_1; ninput x y; ncards;n11.00.5283n11.80.5299n12.00.5358n12.30.5292n13.10.5602n13.70.6014n14.40.5830n14.90.6102n15.20.6075n16.00.6411n;nproc corr;nvar x y; run;nproc plot;plot y*x=*;run;两变量间相关与回归分析课件 第二节第二节 直线回归直线回归相关分析是描述两变量之间相互关系相关分析是描述两变量之间相互关系 回归分析是分析两变量间是否有依存关系回归分析是分析两变量间是否有依存关系一、直线回归方程一、直线回归方程a称为截距,称为截距, b称之为斜率或回归系数,表示称之为斜率或回归系数,表示当自变量当自变量X每改变一个单位每改变一个单位,因变量因变量Y平均变动平均变动的单位数。的单位数。 两变量间相关与回归分析课件最小二乘法:最小二乘法: 二、实例求解回归方程二、实例求解回归方程例例11-2某地测得某地测得10名名3岁儿童的体表面积岁儿童的体表面积(m2)与与体重体重(kg)资料见表资料见表11-1第第2、3栏栏,试求试求3岁儿童由体岁儿童由体重推算体表面积的回归方程。重推算体表面积的回归方程。两变量间相关与回归分析课件二、实例求解回归方程二、实例求解回归方程1、绘制散点图。绘制散点图。2、计算、计算 77.55946 - 134.45.7266/10b 0.02385 1831.24 - (134.4)2/10 两变量间相关与回归分析课件3.绘制回归线绘制回归线 图图11-5 三岁儿童的体表面积与体重的回归线三岁儿童的体表面积与体重的回归线两变量间相关与回归分析课件三、直线回归方程的假设检验三、直线回归方程的假设检验1、回归系数的假设检验、回归系数的假设检验方差分析方差分析两变量间相关与回归分析课件两变量间相关与回归分析课件F=89.024, P0.01两变量间相关与回归分析课件 拒绝H0, 接受H1,回归方程有统计学意义,故可认为小儿体表面积与体重之间有直线回归关系存在。 2、回归系数的假设检验、回归系数的假设检验t检验检验 SY.X为剩余标准差, P0.01 两变量间相关与回归分析课件 四、直线回归方程的应用四、直线回归方程的应用1、描述两变量间的依存关系2、利用回归方程进行预测 所谓利用回归方程进行预测就是把自变量代入回归方程,对应变量进行估计,可求出因变量取值的波动范围,即个体Y值的预测区间(prediction interval, PI)。当X为某定值时 ,Y的1-预测区间为: 两变量间相关与回归分析课件SY为总体中当为总体中当X为某定值时为某定值时Y的标准差的标准差, 例12-3:例12-2所得的回归方程: 若已知某岁儿童的体重为若已知某岁儿童的体重为13.5kg, 试估计该儿童体试估计该儿童体表面积:表面积:两变量间相关与回归分析课件两变量间相关与回归分析课件3、利用回归方程进行统计控制 统计控制是利用回归方程进行逆估计,如要求因变量Y在一定范围内波动,可以通过控制自变量X的取值来实现。 两变量间相关与回归分析课件两变量间相关与回归分析课件ndata li11_2; ninput x y; ncards;n11.00.5283 11.80.5299 12.00.5358 12.30.5292 13.10.5602 13.70.6014n14.40.5830 14.90.6102 15.20.6075 16.00.6411n;nproc reg;nmodel y=x/stb nP /*输出y的实测值、预测值及其误差、残差*/nClm /*输出预测值均值的95%的置信区间*/ncli; /*输出y的95%的预测区间*/nRun;两变量间相关与回归分析课件五、直线回归分析中应注意的问题五、直线回归分析中应注意的问题1、进行回归分析要有实际意义。 2、注意直线回归分析的条件。 线性 独 立性 正态性 方差齐性 3、结果的正确解释:不能混淆P值与回归系 数的意义。4、线性回归应用时应考虑其实测范围。 两变量间相关与回归分析课件第三节第三节 直线回归与直线相关分析的区别与联系直线回归与直线相关分析的区别与联系一、直线回归与直线相关分析的区别 1. 资料要求不同。 2. 应用目的不同。 3. 统计意义不同二、直线回归与直线相关分析的联系 1. 正负符号一致 2. 假设检验等价 3. r与b可换算 4. 用回归解释相关:决定系数= 两变量间相关与回归分析课件 第四节 秩相关 一、Spearman等级相关系数 两变量间相关与回归分析课件 二、假设检验 例12-5 某保险公司在18个地区开展大病住院医疗保险,收集到表11-2(1)、(2)、(4)栏统计资料。资料中X表示承保深度(参保人数对该地区人口数的比例,%),Y表示因大病住院赔付系数(住院赔付额对保费收入的比例,%)。现欲研究大病住院医疗保险承保深度与赔付系数间的关系。 两变量间相关与回归分析课件两变量间相关与回归分析课件两变量间相关与回归分析课件data li11_5; input x y; cards;8.31.0 2.54.24.03.8 6.92.49.80.8 6.63.45.52.8 7.53.98.21.5 2.13.19.01.4 6.23.6;proc corr spearman;var x y; run;两变量间相关与回归分析课件 曲线拟合曲线拟合两变量间相关与回归分析课件二、曲线拟合的一般步骤二、曲线拟合的一般步骤依据分析目的确定自变量依据分析目的确定自变量X和应变量和应变量Y之之后,根据两变量散点图呈现的趋势,结后,根据两变量散点图呈现的趋势,结合专业知识及以往经验选择合适的曲线合专业知识及以往经验选择合适的曲线形式。形式。 选用适当的估计方法求得回归方程。选用适当的估计方法求得回归方程。 曲线直线化作最小二乘拟合,非线性最曲线直线化作最小二乘拟合,非线性最小二乘法,利用统计软件中的一些数值小二乘法,利用统计软件中的一些数值算法直接求得算法直接求得Y和和X关系的估计方程。关系的估计方程。两变量间相关与回归分析课件可结合散点图试配几种不同形式的曲可结合散点图试配几种不同形式的曲线方程并计算其线方程并计算其R2,一般来说,一般来说R2较大时较大时拟合效果较好。为了单纯地得到较大拟合效果较好。为了单纯地得到较大的的R2,模型的形式可能会很复杂,甚,模型的形式可能会很复杂,甚至使其中的参数无法解释实际意义。至使其中的参数无法解释实际意义。要充分考虑专业知识,结合实际解释要充分考虑专业知识,结合实际解释和应用效果来确定最终的曲线。和应用效果来确定最终的曲线。两变量间相关与回归分析课件例1:对数曲线拟合某研究者以已知浓度免疫球蛋白某研究者以已知浓度免疫球蛋白A (lgA,g/ml)作火箭电泳,测得火箭高度作火箭电泳,测得火箭高度(cm)如下表)如下表,试采用恰当的回归方程描试采用恰当的回归方程描述火箭高度述火箭高度Y与与lgA浓度浓度X之间的关系。之间的关系。 两变量间相关与回归分析课件两变量间相关与回归分析课件两变量间相关与回归分析课件对数曲线对数曲线两变量间相关与回归分析课件ndata dsh;ninput x y; x1=log10(x);ncards;n0.20 7.60 0.40 12.30 0.60 15.70 0.80 18.20n1.00 18.70 1.20 21.40 1.40 22.60 1.60 23.80n;nproc reg;nmodel y=x1; /*曲线直线化法*/nrun;两变量间相关与回归分析课件两变量间相关与回归分析课件ndata dsh2; ninput x y; ncards;n0.20 7.60 0.40 12.30 0.60 15.70 0.80 18.20n1.00 18.70 1.20 21.40 1.40 22.60 1.60 23.80 n;nproc nlin;nparms a=0 b=0;nmodel y=a+b*log10(x); run;两变量间相关与回归分析课件例2:指数曲线拟合例例某疾病防治站重复治疗钩虫病病某疾病防治站重复治疗钩虫病病人的次数(人的次数(X)与复查阳性率()与复查阳性率(y)资料如)资料如下。根据散点图用合适的曲线回归方程来拟下。根据散点图用合适的曲线回归方程来拟合此资料。合此资料。X 1 2 3 4 5 6 7 8Y 63.9 36.0 17.1 10.5 7.3 4.5 2.8 1.7两变量间相关与回归分析课件两变量间相关与回归分析课件指数曲线指数曲线两变量间相关与回归分析课件ndata zhsh; input x y;ncards;n1 63.9n2 36.0n3 17.1n4 10.5n5 7.3n6 4.5n7 2.8n8 1.7n;nproc nlin; parms a=0 b=0; modelny=exp(a+b*x);nproc plot; plot y*x=*; run;两变量间相关与回归分析课件两变量间相关与回归分析课件例3:抛物线拟合:抛物线拟合:n大气污染对日光紫外线辐射的影响研究大气污染对日光紫外线辐射的影响研究时间时间X 9 10 11 12 13 14 15紫外线紫外线强度强度Y .47 .57 .68 .73 .67 .55 .38 两变量间相关与回归分析课件ndata pwx; input x y;ncards;n9 0.47 10 0.57 11 0.68 12 0.73 13 0.67 14 0.55 15 0.38n;nproc nlin; parms a=0 b=0 c=0; model ny=a+b*x+c*x*2;nproc plot; plot y*x=+; run;两变量间相关与回归分析课件常见的几种常见的几种 曲线拟合曲线拟合两变量间相关与回归分析课件两变量间相关与回归分析课件两变量间相关与回归分析课件两变量间相关与回归分析课件
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号