资源预览内容
第1页 / 共84页
第2页 / 共84页
第3页 / 共84页
第4页 / 共84页
第5页 / 共84页
第6页 / 共84页
第7页 / 共84页
第8页 / 共84页
第9页 / 共84页
第10页 / 共84页
亲,该文档总共84页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
统计本科应用多元分析,Canonical Correlation Analysis,典型相关分析,第四军医大学卫生统计学教研室 宇传华,一、引言,第四军医大学卫生统计学教研室 宇传华,1. 两个随机变量Y与X 简单相关系数2. 一个随机变量Y与一组随机变量X1,X2, Xp 多重相关(复相关系数)3. 一组随机变量Y1,Y2,Yq与另一组随机变量X1,X2,Xp 典型(则)相关系数,(一)何时采用典型相关分析,典型相关是简单相关、多重相关的推广;或者说简单相关系数、复相关系数是典型相关系数的特例。,第四军医大学卫生统计学教研室 宇传华,典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。 由Hotelling (1935, 1936)最早提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它的应用。,第四军医大学卫生统计学教研室 宇传华,实例(X与Y地位相同),第四军医大学卫生统计学教研室 宇传华,1985年中国28 省市城市男生(1922岁)的调查数据。记形态指标身高(cm)、坐高、体重(kg)、胸围、肩宽、盆骨宽分别为X1,X2,X6;机能指标脉搏(次/分)、收缩压(mmHg) 、舒张压(变音)、舒张压(消音)、肺活量(ml)分别为Y1,Y2,Y5。现欲研究这两组变量之间的相关性。,第四军医大学卫生统计学教研室 宇传华,第四军医大学卫生统计学教研室 宇传华,简单相关系数矩阵,第四军医大学卫生统计学教研室 宇传华,简单相关系数公式符号,Corr(X)R11,Corr(Y)R22,Corr(Y,X)R21,Corr(X,Y)R12,第四军医大学卫生统计学教研室 宇传华,简单相关系数描述两组变量的相关关系的缺点,只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数(实例为30个),使问题显得复杂,难以从整体描述。(复相关系数也如此),第四军医大学卫生统计学教研室 宇传华,(二)典型相关分析的思想,采用主成分思想寻找第i对典型(相关)变量(Ui,Vi):,典型相关系数典型变量系数或典型权重,第四军医大学卫生统计学教研室 宇传华,X*1,X*2,X*p和Y*1,Y*2,Y*q分别为X1,X2,Xp和Y1,Y2,Yq的正态离差标准化值。记第一对典型相关变量间的典型相关系数为: CanR1Corr(U1,V1)(使U1与V1 间最大相关) 第二对典型相关变量间的典型相关系数为: CanR2Corr(U2,V2)(与U1、V1 无关; 使U2与V2 间最大相关) 第五对典型相关变量间的典型相关系数为: CanR5Corr(U5,V5) (与U1、V1 、 U4、V4无关; U5与V5 间最大相关)有: 1CanR1CanR2CanR50,第四军医大学卫生统计学教研室 宇传华,典型相关变量的性质,第四军医大学卫生统计学教研室 宇传华,(三)典型相关分析示意图,X1,Y1,Y2,Y3,Y4,Y5,X2,X3,X4,X5,X6,X,Y,U1U2U3U4U5,V1V2V3V4V5,CanR1CanR2CanR3CanR4CanR5,第四军医大学卫生统计学教研室 宇传华,二、典型相关系数及其检验,第四军医大学卫生统计学教研室 宇传华,(一)求解典型相关系数的步骤,求X,Y变量组的相关阵R=求矩阵A、B 可以证明A、B有相同的非零特征根3. 求A或B的i(相关平方)与CanRi,i1,m4. 求A、B关于i的特征根向量即变量系数,第四军医大学卫生统计学教研室 宇传华,(二)典型相关系数计算实例,求X,Y变量组的相关阵R=,第四军医大学卫生统计学教研室 宇传华,Corr(X)R11,Corr(Y)R22,Corr(Y,X)R21,Corr(X,Y)R12,第四军医大学卫生统计学教研室 宇传华,2. 求矩阵A、B,第四军医大学卫生统计学教研室 宇传华,A矩阵(pp),第四军医大学卫生统计学教研室 宇传华,B矩阵(qq),第四军医大学卫生统计学教研室 宇传华,3. 求矩阵A、B的(相关系数的平方),A、B有相同的非零特征值,第四军医大学卫生统计学教研室 宇传华,B矩阵求(典型相关系数的平方),第四军医大学卫生统计学教研室 宇传华,5个与典型相关系数,第四军医大学卫生统计学教研室 宇传华,4. 求A、B关于i的变量系数(求解第1典型变量系数),第四军医大学卫生统计学教研室 宇传华,求解第2典型变量系数,第四军医大学卫生统计学教研室 宇传华,求解第5典型变量系数,第四军医大学卫生统计学教研室 宇传华,5组(标准化)典型变量系数(X),第四军医大学卫生统计学教研室 宇传华,5组(标准化)典型变量系数(X),第四军医大学卫生统计学教研室 宇传华,由标准化典型变量系数获得原变量X对应的粗典型变量系数,粗典型变量系数可由标准典型变量系数与相应的标准差之比获得。,第四军医大学卫生统计学教研室 宇传华,5组(标准化)典型变量系数(Y),第四军医大学卫生统计学教研室 宇传华,(三)典型相关系数的特点,两变量组的变量单位改变,典型相关系数不变,但典型变量系数改变。(无论原变量标准化否,获得的典型相关系数不变)第一对典则相关系数较两组变量间任一个简单相关系数或复相关系数之绝对值都大,即CanR1max(|Corr(Xi,Yj)|) 或CanR1max(|Corr(X,Yj)|) max(|Corr(Xi,Y)|),第四军医大学卫生统计学教研室 宇传华,(四)校正典型相关系数(Adjusted Canonical Correlation),为了使结果更加明了,增加大值或小值,减少之间大小的值,将典型变量系数旋转,可得到校正的典型相关系数。缺点:1.可能影响max(U1,V1); 2. 影响(U1,V1)与其他典型变量间的独立性。,第四军医大学卫生统计学教研室 宇传华,(五)典型相关系数的标准误,第四军医大学卫生统计学教研室 宇传华,(六)E1H的特征值(见典型判别、MANOVA,E误差项,H组间变异),Eigenvalues of Inv(E)*H = CanRsq/(1-CanRsq),Eigenvalue Difference Proportion Cumulative 1 3.2422 2.0510 0.6546 0.6546 2 1.1912 0.8379 0.2405 0.8951 3 0.3533 0.2097 0.0713 0.9665 4 0.1436 0.1212 0.0290 0.9955 5 0.0225 0.0045 1.0000,第四军医大学卫生统计学教研室 宇传华,(七)典型相关系数的假设检验,全部总体典型相关系数均为0部分总体典型相关系数为0,第四军医大学卫生统计学教研室 宇传华,1. 全部总体典型相关系数为0,第四军医大学卫生统计学教研室 宇传华,F近似检验(SAS结果),Test of H0: The canonical correlations in the current row and all that follow are zeroLikelihood Approximate Ratio F Value Num DF Den DF Pr F1 0.06798466 2.24 30 70 0.00302 0.28840509 1.38 20 60.649 0.16863 0.63195301 0.80 12 50.561 0.65044 0.85521598 0.54 6 40 0.77295 0.97803479 0.24 2 21 0.7920,第四军医大学卫生统计学教研室 宇传华,F近似检验(计算公式),第四军医大学卫生统计学教研室 宇传华,多变量统计量与F近似检验,Multivariate Statistics and F ApproximationsStatistic Value F Value Num DF Den DF Pr FWilks Lambda 0.06798 2.24 30 70 0.0030Pillais Trace 1.71651 1.83 30 105 0.0133Hotelling-Lawley Trace 4.95277 2.62 30 35.396 0.0032 Roys Greatest Root 3.24221 11.35 6 21 .0001 NOTE: F Statistic for Roys Greatest Root is an upper boun.,第四军医大学卫生统计学教研室 宇传华,多变量统计量的计算公式,第四军医大学卫生统计学教研室 宇传华,2. 部分总体典型相关系数为0仅对较小的典型相关作检验,第四军医大学卫生统计学教研室 宇传华,卡方近似检验,第四军医大学卫生统计学教研室 宇传华,部分总体F近似检验(计算公式),第四军医大学卫生统计学教研室 宇传华,三、典型结构分析,第四军医大学卫生统计学教研室 宇传华,与原变量间的相关程度和典型变量系数有关。,典型变量与原变量的亲疏关系,原变量与自已的典则变量 原变量与对方的典则变量之间的相关系数。,第四军医大学卫生统计学教研室 宇传华,原变量在典型变量上的负荷(即原变量与典型变量间的相关系数),第四军医大学卫生统计学教研室 宇传华,负荷矩阵的表达,左上角的矩阵 X1=0.9050U1-0.0806U2+0.3777U3-0.1487U4+0.0887U5 X2=0.8616U1+0.0112U2+0.4152U3-0.0360U4+0.2412U5X6,右下角的矩阵 Y1= -0.4130 V1-0.0848V2+0.7353V3+0.4530V4+0.2764V5 Y2=0.4533V1+0.8452V2+0.0968V3+0.1433V4+0.2240V5.Y5,第四军医大学卫生统计学教研室 宇传华,各典型变量的意义解释,第四军医大学卫生统计学教研室 宇传华,等于该变量与自己这方典则变量的相关系数与典则相关系数的乘积,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号