资源预览内容
第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
亲,该文档总共6页全部预览完了,如果喜欢就下载吧!
资源描述
数据分析课程设计姓名学号班级成 绩 评 定(等 级 记 分: A-20 B-18 C-15 D-12 E-10)选题的适宜性 A B C D E功能的完备性 A B C D E作业的独立性 A B C D E编程的规范性 A B C D E代码的正确性 A B C D E综 合 评 定1、需求分析主成份所关心的问题,是通过一组变量的几个线性组合来解释这组变量的方差-协方差结构,它的一般目的是数据的压缩以及数据的解释。虽然要求 n 个成分可以再现全系统的变异性常常只用少数 m 个主成分就可以说明。出现这种情况时,m 个主成分所包含的信息和 n 个变量所包含的几乎一个样多。所以 m 个主成分就可以代替初始的 n 个变量。主成分常常揭示出一些不曾预想到的关系,因而会对数据做出不同寻常的解释 。所以编写一套直接得出数据主成分的程序很有必要.在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。2、系统设计(1)运行环境:程序设计语言为 MATLAB,运行环境为安装 WINDOWS 系统和 MATLAB 系统的 PC 机。(2)结构设计:原始数据矩阵 标准化后的数据矩阵 矩阵的相关系数 矩阵的特征向量与特征值 方差贡献率 累计方差贡献率 主成分 分析3、程序代码pca.m %主成分分析(principal component analysis)function X0,X1,X3,X4=pca(X)%PCA 分析数据矩阵进行标准化处理,得出相关系数,特征值,特征向量排序%X 为 nxm 维的数据矩阵%调用语法为X0,X1,X3,X4=pca(X)%X 为原始数据矩阵%X0 为标准化之后的矩阵%X1 为标准化之后的数据矩阵的相关系数%X2 为特征向量%lambda 为特征值%X3 方差贡献率%X4 累计方差贡献率%-标准化数据矩阵-zeros(size(X);nr,nx=size(X); %nr,nx 分别为矩阵的行与列for mk=1:nrX0(mk,:)=(X(mk,:)-mean(X)./std(X);end%-求相关系数-fprintf( X0 为标准化之后的矩阵n X1 为标准化之后的数据矩阵的相关系数n X2为特征向量n lambda 为特征值n X3 方差贡献率n X4 累计方差贡献率n)X1=corrcoef(X0);%-求相关系数矩阵的特征值与特征向量-X2,lambda=eigs(X1)%-方差贡献率;累计方差贡献率- Xsum=sum(sum(lambda,2),1); for i=1:nx X3(i)=lambda(i,i)/Xsum; end for i=1:nx X4(i)= sum(sum(lambda(1:i,1:i),2),1)/Xsum; end 4、程序测试下面为北京,天津,河北,山西,内蒙古,辽宁,吉林,黑龙江,上海,江苏,浙江,安徽,福建 12 个省市的专项收入,行政事业性收费收入,罚没收入,国有资本经营收入国有资源(资产)有偿使用收入及其他收入的数据地区专项收入 行政事业性 收费收入 罚没收入 国有资本经 营收入国有资源(资产)有偿使用收入其他收入北 京 44.01 44.01 44.01 44.01 44.01 44.01天 津 16.44 100.69 8.16 23.75 42.77 15.92河 北 60.89 49.81 53.85 30.11 11.57 21.57山 西 115.15 46.87 36.01 1.34 6.44 18.10内蒙古 109.76 42.54 21.91 70.71 20.70 8.41辽 宁 45.67 93.76 41.89 145.66 69.46 10.80吉 林 18.93 43.64 29.80 17.66 11.82 4.14黑龙江 49.92 62.04 22.69 30.69 21.34 10.67上 海 42.30 85.27 20.01 -9.28 6.30 27.24江 苏 91.33 159.68 77.19 184.78 46.18 14.88浙 江 67.11 41.94 78.97 -46.38 11.47 5.58安 徽 47.05 85.43 28.34 17.44 47.16 9.19输入 a=结果为 a=调用主成分分析函数:X0,X1,X3,X4=pca(a)结果为:X0 为标准化之后的矩阵X1 为标准化之后的数据矩阵的相关系数X2 为特征向量lambda 为特征值X3 方差贡献率X4 累计方差贡献率X2 =0.0750 -0.7198 0.0009 0.5940 0.2554 0.24130.5649 0.0845 0.2889 -0.2115 -0.1248 0.7280 0.2464 -0.5696 -0.2519 -0.6996 0.1430 -0.20390.5889 -0.0701 -0.0199 0.2841 -0.5958 -0.46060.5173 0.3655 -0.1923 0.1566 0.7049 -0.20120.0111 -0.1089 0.9032 -0.0885 0.2165 -0.3430lambda =2.4475 0 0 0 0 00 1.4517 0 0 0 00 0 1.1665 0 0 00 0 0 0.6059 0 00 0 0 0 0.1750 00 0 0 0 0 0.1535X0 =-0.4719 -0.9417 -0.7508 -0.8979 -0.0613 -0.3537-1.3372 0.8300 -1.2494 -0.1956 0.7968 0.41850.0579 -0.5778 0.7631 -0.1011 -0.7526 1.25761.7608 -0.6592 -0.0227 -0.5285 -1.0074 0.74231.5916 -0.7790 -0.6438 0.5021 -0.2992 -0.6967-0.4198 0.6382 0.2363 1.6157 2.1224 -0.3418-1.2591 -0.7486 -0.2962 -0.2861 -0.7402 -1.3309-0.2864 -0.2395 -0.6094 -0.0925 -0.2674 -0.3611-0.5256 0.4033 -0.7274 -0.6863 -1.0144 2.09961.0132 2.4622 1.7912 2.1970 0.9662 0.26410.2531 -0.7956 1.8696 -1.2375 -0.7576 -1.1170-0.3765 0.4077 -0.3605 -0.2893 1.0149 -0.5809X1 =1.0000 -0.0389 0.3872 0.2399 -0.2068 0.0819-0.0389 1.0000 0.2497 0.7241 0.6373 0.27460.3872 0.2497 1.0000 0.2980 0.0238 -0.11510.2399 0.7241 0.2980 1.0000 0.6805 -0.0075-0.2068 0.6373 0.0238 0.6805 1.0000 -0.2175 0.0819 0.2746 -0.1151 -0.0075 -0.2175 1.0000X3 =0.4079 0.2419 0.1944 0.1010 0.0292 0.0256X4 =0.4079 0.6499 0.8443 0.9453 0.9744 1.0000由此可以马上得出前三个主成分的累计方差贡献率达 84.43 %就可以代替原 6 项指标进行进一步的分析。测试结果为程序具有可行性
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号