资源预览内容
第1页 / 共42页
第2页 / 共42页
第3页 / 共42页
第4页 / 共42页
第5页 / 共42页
第6页 / 共42页
第7页 / 共42页
第8页 / 共42页
第9页 / 共42页
第10页 / 共42页
亲,该文档总共42页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
SPSS 因子分析因子分析本章内容10.1 因子分析概述因子分析概述10.2 因子分析的基本内容因子分析的基本内容10.3 因子分析的基本操作及案例因子分析的基本操作及案例210.1因子分析概述10.1.1因子分析的意义因子分析的意义 在实际问题的分析过程中,人们往往希望尽可能多的搜在实际问题的分析过程中,人们往往希望尽可能多的搜集关于分析对象的数据信息,进而能够比较全面的、完整的集关于分析对象的数据信息,进而能够比较全面的、完整的把握和认识它。于是,对研究对象的描述就会有很多指标。把握和认识它。于是,对研究对象的描述就会有很多指标。但是效果如何呢?如果搜集的变量过多,虽然能够比较全面但是效果如何呢?如果搜集的变量过多,虽然能够比较全面精确的描述事物,但在实际建模时这些变量会给统计分析带精确的描述事物,但在实际建模时这些变量会给统计分析带来计算量大和信息重叠的问题。而消减变量个数必然会导致来计算量大和信息重叠的问题。而消减变量个数必然会导致信息丢失和信息不完整等问题的产生。信息丢失和信息不完整等问题的产生。 因子分析是解决上述问题的一种非常有效的方法。它以因子分析是解决上述问题的一种非常有效的方法。它以最少的信息丢失,将原始众多变量综合成较少的几个综合指最少的信息丢失,将原始众多变量综合成较少的几个综合指标(因子),能够起到有效降维的目的。标(因子),能够起到有效降维的目的。3因子分析的特点因子分析的特点1、因子个数远远少于原有变量的个数;、因子个数远远少于原有变量的个数;2、因子能够反应原有变量的绝大部分信息;、因子能够反应原有变量的绝大部分信息;3、因子之间不存在线性关系;、因子之间不存在线性关系;4、因子具有命名解释性。、因子具有命名解释性。410.1.2因子分析的数学模型和相关概念因子分析的数学模型和相关概念数学模型数学模型 假设原有变量有假设原有变量有p个,分别用个,分别用 表表示,且每个变量的均值是示,且每个变量的均值是0,标准差是,标准差是1,现将每个原,现将每个原有变量用有变量用k(kp)个因子)个因子 的线性组的线性组合来表示,即:合来表示,即:5 在这个数学模型中,在这个数学模型中,F称为公共因子,因为它出现在每个称为公共因子,因为它出现在每个变量的线性表达式中,简称因子。因子可理解为高维空间中互变量的线性表达式中,简称因子。因子可理解为高维空间中互相垂直的相垂直的k个坐标轴;个坐标轴;A称为因子载荷矩阵,称为因子载荷矩阵, 称为因子载荷,称为因子载荷,是第是第i个原始变量在第个原始变量在第j个因子上的负荷;个因子上的负荷; 称为特殊因子,表称为特殊因子,表示原始变量不能被因子解释的部分。其均值为示原始变量不能被因子解释的部分。其均值为0,相当于多元,相当于多元线性回归模型中的残差。线性回归模型中的残差。因子分析的几个相关概念因子分析的几个相关概念1、因子载荷、因子载荷 在因子不相关的前提下,因子载荷是第在因子不相关的前提下,因子载荷是第i个变量与第个变量与第j个个因子的相关系数。因子载荷越大说明因子与变量的相关性越强,因子的相关系数。因子载荷越大说明因子与变量的相关性越强,所以因子载荷说明了因子对变量的重要作用和程度。所以因子载荷说明了因子对变量的重要作用和程度。 6 2、变量共同度、变量共同度 变量共同度也称为公共方差。第变量共同度也称为公共方差。第i个变量的共同度定义个变量的共同度定义为因子载荷矩阵中第为因子载荷矩阵中第i行元素的平方和,即:行元素的平方和,即: 变量共同度是全部因子对变量变量共同度是全部因子对变量xi方差解释说明的比例,体现了方差解释说明的比例,体现了因子全体对变量因子全体对变量xi的解释贡献程度,越接近于的解释贡献程度,越接近于1,说明因子全,说明因子全体解释说明变量体解释说明变量xi的较大部分,变量共同度刻画了因子全体对的较大部分,变量共同度刻画了因子全体对变量变量xi信息解释的程度,是评价变量信息丢失程度的重要指标信息解释的程度,是评价变量信息丢失程度的重要指标73、因子的方差贡献、因子的方差贡献 因子方差贡献是因子载荷矩阵中第因子方差贡献是因子载荷矩阵中第j列元素的平方和,反列元素的平方和,反映了第映了第j个因子对原有变量总方差的解释能力。该数值越高,个因子对原有变量总方差的解释能力。该数值越高,说明相应因子的重要性越高。说明相应因子的重要性越高。810.2因子分析的基本内容10.2.1因子分析的基本步骤因子分析的基本步骤 1、因子分析的前提条件;、因子分析的前提条件; 因子分析的前提条件是原始变量之间应存在较因子分析的前提条件是原始变量之间应存在较强的相关关系。强的相关关系。 2、因子提取;、因子提取; 3、使因子更具有命名可解释性;、使因子更具有命名可解释性; 4、计算各样本的因子得分。、计算各样本的因子得分。910.2.2因子分析的前提条件因子分析的前提条件 1、计算相关系数并进行统计检验、计算相关系数并进行统计检验 如果相关系数矩阵中的大部分相关系数小于如果相关系数矩阵中的大部分相关系数小于0.3,那么,那么这些变量不适合进行因子分析。这些变量不适合进行因子分析。 2、计算反映象相关矩阵(越接近,相关性越强)、计算反映象相关矩阵(越接近,相关性越强)除主对角元素外,其他大多数元素的绝对值均较小,对角线上除主对角元素外,其他大多数元素的绝对值均较小,对角线上元素越接近,变量相关性越强。元素越接近,变量相关性越强。10 3、Bartletts球度检验球度检验 以原有变量的相关系数矩阵为出发点,假设相关系数以原有变量的相关系数矩阵为出发点,假设相关系数为单位矩阵,如果该检验对应的为单位矩阵,如果该检验对应的P值小于给定的显著性水平值小于给定的显著性水平a,则应拒绝原假设,认为原有变量适合进行因子分析。,则应拒绝原假设,认为原有变量适合进行因子分析。 4、KMO检验检验 该统计量取值在该统计量取值在0-1之间,越接近于之间,越接近于1说明变量间的相说明变量间的相关性越强,原有变量适合做因子分析。关性越强,原有变量适合做因子分析。0.9以上表示非常合以上表示非常合适;适;0.8-0.9表示合适;表示合适;0.7-0.8表示一般;表示一般;0.6-0.7表表示尚可;示尚可;0.5-0.6表示不太合适;表示不太合适;0.5以下表示极不合适。以下表示极不合适。1110.2.3因子提取和因子载荷矩阵的求解因子提取和因子载荷矩阵的求解 因子载荷矩阵的求解一般采用主成分法。主成分分析因子载荷矩阵的求解一般采用主成分法。主成分分析法通过坐标变换的手段,将原有的法通过坐标变换的手段,将原有的p个变量标准化后进行线个变量标准化后进行线性组合,转换成另一组不相关的变量性组合,转换成另一组不相关的变量y,即:,即:12式中的系数按以下原则进行求解:式中的系数按以下原则进行求解:(1)(2) 根据以上原则确定的变量依次为原始变量的第根据以上原则确定的变量依次为原始变量的第1、第、第2第第p个主成分。其中第一个主成分在总方差中所占比例个主成分。其中第一个主成分在总方差中所占比例最大,其余主成分在总方差中所占比例依次递减,即主成分最大,其余主成分在总方差中所占比例依次递减,即主成分综合原始变量的能力依次减弱。在主成份的实际应用中,一综合原始变量的能力依次减弱。在主成份的实际应用中,一般只选取前面几个主成分即可,这样既减少了变量的数目,般只选取前面几个主成分即可,这样既减少了变量的数目,又能够用较少的主成分反映原始变量的绝大部分信息。又能够用较少的主成分反映原始变量的绝大部分信息。13 可可见见,主主成成分分分分析析关关键键的的步步骤骤是是如如何何求求出出上上述述方方程程中中的的系系数数。通通过过方方程程的的推推导导可可以以发发现现,每每个个方方程程中中的的系系数数向向量量是是原原始始变变量量相相关关系系数数矩矩阵阵的的特特征征值值对对应应的的特特征征向向量量。具具体求解步骤如下:体求解步骤如下:(1)将原有变量进行标准化处理;)将原有变量进行标准化处理;(2)计算变量的相关系数矩阵;)计算变量的相关系数矩阵;(3)求求相相关关系系数数矩矩阵阵的的的的特特征征根根 及及对对应应的的特特征向量征向量 14 因因子子分分析析利利用用主主成成分分分分析析得得到到的的p个个特特征征根根和和对对应应的的特征向量,在此基础上计算因子载荷矩阵:特征向量,在此基础上计算因子载荷矩阵: 由由于于因因子子分分析析的的目目的的是是减减少少变变量量个个数数,因因此此在在计计算算因因子子载载荷荷矩矩阵阵时时,一一般般不不选选取取所所有有特特征征值值,而而只只选选取取前前k个个特特征征值值和和特特征征向向量量,得得到到下下面面包包含含k个个因因子子的的因因子子载载荷荷矩矩阵:阵: 15因子个数的确定方法:因子个数的确定方法:(1)根据特征根确定因子数:一般选取大于)根据特征根确定因子数:一般选取大于1的的特征根,还可规定特征根数与特征根值的碎石特征根,还可规定特征根数与特征根值的碎石图并通过观察碎石图确定因子数;图并通过观察碎石图确定因子数;(2)根据因子的累计方差贡献率确定因子数:)根据因子的累计方差贡献率确定因子数:通常选取累计方差贡献率大于通常选取累计方差贡献率大于85%的特征根的特征根个数为因子个数。个数为因子个数。1617例:例: 成绩数据(成绩数据(student.sav)100个个学学生生的的数数学学、物物理理、化化学学、语语文文、历历史史、英语的成绩如下表(部分)。英语的成绩如下表(部分)。 18从本例可能提出的问题从本例可能提出的问题能不能把这个数据的能不能把这个数据的6个变量用一两个综合变量来表示呢?个变量用一两个综合变量来表示呢?这一两个综合变量包含有多少原来的信息呢?这一两个综合变量包含有多少原来的信息呢?能能不不能能利利用用找找到到的的综综合合变变量量来来对对学学生生排排序序呢呢?这这一一类类数数据据所所涉涉及及的的问问题题可可以以推推广广到到对对企企业业,对对学学校校进进行行分分析析、排排序序、判别和分类等问题。判别和分类等问题。19例例中中的的的的数数据据点点是是六六维维的的;也也就就是是说说,每每个个观观测测值值是是6维维空空间间中中的的一一个个点点。我我们们希希望望把把6维维空空间间用用低低维维空空间间表表示。示。先先假假定定只只有有二二维维,即即只只有有两两个个变变量量,它它们们由由横横坐坐标标和和纵纵坐坐标标所所代代表表;因因此此每每个个观观测测值值都都有有相相应应于于这这两两个个坐坐标标轴轴的的两两个个坐坐标标值值;如如果果这这些些数数据据形形成成一一个个椭椭圆圆形形状状的的点点阵阵,那那么么这这个个椭椭圆圆有有一一个个长长轴轴和和一一个个短短轴轴。在在短短轴轴方方向向上上,数数据据变变化化很很少少;在在极极端端的的情情况况,短短轴轴如如果果退退化化成成一一点点,那那只只有有在在长长轴轴的的方方向向才才能能够够解解释释这这些些点点的的变变化化了了;这这样样,由二维到一维的降维就自然完成了。由二维到一维的降维就自然完成了。20当当坐坐标标轴轴和和椭椭圆圆的的长长短短轴轴平平行行,那那么么代代表表长长轴轴的的变变量量就就描描述述了了数数据据的的主主要要变变化化,而而代代表表短短轴轴的的变变量量就就描描述述了了数数据的次要变化。据的次要变化。但但是是,坐坐标标轴轴通通常常并并不不和和椭椭圆圆的的长长短短轴轴平平行行。因因此此,需需要要寻寻找找椭椭圆圆的的长长短短轴轴,并并进进行行变变换换,使使得得新新变变量量和和椭椭圆圆的长短轴平行。的长短轴平行。如如果果长长轴轴变变量量代代表表了了数数据据包包含含的的大大部部分分信信息息,就就用用该该变变量量代代替替原原先先的的两两个个变变量量(舍舍去去次次要要的的一一维维),降降维维就就完完成了。成了。椭圆(球)的长短轴相差得越大,降维也越有效果。椭圆(球)的长短轴相差得越大,降维也越有效果。2122对对于于多多维维变变量量的的情情况况和和二二维维类类似似,也也有有高高维维的的椭椭球,只不过无法直观地看见罢了。球,只不过无法直观地看见罢了。首首先先把把高高维维椭椭球球的的主主轴轴找找出出来来,再再用用代代表表大大多多数数数数据据信信息息的的最最长长的的几几个个轴轴作作为为新新变变量量;这这样样,主主成分分析就基本完成了。成分分析就基本完成了。注意,和二维情况类似,高维椭球的主轴也是互注意,和二维情况类似,高维椭球的主轴也是互相垂直的。这些互相正交的新变量是原先变量的相垂直的。这些互相正交的新变量是原先变量的线性组合,即主成分线性组合,即主成分(principal component)。正正如如二二维维椭椭圆圆有有两两个个主主轴轴,三三维维椭椭球球有有三三个个主主轴轴一样,有几个变量,就有几个主成分。一样,有几个变量,就有几个主成分。23原则上如果有原则上如果有n个变量,则最多可以提取出个变量,则最多可以提取出n个主个主成分,但如果将它们全部提取出来就失去了该方法成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义。多数情况下提取出前简化数据的实际意义。多数情况下提取出前 23个主成分已包含了个主成分已包含了85%以上的信息,其他的可以以上的信息,其他的可以忽略不计。忽略不计。提取出的主成分能包含主要信息即可,不一定非要提取出的主成分能包含主要信息即可,不一定非要有准确的实际含义。有准确的实际含义。249.2.4因子的命名因子的命名 观察因子载荷矩阵,如果因子载荷的绝对值在第观察因子载荷矩阵,如果因子载荷的绝对值在第j列的列的多个行上都有较大的取值,则表明因子多个行上都有较大的取值,则表明因子fj能够同时解释许多能够同时解释许多变量的信息,且对每个变量只能揭示较少部分信息,但不变量的信息,且对每个变量只能揭示较少部分信息,但不能代表任何一个原有变量。这种情况下,因子能代表任何一个原有变量。这种情况下,因子fj的含义是模的含义是模糊不清的,为解决这个问题,可通过因子旋转的方式是一糊不清的,为解决这个问题,可通过因子旋转的方式是一个变量值在尽可能少的因子上有比较高的载荷。因子旋转个变量值在尽可能少的因子上有比较高的载荷。因子旋转一般采用正交旋转使新生成的变量仍可保持不相关,正交一般采用正交旋转使新生成的变量仍可保持不相关,正交旋转一般采用方差最大法(旋转一般采用方差最大法(varimax)。然后再根据各因)。然后再根据各因子对各原始变量的解释程度进行命名。子对各原始变量的解释程度进行命名。259.2.5 计算因子得分计算因子得分在在因因子子分分析析实实际际应应用用中中,当当因因子子确确定定以以后后,便便可可计计算算各各因因子子在在每每个个样样本本上上的的具具体体数数值值,这这些些数数值值称称为为因因子子得得分分,形形成成的的变变量量称称为为因因子子变变量量。计计算算因因子子得得分分的的途途径径是是用用原原有有变变量量描描述因子,第述因子,第j个因子在第个因子在第i个样本上的值可表示为:个样本上的值可表示为:估估计计因因子子得得分分系系数数的的方方法法有有很很多多,通通常常采采用用最最小小二二乘乘意意义义下下的的回归法进行估计。回归法进行估计。Wj*R=SjR为为原原有有变变量量的的相相关关系系数数,Sj是是第第1,2,p个个变变量量与与第第j个个因因子的相关系数。子的相关系数。269.3因子分析的基本操作1、选择菜单、选择菜单AnalyzeData ReductionFactor,出现,出现主窗口:主窗口:272、把参与因子分析的变量选到、把参与因子分析的变量选到Variables框中。框中。3、选择参与因子分析的样本。把作为条件变量的变量指定到、选择参与因子分析的样本。把作为条件变量的变量指定到Selection Variable框中并单击框中并单击Value按钮输入变量值,按钮输入变量值,只有满足条件的样本数据才参与因子分析。只有满足条件的样本数据才参与因子分析。4、在主窗口中单击、在主窗口中单击Descriptives按钮指定输出结果。按钮指定输出结果。Statistics框中指定输出哪些基本统计量,其中框中指定输出哪些基本统计量,其中Univariate descriptives表示输出各个变量的基本描述表示输出各个变量的基本描述统计量;统计量;Initial solution表示输出因子分析的初始解。表示输出因子分析的初始解。Correlation Matrix框中指定考察因子分析条件的方法及框中指定考察因子分析条件的方法及输出结果,其中输出结果,其中Coefficients表示输出相关系数矩阵;表示输出相关系数矩阵;Significance levels表示输出相关系数检验的概率表示输出相关系数检验的概率p值;值;Determinant表示输出变量相关系数矩阵的行列式值;表示输出变量相关系数矩阵的行列式值;Inverse表示输出相关系数矩阵的逆矩阵;表示输出相关系数矩阵的逆矩阵;Anti-image表示输出反映象相关矩阵;表示输出反映象相关矩阵;KMO and Bartletts test of sphericity表示进行巴特利特球度检验和表示进行巴特利特球度检验和KMO检验。检验。28295、在主窗口中单击、在主窗口中单击Extraction按钮指定提取因子的方法。按钮指定提取因子的方法。在在Method框中提供了多种提取因子的方法,其中框中提供了多种提取因子的方法,其中Principal components是主成分分析法,是是主成分分析法,是SPSS默认默认的方法;在的方法;在Analyze框中指定提取因子的依据,其中框中指定提取因子的依据,其中Correlation matrix为相关系数矩阵,当原有变量存在数为相关系数矩阵,当原有变量存在数量级的差异时,通常选择该选项;量级的差异时,通常选择该选项;Covariance matrix为为协方差阵。在协方差阵。在Extract框中选择如何确定因子数目:在框中选择如何确定因子数目:在Eigenvaluse over后输入一个特征根值(默认值为后输入一个特征根值(默认值为1),),SPSS将提取大于该值的特征根;也可在将提取大于该值的特征根;也可在Number of factors框后输入提取因子的个数。在框后输入提取因子的个数。在Display框中选择输框中选择输出哪些与因子提取有关的信息,其中出哪些与因子提取有关的信息,其中Unrotated factor solution表示输出未旋转的因子载荷矩阵;表示输出未旋转的因子载荷矩阵;Scree plot表表示输出因子的碎石图。示输出因子的碎石图。30316、在主窗口中单击、在主窗口中单击Rotation按钮选择因子旋转方法。在按钮选择因子旋转方法。在Method框中选择因子旋转方法,其中框中选择因子旋转方法,其中None表示不旋转表示不旋转(默认选项);(默认选项);Varimax为方差最大法;为方差最大法;Quartimax为为四次方最大法;四次方最大法;Equamax为等量最大法;其他为斜交旋转为等量最大法;其他为斜交旋转法。在法。在Display框指定输出与因子旋转相关的信息,其中框指定输出与因子旋转相关的信息,其中Rotated Solution表示输出旋转后的因子载荷矩阵表示输出旋转后的因子载荷矩阵B;Loading plots表示输出旋转后的因子载荷散点图。表示输出旋转后的因子载荷散点图。327、在主窗口中单击、在主窗口中单击Scores按钮选择计算因子得分的方法。按钮选择计算因子得分的方法。选中选中Save as variables项表示将因子得分保存到项表示将因子得分保存到SPSS变量中,生成几个因子便产生几个变量中,生成几个因子便产生几个SPSS变量。变量名的形变量。变量名的形式为式为FACn_m,其中,其中n为因子编号,以数字序号的形式表为因子编号,以数字序号的形式表示;示;m表示是第几次分析的结果。选中表示是第几次分析的结果。选中Display factor score coefficient matrix项表示输出因子得分函数中的项表示输出因子得分函数中的各因子得分系数。在各因子得分系数。在Method框中指定计算因子得分的方法,框中指定计算因子得分的方法,其中其中Regression为回归法。为回归法。338、在主窗口中单击、在主窗口中单击Options按钮指定缺失值的处理方法和因按钮指定缺失值的处理方法和因子载荷矩阵的输出方法。在子载荷矩阵的输出方法。在Missing Values框中指定如框中指定如何处理缺失值。在何处理缺失值。在Coefficient Display Format框中指框中指定因子载荷矩阵的输出方式,其中定因子载荷矩阵的输出方式,其中Sorted by size表示以表示以第一因子得分的降序输出因子载荷矩阵;在第一因子得分的降序输出因子载荷矩阵;在Suppress absolute values less than框后输入一数值,表示输出框后输入一数值,表示输出大于该值的因子载荷。大于该值的因子载荷。349.4因子分析的应用举例 为研究全国各地区年人均收入的差异性和相似性,收集为研究全国各地区年人均收入的差异性和相似性,收集到到19971997年全国年全国3131个省市自治区各类经济单位包括国有经济单个省市自治区各类经济单位包括国有经济单位、集体经济单位、联营经济单位、股份制经济单位、外商位、集体经济单位、联营经济单位、股份制经济单位、外商投资经济单位、港澳台经济单位和其他经济单位的年人均收投资经济单位、港澳台经济单位和其他经济单位的年人均收入数据。由于涉及的变量较多,直接进行地区间的比较分析入数据。由于涉及的变量较多,直接进行地区间的比较分析较为繁琐,因此首先考虑采用因子分析方法减少变量个数,较为繁琐,因此首先考虑采用因子分析方法减少变量个数,之后再进行比较和综合评价。之后再进行比较和综合评价。359.4.1 考察原有变量是否适合进行因子分析考察原有变量是否适合进行因子分析 这里借助变量的相关系数矩阵、巴特利特球度检验和这里借助变量的相关系数矩阵、巴特利特球度检验和KMO检验方法进行分析。检验方法进行分析。 同时,由于数据中存在缺失值,采用均值替代法处理缺同时,由于数据中存在缺失值,采用均值替代法处理缺失值。失值。9.4.2 提取因子提取因子 首先进行尝试性分析,根据原有变量的相关系数矩阵,首先进行尝试性分析,根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取特征根值大于采用主成分分析法提取因子并选取特征根值大于1的特征根,的特征根,输出因子分析的初始解。输出因子分析的初始解。 重新指定提取特征根的标准,指定提取两个因子。重新指定提取特征根的标准,指定提取两个因子。369.4.3 因子的命名解释因子的命名解释 采用方差最大法对因子载荷矩阵实施正交旋转采用方差最大法对因子载荷矩阵实施正交旋转以使因子具有命名解释性。指定按第一因子载荷降以使因子具有命名解释性。指定按第一因子载荷降序的顺序输出旋转后的因子载荷以及旋转后的因子序的顺序输出旋转后的因子载荷以及旋转后的因子载荷图。载荷图。9.4.4 计算因子得分计算因子得分 采用回归法估计因子得分系数,并输出因子得采用回归法估计因子得分系数,并输出因子得分系数。分系数。379.4.5 各省市自治区的综合评价各省市自治区的综合评价 可利用因子得分变量对地区进行对比研究。首可利用因子得分变量对地区进行对比研究。首先,绘制两因子得分变量的散点图;其次,对各地先,绘制两因子得分变量的散点图;其次,对各地区人均年收入进行综合评价,采用计算因子加权总区人均年收入进行综合评价,采用计算因子加权总分的方法,以两个因子的方差贡献率为权数。分的方法,以两个因子的方差贡献率为权数。38练习根据基本建设投资数据判断是否适合作因子分析,根据基本建设投资数据判断是否适合作因子分析,如果可以作,提取几个因子比较合适?并对因子进如果可以作,提取几个因子比较合适?并对因子进行命名,计算综合得分。行命名,计算综合得分。39因子分析和主成分分析的一些注意事项因子分析和主成分分析的一些注意事项 可可以以看看出出,因因子子分分析析和和主主成成分分分分析析都都依依赖赖于于原原始始变变量量,也也只能反映原始变量的信息。所以原始变量的选择很重要。只能反映原始变量的信息。所以原始变量的选择很重要。另另外外,如如果果原原始始变变量量都都本本质质上上独独立立,那那么么降降维维就就可可能能失失败败,这这是是因因为为很很难难把把很很多多独独立立变变量量用用少少数数综综合合的的变变量量概概括括。数数据据越相关,降维效果就越好。越相关,降维效果就越好。在在得得到到分分析析的的结结果果时时,并并不不一一定定会会都都得得到到如如我我们们例例子子那那样样清清楚楚的的结结果果。这这与与问问题题的的性性质质,选选取取的的原原始始变变量量以以及及数数据据的的质质量等都有关系。量等都有关系。40Thank you部分资料从网络收集整理而来,供大家参考,感谢您的关注!
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号