资源预览内容
亲,该文档总共2页全部预览完了,如果喜欢就下载吧!
资源描述
1 填空题 1多元分析研究的是多个随机变量及其相互关系的 统计总体。 2多元统计中常用的统计量有:样本均值、样本方 差、样本协方差和样本相关系数。 3协方差和相关系数仅仅是变量间离散程度的一种 度量,并不能刻画变量间可能存在的关联程度。 4人们通过各种实践,发现变量之间的相互关系可 以分成相关和不相关两种类型。 5总离差平方和可以分解为回归离差平方和和剩余 离差平方和两个部分,各自的自由度为 p 和 n- p-1,其中回归离差平方和在总离差平方和中所占比 重越大,则线性回归效果越显著。 7偏相关系数是指多元回归分析中,当其他变量固 定后,给定的两个变量之间的的相关系数。 8Spss 中回归方程的建模方法有一元线形回归、多 元线形回归、岭回归、多对多线形回归等。 9主成分分析是通过适当的变量替换,使新变量成 为原变量的综合变量,并寻求相关性的一种方法。 10主成分分析的基本思想是:设法将原来众多具 有一定相关性(比如P 个指标),重新组合成 一组新的互相无关的综合指标来代替原来的指标。11主成分的协方差矩阵为对角矩阵。 12主成分表达式的系数向量是相关系数矩阵的特 征向量。 13原始变量协方差矩阵的特征根的统计含义是原 始数据的相关系数。 14原始数据经过标准化处理,转化为均值为 0 , 方差为 1 的标准值,且其协方差矩阵与相关系数 矩阵相等。 15样本主成分的总方差等于 1 。 16变量按相关程度为,在相关性很强程度下,主 成分分析的效果较好。 17在经济指标综合评价中,应用主成分分析法, 则评价函数中的权数为方差贡献度。 19因子分析是把每个原始变量分解为两部分因素, 一部分是公共因子,另一部分为特殊因子。 20变量共同度是指因子载荷矩阵中第 i 行元素的 平方和。 21公共因子方差与特殊因子方差之和为 1 。 22聚类分析是建立一种分类方法,它将一批样哂 或变量按照它们在性质上的亲疏程度进行科学的分 类。 23Q 型聚类法是按样品进行聚类,R 型聚类法是 按变量进行聚类。 24 R 型聚类统计量通常采用具有代表性的变量。 25在聚类分析中需要对原始数据进行无量纲化处 理,以消除不同量纲或数量级的影响,达到数据间 可同度量的目的。常用的无量纲化方法有以下几种: 中心化变换、规格化变换、标准化变换、对数变换。26六种 Q 型聚类方法分别为最短距离法、最长距 离法、中间距离法、重心法、类平均法、可变类平 均法 28判别分析是要解决在研究对象已分成若干类的 情况下,确定新的观测数据属于已知类别中哪一类 的多元统计方法。 29用判别分析方法处理问题时,通常以判别函数 作为衡量新样本点与各已知组别接近程度的指标。 30进行判别分析时,通常指定一种判别规则,用 来判定新样本的归属,常见的判别准则有 Fisher 准 则、贝叶斯准则。 33Fisher 判别法就是要找一个由 p 个变量组成的 线性判别函数,使得各自组内点的离差尽可能接近, 而不同组间点的尽可能疏远。 二、简答题 1简述多元统计分析的作用。 答:能够简化数据的数据结构;能够进行分类 和组合;能够研究指标之间的依存关系;进行预测; 进行假设检验。 2简述矩阵 A 的特征根与特征向量的求法。 3 “最优”回归方程。 答:所谓“最优”回归方程,是指方程中包含 所有对应变量影响比较显著的变量,而不包括对应 变量影响不显著的变量的回归方程 4 简述逐步回归分析方法的基本原理。 原理是,从一个自变量出发,依照自变量对因 变量的影响显著性大小,从大到小逐个引入回归方 程,同时,在逐个自变量选入回归方程的过程中, 如果发现先前被引入的自变量在其后由于某些自变 量的引入而失去其重要性时,可以从回归方程中随 时予以剔除。引入一个变量或剔除一个变量,为逐 步回归的一步,每步都要进行显著性检验,以便保 证每次引入变量前回归方程中只包括显著性变量, 这个过程反复进行,直到既无不显著变量从回归方 程中剔除,又无显著变量需要选入回归方程时为止。5简述主成分的概念及几何意义。 主成分分析是采取一种数学降维的方法,找出几个 综合变量来代替原来众多的变量,使这些综合变量 能尽可能地代表原来变量的信息量,而且彼此之间 互不相关。这种将把多个变量化为少数几个互相无 关的综合变量的统计分析方法就叫做主成分分析或 主分量分析。 8提取样本主成分的原则。 (1)Fi于 Fj不相关。 (2)F1是 X1 ,X2 Xp的一切线 性组合中方差最大的,F2是与 F1不相关的 X1 ,X2Xp 一切线性组合中方差最大。Fp是与 F1 ,FP-1不相关的 X1 ,X1.Xp 一切线性组合中方差 最大。 10思考主成分分析法的应用。 首先,主成分分析可以用于系统评估;其次, 在经济统计研究中,除了经济效益的综合评价研究 外,对不同地区经济发展水平的评价研究,不同地 区经济发展竞争力的评价研究,人民生活水平、生 活质量的评价研究,等等都可以用主成分分析方法 进行研究;另外,主成分分析除了用于系统评估研 究领域外,还可以与回归分析结合,进行主成分回 归分析,以及利用主成分分析进行挑选变量,选择 变量子集合的研究。 11简述因子分析的基本思想。 因子分析是通过变量(或样品)的相关系数矩 阵内部结构的研究,找出存在于所有变量(或样品) 中具有共性的因素,并综合为少数几个新变量,把 原始变量表示成少数几个综合变量的线性组合,以 再现原始变量与综合变量之间的相关关系。其中, 这里的少数几个综合变量一般是不可观测指标,通 常称为公共因子。 12因子旋转。根据因了载荷阵的不唯一性,可对因子载荷阵 实行旋转即用一个正交阵右乘 A,使旋转后的因子 载荷阵结构简化,便于对公共因子解释,这就是因 子旋转。 13因子载荷。 因子载荷:其统计意义是第 1 个变量与第 1 人 公共因子的关系故即表示 Xi 的份量或比重,由于历 史的原因,心理学家将它叫载荷。 14简述系统聚类法的基本思想及主要步骤。 聚类分析是将样品或变量按照它们在性质上 的亲疏程度进行分类的多元统计分析方法。聚类分 析时,用来描述样品或变量的亲疏程度通常有两个 途径,一是把每个样品或变量看成是多维空间上的 一个点,在多维坐标中,定义点与点,类和类之间 的距离,用点与点间距离来描述样品或变量之间的 亲疏程度;另一个是计算样品或变量的相似系数, 用相似系数来描述样品或变量之间的亲疏程度 15简述系统聚类分析法。 是在样品距离的基础上定义类与类的距离,首 先将个样品自成一类,然后每次将具有最小距n 离的两个类合并,合并后再重新计算类与类之间的 距离,再并类,这个过程一直持续到所有的样品都 归为一类为止。这种聚类方法称为系统聚类法。根 据并类过程所做的样品并类过程图称为聚类谱系图。16简述聚类分析和判别分析的区别和联系。 区别:判别分析与聚类分析不同。判别分析是 在已知研究对象分成若干类型(或组别)并已取得 各种类型的一批已知样品的观测数据,在此基础上 根据某些准则建立判别式,然后对未知类型的样品 进行判别分类。聚类分析,并对于一批合定样品要 划分的类型事先不知道,正需要聚类分析来综合确 定类型的。 联系:判别分析与聚类分析往往联合使用,往往是 专职能部门类分析,再进行判别新样品属于哪一类。 建立判别式判别。 17判别分析的基本步骤。 步骤:(1)选择自变量或组变量,并计算各 组单变量描述的计量,对判别分析所要求的前提能 定进行统计检验;(2)推导判别系数组出标准化或 未标准化的典则判别函数系数,并进行安著性检验; (3)建立 Fisher 判别模型,根据 Bayes 规则和 Fisher 规则进行判别组合;4)进行样本回判分析, 对判别系数的结果进行分析;(5)输出结果,根据 实际情况分析出结果,做出结论。 18BAYES 判别法和 FISHER 判别法的比较。 Fisher 判别:又称典则判别,该方法的基本思 想是投影,即将原来在 R 维空间的自变量组合投影 到维度较低的 D 维空间上去,然后在 D 维空间再进 行分类。其优势在于对分布和方差没有什么限制, 应用范围广泛。 Bayes 判别:就是利用经验信息,基本思想是认为 所有 D 个类别都是空间中互斥的子城,每个观测都 是空间中的一点。其优点在于进行多类别判别,但 是它要求总体呈多元正态分布。 5简述逐步判别基本原理。 1.简述:(1)什么是判别分析; (2)请介绍几种常用判别的方法并阐述其 中一种判别方法的基本思想. (1)判别分析就是判别样品所属类型的一种统计方 法。 (2)距离判别法、Fisher 判别法、Bayes 判别法、 逐步判别法(一)距离判别法基本思想:根据已知分类的数 据,计算样品与各类之间的“距离” ,根据样品到类 之间的“距离”大小判别,样品到那个类的“距离” 最小,判样品属于哪个类。(二)Fisher 判别法的基本思想:从多个总体 (类)抽取一定的样本,借助方差分析的思想,建 立 p 个指标的线性判别函数,把待判样品代入线性 判别函数,然后与临界值比较,就可判样品属于哪 个类。 (三)Bayes 判别法的基本思想:对多个总体 (类)要求有一定的认识,利用借 Bayes 公式计算 样品到每个总体(类)的概率,比较概率的大小, 样品到那个总体(类)的概率最大,就判样品属于 哪个总体(类) 。 1.因子分析的基本思想:把每个研究变量分解为几个影响因素变量, 将每个原始变量分解成两部分因素,一部分是由所 有变量共同具有的少数几个公共因子组成的,另一 部分是每个变量独自具有的因素,即特殊因子。 2.主成分分析分析与因子分析的联系和差异:联系:(1)因子分析是主成分分析的推广, 是主成分分析的逆问题。 (2)二者都是以降维为 目的,都是从协方差矩阵或相关系数矩阵出发。区别:(1)主成分分析模型是原始变量的线 性组合,是将原始变量加以综合、归纳,仅仅是变 量变换;而因子分析是将原始变量加以分解,描述 原始变量协方差矩阵结构的模型;只有当提取的公 因子个数等于原始变量个数时,因子分析才对应变 量变换。 (2)主成分分析,中每个主成分对应的系 数是唯一确定的;因子分析中每个因子的相应系数 即因子载荷不是唯一的。 (3)因子分析中因子载荷 的不唯一性有利于对公因子进行有效解释;而主成 分分析对提取的主成分的解释能力有限。 3.因子载荷矩阵求解的方法: (1)基于主成分模型的主成分分析法 (2)基于因子分析模型的主轴因子法(3)极大似 然法(4)最小二乘法 (5)因子提取法 (6)映象分析法 4.因子分析的基本步骤: (1)因子分析的前提条件鉴定(2)因子提取(3)因子旋转(4)计算因子得分5 因子载荷阵的估计方法 (1)基于主成分模型的主成分分析法 Principal (2)基于因子分析模型的主轴因子法 Principal axis factoring 6 主成分分析概念及几何意义 概念(思想):主成分分析就是设法将原来指标 重新组合成一组新的互相无关的几个综合指标来代 替原来指标。同时根据实际需要从中可取几个较少 的综合指标尽可能多地反映原来的指标的信息 几何意义:主成分分析的过程也就是坐标旋转的过程,各主 成分表达式就是新坐标系与原坐标系的转换关系, 新坐标系中各坐标轴的方向就是原始数据方差最大 的方向。 7.聚类分析的基本思想: 是根据一批样品的多个观测指标,具体地 找出一些能够度量样品或指标之间相似程度的统计 量,然后利用统计量将样品或指标进行归类。把相 似的样品或指标归为一类,把不相似的归为其他类。 直到把所有的样品(或指标)聚合完毕. 8 系统聚类的基本思想是:距离相近的样品(或变 量)先聚成类,距离相远的后聚成类,过程一直进 行下去,每个样品(或变量)总能聚到合适的类中。系统聚类过程是:假设总共有 n 个样品(或变量) , 第一步将每个样品(或变量)独自聚成一类,共有
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号