资源预览内容
第1页 / 共12页
第2页 / 共12页
第3页 / 共12页
第4页 / 共12页
第5页 / 共12页
第6页 / 共12页
第7页 / 共12页
第8页 / 共12页
第9页 / 共12页
第10页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
多元数据分析练习题第二章多元正态的参数估计一. 判断题(1)若 是对角矩阵,则 相互独立。),(),(21pTpNXX pX,21( )(2)多元正态分布的任何边缘分布为正态分布,反之也成立。 ( )(3)对任意的随机向量 来说,其协方差矩阵 是对称矩阵,并且Tp),(21总是半正定的。 ( )(4)对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。 ( )(5)若 分别为样本均值和样本协差阵,则),(),(21 pTpNXX SX分别为 的无偏估计。 ( )Sn,二.计算题1. 假设随机向量 的协方差矩阵为 ,试求相关TX),(321 9234316系数矩阵 。R1341242. 假设随机向量 的协方差矩阵为 ,令Tx),(212019,试求 的协方差矩阵。2121,xyxyy,2173603.假设 ,其中 ,5.0.1),(3ANX T)1,2(,试求 的分布。412xy)4,(2N三.证明题1.设 是来自 的随机样本, 为样本均值。试证明: )()2()1,nX ),(pNX, 。(ED12.设 是来自 的随机样本, 为样本协差阵。试证明:)()2()1,n ),(p Sn1。(Sn3证明:若 维正态随机向量 的协差阵为对角矩阵,则p),(21pXX的各分量是相互独立的随机变量。X第四章判别分析一.判断题1.从某种意义上讲,距离判别是 Bayes 判别的一种特例。 ( )2.距离判别的思想是分别计算样本到各个总体的欧几里得距离,根据距离的大小判别样本属于哪个总体。 ( )3.量纲的变化对欧几里得距离的计算结果有影响,而马氏距离则克服了这种影响。欧氏距离是马氏距离的一种特例。 ( )4.贝叶斯判别法是一种考虑了总体出现的先验概率和误判损失的判别方法。 ( )5.在贝叶斯判别法中, 是一个划分, 是将样品误判给总体 的),(21kR)(xhi iG加权平均损失,则 。 ( )kixhxRjii ,21,(min6.费希尔判别法是借助方差分析的思想构造线性判别函数,使得总体之间区别最大,而使每个个体内部的离差最小。 ( )二.计算题1.设有两个正态总体 ,已知:21,G 14,3)(,52)1( 2(1)建立距离判别法的判别准则;(2)判断:样品: ,应归属于哪一类?31X2Gx(答案: ))5281024(31),(,148,222xxxGD2.设 G1,G2 为两个二元总体,从中分别抽取容量为 3 的样本如下:x1 x2 x1 x23 72 4 : G14 76 95 7 :G24 8(1)求两样本的样本均值 及协方差矩阵 ;)2(1,x21,STTx8,5,)63()2()1,6321(2)假定两总体协方差矩阵相等,记为 ,用 联合估计 ;21,S21,2(3)建立距离判别法则; 221212121 ,0),(;,0),()53(),( GxWGxxxW (4)假设有一新样品 ,进行距离判别。TT7,03.已知两总体的概率密度分别为 和 ,且总体的先验分布为 ,)(1xf2f 8.0,.21p误判损失为 。2(,5)1(c(1)建立 Bayes 判别准则;(2)假设有一新样品 满足 和 ,判定 的归属问题。0x3.6)01f 5.0)(2xf0x4. 假设两总体 G1,G2 的概率密度分别为 和1,1。5.,5)(2 xf(1)做出 和 的图像。若假定先验概率 , ,求 Bayes 判)(1f2xf 21p)2(c别区间的临界点;(0.25)(2)若 , ,求 Bayes 判别区间的临界点;(-0.33)8.0,.p)2(1c5.假定有 三个组,已知 , 和321G30.,65.0,.p 10.)(1xf, 。6.)(02xf 4.)(0xf(1)若不计误判损失,判定 属于哪个组;( ) (后验概率分别为 0.004,0.361,0.635)3G(2)假定误判代价矩阵为 1误判为 23G真实组 1G20)(c210)(c20)1(c3G60)31(c50)32(c0)3(c判定 属于哪个组。 (误判的平均损失为 51.39,36.05,41.95 )0x 2G6. 已知两总体的概率密度分别为 和 ,且总体的先验分布为 ,)(1xf2f 4.0,6.21p误判损失为 。)2(,4)1(c(1)建立 Bayes 判别准则;(2)假设有一新样品 满足 和 ,判定 的归属问题。0x36.0)(1f 24.0)(2xf0x( )G7.假设先验概率,误判代价及概率密度值已列于下表。试用贝叶斯判别法将样品分到组中的一个。若不考虑误判代价,则判别结果又将如何?321,1G判别为 2G3G真实组 123G0)(c421)3(c0)1(c5)32(c80)1(c2)3(c先验概率概率密度5.0p46)(1xf 1.0p)(2xf .0p7)(3xf8. 金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求” (两个总体均服从正态分布,协差阵相等),今测得两个总体的若干数据,并由这些数据得到 41,2,61(1)假设对某一金融分析员进行测量得到两个指标为 ,判别这一分析员是否能Tx),5(满足这项工作。(满足)(2)当两组先验概率分别为 ,损失相同。问该金融分析员满足要731.0,269.1q求吗?为什么?(不满足)第五章聚类分析一.判断题1.快速(动态)聚类分析中,分类的个数是确定的,不可改变。 ( )2.K 均值聚类分析中,样品一旦划入某一类就不可改变。 ( )3.判别分析,聚类分析和主成分分析都不要求数据来自正态总体。 ( )4.系统聚类可以对不同的类数产生一系列的聚类结果。 ( )5. K 均值聚类和系统聚类一样,可以用不同的方法定义点点间的距离。 ( )6. K 均值聚类和系统聚类一样,都是以距离的远近亲疏为标准进行聚类的。 ( )二. 计算题1. 下面是5个样品两两间的距离矩阵 0853617940)(D试用最长距离法作系统聚类,并画出谱系聚类图。2. 假设有 6 个样本,每个样本只测量一个指标,数据如表。样本点间使用绝对值距离,类间使用最长距离,利用系统聚类法对这 6 个样本进行分类。要求:(1)写出距离矩阵及类的合并过程;(2)画出聚类的谱系图;(3)写出样本分成两类时的结果。样本编号 1 2 3 4 5 6指标 1 1 2 4 3 -4 -23. 假定我们对 三个样品分别测量两个变量 和 得到结果如表:CBA, 1X2用快速聚类法将以上样品聚成两类。样品 变量X1 X2A 5 3B -1 1C 1 24. 检验某产品的重量,抽了 6 个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11,试用最短距离法,重心法进行聚类分析。5. 考虑下列 4 个样品的距离矩阵: ,用最短距离,最长距离法和类平均法043521对这 4 个样品进行聚类,并画出谱系图。6. 有 8 个样本,每个样本两个指标,数据如表。样本点间使用欧氏距离,类间使用最短距离法,利用系统聚类法对这 8 个样本进行分类。样本编号 1 2 3 4 5 6 7 8指标 1 2 2 4 4 -4 -2 -3 -1指标 2 5 3 4 3 3 2 2 -37.检验某产品的重量,抽了 5 个样品,每个样品只测了一个指标,分别为 1,2,6,11,试用快速聚类法将样品分为两类。三.简答题1.判别分析与聚类分析有何区别?判别分析是对于 n 个给定的样本,已知每个样本属于 k 个类别中的某一类,利用这些数据,找到一种判别方法,使得这种判别方法具有某种最优性质,能把属于不同种类的样本点尽可能的区别开来,并对测得同样指标数据的新样本,能够判别这个样本归属于哪一类。聚类分析是在样品和类之间定义一种距离,按照距离的大小对样品进行聚类,距离相近的样品先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品总能聚到合适的类中。聚类分析没有判别函数,对新的样品无法判别它应该归属哪一类,必须重新进行聚类过程,才能判别它属于哪类。系统聚类分析能够得到样品从最小的分类(每个样品自成一类)到最大的分类的情况,而判别分析没有这种功能,但判别分析的距离判别法与聚类分析非常相似,也是根据距离的远近判别样本的归属问题。2.K 均值法与系统聚类法的异同(1) K 均值法事先必须确定分类的个数,分类的个数确定,而系统聚类分析系统聚类分析能够得到样品从最小的分类(每个样品自成一类)到最大的分类的情况,可以根据需要将样品分为几类。(2) K 均值法可以随意将样品分为 K 类,根据样品到类中心的距离远近重新进行分类,而系统聚类中样品一旦划入某一类就不能更改。(3) K 均值法样品与不同类间的距离采用点到类中心的平方欧氏距离,而系统聚类中点间距离有很多种定义方法。3. 简述系统聚类法的思想。4. 简述快速聚类法的思想。第六章主成分分析一.判断题1.主成分分析数学模型中的正交变换,在几何上就是做一个坐标旋转。 ( )2假设 为某实际问题所涉及的 个变量, 是其 个主成分,pX,.21 ppY,.21判断下列说法是否正确:(1)由原始变量 的协方差矩阵和相关矩阵出发,求得的主成分是一致的。 p,.21( )(2)对变量做主成分分析之前,必须对原始数据进行标准化。 ( )(3)由标准化数据的协方差矩阵出发求得的主成分与由原始数据的相关系数矩阵出发求得的主成分一致。 ( )(4) 。 ( )jiYCovji,0),((5)由于 包含原始变量的信息量递减,因而实际应用中选取前几个主成分代p.21替原来的原始变量。 ( )(6)当各个变量取值范围相差不大或者是度量单位相同的指标时,一般选择直接从协方差矩阵求解。 ( )(7) 。 ( )piipii XVarYar11 )()((8)假设 的协方差矩阵为 , 为 的非零特征根,pX,.2 m,.21为对应的单位化的特征向量,则第 个主成分为 。mi,., i miXYTii ,.21,( )(9) 是 的线性组合。 ( )iYp,.21(10) 。 ( )iD,.)((11)主成分的协方差矩阵是对角阵。 ( )(12)方差贡献率表明了主成分综合原始变量的能力。 ( )3.主成分分析中的信息,是用变量期望的大小来表示的。 ( )二. 计算题1.假设总体 的协方差矩阵为 ,求 的主成分 并计算第TX),(2125X,21Y一主成分 的累计贡献率。1Y2.假设总体 的相关矩阵为 , 求 的标准TX),(3211R)1(X化变量的主成分 并计算各主成分的贡献率和累计贡献率。,321Y( ,)(1p))62,1(),021,(, 321 ttt3.假设总体 的协方差矩阵为 ,求 的主成分TX),(321 5024X并计算各主成分的贡献率和累计贡献率,确定应取几个主成分。,321Y4.设 的协方差矩阵为TpX),(21,其中 ,试求 的主成分及主成分具有p002
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号