资源预览内容
第1页 / 共35页
第2页 / 共35页
第3页 / 共35页
第4页 / 共35页
第5页 / 共35页
第6页 / 共35页
第7页 / 共35页
第8页 / 共35页
第9页 / 共35页
第10页 / 共35页
亲,该文档总共35页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
The Legendary Book onLinear Algebra目录第零章第一章第二章第三章第四章第五章第六章第七章第八章番外话 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .将打洞进行到底 . . . . . . . . . . . . . . . . . . . . . . . . . .Jordan 标准形总结秩不等式. . . . . . . . . . . . . . . . . . . . . . . .127. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12交结数:刻画相似程度的不变量 . . . . . . . . . . . . . . . . 16同时上三角化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19覆盖定理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23. . . . . . . . . . . . . . . . . . . . 25有理标准形和交换的矩阵解题的艺术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30I0番外话 先说一件很囧的事。 两年前我给北京大学化学学院一年级的学弟学妹们上高数的习题课。 开学第一次课来了三十个人,到期末的最后一次课只剩下十三个人。 虽说习题课不管讲的好坏都拿那份钱,学生也不会拿鸡蛋西红柿拍你,但是看着来上课的人越来越少确实对自尊是一种打击。 特别让我印象深刻的是一个相貌气质都很不错的MM(那十三个人之一) ,她每次课都在下面很认真的听,很安静,整个学期她只站起来问了三次问题,但是每一次都把我问倒了。 很显然这是对我的进一步打击。 我很无奈的承认自己不配拿那份津贴,就转行做了本学院高等代数课的助教。 这次给我打击的是另一个很清纯的 MM。有很多次我在黑板上出了题目,然后微笑着、踱着步子显示高深莫测的时候,她都举手表示已经做出了答案。 接下来我只能用凝固的微笑和景仰的目光看着她在全班面前用柔柔的声音解释如何如何。 不过总的来说,我还是成功的 Hold 住了局面,当时一个学年下来到课人数无明显下滑。 习题课上多了,自己也有一些体会。 讲课跟做题是不一样的,你必须脑子里时刻清楚自己在讲什么,接下来要讲什么,然后把它们用平缓的节奏一遍讲正确。 你讲的语气速度快了,或者思维有了跳跃,学生一下跟不上,那么你后面的内容他们听起来都很茫然。 当我一时不知道说什么好的时候,我会面色如常地擦擦黑板,换换粉笔,整理一下自己的思路,绝不轻易开口。 因为如果你不小心说错了话,那比没说要糟糕一百倍:接下来你要用十句话来挽救你的错误,学生很可能就被绕晕了。 即使是“嗯” “啊” “那么”这些口头禅,也会暴露你的思路的紊乱。高深莫测永远是 Hold、局面的不二法宝。 我曾经开玩笑地给学生说,我讲课有一个优点,就是从来没有口头禅。 结果大家都笑了。 我不解,然后大家异口同声的告诉我:老师,你讲课有一个口头禅,就是“很显然”(囧)。希望我在这个文档里没有再犯这个错误 :P。 本文档脱胎于以前的同名文档,经过多次修改以后与最初的版本相比已经面目全非。 但是变薄变精炼的趋势一直没有改变。 那些武侠小说中出现的秘笈宝典,几乎无一例外都是“薄薄的一本小册子”,因为浓缩的才是精华。 本文档也照此看齐,不求全,但求精致,通过几个专题来体现高等代数的方法和想法。 还是那句话,与其炖上一锅大杂烩,倒不如几样精致的小菜来得有滋味。 至于纯粹为难而难,或者为收录而收录的内容,就不在考虑之列了。文档薄一点,也是为了激发大家速成的欲望。 本文档是本人心血之作,也算经过了教学的实践检验,因此我相信质量不会太糟,但是错误恐怕仍然难以避免。欢迎大家来信指教:xidalapuda126.com11将打洞进行到底 之所以把这一章作为整本书的开始,是因为打洞是矩阵里面最基本最重要的技巧,江湖上出来混的没有不知道的,所以怎样强调它的重要性也不过分。下面这个例子就很好地说明了什么是打洞。定理 1.1. 设M=()A BC D是一个方阵,其中 A 是可逆的子方阵,那么| M| = | A| | D CA1 B|结论不难记,从 D 出发顺时针走一圈就可以了。证明. 思路就是利用 A 的可逆性来打洞,干掉 B, C 之一: )( ABA B 第一行左乘以 CA1 加到第二行 , 1 B0 D CAC D也就是( In0CA1 Im)(A BC D)(AB , 1 B0 D CA)=两边求行列式即可。 类似地,D 可逆的时候结论变成 | M | = | D | | A BD 1 C | (从 A 出发顺时针走一圈)。打洞说白了就是一个降阶的过程。 注意到如果把上式写成 () () 1 () A BIn0AB =, 1 I1 BC DCA0 D CAm这就很像一个分块的 LU 分解。 其实真正的 LU 分解和这个是一回事,这里就不具体写了。 如果把打洞的过程倒过来用,就是提升: 定 理 1.2. 设 A 是 n m 矩阵,B 是 m n 矩阵,则 AB 和 BA 的特征多项式只差一个因子 nm ,即 m |In AB| = n |Im BA|21. 将打洞进行到底1.1. 对称矩阵的打洞 只需要对 = 0 证明即可。 我们先证明 = 1 的时候结论成立,也就是 | Im AB| = | In BA| 成立。这只要在矩阵 () Im B A In中分别用 Im 和 In 各打一次洞就可得证:Im B = | In | | Im BA| = | Im | | In AB|A In对于一般的 = 0,只要在等式 | Im AB| = | In BA| 中用 A/ 替换 A 即可。1.1对称矩阵的打洞 打洞有很多重要的应用,特别是当 M 是对称矩阵的时候,如果你用 A 打两次洞干掉 B 和 B 就会发现这恰好是一个合同变换: )() () ( In A1 BA0In0A B = A 1 B1 B I D0Im0 DBABm特别强调的是,对称矩阵的打洞有特别重要的意义:由于 M 可以看作一个“内积”的度量矩阵,所以两边打洞实际上就是在这个“内积”下做 Schmidt 正交化,化二次型为标准形的配方法和矩阵法都源自于此。 这里简要描述一下矩阵法,详细的叙述请查阅教科书。 定 理 1.3 (化二次型为标准形的算法). 设 A = ( aij ) 是一个 n 阶对称矩阵,现在要把它合同为对角形。 如果 a11 = 0,那就用 a11 两次打洞合同掉第一行和第一列的其它元素,把 A 变 成 )( a11 0 , 0 然后考虑右下角的 n 1 阶的矩阵 。 如果 a11 = 0 但是某个 aii = 0,那就交换第 i 行和第 1 行,交换第 i 列和第 1 列, 把 aii 变到 a11 的位置上来,然后返回上一步。 如果 A 的对角线上都是 0,但是某个 aij 不是 0,那就把第 j 行加到第 i 行,第 j 列加到第 i 列,这样 aii 的位置上就出现了 2aij ,然后返回上一步。这样经过有限步以后就可以把 A 变成对角形。31. 将打洞进行到底1.1. 对称矩阵的打洞 这个算法说白了就是一句话:制造非零的对角元来干掉非对角元,其实就是不断地做 Schmidt 正交化。 正定矩阵是最容易化为标准形的对称矩阵,因为正定矩阵的对角元总不是 0(想一想,为什么? ,所以只需要第一个步骤就可以化为标准形。半正定矩阵的打洞也很)简单,虽然对角元可能出现 0,但是我们有下面的引理:引 理 1.4. 如果半正定矩阵 A 的某个对角元是 0,那么该对角元所在的行和列所有元素都是 0。证明. 由 于 A 半 正 定,所 以 有 平 方 根 分 解 A = P P。 记 P = (v1 , v2 , . . . , vn ), 则aij = (vi , v j ),这里的 (vi , v j ) 表示 vi 和 v j 的通常的欧式内积。 aii = 0 说明 vi = 0,从而第 i 行第 i 列都是 0。 可见半正定矩阵化为标准形本质上也只需要步骤 1,只不过对角线上遇到 0 的时候不用打洞,自动跳过去继续考虑右下角的矩阵。 接下来是引理 1.4 的两个应用: 定 理 1.5. 设 A 是一个实对称矩阵,min 和 max 为 A 的最小和最大的实特征值,aii 是 A 的任一对角元,则有min aii max ,而且两个不等号只要有一个成立则 aii 所在的行和列的其它元素就必然都是 0。证明. 只要对 A + min I 和 max I A 这两个半正定矩阵应用引理 1.4 即可。 定 理 1.6 (两半正定矩阵同时合同于对角形). 设 A, B 是两个 n 阶半正定矩阵,则存在可逆矩阵 T 使得 T AT, T BT 都是对角矩阵。证明. 首先做合同变换把 A 化成标准形(AEr 0 ,0 0)这时 B 仍然是半正定的(虽然 B 也发生了变化),所以不妨从一开始就假设 A 就是如上的标准形,并设 () B11 B12 B= , B12 = B21 , B21 B22我们要在保持 A 的形状的前提下把 B 化成标准形。 设正交矩阵 Q 使得 () Is 0 Q B22 Q = , 0 041. 将打洞进行到底1.2. 正定矩阵那么用矩阵(Ir 00 Q)作合同变换保持 A 不变,把 B 化为形如 B11 0 B = Is 0 0 0 0的矩阵。 注意这里已经利用了引理 1.4 的结论,由于 B 的最后一个对角元是零矩阵,所以它的最后一行和最后一列中的矩阵都是 0。 这个时候再用 Is 打洞消去“”的部分,这还是一个不影响 A 的合同变换,这就把 A, B 同时变成了准对角形,最后再用一次正交变换就可以了。1.2正定矩阵 正定矩阵的另一个名字是内积的度量矩阵,永远不要忘记这一点。 正定矩阵几乎所有结论都有对应的几何解释,所以只要你搞清楚这些结论的几何意义,正定矩阵其实就是一个很简单的东东。 设 v1 , v2 , . . . , vn 是 Rn 的一组基,那么矩阵 ( v1 , v1 ) ( v1 , v2 ) ( v1 , v n ) ( v2 , v1 ) ( v2 , v2 ) ( v2 , v n ) A= . . . . .( v n , v1 ) ( v n , v2 ) ( v n , v n )就是一个正定矩阵。 反过来,每一个正定矩阵都有如上的表示形式。 很显然,A 刻画了向量组 v1 vn 的长度以及它们之间的相互夹角,所以不难想象 v1 vn 的一些几何性质可以用 A 的代数性质来描述。反过来,如果有人问你正定矩阵的代数性质,你也要立刻想到它对应的几何解释。 举几个例子: 正定矩阵的对角元都不是零。这是显然的,因为 aii 代表 vi 的长度的平方,当然 不能是零。 正定矩阵中最大的元素必然出现在对角线上。 这是因为内积满足 Schwatz 不等 式 (vi , v j )2 (vi , vi )(v j , v j ),即 a2 aii a jj ,从而 aij max aii , a jj 。 ij 正定矩阵的行列式的值等于 v1 , v2 , . . . , vn 张成的平行多面体的体积的平方。正定 矩阵的主子式都大于零,这是因为主子式 Ai1 i2 im 的值是 vi1 , vi2 , . . . , vim 张成的 平行多面体的体积的平方,所以大于零。51. 将打洞进行到底1.2. 正定矩阵 例 1.7. 设 A 是 n 阶正定矩阵,求证 | A| a11 a22 ann ,等号成立当且仅当 A 是对角矩阵。 这个结论的几何解释就是:平行多面体的体积不大于各个棱长的乘积,当且仅当各棱垂直的时候等号成立。证明. 用归纳法,假设 n 1 的时候结论成立。设 () A n 1 A= , ann 11则 | A| = | An1 | | ann A1 |。 注意 0 ann A1 ann ,所以使用归纳假nn设即可。等号成立的条件也不难证明。 1 实 际 上 ann A1 这 个 量 也 是 有 它 的 几 何 解 释 的。 我 们 来 这 样 分 析:记nv1 vn1 张成的底面为 P,vn 可以分解为垂直于 P 的分量和属于 P 的分量的和:vn = vn + v ,n那么设vn P,v Pnv n = v n v = x 1 v 1 + + x n 1 v n 1 ,n两边依次用 v1 , . . . , vn1 作内积,我们得到这样一个方程组:( v 1 , v n ) = x 1 ( v 1 , v 1 ) + + x n 1 ( v 1 , v n 1 ),( v 2 , v n ) = x 1 ( v 2 , v 1 ) + + x n 1 ( v 2 , v n 1 ),(vn1 , vn ) = x1 (vn1 , v1 ) + + xn1 (vn1 , vn1 )采用上面例题中的记号,这个方程组就是 = An1 X,所以 1vn = (v1 , v2 , . . . , vn1 ) X = (v1 , v2 , . . . , vn1 ) A1 n () () 11 vn 2 = (v1 , v2 , . . . , vn1 ) A1 (v1 , v2 , . . . , vn1 ) A1 nn 1= A1 n根据勾股定理,vn 2 = vn 2 + v 2 ,我们就得到n 1v 2 = ann A1 nn 1你看到了什么?ann A1 是 vn 到 P 的距离的平方! 那它当然必须大于 0,同时n小于等于 vn 的长度的平方 ann。 思考题 1.8. 书上有这样一个定理:对称矩阵 A 是正定的当且仅当 A 的顺序主子式都大于 0。看看这个是怎样打洞的?和 LU 分解定理比较一下,它们是不是很像?思考题 1.9. 设 A 是一个元素都是整数的反对称矩阵,求证 | A| 是完全平方数。62Jordan 标准形总结 这一章主要介绍 Jordan 形的两个运算性质和两个代数性质。两个运算性质分别是计算 Jordan 块的多项式和与 Jordan 块交换的矩阵;两个代数性质是 Jordan 块的不可分解性和分裂性质。熟悉 Jordan 块的运算很重要,等你学到常微分方程的时候就会体会到这一点。2.1Jordan 标准形定理的证明 我们要说的这个证明在思想上没有什么先进之处,只是把老想法用新语言说了一遍,但是这的确是最简单的说法! 我们先说一个简单的引理:引 理 2.1. 设 A 是一个线性变换,如果向量 v 满足 Ak v = 0 但是 Ak+1 v = 0 (k N+ ),那么 v, Av, . . ., Ak v 线性无关。这个引理证明很简单,留给大家完成。 定 理 2.2. 设 A 是 V 上的幂零线性变换,则存在 V 的一组基使得 A 在这组基下的矩阵是一些 Jordan 块的和。证明. 对 V 的维数 n 归纳。n = 1 时显然,设 dim V n 时结论成立,考虑 dim V = n的情形。这时 A 的像空间 A(V ) 是 V 的 A 不变子空间且 dim A(V ) dim V,所以根据归纳假设存在 A(V ) 中的一组基v1 , Av1 , . . . , A a1 1 v1 ,v2 , Av2 , . . . , A a2 1 v2 , ,vm , Avm , . . . , A am 1 vm 使得 A 在 A(V ) 上的限制在这组基下为 Jordan 标准型。其中 A a1 v1 = A a2 v2 = =A am vm = 0。显然 A a1 1 v1 , . . ., A am 1 vm 都属于 Ker A。 下面把 A a1 1 v1 , . . ., A am 1 vm 扩充为 Ker A 的一组基,比如说扩充为A a1 1 v1 , ,A am 1 vm ,w1 , ,wr ,并选取 ui V 使得 Aui = vi。我们断言向量组u1 , Au1 , . . . , A a1 u1 ,u2 , Au2 , . . . , A a2 u2 , ,um , Aum , . . . , A am um ,w1 , . . . , wr 构成 V 的一组基。如果这一断言成立,那么 A 在这组基下显然就是 Jordan 标准型。72. Jordan 标准形总结2.2. JORDAN 块的运算特点 注意现在 A a1 u1 , . . ., A am um , w1 , . . ., wr 构成 Ker A 的一组基。 这组向量的线性无关性很好证,假设这些向量的某个线性组合 L 等于 0,两边用A 作用以后 A a1 u1 , . . ., A am um , w1 , . . . , wr 这些项被消掉,剩下的是一个只含有 v1 , . . .,A a1 1 v1 , . . ., vm , . . . , A am 1 vm 的线性组合为 0 的等式,所以它们前面的系数都是 0,即 u1 , . . ., A a1 1 u1 , . . . , um , . . ., A am 1 um 这些项在 L 中实际上不出现,从而 L 只包含A a1 u1 , . . ., A am um , w1 , . . ., wr 这些项。 但是这些项是 Ker A 的一组基,所以它们前面的系数也都是 0。 有了线性无关,要证明这组向量是一组基,只要再算算维数即可。 这组向量一共有 a1 + + am + r + m 个。 另一方面,dim A(V ) = a1 + + am ,dim Ker A =m + r。 注意由同态基本定理 dim V = dim A(V ) + dim Ker A,所以这些向量的个数等于 V 的维数,从而它们构成 V 的一组基。2.2Jordan 块的运算特点 学到现在,你应该知道这个小规律(不知道的话用力将头撞墙三下 :P)当 J 是一个幂零的 Jordan 块的时候, 0 1 . 0 J= , . . 1 0 nn那么 J 2 就是把 J 中的 1 向右上方平移一层,J k 就平移 k 1 层,J n 就变成零矩阵了。用这个规律我们可以很快算出一般的 Jordan 块 1 . J= . . 1 nn的多项式来:对于给定的 m 次多项式 f ( x ),在 点作 f 的 Taylor 展开:f ( x ) = a0 + a1 ( x ) + + a m ( x ) m ,那么 a0 a1 . a0 f ( J) = . .a n 1 . . . a1 a0可见 Jordan 块的多项式是很好算的,其形状是一个上三角的分层矩阵。82. Jordan 标准形总结2.3. 与 JORDAN 块交换的矩阵2.3与 Jordan 块交换的矩阵反过来我们可以证明与一个 Jordan 块 J 交换的矩阵必然可以表示为 J 的多项式。定理 2.3. 设 J= 0 1. . 0 , . 1 0 nn且矩阵 A 满足 AJ = J A,则 A 必然形如 a0 a1 . .a0 A= .a n 1 . . . , a1 a0即 A 可以表示为 J 的多项式。证明. 设 , J, . . ., J n1 构成空间的一组基,则 A 可以表示为它们的线性组合A = a0 + a1 J + + an1 J n1 = f ( J )其中 f ( x ) = a0 + a1 x + + an1 x n1。不难验证对任何的 i,A( J i ) = J i ( A) = J i ( f ( J ) = f ( J )( J i )既然在一组基上有 A = f ( J ) 成立,那么自然在全空间上也成立。2.4Jordan 块的不可分解性设 J 是有限维向量空间 V 上的线性变换,且 J 在一组基下的矩阵是 Jordan 形: 1 . . ( 1 , 2 , . . . , n ) J = ( 1 , 2 , . . . , n ) . . 1 我们有如下的结论:定理 2.4. 不存在 V 的一对 J 不变的真子空间 U, W 使得 V = U W。92. Jordan 标准形总结2.5. JORDAN 块的分裂证明. 只要证明 = 0 的情形即可(否则就用 J In 代替 J)。这里的关键在于 J 仅有一个线性无关的特征向量:由于 r( J ) = n 1,所以齐次线性方程组 JX = 0 的解空间是一维的,这就等价于说 J 关于特征值 0 的特征子空间是一维的。 如果存在满足条件的一对 U, W,那么 J 在 U 和 W 上就会各自有一个特征向量,这就导致了矛盾。 这个结论的意义是什么呢?说的就是 Jordan 块具有不可分解性:Jordan 块矩阵对应的线性变换不能再分解为两个更小的线性变换的直和。 就像整数可以唯一分解为素数的乘积,多项式在复数域上可以唯一分解为一次因式的乘积一样,线性变换在复数域上可以唯一分解为 Jordan 块的和,这些组成单元不能够再进行分解。 如果说 Jordan 块的不可分解性是一个极端的话,那么对角矩阵的“完全可约性”则是另一个极端: 思 考 题 2.5. 设 A 是复数域上有限维向量空间 V 上的线性变换,则 A 可对角化的充要条件是对任何 A 不变子空间 U,都有 A 不变子空间 W 使得 V = U W 成立。然而 Jordan 块的幂却是可以分解的,而且分解的很规则,这就是下面要讨论的。2.5Jordan 块的分裂我们来算 J k 的标准形。分情况讨论,先看 = 0 的情形:这个时候 J 是一个移位算子:J: n n1 1 0,整个轨道只有一条。但是 J k 则是 k 步 k 步地跳: n n2k 0, n1 n1k 0,k J : nk+1 n2k+1 0所以 J k 有 k 条轨道,每个轨道都是一个 Jordan 块,即 J K 的标准形中有 k 个 Jordan块。设 n = qk + r,这里 0 r k,则这 k 个 Jordan 块中有 r 个是 q + 1 阶的,另外k r 个是 q 阶的。 举个例子,一个 8 阶的 0 特征值 Jordan 块 J,J 3 的 Jordan 标准形是什么样子的?这个时候 J 8 有 3 个轨道 8 , 5 , 2 , 7 , 4 , 1 , 6 , 3 ,所以 J 7 的 Jordan 标准形是 2个 3 阶的 Jordan 块和 1 个 2 阶的 Jordan 块的和。 再来看 = 0 的情形。 k kk 1 . . . . . . kkJ =, . kk1 k102. Jordan 标准形总结2.5. JORDAN 块的分裂所以只需要分析 B = J k k I 的标准形。我们有如下的结论:定理 2.6. 设 A= 0 a12 0a23 . . . . , an1,n 0ann . . . . . .而且 a12 a23 an1,n = 0,则 A 的 Jordan 标准形就是一个 n 阶的 Jordan 块。证明. 由于 Bn 是零线性变换,但 Bn1 n = 0,所以 n , B n , . . ., Bn1 n 构成空间的一组基,在这组基下 B 的矩阵就是一个 n 阶的 Jordan 块。 总结一下:零特征值的 Jordan 块的高次幂一定会分裂,而且是尽可能均匀的分裂;非零特征值的 Jordan 块的任意次幂都不会分裂。 一个不可约的代数结构,在某种限制或者扩张的意义下却能均匀的“碎裂”,这是代数学中一个常见而重要的现象。 比如设 f 是一个有理数域 Q 上的不可约多项式,F 是 Q 的一个正规扩域,则如果 f 在 F 上是可约的,那么 f 必然分解成一些次数相同的多项式的乘积: f = f 1 f 2 f r , deg f 1 = = deg f r类似的还有代数数论中素理想的分解,群表示论中不可约表示(在诱导和限制下)的分解,代数几何中不可约代数簇的分解等等。 最后我想多说一点废话。Jordan 标准形的理论告诉我们复数域上的线性变换本质上只有两种,那就是数乘变换和移位变换:A 1 = 2 ,A 2 = 3 , ,A n1 = n ,A n = 0 复数域上的任何线性变换都可以分解为数乘变换和移位变换的组合,而数乘变换是很平凡的变换,所以可以说移位运算是最重要的线性变换。 Halmos 说过在泛函分析里面最重要的泛函仍然是移位运算(至少你要想想紧算子,Toeplitz 算子,Hankel算子)。 不说泛函了,我懂的不多,再说就露馅了 :P。 看来线性变换和群在集合上的作用是很相似的,就是一些不动点(相当于特征向量)和非平凡的轨道(Jordan 块)的组合,把作用限制在子群上(相当于子模 Ak )轨道还可以继续分解。有些矩阵不能对角化的原因就在于它们有非平凡的轨道,或者说,组成成分里含有移位算子。113秩不等式 秩不等式问题有比较模式化的解决方法,就是利用分块矩阵的初等变换,其原理就是下面这个引理:引 理 3.1. 设M=(A 0 ,C B)其中 A, B 都是方阵,那么 r( M ) r( A) + r( B)。 引理的证明留给大家完成(真的很简单)。 在证明有关秩的不等式的时候,基本思路就是从准对角矩阵出发,用初等变换化成三角形的分块矩阵,来应用上面这个引理。 下面是秩不等式里面最基本的结论: 定 理 3.2 (Frobenius 不等式). 设 A 是数域 F 上的 m n 矩阵,B 是 n k 矩阵,C是 k s 矩阵,则 r( AB) + r( BC ) r( ABC ) + r( B).证明.(ABC 0 0B)(ABC AB 0B)( 0AB BC B)比较两端的矩阵的秩即可。例 3.3 (北京大学2005). 设 A 是数域 F 上 n 维向量空间上的线性变换,求证A3 = I r( I A) + r( I + A + A2 ) = n证明. 注意到存在 u( x ), v( x ) 使得 u( x )(1 x ) + v( x )(1 + x2 + x ) = 1。 考虑大的 2n阶的方阵 ()() 第一列乘以 u( A) 加到第二列 IA0I A u( A)( I A) 2 0I+A+A0I + A + A2 () 第二行乘以 v( A) 加到第一列 IAI 0I + A + A2 () 0I用 I 打洞干掉两边的矩阵 3I 0A所以这个矩阵的秩是 n 当且仅当 A3 I = 0,这就得到了证明。123. 秩不等式例 3.4. 设 A, B 是数域 F 上的 n 阶方阵且满足 AB = BA = 0, r( A) = r( A2 ),求证r( A + B) = r( A) + r( B)证明. 只要证明 r( A + B) r( A) + r( B) 即可。用老办法,从 () A+B 0 00出发,通过初等变换化为形如(B 0 A)的矩阵,就得到了结论。在变换前先注意两点:(1) 由于 A2 的列向量都是 A 的列向量的线性组合,所以 r( A) = r( A2 ) 说明 A 的列向量组和 A2 的列向量组是等价的,从而 A 的列向量组可以被 A2 的列向量组线性表示。 设 i 是 A 的第 i 个列向量,那么线性方程组 A2 X = i 有解 Xi ,令 n n 矩阵P = X1 , X2 , . . . , Xn ,那么 A2 P = A。(2) 当 r( A) = r( A2 ) 时有 r( A) = r( A2 ) = r( A3 ) = 这个在 Frobenius 不等式r( B) + r( ABC ) r( AB) + r( BC )中令 B = C = A 即可。 下面进行变换: )( A+B 0A + B 0 第一行左乘以 A 加到第二行 A2000 () A + B A2第一列右乘以 A 加到第二列 A2A3 () B A2第二列右乘以 P 加到第一列 . 3 0 A从而 r( A + B) r( B) + r( A3 ) = r( B) + r( A),得证。 下面再给一种解法: 可以假设 A 是 Jordan 标准形,那么 r( A) = r( A2 ) 说明 A 的 0 特征值对应的Jordan 块都是一阶的,从而 A 形如 () A1 0 , 0 0这里 A1 是可逆的。 AB = BA = 0 说明 B 形如 () 0 0 , 0 B1这样就得到了证明。133. 秩不等式 定 理 3.5. 设 A1 , A2 , . . . , Am 为 n 阶方阵,适合条件 A1 + + Am = I。试证明下面三个条件等价:(a). A1 , A2 , . . . , Am 都是幂等矩阵;(b). r( A1 )+r( A2 )+ +r( Am ) = n;(c). 当 1 i 1,则存在与 A 交换的变换 B 使得 Bv1 = v2。 假设这个引理是正确的,那么 B 肯定不是 A 的多项式,所以必须 r = 1,即 A 是由一个向量生成的循环空间。277. 有理标准形和交换的矩阵7.2. 何时与 A 交换的矩阵总是 A 的多项式?证明. 我们已经知道 v1 中的元素都形如 f ( A)v1 ,这里 f ( x ) 是一个多项式。既然已经规定了 B 在生成元 v1 处的值,因此我们只要“顺水推舟”地定义 B 就好了:对于u = f ( A)v1 v1 ,令 Bu = f ( A)v2 v2 而把 B 在其它的 vi (i = 1) 上的作用都定义为零。这就是一个线性变换,把 v1 映为v2 ,而且与 A 交换。 这样定义 B 有个问题,就是 u = f ( A)v1 这个表示中 f ( x ) 不是唯一的,我们还需要验证 Bu 的定义不依赖于 f ( x ) 的选取。 设 u = f 1 ( A)v1 = f 2 ( A)v1 ,我们要说明 f 1 ( A)v2 = f 2 ( A)v2。 由 f 1 ( A)v1 = f 2 ( A)v1 可得 p1 ( x )|( f 1 f 2 ),当然就有p2 ( x )|( f 1 f 2 ),从而 f 1 ( A)v2 = f 2 ( A)v2。因此我们 B 的定义是合理的。 现在我们已经找到了 A 应该满足的必要条件:V 有一个关于 A 的循环向量 v。那么这个条件是不是充分的呢?答案是肯定的: 定 理 7.5. 若 V 有一个关于 A 的循环向量 v,则任何与 A 交换的变换都可以写成 A的多项式。证明. 我们断言循环空间上一个与 A 交换的变换 B 由它在生成元 v 处的值 Bv 完全决定:由于存在多项式 f ( x ) 使得 Bv = f ( A)v,不难验证这时 B = f ( A) 成立。从而我们已经从变换的角度完全解决了这一问题。矩阵的角度 在定理 4.4 中令 A = B,那么 i ( A, A) 就是与 A 交换的矩阵构成的空间的维数。这个维数总是大于等于 n 的: ()()p ppp i ( A, A) = deg f i ( x ), f j ( x ) deg f i ( x ), f i ( x ) = deg f i ( x ) = ni =1 j =1i =1i =1A 的多项式也构成一个线性空间,这个空间的维数总是小于等于 n 的,因为其中的元素总是 I, A, . . ., An1 的线性组合。 这两个空间的维数相等当且仅当上面式子中的等号成立,这时 A 仅有一个不变因子,也就是 A 的特征多项式等于其极小多项式,这就从矩阵的角度证明了定理 7.5。 例 7.6. 如果矩阵 A 有 n 个互不相同的特征值那么与 A 交换的矩阵一定可以表示为A 的多项式.证明. 设 Avi = i vi ,那么 v1 + + vn 就是一个循环向量。287. 有理标准形和交换的矩阵7.3. 双中心化子定理7.3双中心化子定理 定理 7.7 (双中心化子). 设 A 是任一给定的方阵,如果方阵 C 和每一个与 A 可交换的方阵都可交换,则 C 可以表示为 A 的多项式。证明. 首先把 A, C 都看成某个向量空间上的线性变换,如果结论成立的话,显然下面的条件是必须满足的:引 理 7.8. A 的不变子空间直和分解必定也是 C 的不变子空间直和分解。引理的证明:设 V 在 A 的作用下分解为不变子空间的直和 V = V1 Vr ,P 是从V 到 Vi 上的投影,则有 AP = PA,那么根据已知有 CP = PC,所以 Vi 也是 C 的不变子空间,引理得证。 我们还是来考虑 V 在 A 的作用下的循环子空间分解V = v1 v2 vr 这里的 v1 , . . ., vr 满足的条件仍然与定理 7.1 中一致。 由于 C 在每个 vi 上的限制与A 交换,所以立刻想到用上定理 7.5 的结论:C 在子空间 vi 上可以表示为 A 的多项式 C = gi ( A)。问题是这些 gi ( x ) 相等吗?如果是同一个多项式那问题就解决了,但是这个不那么显然,所以得分析的再细一点。我们回忆前面证过的结论(参考引理 7.4)引 理 7.9. 对任何 i 1,存在与 A 交换的变换 B 使得 Bv1 = vi。(道理是一样一样的)现在是它派上用场的时候了。我们有v 1 v i gi ( A ) v i ,BC v 1 g1 ( A ) v 1 g1 ( A ) v i 由于 CB = BC 所以两条路径的结果应该是一样的,也就是 gi ( A)vi = g1 ( A)vi。 再强调一遍:循环空间上一个与 A 交换的变换由它在生成元处的值完全决定,所以gi ( A) 和 g1 ( A) 在 vi 上相同,所以我们可以统一用 g1 ( x ) 来代替所有的 gi ( x ),即C = g1 ( A)。 这个定理的意义就是在环 Matn ( F ) 中,对矩阵 A 生成的子环 R 求两次中心化子以后又得到了 R,所以叫做双中心化子定理。 双中心化子性质是单代数的核心性质,在结合代数理论中会经常见到它。CB298解题的艺术 这一章选择了一些解法比较巧妙但又不是纯难度的一些题目。 如果你是第一次见到它们,还是建议先自己思考一会。毕竟这样的题目比较少,浪费一道少一道。例 8.1. 伴随矩阵 A 总可以表示为 A 的多项式.证明. 首先 r( A) n 1 和 r( A) = n 的情形是很容易的,r( A) = n 1 的情形才是关键。下面就考虑这种情形。 显然只要对 A 是 Jordan 标准形的情况加以证明即可。把 A 按特征值分块为 )( B 0 A= , 0 J这里 B 是 m 阶可逆矩阵,J 是一个特征值为 0 的 l 阶 Jordan 块,m + l = n。注意由于有 r( A) = n 1 的前提,所以 A 只能有一个特征值为 0 的 Jordan 块。 现在来看 A。由于 AA = A A = 0,所以 A 也被同时分块为 () 0 0 A = 0 C(因为 B 可逆,所以左上角也应该是 0)只需要算 C,也就是 J 的伴随矩阵乘以 | B|。而 J 只有左下角的 0 的代数余子式是 (1)l +1 | B|,其它的都是 0,所以 0 0 0 .C = | B| J = (1)l +1 | B| . .1. = (1)l +1 | B| J l 1 00 l l好了,现在的任务是找一个多项式 f ( x ) 使得f ( B) = 0, f ( J ) = (1)l +1 | B| J l 1设 B 的特征多项式是 g( x ),那么f ( x ) = (1)n+1 x l 1 g( x )就合乎要求(注意 g( x ) 的常数项是 (1)m | B|) 。308. 解题的艺术这里的 f ( x ) 一眼看不大出来,我是这么找的:设f ( x ) = a 0 + a 1 x + + a l 1 x l 1 + a l x l + a l +1 x l +1 + ,并代入 f ( J ) = (1)m | B| J l 1 就会发现 a0 = a1 = = al 2 = 0,al 1 = (1)l +1 | B|,所以 () f ( x ) = (1)m+l +1 x l 1 (1)m | B| + al x + al +1 x2 + 这样就凑出来了。例 8.2. 设 A, B 都是 n 阶矩阵,C = AB BA。如果 AC = CA,求证 C 幂零。 这个问题的传统解法是归纳证明 tr(C k ) = 0。 不过让我们考虑另外一种解法:考虑 C 的 Jordan 标准形,并且把相同特征值的 Jordan 块合并在一起。即 C1 C2 C= . .Cr这样不同的 Ci 没有共同的特征值。这个时候 A 也被分块为 A1 A2 A= . . Ar如果这个时候再把 B 划分为 r2 个子矩阵 B = ( Bij ) 的话,有意思的事情发生了:Ci = Ai Bii Bii Ai这说明 Ci 的迹是 0。 但是 Ci 是上三角矩阵而且对角线上是它仅有的特征值 i ,所以i = 0,从而 C 所有特征值都是 0,从而幂零。例 8.3. 已知方阵 A, B 的特征值都是正数且满足 A2 = B2 ,求证 A = B。这个问题作为练习出现过,不了解第四章的结论的话真是很难想出来。证明. 由已知可得 A( A B) = ( A B)( B),所以若 A B = 0 则 A, B 必须有共同的特征值,矛盾!下面这个例子的解法来自 Halmos 的书。 例 8.4. A, B 是数域 F 上的 n 阶方阵,若 I BA 可逆,则 I AB 也可逆,并求其逆。318. 解题的艺术首先用纯形式的推导找出这个逆来:把矩阵看成数,作幂级数展开:( I AB)1 = I + AB + ( AB)2 + = I + A( I + BA + ( BA)2 + ) B= I + A( I BA)1 B.所以 ( I AB)1 = I + A( I BA)1 B,这就从形式上找出来了结果,剩下的只是验证而已。 这个做法确实很巧妙,而且不用记忆答案,用到的时候立刻就能推出来。例 8.5. 求证在 n 维欧式空间中两两夹钝角的单位向量的个数的最大值是 n + 1。证明. 分两步,第一步证明两两夹钝角的单位向量的个数不超过 n + 1,第二步证明确实可以达到 n + 1。两步都要用到归纳法。 首先证明在 n 维欧式空间中不能有超过 n + 1 个的两两夹钝角的单位向量。 n = 1显然。 设小于 n 时结论成立。 看 n 的情形:若这时有 n + 2 个两两夹钝角的单位向量1 , . . ., n+2。考虑 i = i (i , n+2 )n+2 (i = 1, 2, . . . , n + 1),则 1 , . . ., n+1 都落在 n+2 的正交补空间中(这个空间维数是 n 1) ,且( i , j ) = ( i , j ) = (i , j ) (i , n+2 )( j , n+2 ) 0这与归纳假设矛盾。 其次证明确实有 n + 1 个两两夹钝角的单位向量。仍然对维数归纳:n = 1 时 和 是两个夹钝角的向量。 设小于 n 时结论成立,对 n 的情形:先任取一个非零单位向量 ,在 的正交补空间中取 n 个互相正交的单位向量 1 , . . ., n。我们证明存在一个负数 使得 1 , . . . n ,是 n + 1 个两两夹钝角的向量。这只要令 满足2 min(i , j ),1 i j n即可。例 8.6. A 是实方阵且 AA = A2 ,求证 A 是对称矩阵。证明. 迹函数( A, B) tr( AB ) =i =1 j =1 aij bijnn其实就是 Matn (R) 作为 n2 维欧式空间上的标准内积。特别地,tr( AA ) =i =1 j =1n a2 ijn因此要证明 A A 是零矩阵,只需验证 tr( A A )( A A ) = 0 即可。328. 解题的艺术 例 8.7. 设 A 是一个实对称矩阵,正负惯性指数分别为 p, q,T 是一个实矩阵。 问矩阵 B = T AT 的正负惯性指数与 A 相比是大还是小? 这个题目我不写过程了,大家可以参考北大代数几何教研室编的高等代数第三版 234 页的补充题 3,这两个题目是一回事。 答案是:当用一个不可逆的矩阵 T 给一个对称矩阵 A 做“合同变换”的话,正负惯性指数都会减小(不一定是严格减小)。 最后这个题目来自 Horn 的书:例 8.8. 设 V 是一个向量空间,是否存在 V 上的线性变换 A, B 使得 AB BA = I? 答案不难,V 是有限维的话就没有,两边求迹就得出矛盾。 V 是无限维的话可能有,比如在 C1 (R) 上定义A f = f ( x ),B f = x f ( x ),不难验证就有 AB BA = I 成立。 H.Wielandt 给出了如下证明: 如果有满足条件的 A, B 存在,不难用归纳法证明Ak+1 B BAk+1 = (k + 1) Ak设 是 Matn ( F ) 上任一范数,那么(k + 1) Ak 2 Ak+1 B 2 Ak A B.这样必有某个 k 使得 Ak = 0。 但是上面第一个不等号告诉我们 Ak1 的范数被 Ak的范数所控制,所以 Ak = 0 Ak1 = 0 A = 0,这就导出了矛盾。 这个证明的好处就在于它可以应用到 Banach 空间上去:在量子力学中有如下方程 ih XP PX =I. 2X 是位置算子,P 是动量算子,h 是普朗克常数。 Wielandt 的证明告诉我们这样的算子一定不是有界算子,这解决了一个物理学中长久以来悬而未决的问题。33
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号