対角化(一般の場合) のバックアップ(No.1)

更新


線形代数I

培風館「教養の線形代数(五訂版)」に沿って行っている授業の授業ノート(の一部)です。

行列の対角化・三角化

この後得られる結果を先取りしておく。

  • 相似変換により任意の行列を三角行列に変換できる(三角化可能)
  • 相似変換により行列を対角行列に変換できるときとできないときがある(対角化可能・不可能)

相似変換による三角化・対角化とは?

ある行列 A を正則行列 P によって相似変換して結果を三角行列あるいは対角行列にすること。
あるいは、そのような行列 P を見つけること。

三角化:

&math(P^{-1}AP= \begin{bmatrix} a'_{11}&*&*&\dots&*\\ 0&a'_{22}&*&\dots&*\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&*\\ 0&0&\dots&0&a'_{nn} \end{bmatrix} );

対角化:

&math(P^{-1}AP= \begin{bmatrix} a'_{11}&0&0&\dots&0\\ 0&a'_{22}&0&\dots&0\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&0\\ 0&0&\dots&0&a'_{nn} \end{bmatrix} );

この教科書で「三角化」というのは「上三角化」のことを指している場合が多い。 一般には下三角行列にすることも三角化と呼ばれる。

対角行列は三角行列であるから、対角化は三角化の特殊例である。

三角化(対角化)できたならば、対角成分は A の固有値である

P^{-1}AP が三角行列の時、 P^{-1}AP-\lambda I も三角行列である。

例:

P^{-1}AP=\begin{bmatrix}a&b\\0&d\end{bmatrix}

なら、

P^{-1}AP-\lambda I=\begin{bmatrix}a-\lambda&b\\0&d-\lambda\end{bmatrix}

三角行列の行列式は対角成分の積であるから、

|P^{-1}AP-\lambda I|=(a'_{11}-\lambda)(a'_{22}-\lambda)\dots(a'_{nn}-\lambda)

一方、 A の固有多項式は、

|A-\lambda I|=(\lambda_1-\lambda)(\lambda_2-\lambda)\dots(\lambda_n-\lambda)

相似な行列の固有多項式は等しいから、順番を除いて

a'_{11}=\lambda_1 a'_{22}=\lambda_2 、・・・ a'_{nn}=\lambda_n であることになる。

すなわち、三角化後の対角成分には重複度を含めた n 個の固有値が現われる。

&math(P^{-1}AP= \begin{bmatrix} \lambda_1&*&*&\dots&*\\ 0&\lambda_2&*&\dots&*\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&*\\ 0&0&\dots&0&\lambda_n \end{bmatrix} );

対角化するための P をどのように見つけるか

固有ベクトルを並べた行列

行列 P の列ベクトルを \bm p_1, \bm p_2, \dots, \bm p_n と置き、 これらすべてが A の固有値であるとする。

P=\Bigg[ \bm p_1 \ \bm p_2 \ \dots \ \bm p_n \Bigg]

A\bm p_k=\lambda_k \bm p_k

このとき、

&math( P^{-1}AP &=P^{-1}A\Bigg[ \bm p_1 \ \bm p_2 \ \dots \ \bm p_n \Bigg]\\ &=P^{-1}\Bigg[ A\bm p_1 \ A\bm p_2 \ \dots \ A\bm p_n \Bigg]\\ &=P^{-1}\Bigg[ \lambda_1\bm p_1 \ \lambda_2\bm p_2 \ \dots \ \lambda_n\bm p_n \Bigg]\\ &=P^{-1}\underbrace{\Bigg[ \bm p_1 \ \bm p_2 \ \dots \ \bm p_n \Bigg]}_{P}\begin{bmatrix} \lambda_1&0&\hdots&0\\ 0&\lambda_2&&\vdots\\ \vdots&&\ddots&0\\ 0&\hdots&0&\lambda_n \end{bmatrix}\\ &=\begin{bmatrix} \lambda_1&0&\hdots&0\\ 0&\lambda_2&&\vdots\\ \vdots&&\ddots&0\\ 0&\hdots&0&\lambda_n \end{bmatrix} );

となって、対角化できる。

対角化された行列の中に現れる固有値の順番が、 始めに並べた \bm p_1, \bm p_2, \dots, \bm p_n と同じ順になることに注意せよ。

対角化可能条件

対角化は必ずしも可能ではない。
n 本の固有ベクトルを並べて作った P は必ずしも正則にならない。

P が正則となるように n 本の固有ベクトルを選ぶことができる」 というのが「行列 A を対角化できる」十分条件となる。

より使いやすい条件

教科書の P83 あたり でやったように「ある行列の列ベクトルが一次独立」であることと、その行列は正則であることとは同値である。

したがって、「 A n 本の一次独立な固有ベクトルを持つこと」 が A を対角化できる条件となる。

n 個の異なる固有値を持つ場合

  • A は重複度を含めて n 個の固有値を持つ
  • 異なる固有値に属する固有ベクトルは一次独立である

したがって、 A の固有値 \lambda_1,\lambda_2,\dots,\lambda_n がすべて異なるなら、 対応する固有ベクトルを1つづつ取って P=\Bigg[{\bm x}_1\ {\bm x}_2\ \dots\ {\bm x}_n\Bigg] を作れば P は一次独立になる。

固有値に重複解がある場合

n 個の固有値のうち等しい物があれば、その固有値を重複解と呼ぶのであった。

固有値方程式が重複解を持つ場合、対角化が不可能な場合がある。

すべての固有値が、自身の重複度と同じ数の一次独立な固有ベクトルを持てば、 全体で n 個の一次独立な固有ベクトルが得られる。
→ なぜなら固有値は重複度を含めて n 本あるから

逆に、ある固有値 \lambda_k に属する固有ベクトルの自由度 f_k が 固有値の重複度 r_k よりも小さくなるとき、行列は対角化できない。

(固有ベクトルの自由度が固有値の重複度を超えないことが前提になるが、 その証明は三角化について学んでからにする)

対角化可能性の判別

すべての固有値が、自身の重複度と同じ数の一次独立な固有ベクトルを持つことを確認すればよい。

例(例8):

A=\begin{bmatrix}1&0&0\\1&2&-3\\1&1&-2\end{bmatrix}

&math( |A-\lambda I|&=\begin{vmatrix}1-\lambda&0&0\\1&2-\lambda&-3\\1&1&-2-\lambda\end{vmatrix}\\ &=(1-\lambda)\begin{vmatrix}2-\lambda&-3\\1&-2-\lambda\end{vmatrix}\\ &=(1-\lambda)\{(2-\lambda)(-2-\lambda)+3\}\\ &=(1-\lambda)(\lambda^2-1)\\ &=(1-\lambda)(\lambda-1)(\lambda+1)\\ &=(1-\lambda)^2(1+\lambda)\\ &=0 );

\therefore \lambda=1,-1

\lambda=1 が2重解なので、こちらに対応する固有ベクトルを求めてみる。

&math( &(A-\lambda I)\bm x=\begin{bmatrix}0&0&0\\1&1&-3\\1&1&-3\end{bmatrix}\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix}\\ &\rightarrow x+y-3z=0\\ );

掃き出せない y,z をパラメータに置くと、

y=s, z=t \rightarrow x=-s+3t

\therefore \begin{bmatrix}x\\y\\z\end{bmatrix}=s\begin{bmatrix}-1\\1\\0\end{bmatrix}+t\begin{bmatrix}3\\0\\1\end{bmatrix}

となり、例えば \begin{bmatrix}-1\\1\\0\end{bmatrix},\begin{bmatrix}3\\0\\1\end{bmatrix} として一時独立な2本の固有ベクトルを選ぶことができる。

すなわち、 A は対角化可能であることが分かる。

以下、実際に対角化してみよう。

\lambda=-1 に対する固有ベクトルは、

&math( &(A-\lambda I)\bm x=\begin{bmatrix}2&0&0\\1&3&-3\\1&1&-1\end{bmatrix}\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix}\\ &\rightarrow \begin{cases}x=0\\y-z=0\end{cases}\\ );

掃き出せない z をパラメータに置くと、

z=s \rightarrow y=s

\therefore \begin{bmatrix}x\\y\\z\end{bmatrix}=s\begin{bmatrix}0\\1\\1\end{bmatrix}

したがって、例えば \begin{bmatrix}0\\1\\1\end{bmatrix} が固有ベクトル。

以上より、

P=\begin{bmatrix}-1&3&0\\1&0&1\\0&1&1\end{bmatrix}

と置けば、これは1,2列目が \lambda=1 の、3列目が \lambda=-1 の固有ベクトルであり、 なおかつ P は正則。したがって、 A

P^{-1}AP=\begin{bmatrix}1&0&0\\0&1&0\\0&0&-1\end{bmatrix}

として対角化される。

A を対角化せよ」 という問題に答えるのであればここまでで正答となる。

以下蛇足ではあるが、本当に対角化されることを確かめてみよう。

まずは P^{-1} を求めてみる。

&math( &\begin{bmatrix}-1&3&0&1&0&0\\1&0&1&0&1&0\\0&1&1&0&0&1\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\-1&3&0&1&0&0\\0&1&1&0&0&1\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\0&3&1&1&1&0\\0&1&1&0&0&1\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\0&1&1&0&0&1\\0&3&1&1&1&0\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\0&1&1&0&0&1\\0&0&-2&1&1&-3\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\0&1&1&0&0&1\\0&0&1&-1/2&-1/2&3/2\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&0&1/2&3/2&-3/2\\0&1&0&1/2&1/2&-1/2\\0&0&1&-1/2&-1/2&3/2\end{bmatrix}\\ );

&math( \therefore P^{-1}=\frac{1}{2}\begin{bmatrix}1&3&-3\\1&1&-1\\-1&-1&3\end{bmatrix}\\ );

正しく求まった。この P^{-1} を用いて、

&math( P^{-1}AP&= \frac{1}{2}\begin{bmatrix}1&3&-3\\1&1&-1\\-1&-1&3\end{bmatrix} \begin{bmatrix}1&0&0\\1&2&-3\\1&1&-2\end{bmatrix} \begin{bmatrix}-1&3&0\\1&0&1\\0&1&1\end{bmatrix}\\ &=\frac{1}{2}\begin{bmatrix}1&3&-3\\1&1&-1\\-1&-1&3\end{bmatrix} \begin{bmatrix}-1&3&0\\1&0&-1\\0&1&-1\end{bmatrix}\\ &=\frac{1}{2}\begin{bmatrix}2&0&0\\0&2&0\\0&0&-2\end{bmatrix}\\ &=\begin{bmatrix}1&0&0\\0&1&0\\0&0&-1\end{bmatrix} );

として、正しく対角化された。

P を作るときに1,2列目に \lambda=1 の、 3列目に \lambda=-1 の固有ベクトルを並べたことに対応して、 1,2列目に 1 が、3列目に -1 が現れている。

例(例9):

A=\begin{bmatrix}1&2&1\\0&1&0\\-1&0&3\end{bmatrix}

&math( |A-\lambda I|&=\begin{vmatrix}1-\lambda&2&1\\0&1-\lambda&0\\-1&0&3-\lambda\end{vmatrix}\\ &=(1-\lambda)\begin{vmatrix}1-\lambda&1\\-1&3-\lambda\end{vmatrix}\\ &=(1-\lambda)\{(1-\lambda)(3-\lambda)+1\}\\ &=(1-\lambda)(\lambda^2-4\lambda+4)\\ &=(1-\lambda)(2-\lambda)^2\\ &=0 );

\therefore \lambda=1,2

\lambda=2 が2重解なので、こちらに対応する固有ベクトルを求めてみる。

&math( &(A-\lambda I)\bm x=\begin{bmatrix}-1&2&1\\0&1&0\\-1&0&1\end{bmatrix}\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix}\\ &\rightarrow \begin{cases}x-z=0\\y=0\end{cases}\\ );

掃き出せない z をパラメータに置くと、

z=s \rightarrow x=s

\therefore \begin{bmatrix}x\\y\\z\end{bmatrix}=s\begin{bmatrix}1\\0\\1\end{bmatrix}

となり、 s をどのように選んでも2つの一次独立な固有ベクトルを見つけることができない。

すなわち、 A は対角化不可能。

行列の三角化

対角化が必ずしも可能とは限らないのに対して、
三角化は任意の行列 A に対して必ず可能である。
→ 定理 6.2

証明には数学的帰納法を使う:

  1. n=1 次の時に三角化可能
  2. n-1 次が三角化可能であれば n 次が三角化可能

1. については、 A=[a] はそれ自身が三角行列であるから明らかに三角化可能

2. について、

n 次正方行列 A の固有値 \lambda_1 に対する固有ベクトルを \bm r_1 とする。 (固有値・固有ベクトルの組は必ず1つは求まる)

この \bm r_1 に対して、

R=\Bigg[ \bm r_1\ \bm r_2\ \dots\ \bm r_n \Big]

が正則となるように \bm r_2,\bm r_3,\dots,\bm r_n を定めると(これは常に可能である)、

&math(R^{-1}AR\bm e_1=R^{-1}A(R\bm e_1)=R^{-1}A\bm r_1=R^{-1}\lambda\bm r_1=R^{-1}\lambda R\bm e_1 = \lambda \bm e_1);

であるから、 R^{-1}AR の一列目は第一要素が \lambda 、その他が 0 であり、

&math( R^{-1}AR=\begin{bmatrix} \lambda_1&\bm b\\ \bm o&A_1 \end{bmatrix} );

と書き表すことができる。 ここで、 \bm b は内容不定な行ベクトルである。

もし n-1 次の行列 A_1 が正則行列 Q により三角化可能であるとすれば、

&math(Q^{-1}A_1Q=D= \begin{bmatrix} \lambda_2&*&\dots&*\\ 0&\lambda_3&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_n \end{bmatrix} );

上記の R Q を用いて、

&math(P=R\begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix} );

なるベクトル P を作れば、

&math(P^{-1}=\begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix}R^{-1} );

であるから P は正則で、

&math( P^{-1}AP=\begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix}R^{-1} A R\begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix}= \begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix} \begin{bmatrix} \lambda_1&\bm b\\ \bm o&A_1 \end{bmatrix} \begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix}=\\ \ \\ \begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix} \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&A_1Q \end{bmatrix} = \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&Q^{-1}A_1Q \end{bmatrix} = \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&\begin{bmatrix}

 \lambda_2&*&\dots&*\\
 0&\lambda_3&&\vdots\\
 \vdots&&\ddots&*\\
 0&&0&\lambda_n\\

\end{bmatrix} \end{bmatrix} );

であるから P により n 次行列 A を三角化可能である。

したがって、任意の次数の行列 A について、 P^{-1}AP を三角行列にするような P が存在することが証明された。

対角化の実用性

対角行列の性質を確認する。

対角行列の累乗

対角行列 D

D=\begin{bmatrix}a&0\\0&d\end{bmatrix}

とすれば、

D^2=\begin{bmatrix}a&0\\0&d\end{bmatrix}\begin{bmatrix}a&0\\0&d\end{bmatrix}=\begin{bmatrix}a^2&0\\0&d^2\end{bmatrix}

である。

同様に、

D^m=\begin{bmatrix}a^m&0\\0&d^m\end{bmatrix}

となる。

対角行列の多項式

&math(\alpha D^l+\beta D^m=\alpha \begin{bmatrix}a^l&0\\0&d^l\end{bmatrix}+\beta \begin{bmatrix}a^m&0\\0&d^m\end{bmatrix} =\begin{bmatrix}\alpha a^l+\beta a^m&0\\0&\alpha d^l+\beta d^m\end{bmatrix});

元の式 \alpha D^l+\beta D^m と、
結果の対角要素 \alpha a^l+\beta a^m \alpha d^l+\beta d^m
の類似性に注目せよ。

一般の行列の累乗

A n 次の行列として、 P により対角化可能とする。

&math(P^{-1}AP=D= \begin{bmatrix} \lambda_1&0&\dots&0\\ 0&\lambda_2&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n \end{bmatrix} );

すると、

&math((P^{-1}AP)^m=P^{-1}APP^{-1}AP\dots P^{-1}AP= P^{-1}A^mP= \begin{bmatrix} \lambda_1^m&0&\dots&0\\ 0&\lambda_2^m&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n^m \end{bmatrix} )

より、

&math(A^m = P \begin{bmatrix} \lambda_1^m&0&\dots&0\\ 0&\lambda_2^m&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n^m \end{bmatrix} P^{-1} )

と表せる。

左辺を普通に計算しようとすれば m-1 回の行列のかけ算が必要になるが、 右辺は数値の m と、2回の行列のかけ算で済むため計算量が少なく、 また理論的にも見通しがよい。

一般の行列の多項式

g(x) を任意の多項式として、

g(x)=a_0+a_1x+a_2x^2+a_3x^3+\dots=\sum_{k=0}a_kx^k

g(A) を次のように定義する。

g(A)=a_0\red{I}+a_1A+a_2A^2+a_3A^3+\dots=\sum_{k=0}a_kA^k

(ゼロ次項に単位行列が掛かっていることに注意せよ)

すると、

&math(g(P^{-1}AP)&=a_0I+a_1(P^{-1}AP)+a_2(P^{-1}AP)^2+a_3(P^{-1}AP)^3+\dots\\ &=a_0P^{-1}P+a_1(P^{-1}AP)+a_2(P^{-1}AP)^2+a_3(P^{-1}AP)^3+\dots\\ &=a_0P^{-1}P+a_1P^{-1}AP+a_2P^{-1}A^2P+a_3P^{-1}A^3P+\dots\\ &=P^{-1}(a_0+a_1A+a_2A^2+a_3A^3+\dots)P\\ &=P^{-1}g(A)P\\ &= \begin{bmatrix} g(\lambda_1)&0&\dots&0\\ 0&g(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(\lambda_n) \end{bmatrix} );

したがって、

&math( g(A)= &= P \begin{bmatrix} g(\lambda_1)&0&\dots&0\\ 0&g(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(\lambda_n) \end{bmatrix} P^{-1} );

のように、任意の行列の多項式を、対角化を用いて固有値の多項式に関連づけることができる。

行列の超関数

指数関数のテイラー展開は、

e^x=1+x+\frac{1}{2!}x^2+\frac{1}{3!}x^3+\dots=\sum_{k=0} \frac{1}{k!}x^k

であるから、

&math(ae^{bA}=a\sum_{k=0} \frac{1}{k!}(bA)^k= aP \begin{bmatrix} g(b\lambda_1)&0&\dots&0\\ 0&g(b\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(b\lambda_n) \end{bmatrix} P^{-1});

などとして、「行列の指数関数」を定義できる。

このような関数が量子力学他で利用される。

フロベニウス(Frobenius)の定理

行列 B が行列 A の多項式で表される時、

B=g(A)

B の固有値は、 A の固有値 \lambda_1,\lambda_2,\dots,\lambda_n を使って、 g(\lambda_1),g(\lambda_2),\dots,g(\lambda_n) と表せる。

例: B=3A^3-A^2+A+2I について、例えば 3\lambda_1^3-\lambda_1^2+\lambda_1+2 が固有値となる。

&math(\because P^{-1}BP=\begin{bmatrix} g(\lambda_1)&&&\hsymbu{0}\\ &g(\lambda_2)\\ &&\ddots\\ \hsymbl{0}&&&g(\lambda_n)\\ \end{bmatrix});

より自明。

ケーリーハミルトンの定理

上記の g(x) として、 A の固有多項式 f_A(x)=|A-xI| を取れば、

&math(f_A(A)= P \begin{bmatrix} f_A(\lambda_1)&0&\dots&0\\ 0&f_A(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&f_A(\lambda_n) \end{bmatrix} P^{-1} );

ところが、 \lambda_k は固有方程式 f_A(\lambda)=0 の解であるから、 f_A(\lambda_k) はすべてゼロになって、

&math(f_A(A)= P \begin{bmatrix} 0&0&\dots&0\\ 0&0&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&0 \end{bmatrix} P^{-1} =POP^{-1}=O );

となる。

例:

&math( A=\begin{bmatrix} 0&-1\\ 1&1\\ \end{bmatrix} );

とすれば、

&math( f_A(\lambda)=|A-\lambda I|=\begin{vmatrix} 0-\lambda&-1\\ 1&1-\lambda\\ \end{vmatrix}=

  • \lambda(1-\lambda)+1=\lambda^2-\lambda+1 );

したがって、ケーリー・ハミルトンの定理より、 固有値や固有ベクトルを求めることなく、

f_A(A)=A^2-A+I=O

が成立することが分かる。

これを用いると、

A^2=A-I

A^3=A^2A=(A-I)A=A^2-A=A-I-A=-I

A^4=A^3A=-IA=-A

A^5=A^4A=-AA=-(A-I)=-A+I

A^6=A^5A=(-A+I)A=-A^2+A=-A+I+A=I

したがって、整数 n を6で割ったあまりを l とすると、 ( n=6k+l ただし 0\le l<6

&math( A^n=A^{6k+l}=(A^6)^kA^l=I^6A^l=A^l= \begin{cases} I&(l=0)\\ A-I&(l=1)\\

  • A&(l=2)\\
  • I&(l=3)\\
  • A+I&(l=4)\\ A&(l=5)\\ \end{cases} );

と表せることが分かる。

上記は A が対角化可能な時のみの証明になっているが、 ケーリーハミルトンの定理は対角化不能な A でも成立する。

f_A(\lambda)=(\lambda_1-\lambda)(\lambda_2-\lambda)\dots(\lambda_n-\lambda)

より、

&math(&P^{-1}f_A(A)P=f_A(P^{-1}AP)= (\lambda_1 I-P^{-1}AP)(\lambda_2 I-P^{-1}AP)\dots (\lambda_n I-P^{-1}AP)=\\ &\begin{bmatrix} 0&*&\dots&*\\ 0&\lambda_1-\lambda_2&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_1-\lambda_n \end{bmatrix} \begin{bmatrix} \lambda_2-\lambda_1&*&\dots&*\\ 0&0&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_2-\lambda_n \end{bmatrix} \dots \begin{bmatrix} \lambda_n-\lambda_1&*&\dots&*\\ 0&\lambda_n-\lambda_2&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&0 \end{bmatrix} =O\\ );

したがって、左から P 右から P^{-1} を掛ければ

f_A(A)=O

となる。

注2

上記でやり残した「固有値 \lambda_k が重複度 r_k を持つ時、 固有関数の自由度 f_k r_k 以下である」を証明しよう。

行列の階数は正則行列のかけ算で変化しないから、

\rank(A-\lambda_k I)=\rank\{P^{-1}(A-\lambda_k I)P\}=\rank(P^{-1}AP-\lambda_k I)

P A を三角化するように取れば、

&math( P^{-1}AP-\lambda_k I = \begin{bmatrix} \lambda_1-\lambda_k&*&\dots&*\\ 0&\lambda_2-\lambda_k&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_n-\lambda_k \end{bmatrix} );

n 個の対角成分のうち r_k 個がゼロとなり、 n-r_k 個は非ゼロとなる。

固有値の順番は任意に取れるから、ここでは n-r_k+1\le i\le n に対して \lambda_i-\lambda_k=0 とする。

このとき逆に、 1\le i\le n-r_k に対して対角成分はゼロでないから、それぞれの行を \lambda_i-\lambda_k で割れば、

&math( P^{-1}AP-\lambda_k I \sim \begin{bmatrix} \ 1\ &*&\cdots&\cdots&\cdots&\ *\ \\ \ 0\ &\ddots&\ddots&&&\vdots\\ \vdots&\ddots&1&\ddots&&\vdots\\ \vdots&&\ddots&0&\ddots&\vdots\\ \vdots&&&\ddots&\ddots&*\\ 0&\cdots&\cdots&\cdots&0&0 \end{bmatrix} \begin{array}{l} \left.\rule{0cm}{1cm}\right\}n-r_k\\[8mm] \left.\rule{0cm}{1cm}\right\}r_k\\ \end{array} );

となる。

左から n-r_k 列は容易に掃き出せるから、 この行列の階数が n-r_k よりも大きいことは一目瞭然である。

\rank (P^{-1}AP-\lambda_kI) = \rank (A-\lambda_kI) \ge n-r_k

したがって、

(自由度) = n-\rank (A-\lambda_kI) \le r_k

として、固有ベクトルの解の自由度が重複度 r_k を超えないことを示せた。

トレース、行列式と固有値との関係

行列 A のトレースおよび行列式は、その n 個の固有値(重複を含む)を使って

\tr A=\sum_{i=1}^n \lambda_i =\lambda_1+\lambda_2+\dots+\lambda_n

|A|=\prod_{i=1}^n \lambda_i=\lambda_1\,\lambda_2\,\cdots\,\lambda_n

のように表せる。

証明(トレース)

  • トレースの定義:  \tr A=\sum_{i=1}^n a_{ii}=a_{11}+a_{22}+\dots+a_{nn}
  • トレースの性質1:  \tr (A+B)=\tr A + \tr B

  ほぼ自明

  • トレースの性質2:  \tr (AB)=\tr (BA)

  &math( \because \tr (AB)&=\sum_{i=1}^n \left(\sum_{k=1}^n a_{ik}b_{ki}\right)\\ &=\sum_{k=1}^n \left(\sum_{i=1}^n b_{ki}a_{ik}\right) =\tr (BA) );

  • トレースの性質3:  \tr (P^{-1}AP)=\tr A

  &math( \because \tr (P^{-1}AP)=\tr [(P^{-1})(AP)]=\tr [(AP)(P^{-1})]=\tr (A I)=\tr A );

これらを使えば、 A を三角化する P に対して、

&math(\tr A=\tr (P^{-1}AP)= \tr \begin{bmatrix} \lambda_1&&&\hsymbu{*} \\ &\lambda_2&&\\ &&\ddots\\ \hsymbl{0}&&&\lambda_n \end{bmatrix} = \sum_{i=1}^n \lambda_i );

を得る。

証明(行列式)

  • 行列式の性質1:  |AB|=|A||B|
  • 行列式の性質2:  |P^{-1}AP|=|P^{-1}||A||P|=|P|^{-1}|A||P|=|A|

これらを使えば、 A を三角化する P に対して、

&math(|A|=|P^{-1}AP|= \begin{vmatrix} \lambda_1&&&\hsymbu{*} \\ &\lambda_2&&\\ &&\ddots\\ \hsymbl{0}&&&\lambda_n \end{vmatrix} = \prod_{i=1}^n \lambda_i );

を得る。

相似な行列は

  • 固有値が等しい
  • トレースが等しい
  • 行列式が等しい

という点で「似ている」

質問・コメント





Counter: 308982 (from 2010/06/03), today: 4, yesterday: 0