広義固有空間の構造とジョルダン標準形 のバックアップ(No.11)

更新


線形代数I

概要

現在推敲中で未完成です

ジョルダン標準形とは、対角化できない行列を「準対角化」した形である。 この標準形は行列の固有空間の概念を拡張した、「広義固有空間」が持つ構造を反映した形となる。

ここは発展項目なので、線形代数IIの内容を先取りして使う。
実のところ、線形代数IIでも扱わない内容なので、線形代数IIを学んでから戻ってきても良い。

目次

固有空間とその次元

n 次正方行列 A の、固有値 \lambda に対する固有空間 V(\lambda) (固有ベクトルの集合が作る線形空間)とは、

  (A-\lambda I)\bm x=\bm 0

の解が作る空間である。したがって、

  V(\lambda)=\mathrm{Ker}\,(A-\lambda I)

と書ける。

すべての固有値について、その重複度と同数の一次独立な固有ベクトルを見つけられることが 行列が対角化可能な条件だった。

これは固有空間の次元が重複度と等しいことと同値である。 (重複度を超えることはない)

  \dim V(\lambda)=\dim\mathrm{Ker}\,(A-\lambda I)=r

\lambda の重複度を r とする)

広義固有空間

対角化できない場合には

  \dim\mathrm{Ker}\,(A-\lambda I)<r

となる固有値があるが、そのような場合にも必ず、

  \dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r

となることを以下のようにして示せる。すなわち、固有空間

  V(\lambda)=\mathrm{Ker}\,(A-\lambda I)

に対して、「広義固有空間」を

  W(\lambda)=\mathrm{Ker}\,\{(A-\lambda I)^r\}

と定義すれば、その次元は必ず重複度と等しくなる。

さらに、異なる固有値の広義固有空間はゼロ以外で重ならないため、 全空間を広義固有空間の直和に分解できることになる。

広義固有空間の次元が重複度と等しくなること、広義固有空間がゼロ以外で重ならないこと、の証明

三角化可能定理 の証明の手順において、 初めに \lambda r 回選ぶと、左上から r 個の \lambda が並び、その後、他の固有値が並ぶ形に三角化する P の存在を示せる。

 &math( &\hspace{4mm}\overbrace{\hspace{17mm}}^{r}\\ P^{-1}AP=&\begin{pmatrix} \lambda & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & \lambda & & & \vdots\\
 &  &  & \lambda'& &\vdots\\
 &  &  &  & \lambda''\\
 &  &  &  &  & \ddots\\

\end{pmatrix} );

この P を用いて ケーリーハミルトンの定理 の証明で行ったのと同じ操作を

  (A-\lambda I)^r

に対して行えば、

 &math( &(A-\lambda I)^r\\ &=PP^{-1}(A-\lambda I)PP^{-1}(A-\lambda I)PP^{-1}\dots(A-\lambda I)PP^{-1}\\ &=P(P^{-1}AP-\lambda I)(P^{-1}AP-\lambda I)\dots(P^{-1}AP-\lambda I)P^{-1}\\ &=P\begin{pmatrix} 0 & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & 0 & & & \vdots\\
 &  &  & \lambda'-\lambda& &\vdots\\
 &  &  &  & \lambda''-\lambda\\
 &  &  &  &  & \ddots\\

\end{pmatrix}^{\displaystyle r} P^{-1}\\ &=P\begin{pmatrix} 0 & 0 & 0 & \dots & \dots&* \\

 & \ddots & 0 &\dots & \dots&* \\
 &  & 0 & & & \vdots\\
 &  &  & (\lambda'-\lambda)^r& &\vdots\\
 &  &  &  & (\lambda''-\lambda)^r\\
 &  &  &  &  & \ddots\\

\end{pmatrix} P^{-1}\\ &\hspace{12mm}\underbrace{\hspace{17mm}}_{r}\\ );

中央の行列の階数は n-r 、カーネルは r 次元で、 これらは正則行列( P P^{-1} )とのかけ算で変化しないため、 (A-\lambda I)^r の階数は n-r 、 カーネルは r 次元となることが分かった。

  \dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r

一方、 \bm x\in\mathrm{Ker}\,\{(A-\lambda I)^r\} ただし \bm x\ne\bm 0 とすれば、 上記の形から P^{-1}\bm x r+1 要素目以降がすべてゼロとなるようなベクトルである。 そして、 P^{-1} は正則であるため r 要素目よりも前にゼロでない要素が存在する。

(A-\lambda'I)^{r'} に対して上と同様の計算を行うと、

 &math( &(A-\lambda' I)^{r'}\\ &=P\begin{pmatrix} \lambda-\lambda' & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & \lambda-\lambda' & & & \vdots\\
 &  &  & 0& &\vdots\\
 &  &  &  & \lambda''-\lambda\\
 &  &  &  &  & \ddots\\

\end{pmatrix}^{\displaystyle r'} P^{-1}\\ &=P\begin{pmatrix} (\lambda-\lambda')^{r'} & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & (\lambda-\lambda')^{r'} & & & \vdots\\
 &  &  & 0& &\vdots\\
 &  &  &  & (\lambda''-\lambda')^{r'}\\
 &  &  &  &  & \ddots\\

\end{pmatrix} P^{-1}\\ &\hspace{12mm}\underbrace{\hspace{45mm}}_{r}\\ );

のように r 列目までの対角要素には (\lambda-\lambda')^{r'} が並び、 P^{-1}\bm x との積はゼロにならないことが分かる。 これは異なる固有値の広義固有空間が \bm 0 以外で重ならないことを示す。

広義固有空間の構造

定義の通り、広義固有空間に含まれるベクトルは、

  \underbrace{(A-\lambda I)(A-\lambda I)\dots(A-\lambda I)}_{r回}\bm x=\bm 0

を満たす。

そこでこの空間を、 「何回 (A-\lambda I) をかけたらゼロになるか」で分類すると、 それらの集合は部分空間となる。

  • 0回でゼロになる空間は V^0(\lambda)=\set{\bm 0}
  • 1回でゼロになるのが通常の固有空間 V(\lambda)
  • 2回かけたらゼロになる空間 V^2(\lambda)
  • 3回かけたらゼロになる空間 V^3(\lambda)
  • r 回かけたらゼロになる空間 V^r(\lambda)=W(\lambda)

k 回かけたらゼロになるベクトルは k+1 回かけたらゼロになるベクトルでもあるので、 これらの空間には

 &math( \underbrace{V^0(\lambda)}_{=\,\set{\bm 0}}\subset \underbrace{V^1(\lambda)}_{=\,V(\lambda)}\subseteq V^2(\lambda)\subseteq\dots\subseteq \underbrace{V^r(\lambda)}_{=\,W(\lambda)} );

の関係がある。

とはいえこれは V^k(\lambda) が必ず V^{k-1}(\lambda) よりも大きいというわけでは無く、 V^k(\lambda)=V^{k-1}(\lambda) である可能性を否定しない。

V^{k}(\lambda) V^{k-1}(\lambda) よりもどれだけ大きくなるかを考えるため、

  \delta V_k=\dim V^k(\lambda)-\dim V^{k-1}(\lambda)

と定義する。このとき任意の k>0 に対して

  \delta V_k>\delta V_{k+1}

が成り立つことを次のように示せる。

定義から、 \delta V_{k+1} は、 V_{k+1}(\lambda)

  V_{k+1}(\lambda)=V_{k}(\lambda)\dot+\Delta V_{k+1}(\lambda)

のように直和分解したときの \Delta V_{k+1}(\lambda) の次元である。

  \delta V_{k+1}=\dim\Delta V_{k+1}(\lambda)

すなわち、 k 回ではゼロにならないが、 k+1 回でゼロになる ベクトルのみからなる線形空間 \Delta V_{k+1}(\lambda) から、 一次独立なベクトル(基底ベクトル)を \delta V_{k+1} 本見つけられる。

それらに (A-\lambda I) を1回かけて得た \delta V_{k+1} 本のベクトルは、 それらは k-1 回ではゼロにならないが、 k 回でゼロになるベクトルのみからなる \delta V_{k+1} 次元空間を張る。

なぜなら、もしそれらの一次結合が k-1 回以下でゼロになったとしたら、 それは \Delta V_{k+1}(\lambda) のベクトルの一次結合により k 回以下でゼロになるベクトルを作れたことになり、 \Delta V_{k+1}(\lambda) の定義に反するためだ。

k-1 回ではゼロにならないが、 k 回でゼロになるベクトルのみからなる \delta V_{k+1} 次元空間が存在することは、 \dim V^k(\lambda) \dim V^{k-1}(\lambda) より少なくとも \delta V_{k+1} だけ大きいことを示しており、すなわち \delta V_k\le \delta V_{k+1} が示された。

上記を図示すると次のようになる。

 &math( &\overbrace{V^1(\lambda)}^{V(\lambda)}\subseteq V^2(\lambda)\subseteq V^3(\lambda)\subseteq V^4(\lambda)\subseteq\ \ \ \dots\dots\ \ \ \subseteq \overbrace{V^r(\lambda)}^{W(\lambda)}\\ &\hspace{4mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\ \ \dots\dots\hspace{3mm}\searrow\hspace{6mm}\nearrow\\ &\hspace{9mm}\delta V_2\hspace{3mm}\ge\hspace{3mm}\delta V_3\hspace{3mm}\ge\hspace{3mm}\delta V_4\hspace{3mm}\ge\hspace{3mm}\dots\underbrace{\dots\hspace{3mm}\ge\hspace{3mm}\delta V_r}_{=\,0} );

ここで、

  \delta V_1+\delta V_2+\dots+\delta V_r=r

であるから、 \delta V_1>1 のときには上式のように、 ある m ( m<r )以上の k に対して \delta V_k=0 となる。 これは V^{m}(\lambda)=V^{m+1}(\lambda)=\dots=V^r(\lambda) を意味する。

つまり、 r よりも小さい m 回で、広義固有空間のベクトルがすべてゼロになる。 m=1 の場合が、広義固有空間が固有空間と等しい場合である。

広義固有空間の分解

上記の議論は、広義固有空間を k-1 回ではゼロにならないが、 k 回でゼロになるベクトルのみからなる空間 \Delta V_k(\lambda) の直和として、

 &math( W(\lambda)=\underbrace{\underbrace{\underbrace{\underbrace{\Delta V_1(\lambda)}_{V(\lambda)}\dot+\Delta V_2(\lambda)}_{V^2(\lambda)}\dot+\Delta V_3(\lambda)}_{V^3(\lambda)}\dot+\dots\dot+\Delta V_m(\lambda)}_{V^m(\lambda)} );

の形に分解するための手順を与える。

すなわち、

  1. まず k=1 から順に \dim V^k(\lambda) を求める
    • 次元は徐々に増えるが、増え方はだんだん鈍くなり、最後は増えなくなる
  2. 次元増加の差分から \delta V_k を求める
  3. \delta V_k\ne 0 を満たす最も大きな k k_\mathrm{max} に対して、 k_\mathrm{max}-1 回ではゼロにならないが、 k_\mathrm{max} 回でゼロになるような空間を張る \delta V_{k_\mathrm{max}} 個のベクトルを見つけると、 それらは \Delta V^{k_\mathrm{max}}(\lambda) の基底となる。
  4. それらのベクトルに
    • (A-\lambda I) を1回かけると \Delta V^{k-1}(\lambda) の基底(の一部)が、
    • (A-\lambda I) を2回かけると \Delta V^{k-2}(\lambda) の基底(の一部)が、
      ...
    • (A-\lambda I) k_\mathrm{max}-1 回かけると \Delta V(\lambda) の基底(の一部)が、
      それぞれ求まる。
  5. そのようにして求まった数の基底ベクトル以上の次元を持つ k があれば、 そのような k のうち最大のものに対して、足りない数のベクトルを見つけて、 \Delta V^k(\lambda) の基底を作る。
  6. 新しく見つけたベクトルに (A-\lambda I) をかけることで、 その k 以下の \Delta V^k(\lambda) の基底ベクトルの一部も同時に発見できる。
  7. すべての基底ベクトルが見つかるまで、5., 6. を繰り返す。

このようにして構成した基底は、 (A-\lambda I) とのかけ算により

  \bm b'=(A-\lambda I)\bm b

  \bm b''=(A-\lambda I)\bm b'

  \bm b'''=(A-\lambda I)\bm b''

 …

のように連なった何本かのベクトル鎖からできており、 このようなベクトルの連なりは「ジョルダン鎖」と呼ばれる。

k-1 回ではゼロにならないが、 k 回でゼロになるベクトルのみからなる空間への分解は一意には決まらず、基底の取り方にも大きな任意性がある。したがって上記の方法は分解の一例を与えるに過ぎないが、この方法は以下に示すように「ジョルダン標準形」を与える基礎をなす。

例1 3次元の広義固有空間、鎖1本

 &math(A=\begin{pmatrix}

4 & -2 & 0 \\
-3 & 4 & -2 \\
-11 & 9 & -2 \\

\end{pmatrix} );

まずは固有値を求める。

 &math(|A-\lambda I|= \begin{vmatrix}

4-\lambda & -2 & 0 \\
-3 & 4-\lambda & -2 \\
-11 & 9 & -2-\lambda \\

\end{vmatrix}= 8-12\lambda+6\lambda^2-\lambda^3=(2-\lambda)^3 );

  \lambda=2 (3重解)

したがって、広義固有空間 W(2) は3次元。

&math(A-2I=\begin{pmatrix}

2 & -2 & 0 \\
-3 & 2 & -2 \\
-11 & 9 & -4 \\

\end{pmatrix} \sim\begin{pmatrix}

1 & -1 & 0 \\
0 & -1 & -2 \\
0 & -2 & -4 \\

\end{pmatrix} \sim\begin{pmatrix}

1 & 0 & 2 \\
0 & 1 & 2 \\
0 & 0 & 0 \\

\end{pmatrix}); より \dim V(2)=1

&math((A-2I)^2=\begin{pmatrix}

2 & -2 & 0 \\
-3 & 2 & -2 \\
-11 & 9 & -4 \\

\end{pmatrix}^2 =\begin{pmatrix}

10 & -8 & 4 \\
10 & -8 & 4 \\
-5 & 4 & -2 \\

\end{pmatrix} \sim\begin{pmatrix}

5 & -4 & 2 \\

0&0&0\\ 0&0&0\\ \end{pmatrix}); より \dim V^2(2)=2

3重解なので \dim V^3(2)=3 となるはずであるが、実際、

&math((A-2I)^3 =\begin{pmatrix}

10 & -8 & 4 \\
10 & -8 & 4 \\
-5 & 4 & -2 \\

\end{pmatrix} \begin{pmatrix}

2 & -2 & 0 \\
-3 & 2 & -2 \\
-11 & 9 & -4 \\

\end{pmatrix} =\begin{pmatrix} 0&0&0\\ 0&0&0\\ 0&0&0\\ \end{pmatrix});

であるからこれは正しい。以上より、

  \dim \Delta V(2)=\dim \Delta V^2(2)=\dim \Delta V^3(2)=1

したがって、 \Delta V^3(2) の基底を見つければ、それに A-2I をかけていくことで \Delta V^2(2),\Delta V(2) の基底が見つかるはず。

(A-2I)^2\bm x=\bm 0 は上記の通り係数行列の同値変形で 5x-4y+2z=0 となるから、 V^2(2) に入らない条件は (A-2I)^2\bm x\ne\bm 0 であり、 たとえば、

 &math(\bm b_3=\begin{pmatrix} 1\\0\\0 \end{pmatrix});

とすれば、これは V^2(2) に入らないが V^3(2) に入るから、 \Delta V^3(2) の基底となる。この \bm b_3 から

 &math(\bm b_2=(A-2I)\bm b_3= \begin{pmatrix} 2\\-3\\11 \end{pmatrix});

として \Delta V^2(2) の基底を、

 &math(\bm b_1=(A-2I)^2\bm b_3= \begin{pmatrix} 10\\10\\-5 \end{pmatrix});

として \Delta V(2) の基底を作ると、

  (A-2I)^3\bm b_3=O\bm b_3=\bm 0

よりこれらは確かに、それぞれ

  • 2回ではゼロにならないが3回でゼロになる \bm b_3
  • 1回ではゼロにならないが2回でゼロになる \bm b_2
  • 0回ではゼロではないが1回でゼロになる \bm b_1

であることが分かる。

以上より広義固有空間を

 &math( W(2)= \underbrace{\underbrace{\underbrace{ \underbrace{\Delta V(2)}_{[\bm b_1]}}_{V(2)}\dot+ \underbrace{\Delta V^2(2)}_{[\bm b_2]}}_{V^2(2)}\dot+ \underbrace{\Delta V^3(2)}_{[\bm b_3]}}_{V^3(2)} );

のように分解できることが分かった。

直和分解の任意性

\bm b_1 は1次元固有空間内の固有ベクトルであるから、 定数倍以外には任意性が無いが、

\bm b_2 \bm b_1 の任意の定数倍を加えて \bm b_2' を作れば、これも V^2(2) の元であり、なおかつ V(2) の元では無いから、 \Delta V^2(2) の基底となる。

同様に、 \bm b_3 \bm b_1,\bm b2 の任意の定数倍を加えて \bm b_3' を作れば、これも V^3(2) の元であり、なおかつ V^2(2) の元では無いから、 \Delta V^3(2) の基底となる。

そのようにして適当に作った一般の \bm b_1,\bm b_2',\bm b_3' は必ずしもジョルダン鎖を構成しないが、 やはり広義固有空間の直和分解を与える基底となる。

 &math( W(2)= \underbrace{\underbrace{\underbrace{ \underbrace{\Delta V(2)}_{[\bm b_1]}}_{V(2)}\dot+ \underbrace{\Delta {V^2}'(2)}_{[\bm b_2']}}_{V^2(2)}\dot+ \underbrace{\Delta {V^3}'(2)}_{[\bm b_3']}}_{V^3(2)} );

このとき \Delta {V^2}'(2),\Delta {V^3}'(2) は上記の \Delta V^2(2),\Delta V^3(2) とは異なるものとなるが、

  V^2(2)=V(2)+\Delta V^2(2)=V(2)+\Delta {V^2}'(2)

  V^3(2)=V^2(2)+\Delta V^3(2)=V^2(2)+\Delta {V^3}'(2)

となる。

ジョルダン標準形

上記の \bm b_1,\bm b_2,\bm b_3 に対して、

  (A-\lambda I)\bm b_1=\bm 0
  (A-\lambda I)\bm b_2=\bm b_1
  (A-\lambda I)\bm b_3=\bm b_2

であり、まとめて書けば、

 &math( (A-\lambda I)\Bigg(\bm p_1\ \bm p_2\ \bm p_3\Bigg) &=\Bigg(\,\bm 0\ \bm p_1\ \bm p_2\Bigg)\\ &=\underbrace{\Bigg(\bm p_1\ \bm p_2\ \bm p_3\Bigg)}_{=\,P} \begin{pmatrix} 0&1&0\\ 0&0&1\\ 0&0&0 \end{pmatrix} );

ここで \bm p_1,\bm p_2,\bm p_3 は一次独立であるから、

 &math( P=\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg) );

は正則である。左から P^{-1} を掛けて、

 &math( P^{-1}(A-\lambda I)P =\begin{pmatrix} 0&1&0\\ 0&0&1\\ 0&0&0 \end{pmatrix} );

より、

 &math( P^{-1}AP=\begin{pmatrix} \lambda&1&0\\ 0&\lambda&1\\ 0&0&\lambda \end{pmatrix} );

を得る。この形は A のジョルダン標準形と呼ばれる。

  • 対角要素に固有値が並ぶ
  • すぐ右上に、対応するベクトルがどのベクトルへ移るかを示す 1 が並ぶ
  • この形から、3次元空間に長さ3の1本のジョルダン鎖が存在することが分かる

例2 3次元の広義固有空間、鎖2本

 &math(A=\begin{pmatrix}

  • 9&8&-4\\
  • 15&13&-6\\
  • 5&4&-1 \end{pmatrix} );

とすると、

  |A-\lambda I|=1-3\lambda+3\lambda^2-\lambda^3=(1-\lambda)^3

固有値の 1 は3重解。

 &math( A-I=\begin{pmatrix}

  • 10&8&-4\\
  • 15&12&-6\\
  • 5&4&-2 \end{pmatrix} \sim\begin{pmatrix} 5&-4&2\\ 0&0&0\\ 0&0&0\\ \end{pmatrix}); より \dim V(2)=2

  (A-I)^2=O より \dim V^2(2)=3

つまり、 \dim\Delta V(1)=2,\dim\Delta V^2(1)=1

(A-I)\bm x=\bm 0 は上記の通り同値変形により 5x-4y+2z=0 を導くから、これを満たさないベクトルを1つ見つければ、

 &math(\bm b_3=\begin{pmatrix} 1\\0\\0 \end{pmatrix});

として \Delta V^2(1) の基底を得、

 &math(\bm b_2=-\frac{1}{5}(A-I)\bm b_3=\begin{pmatrix} 2\\3\\1 \end{pmatrix});

として \Delta V(1) の基底ベクトルの1つを得る。

もう1つは 5x-4y+2z=0 を満たすベクトルを適当に選んで、 例えば

 &math(\bm b_1=\begin{pmatrix} 0\\1\\2 \end{pmatrix});

などとすれば、 \set{\bm b_1,\bm b_2} \Delta V(1) の基底となる。

ジョルダン標準形

  P=\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg)

に対して、

 &math(P^{-1}AP=\begin{pmatrix} \lambda&\\ &\lambda&1\\ &&\lambda \end{pmatrix} );

となる。

この形から、3次元空間に長さ2のジョルダン鎖が1本、 長さ1のジョルダン鎖が1本、存在することが分かる

例3 1+3次元の広義固有空間、鎖3本

 &math( \begin{pmatrix} \lambda&\\ &\lambda'&\\ &&\lambda'&1\\ &&&\lambda'\\ \end{pmatrix} );

一般のジョルダン標準形

すべての固有値に対して上記のような広義固有空間のジョルダン鎖による分解を行えば、 最終的に n 本の一次独立なベクトルが得られる。

それらを上記の例のようにジョルダン鎖を構成する順番に並べて正則行列 P を作れば、 P^{-1}AP により A はジョルダン標準形と呼ばれる形に「準対角化」される。

ジョルダン標準形は対角成分に固有値が並び、 固有ベクトルのうちジョルダン鎖を構成する部分について 固有値の右上に1が並ぶ。

ジョルダン標準形の応用

ジョルダン標準形を見れば、その行列の広義固有空間がどのような構造になっているか一目瞭然となる。 その意味でジョルダン標準形は非常に重要であるが、応用的にも重要な意味を持つ。

$A$不変


Counter: 69409 (from 2010/06/03), today: 37, yesterday: 0