広義固有空間の構造とジョルダン標準形 のバックアップ(No.5)

更新


線形代数I

概要

ジョルダン標準形とは、対角化できない行列を「準対角化」した形である。 これは固有空間の概念を拡張した、「広義固有空間」が持つ構造を反映した形となる。

ここは発展項目なので、線形代数IIの内容を先取りして使う。
実のところ、線形代数IIでも扱わない内容なので、線形代数IIを学んでから戻ってきても良い。

固有空間とその次元

n 次正方行列 A の、固有値 \lambda に対する固有空間 V(\lambda) (固有ベクトルの集合が作る線形空間)は、

  (A-\lambda I)\bm x=\bm 0

の解が作る空間である。したがって、

  V(\lambda)=\mathrm{Ker}\,(A-\lambda I)

と表せる。

\lambda の重複度と同数の一次独立な固有ベクトルを見つけられることが A を対角化できる必要条件だった。

これは固有空間の次元が重複度と等しいことと同値である。 (重複度を超えることはない)

  \dim V(\lambda)=\dim\mathrm{Ker}\,(A-\lambda I)=r

\lambda の重複度を r とする)

広義固有空間

対角化できない場合には

  \dim\mathrm{Ker}\,(A-\lambda I)<r

となる固有値があるが、そのような場合にも必ず、

  \dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r

となることを以下のようにして示せる。すなわち、固有空間

  V(\lambda)=\mathrm{Ker}\,(A-\lambda I)

に対して、「広義固有空間」を

  W(\lambda)=\mathrm{Ker}\,\{(A-\lambda I)^r\}

と定義すれば、その次元はぴったり重複度と等しくなる。

以下証明:

三角化可能定理 において、 初めに \lambda r 解選ぶと、左上から r 個の \lambda が並び、その後、他の固有値が並ぶ形に三角化ができる。

 &math( &\hspace{4mm}\overbrace{\hspace{17mm}}^{r}\\ P^{-1}AP=&\begin{pmatrix} \lambda & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & \lambda & & & \vdots\\
 &  &  & \lambda'& &\vdots\\
 &  &  &  & \lambda''\\
 &  &  &  &  & \ddots\\

\end{pmatrix} );

そこで ケーリーハミルトンの定理 と同じ操作を

  (A-\lambda I)^r

に対して行えば、

 &math( &(A-\lambda I)^r\\ &=PP^{-1}(A-\lambda I)PP^{-1}(A-\lambda I)PP^{-1}\dots(A-\lambda I)PP^{-1}\\ &=P(P^{-1}AP-\lambda I)(P^{-1}AP-\lambda I)\dots(P^{-1}AP-\lambda I)P^{-1}\\ &=P\begin{pmatrix} 0 & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & 0 & & & \vdots\\
 &  &  & \lambda'-\lambda& &\vdots\\
 &  &  &  & \lambda''-\lambda\\
 &  &  &  &  & \ddots\\

\end{pmatrix}^{\displaystyle r} P^{-1}\\ &=P\begin{pmatrix} 0 & 0 & 0 & \dots & \dots&* \\

 & \ddots & 0 &\dots & \dots&* \\
 &  & 0 & & & \vdots\\
 &  &  & (\lambda'-\lambda)^r& &\vdots\\
 &  &  &  & (\lambda''-\lambda)^r\\
 &  &  &  &  & \ddots\\

\end{pmatrix} P^{-1}\\ &\hspace{12mm}\underbrace{\hspace{17mm}}_{r}\\ );

となって、 (A-\lambda I)^r の階数が n-r となることが分かる。 すなわち、 (A-\lambda I)^r\bm x=\bm 0 を解けば r 個のパラメータが残り、

  \dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r

となるのである。

広義固有空間の構造

広義固有空間のベクトルは、

  \underbrace{(A-\lambda I)(A-\lambda I)\dots(A-\lambda I)}_{r回}\bm x=\bm 0

を満たす。

そこでこの空間を、 「何回 (A-\lambda I) をかけたらゼロになるか」で分類すると、 それぞれが線形空間を作る。

  • 0回でゼロになる空間は V^0(\lambda)=\set{\bm 0}
  • 1回でゼロになるのが通常の固有空間 V(\lambda)
  • 2回かけたらゼロになる空間 V^2(\lambda)
  • 3回かけたらゼロになる空間 V^3(\lambda)

とすると、以下が成り立つ。

k+1 回かけたらゼロになるベクトルに (A-\lambda I) を1回かけると k 回かけたらゼロになるベクトルになるので、

  \bm x\in V^k(\lambda)\to(A-\lambda I)\bm x\in V^{k-1}(\lambda)

k 回かけたらゼロになるベクトルは k+1 回かけたらゼロになるベクトルでもあるので、

  V^k(\lambda)\subset V^{k+1}(\lambda)

もともと、 r 回かければゼロになるものを分類しているのであったから、

  V^r(\lambda)=W(\lambda)

すなわち、

 &math(V^0(\lambda)\subset V^1(\lambda)\subset V^2(\lambda)\dots\subset V^r(\lambda)=W(\lambda) );

\dim V^{k+1}(\lambda) から \dim V^k(\lambda) へと、 増えた空間を \Delta V^k(\lambda) と書こう。つまり、

  V^{k+1}(\lambda) =V^k(\lambda)\dot +\Delta V^{k+1}(\lambda)

とする。( \Delta V^{k+1}(\lambda)=\set{\bm 0} の場合もある)

すると、 W(\lambda) \Delta V^k(\lambda) の直和で書けて、

 &math( W(\lambda)= \underbrace{V^0(\lambda)}_{=\,\set{\bm 0}} \,\dot+\,\underbrace{\Delta V(\lambda)}_{=\,V(\lambda)} \,\dot+\,\Delta V^2(\lambda) \,\dot+\, \dots \,\dot+\, \Delta V^m(\lambda) \,\dot+\, \underbrace{\Delta V^{m+1}(\lambda) \,\dot+\, \dots \,\dot+\, \Delta V^r(\lambda)}_{\set{\bm 0}} );

一般に、 m\le r に対して k>m \Delta V^k(\lambda) は空集合になる。

固有空間 V(\lambda) の次元が1よりも大きいときには その内部を

  V(\lambda)=V_1(\lambda)\,\dot+\,V_2(\lambda)\,\dot+\,\dots

のように1次元の空間に分解して、それぞれに対して \Delta V^{k}_{1}(\lambda) などを求めれば、 W(\lambda) をすべて1次元の \Delta V^k_{l}(\lambda) の直和に分けられる。(証明略)

例1 固有空間は1次元

 &math(A=\begin{pmatrix}

4 & -2 & 0 \\
-3 & 4 & -2 \\
-11 & 9 & -2 \\

\end{pmatrix}

);

 &math(|A-\lambda I|= \begin{vmatrix}

4-\lambda & -2 & 0 \\
-3 & 4-\lambda & -2 \\
-11 & 9 & -2-\lambda \\

\end{vmatrix}= 8-12\lambda+6\lambda^2-\lambda^3=(2-\lambda)^3 );

  \lambda=2 (3重解)

  (A-\lambda I)\bm x=\bm 0

 &math( \begin{pmatrix}

2 & -2 & 0 \\
-3 & 2 & -2 \\
-11 & 9 & -4 \\

\end{pmatrix}\sim \begin{pmatrix}

1 & -1 & 0 \\
0 & -1 & -2 \\
0 & -2 & -4 \\

\end{pmatrix}\sim \begin{pmatrix}

1 & 0 & 2 \\
0 & 1 & 2 \\
0 & 0 & 0 \\

\end{pmatrix} );

掃出せなかった z をパラメータとして、

 &math(\bm x=z\begin{pmatrix}

  • 2\\-2\\1 \end{pmatrix});

3重解なのに \dim V(2)=1 だ。 基底として &math(\bm b_1=\begin{pmatrix}

  • 2\\-2\\1 \end{pmatrix}); を取れる。

\Delta V^2(2) を求めるために (A-\lambda I) をかけると \Delta V(\lambda) に入るベクトルを探す。

  (A-\lambda I)\bm x=s\bm b_1

の拡大係数行列を変形して、

 &math( \begin{pmatrix}

2 & -2 & 0 & -2\\
-3 & 2 & -2 & -2\\
-11 & 9 & -4 & 1\\

\end{pmatrix}\sim \begin{pmatrix}

1 & -1 & 0 & -1\\
0 & -1 & -2 & -5\\
0 & -2 & -4 & -10\\

\end{pmatrix}\sim \begin{pmatrix}

1 & 0 & 2 & 4\\
0 & 1 & 2 & 5\\
0 & 0 & 0 & 0\\

\end{pmatrix} );

より、

 &math( \begin{cases} x+2z=4s\\ y+2z=5s\\ 0=0 \end{cases} );

掃出せなかった z をパラメータとすれば、

 &math( \bm x=z\begin{pmatrix}

  • 2\\-2\\1 \end{pmatrix}+s\begin{pmatrix} 4\\5\\0 \end{pmatrix} );

\Delta V^2(\lambda) は &math(\bm b_2=\begin{pmatrix} 4\\5\\0 \end{pmatrix}); を基底に持つ1次元空間。

次に \Delta V^3(\lambda) を求めるために、 (A-\lambda I) をかけると \Delta V^2(\lambda) に入るベクトルを探す。

  (A-\lambda I)\bm x=s\bm b_2

の拡大係数行列を変形して、

 &math( \begin{pmatrix}

2 & -2 & 0 & 4\\
-3 & 2 & -2 & 5\\
-11 & 9 & -4 & 0\\

\end{pmatrix}\sim \begin{pmatrix}

1 & -1 & 0 & 2\\
0 & -1 & -2 & 11\\
0 & -2 & -4 & -22\\

\end{pmatrix}\sim \begin{pmatrix}

1 & 0 & 2 & -9\\
0 & 1 & 2 & -11\\
0 & 0 & 0 & 0\\

\end{pmatrix} );

掃出せなかった z をパラメータとすれば、

 &math( \bm x=z\begin{pmatrix}

  • 2\\-2\\1 \end{pmatrix}+s\begin{pmatrix}
  • 9\\-11\\0 \end{pmatrix} );

\Delta V^3(\lambda) は &math(\bm b_3=\begin{pmatrix}

  • 9\\-11\\0 \end{pmatrix}); を基底に持つ1次元空間。

\Delta V^4(\lambda) があるか調べるために、 (A-\lambda I) をかけると \Delta V^3(\lambda) に入るベクトルを探してみる。

 &math( \begin{pmatrix}

2 & -2 & 0 & -9\\
-3 & 2 & -2 & -11\\
-11 & 9 & -4 & 0\\

\end{pmatrix}\sim \begin{pmatrix}

2 & -2 & 0 & -9\\
-6 & 4 & -4 & -22\\
-22 & 18 & -8 & 0\\

\end{pmatrix}\sim \begin{pmatrix}

2 & -2 & 0 & -9 \\
0 & -2 & -4 & -49\\
0 & -4 & -8 & -99\\

\end{pmatrix}\sim \begin{pmatrix}

2 & -2 & 0 & -9 \\
0 & -2 & -4 & -49\\
0 & 0 & 0 & -1\\

\end{pmatrix} );

最後の行は 0=-1 を表し、これを満たすベクトルは存在しないから、 \Delta V^4(\lambda)=\set{\bm 0} である。

したがって、

 &math( W(\lambda)= \underbrace{ \underbrace{ \underbrace{V(\lambda)}_{[\bm b_1]}\,\dot+\, \underbrace{\Delta V^2(\lambda)}_{[\bm b_2]} }_{V^2(\lambda)} \,\dot+\, \underbrace{\Delta V^3(\lambda)}_{[\bm b_3]} }_{V^3(\lambda)} );

の構造を持っている。

ジョルダン標準形

上記の \bm b_1,\bm b_2,\bm b_3 に対して、

  (A-\lambda I)\bm b_1=\bm 0  つまり A\bm b_1=\lambda\bm b_1

  (A-\lambda I)\bm b_2=\bm b_1  つまり A\bm b_2=\lambda\bm b_2+\bm b_1

  (A-\lambda I)\bm b_3=\bm b_2  つまり A\bm b_3=\lambda\bm b_3+\bm b_2

だから、

 &math( P=\Big(\bm b_1\ \bm b_2\ \bm b_3\Big) );

に対して、

 &math( P^{-1}AP &=P^{-1}A\Big(\bm b_1\ \bm b_2\ \bm b_3\Big)\\ &=P^{-1}\Big(A\bm b_1\ A\bm b_2\ A\bm b_3\Big)\\ &=P^{-1}\Big(\lambda\bm b_1\ \lambda\bm b_2+\bm b_1\ \lambda\bm b_3+\bm b_2\Big)\\ &=P^{-1}\underbrace{\Big(\bm b_1\ \bm b_2\ \bm b_3\Big)}_{P}\begin{pmatrix} \lambda&1&\\ &\lambda&1\\ &&\lambda \end{pmatrix}= \begin{pmatrix} \lambda&1&\\ &\lambda&1\\ &&\lambda \end{pmatrix}\\ );

を得る。この形は A のジョルダン標準形と呼ばれる。

  • 対角要素に固有値が並ぶ
  • すぐ右上に、対応するベクトルがどのベクトルへ移るかを示す 1 が並ぶ

例2 固有空間が2次元で非対称

 &math(A=\begin{pmatrix}

  • 9&8&-4\\
  • 15&13&-6\\
  • 5&4&-1 \end{pmatrix} );

とすると、

  |A-\lambda I|=1-3\lambda+3\lambda^2-\lambda^3=(1-\lambda)^3

(A-\lambda I)\bm x=\bm 0 は、 5x-4y+2z=0 を導き、 掃出せなかった y,z をパラメータで y=5s,z=5t と置けば、

 &math(\bm x=s\begin{pmatrix} 4\\5\\0 \end{pmatrix}+t\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix});

V(\lambda) は2次元で、 &math(\bm b_1=\begin{pmatrix} 4\\5\\0 \end{pmatrix},\bm b_2=\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix}); を基底に取れる。

\Delta V^2(\lambda) を求めるために、

&math((A-\lambda I)\bm x=s\begin{pmatrix} 4\\5\\0 \end{pmatrix}+t\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix});

と置けば、

 &math( \begin{pmatrix}

  • 10&8&-4&4&-2\\
  • 15&12&-6&5&0\\
  • 5&4&-2&0&5 \end{pmatrix}\sim \begin{pmatrix}
  • 5&4&-2&0&5\\ 0&0&0&4&-12\\ 0&0&0&5&-15\\ \end{pmatrix}\sim \begin{pmatrix}
  • 5&4&-2&0&5\\ 0&0&0&1&-3\\ 0&0&0&0&0\\ \end{pmatrix}\sim );

となって、&math( \begin{cases}

  • 5x+4y-2z=5t\\ 0=s-3t\\ \end{cases} ); を得る。

すなわち、

 &math( \bm x=s'\begin{pmatrix} 4\\5\\0 \end{pmatrix}+t'\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix}+t\begin{pmatrix}
  • 1\\0\\0 \end{pmatrix} );

に対して

 &math( (A-\lambda)\bm x= 3t\begin{pmatrix} 4\\5\\0 \end{pmatrix}+t\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix} =t\begin{pmatrix} 10\\15\\5 \end{pmatrix} =5t\begin{pmatrix} 2\\3\\1 \end{pmatrix} );

つまり、

 &math(\bm b_2'=\begin{pmatrix} 2\\3\\1 \end{pmatrix});

 &math(\bm b_3=\begin{pmatrix}

  • 1\\0\\0 \end{pmatrix});

とすると、 (A-\lambda)\bm b_3=\bm b_2'

\bm b_1,\bm b_2' V(1) を張るから、 広義固有空間の構造は、

 &math( W(1)= \underbrace{ \underbrace{ \underbrace{V_1(1)}_{\bm b_1} \,\dot+\, \underbrace{V_2(1)}_{\bm b_2'} }_{V(1)} \,\dot+\, \underbrace{V_2^2(1)}_{\bm b_2} }_{V^2(1)} );

ジョルダン標準形

  P=\Big(\bm b_1\ \bm b_2'\ \bm b_3\Big)

に対して、

 &math(P^{-1}AP=\begin{pmatrix} \lambda&\\ &\lambda&1\\ &&\lambda \end{pmatrix} );

となる。

例3 固有空間が2次元で対称

 &math( A=\begin{pmatrix}

3 & 8 & 4 & -12 \\
6 & 5 & 4 & -12 \\
-6 & -1 & -5 & 6 \\
5 & 9 & 4 & -15 \\

\end{pmatrix} );

 &math( \begin{pmatrix} \lambda&1\\ &\lambda&\\ &&\lambda&1\\ &&&\lambda\\ \end{pmatrix} );

一般のジョルダン標準形

ジョルダン標準形の応用

ジョルダン標準形を見れば、その行列の広義固有空間がどのような構造になっているか一目瞭然となる。 その意味でジョルダン標準形は非常に重要であるが、応用的にも重要な意味を持つ。


Counter: 69421 (from 2010/06/03), today: 10, yesterday: 0