広義固有空間の構造とジョルダン標準形 のバックアップ(No.9)

更新


線形代数I

概要

現在推敲中で未完成です

ジョルダン標準形とは、対角化できない行列を「準対角化」した形である。 この標準形は行列の固有空間の概念を拡張した、「広義固有空間」が持つ構造を反映した形となる。

ここは発展項目なので、線形代数IIの内容を先取りして使う。
実のところ、線形代数IIでも扱わない内容なので、線形代数IIを学んでから戻ってきても良い。

目次

固有空間とその次元

n 次正方行列 A の、固有値 \lambda に対する固有空間 V(\lambda) (固有ベクトルの集合が作る線形空間)とは、

  (A-\lambda I)\bm x=\bm 0

の解が作る空間である。したがって、

  V(\lambda)=\mathrm{Ker}\,(A-\lambda I)

と書ける。

すべての固有値について、その重複度と同数の一次独立な固有ベクトルを見つけられることが 行列が対角化可能な条件だった。

これは固有空間の次元が重複度と等しいことと同値である。 (重複度を超えることはない)

  \dim V(\lambda)=\dim\mathrm{Ker}\,(A-\lambda I)=r

\lambda の重複度を r とする)

広義固有空間

対角化できない場合には

  \dim\mathrm{Ker}\,(A-\lambda I)<r

となる固有値があるが、そのような場合にも必ず、

  \dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r

となることを以下のようにして示せる。すなわち、固有空間

  V(\lambda)=\mathrm{Ker}\,(A-\lambda I)

に対して、「広義固有空間」を

  W(\lambda)=\mathrm{Ker}\,\{(A-\lambda I)^r\}

と定義すれば、その次元は必ず重複度と等しくなる。

さらに、異なる固有値の広義固有空間はゼロ以外で重ならないため、 全空間を広義固有空間の直和に分解できることになる。

広義固有空間の次元が重複度と等しくなることの証明

三角化可能定理 の証明の手順において、 初めに \lambda r 回選ぶと、左上から r 個の \lambda が並び、その後、他の固有値が並ぶ形に三角化する P の存在を示せる。

 &math( &\hspace{4mm}\overbrace{\hspace{17mm}}^{r}\\ P^{-1}AP=&\begin{pmatrix} \lambda & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & \lambda & & & \vdots\\
 &  &  & \lambda'& &\vdots\\
 &  &  &  & \lambda''\\
 &  &  &  &  & \ddots\\

\end{pmatrix} );

この P を用いて ケーリーハミルトンの定理 の証明で行ったのと同じ操作を

  (A-\lambda I)^r

に対して行えば、

 &math( &(A-\lambda I)^r\\ &=PP^{-1}(A-\lambda I)PP^{-1}(A-\lambda I)PP^{-1}\dots(A-\lambda I)PP^{-1}\\ &=P(P^{-1}AP-\lambda I)(P^{-1}AP-\lambda I)\dots(P^{-1}AP-\lambda I)P^{-1}\\ &=P\begin{pmatrix} 0 & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & 0 & & & \vdots\\
 &  &  & \lambda'-\lambda& &\vdots\\
 &  &  &  & \lambda''-\lambda\\
 &  &  &  &  & \ddots\\

\end{pmatrix}^{\displaystyle r} P^{-1}\\ &=P\begin{pmatrix} 0 & 0 & 0 & \dots & \dots&* \\

 & \ddots & 0 &\dots & \dots&* \\
 &  & 0 & & & \vdots\\
 &  &  & (\lambda'-\lambda)^r& &\vdots\\
 &  &  &  & (\lambda''-\lambda)^r\\
 &  &  &  &  & \ddots\\

\end{pmatrix} P^{-1}\\ &\hspace{12mm}\underbrace{\hspace{17mm}}_{r}\\ );

正則行列( P P^{-1} )とのかけ算で行列の階数は変化しないため、 (A-\lambda I)^r の階数が n-r となることが分かる。

行列の階数はその行列に対して掃出し操作の行える回数と等しい。

一方、 (A-\lambda I)^r\bm x=\bm 0 を解けば、掃出せなかった列の数だけパラメータが残るから、 その個数は n-\rank\{(A-\lambda I)^r\}=r であり、

  \dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r

となることが証明できた。

一方、 \bm x\in\mathrm{Ker}\,\{(A-\lambda I)^r\} ただし \bm x\ne\bm 0 とすれば、 P^{-1}\bm x r+1 要素目以降がすべてゼロとなるようなベクトルであるが、 P^{-1} は正則であるため r 要素目よりも前にゼロでない要素が存在する。 (A-\lambda'I)^{r'} に対して同様の計算を行えば、

 &math( &(A-\lambda' I)^{r'}\\ &=P\begin{pmatrix} \lambda-\lambda' & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & \lambda-\lambda' & & & \vdots\\
 &  &  & 0& &\vdots\\
 &  &  &  & \lambda''-\lambda\\
 &  &  &  &  & \ddots\\

\end{pmatrix}^{\displaystyle r} P^{-1}\\ &=P\begin{pmatrix} (\lambda-\lambda')^{r'} & * & * & \dots & \dots&* \\

 & \ddots & * &\dots & \dots&* \\
 &  & (\lambda-\lambda')^{r'} & & & \vdots\\
 &  &  & 0& &\vdots\\
 &  &  &  & (\lambda''-\lambda')^{r'}\\
 &  &  &  &  & \ddots\\

\end{pmatrix} P^{-1}\\ &\hspace{12mm}\underbrace{\hspace{45mm}}_{r}\\ );

のように r 列目までの対角要素には (\lambda-\lambda')^{r'} が並び、 P^{-1}\bm x との積はゼロにならない。 これは異なる固有値の広義固有空間が \bm 0 以外で重ならないことを示す。

広義固有空間の構造

定義の通り、広義固有空間に含まれるベクトルは、

  \underbrace{(A-\lambda I)(A-\lambda I)\dots(A-\lambda I)}_{r回}\bm x=\bm 0

を満たす。

そこでこの空間を、 「何回 (A-\lambda I) をかけたらゼロになるか」で分類する。 これらの集合は部分空間となるから、

  • 0回でゼロになる空間は V^0(\lambda)=\set{\bm 0}
  • 1回でゼロになるのが通常の固有空間 V(\lambda)
  • 2回かけたらゼロになる空間 V^2(\lambda)
  • 3回かけたらゼロになる空間 V^3(\lambda)
  • r 回かけたらゼロになる空間 V^r(\lambda)=W(\lambda)

とすると、以下が成り立つ。

k 回かけたらゼロになるベクトルは k+1 回かけたらゼロになるベクトルでもあるので、

 &math( \underbrace{V^0(\lambda)}_{=\,\set{\bm 0}}\subset \underbrace{V^1(\lambda)}_{=\,V(\lambda)}\subset V^2(\lambda)\dots\subset \underbrace{V^r(\lambda)}_{=\,W(\lambda)} );

V^{k-1}(\lambda) から V^{k}(\lambda) へと、 増えた分の空間を \Delta V^{k}(\lambda) と書こう。つまり、

  V^{k}(\lambda) =V^{k-1}(\lambda)\dot +\Delta V^{k}(\lambda)

k-1 回ではゼロにならないが、 k 回で初めてゼロになるベクトル(とゼロベクトル)の集合が \Delta V^{k}(\lambda) である。 ( \Delta V^{k}(\lambda)=\set{\bm 0} の場合もある)

すると、 W(\lambda) \Delta V^k(\lambda) の直和で書けて、

 &math( W(\lambda)= \underbrace{V^0(\lambda)}_{=\,\set{\bm 0}} \,\dot+\,\underbrace{\Delta V(\lambda)}_{=\,V(\lambda)} \,\dot+\,\Delta V^2(\lambda) \,\dot+\, \dots \,\dot+\, \Delta V^m(\lambda) \,\dot+\, \underbrace{\Delta V^{m+1}(\lambda) \,\dot+\, \dots \,\dot+\, \Delta V^r(\lambda)}_{\set{\bm 0}} );

一般に、 m\le r に対して k>m \Delta V^k(\lambda) はゼロ次元 {0} になる。 これは m 回かけたらすべてゼロになってしまうため、 V^m=V^{m+1}=V^{m+2}=\dots=V^r ということ。

一方、このとき V^1(\lambda),V^2(\lambda),\dots,V^m(\lambda) はゼロ次元にならない。

なぜなら一般に、 \Delta V^{k}(\lambda) に含まれるベクトルに (A-\lambda I) をかけたベクトルは \Delta V^{k-1}(\lambda) に属すから、 T\bm x=(A-\lambda I)\bm x とすれば、

  T\big(\Delta V^{k}(\lambda)\big)\subset\Delta V^{k-1}(\lambda)

しかも k\ge 1 であれば \Delta V^{k}(\lambda) には1回かけてゼロになるベクトルは含まれないから、

  \dim T\big(\Delta V^{k}(\lambda)\big)=\dim \Delta V^{k}(\lambda)

つまり、

  \dim T\big(\Delta V^{k}(\lambda)\big)\le \dim\Delta V^{k-1}(\lambda)

このとき、 \Delta V^{k}(\lambda) の基底ベクトルに (A-\lambda I) をかけたものに、必要に応じていくつかベクトルを加えて \Delta V^{k-1}(\lambda) の基底を作れる。

つまり、全体空間は広義固有空間の直和に分解でき、

  U=W(\lambda)\dot +W(\lambda')\dot +\dots\dot +W(\lambda'')

それぞれの広義固有空間は次のような構造をしていることがわかった。

 &math( W(\lambda)=&\Delta V^m(\lambda)\dot + \underbrace{T\big(\Delta V^m(\lambda)\big)\dot +{\Delta V^{m-1}}^*(\lambda)} _{=\,\Delta V^{m-1}(\lambda)}\dot + \underbrace{T\big(\Delta V^{m-1}(\lambda)\big)\dot +{\Delta V^{m-2}}^*(\lambda)}_{=\,\Delta V^{m-2}(\lambda)}\dot + \dots\dot + \underbrace{T\big(\Delta V^2(\lambda)\big)\dot +{\Delta V^{1}}^*(\lambda)}_{=\,V(\lambda)}\\ =&\underbrace{{\Delta V^m}^*(\lambda)}_{=\,\Delta V^m(\lambda)}\dot +\\ &\underbrace{T\big({\Delta V^m}^*(\lambda)\big)\dot+{\Delta V^{m-1}}^*(\lambda)}_{=\,\Delta V^{m-1}(\lambda)}\dot +\\ &\underbrace{T^2\big({\Delta V^m}^*(\lambda)\big)\dot+T\big({\Delta V^{m-1}}^*(\lambda)\big)\dot+{\Delta V^{m-2}}^*(\lambda)}_{=\,\Delta V^{m-2}(\lambda)}\dot +\\ &\cdots\\ &\underbrace{T^{m-1}\big({\Delta V^m}^*(\lambda)\big)\dot+T^{m-2}\big({\Delta V^{m-1}}^*(\lambda)\big)\dot+\dots\dot+{\Delta V^{1}}^*(\lambda)}_{=\,\Delta V^{1}(\lambda)\,=\,V(\lambda)}\\ );

例1 3次元の広義固有空間、固有空間が1次元

 &math(A=\begin{pmatrix}

4 & -2 & 0 \\
-3 & 4 & -2 \\
-11 & 9 & -2 \\

\end{pmatrix}

);

まずは固有値を求める。

 &math(|A-\lambda I|= \begin{vmatrix}

4-\lambda & -2 & 0 \\
-3 & 4-\lambda & -2 \\
-11 & 9 & -2-\lambda \\

\end{vmatrix}= 8-12\lambda+6\lambda^2-\lambda^3=(2-\lambda)^3 );

  \lambda=2 (3重解)

したがって、広義固有空間 W(2) は3次元。

次に固有空間 V(2) を求める。

  (A-\lambda I)\bm x=\bm 0

 &math( \begin{pmatrix}

2 & -2 & 0 \\
-3 & 2 & -2 \\
-11 & 9 & -4 \\

\end{pmatrix}\sim \begin{pmatrix}

1 & -1 & 0 \\
0 & -1 & -2 \\
0 & -2 & -4 \\

\end{pmatrix}\sim \begin{pmatrix}

1 & 0 & 2 \\
0 & 1 & 2 \\
0 & 0 & 0 \\

\end{pmatrix} );

掃出せなかった z をパラメータとして、

 &math(\bm x=z\begin{pmatrix}

  • 2\\-2\\1 \end{pmatrix});

したがって、固有空間 V(2) は1次元。 基底として &math(\bm b_1=\begin{pmatrix}

  • 2\\-2\\1 \end{pmatrix}); を取れる。

広義固有空間が3次元で固有空間が1次元ということは、

 &math( \dim V(2)=1\ge\dim \Delta V^2(2)\ge\dim \Delta V^3(2)\ge\dim \Delta V^4(2)\ge\dots);

かつ、

 &math( \dim V(2)+\dim \Delta V^2(2)+\dim \Delta V^3(2)+\dim \Delta V^4(2)+\dots=\dim W(2)=3 );

であるから、

 &math(&\dim V(2)=\dim \Delta V^2(2)=\dim \Delta V^3(2)=1\\ &\dim\Delta V^4(2)=\dim\Delta V^5(2)=\dots=0);

となるはず。

\Delta V^2(2) を求めるため、 「 (A-\lambda I) をかけると V(2) に入るベクトル」を探す。

  (A-\lambda I)\bm x=s\bm b_1

の拡大係数行列を変形して、

 &math( \begin{pmatrix}

2 & -2 & 0 & -2\\
-3 & 2 & -2 & -2\\
-11 & 9 & -4 & 1\\

\end{pmatrix}\sim \begin{pmatrix}

1 & -1 & 0 & -1\\
0 & -1 & -2 & -5\\
0 & -2 & -4 & -10\\

\end{pmatrix}\sim \begin{pmatrix}

1 & 0 & 2 & 4\\
0 & 1 & 2 & 5\\
0 & 0 & 0 & 0\\

\end{pmatrix} );

より、

 &math( \begin{cases} x+2z=4s\\ y+2z=5s\\ 0=0 \end{cases} );

掃出せなかった z をパラメータとすれば、

 &math( \bm x=z\begin{pmatrix}

  • 2\\-2\\1 \end{pmatrix}+s\begin{pmatrix} 4\\5\\0 \end{pmatrix} );

第1項は V(2) のベクトルだから、 \Delta V^2(\lambda) は &math(\bm b_2=\begin{pmatrix} 4\\5\\0 \end{pmatrix}); を基底に持つ1次元空間。

次に \Delta V^3(\lambda) を求めるために「 (A-\lambda I) をかけると \Delta V^2(\lambda) に入るベクトル」を探す。

  (A-\lambda I)\bm x=s\bm b_2

の拡大係数行列を変形して、

 &math( \begin{pmatrix}

2 & -2 & 0 & 4\\
-3 & 2 & -2 & 5\\
-11 & 9 & -4 & 0\\

\end{pmatrix}\sim \begin{pmatrix}

1 & -1 & 0 & 2\\
0 & -1 & -2 & 11\\
0 & -2 & -4 & -22\\

\end{pmatrix}\sim \begin{pmatrix}

1 & 0 & 2 & -9\\
0 & 1 & 2 & -11\\
0 & 0 & 0 & 0\\

\end{pmatrix} );

掃出せなかった z をパラメータとすれば、

 &math( \bm x=z\begin{pmatrix}

  • 2\\-2\\1 \end{pmatrix}+s\begin{pmatrix}
  • 9\\-11\\0 \end{pmatrix} );

第1項は V(2) のベクトルだから、 \Delta V^3(\lambda) は &math(\bm b_3=\begin{pmatrix}

  • 9\\-11\\0 \end{pmatrix}); を基底に持つ1次元空間。

念のため、 \Delta V^4(\lambda) があるか調べるために 「 (A-\lambda I) をかけると \Delta V^3(\lambda) に入るベクトル」を探してみる。

 &math( \begin{pmatrix}

2 & -2 & 0 & -9\\
-3 & 2 & -2 & -11\\
-11 & 9 & -4 & 0\\

\end{pmatrix}\sim \begin{pmatrix}

2 & -2 & 0 & -9\\
-6 & 4 & -4 & -22\\
-22 & 18 & -8 & 0\\

\end{pmatrix}\sim \begin{pmatrix}

2 & -2 & 0 & -9 \\
0 & -2 & -4 & -49\\
0 & -4 & -8 & -99\\

\end{pmatrix}\sim \begin{pmatrix}

2 & -2 & 0 & -9 \\
0 & -2 & -4 & -49\\
0 & 0 & 0 & -1\\

\end{pmatrix} );

最後の行は 0=-1 を表し、これを満たすベクトルは存在しないから、 \Delta V^4(\lambda)=\set{\bm 0} である。

したがって、

 &math( W(\lambda)= \underbrace{ \underbrace{ \underbrace{V(\lambda)}_{[\bm b_1]}\,\dot+\, \underbrace{\Delta V^2(\lambda)}_{[\bm b_2]} }_{V^2(\lambda)} \,\dot+\, \underbrace{\Delta V^3(\lambda)}_{[\bm b_3]} }_{V^3(\lambda)} );

の構造を持っている。

ジョルダン標準形

上記の \bm b_1,\bm b_2,\bm b_3 に対して、

  (A-\lambda I)\bm b_1=\bm 0
  (A-\lambda I)\bm b_2=\bm b_1
  (A-\lambda I)\bm b_3=\bm b_2

であり、まとめて書けば、

 &math( (A-\lambda I)\Bigg(\bm p_1\ \bm p_2\ \bm p_3\Bigg) &=\Bigg(\,\bm 0\ \bm p_1\ \bm p_2\Bigg)\\ &=\underbrace{\Bigg(\bm p_1\ \bm p_2\ \bm p_3\Bigg)}_{=\,P} \begin{pmatrix} 0&1&0\\ 0&0&1\\ 0&0&0 \end{pmatrix} );

ここで \bm p_1,\bm p_2,\bm p_3 はそれぞれ V(\lambda),V^2(\lambda),V^3(\lambda) の元であるから一次独立であり、

 &math( P=\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg) );

は正則である。左から P^{-1} を掛けて、

 &math( P^{-1}(A-\lambda I)P =\begin{pmatrix} 0&1&0\\ 0&0&1\\ 0&0&0 \end{pmatrix} );

より、

 &math( P^{-1}AP=\begin{pmatrix} \lambda&1&0\\ 0&\lambda&1\\ 0&0&\lambda \end{pmatrix} );

を得る。この形は A のジョルダン標準形と呼ばれる。

  • 対角要素に固有値が並ぶ
  • すぐ右上に、対応するベクトルがどのベクトルへ移るかを示す 1 が並ぶ

例2 固有空間が2次元で非対称

 &math(A=\begin{pmatrix}

  • 9&8&-4\\
  • 15&13&-6\\
  • 5&4&-1 \end{pmatrix} );

とすると、

  |A-\lambda I|=1-3\lambda+3\lambda^2-\lambda^3=(1-\lambda)^3

(A-\lambda I)\bm x=\bm 0 は、 5x-4y+2z=0 を導き、 掃出せなかった y,z をパラメータで y=5s,z=5t と置けば、

 &math(\bm x=s\begin{pmatrix} 4\\5\\0 \end{pmatrix}+t\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix});

V(\lambda) は2次元で、 &math(\bm b_1=\begin{pmatrix} 4\\5\\0 \end{pmatrix},\bm b_2=\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix}); を基底に取れる。

\Delta V^2(\lambda) を求めるために、

&math((A-\lambda I)\bm x=s\begin{pmatrix} 4\\5\\0 \end{pmatrix}+t\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix});

と置けば、

 &math( \begin{pmatrix}

  • 10&8&-4&4&-2\\
  • 15&12&-6&5&0\\
  • 5&4&-2&0&5 \end{pmatrix}\sim \begin{pmatrix}
  • 5&4&-2&0&5\\ 0&0&0&4&-12\\ 0&0&0&5&-15\\ \end{pmatrix}\sim \begin{pmatrix}
  • 5&4&-2&0&5\\ 0&0&0&1&-3\\ 0&0&0&0&0\\ \end{pmatrix}\sim );

となって、&math( \begin{cases}

  • 5x+4y-2z=5t\\ 0=s-3t\\ \end{cases} ); を得る。

すなわち、

 &math( \bm x=s'\begin{pmatrix} 4\\5\\0 \end{pmatrix}+t'\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix}+t\begin{pmatrix}
  • 1\\0\\0 \end{pmatrix} );

に対して

 &math( (A-\lambda)\bm x= 3t\begin{pmatrix} 4\\5\\0 \end{pmatrix}+t\begin{pmatrix}

  • 2\\0\\5 \end{pmatrix} =t\begin{pmatrix} 10\\15\\5 \end{pmatrix} =5t\begin{pmatrix} 2\\3\\1 \end{pmatrix} );

つまり、

 &math(\bm b_2'=\begin{pmatrix} 2\\3\\1 \end{pmatrix});

 &math(\bm b_3=\begin{pmatrix}

  • 1\\0\\0 \end{pmatrix});

とすると、 (A-\lambda)\bm b_3=\bm b_2'

\bm b_1,\bm b_2' V(1) を張るから、 広義固有空間の構造は、

 &math( W(1)= \underbrace{ \underbrace{ \underbrace{V_1(1)}_{\bm b_1} \,\dot+\, \underbrace{V_2(1)}_{\bm b_2'} }_{V(1)} \,\dot+\, \underbrace{V_2^2(1)}_{\bm b_2} }_{V^2(1)} );

ジョルダン標準形

  P=\Big(\bm b_1\ \bm b_2'\ \bm b_3\Big)

に対して、

 &math(P^{-1}AP=\begin{pmatrix} \lambda&\\ &\lambda&1\\ &&\lambda \end{pmatrix} );

となる。

例3 固有空間が2次元で対称

 &math( A=\begin{pmatrix}

3 & 8 & 4 & -12 \\
6 & 5 & 4 & -12 \\
-6 & -1 & -5 & 6 \\
5 & 9 & 4 & -15 \\

\end{pmatrix} );

 &math( \begin{pmatrix} \lambda&1\\ &\lambda&\\ &&\lambda&1\\ &&&\lambda\\ \end{pmatrix} );

一般のジョルダン標準形

ジョルダン標準形の応用

ジョルダン標準形を見れば、その行列の広義固有空間がどのような構造になっているか一目瞭然となる。 その意味でジョルダン標準形は非常に重要であるが、応用的にも重要な意味を持つ。


Counter: 102020 (from 2010/06/03), today: 14, yesterday: 0