広義固有空間の構造とジョルダン標準形 のバックアップ差分(No.8)

更新


  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[線形代数I]]

* 概要 [#jcb5900a]

ジョルダン標準形とは、対角化できない行列を「準対角化」した形である。
この標準形は行列の固有空間の概念を拡張した、「広義固有空間」が持つ構造を反映した形となる。

ここは発展項目なので、線形代数IIの内容を先取りして使う。~
実のところ、線形代数IIでも扱わない内容なので、線形代数IIを学んでから戻ってきても良い。

* 固有空間とその次元 [#q8a7b352]

&math(n); 次正方行列 &math(A); の、固有値 &math(\lambda); に対する固有空間 &math(V(\lambda)); 
(固有ベクトルの集合が作る線形空間)とは、

 &math((A-\lambda I)\bm x=\bm 0);

の解が作る空間である。したがって、

 &math(V(\lambda)=\mathrm{Ker}\,(A-\lambda I));

と書くことができる。

&math(\lambda); の重複度と同数の一次独立な固有ベクトルを見つけられることが
&math(A); を対角化できる必要条件だった。
すべての固有値について、その重複度と同数の一次独立な固有ベクトルを見つけられることが
行列が対角化可能な条件だった。

これは固有空間の次元が重複度と等しいことと同値である。
(重複度を超えることはない)

 &math(\dim V(\lambda)=\dim\mathrm{Ker}\,(A-\lambda I)=r);

(&math(\lambda); の重複度を &math(r); とする)

* 広義固有空間 [#d119c641]

対角化できない場合には

 &math(\dim\mathrm{Ker}\,(A-\lambda I)<r);

となる固有値があるが、そのような場合にも必ず、

 &math(\dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r);

となることを以下のようにして示せる。すなわち、固有空間

 &math(V(\lambda)=\mathrm{Ker}\,(A-\lambda I));

に対して、「広義固有空間」を

 &math(W(\lambda)=\mathrm{Ker}\,\{(A-\lambda I)^r\});

と定義すれば、その次元はぴったり重複度と等しくなる。
と定義すれば、その次元は必ず重複度と等しくなる。

さらに、異なる固有値の広義固有空間は重ならないため、
全空間を広義固有空間の直和に分解できることになる。

** 広義固有空間の次元が重複度と等しくなることの証明 [#h3aa536c]

[[三角化可能定理>線形代数I/対角化(一般の場合)#m3c1a3d7]] の証明の手順において、
初めに &math(\lambda); を &math(r); 解選ぶと、左上から &math(r); 個の
&math(\lambda); が並び、その後、他の固有値が並ぶ形に三角化ができる。
初めに &math(\lambda); を &math(r); 回選ぶと、左上から &math(r); 個の
&math(\lambda); が並び、その後、他の固有値が並ぶ形に三角化する &math(P); の存在を示せる。

 &math(
&\hspace{4mm}\overbrace{\hspace{17mm}}^{r}\\
P^{-1}AP=&\begin{pmatrix}
\lambda & * & * & \dots & \dots&* \\
  & \ddots & * &\dots & \dots&* \\
  &  & \lambda & & & \vdots\\
  &  &  & \lambda'& &\vdots\\
  &  &  &  & \lambda''\\
  &  &  &  &  & \ddots\\
\end{pmatrix}
);

この &math(P); を用いて [[ケーリーハミルトンの定理>線形代数I/ケーリー・ハミルトンの定理]] 
の証明で行ったのと同じ操作を

 &math((A-\lambda I)^r);

に対して行えば、

 &math(
&(A-\lambda I)^r\\
&=PP^{-1}(A-\lambda I)PP^{-1}(A-\lambda I)PP^{-1}\dots(A-\lambda I)PP^{-1}\\
&=P(P^{-1}AP-\lambda I)(P^{-1}AP-\lambda I)\dots(P^{-1}AP-\lambda I)P^{-1}\\
&=P\begin{pmatrix}
0 & * & * & \dots & \dots&* \\
  & \ddots & * &\dots & \dots&* \\
  &  & 0 & & & \vdots\\
  &  &  & \lambda'-\lambda& &\vdots\\
  &  &  &  & \lambda''-\lambda\\
  &  &  &  &  & \ddots\\
\end{pmatrix}^{\displaystyle r}
P^{-1}\\
&=P\begin{pmatrix}
0 & 0 & 0 & \dots & \dots&* \\
  & \ddots & 0 &\dots & \dots&* \\
  &  & 0 & & & \vdots\\
  &  &  & (\lambda'-\lambda)^r& &\vdots\\
  &  &  &  & (\lambda''-\lambda)^r\\
  &  &  &  &  & \ddots\\
\end{pmatrix}
P^{-1}\\
&\hspace{12mm}\underbrace{\hspace{17mm}}_{r}\\
);

となって、&math((A-\lambda I)^r); の階数が &math(n-r); となることが分かる。
正則行列(&math(P); や &math(P^{-1});)とのかけ算で行列の階数は変化しないため、
&math((A-\lambda I)^r); の階数が &math(n-r); となることが分かる。

階数は対象の行列に対して掃出し操作の行える階数。
対応する連立方程式の一般解には掃出しの行えなかった列の数だけパラメータが残るから、
&math((A-\lambda I)^r\bm x=\bm 0); を解けば &math(r); 個のパラメータが残り、
行列の階数はその行列に対して掃出し操作の行える回数と等しい。

一方、&math((A-\lambda I)^r\bm x=\bm 0); を解けば、掃出せなかった列の数だけパラメータが残るから、
その個数は &math(n-\rank\{(A-\lambda I)^r\}=r); であり、

 &math(\dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r);

となることが証明できた。

* 広義固有空間の構造 [#lc6fbe8f]

広義固有空間のベクトルは、
定義の通り、広義固有空間に含まれるベクトルは、

 &math(\underbrace{(A-\lambda I)(A-\lambda I)\dots(A-\lambda I)}_{r回}\bm x=\bm 0);

を満たす。

そこでこの空間を、
「何回 &math((A-\lambda I)); をかけたらゼロになるか」で分類する。
それらの集合は部分空間となるから、
これらの集合は部分空間となるから、

- 0回でゼロになる空間は &math(V^0(\lambda)=\set{\bm 0});
- 1回でゼロになるのが通常の固有空間 &math(V(\lambda));
- 2回かけたらゼロになる空間 &math(V^2(\lambda));
- 3回かけたらゼロになる空間 &math(V^3(\lambda));
- …
- &math(r);回かけたらゼロになる空間 &math(V^r(\lambda)=W(\lambda));

とすると、以下が成り立つ。

&math(k+1); 回かけたらゼロになるベクトルに &math((A-\lambda I));
を1回かけると &math(k); 回かけたらゼロになるベクトルになるので、

 &math(\bm x\in V^k(\lambda)\to(A-\lambda I)\bm x\in V^{k-1}(\lambda));

&math(k); 回かけたらゼロになるベクトルは &math(k+1);
回かけたらゼロになるベクトルでもあるので、

 &math(
\underbrace{V^0(\lambda)}_{=\,\set{\bm 0}}\subset \underbrace{V^1(\lambda)}_{=\,V(\lambda)}\subset V^2(\lambda)\dots\subset \underbrace{V^r(\lambda)}_{=\,W(\lambda)}
);

&math(V^k(\lambda)); から &math(V^{k+1}(\lambda)); へと、
増えた分の空間を &math(\Delta V^k(\lambda)); と書こう。つまり、
&math(V^{k-1}(\lambda)); から &math(V^{k}(\lambda)); へと、
増えた分の空間を &math(\Delta V^{k}(\lambda)); と書こう。つまり、

 &math(V^{k+1}(\lambda) =V^k(\lambda)\dot +\Delta V^{k+1}(\lambda));
 &math(V^{k}(\lambda) =V^{k-1}(\lambda)\dot +\Delta V^{k}(\lambda));

とする。(&math(\Delta V^{k+1}(\lambda)=\set{\bm 0}); の場合もある)
&math(k-1); 回ではゼロにならないが、&math(k); 
回で初めてゼロになるベクトル(とゼロベクトル)の集合が 
&math(\Delta V^{k}(\lambda)); である。
(&math(\Delta V^{k}(\lambda)=\set{\bm 0}); の場合もある)

すると、&math(W(\lambda)); は &math(\Delta V^k(\lambda));
の直和で書けて、

 &math(
W(\lambda)=
\underbrace{V^0(\lambda)}_{=\,\set{\bm 0}}
\,\dot+\,\underbrace{\Delta V(\lambda)}_{=\,V(\lambda)}
\,\dot+\,\Delta V^2(\lambda)
\,\dot+\, \dots \,\dot+\, \Delta V^m(\lambda)
\,\dot+\, \underbrace{\Delta V^{m+1}(\lambda)
\,\dot+\, \dots \,\dot+\, \Delta V^r(\lambda)}_{\set{\bm 0}}
);

一般に、&math(m\le r); に対して &math(k>m); の 
&math(\Delta V^k(\lambda)); は空集合になる。
&math(\Delta V^k(\lambda)); はゼロ次元 {0} になる。
これは m 回かけたらすべてゼロになってしまうため、
&math(V^m=V^{m+1}=V^{m+2}=\dots=V^r); ということ。

固有空間 &math(V(\lambda)); の次元が1よりも大きいときには
その内部を 
一方、このとき &math(V^1(\lambda),V^2(\lambda),\dots,V^m(\lambda)); はゼロ次元にならない。

 &math(V(\lambda)=V_1(\lambda)\,\dot+\,V_2(\lambda)\,\dot+\,\dots); 
なぜなら一般に、&math(\Delta V^{k}(\lambda)); に含まれるベクトルに &math((A-\lambda I)); 
をかけたベクトルは 
&math(\Delta V^{k-1}(\lambda)); に属すから、&math(T\bm x=(A-\lambda I)\bm x); とすれば、

のように1次元の空間に分解して、それぞれに対して 
&math(\Delta V^{k}_{1}(\lambda)); などを求めれば、
&math(W(\lambda)); をすべて1次元の &math(\Delta V^k_{l}(\lambda)); 
の直和に分けられる。(証明略)
 &math(T\big(\Delta V^{k}(\lambda)\big)\subset\Delta V^{k-1}(\lambda));

しかも &math(k\ge 1); であれば &math(\Delta V^{k}(\lambda)); 
には1回かけてゼロになるベクトルは含まれないから、

 &math(\dim T\big(\Delta V^{k}(\lambda)\big)=\dim \Delta V^{k}(\lambda));

つまり、

 &math(\dim T\big(\Delta V^{k}(\lambda)\big)\le \dim\Delta V^{k-1}(\lambda));

このとき、&math(\Delta V^{k}(\lambda)); の基底ベクトルに &math((A-\lambda I)); 
をかけたものに、必要に応じていくつかベクトルを加えて &math(\Delta V^{k-1}(\lambda)); 
の基底を作れる。

つまり、全体空間は広義固有空間の直和に分解でき、

 &math(U=W(\lambda)\dot +W(\lambda')\dot +\dots\dot +W(\lambda''));

それぞれの広義固有空間は次のような構造をしていることがわかった。

 &math(
W(\lambda)=&\Delta V^m(\lambda)\dot +
\underbrace{T\big(\Delta V^m(\lambda)\big)\dot +{\Delta V^{m-1}}^*(\lambda)}
_{=\,\Delta V^{m-1}(\lambda)}\dot +
\underbrace{T\big(\Delta V^{m-1}(\lambda)\big)\dot +{\Delta V^{m-2}}^*(\lambda)}_{=\,\Delta V^{m-2}(\lambda)}\dot +
\dots\dot +
\underbrace{T\big(\Delta V^2(\lambda)\big)\dot +{\Delta V^{1}}^*(\lambda)}_{=\,V(\lambda)}\\
=&\underbrace{{\Delta V^m}^*(\lambda)}_{=\,\Delta V^m(\lambda)}\dot +\\
&\underbrace{T\big({\Delta V^m}^*(\lambda)\big)\dot+{\Delta V^{m-1}}^*(\lambda)}_{=\,\Delta V^{m-1}(\lambda)}\dot +\\
&\underbrace{T^2\big({\Delta V^m}^*(\lambda)\big)\dot+T\big({\Delta V^{m-1}}^*(\lambda)\big)\dot+{\Delta V^{m-2}}^*(\lambda)}_{=\,\Delta V^{m-2}(\lambda)}\dot +\\
&\cdots\\
&\underbrace{T^{m-1}\big({\Delta V^m}^*(\lambda)\big)\dot+T^{m-2}\big({\Delta V^{m-1}}^*(\lambda)\big)\dot+\dots\dot+{\Delta V^{1}}^*(\lambda)}_{=\,\Delta V^{1}(\lambda)\,=\,V(\lambda)}\\
);

* 例1 固有空間は1次元 [#u32b1a19]

 &math(A=\begin{pmatrix}
 4 & -2 & 0 \\
 -3 & 4 & -2 \\
 -11 & 9 & -2 \\
\end{pmatrix}

);

 &math(|A-\lambda I|=
\begin{vmatrix}
 4-\lambda & -2 & 0 \\
 -3 & 4-\lambda & -2 \\
 -11 & 9 & -2-\lambda \\
\end{vmatrix}=
8-12\lambda+6\lambda^2-\lambda^3=(2-\lambda)^3
);

 &math(\lambda=2);  (3重解)

 &math((A-\lambda I)\bm x=\bm 0);

 &math(
\begin{pmatrix}
 2 & -2 & 0 \\
 -3 & 2 & -2 \\
 -11 & 9 & -4 \\
\end{pmatrix}\sim
\begin{pmatrix}
 1 & -1 & 0 \\
 0 & -1 & -2 \\
 0 & -2 & -4 \\
\end{pmatrix}\sim
\begin{pmatrix}
 1 & 0 & 2 \\
 0 & 1 & 2 \\
 0 & 0 & 0 \\
\end{pmatrix}
);

掃出せなかった &math(z); をパラメータとして、

 &math(\bm x=z\begin{pmatrix}
-2\\-2\\1
\end{pmatrix});

3重解なのに &math(\dim V(2)=1); だ。
基底として &math(\bm b_1=\begin{pmatrix}
-2\\-2\\1
\end{pmatrix}); を取れる。

&math(\Delta V^2(2)); を求めるために &math((A-\lambda I)); をかけると &math(\Delta V(\lambda)); に入るベクトルを探す。

 &math((A-\lambda I)\bm x=s\bm b_1);

の拡大係数行列を変形して、

 &math(
\begin{pmatrix}
 2 & -2 & 0 & -2\\
 -3 & 2 & -2 & -2\\
 -11 & 9 & -4 & 1\\
\end{pmatrix}\sim
\begin{pmatrix}
 1 & -1 & 0 & -1\\
 0 & -1 & -2 & -5\\
 0 & -2 & -4 & -10\\
\end{pmatrix}\sim
\begin{pmatrix}
 1 & 0 & 2 & 4\\
 0 & 1 & 2 & 5\\
 0 & 0 & 0 & 0\\
\end{pmatrix}
);

より、

 &math(
\begin{cases}
x+2z=4s\\
y+2z=5s\\
0=0
\end{cases}
);

掃出せなかった &math(z); をパラメータとすれば、

 &math(
\bm x=z\begin{pmatrix}
-2\\-2\\1
\end{pmatrix}+s\begin{pmatrix}
4\\5\\0
\end{pmatrix}
);

&math(\Delta V^2(\lambda)); は 
&math(\bm b_2=\begin{pmatrix}
4\\5\\0
\end{pmatrix}); 
を基底に持つ1次元空間。

次に &math(\Delta V^3(\lambda)); を求めるために、 &math((A-\lambda I)); をかけると &math(\Delta V^2(\lambda)); に入るベクトルを探す。

 &math((A-\lambda I)\bm x=s\bm b_2);

の拡大係数行列を変形して、

 &math(
\begin{pmatrix}
 2 & -2 & 0 & 4\\
 -3 & 2 & -2 & 5\\
 -11 & 9 & -4 & 0\\
\end{pmatrix}\sim
\begin{pmatrix}
 1 & -1 & 0 & 2\\
 0 & -1 & -2 & 11\\
 0 & -2 & -4 & -22\\
\end{pmatrix}\sim
\begin{pmatrix}
 1 & 0 & 2 & -9\\
 0 & 1 & 2 & -11\\
 0 & 0 & 0 & 0\\
\end{pmatrix}
);

掃出せなかった &math(z); をパラメータとすれば、

 &math(
\bm x=z\begin{pmatrix}
-2\\-2\\1
\end{pmatrix}+s\begin{pmatrix}
-9\\-11\\0
\end{pmatrix}
);

&math(\Delta V^3(\lambda)); は 
&math(\bm b_3=\begin{pmatrix}
-9\\-11\\0
\end{pmatrix}); 
を基底に持つ1次元空間。

&math(\Delta V^4(\lambda)); があるか調べるために、
&math((A-\lambda I)); をかけると &math(\Delta V^3(\lambda)); に入るベクトルを探してみる。

 &math(
\begin{pmatrix}
 2 & -2 & 0 & -9\\
 -3 & 2 & -2 & -11\\
 -11 & 9 & -4 & 0\\
\end{pmatrix}\sim
\begin{pmatrix}
 2 & -2 & 0 & -9\\
 -6 & 4 & -4 & -22\\
 -22 & 18 & -8 & 0\\
\end{pmatrix}\sim
\begin{pmatrix}
 2 & -2 & 0 & -9 \\
 0 & -2 & -4 & -49\\
 0 & -4 & -8 & -99\\
\end{pmatrix}\sim
\begin{pmatrix}
 2 & -2 & 0 & -9 \\
 0 & -2 & -4 & -49\\
 0 & 0 & 0 & -1\\
\end{pmatrix}
);

最後の行は &math(0=-1); を表し、これを満たすベクトルは存在しないから、
&math(\Delta V^4(\lambda)=\set{\bm 0}); である。

したがって、

 &math(
W(\lambda)=
\underbrace{
\underbrace{
\underbrace{V(\lambda)}_{[\bm b_1]}\,\dot+\,
\underbrace{\Delta V^2(\lambda)}_{[\bm b_2]}
}_{V^2(\lambda)}
\,\dot+\,
\underbrace{\Delta V^3(\lambda)}_{[\bm b_3]}
}_{V^3(\lambda)}
); 

の構造を持っている。

** ジョルダン標準形 [#h8ebcea2]

上記の &math(\bm b_1,\bm b_2,\bm b_3); に対して、

 &math((A-\lambda I)\bm b_1=\bm 0); つまり &math(A\bm b_1=\lambda\bm b_1);

 &math((A-\lambda I)\bm b_2=\bm b_1); つまり &math(A\bm b_2=\lambda\bm b_2+\bm b_1);

 &math((A-\lambda I)\bm b_3=\bm b_2); つまり &math(A\bm b_3=\lambda\bm b_3+\bm b_2);

だから、

 &math(
P=\Big(\bm b_1\ \bm b_2\ \bm b_3\Big)
);

に対して、

 &math(
P^{-1}AP
&=P^{-1}A\Big(\bm b_1\ \bm b_2\ \bm b_3\Big)\\
&=P^{-1}\Big(A\bm b_1\ A\bm b_2\ A\bm b_3\Big)\\
&=P^{-1}\Big(\lambda\bm b_1\ \lambda\bm b_2+\bm b_1\ \lambda\bm b_3+\bm b_2\Big)\\
&=P^{-1}\underbrace{\Big(\bm b_1\ \bm b_2\ \bm b_3\Big)}_{P}\begin{pmatrix}
\lambda&1&\\
&\lambda&1\\
&&\lambda
\end{pmatrix}=
\begin{pmatrix}
\lambda&1&\\
&\lambda&1\\
&&\lambda
\end{pmatrix}\\
);

を得る。この形は &math(A); のジョルダン標準形と呼ばれる。

- 対角要素に固有値が並ぶ
- すぐ右上に、対応するベクトルがどのベクトルへ移るかを示す 1 が並ぶ

* 例2 固有空間が2次元で非対称 [#x6301dc2]

 &math(A=\begin{pmatrix}
-9&8&-4\\
-15&13&-6\\
-5&4&-1
\end{pmatrix}
);

とすると、

 &math(|A-\lambda I|=1-3\lambda+3\lambda^2-\lambda^3=(1-\lambda)^3);

&math((A-\lambda I)\bm x=\bm 0); は、
&math(5x-4y+2z=0); を導き、
掃出せなかった &math(y,z); 
をパラメータで &math(y=5s,z=5t); と置けば、

 &math(\bm x=s\begin{pmatrix}
4\\5\\0
\end{pmatrix}+t\begin{pmatrix}
-2\\0\\5
\end{pmatrix});

&math(V(\lambda)); は2次元で、
&math(\bm b_1=\begin{pmatrix}
4\\5\\0
\end{pmatrix},\bm b_2=\begin{pmatrix}
-2\\0\\5
\end{pmatrix}); を基底に取れる。

&math(\Delta V^2(\lambda)); を求めるために、

&math((A-\lambda I)\bm x=s\begin{pmatrix}
4\\5\\0
\end{pmatrix}+t\begin{pmatrix}
-2\\0\\5
\end{pmatrix});

と置けば、

 &math(
\begin{pmatrix}
-10&8&-4&4&-2\\
-15&12&-6&5&0\\
-5&4&-2&0&5
\end{pmatrix}\sim
\begin{pmatrix}
-5&4&-2&0&5\\
0&0&0&4&-12\\
0&0&0&5&-15\\
\end{pmatrix}\sim
\begin{pmatrix}
-5&4&-2&0&5\\
0&0&0&1&-3\\
0&0&0&0&0\\
\end{pmatrix}\sim
);

となって、&math(
\begin{cases}
-5x+4y-2z=5t\\
0=s-3t\\
\end{cases}
); を得る。

すなわち、

 &math(
\bm x=s'\begin{pmatrix}
4\\5\\0
\end{pmatrix}+t'\begin{pmatrix}
-2\\0\\5
\end{pmatrix}+t\begin{pmatrix}
-1\\0\\0
\end{pmatrix}
);

に対して

 &math(
(A-\lambda)\bm x=
3t\begin{pmatrix}
4\\5\\0
\end{pmatrix}+t\begin{pmatrix}
-2\\0\\5
\end{pmatrix}
=t\begin{pmatrix}
10\\15\\5
\end{pmatrix}
=5t\begin{pmatrix}
2\\3\\1
\end{pmatrix}
);

つまり、

 &math(\bm b_2'=\begin{pmatrix}
2\\3\\1
\end{pmatrix});

 &math(\bm b_3=\begin{pmatrix}
-1\\0\\0
\end{pmatrix});

とすると、&math((A-\lambda)\bm b_3=\bm b_2');

&math(\bm b_1,\bm b_2'); も &math(V(1)); を張るから、
広義固有空間の構造は、

 &math(
W(1)=
\underbrace{
\underbrace{
\underbrace{V_1(1)}_{\bm b_1}
\,\dot+\,
\underbrace{V_2(1)}_{\bm b_2'}
}_{V(1)}
\,\dot+\,
\underbrace{V_2^2(1)}_{\bm b_2}
}_{V^2(1)}
);

** ジョルダン標準形 [#r201ca8f]

 &math(P=\Big(\bm b_1\ \bm b_2'\ \bm b_3\Big));

に対して、

 &math(P^{-1}AP=\begin{pmatrix}
\lambda&\\
&\lambda&1\\
&&\lambda
\end{pmatrix}
);

となる。

* 例3 固有空間が2次元で対称 [#gedf2577]

 &math(
A=\begin{pmatrix}
 3 & 8 & 4 & -12 \\
 6 & 5 & 4 & -12 \\
 -6 & -1 & -5 & 6 \\
 5 & 9 & 4 & -15 \\
\end{pmatrix}
);

 &math(
\begin{pmatrix}
\lambda&1\\
&\lambda&\\
&&\lambda&1\\
&&&\lambda\\
\end{pmatrix}
);

* 一般のジョルダン標準形 [#k62cc044]

* ジョルダン標準形の応用 [#ff462da9]

ジョルダン標準形を見れば、その行列の広義固有空間がどのような構造になっているか一目瞭然となる。
その意味でジョルダン標準形は非常に重要であるが、応用的にも重要な意味を持つ。


Counter: 101584 (from 2010/06/03), today: 3, yesterday: 0