広義固有空間の構造とジョルダン標準形 のバックアップ差分(No.18)

更新


  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[線形代数I]]

* 概要 [#jcb5900a]

&katex();
&color(red){&size(33){現在推敲中で未完成です};};

ジョルダン標準形とは、対角化できない行列を「準対角化」した形である(対角化可能な行列のジョルダン標準形は対角化した形そのものである)。

この標準形は行列の「固有空間」の概念を拡張した、「広義固有空間」が持つ構造を反映した形となる。

ここは発展項目なので、線形代数IIの内容を先取りして使う。~
実のところ、線形代数IIでも扱わない内容なので、線形代数IIを学んでから戻ってきても良い。

** 目次 [#y4ce8fd1]

#contents();

* 固有空間とその次元 [#q8a7b352]

&math(A); を &math(n); 次正方行列とし、その固有値 &math(\lambda); に対する固有空間(固有ベクトルの集合が作る線形空間)を &math(V(\lambda)); と書くことにする。
$A$ を $n$ 次正方行列とし、その固有値 $\lambda$ に対する固有空間(固有ベクトルの集合が作る線形空間)を $V(\lambda)$ と書くことにする。$x\in V(\lambda)$ は、

&math(x\in V(\lambda); は、
$$A\bm x=\lambda \bm x$$

 &math(A\bm x=\lambda \bm x);
を満たすから、すなわち $V(\lambda)$ は

を満たすから、すなわち &math(V(\lambda)); は
$$(A-\lambda I)\bm x=\bm 0$$

 &math((A-\lambda I)\bm x=\bm 0);

の解が作る空間と言える。これを、

 &math(V(\lambda)=\mathrm{Ker}\,(A-\lambda I));
$$V(\lambda)=\mathrm{Ker}\,(A-\lambda I)$$

とも書けることが以下で重要になってくる。~
ここで &math(\mathrm{Ker}); は線形写像の核を表す → [[線形代数II/線形写像・像・核・階数#naf8d1e7]]
と書けることが以下で重要になってくる。~
ここで $\mathrm{Ker}$ は線形写像の核を表す → [[線形代数II/線形写像・像・核・階数#naf8d1e7]]

** 対角化可能な場合 [#e4352329]

すべての固有値について、その重複度と同数の一次独立な固有ベクトルを見つけられることが
行列が対角化可能な条件だった。

これは固有空間の次元が重複度と等しいことと同値である。~
(重複度を超えることはない → [[線形代数I/固有値と固有ベクトル#k2bcc540]])

式で書けば、

 &math(\dim V(\lambda)=\dim\mathrm{Ker}\,(A-\lambda I)=r);
$$\dim V(\lambda)=\dim\mathrm{Ker}\,(A-\lambda I)=r$$

(&math(\lambda); の重複度を &math(r); とする)
($\lambda$ の重複度を $r$ とする)

すべての固有値に対する重複度を加えると &math(n); となるから、
すべての固有値に対する重複度を加えると $n$ となるから、
このとき、全空間を固有空間の直和に分解できることになる。

 &math(\sum_{k}\dim V(\lambda_k)=n);
$$\sum_{k}\dim V(\lambda_k)=n$$

* 広義固有空間 [#d119c641]

対角化できない場合には

 &math(\dim\mathrm{Ker}\,(A-\lambda I)<r);
$$\dim\mathrm{Ker}\,(A-\lambda I)<r$$

となる固有値があるが、そのような場合にも必ず、

 &math(\dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r);
$$\dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r$$

となることを以下のようにして示せる。すなわち、固有空間

 &math(V(\lambda)=\mathrm{Ker}\,(A-\lambda I));
$$V(\lambda)=\mathrm{Ker}\,(A-\lambda I)$$

に対して、「広義固有空間」を

 &math(W(\lambda)=\mathrm{Ker}\,\{(A-\lambda I)^r\});
$$W(\lambda)=\mathrm{Ker}\,\{(A-\lambda I)^r\}$$

と定義すれば、その次元は必ず重複度と等しくなる。

すべての固有値の重複度の和は全空間の次元に等しく、
さらに、異なる固有値の広義固有空間はゼロ以外で重ならないため、
「全空間を&ruby(・・){広義};固有空間の[[直和>線形代数II/射影・直和・直交直和#u527a7fd]]に分解できる」ことになる。

まとめると、
- 任意の行列 ↔ 全空間を&ruby(・・){広義};固有空間の直和に分解可能
- 対角化可能な行列 ↔ 全空間を固有空間の直和に分解可能~
(広義固有空間が固有空間と等しくなる、ということ)
** 広義固有空間の次元が重複度と等しくなることの証明 [#h3aa536c]

[[三角化可能定理>線形代数I/対角化(一般の場合)#m3c1a3d7]] の証明の手順において、
初めに &math(\lambda); を &math(r); 回選ぶと、左上から &math(r); 個の
&math(\lambda); が並び、その後、他の固有値が並ぶ形に三角化する &math(P); の存在を示せる。
初めに $\lambda$ を $r$ 回選ぶと、左上から $r$ 個の
$\lambda$ が並び、その後、他の固有値が並ぶ形に三角化する $P$ の存在を示せる。

$$
\begin{aligned}
&\hspace{4mm}\overbrace{\hspace{17mm}}^{r}\\
P^{-1}AP=&\begin{pmatrix}
\lambda & * & * & \dots & \dots&* \\
& \ddots & * &\dots & \dots&* \\
&  & \lambda & & & \vdots\\
&  &  & \lambda'& &\vdots\\
&  &  &  & \lambda''\\
&  &  &  &  & \ddots\\
\end{pmatrix}
\end{aligned}
$$

この &math(P); を用いて [[ケーリーハミルトンの定理>線形代数I/ケーリー・ハミルトンの定理]] 
この $P$ を用いて [[ケーリーハミルトンの定理>線形代数I/ケーリー・ハミルトンの定理]] 
の証明で行ったのと同じ操作を

 &math((A-\lambda I)^r);
$$(A-\lambda I)^r$$

に対して行えば、

 &math(
&(A-\lambda I)^r\\
&=PP^{-1}(A-\lambda I)PP^{-1}(A-\lambda I)PP^{-1}\dots(A-\lambda I)PP^{-1}\\
&=P(P^{-1}AP-\lambda I)(P^{-1}AP-\lambda I)\dots(P^{-1}AP-\lambda I)P^{-1}\\
&=P\begin{pmatrix}
0 & * & * & \dots & \dots&* \\
  & \ddots & * &\dots & \dots&* \\
  &  & 0 & & & \vdots\\
  &  &  & \lambda'-\lambda& &\vdots\\
  &  &  &  & \lambda''-\lambda\\
  &  &  &  &  & \ddots\\
\end{pmatrix}^{\displaystyle r}
P^{-1}\\
&=P\begin{pmatrix}
0 & 0 & 0 & \dots & \dots&* \\
  & \ddots & 0 &\dots & \dots&* \\
  &  & 0 & & & \vdots\\
  &  &  & (\lambda'-\lambda)^r& &\vdots\\
  &  &  &  & (\lambda''-\lambda)^r\\
  &  &  &  &  & \ddots\\
\end{pmatrix}
P^{-1}\\
&\hspace{12mm}\underbrace{\hspace{17mm}}_{r}\\
);

この形から中央の行列の階数は &math(n-r);、カーネルは &math(r); 次元である事が分かる。
この形から中央の行列の階数は $n-r$、カーネルは $r$ 次元である事が分かる。

階数やカーネルの次元は正則行列(&math(P); や &math(P^{-1});)とのかけ算で変化しないから、
&math((A-\lambda I)^r); についても階数は &math(n-r); であり、カーネルは &math(r); 
階数やカーネルの次元は正則行列($P$ や $P^{-1}$)とのかけ算で変化しないから、
$(A-\lambda I)^r$ についても階数は $n-r$ であり、カーネルは $r$ 
次元であることが分かる。

 &math(\dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r);
$$\dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r$$

** 異なる固有値の広義固有空間がゼロ以外で重ならないことの証明 [#l82d9c24]

一方、&math(\bm x\in\mathrm{Ker}\,\{(A-\lambda I)^r\}); ただし &math(\bm x\ne\bm 0); とすれば、
上記の形から &math(P^{-1}\bm x); は &math(r+1); 要素目以降がすべてゼロとなるようなベクトルである。
そして、&math(P^{-1}); は正則であるため &math(r); 要素目よりも前にゼロでない要素が存在する。
一方、$\bm x\in\mathrm{Ker}\,\{(A-\lambda I)^r\}$ ただし $\bm x\ne\bm 0$ とすれば、
上記の形から $P^{-1}\bm x$ は $r+1$ 要素目以降がすべてゼロとなるようなベクトルである。
そして、$P^{-1}$ は正則であるため $r$ 要素目よりも前にゼロでない要素が存在する。

 &math(
$$
P^{-1}\bm x=\begin{pmatrix}*\\\vdots\\\ast\\0\\\vdots\\0
\end{pmatrix}
\begin{array}{l}
\Bigg\}\ r個(ゼロでないものを含む)
\\[10mm]\Bigg\}\ (n-r)個
\Bigg\}\ r\,\text{個(ゼロでないものを含む)}
\\[10mm]\Bigg\}\ (n-r)\text{個}
\end{array}
);
$$

&math((A-\lambda'I)^{r'}); に対して上と同様の計算を行うと、
$(A-\lambda'I)^{r'}$ に対して上と同様の計算を行うと、

 &math(
&(A-\lambda' I)^{r'}\\
&=P\begin{pmatrix}
\lambda-\lambda' & * & * & \dots & \dots&* \\
  & \ddots & * &\dots & \dots&* \\
  &  & \lambda-\lambda' & & & \vdots\\
  &  &  & 0& &\vdots\\
  &  &  &  & \lambda''-\lambda\\
  &  &  &  &  & \ddots\\
\end{pmatrix}^{\displaystyle r'}
P^{-1}\\
&=P\begin{pmatrix}
(\lambda-\lambda')^{r'} & * & * & \dots & \dots&* \\
  & \ddots & * &\dots & \dots&* \\
  &  & (\lambda-\lambda')^{r'} & & & \vdots\\
  &  &  & 0& &\vdots\\
  &  &  &  & (\lambda''-\lambda')^{r'}\\
  &  &  &  &  & \ddots\\
\end{pmatrix}
P^{-1}\\
&\hspace{12mm}\underbrace{\hspace{45mm}}_{r}\\
);

のように &math(r); 列目までの対角要素には &math((\lambda-\lambda')^{r'}); が並び、
&math(P^{-1}\bm x); との積はゼロにならないことが分かる。
これは異なる固有値の広義固有空間が &math(\bm 0); 以外で重ならないことを示す。
のように $r$ 列目までの対角要素には $(\lambda-\lambda')^{r'}$ が並び、
$P^{-1}\bm x$ との積はゼロにならないことが分かる。
これは異なる固有値の広義固有空間が $\bm 0$ 以外で重ならないことを示す。

* 広義固有空間の構造 [#lc6fbe8f]

定義の通り、広義固有空間に含まれるベクトルは、
定義の通り、広義固有空間に含まれるベクトルは $(A-\lambda I)$ を $r$ 回かけるとゼロになる。

 &math(\underbrace{(A-\lambda I)(A-\lambda I)\dots(A-\lambda I)}_{r回}\bm x=\bm 0);
$$
\underbrace{(A-\lambda I)(A-\lambda I)\dots(A-\lambda I)}_{r\text{回}}\bm x=\bm 0
$$

を満たす。
とはいえ必ず $r$ 回かけないとゼロにならないかといえばそうとは限らない。
$r$ 回かける前にゼロになってしまえばその後何回かけてもゼロだからだ。

そこでこの空間を、
「何回 &math((A-\lambda I)); をかけたらゼロになるか」で分類すると、
それらの集合は部分空間となる。
$$
\underbrace{(A-\lambda I)\dots(A-\lambda I) \overbrace{(A-\lambda I)\dots(A-\lambda I)}^{\text{途中まででゼロになるかも}}}_{\text{全部で}\,r\,\text{回}}\bm x=\bm 0
$$

- 0回でゼロになる空間は &math(V^0(\lambda)=\set{\bm 0});
- 1回でゼロになるのが通常の固有空間 &math(V(\lambda)=\mathrm{Ker}\,(A-\lambda I));
- 2回かけたらゼロになる空間 &math(V^2(\lambda)=\mathrm{Ker}\,(A-\lambda I)^2);
- 3回かけたらゼロになる空間 &math(V^3(\lambda)=\mathrm{Ker}\,(A-\lambda I)^3);
そこで広義固有空間に含まれるベクトルを「 $(A-\lambda I)$ を何回かけたらゼロになるか」で分類するとそれらは部分空間を作る。

- 0回かけたらゼロになる空間は $V^0(\lambda)=\mathrm{Ker}\,(A-\lambda I)^0=\mathrm{Ker}\,E=\{\bm 0\}$ ~
 ↑ これは ゼロ次元空間である
- 1回かけたらゼロになるのが通常の固有空間 $V^1(\lambda)=V(\lambda)=\mathrm{Ker}\,(A-\lambda I)$
- 2回かけたらゼロになる空間 $V^2(\lambda)=\mathrm{Ker}\,(A-\lambda I)^2$
- 3回かけたらゼロになる空間 $V^3(\lambda)=\mathrm{Ker}\,(A-\lambda I)^3$
- …
- &math(r);回かけたらゼロになる空間 &math(V^r(\lambda)=\mathrm{Ker}\,(A-\lambda I)^r=W(\lambda));
- $r$回かけたらゼロになる空間 $V^r(\lambda)=\mathrm{Ker}\,(A-\lambda I)^r=W(\lambda)$~
 ↑ 広義固有空間そのものになる

&math(k); 回かけたらゼロになるベクトルは &math(k+1);
回かけたらゼロになるベクトルでもあるので、
$k$ 回かけたらゼロになるベクトルは $k+1$ 回かけたらゼロになるベクトルでもあるので、
これらの空間には

 &math(
\underbrace{V^0(\lambda)}_{=\,\set{\bm 0}}\subset \underbrace{V^1(\lambda)}_{=\,V(\lambda)}\subseteq V^2(\lambda)\subseteq\dots\subseteq \underbrace{V^r(\lambda)}_{=\,W(\lambda)}
);
$$
\underbrace{V^0(\lambda)}_{=\,\{\bm 0\}}\subsetneq \underbrace{V^1(\lambda)}_{=\,V(\lambda)}\subseteq V^2(\lambda)\subseteq\dots\subseteq \underbrace{V^r(\lambda)}_{=\,W(\lambda)}
$$

の関係がある。

とはいえ必ず &math(V^k(\lambda)); が &math(V^{k-1}(\lambda)); 
よりも大きいというわけではなく、&math(V^k(\lambda)=V^{k-1}(\lambda)); 
である可能性を否定しない。
とはいえ $V^{k-1}(\lambda)\subseteq V^k(\lambda)$ は必ずしも $V^k(\lambda)$ が $V^{k-1}(\lambda)$ よりも大きいと主張しているわけではなく、両者が等しい可能性もある。

&math(V^{k}(\lambda)); が &math(V^{k-1}(\lambda)); よりもどれだけ大きくなるかを考えるため、
$V^{k}(\lambda)$ が $V^{k-1}(\lambda)$ よりどれだけ大きいか考えるため、

 &math(\delta V_k=\dim V^k(\lambda)-\dim V^{k-1}(\lambda));
$$\delta V_k=\dim V^k(\lambda)-\dim V^{k-1}(\lambda)$$

と定義する。このとき任意の &math(k>0); に対して
を定義しよう。このとき任意の $k>0$ に対して

 &math(\delta V_k\ge\delta V_{k+1});
$$\delta V_k\ge\delta V_{k+1}$$

が成り立つことを次のように示せる。

定義から、&math(\delta V_{k+1}); は、&math(V_{k+1}(\lambda)); を

 &math(V_{k+1}(\lambda)=V_{k}(\lambda)\dot+\Delta V_{k+1}(\lambda));

のように直和分解したときの &math(\Delta V_{k+1}(\lambda)); の次元である。

 &math(\delta V_{k+1}=\dim\Delta V_{k+1}(\lambda));

すなわち、&math(k); 回ではゼロにならないが、&math(k+1); 回でゼロになる
ベクトル&ruby(・・){のみ};からなる線形空間 &math(\Delta V_{k+1}(\lambda)); から、
一次独立なベクトル(基底ベクトル)を &math(\delta V_{k+1}); 本見つけられる。

重要なのは、これらのベクトルに &math((A-\lambda I)); 
を1回かけて得たベクトルは、
&math(k-1); 回ではゼロにならないが、&math(k); 
回でゼロになるベクトルのみからなる &math(\delta V_{k+1}); 
次元空間を張る、という事実である。
回でゼロになるベクトルであり、なおかつ一次独立であるという事実である。

なぜなら、もしそれらの一次結合が &math(k-1); 
回以下でゼロになったり、&math(k); 回でゼロにならなかったとしたら、
それは &math(\Delta V_{k+1}(\lambda)); のベクトルの一次結合により
&math(k); 回以下でゼロになったり、&math(k); 
回でゼロにならないベクトルを作れたことになり、
&math(\Delta V_{k+1}(\lambda)); の定義に反するためだ。
$(A-\lambda I)$ の掛け算によって一次独立性が失われないことは以下のように背理法で示せる。

上記のベクトルで張られる &math(\delta V_{k+1}); 
次元空間の存在は、&math(\dim V^k(\lambda)); が 
&math(\dim V^{k-1}(\lambda)); より少なくとも &math(\delta V_{k+1}); 
だけ大きいことを示している。
すなわち &math(\delta V_k\ge \delta V_{k+1}); が示された。
$\Delta V_{k+1}(\lambda)$ の基底 $\{\bm b_i\}$ に $(A-\lambda I)$ を掛けたら一次従属になったとする。すなわち、

$$\sum_i c_i(A-\lambda I)\bm b_i=\bm 0$$

すると、

$$(A-\lambda I)\sum_i c_i\bm b_i=\bm 0$$

が得られるが、これは $\Delta V_{k+1}(\lambda)$ に含まれるベクトル $\sum_i c_i\bm b_i$ 
に1回 $(A-\lambda I)$ を掛けたらゼロになったことを表しており、
$k=0$ でない限り矛盾している。すなわち $k>0$ において、 
$\Delta V_{k+1}(\lambda)$ の基底 $\{\bm b_i\}$ に $(A-\lambda I)$ を掛けた
$\big\{(A-\lambda I)\bm b_i\big\}$ は一次独立である。

上記のベクトルが張る $\delta V_{k+1}$ 次元空間の存在は、
$\dim V^k(\lambda)$ が $\dim V^{k-1}(\lambda)$ より少なくとも 
$\delta V_{k+1}$ だけ大きいことを示している。
すなわち $\delta V_k\ge \delta V_{k+1}$ が示された。

ここまでで分かった関係を図示すると次のようになる。

 &math(
&\overbrace{V^0(\lambda)}^{\set{\bm 0}}\subseteq\overbrace{V^1(\lambda)}^{V(\lambda)}\subseteq V^2(\lambda)\subseteq V^3(\lambda)\subseteq V^4(\lambda)\subseteq\ \ \ \dots\dots\ \ \ \subseteq \overbrace{V^r(\lambda)}^{W(\lambda)}\\
&\hspace{4mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\ \ \dots\dots\hspace{3mm}\searrow\hspace{6mm}\nearrow\\
&\hspace{9mm}\delta V_1\hspace{3mm}\ge\hspace{3mm}\delta V_2\hspace{3mm}\ge\hspace{3mm}\delta V_3\hspace{3mm}\ge\hspace{3mm}\delta V_4\hspace{3mm}\ge\hspace{3mm}\dots\underbrace{\dots\hspace{3mm}\ge\hspace{3mm}\delta V_r}_{=\,0}
);

ここで、

 &math(\delta V_1+\delta V_2+\dots+\delta V_r=r);
$$\delta V_1+\delta V_2+\dots+\delta V_r=r$$

であるから、&math(\delta V_1>1); のときには上式のように、
ある &math(m); (&math(m<r);)以上の &math(k); に対して &math(\delta V_k=0); となる。
これは &math(V^{m}(\lambda)=V^{m+1}(\lambda)=\dots=V^r(\lambda)); を意味する。
であるから、$\delta V_1>1$ のときには上式のように、
ある $m$ ($m<r$)以上の $k$ に対して $\delta V_k=0$ となる。
これは $V^{m}(\lambda)=V^{m+1}(\lambda)=\dots=V^r(\lambda)$ を意味する。

つまり、&math(r); よりも小さい &math(m); 回で、広義固有空間のベクトルがすべてゼロになる。
&math(m=1); の場合が、広義固有空間が固有空間と等しい場合である。
つまり、$r$ よりも小さい $m$ 回で、広義固有空間のベクトルがすべてゼロになる。
$m=1$ の場合が、広義固有空間が固有空間と等しい、すなわち対角化可能な場合である。

* 広義固有空間の分解 [#g30b3d67]

上記の議論は、広義固有空間を
&math(k-1); 回ではゼロにならないが、&math(k); 回でゼロになるベクトルのみからなる空間
&math(\Delta V_k(\lambda)); の直和として、

 &math(
W(\lambda)=\underbrace{\underbrace{\underbrace{\underbrace{\Delta V^1(\lambda)}_{V(\lambda)}\dot+\Delta V^2(\lambda)}_{V^2(\lambda)}\dot+\Delta V^3(\lambda)}_{V^3(\lambda)}\dot+\dots\dot+\Delta V^m(\lambda)}_{V^m(\lambda)}
);

の形に分解するための手順を与える。

すなわち、
+ まず &math(k=1); から順に &math(\dim V^k(\lambda)); を求める
-- 次元は徐々に増えるが、増え方はだんだん鈍くなり、最後は増えなくなる
+ 次元増加の差分から &math(\delta V_k); を求める
+ &math(\delta V_k\ne 0); を満たす最も大きな &math(k);、&math(k_\mathrm{max}); に対して、
&math(k_\mathrm{max}-1); 回ではゼロにならないが、&math(k_\mathrm{max}); 
回でゼロになるような空間を張る &math(\delta V_{k_\mathrm{max}}); 個のベクトルを見つけると、
それらは &math(\Delta V^{k_\mathrm{max}}(\lambda)); の基底となる。
+ それらのベクトルに 
-- &math((A-\lambda I)); を1回かけると &math(\Delta V^{k-1}(\lambda)); の基底(の一部)が、
-- &math((A-\lambda I)); を2回かけると &math(\Delta V^{k-2}(\lambda)); の基底(の一部)が、~
...~
-- &math((A-\lambda I)); を&math(k_\mathrm{max}-1);回かけると &math(\Delta V(\lambda)); の基底(の一部)が、~
それぞれ求まる。
+ そのようにして求まった数の基底ベクトル以上の次元を持つ &math(k); があれば、
そのような &math(k); のうち最大のものに対して、足りない数のベクトルを見つけて、
&math(\Delta V^k(\lambda)); の基底を作る。
+ 新しく見つけたベクトルに &math((A-\lambda I)); をかけることで、
その &math(k); 以下の &math(\Delta V^k(\lambda)); の基底ベクトルの一部も同時に発見できる。
+ すべての基底ベクトルが見つかるまで、5., 6. を繰り返す。

このようにして構成した基底は、&math((A-\lambda I)); とのかけ算により

 &math(\bm b'=(A-\lambda I)\bm b);

 &math(\bm b''=(A-\lambda I)\bm b');

 &math(\bm b'''=(A-\lambda I)\bm b'');

 …

の関係を持つ何本かのベクトルの連なりからできており、
このようなベクトルの連なりは「ジョルダン鎖」と呼ばれる。

&math(k-1); 回ではゼロにならないが、&math(k); 回でゼロになるベクトルのみからなる空間への分解は一意には決まらず、基底の取り方にも大きな任意性がある。したがって上記の方法は分解の一例を与えるに過ぎないが、この方法は以下に示すように「ジョルダン標準形」を与える基礎をなす。

* 例1 3次元の広義固有空間、鎖1本 [#u32b1a19]

 &math(A=\begin{pmatrix}
 4 & -2 & 0 \\
 -3 & 4 & -2 \\
 -11 & 9 & -2 \\
\end{pmatrix}
);

まずは固有値を求める。

 &math(|A-\lambda I|=
\begin{vmatrix}
 4-\lambda & -2 & 0 \\
 -3 & 4-\lambda & -2 \\
 -11 & 9 & -2-\lambda \\
\end{vmatrix}=
8-12\lambda+6\lambda^2-\lambda^3=(2-\lambda)^3
);

 &math(\lambda=2);  (3重解)

したがって、広義固有空間 &math(W(2)); は3次元。

&math(A-2I=\begin{pmatrix}
 2 & -2 & 0 \\
 -3 & 2 & -2 \\
 -11 & 9 & -4 \\
\end{pmatrix}
\sim\begin{pmatrix}
 1 & -1 & 0 \\
 0 & -1 & -2 \\
 0 & -2 & -4 \\
\end{pmatrix}
\sim\begin{pmatrix}
 1 & 0 & 2 \\
 0 & 1 & 2 \\
 0 & 0 & 0 \\
\end{pmatrix}); より
&math(\dim V(2)=1);

&math((A-2I)^2=\begin{pmatrix}
 2 & -2 & 0 \\
 -3 & 2 & -2 \\
 -11 & 9 & -4 \\
\end{pmatrix}^2
=\begin{pmatrix}
 10 & -8 & 4 \\
 10 & -8 & 4 \\
 -5 & 4 & -2 \\
\end{pmatrix}
\sim\begin{pmatrix}
 5 & -4 & 2 \\
0&0&0\\
0&0&0\\
\end{pmatrix}); より &math(\dim V^2(2)=2);

3重解なので &math(\dim V^3(2)=3); となるはずであるが、実際、

&math((A-2I)^3
=\begin{pmatrix}
 10 & -8 & 4 \\
 10 & -8 & 4 \\
 -5 & 4 & -2 \\
\end{pmatrix}
\begin{pmatrix}
 2 & -2 & 0 \\
 -3 & 2 & -2 \\
 -11 & 9 & -4 \\
\end{pmatrix}
=\begin{pmatrix}
0&0&0\\
0&0&0\\
0&0&0\\
\end{pmatrix});

であるからこれは正しい。以上より、

 &math(\dim \Delta V(2)=\dim \Delta V^2(2)=\dim \Delta V^3(2)=1);

したがって、
&math(\Delta V^3(2)); の基底を見つければ、それに &math(A-2I); をかけていくことで
&math(\Delta V^2(2),\Delta V(2)); の基底が見つかるはず。

&math((A-2I)^2\bm x=\bm 0); は上記の通り係数行列の同値変形で &math(5x-4y+2z=0); 
となるから、&math(V^2(2)=\set{\bm x\in\mathbb{R}^3|5x-4y+2z=0}); に入らず、
&math(V^3(2)=\set{\bm x\in\mathbb{R}^3}); に入るという条件は
&math(5x-4y+2z\ne 0); であり、たとえば、

 &math(\bm b_3=\begin{pmatrix}
1\\0\\0
\end{pmatrix});

とすれば、&math([\bm b_3]); は &math(2); 回ではゼロにならないが 
&math(3); 回でゼロになるベクトルからなる空間であるから、
このベクトルを &math(\Delta V^3(2)); の基底とできる。

この &math(\bm b_3); から

 &math(\bm b_2=(A-2I)\bm b_3=
\begin{pmatrix}
2\\-3\\11
\end{pmatrix});

として &math(\Delta V^2(2)); の基底を、

 &math(\bm b_1=(A-2I)^2\bm b_3=
\begin{pmatrix}
10\\10\\-5
\end{pmatrix});

として &math(\Delta V(2)); の基底を作ると、

 &math((A-2I)^3\bm b_3=O\bm b_3=\bm 0);

よりこれらは確かに、それぞれ
- 2回ではゼロにならないが3回でゼロになる &math(\bm b_3);
- 1回ではゼロにならないが2回でゼロになる &math(\bm b_2);
- 0回ではゼロではないが1回でゼロになる &math(\bm b_1);

であることが分かる。

以上より広義固有空間を

 &math(
W(2)=
\underbrace{\underbrace{\underbrace{
\underbrace{\Delta V(2)}_{[\bm b_1]}}_{V(2)}\dot+
\underbrace{\Delta V^2(2)}_{[\bm b_2]}}_{V^2(2)}\dot+
\underbrace{\Delta V^3(2)}_{[\bm b_3]}}_{V^3(2)}
);

のように分解できることが分かった。
ここで、例えば &math([\bm b_1]); は &math(\bm b_1); 
により張られる空間を表す。

** 直和分解の任意性 [#l56e0ca6]

上記の分解に於いて、&math(\bm b_3); は
&math(5x-4y+2z\ne 0); を満たすベクトルならばどんなものでも良かった。
上記の分解に於いて、$\bm b_3$ は
$5x-4y+2z\ne 0$ を満たすベクトルならばどんなものでも良かった。
すなわち上記のようなジョルダン鎖を用いた直和分解には空間の取り方に大きな任意性がある。

一方、基底がジョルダン鎖を為さないような分解の仕方にはさらに大きな任意性があることを以下に見よう。

&math(\bm b_1); は1次元固有空間内の固有ベクトルであるから、
$\bm b_1$ は1次元固有空間内の固有ベクトルであるから、
定数倍以外には任意性が無いが、

&math(\bm b_2); に &math(\bm b_1); の任意の定数倍を加えて
&math(\bm b_2'); を作れば、これも
&math(V^2(2)); の元であり、なおかつ &math(V(2)); の元では無いから、
&math(\Delta {V^2}'(2)=[\bm b_2']); と置けばこの &math(\Delta {V^2}'(2)); に対しても
$\bm b_2$ に $\bm b_1$ の任意の定数倍を加えて
$\bm b_2'$ を作れば、これも
$V^2(2)$ の元であり、なおかつ $V(2)$ の元では無いから、
$\Delta {V^2}'(2)=[\bm b_2']$ と置けばこの $\Delta {V^2}'(2)$ に対しても

 &math(V^2(2)=V(2)\dot +\Delta {V^2}'(2));
$$V^2(2)=V(2)\dot +\Delta {V^2}'(2)$$

が成り立つ。

同様に、&math(\bm b_3); に &math(\bm b_1,\bm b2); の任意の定数倍を加えて
&math(\bm b_3'); を作れば、これも &math(V^3(2)); の元であり、なおかつ 
&math(V^2(2)); の元では無いから、&math(\Delta {V^3}'(2)=[\bm b_3']); 
と置けばこの &math(\Delta {V^3}'(2)); に対しても
同様に、$\bm b_3$ に $\bm b_1,\bm b2$ の任意の定数倍を加えて
$\bm b_3'$ を作れば、これも $V^3(2)$ の元であり、なおかつ 
$V^2(2)$ の元では無いから、$\Delta {V^3}'(2)=[\bm b_3']$ 
と置けばこの $\Delta {V^3}'(2)$ に対しても

 &math(V^3(2)=V^2(2)\dot +\Delta {V^3}'(2));
$$V^3(2)=V^2(2)\dot +\Delta {V^3}'(2)$$

が成り立つ。

つまりそのようにして適当に作った一般の &math(\bm b_1,\bm b_2',\bm b_3'); 
つまりそのようにして適当に作った一般の $\bm b_1,\bm b_2',\bm b_3'$ 
は必ずしもジョルダン鎖を構成しないが、
やはり広義固有空間の直和分解を与える基底となる。

 &math(
$$
W(2)=
\underbrace{\underbrace{\underbrace{
\underbrace{\Delta V(2)}_{[\bm b_1]}}_{V(2)}\dot+
\underbrace{\Delta {V^2}'(2)}_{[\bm b_2']}}_{V^2(2)}\dot+
\underbrace{\Delta {V^3}'(2)}_{[\bm b_3']}}_{V^3(2)}
);
$$

このように、広義固有空間を直和分解するためには必ずしも
ジョルダン鎖により基底の構成する必要は無いのであるが、
ジョルダン鎖により基底を構成する必要は無いのであるが、
ジョルダン鎖による基底の構成方法は次項の通り
行列のジョルダン標準形を与える基礎となる。

** ジョルダン標準形 [#h8ebcea2]

上記の &math(\bm b_1,\bm b_2,\bm b_3); に対して、

 &math((A-\lambda I)\bm b_1=\bm 0);~
 &math((A-\lambda I)\bm b_2=\bm b_1);~
 &math((A-\lambda I)\bm b_3=\bm b_2);

であり、まとめて書けば、

 &math(
(A-\lambda I)\Bigg(\bm p_1\ \bm p_2\ \bm p_3\Bigg)
&=\Bigg(\,\bm 0\ \bm p_1\ \bm p_2\Bigg)\\
&=\underbrace{\Bigg(\bm p_1\ \bm p_2\ \bm p_3\Bigg)}_{=\,P}
\begin{pmatrix}
0&1&0\\
0&0&1\\
0&0&0
\end{pmatrix}
);

ここで &math(\bm p_1,\bm p_2,\bm p_3); は一次独立であるから、

 &math(
P=\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg)
);

は正則である。左から &math(P^{-1}); を掛けて、

 &math(
P^{-1}(A-\lambda I)P
=\begin{pmatrix}
0&1&0\\
0&0&1\\
0&0&0
\end{pmatrix}
);

より、

 &math(
P^{-1}AP=\begin{pmatrix}
\lambda&1&0\\
0&\lambda&1\\
0&0&\lambda
\end{pmatrix}
);

を得る。この形は &math(A); のジョルダン標準形と呼ばれる。

- 対角要素に固有値が並ぶ
- すぐ右上に、対応するベクトルがどのベクトルへ移るかを示す 1 が並ぶ
- この形から、3次元空間に長さ3の1本のジョルダン鎖が存在することが分かる

* 例2 3次元の広義固有空間、鎖2本 [#x6301dc2]

 &math(A=\begin{pmatrix}
-9&8&-4\\
-15&13&-6\\
-5&4&-1
\end{pmatrix}
);

とすると、

 &math(|A-\lambda I|=1-3\lambda+3\lambda^2-\lambda^3=(1-\lambda)^3);

固有値の 1 は3重解。

 &math(
A-I=\begin{pmatrix}
-10&8&-4\\
-15&12&-6\\
-5&4&-2
\end{pmatrix}
\sim\begin{pmatrix}
5&-4&2\\
0&0&0\\
0&0&0\\
\end{pmatrix}); より
&math(\dim V(2)=2);

 &math((A-I)^2=O); より 
&math(\dim V^2(2)=3);

つまり、&math(\dim\Delta V(1)=2,\dim\Delta V^2(1)=1);

&math((A-I)\bm x=\bm 0); は上記の通り同値変形により
&math(5x-4y+2z=0); を導くから、これを満たさないベクトルを1つ見つければ、

 &math(\bm b_3=\begin{pmatrix}
1\\0\\0
\end{pmatrix});

として &math(\Delta V^2(1)); の基底を得、

 &math(\bm b_2=-\frac{1}{5}(A-I)\bm b_3=\begin{pmatrix}
2\\3\\1
\end{pmatrix});

として &math(\Delta V(1)); の基底ベクトルの1つを得る。

もう1つは &math(5x-4y+2z=0); を満たすベクトルを適当に選んで、
例えば

 &math(\bm b_1=\begin{pmatrix}
0\\1\\2
\end{pmatrix});

などとすれば、&math(\set{\bm b_1,\bm b_2}); が &math(\Delta V(1)); の基底となる。

** ジョルダン標準形 [#r201ca8f]

 &math(P=\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg));

に対して、

 &math(P^{-1}AP=\begin{pmatrix}
\lambda&\\
&\lambda&1\\
&&\lambda
\end{pmatrix}
);

となる。

この形から、3次元空間に長さ2のジョルダン鎖が1本、
長さ1のジョルダン鎖が1本、存在することが分かる

* 例3 3+1次元の広義固有空間、鎖3本 [#gedf2577]

 &math(
A=\begin{pmatrix}
 1 & 2 & 6 & -5 \\
 1 & 0 & -12 & 11 \\
 -3 & 6 & 29 & -24 \\
 -3 & 6 & 30 & -25 \\
\end{pmatrix}
);

 &math(
&|A-\lambda I|=\begin{vmatrix}
 1-\lambda & 2 & 6 & -5 \\
 1 & -\lambda & -12 & 11 \\
 -3 & 6 & 29-\lambda & -24 \\
 -3 & 6 & 30 & -25-\lambda \\
\end{vmatrix}
=\begin{vmatrix}
 1-\lambda & 2 & 6 & -5 \\
 1 & -\lambda & -12 & 11 \\
 -3 & 6 & 29-\lambda & -24 \\
 0 & 0 & 1+\lambda & -1-\lambda \\
\end{vmatrix}
=\begin{vmatrix}
 1-\lambda & 2 & 1 & -5 \\
 1 & -\lambda & -1 & 11 \\
 -3 & 6 & 5-\lambda & -24 \\
 0 & 0 & 0 & -1-\lambda \\
\end{vmatrix}\\
&=(-1-\lambda)\begin{vmatrix}
 1-\lambda & 2 & 1 \\
 1 & -\lambda & -1 \\
 -3 & 6 & 5-\lambda \\
\end{vmatrix}
=(-1-\lambda)\begin{vmatrix}
 2-\lambda & 2-\lambda & 0 \\
 1 & -\lambda & -1 \\
 -3 & 6 & 5-\lambda \\
\end{vmatrix}
=(-1-\lambda)\begin{vmatrix}
 2-\lambda & 0 & 0 \\
 1 & -1-\lambda & -1 \\
 -3 & 9 & 5-\lambda \\
\end{vmatrix}\\
&=(-1-\lambda)(2-\lambda)\begin{vmatrix}
 -1-\lambda & -1 \\
 9 & 5-\lambda \\
\end{vmatrix}
=(-1-\lambda)(2-\lambda)\big\{(-1-\lambda)(5-\lambda)+9\big\}\\
&=(-1-\lambda)(2-\lambda)(4-4\lambda+\lambda^2)
=(-1-\lambda)(2-\lambda)^3=0
);

より、固有値は &math(2,-1); であり、&math(\dim W(2)=3,\ \dim W(-1)=\dim V(-1)=1); 
であることが分かった。

 &math(
(A-2 I)=\begin{pmatrix}
 -1 & 2 & 6 & -5 \\
 1 & -2 & -12 & 11 \\
 -3 & 6 & 27 & -24 \\
 -3 & 6 & 30 & -27 \\
\end{pmatrix}
\sim\begin{pmatrix}
 1 & -2 & -12 & 11 \\
 0 & 0 & -6 & 6 \\
 0 & 0 & -9 & 9 \\
 0 & 0 & -6 & 6 \\
\end{pmatrix}
\sim\begin{pmatrix}
 1 & -2 & 0 & -1 \\
 0 & 0 & 1 & -1 \\
 0 & 0 & 0 & 0 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
); より
&math(\dim V(2)=2);

 &math(
(A-2 I)^2=(A-2 I)^2=\begin{pmatrix}
 0 & 0 & -18 & 18 \\
 0 & 0 & 36 & -36 \\
 0 & 0 & -81 & 81 \\
 0 & 0 & -90 & 90 \\
\end{pmatrix}
\sim\begin{pmatrix}
 0 & 0 & 1 & -1 \\
 0 & 0 & 0 & 0 \\
 0 & 0 & 0 & 0 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
); より
&math(\dim V^2(2)=3=\dim W(2));

つまり、&math(\dim\Delta V(2)=2, \dim\Delta V^2(2)=1); 

&math(\dim\Delta V^2(2)); に入るベクトルを1つ見つける。

 &math(
\Delta V^2(2)=\set{\bm x|(A-2I)\bm x\ne \bm 0\land (A-2I)^2\bm x=\bm 0}
); 

だから、

 &math(
\begin{cases}
x-2y-w\ne 0\lor z-w\ne 0\\
z-w=0
\end{cases}
);

が条件となる。たとえば &math(\bm b_3=\begin{pmatrix}
1\\0\\0\\0
\end{pmatrix}); とするとこの条件が満たされ、
&math(\Delta V^2(2)=[\bm b_3]); と取れる。

 &math(
\bm b_2=(A-2I)\bm b_3=\begin{pmatrix}
-1\\1\\-3\\-3
\end{pmatrix});

は &math(V(2)); の元となるはずで、実際 &math((A-2I)\bm b_2=\bm 0); を確かめられる。

&math(\dim V(2)=2); なので、&math(V(2)); から &math(\bm b_2); と一次独立なベクトルを1つ求める。
&math(V(2)=\set{\bm x|x-2y-w= 0\land z-w= 0}); であるから、

 &math(
\bm b_1=\begin{pmatrix}
2\\1\\0\\0
\end{pmatrix});

と置けば &math(\bm b_1,\bm b_2); は &math(V(2)); の基底となる。

一方、

 &math(
&\{A-(-1)I\}=\begin{pmatrix}
 2 & 2 & 6 & -5 \\
 1 & 1 & -12 & 11 \\
 -3 & 6 & 30 & -24 \\
 -3 & 6 & 30 & -24 \\
\end{pmatrix}
\sim\begin{pmatrix}
 1 & 1 & -12 & 11 \\
 0 & 0 & 30 & -27 \\
 0 & 9 & -6 & 9 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
\sim\begin{pmatrix}
 3 & 3 & -36 & 33 \\
 0 & 0 & 10 & -9 \\
 0 & 3 & -2 & 3 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}\\
&\sim\begin{pmatrix}
 3 & 0 & -34 & 30 \\
 0 & 0 & 10 & -9 \\
 0 & 3 & -2 & 3 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
\sim\begin{pmatrix}
 30 & 0 & -340 & 300 \\
 0 & 0 & 10 & -9 \\
 0 & 30 & -20 & 30 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
\sim\begin{pmatrix}
 30 & 0 & 0 & -6 \\
 0 & 0 & 10 & -9 \\
 0 & 30 & 0 & 12 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
\sim\begin{pmatrix}
 5 & 0 & 0 & -1 \\
 0 & 5 & 0 & 2 \\
 0 & 0 & 10 & -9 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}\\
);

 &math(\begin{cases}
5x-w=0\\
5y+2w=0\\
10z-9w=0
\end{cases}); より &math(w=10s); と置いて、

 &math(\bm x=s\begin{pmatrix}
2\\-4\\9\\10
\end{pmatrix});

そこで &math(V(-1)); の基底として 
&math(\bm b_4=\begin{pmatrix}
2\\-4\\9\\10
\end{pmatrix}); を取る。

** ジョルダン標準形 [#g1546898]

&math(P=\Bigg(
\bm p_1\ \bm p_2\ \bm p_3\ \bm p_4
\Bigg)); と置けば、

 &math(
AP&=\Bigg(
2\bm p_1\ \ 2\bm p_2\ \ \bm p_2+2\bm p_3\ \ -\bm p_4
\Bigg)\\
&=P\begin{pmatrix}
2\\
&2&1\\
&&2\\
&&&-1
\end{pmatrix}
);

より、

 &math(P^{-1}AP=
\begin{pmatrix}
2&\\
&2&1\\
&&2&\\
&&&-1\\
\end{pmatrix}
);

となる。

* 例4 2+2次元の広義固有空間、鎖2本 [#m4d46116]

&math(\dim\Delta V^{k_\mathrm{max}}(\lambda)>1); のときには
&math(\Delta V^{k_\mathrm{max}}(\lambda)); が &math(k_\mathrm{max}-1); 
回でゼロにならず、&math(k_\mathrm{max}); 回でゼロになるベクトルのみを含むよう
慎重に基底を選ぶ必要がある。

 &math(\begin{pmatrix}
\lambda&1\\
&\lambda\\
&&\lambda&1\\
&&&\lambda\\
\end{pmatrix}
);
* 一般のジョルダン標準形 [#k62cc044]

すべての固有値に対して上記のような広義固有空間のジョルダン鎖による分解を行えば、
それぞれの広義固有空間の基底として最終的に &math(n); 本の一次独立なベクトルが得られる。

それらを上記の例のようにジョルダン鎖を構成する順番に並べて正則行列 
&math(P); を作れば、&math(P^{-1}AP); により &math(A); 
はジョルダン標準形と呼ばれる形に「準対角化」される。

ジョルダン標準形は対角成分に固有値が並び、
固有ベクトルのうちジョルダン鎖を構成する部分について
固有値の右上に1が並ぶ。

ジョルダン鎖を構成する、固有値の右上に1が並ぶユニットを
ジョルダン胞と呼ぶ。

* ジョルダン標準形の応用 [#ff462da9]

ジョルダン標準形を見れば、その行列の広義固有空間がどのような構造になっているか一目瞭然となる。
その意味でジョルダン標準形は非常に重要であるが、応用的にも重要な意味を持つ。

** $A$不変 [#a007f83d]


Counter: 66347 (from 2010/06/03), today: 39, yesterday: 0