広義固有空間の構造とジョルダン標準形の履歴差分(No.29)

更新
追加された行はこの色です。
削除された行はこの色です。
[[線形代数Ｉ]]

* 概要 [#jcb5900a]

&katex();
ジョルダン標準形とは、対角化できない行列を「準対角化」した形である（対角化可能な行列のジョルダン標準形は対角化した形そのものである）。

この標準形は行列の「固有空間」の概念を拡張した、「広義固有空間」が持つ構造を反映した形となる。

ここは発展項目なので、線形代数IIの内容を先取りして使う。~
実のところ、線形代数IIでも扱わない内容なので、線形代数IIを学んでから戻ってきても良い。

** 目次 [#y4ce8fd1]

#contents();

* 固有空間とその次元 [#q8a7b352]

$A$ を $n$ 次正方行列とし、その固有値 $\lambda$ に対する固有空間（固有ベクトルの集合が作る線形空間）を $V(\lambda)$ と書くことにする。$\bm x\in V(\lambda)$ は、

$$A\bm x=\lambda \bm x$$

を満たすから、すなわち $V(\lambda)$ は

$$(A-\lambda I)\bm x=\bm 0$$

の解が作る空間と言える。これを、

$$V(\lambda)=\mathrm{Ker}\,(A-\lambda I)$$

と書けることが以下で重要になってくる。~
ここで $\mathrm{Ker}$ は線形写像の核を表す → [[線形代数II/線形写像・像・核・階数#naf8d1e7]]

** 対角化可能な場合 [#e4352329]

すべての固有値について、その代数的な重複度と同数の一次独立な固有ベクトルを見つけられること、が
行列が対角化可能となるための条件だった。

これは固有空間の次元が固有値の重複度と等しいことと同値である。~
（重複度を超えることはない → [[線形代数Ｉ/固有値と固有ベクトル#k2bcc540]]）

式で書けば、

$$\dim V(\lambda)=\dim\mathrm{Ker}\,(A-\lambda I)=r$$

（$\lambda$ の重複度を $r$ とする）

すべての固有値に対する重複度を加えると $n$ となるから、
このとき、$n$ 次元数ベクトル空間 $U$ を固有空間の [[直和>線形代数II/射影・直和・直交直和]] に分解できることになる。

$$U=V(\lambda_1)\dotplus V(\lambda_2)\dotplus\dots\dotplus V(\lambda_m)$$

$$\sum_{k}\dim V(\lambda_k)=n$$

* 広義固有空間 [#d119c641]

対角化できない場合には

$$\dim\mathrm{Ker}\,(A-\lambda I)<r$$

となる固有値があるが、そのような場合にも必ず、

$$\dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r$$

となることを以下のようにして示せる。すなわち、固有空間

$$V(\lambda)=\mathrm{Ker}\,(A-\lambda I)$$

に対して、「広義固有空間」を

$$W(\lambda)=\mathrm{Ker}\,\{(A-\lambda I)^r\}$$

と定義すれば、その次元は必ず重複度と等しくなる。（固有空間は $(A-\lambda I)$ を１回かければゼロになるベクトルの集合であるのに対して、広義固有空間は $(A-\lambda I)$ を $r$ 回かければゼロになるベクトルの集合である。）

任意の行列について、すべての固有値の重複度の和は全空間の次元に等しく、
異なる固有値の広義固有空間はゼロ以外で重ならないため、
「任意の行列について全空間 $U$ を&ruby(・・){広義};固有空間 $W(\lambda_i)$ の[[直和>線形代数II/射影・直和・直交直和#u527a7fd]]に分解できる」ことになる。

$$U=W(\lambda_1)\dotplus W(\lambda_2)\dotplus\dots\dotplus W(\lambda_m)$$

まとめると、
- 任意の行列 ↔ 全空間を&ruby(・・){広義};固有空間の直和に分解可能~
~
- 対角化可能な行列 ↔ 全空間を固有空間の直和に分解可能~
(広義固有空間が固有空間と等しくなる、ということ)~
~
- 正規行列 ↔ 全空間を固有空間の直交直和に分解可能~
(対角化可能かつ異なる固有値に属する固有空間が互いに直交する)


** 広義固有空間の次元が重複度と等しくなることの証明 [#h3aa536c]

[[三角化可能定理>線形代数Ｉ/対角化（一般の場合）#m3c1a3d7]] の証明の手順において、
初めに $\lambda$ を $r$ 回選ぶと、左上から $r$ 個の
$\lambda$ が並び、その後、他の固有値 $(\ne \lambda)$ が並ぶ形に三角化する $P$ の存在を示せる。

$$
\begin{aligned}
&\hspace{4mm}\overbrace{\hspace{17mm}}^{r}\\
P^{-1}AP=&\begin{pmatrix}
\lambda & * & * & \dots & \dots&* \\
& \ddots & * &\dots & \dots&* \\
&  & \lambda & & & \vdots\\
&  &  & \lambda'& &\vdots\\
&  &  &  & \lambda''\\
&  &  &  &  & \ddots\\
\end{pmatrix}
\end{aligned}
$$

この $P$ を用いて [[ケーリーハミルトンの定理>線形代数Ｉ/ケーリー・ハミルトンの定理]] 
の証明で行ったのと同じ操作を

$$(A-\lambda I)^r$$

に対して行えばいい。すなわち、

　&math(
&(A-\lambda I)^r\\
&=PP^{-1}(A-\lambda I)PP^{-1}(A-\lambda I)PP^{-1}\dots(A-\lambda I)PP^{-1}\\
&=P(P^{-1}AP-\lambda I)(P^{-1}AP-\lambda I)\dots(P^{-1}AP-\lambda I)P^{-1}\\
&=P\begin{pmatrix}
0 & * & * & \dots & \dots&* \\
  & \ddots & * &\dots & \dots&* \\
  &  & 0 & & & \vdots\\
  &  &  & \lambda'-\lambda& &\vdots\\
  &  &  &  & \lambda''-\lambda\\
  &  &  &  &  & \ddots\\
\end{pmatrix}^{\displaystyle r}
P^{-1}\\
&=P\begin{pmatrix}
0 & 0 & 0 & * & \dots&* \\
  & \ddots & 0 &* & \dots&* \\
  &  & 0 & & & \vdots\\
  &  &  & (\lambda'-\lambda)^r& &\vdots\\
  &  &  &  & (\lambda''-\lambda)^r\\
  &  &  &  &  & \ddots\\
\end{pmatrix}
P^{-1}\\
&\hspace{12mm}\underbrace{\hspace{17mm}}_{r}\\
);

この形から中央の行列の階数は $n-r$、カーネルは $r$ 次元である事が分かる。

階数やカーネルの次元は正則行列（$P$ や $P^{-1}$）とのかけ算で変化しないから、
$(A-\lambda I)^r$ についても階数は $n-r$ であり、カーネルは $r$ 
次元であることが分かる。

$$\dim\mathrm{Ker}\,\{(A-\lambda I)^r\}=r$$

** 異なる固有値の広義固有空間がゼロ以外で重ならないことの証明 [#l82d9c24]

$\bm x\in\mathrm{Ker}\,\{(A-\lambda I)^r\}$ ただし $\bm x\ne\bm 0$ とする。

上記の形から $P^{-1}\bm x$ は $r+1$ 要素目以降がすべてゼロとなるようなベクトルである。
そして、$P^{-1}$ は正則であるため $r$ 要素目よりも前にゼロでない要素が存在する。

$$
P^{-1}\bm x=\begin{pmatrix}*\\\vdots\\\ast\\0\\\vdots\\0
\end{pmatrix}
\begin{array}{l}
\Bigg\}\ r\,\text{個（ゼロでないものを含む）}
\\[10mm]\Bigg\}\ (n-r)\text{個}
\end{array}
$$

同じ $P$ を使って $(A-\lambda'I)^{r'}$ に対して計算を行うと（$\lambda'\ne\lambda$とする）、

　&math(
&(A-\lambda' I)^{r'}\\
&=P\begin{pmatrix}
\lambda-\lambda' & * & * & \dots & \dots&* \\
  & \ddots & * &\dots & \dots&* \\
  &  & \lambda-\lambda' & & & \vdots\\
  &  &  & 0& &\vdots\\
  &  &  &  & \lambda''-\lambda\\
  &  &  &  &  & \ddots\\
\end{pmatrix}^{\displaystyle r'}
P^{-1}\\
&=P\begin{pmatrix}
(\lambda-\lambda')^{r'} & * & * & \dots & \dots&* \\
  & \ddots & * &\dots & \dots&* \\
  &  & (\lambda-\lambda')^{r'} & & & \vdots\\
  &  &  & 0& &\vdots\\
  &  &  &  & (\lambda''-\lambda')^{r'}\\
  &  &  &  &  & \ddots\\
\end{pmatrix}
P^{-1}\\
&\hspace{12mm}\underbrace{\hspace{45mm}}_{r}\\
);

のように $r$ 列目までの対角要素には $(\lambda-\lambda')^{r'}\ne 0$ が並ぶから、
$P^{-1}\bm x$ との積はゼロにならない。
そこに正則行列 $P$ を掛けてもゼロでないから、$(A-\lambda' I)^{r'}\bm x\ne\bm 0$ が言える。

これは異なる固有値の広義固有空間が $\bm 0$ 以外で重ならないことを示す。

* 広義固有ベクトルとその階数 [#y508fc83]

定義の通り、広義固有空間に含まれるベクトルは $(A-\lambda I)$ を $r$ 回かけるとゼロになる。
このようなベクトルは「広義固有ベクトル」と呼ばれる。
とはいえ必ず $r$ 回かけないとゼロにならないかといえばそうとは限らない。
$r$ 回かける前にゼロになってしまえばその後何回かけてもゼロだからだ。

$$
\underbrace{(A-\lambda I)\dots(A-\lambda I) \overbrace{(A-\lambda I)\dots(A-\lambda I)}^{\text{途中まででゼロになるかも}}}_{\text{全部で}\,r\,\text{回}}\bm x=\bm 0
$$

そこで $k$ 回目に&ruby(・・・・){はじめて};ゼロになるものを、「階数 $k$ の広義固有ベクトル」と呼んで分類する。注意が必要なのは、「$k$ 階の広義固有ベクトルの集合」はベクトル空間にはならないことである。以下これを見よう。

$\bm x_1$ を $1$ 階の広義固有ベクトル（＝ 通常の固有ベクトル）とし、~
$\bm x_2$ を $2$ 階の広義固有ベクトルとすると、

$$(A-\lambda I)(\bm x_1-\bm x_2)=\bm 0-(A-\lambda I)\bm x_2=-(A-\lambda I)\bm x_2\ne \bm 0
\ \ \ \ \text{→ １回でゼロにならず}$$

$$(A-\lambda I)^2(\bm x_1-\bm x_2)=(A-\lambda I)\bm 0-(A-\lambda I)^2\bm x_2=\bm 0
\ \ \ \ \text{→ ２回目ではじめてゼロになる}$$

となるから $\bm x_1-\bm x_2$ は $2$ 階の広義固有ベクトルであるが、このベクトルと、同じく $2$ 階の広義固有ベクトルである $\bm x_2$ との和は $\bm x_1$ であり、$1$ 階の広義固有ベクトルとなってしまう。すなわち、$2$ 階の広義固有ベクトルの集合はベクトルの和に対して閉じていない。

（というか、そもそも $\bm 0$ がゼロ階の広義固有ベクトルだしね）
* 広義固有空間の構造 [#lc6fbe8f]

一方で、広義固有空間を単に「$(A-\lambda I)$ を $k$ 回かけるとゼロになる」という基準で分類するとそれらは部分空間を作る（「始めて」という条件を除いた）。

- ０回かけたらゼロになる空間は $V^0(\lambda)=\mathrm{Ker}\,(A-\lambda I)^0=\mathrm{Ker}\,I=\{\bm 0\}$ ~
　↑ これは ゼロ次元空間である
- １回かけたらゼロになる空間 $V^1(\lambda)=\mathrm{Ker}\,(A-\lambda I)=V(\lambda)$~
　↑ 通常の固有空間である
- ２回かけたらゼロになる空間 $V^2(\lambda)=\mathrm{Ker}\,(A-\lambda I)^2$
- ３回かけたらゼロになる空間 $V^3(\lambda)=\mathrm{Ker}\,(A-\lambda I)^3$
- …
- $r$回かけたらゼロになる空間 $V^r(\lambda)=\mathrm{Ker}\,(A-\lambda I)^r=W(\lambda)$~
　↑ 広義固有空間そのものになる

$k$ 回かけたらゼロになるベクトルは $k+1$ 回かけたらゼロになるベクトルでもあるので、

$$
\underbrace{V^0(\lambda)}_{=\,\{\bm 0\}}\subsetneq \underbrace{V^1(\lambda)}_{=\,V(\lambda)}\subseteq V^2(\lambda)\subseteq\dots\subseteq \underbrace{V^r(\lambda)}_{=\,W(\lambda)}
$$

の関係がある。$V^{k}(\lambda)$ が $V^{k-1}(\lambda)$ よりどれだけ大きいか考えるため、

$$\delta V_k(\lambda)=\dim V^k(\lambda)-\dim V^{k-1}(\lambda)$$

を定義しよう。このとき任意の $k>0$ に対して

$$\delta V_k(\lambda)\ge\delta V_{k+1}(\lambda)$$

が成り立つことを次のように示せる（次元の増え方が&ruby(・・・){先細り};になるということ）。

定義から $\delta V_{k+1}(\lambda)$ は $V_{k+1}(\lambda)$ を

$$V_{k+1}(\lambda)=V_{k}(\lambda)\dotplus\Delta V_{k+1}(\lambda)$$

のように直和分解したときの $\Delta V_{k+1}(\lambda)$ の次元である。

$$\delta V_{k+1}=\dim\Delta V_{k+1}(\lambda)$$

このとき $\Delta V_{k+1}(\lambda)$ は $k+1$ 階の広義固有ベクトルのみからなる空間である。なぜなら $k+2$ 階以上の広義固有ベクトルが含まれれば $V_{k+1}(\lambda)$ もそれらを含むことにくなってしまうし、$k$ 階以下の広義固有ベクトルが含まれれば $V_k(\lambda)$ と独立でなくなってしまうためである。（直和とは独立な空間同士の和空間のことであった）

重要なのは、この $\Delta V_{k+1}(\lambda)$ の基底ベクトルに $(A-\lambda I)$ 
を１回かけて得られる $\delta V_{k+1}(\lambda)$ 本のベクトルは、$k$ 階の広義固有ベクトルのみからなる $\delta V_{k+1}(\lambda)$ 次元空間を張るという事実である。なぜなら $\Delta V_{k+1}(\lambda)$ の基底 $\{\bm b_i\}$ に $(A-\lambda I)$ を掛けたベクトルで張られる空間に存在する

$$\sum_i c_i(A-\lambda I)\bm b_i=(A-\lambda I)\sum_i c_i\bm b_i$$

というベクトルは $k+1$ 階の広義固有ベクトル $\sum_i c_i\bm b_i$ に $(A+\lambda I)$ を１回かけたベクトルと見なせるためである。

すなわち $k\ge 1$ の仮定の下で、$k$ 階の広義固有ベクトルのみからなる $\delta V_{k+1}(\lambda)$ 次元空間の存在を示せたが、これは $\dim V^k(\lambda)$ が $\dim V^{k-1}(\lambda)$ より&ruby(・・・・・){少なくとも}; $\delta V_{k+1}$ だけ大きいことを示す。

すなわち $\delta V_k\ge \delta V_{k+1}$ が示された。

ここまでで分かった関係を図示すると次のようになる。

　&math(
&\overbrace{V^0(\lambda)}^{\set{\bm 0}}\subseteq\overbrace{V^1(\lambda)}^{V(\lambda)}\subseteq V^2(\lambda)\subseteq V^3(\lambda)\subseteq V^4(\lambda)\subseteq\ \ \ \dots\dots\ \ \ \subseteq \overbrace{V^r(\lambda)}^{W(\lambda)}\\
&\hspace{4mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\hspace{6mm}\nearrow\hspace{3mm}\searrow\ \ \dots\dots\hspace{3mm}\searrow\hspace{6mm}\nearrow\\
&\hspace{9mm}\delta V_1\hspace{3mm}\ge\hspace{3mm}\delta V_2\hspace{3mm}\ge\hspace{3mm}\delta V_3\hspace{3mm}\ge\hspace{3mm}\delta V_4\hspace{3mm}\ge\hspace{3mm}\dots\underbrace{\dots\hspace{3mm}\ge\hspace{3mm}\delta V_r}_{=\,0}
);

ここで、

$$\delta V_1+\delta V_2+\dots+\delta V_r=r$$

であるから、$\delta V_1>1$ のときには上式のように、
ある $m$ ($m<r$)以上の $k$ に対して $\delta V_k=0$ となる。
これは $V^{m}(\lambda)=V^{m+1}(\lambda)=\dots=V^r(\lambda)$ を意味する。
つまり、$r$ よりも小さい $m$ 回で、広義固有空間のベクトルがすべてゼロになる。
$m=1$ の場合が、広義固有空間が固有空間と等しい、すなわち対角化可能な場合である。

逆に、$\delta V_1=1$ のときには $V^{1}(\lambda)=V^{2}(\lambda)=\dots=V^r(\lambda)=1$ となる。

* 広義固有空間の分解 [#g30b3d67]

上の議論は広義固有空間を
$k$ 階の広義固有ベクトルのみからなる空間
$\Delta V^k(\lambda)$ の直和として、

　&math(
W(\lambda)=\underbrace{\underbrace{\underbrace{\underbrace{\Delta V^1(\lambda)}_{V(\lambda)}\dot+\Delta V^2(\lambda)}_{V^2(\lambda)}\dot+\Delta V^3(\lambda)}_{V^3(\lambda)}\dot+\dots\dot+\Delta V^m(\lambda)}_{V^m(\lambda)}
);

の形に分解するための手順を与える。

ここで $\Delta V^k(\lambda)$ は $k$ 階の広義固有ベクトル&ruby(・・){のみ};を含む空間であるが、$k$ 階の広義固有ベクトルを&ruby(・・・){すべて};集めた集合ではないことに注意せよ。上でも例を見たとおり、後者は線形空間とはならない。

具体的な手順は以下の通りである：
+ 固有方程式を解き、すべての固有値 $\lambda$ に対して以下を繰り返す
+ まず $k=1$ から順に $\dim\mathrm{Ker}\,(A-\lambda I)^k\ \big(=\dim V^k(\lambda)\big)$ を求める
-- 次元は徐々に増えるが、増え方はだんだん鈍くなり、最後は増えなくなる
+ 次元増加の差分から $\delta V^k(\lambda)$ を求める
+ $\delta V^k(\lambda)\ne 0$ を満たす最も大きな $k$ に対して、
$\mathrm{Ker}\,(A-\lambda I)^{k-1}$ には入らないが、
$\mathrm{Ker}\,(A-\lambda I)^k$ に入る 
一次独立な $\delta V_k(\lambda)$ 個のベクトルを見つけると、
それらが $\Delta V^k(\lambda)$ の基底となる。
+ それらのベクトルに 
-- $(A-\lambda I)$ を１回かけると $\Delta V^{k-1}(\lambda)$ の基底（の一部）が、
-- $(A-\lambda I)$ を２回かけると $\Delta V^{k-2}(\lambda)$ の基底（の一部）が、~
...~
-- $(A-\lambda I)$ を$(k-1)$回かけると $\Delta V(\lambda)$ の基底（の一部）が、~
それぞれ求まる。
+ そのようにして求まった数の基底ベクトル以上の次元を持つ $\delta V^k(\lambda)$ があれば、
そのような $k$ のうち最大のものに対して、足りない数のベクトルを見つけて、
$\Delta V^k(\lambda)$ の基底を作る。
+ 新しく見つけたベクトルに $(A-\lambda I)$ を(複数回)かけることで、
その $k$ 以下の $\Delta V^k(\lambda)$ の基底ベクトルの一部も同時に発見できる。
+ すべての基底ベクトルが見つかるまで 6., 7. を繰り返す。

このようにして構成した基底は、$(A-\lambda I)$ とのかけ算により

　&math(\bm b'=(A-\lambda I)\bm b);

　&math(\bm b''=(A-\lambda I)\bm b');

　&math(\bm b'''=(A-\lambda I)\bm b'');

　…

の関係を持つ何本かの「ベクトルの連なり」からできており、
このようなベクトルの連なりは「ジョルダン鎖」と呼ばれる。

広義固有空間を $k$ 階の広義固有ベクトルのみからなる空間へ分解する方法は一意には決まらず、基底の取り方にも大きな任意性がある。したがって上記は分解の一例を与えるに過ぎないが、この手順は以下に示す「ジョルダン標準形」を与える基礎をなすため、習熟しておくことが重要である。

* 例１ ３次元の広義固有空間、鎖１本 [#u32b1a19]

$$A=\begin{pmatrix}
4 & -2 & 0 \\-3 & 4 & -2 \\-11 & 9 & -2 \\
\end{pmatrix}
$$

まずは固有値を求める。

$$|A-\lambda I|=
\begin{vmatrix}
4-\lambda & -2 & 0 \\-3 & 4-\lambda & -2 \\-11 & 9 & -2-\lambda \\
\end{vmatrix}=
8-12\lambda+6\lambda^2-\lambda^3=(2-\lambda)^3
$$

$$\lambda=2\ \ \text{（３重解）}$$

したがって、広義固有空間 $W(2)$ は３次元。

$$
A-2I=\begin{pmatrix}
2 & -2 & 0 \\-3 & 2 & -2 \\-11 & 9 & -4 \\
\end{pmatrix}
\sim\begin{pmatrix}
1 & -1 & 0 \\
0 & -1 & -2 \\
0 & -2 & -4 \\
\end{pmatrix}
\sim\begin{pmatrix}
1 & 0 & 2 \\
0 & 1 & 2 \\
0 & 0 & 0 \\
\end{pmatrix}\ \ \text{より}\ \ \dim V(2)=1
$$

$$
(A-2I)^2=\begin{pmatrix}
2 & -2 & 0 \\-3 & 2 & -2 \\-11 & 9 & -4 \\
\end{pmatrix}^2
=\begin{pmatrix}
10 & -8 & 4 \\
10 & -8 & 4 \\-5 & 4 & -2 \\
\end{pmatrix}
\sim\begin{pmatrix}
5 & -4 & 2 \\
0&0&0\\
0&0&0\\
\end{pmatrix}\ \ \text{より}\ \ \dim V^2(2)=2
$$

３重解なので $\dim V^3(2)=3$ となるはずであるが、実際、

$$
(A-2I)^3
=\begin{pmatrix}
10 & -8 & 4 \\
10 & -8 & 4 \\-5 & 4 & -2 \\
\end{pmatrix}
\begin{pmatrix}
2 & -2 & 0 \\-3 & 2 & -2 \\-11 & 9 & -4 \\
\end{pmatrix}
=\begin{pmatrix}
0&0&0\\
0&0&0\\
0&0&0\\
\end{pmatrix}
$$

であるからこれは正しい。以上より、

$$\dim \Delta V(2)=\dim \Delta V^2(2)=\dim \Delta V^3(2)=1$$

したがって
$\Delta V^3(2)$ の基底を見つければ、それに $A-2I$ をかけていくことで
$\Delta V^2(2),\Delta V(2)$ の基底が見つかるはず。

$(A-2I)^2\bm x=\bm 0$ は上記の通り係数行列の同値変形で $5x-4y+2z=0$ 
となるから、$V^2(2)=\{\bm x\in\mathbb{R}^3|5x-4y+2z=0\}$ に入らず、
$V^3(2)=\{\bm x\in\mathbb{R}^3\}$ に入るという条件は
$5x-4y+2z\ne 0$ である。そこでたとえば、

$$
\bm b_3=\begin{pmatrix}
1\\0\\0
\end{pmatrix}
$$

とすれば $3$ 階の広義固有ベクトルが得られ、
$\Delta V^3(2)$ の基底を $\{\bm b_3\}$ と取れる。

この $\bm b_3$ から

$$
\bm b_2=(A-2I)\bm b_3=
\begin{pmatrix}
2\\-3\\11
\end{pmatrix}
$$

として $\Delta V^2(2)$ の基底を $\{\bm b_2\}$、

$$
\bm b_1=(A-2I)^2\bm b_3=
\begin{pmatrix}
10\\10\\-5
\end{pmatrix}
$$

として $\Delta V(2)$ の基底を $\{\bm b_1\}$ として作ると、

　&math((A-2I)\underbrace{(A-2I)\underbrace{(A-2I)\bm b_3}_{\bm b_2}}_{\bm b_1}=(A-2I)^3\bm b_3=O\bm b_3=\bm 0);

よりこれらは確かにそれぞれ、
- 2回ではゼロにならないが3回でゼロになる $\bm b_3$
- 1回ではゼロにならないが2回でゼロになる $\bm b_2$
- 0回ではゼロではないが1回でゼロになる $\bm b_1$

であることが分かる。

以上より広義固有空間を

　&math(
W(2)=
\underbrace{\underbrace{\underbrace{
\underbrace{\Delta V(2)}_{[\bm b_1]}}_{V(2)}\dotplus
\underbrace{\Delta V^2(2)}_{[\bm b_2]}}_{V^2(2)}\dotplus
\underbrace{\Delta V^3(2)}_{[\bm b_3]}}_{V^3(2)}
);

のように分解できることが分かった。
ここで、例えば $[\bm b_1]$ は $\bm b_1$ 
により張られる空間を表す。

** 直和分解の任意性 [#l56e0ca6]

上記の分解に於いて、$\bm b_3$ は
$5x-4y+2z\ne 0$ を満たすベクトルならばどんなものでも良かった。
すなわち上記のようなジョルダン鎖を用いた直和分解には空間の取り方に大きな任意性がある。

一方、基底がジョルダン鎖を為さないような分解の仕方にはさらに大きな任意性があることを以下に見よう。

$\bm b_1$ は１次元固有空間内の固有ベクトルであるから、
定数倍以外には任意性が無いが、

$\bm b_2$ に $\bm b_1$ の任意の定数倍を加えて
$\bm b_2'$ を作れば、これも
$V^2(2)$ の元であり、なおかつ $V(2)$ の元では無いから、
$\Delta {V^2}'(2)=[\bm b_2']$ と置けばこの $\Delta {V^2}'(2)$ に対しても

$$V^2(2)=V(2)\dot +\Delta {V^2}'(2)$$

が成り立つ。

同様に、$\bm b_3$ に $\bm b_1,\bm b_2$ の任意の定数倍を加えて
$\bm b_3'$ を作れば、これも $V^3(2)$ の元であり、なおかつ 
$V^2(2)$ の元では無いから、$\Delta {V^3}'(2)=[\bm b_3']$ 
と置けばこの $\Delta {V^3}'(2)$ に対しても

$$V^3(2)=V^2(2)\dot +\Delta {V^3}'(2)$$

が成り立つ。

つまりそのようにして適当に作った一般の $\bm b_1,\bm b_2',\bm b_3'$ 
は必ずしもジョルダン鎖を構成しないが、
やはり広義固有空間の直和分解を与える基底となる。

$$
W(2)=
\underbrace{\underbrace{\underbrace{
\underbrace{\Delta V(2)}_{[\bm b_1]}}_{V(2)}\dot+
\underbrace{\Delta {V^2}'(2)}_{[\bm b_2']}}_{V^2(2)}\dot+
\underbrace{\Delta {V^3}'(2)}_{[\bm b_3']}}_{V^3(2)}
$$

このように、広義固有空間を直和分解するためには必ずしも
ジョルダン鎖により基底を構成する必要は無いのであるが、
ジョルダン鎖による基底の構成方法は次項の通り
行列のジョルダン標準形を与える基礎となる。

** ジョルダン標準形 [#h8ebcea2]

上記の &math(\bm b_1,\bm b_2,\bm b_3); に対して、

　&math((A-\lambda I)\bm b_1=\bm 0);~
　&math((A-\lambda I)\bm b_2=\bm b_1);~
　&math((A-\lambda I)\bm b_3=\bm b_2);

であり、まとめて書けば、

　&math(
(A-\lambda I)\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg)
&=\Bigg(\,\bm 0\ \bm b_1\ \bm b_2\Bigg)\\
&=\underbrace{\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg)}_{=\,P}
\begin{pmatrix}
0&1&0\\
0&0&1\\
0&0&0
\end{pmatrix}
);

ここで &math(\bm b_1,\bm b_2,\bm b_3); は一次独立であるから、

　&math(
P=\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg)
);

は正則である。左から &math(P^{-1}); を掛けて、

　&math(
P^{-1}(A-\lambda I)P
=\begin{pmatrix}
0&1&0\\
0&0&1\\
0&0&0
\end{pmatrix}
);

より、

　&math(
P^{-1}AP=\begin{pmatrix}
\lambda&1&0\\
0&\lambda&1\\
0&0&\lambda
\end{pmatrix}
);

を得る。この形は対角化が不可能な &math(A); を&ruby(・){準};対角化した形になっており、ジョルダン標準形と呼ばれる。

- 対角要素に固有値が並ぶ
- すぐ右上に、対応するベクトルがどのベクトルへ移るかを示す 1 が並ぶ
- この形から、３次元空間に長さ３の１本のジョルダン鎖が存在することが分かる

* 例２ ３次元の広義固有空間、鎖２本 [#x6301dc2]

　&math(A=\begin{pmatrix}
-9&8&-4\\
-15&13&-6\\
-5&4&-1
\end{pmatrix}
);

とすると、

　&math(|A-\lambda I|=1-3\lambda+3\lambda^2-\lambda^3=(1-\lambda)^3);

固有値の 1 は３重解。

　&math(
A-I=\begin{pmatrix}
-10&8&-4\\
-15&12&-6\\
-5&4&-2
\end{pmatrix}
\sim\begin{pmatrix}
5&-4&2\\
0&0&0\\
0&0&0\\
\end{pmatrix}); より
&math(\dim V(1)=2);

　&math((A-I)^2=O); より 
&math(\dim V^2(1)=3);

つまり、&math(\dim\Delta V(1)=2,\dim\Delta V^2(1)=1);

&math((A-I)\bm x=\bm 0); は上記の通り同値変形により
&math(5x-4y+2z=0); を導くから、これを満たさないベクトルを１つ探すと、

　&math(\bm b_3=\begin{pmatrix}
1\\0\\0
\end{pmatrix});

として &math(\Delta V^2(1)); の基底を得、

　&math(\bm b_2=-\frac{1}{5}(A-I)\bm b_3=\begin{pmatrix}
2\\3\\1
\end{pmatrix});

として &math(\Delta V(1)); の基底ベクトルの１つを得る。

もう１つは &math(5x-4y+2z=0); を満たすベクトルを適当に選んで、
例えば

　&math(\bm b_1=\begin{pmatrix}
0\\1\\2
\end{pmatrix});

などとすれば、&math(\set{\bm b_1,\bm b_2}); が &math(\Delta V(1)); の基底となる。

** ジョルダン標準形 [#r201ca8f]

　&math(P=\Bigg(\bm b_1\ \bm b_2\ \bm b_3\Bigg));

に対して、

　&math(P^{-1}AP=\begin{pmatrix}
\lambda&\\
&\lambda&1\\
&&\lambda
\end{pmatrix}
);

となる。

この形から、３次元空間に長さ２のジョルダン鎖が１本、
長さ１のジョルダン鎖が１本、存在することが分かる

* 例３ ３＋１次元の広義固有空間、鎖３本 [#gedf2577]

　&math(
A=\begin{pmatrix}
 1 & 2 & 6 & -5 \\
 1 & 0 & -12 & 11 \\
 -3 & 6 & 29 & -24 \\
 -3 & 6 & 30 & -25 \\
\end{pmatrix}
);

　&math(
&|A-\lambda I|=\begin{vmatrix}
 1-\lambda & 2 & 6 & -5 \\
 1 & -\lambda & -12 & 11 \\
 -3 & 6 & 29-\lambda & -24 \\
 -3 & 6 & 30 & -25-\lambda \\
\end{vmatrix}
=\begin{vmatrix}
 1-\lambda & 2 & 6 & -5 \\
 1 & -\lambda & -12 & 11 \\
 -3 & 6 & 29-\lambda & -24 \\
 0 & 0 & 1+\lambda & -1-\lambda \\
\end{vmatrix}
=\begin{vmatrix}
 1-\lambda & 2 & 1 & -5 \\
 1 & -\lambda & -1 & 11 \\
 -3 & 6 & 5-\lambda & -24 \\
 0 & 0 & 0 & -1-\lambda \\
\end{vmatrix}\\
&=(-1-\lambda)\begin{vmatrix}
 1-\lambda & 2 & 1 \\
 1 & -\lambda & -1 \\
 -3 & 6 & 5-\lambda \\
\end{vmatrix}
=(-1-\lambda)\begin{vmatrix}
 2-\lambda & 2-\lambda & 0 \\
 1 & -\lambda & -1 \\
 -3 & 6 & 5-\lambda \\
\end{vmatrix}
=(-1-\lambda)\begin{vmatrix}
 2-\lambda & 0 & 0 \\
 1 & -1-\lambda & -1 \\
 -3 & 9 & 5-\lambda \\
\end{vmatrix}\\
&=(-1-\lambda)(2-\lambda)\begin{vmatrix}
 -1-\lambda & -1 \\
 9 & 5-\lambda \\
\end{vmatrix}
=(-1-\lambda)(2-\lambda)\big\{(-1-\lambda)(5-\lambda)+9\big\}\\
&=(-1-\lambda)(2-\lambda)(4-4\lambda+\lambda^2)
=(-1-\lambda)(2-\lambda)^3=0
);

より、固有値は &math(2,-1); であり、&math(\dim W(2)=3,\ \dim W(-1)=\dim V(-1)=1); 
であることが分かった。

　&math(
(A-2 I)=\begin{pmatrix}
 -1 & 2 & 6 & -5 \\
 1 & -2 & -12 & 11 \\
 -3 & 6 & 27 & -24 \\
 -3 & 6 & 30 & -27 \\
\end{pmatrix}
\sim\begin{pmatrix}
 1 & -2 & -12 & 11 \\
 0 & 0 & -6 & 6 \\
 0 & 0 & -9 & 9 \\
 0 & 0 & -6 & 6 \\
\end{pmatrix}
\sim\begin{pmatrix}
 1 & -2 & 0 & -1 \\
 0 & 0 & 1 & -1 \\
 0 & 0 & 0 & 0 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
); より
&math(\dim V(2)=2);

　&math(
(A-2 I)^2=(A-2 I)^2=\begin{pmatrix}
 0 & 0 & -18 & 18 \\
 0 & 0 & 36 & -36 \\
 0 & 0 & -81 & 81 \\
 0 & 0 & -90 & 90 \\
\end{pmatrix}
\sim\begin{pmatrix}
 0 & 0 & 1 & -1 \\
 0 & 0 & 0 & 0 \\
 0 & 0 & 0 & 0 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
); より
&math(\dim V^2(2)=3=\dim W(2));

つまり、&math(\dim\Delta V(2)=2, \dim\Delta V^2(2)=1); 

&math(\dim\Delta V^2(2)); に入るベクトルを１つ見つける。

　&math(
\Delta V^2(2)=\set{\bm x|(A-2I)\bm x\ne \bm 0\land (A-2I)^2\bm x=\bm 0}
); 

だから、

　&math(
\begin{cases}
x-2y-w\ne 0\lor z-w\ne 0\\
z-w=0
\end{cases}
);

が条件となる。たとえば &math(\bm b_3=\begin{pmatrix}
1\\0\\0\\0
\end{pmatrix}); とするとこの条件が満たされ、
&math(\Delta V^2(2)=[\bm b_3]); と取れる。

　&math(
\bm b_2=(A-2I)\bm b_3=\begin{pmatrix}
-1\\1\\-3\\-3
\end{pmatrix});

は &math(V(2)); の元となるはずで、実際 &math((A-2I)\bm b_2=\bm 0); を確かめられる。

&math(\dim V(2)=2); なので、&math(V(2)); から &math(\bm b_2); と一次独立なベクトルを１つ求める。
&math(V(2)=\set{\bm x|x-2y-w= 0\land z-w= 0}); であるから、

　&math(
\bm b_1=\begin{pmatrix}
2\\1\\0\\0
\end{pmatrix});

と置けば &math(\bm b_1,\bm b_2); は &math(V(2)); の基底となる。

一方、

　&math(
&\{A-(-1)I\}=\begin{pmatrix}
 2 & 2 & 6 & -5 \\
 1 & 1 & -12 & 11 \\
 -3 & 6 & 30 & -24 \\
 -3 & 6 & 30 & -24 \\
\end{pmatrix}
\sim\begin{pmatrix}
 1 & 1 & -12 & 11 \\
 0 & 0 & 30 & -27 \\
 0 & 9 & -6 & 9 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
\sim\begin{pmatrix}
 3 & 3 & -36 & 33 \\
 0 & 0 & 10 & -9 \\
 0 & 3 & -2 & 3 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}\\
&\sim\begin{pmatrix}
 3 & 0 & -34 & 30 \\
 0 & 0 & 10 & -9 \\
 0 & 3 & -2 & 3 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
\sim\begin{pmatrix}
 30 & 0 & -340 & 300 \\
 0 & 0 & 10 & -9 \\
 0 & 30 & -20 & 30 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
\sim\begin{pmatrix}
 30 & 0 & 0 & -6 \\
 0 & 0 & 10 & -9 \\
 0 & 30 & 0 & 12 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}
\sim\begin{pmatrix}
 5 & 0 & 0 & -1 \\
 0 & 5 & 0 & 2 \\
 0 & 0 & 10 & -9 \\
 0 & 0 & 0 & 0 \\
\end{pmatrix}\\
);

　&math(\begin{cases}
5x-w=0\\
5y+2w=0\\
10z-9w=0
\end{cases}); より &math(w=10s); と置いて、

　&math(\bm x=s\begin{pmatrix}
2\\-4\\9\\10
\end{pmatrix});

そこで &math(V(-1)); の基底として 
&math(\bm b_4=\begin{pmatrix}
2\\-4\\9\\10
\end{pmatrix}); を取る。

** ジョルダン標準形 [#g1546898]

&math(P=\Bigg(
\bm b_1\ \bm b_2\ \bm b_3\ \bm b_4
\Bigg)); と置けば、

　&math(
AP&=\Bigg(
2\bm b_1\ \ 2\bm b_2\ \ \bm b_2+2\bm b_3\ \ -\bm b_4
\Bigg)\\
&=P\begin{pmatrix}
2\\
&2&1\\
&&2\\
&&&-1
\end{pmatrix}
);

より、

　&math(P^{-1}AP=
\begin{pmatrix}
2&\\
&2&1\\
&&2&\\
&&&-1\\
\end{pmatrix}
);

となる。

- 固有値 2 の広義固有空間は３次元で、長さ１のジョルダン鎖と、長さ２のジョルダン鎖から構成される
- 固有値 -1 の固有空間は１次元

* 例４ ２＋２次元の広義固有空間、鎖２本 [#m4d46116]

&math(\dim\Delta V^{k}(\lambda)>1); のときには
線形結合により $k$ 階以下のベクトルが生じてしまわないよう、
慎重に基底ベクトルを選ぶ必要がある（基底ベクトル自体が $k$ 階であるだけでは不十分）。

　&math(\begin{pmatrix}
\lambda&1\\
&\lambda\\
&&\lambda&1\\
&&&\lambda\\
\end{pmatrix}
);
* 一般のジョルダン標準形 [#k62cc044]

すべての固有値に対して上記のような広義固有空間のジョルダン鎖による分解を行えば、
それぞれの広義固有空間の基底として最終的に &math(n); 本の一次独立なベクトルが得られる。

それらを上記の例のようにジョルダン鎖を構成する順番に並べて正則行列 
&math(P); を作れば、&math(P^{-1}AP); により &math(A); 
はジョルダン標準形と呼ばれる形に「準対角化」される。

ジョルダン標準形は対角成分に固有値が並び、
固有ベクトルのうちジョルダン鎖を構成する部分について
固有値の右上に１が並ぶ。

ジョルダン鎖を構成する、固有値の右上に１が並ぶユニットを
ジョルダン胞あるいはジョルダン細胞と呼ぶ。

* ジョルダン標準形の応用 [#ff462da9]

ジョルダン標準形を見れば、その行列の広義固有空間がどのような構造になっているか一目瞭然となる。
その意味でジョルダン標準形は非常に重要であるが、応用的にも重要な意味を持つ。

** ジョルダン細胞の累乗 [#v93147fd]

$k$ 次のジョルダン細胞の $n$ 乗を求めよう。

$$
\begin{aligned}
J_k(\lambda)&=\begin{pmatrix}
\lambda&1\\
&\ddots&\ddots\\
&&\ddots&1\\
&&&\lambda\\
\end{pmatrix}\\
&=\underbrace{\begin{pmatrix}
\lambda&\\
&\ddots&\\
&&\ddots\\
&&&\lambda\\
\end{pmatrix}}_{\lambda I}+\underbrace{
\begin{pmatrix}
0&1\\
&\ddots&\ddots\\
&&\ddots&1\\
&&&0\\
\end{pmatrix}}_{N_k}\\
&=\lambda I+N_k
\end{aligned}
$$

と分割すると、

$$
{N_4}^2=\begin{pmatrix}
0&1\\
&0&1\\
&&0&1\\
&&&0
\end{pmatrix}^2=
\begin{pmatrix}
0&0&1\\
&0&0&1\\
&&0&0\\
&&&0
\end{pmatrix}
$$

$$
{N_4}^3=\begin{pmatrix}
0&1\\
&0&1\\
&&0&1\\
&&&0
\end{pmatrix}\begin{pmatrix}
0&0&1\\
&0&0&1\\
&&0&0\\
&&&0
\end{pmatrix}=
\begin{pmatrix}
0&0&0&1\\
&0&0&0\\
&&0&0\\
&&&0
\end{pmatrix}
$$

$$
{N_4}^4=O_4
$$

として確かめられるように整数 $n\ge 0$ に対して

$$N_k^n=
\Big(\delta_{i+n,\,j}\Big)
$$

と表せる。この式は
- $n=0$ では $I_k$ ($k$ 次単位行列)
- $1\le n<k$ では 対角線から右に数えて $n$ 番目だけが $1$
- $n\ge k$ では $O_k$ ($k$ 次正方零行列)

を表している（各自確かめよ）。

したがって例えば、

$$
J_4(\lambda)^0=(\lambda I+N_k)^0=\red 1I=\begin{pmatrix}
\red{1}\\
&1\\
&&1\\
&&&1\\
\end{pmatrix}
$$

$$
\begin{aligned}
J_4(\lambda)^1=(\lambda I+N_k)^1=\red\lambda I+\red 1N_k=\begin{pmatrix}
\red{\lambda}&\red1\\
&\lambda&1\\
&&\lambda&1\\
&&&\lambda&1\\
\end{pmatrix}
\end{aligned}
$$

$$
\begin{aligned}
J_4(\lambda)^2&=(\lambda I+N_k)^2=\red{\lambda^2}I+\red{2\lambda} N_k+\red1{N_k}^2\\
&=\begin{pmatrix}
\red{\lambda^2}&\red{2\lambda}&\red1\\
&\lambda^2&2\lambda&1\\
&&\lambda^2&2\lambda\\
&&&\lambda^2\\
\end{pmatrix}
\end{aligned}
$$

$$
\begin{aligned}
J_4(\lambda)^3&=(\lambda I+N_k)^3=\red{\lambda^3}I+\red{3\lambda^2} N_k+\red{3\lambda} {N_k}^2+\red1{N_k}^3\\
&=\begin{pmatrix}
\red{\lambda^3}&\red{3\lambda^2}&\red{3\lambda}&\red1\\
&\lambda^3&3\lambda^2&3\lambda\\
&&\lambda^3&3\lambda^2\\
&&&\lambda^3
\end{pmatrix}
\end{aligned}
$$

$$
\begin{aligned}
J_4(\lambda)^4&=(\lambda I+N_k)^4=\red{\lambda^4}I+\red{4\lambda^3} N_k+\red{6\lambda^2} {N_k}^2+\red{4\lambda} N_k^3+\cancel{1N_k^4}\\
&=\begin{pmatrix}
\red{\lambda^4}&\red{4\lambda^3}&\red{6\lambda^2}&\red{4\lambda}\\
&\lambda^4&4\lambda^3&6\lambda^2\\
&&\lambda^4&4\lambda^3\\
&&&\lambda^4\\
\end{pmatrix}
\end{aligned}
$$

のように、$J_k(\lambda)^n$ は
- $1$ 行目に $(\lambda+1)^n$ を展開した際のはじめの $k$ 項が順に並ぶ
- $2$ 行目以降は１つ上の行を１つ右にずらす

の形をしている。

** ジョルダン細胞の関数 [#wd72da65]

任意の関数のマクローリン展開にジョルダン細胞を入れると、

$$
\begin{aligned}
f\big(J_k\big)&=\sum_{n=0}^\infty \frac1{n!}f^{(n)}(0){J_k}^n\\
&=\sum_{n=0}^\infty \frac1{\cancel{n!}}f^{(n)}(0)\sum_{i=0}^n\underbrace{\frac{\cancel{n!}}{i!(n-i)!}}_{\text{二項係数}\,{}_nC_k}\lambda^{(n-i)}{N_k}^i\\
\end{aligned}
$$

ここで $\sum_{n=0}^\infty \sum_{i=0}^n$ は $i\le n$ となるようなすべての $i,n$ の組みについて和を取れという意味になるから、$\sum_{i=0}^\infty\sum_{n=i}^\infty$ と書いても同じ結果になる。すなわち、

$$
\begin{aligned}
\phantom{f\big(J_k\big)}
&=\sum_{i=0}^{\red\infty}\frac1{i!}{N_k}^i\underbrace{\sum_{n=\red i}^\infty f^{(n)}(0)\frac{1}{(n-i)!}\lambda^{(n-i)}}_{f(\lambda)\,\text{と似ているが少々異なる}}\\
\end{aligned}
$$

のようにして各成分が求まる。

この対角成分 ($i=0$) に注目すると、上式の $\underbrace{\hspace{1cm}}$ で囲った部分はそのまま $f(\lambda)$ と等しくなることから、ジョルダン細胞を任意の関数に入れた形の固有値は、固有値自体をその関数に入れた値そのものになることを確認できる。（フロベニウスの定理の一部）

特に $f(x)=e^x$ のときは $f^{(n)}(0)=1$ より、
$$
\begin{aligned}
e^{J_k\,t}
&=\sum_{i=0}^{\infty}\frac1{i!}{N_k}^i\sum_{n= i}^\infty \frac{1}{(n-i)!}\lambda^{(n-i)}t^n\\
&=\sum_{i=0}^{\infty}\frac{\red{t^i}}{i!}{N_k}^i\underbrace{\sum_{n= i}^\infty \frac{1}{(n-i)!}\lambda^{(n-i)}t^{\red{(n-i)}}}_{e^{\lambda t}}\\
&=e^{\lambda t}\sum_{i=0}^{\infty}\frac{t^i}{i!}{N_k}^i
\end{aligned}
$$

したがって、例えば

$$
\begin{aligned}
e^{J_4\,t}&=e^{\lambda t}\begin{pmatrix}
1&t&t^2/2!&t^3/3!\\
&1&t&t^2/2!\\
&&1&t\\
&&&1
\end{pmatrix}
\end{aligned}
$$

を得る。

* 任意の行列の関数値 [#c59b167f]

任意の行列 $A$ は複数のジョルダン細胞からなるジョルダン標準形 $J$ に標準化可能である。

$$
P^{-1}AP=J=\begin{pmatrix}
J'\\
&J''\\
&&\ddots\\
&&&J'''\\
\end{pmatrix}
$$

すると [[対角化可能な場合>線形代数II/行列の関数]] と同様に、

$$
f(A)=Pf(J)P^{-1}
$$

であるが、

$$
f(J)=
\begin{pmatrix}
f(J')\\
&f(J'')\\
&&\ddots\\
&&&f(J''')\\
\end{pmatrix}
$$

が成り立つから、個々のジョルダン細胞の関数値を求められれば一般の行列に対する関数値を求められることになる。

** $A$不変 [#a007f83d]

* 質問・コメント [#yf918b97]

#article_kcaptcha
Counter: 117242 (from 2010/06/03), today: 36, yesterday: 68