固有値と固有ベクトルの履歴(No.7)

更新

線形代数Ｉ

固有値問題
固有値問題の解法
- 手順をまとめると
- 具体例
固有方程式が解を持たない場合
固有方程式の解
固有ベクトルの自由度
- 注意
固有ベクトルの一次独立性
相似な行列・相似変換
- 注記
相似変換は固有値を保存する
行列の対角化・三角化
対角化の実用性

培風館「教養の線形代数（五訂版）」に沿って行っている授業の授業ノート（の一部）です。

固有値問題†

Ax と x との関係†

正方行列を考える。

通常、は元のベクトルと必ずしも平行にならない。

例：

　&math( A=\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} );

　であれば　

しかし、をうまく選ぶととなる場合がある。

　であれば　

固有値問題†

与えられた正方行列に対して、、が

を満たすとき、

をの 固有値
（ギリシャ文字の "ラムダ" で書くのが慣例）
をの固有値に属する 固有ベクトル

と呼ぶ。

固有値問題 とは、
与えられた正方行列に対して、固有値と固有ベクトルを（すべて）求める問題である。

どんな役にたつ？†

この授業でもやるように、「行列の対角化」の基礎となる。
→ 行列の対角化は幅広い応用がある

特に量子力学では固有値、固有ベクトルが主要な役割を担う。

注意†

とすると、

は任意のに対して成り立ってしまう。

この 自明な解 は固有ベクトルに含めない。

固有値問題の解法†

まずは固有値を求めよう。

が成り立つとすれば、これに単位行列を掛けて、

と書ける。すると、

が成立しなければならない。

行列が正則である場合（逆行列を持つ場合）、上式の左から逆行列を掛けると、

(左辺)
(右辺)

となり、が導かれてしまう。

すなわち、あるについて行列が正則になったなら、そのに対して 固有ベクトルは存在しない。

つまり、正則でなくなるための条件

が 固有ベクトルが存在するためのに対する必要条件 であることが分かる。

固有値が満たすこの方程式は 「行列の固有方程式」 と呼ばれる。

得られたに対して、

をについて解く、

あるいはこれを変形した、

をについて解けば、

に対応する固有ベクトルが求まる。

をについて解けば、

は常に解となる。

下に見るように、固有方程式を満たすに対しては、

となる解も必ず存在する。

→ 固有方程式はが固有値となるための必要十分条件である

手順をまとめると†

固有値問題を解く手順：

固有方程式からを（いくつか）求める
（それぞれのについて）を解いてを求める

したがって、

一般に、１つの行列が複数の固有値を持つ（もちろん１つのこともある）
それぞれの固有値には、その固有値に属する固有ベクトルが（場合によっては複数）存在する
- →
- →
- 　：
- 　：

具体例†

&math( A=\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} );

のとき、

&math(A-\lambda I&= \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix}

\lambda \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} \\&= \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} \begin{bmatrix} \lambda & 0 \\ 0 & \lambda \end{bmatrix} \\&= \begin{bmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{bmatrix} );

&math( |A-\lambda I| &= \begin{vmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{vmatrix} \\&= (3-\lambda)^2-1^2 \\&= (3-\lambda+1)(3-\lambda-1) \\&= (4-\lambda)(2-\lambda) );

&math( \therefore \lambda=2,4 );

固有ベクトルはのそれぞれの値に対して個別に求める。

① の時

&math( (A-\lambda I)\bm x &= \begin{bmatrix} 3-2 & 1 \\ 1 & 3-2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \bm o = \begin{bmatrix} 0 \\ 0 \end{bmatrix} );

を求める手順はを係数行列とする連立方程式を解くことに帰着する。

拡大係数行列を行に対する基本変形を用いて階段化すると、

&math( \begin{bmatrix} 1 & 1 & 0\\ 1 & 1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & 1 & 0\\ 0 & 0 & 0 \end{bmatrix} );

掃き出せなかった列に対応するをパラメータに置き、とすれば、

同様に、

② の時

&math( (A-\lambda I)\bm x &= \begin{bmatrix}

1 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \bm o );

&math( \begin{bmatrix}

1 & 1 & 0\\ 1 & -1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & -1 & 0\\ 1 & -1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & -1 & 0\\ 0 & 0 & 0 \end{bmatrix} );

そこでと置けば、

まとめると、は、
固有値とそれに属する固有ベクトル
固有値とそれに属する固有ベクトル
を持つ。ただし、は任意の数を表すパラメータである。

固有方程式が解を持たない場合†

固有方程式が解を持たない場合があるだろうか？

例：　

の時、は回転を表すため、任意のベクトルが元とは異なる方向を向く
→ すなわち、元のベクトルと平行にならない。
→ すると、固有ベクトルは１つも存在しないはず！
→ 固有値も存在しないはず！

&math(|A-\lambda I|= \begin{vmatrix}

\cos \theta-\lambda & -\sin\theta \\
\sin\theta & \cos\theta -\lambda

\end{vmatrix} =0 );

では、左辺第２項が正となるから、この方程式を満たすは確かに存在しない・・・
→ 本当？

いや、複素数の範囲 でなら存在する！

２つの解が得られたので場合分けをして：

① の時

&math((A-\lambda I)\bm x&= \begin{bmatrix}

\cos \theta-\lambda & -\sin\theta \\
\sin\theta & \cos\theta -\lambda

\end{bmatrix} \bm x = \begin{bmatrix}

-i\sin\theta & -\sin\theta \\
\sin\theta & -i\sin\theta

\end{bmatrix} \bm x\\ &= \sin\theta \begin{bmatrix}

-i & -1 \\
1 & -i

\end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0 );

&math( \begin{bmatrix}

-i & -1 & 0 \\
1 & -i & 0

\end{bmatrix} ); 一行目にを掛けてみる

&math( = \begin{bmatrix}

1 & -i & 0 \\
1 & -i & 0

\end{bmatrix} );

&math( = \begin{bmatrix}

1 & -i & 0 \\
0 & 0 & 0

\end{bmatrix} );

よりと置けば、

② の時

&math((A-\lambda I)\bm x&= \begin{bmatrix}

i\sin\theta & -\sin\theta \\
\sin\theta & i\sin\theta

\end{bmatrix} \bm x\\ &= \sin\theta \begin{bmatrix}

i & -1 \\
1 & i

\end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0 );

&math( \begin{bmatrix}

i & -1 & 0 \\
1 & i & 0

\end{bmatrix} ); 一行目にを掛けて

&math( = \begin{bmatrix}

-1 & -i & 0 \\
1 & i & 0

\end{bmatrix} );

&math( = \begin{bmatrix}

1 & i & 0 \\
0 & 0 & 0

\end{bmatrix} );

よりと置けば、

確認してみる：

&math(A\bm x= \begin{bmatrix}

\cos \theta & -\sin\theta \\
\sin\theta & \cos\theta

\end{bmatrix} \begin{bmatrix}

is \\  s

\end{bmatrix} = \begin{bmatrix}

is\cos \theta - s\sin\theta \\
is\sin\theta + s\cos\theta

\end{bmatrix} = s(\cos \theta + i\sin\theta) \begin{bmatrix}

i \\ 1

\end{bmatrix} );

&math(A\bm x= \begin{bmatrix}

\cos \theta & -\sin\theta \\
\sin\theta & \cos\theta

\end{bmatrix} \begin{bmatrix}

-it \\  t

\end{bmatrix} = \begin{bmatrix}

-it\cos \theta - t\sin\theta \\
-it\sin\theta + t\cos\theta

\end{bmatrix} = t(\cos \theta - i\sin\theta) \begin{bmatrix}

-i \\ 1

\end{bmatrix} );

（騙されたみたい、に感じるけれど）ちゃんとうまく行く。

このように、複素数の範囲で考える限り固有値は必ず存在する。

固有方程式の解†

固有方程式の次数†

固有方程式は必ずの次方程式となる。

なぜなら・・・

&math( |A-\lambda I| = \begin{vmatrix} a_{11} - \lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & & \vdots \\ \vdots & & \ddots & \\ a_{n1} & \cdots & & a_{nn}-\lambda \\ \end{vmatrix} = 0 );

一般に「行列式」は各行、各列から重複の無いように個の要素を抜き出して積を作り、そのような積を可能な限り集めて和にした物であった。

行列式 = = Σ (符号) × ( n 個の要素の積）

したがって、行列式は対角要素を全て掛け合わせた項

を含んでいる。この項は明らかにの乗を含む。

また他の項（個の要素を掛け合わした物）が、のより大きな次数の項を含むことはあり得ない。

&math(\therefore |A-\lambda I|= (a_{11}-\lambda)(a_{22}-\lambda)\dots(a_{nn}-\lambda)+);( の次以下の項)

これはの次方程式である。

代数学の基本定理†

次方程式は複素数の範囲に必ず個の解を持つ。

というのが「代数学の基本定理」であった。

それら個の解をとすれば、の固有多項式は、

と因数分解できる。

これらすべての解が異なれば個の固有値が得られる。

重複解†

実際には個のうちいくつかが等しい場合があり、それらは「重複解」あるいは「重解」と呼ばれる。

上で個の解、と言っているのは重複解を個別に数えているので、重複解がある場合には、

などとなって、独立な固有値の個数はとなる。

固有値の個数のまとめ†

重複度を含めて必ず個の固有値が存在する。

独立な固有値の個数はとなる。

例†

次行列

&math( A=\begin{bmatrix} 3 & 4 & -5 & 3 \\ 0 & 1 & 8 & 0 \\ 0 & 0 & 2 & -1 \\ 0 & 0 & 0 & 1 \end{bmatrix} );

について、

したがって、

の３つの異なる固有値が見つかる。

ただし、1 は２重解であるため重複度を含めると行列の次数と等しい「４つ」の固有値が存在する。

固有ベクトルの自由度†

例えばがの固有値に属する固有値（）であれば、任意の実数に対してすなわち、と表せるすべてのベクトルはもに属する固有ベクトルである。

なぜなら、[Math Conversion Error]

このように、固有ベクトルは必ずパラメータを含む形で求まる。

ある固有値 [Math Conversion Error]

に属する固有ベクトルに含まれるパラメータの数＝自由度について考えよう。

から固有ベクトルを求める方程式は、元連立の一次方程式となる。

すなわち、

&math( (A-\lambda I)\bm x= \begin{bmatrix} a_{11}-\lambda & a_{12} & \dots & a_{1n} \\ a_{21} & a_{11}-\lambda & & \vdots \\ \vdots & & \ddots & \vdots \\ a_{n1} & \dots & & a_{nn} - \lambda \end{bmatrix} \begin{bmatrix} x_1\\x_2\\\vdots\\x_n \end{bmatrix} = \begin{bmatrix} 0\\0\\\vdots\\0 \end{bmatrix} =\bm o );

階数の定義より、上記連立方程式の拡大係数行列を行に対する基本変形で階段行列化した際には非ゼロの行が行、ゼロの行が行現われる。

&math( \begin{bmatrix} a_{11}-\lambda & a_{12} & \dots & a_{1n} & 0 \\ a_{21} & a_{11}-\lambda & & \vdots & \vdots \\ \vdots & & \ddots & \vdots & \vdots \\ a_{n1} & \dots & \dots & a_{nn} - \lambda & 0 \end{bmatrix} \sim \begin{bmatrix}

* & * & \dots & * & 0 \\

\vdots & \vdots & & \vdots & \vdots \\

* & * & \dots & * & 0 \\

0 & 0 & \dots & 0 & 0 \\ \vdots & \vdots & & \vdots & \vdots \\

0 & 0 & \dots & 0 & 0 \\

\end{bmatrix} \begin{array}{ll} \Bigg\} \ \rank (A-\lambda I)\\ \\ \Bigg\} \ n- \rank (A-\lambda I)\\ \end{array} );

ここで、係数行列は正則ではないため、である。したがって、掃き出し後の階段行列にはゼロの行が必ず１行以上現われることになる。

すなわちはき出せない列が列現れて、解には同数の未定係数（パラメータ）が現われることになる。

&math( \bm x = c^{(1)}\begin{bmatrix} x_1^{(1)}\\x_2^{(1)}\\ \vdots \\x_n^{(1)}\\ \end{bmatrix}

c^{(2)}\begin{bmatrix} x_1^{(2)}\\x_2^{(2)}\\ \vdots \\x_n^{(2)}\\ \end{bmatrix}
\dots + c^{(m)}\begin{bmatrix} x_1^{(m)}\\x_2^{(m)}\\ \vdots \\x_n^{(m)}\\ \end{bmatrix} );

ただし、は任意係数であり、

である。

すなわち、固有ベクトルの自由度はである。

繰り返しになるが、であるため、すべての固有値に対する固有ベクトルは最低１以上の自由度を持つ。

（蛇足：求めた固有値に対して固有ベクトルを求める際にパラメータを含まない形になってしまった場合には、途中の計算を間違えていることになる。）

以上は、「行列の階数」のところでやった「連立一次方程式の解の自由度」の部分をほぼそのままなぞる形の議論であるため、関連して復習せよ。

注意†

教科書では「固有ベクトルの自由度」のことを「固有空間の次元」と呼んでいる。「次元」は線形代数Iの授業の範囲外であるため、ここではあくまで「自由度」あるいは「パラメータの数」として理解していれば良い。

固有ベクトルの一次独立性†

「の異なる固有値に属する固有ベクトルは１次独立である」

この意味は、

「行列の固有値の中から、個の異なる固有値を選び出し、これらに対応する固有ベクトルをそれぞれ１つ選んでとすれば、この個のベクトルは一次独立である」

ということ。

まず確認：

「が一次独立」の意味は、「が成り立つと仮定すればを導けること」であった。

以下は数学的帰納法を用いた証明：

(1)
の時には、固有ベクトルはを満たすため、からが導かれ、は一次独立である。

(2)
ベクトルが個の時に一次独立になると仮定して、個でも一次独立になることを導く。

「個でも一次独立になること」は、「からが導けること」なので、

・・・（＊）

に左からを掛ければ

&math( &c_1A\bm x_1+c_2A\bm x_2+\dots+c_rA\bm x_r=\\ &c_1\lambda_1\bm x_1+c_2\lambda_2\bm x_2+\dots+c_r\lambda_r\bm x_r=0);

一方、（＊）にを掛ければ、

&math( c_1\lambda_r\bm x_1+c_2\lambda_r\bm x_2+\dots+c_r\lambda_r\bm x_r=0);

２つの式を引き算すると、

&math( &c_1(\lambda_1-\lambda_r)\bm x_1+c_2(\lambda_2-\lambda_r)\bm x_2+\dots+c_{r-1}(\lambda_{r-1}-\lambda_r)\bm x_{r-1}+c_r(\lambda_r-\lambda_r)\bm x_r=\\ &c_1(\lambda_1-\lambda_r)\bm x_1+c_2(\lambda_2-\lambda_r)\bm x_2+\dots+c_{r-1}(\lambda_{r-1}-\lambda_r)\bm x_{r-1}=0);

仮定より、異なる固有値に属する個の固有ベクトルは一次独立であるため、係数はすべてゼロでなくてはならず、

であり、すべての固有値が異なるという仮定から、

が導かれる。

さらにこれらを（＊）に代入すれば、を得る。

すなわち、（＊）からが導かれたことになり、は一次独立であることが言えた。

で成り立つことと、
で成り立てばで成り立つことから、
与えられた命題は全てのに対して成り立つことが証明された。

相似な行列・相似変換†

行列ととの間に

の関係があるとき、

「ととは相似である」という。

注記†

このように定義した「相似」という概念は１つの「同値関係」を定義する。

すなわち、相似関係は以下の「同値関係の公理」を満たす。

とは相似である（反射率）
∵ と取ればよい
とが相似であれば、とも相似である（対称律）
∵ に左からを、右からを掛けると
これはに対してとが相似であることを示している。
と、とが相似ならばも相似である（推移律） ∵ の時、これはに対してととが相似であることを示している。（積の逆行列は逆行列の積の順番を入れ替えた物であったことに注意）

また、次正方行列に対して、ある次正方行列を使って

とする変換を、「相似変換」と呼ぶ。

相似変換は固有値を保存する†

相似変換によって固有値が変化しない、すなわち
相似な行列というのは、固有値が等しい行列のこと

これでようやく「どこが似ているか」が分かった！ ← 相似＝「相手と似ていること」

証明：

&math( &|P^{-1}AP-\lambda I|=\\ &|P^{-1}AP-\lambda P^{-1}P|=\\ &|P^{-1}(A-\lambda I)P|=\\ &|P^{-1}|\,|(A-\lambda I)|\,|P|=\\ &|P|^{-1}\,|(A-\lambda I)|\,|P|=\\ &|A-\lambda I|=0\\ );

ここで、

行列の積の行列式は行列式の積である
単位行列の行列式は１である
逆行列の行列式は元の行列の行列式の逆数である

を使った。

この結果から、

「相似な行列の固有多項式は等しい」

すなわち、

「との固有値は重複度も含めて等しい」

ことが分かる。

行列の対角化・三角化†

この後得られる結果を先取りしておく。

相似変換により任意の行列を三角行列に変換できる（三角化可能）
相似変換により行列を対角行列に変換できるときとできないときがある（対角化可能・不可能）

相似変換による三角化・対角化とは？†

ある行列を正則行列によって相似変換して結果を三角行列あるいは対角行列にすること。
あるいは、そのような行列を見つけること。

三角化：

&math(P^{-1}AP= \begin{bmatrix} a'_{11}&*&*&\dots&*\\ 0&a'_{22}&*&\dots&*\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&*\\ 0&0&\dots&0&a'_{nn} \end{bmatrix} );

対角化：

&math(P^{-1}AP= \begin{bmatrix} a'_{11}&0&0&\dots&0\\ 0&a'_{22}&0&\dots&0\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&0\\ 0&0&\dots&0&a'_{nn} \end{bmatrix} );

注†

この教科書で「三角化」というのは「上三角化」のことを指している場合が多い。一般には下三角行列にすることも三角化と呼ばれる。

対角行列は三角行列であるから、対角化は三角化の特殊例である。

三角化（対角化）できたならば、対角成分は A の固有値である†

が三角行列の時、も三角行列である。

例：

なら、

三角行列の行列式は対角成分の積であるから、

一方、の固有多項式は、

相似な行列の固有多項式は等しいから、順番を除いて

、、・・・であることになる。

すなわち、三角化後の対角成分には重複度を含めた個の固有値が現われる。

&math(P^{-1}AP= \begin{bmatrix} \lambda_1&*&*&\dots&*\\ 0&\lambda_2&*&\dots&*\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&*\\ 0&0&\dots&0&\lambda_n \end{bmatrix} );

対角化するための P をどのように見つけるか†

固有ベクトルを並べた行列†

行列の列ベクトルをと置き、これらすべてがの固有値であるとする。

このとき、

&math( P^{-1}AP &=P^{-1}A\Bigg[ \bm p_1 \ \bm p_2 \ \dots \ \bm p_n \Bigg]\\ &=P^{-1}\Bigg[ A\bm p_1 \ A\bm p_2 \ \dots \ A\bm p_n \Bigg]\\ &=P^{-1}\Bigg[ \lambda_1\bm p_1 \ \lambda_2\bm p_2 \ \dots \ \lambda_n\bm p_n \Bigg]\\ &=P^{-1}\underbrace{\Bigg[ \bm p_1 \ \bm p_2 \ \dots \ \bm p_n \Bigg]}_{P}\begin{bmatrix} \lambda_1&0&\hdots&0\\ 0&\lambda_2&&\vdots\\ \vdots&&\ddots&0\\ 0&\hdots&0&\lambda_n \end{bmatrix}\\ &=\begin{bmatrix} \lambda_1&0&\hdots&0\\ 0&\lambda_2&&\vdots\\ \vdots&&\ddots&0\\ 0&\hdots&0&\lambda_n \end{bmatrix} );

となって、対角化できる。

対角化された行列の中に現れる固有値の順番が、始めに並べたと同じ順になることに注意せよ。

対角化可能条件†

対角化は必ずしも可能ではない。
→ 本の固有ベクトルを並べて作ったは必ずしも正則にならない。

「が正則となるように本の固有ベクトルを選ぶことができる」というのが「行列を対角化できる」十分条件となる。

より使いやすい条件†

教科書の P83 あたりでやったように「ある行列の列ベクトルが一次独立」であることと、その行列は正則であることとは同値である。

したがって、「が本の一次独立な固有ベクトルを持つこと」がを対角化できる条件となる。

n 個の異なる固有値を持つ場合†

は重複度を含めて個の固有値を持つ
異なる固有値に属する固有ベクトルは一次独立である

したがって、の固有値がすべて異なるなら、対応する固有ベクトルを１つづつ取ってを作ればは一次独立になる。

固有値に重複解がある場合†

個の固有値のうち等しい物があれば、その固有値を重複解と呼ぶのであった。

固有値方程式が重複解を持つ場合、対角化が不可能な場合がある。

すべての固有値が、自身の重複度と同じ数の一次独立な固有ベクトルを持てば、全体で個の一次独立な固有ベクトルが得られる。
→ なぜなら固有値は重複度を含めて本あるから

逆に、ある固有値に属する固有ベクトルの自由度が固有値の重複度よりも小さくなるとき、行列は対角化できない。

（固有ベクトルの自由度が固有値の重複度を超えないことが前提になるが、その証明は三角化について学んでからにする）

対角化可能性の判別†

すべての固有値が、自身の重複度と同じ数の一次独立な固有ベクトルを持つことを確認すればよい。

例（例８）：

&math( |A-\lambda I|&=\begin{vmatrix}1-\lambda&0&0\\1&2-\lambda&-3\\1&1&-2-\lambda\end{vmatrix}\\ &=(1-\lambda)\begin{vmatrix}2-\lambda&-3\\1&-2-\lambda\end{vmatrix}\\ &=(1-\lambda)\{(2-\lambda)(-2-\lambda)+3\}\\ &=(1-\lambda)(\lambda^2-1)\\ &=(1-\lambda)(\lambda-1)(\lambda+1)\\ &=(1-\lambda)^2(1+\lambda)\\ &=0 );

が２重解なので、こちらに対応する固有ベクトルを求めてみる。

&math( &(A-\lambda I)\bm x=\begin{bmatrix}0&0&0\\1&1&-3\\1&1&-3\end{bmatrix}\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix}\\ &\rightarrow x+y-3z=0\\ );

掃き出せないをパラメータに置くと、

となり、例えばとして一時独立な２本の固有ベクトルを選ぶことができる。

すなわち、は対角化可能であることが分かる。

以下、実際に対角化してみよう。

に対する固有ベクトルは、

&math( &(A-\lambda I)\bm x=\begin{bmatrix}2&0&0\\1&3&-3\\1&1&-1\end{bmatrix}\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix}\\ &\rightarrow \begin{cases}x=0\\y-z=0\end{cases}\\ );

掃き出せないをパラメータに置くと、

したがって、例えばが固有ベクトル。

以上より、

と置けば、これは１，２列目がの、３列目がの固有ベクトルであり、なおかつは正則。したがって、は

として対角化される。

「を対角化せよ」という問題に答えるのであればここまでで正答となる。

以下蛇足ではあるが、本当に対角化されることを確かめてみよう。

まずはを求めてみる。

&math( &\begin{bmatrix}-1&3&0&1&0&0\\1&0&1&0&1&0\\0&1&1&0&0&1\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\-1&3&0&1&0&0\\0&1&1&0&0&1\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\0&3&1&1&1&0\\0&1&1&0&0&1\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\0&1&1&0&0&1\\0&3&1&1&1&0\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\0&1&1&0&0&1\\0&0&-2&1&1&-3\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&1&0&1&0\\0&1&1&0&0&1\\0&0&1&-1/2&-1/2&3/2\end{bmatrix}\\ &\sim\begin{bmatrix}1&0&0&1/2&3/2&-3/2\\0&1&0&1/2&1/2&-1/2\\0&0&1&-1/2&-1/2&3/2\end{bmatrix}\\ );

&math( \therefore P^{-1}=\frac{1}{2}\begin{bmatrix}1&3&-3\\1&1&-1\\-1&-1&3\end{bmatrix}\\ );

正しく求まった。このを用いて、

&math( P^{-1}AP&= \frac{1}{2}\begin{bmatrix}1&3&-3\\1&1&-1\\-1&-1&3\end{bmatrix} \begin{bmatrix}1&0&0\\1&2&-3\\1&1&-2\end{bmatrix} \begin{bmatrix}-1&3&0\\1&0&1\\0&1&1\end{bmatrix}\\ &=\frac{1}{2}\begin{bmatrix}1&3&-3\\1&1&-1\\-1&-1&3\end{bmatrix} \begin{bmatrix}-1&3&0\\1&0&-1\\0&1&-1\end{bmatrix}\\ &=\frac{1}{2}\begin{bmatrix}2&0&0\\0&2&0\\0&0&-2\end{bmatrix}\\ &=\begin{bmatrix}1&0&0\\0&1&0\\0&0&-1\end{bmatrix} );

として、正しく対角化された。

を作るときに１，２列目にの、３列目にの固有ベクトルを並べたことに対応して、１，２列目に 1 が、３列目に -1 が現れている。

例（例９）：

&math( |A-\lambda I|&=\begin{vmatrix}1-\lambda&2&1\\0&1-\lambda&0\\-1&0&3-\lambda\end{vmatrix}\\ &=(1-\lambda)\begin{vmatrix}1-\lambda&1\\-1&3-\lambda\end{vmatrix}\\ &=(1-\lambda)\{(1-\lambda)(3-\lambda)+1\}\\ &=(1-\lambda)(\lambda^2-4\lambda+4)\\ &=(1-\lambda)(2-\lambda)^2\\ &=0 );

が２重解なので、こちらに対応する固有ベクトルを求めてみる。

&math( &(A-\lambda I)\bm x=\begin{bmatrix}-1&2&1\\0&1&0\\-1&0&1\end{bmatrix}\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix}\\ &\rightarrow \begin{cases}x-z=0\\y=0\end{cases}\\ );

掃き出せないをパラメータに置くと、

となり、をどのように選んでも２つの一次独立な固有ベクトルを見つけることができない。

すなわち、は対角化不可能。

行列の三角化†

対角化が必ずしも可能とは限らないのに対して、
三角化は任意の行列に対して必ず可能である。
→ 定理 6.2

証明には数学的帰納法を使う：

次の時に三角化可能
次が三角化可能であれば次が三角化可能

1. については、はそれ自身が三角行列であるから明らかに三角化可能

2. について、

次正方行列の固有値に対する固有ベクトルをとする。 (固有値・固有ベクトルの組は必ず１つは求まる）

このに対して、

が正則となるようにを定めると（これは常に可能である）、

&math(R^{-1}AR\bm e_1=R^{-1}A(R\bm e_1)=R^{-1}A\bm r_1=R^{-1}\lambda\bm r_1=R^{-1}\lambda R\bm e_1 = \lambda \bm e_1);

であるから、の一列目は第一要素が、その他がであり、

&math( R^{-1}AR=\begin{bmatrix} \lambda_1&\bm b\\ \bm o&A_1 \end{bmatrix} );

と書き表すことができる。ここで、は内容不定な行ベクトルである。

もし次の行列が正則行列により三角化可能であるとすれば、

&math(Q^{-1}A_1Q=D= \begin{bmatrix} \lambda_2&*&\dots&*\\ 0&\lambda_3&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_n \end{bmatrix} );

上記のとを用いて、

&math(P=R\begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix} );

なるベクトルを作れば、

&math(P^{-1}=\begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix}R^{-1} );

であるからは正則で、

&math( P^{-1}AP=\begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix}R^{-1} A R\begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix}= \begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix} \begin{bmatrix} \lambda_1&\bm b\\ \bm o&A_1 \end{bmatrix} \begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix}=\\ \ \\ \begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix} \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&A_1Q \end{bmatrix} = \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&Q^{-1}A_1Q \end{bmatrix} = \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&\begin{bmatrix}

 \lambda_2&*&\dots&*\\
 0&\lambda_3&&\vdots\\
 \vdots&&\ddots&*\\
 0&&0&\lambda_n\\

\end{bmatrix} \end{bmatrix} );

であるからにより次行列を三角化可能である。

したがって、任意の次数の行列について、を三角行列にするようなが存在することが証明された。

対角化の実用性†

対角行列の性質を確認する。

対角行列の累乗†

対角行列を

とすれば、

である。

同様に、

となる。

対角行列の多項式†

&math(\alpha D^l+\beta D^m=\alpha \begin{bmatrix}a^l&0\\0&d^l\end{bmatrix}+\beta \begin{bmatrix}a^m&0\\0&d^m\end{bmatrix} =\begin{bmatrix}\alpha a^l+\beta a^m&0\\0&\alpha d^l+\beta d^m\end{bmatrix});

元の式と、
結果の対角要素、
の類似性に注目せよ。

一般の行列の累乗†

を次の行列として、により対角化可能とする。

&math(P^{-1}AP=D= \begin{bmatrix} \lambda_1&0&\dots&0\\ 0&\lambda_2&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n \end{bmatrix} );

すると、

&math((P^{-1}AP)^m=P^{-1}APP^{-1}AP\dots P^{-1}AP= P^{-1}A^mP= \begin{bmatrix} \lambda_1^m&0&\dots&0\\ 0&\lambda_2^m&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n^m \end{bmatrix} )

より、

&math(A^m = P \begin{bmatrix} \lambda_1^m&0&\dots&0\\ 0&\lambda_2^m&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n^m \end{bmatrix} P^{-1} )

と表せる。

左辺を普通に計算しようとすれば回の行列のかけ算が必要になるが、右辺は数値のと、２回の行列のかけ算で済むため計算量が少なく、また理論的にも見通しがよい。

一般の行列の多項式†

を任意の多項式として、

を次のように定義する。

（ゼロ次項に単位行列が掛かっていることに注意せよ）

すると、

&math(g(P^{-1}AP)&=a_0I+a_1(P^{-1}AP)+a_2(P^{-1}AP)^2+a_3(P^{-1}AP)^3+\dots\\ &=a_0P^{-1}P+a_1(P^{-1}AP)+a_2(P^{-1}AP)^2+a_3(P^{-1}AP)^3+\dots\\ &=a_0P^{-1}P+a_1P^{-1}AP+a_2P^{-1}A^2P+a_3P^{-1}A^3P+\dots\\ &=P^{-1}(a_0+a_1A+a_2A^2+a_3A^3+\dots)P\\ &=P^{-1}g(A)P\\ &= \begin{bmatrix} g(\lambda_1)&0&\dots&0\\ 0&g(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(\lambda_n) \end{bmatrix} );

したがって、

&math( g(A)= &= P \begin{bmatrix} g(\lambda_1)&0&\dots&0\\ 0&g(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(\lambda_n) \end{bmatrix} P^{-1} );

のように、任意の行列の多項式を、対角化を用いて固有値の多項式に関連づけることができる。

行列の超関数†

指数関数のテイラー展開は、

であるから、

&math(ae^{bA}=a\sum_{k=0} \frac{1}{k!}(bA)^k= aP \begin{bmatrix} g(b\lambda_1)&0&\dots&0\\ 0&g(b\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(b\lambda_n) \end{bmatrix} P^{-1});

などとして、「行列の指数関数」を定義できる。

このような関数が量子力学他で利用される。

ケーリーハミルトンの定理†

上記のとして、の固有多項式を取れば、

&math(f_A(A)= P \begin{bmatrix} f_A(\lambda_1)&0&\dots&0\\ 0&f_A(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&f_A(\lambda_n) \end{bmatrix} P^{-1} );

ところが、は固有方程式の解であるから、はすべてゼロになって、

&math(f_A(A)= P \begin{bmatrix} 0&0&\dots&0\\ 0&0&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&0 \end{bmatrix} P^{-1} =POP^{-1}=O );

となる。

例：

&math( A=\begin{bmatrix} 0&-1\\ 1&1\\ \end{bmatrix} );

とすれば、

&math( f_A(\lambda)=|A-\lambda I|=\begin{vmatrix} 0-\lambda&-1\\ 1&1-\lambda\\ \end{vmatrix}=

\lambda(1-\lambda)+1=\lambda^2-\lambda+1 );

したがって、ケーリー・ハミルトンの定理より、固有値や固有ベクトルを求めることなく、

が成立することが分かる。

これを用いると、

したがって、整数を６で割ったあまりをとすると、（ただし）

&math( A^n=A^{6k+l}=(A^6)^kA^l=I^6A^l=A^l= \begin{cases} I&(l=0)\\ A-I&(l=1)\\

A&(l=2)\\
I&(l=3)\\
A+I&(l=4)\\ A&(l=5)\\ \end{cases} );

と表せることが分かる。

注†

上記はが対角化可能な時のみの証明になっているが、ケーリーハミルトンの定理は対角化不能なでも成立する。

より、

&math(&P^{-1}f_A(A)P=f_A(P^{-1}AP)= (\lambda_1 I-P^{-1}AP)(\lambda_2 I-P^{-1}AP)\dots (\lambda_n I-P^{-1}AP)=\\ &\begin{bmatrix} 0&*&\dots&*\\ 0&\lambda_1-\lambda_2&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_1-\lambda_n \end{bmatrix} \begin{bmatrix} \lambda_2-\lambda_1&*&\dots&*\\ 0&0&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_2-\lambda_n \end{bmatrix} \dots \begin{bmatrix} \lambda_n-\lambda_1&*&\dots&*\\ 0&\lambda_n-\lambda_2&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&0 \end{bmatrix} =O\\ );

したがって、左から右からを掛ければ

となる。

注２†

上記でやり残した「固有値が重複度を持つ時、固有関数の自由度は以下である」を証明しよう。

行列の階数は正則行列のかけ算で変化しないから、

をを三角化するように取れば、

&math(P^{-1}AP-\lambda_k= \begin{bmatrix} \lambda_1-\lambda_k&*&\dots&*\\ 0&\lambda_2-\lambda_k&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_n-\lambda_k \end{bmatrix} );

個の対角成分のうち個がゼロとなり、個は非ゼロである。

完全にゼロとなる行を上に詰めれば、この行列は階段行列となるが、その際の

[Math Conversion Error]

Counter: 513140 (from 2010/06/03), today: 83, yesterday: 215