固有値と固有ベクトルの履歴(No.6)

更新

線形代数Ｉ

固有値問題
固有値問題の解法
固有方程式が解を持たない場合
固有方程式の解
固有ベクトルの自由度
- 注意
固有ベクトルの一次独立性
相似な行列・相似変換
- 注記
固有値は相似変換に対して保存する
行列の対角化・三角化
対角化の実用性

培風館「教養の線形代数（五訂版）」に沿って行っている授業の授業ノート（の一部）です。

固有値問題†

Ax と x との関係†

正方行列を考える。

通常、は元のベクトルと必ずしも平行にならない。

例：

&math( A=\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} );

であれば

しかし、をうまく選ぶととなる場合がある。

であれば

これらのベクトルについては、が元のベクトルと平行になっている。

固有値問題†

与えられた正方行列に対して、、が

を満たすとき、

をの 固有値
（ギリシャ文字の "ラムダ" で書くのが慣例）
をの固有値に属する 固有ベクトル

と呼ぶ。

固有値問題 とは、
与えられた正方行列に対して、固有値と固有ベクトルを（すべて）求める問題である。

どんな役にたつ？†

この授業でもやるように、「行列の対角化」の基礎となる。
→ 行列の対角化は広い範囲の応用がある

特に量子力学では固有値、固有ベクトルが主要な役割を担う。

注意†

とすると、

は任意のに対して成り立ってしまう。

この 自明な解 は固有ベクトルに含めない。

固有値問題の解法†

まずは固有値を求めよう。

が成り立つとすれば、これに単位行列を掛けて、

と書ける。すると、

が成立しなければならない。

行列が正則である場合（逆行列を持つ場合）、上式の左から逆行列を掛けると、

(左辺)
(右辺)

となり、が導かれてしまう。

すなわち、あるについて行列が正則になる時、 固有ベクトルは存在しない。

したがって、正則でなくなるための条件

が 固有ベクトルが存在するためのに対する必要条件 であることが分かる。

固有値が満たすこの方程式は 「行列の固有方程式」 と呼ばれる。

得られたに対して、を変形した

をについて解けば固有ベクトルが求まる。

下に見るように、固有方程式を満たすに対しては必ずを求められる。

→ 固有方程式はが固有値となるための必要十分条件である

手順をまとめると†

固有値問題を解くための手順は次の通り：

固有方程式からを（いくつか）求める
（個々のについて）を解いてを求める

したがって、

一般には１つの行列が複数の固有値を持つ（１つのこともある）
それぞれの固有値には、その固有値に属する固有ベクトルが（場合によっては複数）存在する
- →
- →
- 　：
- 　：

具体例†

&math( A=\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} );

のとき、

&math(A-\lambda I&= \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix}

\lambda \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} \\&= \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} \begin{bmatrix} \lambda & 0 \\ 0 & \lambda \end{bmatrix} \\&= \begin{bmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{bmatrix} );

&math( |A-\lambda I| &= \begin{vmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{vmatrix} \\&= (3-\lambda)^2-1^2 \\&= (3-\lambda+1)(3-\lambda-1) \\&= (4-\lambda)(2-\lambda) );

&math( \therefore \lambda=2,4 );

固有ベクトルはのそれぞれの値に対して個別に求める。

① の時

&math( (A-\lambda I)\bm x &= \begin{bmatrix} 3-2 & 1 \\ 1 & 3-2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \bm o = \begin{bmatrix} 0 \\ 0 \end{bmatrix} );

を求める手順はを係数行列とする連立方程式を解くことに帰着する。

拡大係数行列を行に対する基本変形を用いて階段化すると、

&math( \begin{bmatrix} 1 & 1 & 0\\ 1 & 1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & 1 & 0\\ 0 & 0 & 0 \end{bmatrix} );

掃き出せなかった列に対応するをパラメータに置き、とすれば、

同様に、

② の時

&math( (A-\lambda I)\bm x &= \begin{bmatrix}

1 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \bm o );

&math( \begin{bmatrix}

1 & 1 & 0\\ 1 & -1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & -1 & 0\\ 1 & -1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & -1 & 0\\ 0 & 0 & 0 \end{bmatrix} );

そこでと置けば、

まとめると、は、
固有値とそれに属する固有ベクトル
固有値とそれに属する固有ベクトル
を持つ。ただし、は任意の数を表すパラメータである。

注意†

固有方程式よりが正則でない、すなわちが保証されている。

固有ベクトルを求める連立方程式は斉次であるため、係数行列の rank は拡大係数行列の rank と一致することになり、最後に得られる階段行列の最終行は必ずの形になる。

すなわち列のうち掃き出せない列が必ず１列以上存在し、解はパラメータを含む形となる。言い換えれば、無数の解が得られることになる。

これは、固有方程式が固有値の満たすべき必要条件であるだけでなく、十分条件になっていることを表している（固有方程式を満たすは必ず固有値となる）。

注）固有方程式の解を用いたにもかかわらず、連立方程式が無数の解を持つ形にならない場合には、どこかで計算を間違えているため見直すべきである。

固有方程式が解を持たない場合†

固有方程式が解を持たない場合があるだろうか？

例：　

の時、は回転を表すため、任意のベクトルが元とは異なる方向へ向くことになる
→ すなわち、元のベクトルと平行にならない。
→ すると、固有ベクトルは１つも存在しないはず！
→ 固有値も存在しないはず！

&math(|A-\lambda I|= \begin{vmatrix}

\cos \theta-\lambda & -\sin\theta \\
\sin\theta & \cos\theta -\lambda

\end{vmatrix} =0 );

では、左辺第２項が正となるから、この方程式を満たすは確かに存在しない・・・
→ 本当？

いや、複素数の範囲 でなら存在する！

２つの解が得られたので場合分けをして：

① の時

&math((A-\lambda I)\bm x&= \begin{bmatrix}

\cos \theta-\lambda & -\sin\theta \\
\sin\theta & \cos\theta -\lambda

\end{bmatrix} \bm x = \begin{bmatrix}

-i\sin\theta & -\sin\theta \\
\sin\theta & -i\sin\theta

\end{bmatrix} \bm x\\ &= \sin\theta \begin{bmatrix}

-i & -1 \\
1 & -i

\end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0 );

&math( \begin{bmatrix}

-i & -1 & 0 \\
1 & -i & 0

\end{bmatrix} ); 一行目にを掛けてみる

&math( = \begin{bmatrix}

1 & -i & 0 \\
1 & -i & 0

\end{bmatrix} );

&math( = \begin{bmatrix}

1 & -i & 0 \\
0 & 0 & 0

\end{bmatrix} );

よりと置けば、

② の時

&math((A-\lambda I)\bm x&= \begin{bmatrix}

i\sin\theta & -\sin\theta \\
\sin\theta & i\sin\theta

\end{bmatrix} \bm x\\ &= \sin\theta \begin{bmatrix}

i & -1 \\
1 & i

\end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0 );

&math( \begin{bmatrix}

i & -1 & 0 \\
1 & i & 0

\end{bmatrix} ); 一行目にを掛けて

&math( = \begin{bmatrix}

-1 & -i & 0 \\
1 & i & 0

\end{bmatrix} );

&math( = \begin{bmatrix}

1 & i & 0 \\
0 & 0 & 0

\end{bmatrix} );

よりと置けば、

確認してみる：

&math(A\bm x= \begin{bmatrix}

\cos \theta & -\sin\theta \\
\sin\theta & \cos\theta

\end{bmatrix} \begin{bmatrix}

is \\  s

\end{bmatrix} = \begin{bmatrix}

is\cos \theta - s\sin\theta \\
is\sin\theta + s\cos\theta

\end{bmatrix} = s(\cos \theta + i\sin\theta) \begin{bmatrix}

i \\ 1

\end{bmatrix} );

&math(A\bm x= \begin{bmatrix}

\cos \theta & -\sin\theta \\
\sin\theta & \cos\theta

\end{bmatrix} \begin{bmatrix}

-it \\  t

\end{bmatrix} = \begin{bmatrix}

-it\cos \theta - t\sin\theta \\
-it\sin\theta + t\cos\theta

\end{bmatrix} = t(\cos \theta - i\sin\theta) \begin{bmatrix}

-i \\ 1

\end{bmatrix} );

（騙されたみたい、に感じるけれど）ちゃんとうまく行く。

固有方程式の解†

固有方程式の次数†

固有方程式は必ずの次方程式となる。

なぜなら・・・

&math( |A-\lambda I| = \begin{vmatrix} a_{11} - \lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & & \vdots \\ \vdots & & \ddots & \\ a_{n1} & \cdots & & a_{nn}-\lambda \\ \end{vmatrix} = 0 );

一般に「行列式」は各行、各列から重複の無いように個の要素を抜き出して積を作り、そのような積を可能な限り集めて和にした物であった。

行列式 = = Σ (符号) × ( n 個の要素の積）

したがって、行列式は対角要素を全て掛け合わせた項

を含んでいる。この項は明らかにの乗を含む。

また他の項（個の要素を掛け合わした物）が、のより大きな次数の項を含むことはあり得ない。

&math(\therefore |A-\lambda I|= (a_{11}-\lambda)(a_{22}-\lambda)\dots(a_{nn}-\lambda)+);( の次以下の項)

これはの次方程式である。

代数学の基本定理†

次方程式は複素数の範囲に必ず個の解を持つ。

というのが「代数学の基本定理」であった。

この定理から、それらの解をとすれば、

と因数分解できる。

すなわち、これらすべての解が異なれば個の固有値が得られることになる。

重複解†

実際には個のうちいくつかが等しい場合があり、それらは「重複解」あるいは「重解」と呼ばれる。

上で個の解、と言っているのは重複解を個別に数えているので、重複解がある場合には、

などとなって、独立な固有値の個数はとなる。

固有値の個数†

重複度を含めて必ず個の固有値が存在する。

独立な固有値の個数はとなる。

例†

次行列

&math( A=\begin{bmatrix} 3 & 4 & -5 & 3 \\ 0 & 1 & 8 & 0 \\ 0 & 0 & 2 & -1 \\ 0 & 0 & 0 & 1 \end{bmatrix} );

について、

したがって、

の３つの異なる固有値が見つかる。

ただし、1 は２重解であるため重複度を含めると行列の次数と等しい「４つ」の固有値が存在する。

固有ベクトルの自由度†

行列に対して、ある固有値が求まったとき、に属する固有ベクトルを求める方程式は、元連立の一次方程式となる。

すなわち、

&math( (A-\lambda I)\bm x= \begin{bmatrix} a_{11}-\lambda & a_{12} & \dots & a_{1n} \\ a_{21} & a_{11}-\lambda & & \vdots \\ \vdots & & \ddots & \vdots \\ a_{n1} & \dots & & a_{nn} - \lambda \end{bmatrix} \begin{bmatrix} x_1\\x_2\\\vdots\\x_n \end{bmatrix} = \begin{bmatrix} 0\\0\\\vdots\\0 \end{bmatrix} =\bm o );

のことである。

階数の定義より、上記連立方程式の拡大係数行列を行に対する基本変形で階段行列化した際には非ゼロの行が行、ゼロの行が行現われる。

&math( \begin{bmatrix} a_{11}-\lambda & a_{12} & \dots & a_{1n} & 0 \\ a_{21} & a_{11}-\lambda & & \vdots & \vdots \\ \vdots & & \ddots & \vdots & \vdots \\ a_{n1} & \dots & \dots & a_{nn} - \lambda & 0 \end{bmatrix} \sim \begin{bmatrix}

* & * & \dots & * & 0 \\

\vdots & \vdots & & \vdots & \vdots \\

* & * & \dots & * & 0 \\

0 & 0 & \dots & 0 & 0 \\ \vdots & \vdots & & \vdots & \vdots \\

0 & 0 & \dots & 0 & 0 \\

\end{bmatrix} \begin{array}{ll} \Bigg\} \ \rank (A-\lambda I)\\ \\ \Bigg\} \ n- \rank (A-\lambda I)\\ \end{array} );

ここで係数行列は正則ではないため、であり、ゼロの行が必ず１行以上現われることになる。

このように、個の変数に対して独立な式の数が個しかないため、これを解いた解には個の未定係数（パラメータ）が現われることになる。

&math( \bm x = c^{(1)}\begin{bmatrix} x_1^{(1)}\\x_2^{(1)}\\ \vdots \\x_n^{(1)}\\ \end{bmatrix}

c^{(2)}\begin{bmatrix} x_1^{(2)}\\x_2^{(2)}\\ \vdots \\x_n^{(2)}\\ \end{bmatrix}
\dots + c^{(m)}\begin{bmatrix} x_1^{(m)}\\x_2^{(m)}\\ \vdots \\x_n^{(m)}\\ \end{bmatrix} );

ただし、は任意係数であり、

である。

に含まれる任意パラメータの数が、「固有ベクトルの自由度」である。

すなわち、固有ベクトルの自由度は、対応するに対してとなることが言えたことになる。

繰り返しになるが、であるため、すべての固有値に対する固有ベクトルは最低１以上の自由度を持つ。

以上は、「行列の階数」のところでやった「連立一次方程式の解の自由度」の部分をほぼそのままなぞる形の議論であるため、関連して復習せよ。

注意†

教科書では同じ量を「固有空間の次元」と呼んでいる。「次元」は線形代数Iの授業の範囲外であるため、ここではあくまで「自由度」あるいは「パラメータの数」として理解していれば良い。

固有ベクトルの一次独立性†

「の異なる固有値に属する固有ベクトルは１次独立である」

この意味は、

「行列の固有値の中から、個の異なる固有値を選び出し、これらに対応する固有ベクトルをそれぞれ１つ選んでとすれば、この個のベクトルは一次独立である」

ということである。

まず確認：

「が一次独立」の意味は、「が成り立つと仮定すればを導けること」であった。

以下は数学的帰納法を用いた証明：

の時には、固有ベクトルはを満たすため、から明らかにが導かれ、は一次独立である。

ベクトルが個の時は一次独立になると仮定して、個でも一次独立になることを導く。
（線形結合がゼロになることからすべての係数がゼロであることを導く）

・・・（＊）

に左からを掛ければ

&math( &c_1A\bm x_1+c_2A\bm x_2+\dots+c_rA\bm x_r=\\ &c_1\lambda_1\bm x_1+c_2\lambda_2\bm x_2+\dots+c_r\lambda_r\bm x_r=0);

一方、（＊）にを掛ければ、

&math( c_1\lambda_r\bm x_1+c_2\lambda_r\bm x_2+\dots+c_r\lambda_r\bm x_r=0);

２つの式を引き算すると、

&math( &c_1(\lambda_1-\lambda_r)\bm x_1+c_2(\lambda_2-\lambda_r)\bm x_2+\dots+c_{r-1}(\lambda_{r-1}-\lambda_r)\bm x_{r-1}+c_r(\lambda_r-\lambda_r)\bm x_r=\\ &c_1(\lambda_1-\lambda_r)\bm x_1+c_2(\lambda_2-\lambda_r)\bm x_2+\dots+c_{r-1}(\lambda_{r-1}-\lambda_r)\bm x_{r-1}=0);

仮定より、異なる固有値に属する個の固有ベクトルは一次独立であるため、

であり、すべての固有値が異なるという仮定から、

が導かれる。

さらにこれらを（＊）に代入すれば、明らかにである。

すなわち、（＊）からが導かれたことになり、は一次独立であることが言えた。

で成り立つことと、
で成り立てばで成り立つことから、
与えられた命題は全てのに対して成り立つことが証明された。

相似な行列・相似変換†

次正方行列に対して、ある次正方行列を使って

とする変換を、「相似変換」と呼ぶ。

また、行列をある行列を使ってと表せる時、行列はと「相似である」という。

注記†

このように定義した「相似」という概念は１つの「同値関係」を定義する。

すなわち、相似関係は以下の「同値関係の公理」を満たす。

とは相似である（反射率）
とが相似であれば、とも相似である（対称律）
と、とが相似ならばも相似である（推移律）

固有値は相似変換に対して保存する†

「相似変換に対して固有方程式は変化しない」

すなわち、ととは全く同じ固有方程式を持つ。

なぜなら、

&math( &|P^{-1}AP-\lambda I|=\\ &|P^{-1}AP-\lambda P^{-1}P|=\\ &|P^{-1}(A-\lambda I)P|=\\ &|P^{-1}|\,|(A-\lambda I)|\,|P|=\\ &|P|^{-1}\,|(A-\lambda I)|\,|P|=\\ &|A-\lambda I|=0\\ );

ここで、

行列の積の行列式は行列式の積である
単位行列の行列式は１である
逆行列の行列式は元の行列の行列式の逆数である

を使った。

この結果から、

「との固有値は重複度も含めて等しい」

ことが分かる。

行列の対角化・三角化†

固有値と固有ベクトルを用いると、相似変換により任意の行列の三角化が可能である。
固有値と固有ベクトルを用いると、相似変換により対角化ができる場合とできない場合がある。

相似変換による三角化・対角化とは？†

ある行列を正則行列によって相似変換して結果を三角行列あるいは対角行列にすること。
あるいは、そのような行列を見つけること。

三角化：

&math(P^{-1}AP= \begin{bmatrix} a'_{11}&*&*&\dots&*\\ 0&a'_{22}&*&\dots&*\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&*\\ 0&0&\dots&0&a'_{nn} \end{bmatrix} );

対角化：

&math(P^{-1}AP= \begin{bmatrix} a'_{11}&0&0&\dots&0\\ 0&a'_{22}&0&\dots&0\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&0\\ 0&0&\dots&0&a'_{nn} \end{bmatrix} );

注†

この教科書で「三角化」というのは「上三角化」のことを指している場合が多い。一般には下三角行列にすることも三角化と呼ばれる。

対角行列は三角行列であるから、対角化は三角化の特殊例である。

三角化（対角化）できたならば、対角成分は A の固有値である†

が三角行列の時、も三角行列である。

例：

なら、

三角行列の行列式は対角成分の積であるから、

一方、の固有多項式は、

両者を比べると、順番を除いて

、、・・・であることになる。

すなわち、三角化後の対角成分には重複度を含めた個の固有値が現われる。

&math(P^{-1}AP= \begin{bmatrix} \lambda_1&*&*&\dots&*\\ 0&\lambda_2&*&\dots&*\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&*\\ 0&0&\dots&0&\lambda_n \end{bmatrix} );

対角化するための P をどのように見つけるか†

準備：P の列ベクトルが固有ベクトルである場合を考える†

行列の列ベクトルをと置き、このうちが固有値に属する固有ベクトルであるとする。

このとき、の番目の列ベクトルについて考える。

一般に、行列に番目の基本ベクトルを左から掛けると、から番目の列ベクトルを取り出すことができる。

&math( B\bm e_k=\Bigg[\bm b_1\ \bm b_2\ \dots\ \bm b_n \Bigg]\begin{bmatrix} 0\\ \vdots\\ 0\\ 1\\ 0\\ \vdots\\ 0\\ \end{bmatrix} \begin{matrix} \\ \\ \\ \leftarrow k \\ \\ \\ \\ \end{matrix} = \bm b_k );

そこで、

&math((P^{-1}AP)\bm e_k=P^{-1}A(P\bm e_k)=P^{-1}A\bm p_k=P^{-1}\lambda\bm p_k= P^{-1}\lambda P\bm e_k=\lambda \bm e_k= \begin{bmatrix} 0\\ \vdots\\ 0\\ \lambda\\ 0\\ \vdots\\ 0\\ \end{bmatrix} \begin{matrix} \\ \\ \\ \leftarrow k \\ \\ \\ \\ \end{matrix} );

とすれば、の番目の列ベクトルは番目の成分にの固有値を持ち、残りがゼロとなる。

対角化†

したがって、の列ベクトルがすべて固有ベクトルであれば、

&math(P^{-1}AP= \begin{bmatrix} \lambda_1&0&0&\dots&0\\ 0&\lambda_2&0&\dots&0\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&0\\ 0&0&\dots&0&\lambda_n \end{bmatrix} );

と対角化できることになる。

対角化可能条件†

対角化は必ずしも可能ではない。
→ 本の固有ベクトルを並べて作ったが正則であれば対角化できるが、正則にならなければうまくいかない。

上で見たように、「が正則となるように本の固有ベクトルを選ぶことができる」というのが「行列を対角化できる」十分条件となる。

実はこれは必要条件でもある。

&math(P^{-1}AP= \begin{bmatrix} \lambda_1&0&0&\dots&0\\ 0&\lambda_2&0&\dots&0\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&0\\ 0&0&\dots&0&\lambda_n \end{bmatrix} );

として対角化できるとき、を右から掛ければ

左辺： &math( P^{-1}AP\bm e_k=P^{-1}A(P\bm e_k)=P^{-1}A\bm p_k );

右辺： &math( \begin{bmatrix} \lambda_1&0&0&\dots&0\\ 0&\lambda_2&0&\dots&0\\ 0&0&\ddots&&\vdots\\ \vdots&\vdots&&\ddots&0\\ 0&0&\dots&0&\lambda_n \end{bmatrix}\bm e_k = \lambda_k \bm e_k= \lambda_k P^{-1}P\bm e_k=P^{-1}(\lambda_k\bm p_k) );

すなわち、

左からを掛ければ

となって、の全ての列ベクトルはの固有ベクトルである。

より使いやすい条件†

教科書の P83 あたりでやったように「正則な行列の列ベクトルは一次独立である」

したがって、「が本の一次独立な固有ベクトルを持つこと」がを対角化できる条件となる。

n 個の異なる固有値を持つ場合†

は重複度を含めて個の固有値を持つから、
異なる固有値に属する固有ベクトルは一次独立である

から、

「固有値が全て異なる場合には本の一次独立な固有ベクトルが得られ対角化が可能である」

すなわち、の固有値がすべて異なるなら、対応する固有ベクトルを１つづつ取って [Math Conversion Error]

を作ればは一次独立になる。

固有値に重複解がある場合†

個の固有値のうち等しい物があれば、その固有値を重複解と呼ぶのであった。

固有値方程式が重複解を持つ場合、対角化が不可能な場合がある。

すべての固有値が、自身の重複度と同じ数の一次独立な固有ベクトルを持てば、全体で個の一次独立な固有ベクトルが得られる。
→ なぜなら固有値は重複度を含めて本あるから

逆に、ある固有値に属する固有ベクトルの自由度が固有値の重複度よりも小さくなるとき、行列は対角化できない。

（これを言うためには固有ベクトルの自由度が固有値の重複度を超えることがないことを言わなければならないが、この証明は三角化について学んでからにする）

対角化可能性の判別†

すべての固有値が、自身の重複度と同じ数の一次独立な固有ベクトルを持つことを確認すればよい

行列の三角化†

対角化が必ずしも可能とは限らないのに対して、
三角化は任意の行列に対して必ず可能である。
→ 定理 6.2

証明には数学的帰納法を使う：

次の時三角化可能
次が三角化可能であれば次が三角化可能

1. については、はそれ自身が三角行列であるから明らかに三角化可能

2. について、

次正方行列の固有値に対する固有ベクトルをとする。 (固有値・固有ベクトルの組は必ず１つは求まる）

このに対して、

が正則となるようにを定めると（これは常に可能である）、

&math(R^{-1}AR\bm e_1=R^{-1}A(R\bm e_1)=R^{-1}A\bm r_1=R^{-1}\lambda\bm r_1=R^{-1}\lambda R\bm e_1 = \lambda \bm e_1);

であるから、の一列目は第一要素が、その他がであり、

&math( R^{-1}AR=\begin{bmatrix} \lambda_1&\bm b\\ \bm o&A_1 \end{bmatrix} );

と書き表すことができる。ここで、は内容不定な行ベクトルである。

もし次の行列が正則行列により三角化可能であるとすれば、

&math(Q^{-1}A_1Q=D= \begin{bmatrix} \lambda_2&*&\dots&*\\ 0&\lambda_3&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_n \end{bmatrix} );

上記のとを用いて、

&math(P=R\begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix} );

なるベクトルを作れば、

&math(P^{-1}=\begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix}R^{-1} );

であるからは正則で、

&math( P^{-1}AP=\begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix}R^{-1} A R\begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix}= \begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix} \begin{bmatrix} \lambda_1&\bm b\\ \bm o&A_1 \end{bmatrix} \begin{bmatrix} 1&\bm o\\ \bm o&Q \end{bmatrix}=\\ \ \\ \begin{bmatrix} 1&\bm o\\ \bm o&Q^{-1} \end{bmatrix} \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&A_1Q \end{bmatrix} = \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&Q^{-1}A_1Q \end{bmatrix} = \begin{bmatrix} \lambda_1&\bm b Q\\ \bm o&\begin{bmatrix}

 \lambda_2&*&\dots&*\\
 0&\lambda_3&&\vdots\\
 \vdots&&\ddots&*\\
 0&&0&\lambda_n\\

\end{bmatrix} \end{bmatrix} );

であるからにより次行列を三角化可能である。

したがって、任意の次数の行列について、を三角行列にするようなが存在することが証明された。

対角化の実用性†

対角行列の性質を確認する。

対角行列の累乗†

対角行列を

とすれば、

である。

同様に、

となる。

対角行列の多項式†

&math(\alpha D^l+\beta D^m=\alpha \begin{bmatrix}a^l&0\\0&d^l\end{bmatrix}+\beta \begin{bmatrix}a^m&0\\0&d^m\end{bmatrix} =\begin{bmatrix}\alpha a^l+\beta a^m&0\\0&\alpha d^l+\beta d^m\end{bmatrix});

元の式と、
結果の対角要素、
の類似性に注目せよ。

一般の行列の累乗†

を次の行列として、により対角化可能とする。

&math(P^{-1}AP=D= \begin{bmatrix} \lambda_1&0&\dots&0\\ 0&\lambda_2&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n \end{bmatrix} );

すると、

&math((P^{-1}AP)^m=P^{-1}APP^{-1}AP\dots P^{-1}AP= P^{-1}A^mP= \begin{bmatrix} \lambda_1^m&0&\dots&0\\ 0&\lambda_2^m&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n^m \end{bmatrix} )

より、

&math(A^m = P \begin{bmatrix} \lambda_1^m&0&\dots&0\\ 0&\lambda_2^m&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n^m \end{bmatrix} P^{-1} )

と表せる。

左辺を普通に計算しようとすれば回の行列のかけ算が必要になるが、右辺は数値のと、２回の行列のかけ算で済むため計算量が少なく、また理論的にも見通しがよい。

一般の行列の多項式†

を任意の多項式として、

を次のように定義する。

（ゼロ次項に単位行列が掛かっていることに注意せよ）

すると、

&math(g(P^{-1}AP)&=a_0I+a_1(P^{-1}AP)+a_2(P^{-1}AP)^2+a_3(P^{-1}AP)^3+\dots\\ &=a_0P^{-1}P+a_1(P^{-1}AP)+a_2(P^{-1}AP)^2+a_3(P^{-1}AP)^3+\dots\\ &=a_0P^{-1}P+a_1P^{-1}AP+a_2P^{-1}A^2P+a_3P^{-1}A^3P+\dots\\ &=P^{-1}(a_0+a_1A+a_2A^2+a_3A^3+\dots)P\\ &=P^{-1}g(A)P\\ &= \begin{bmatrix} g(\lambda_1)&0&\dots&0\\ 0&g(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(\lambda_n) \end{bmatrix} );

したがって、

&math( g(A)= &= P \begin{bmatrix} g(\lambda_1)&0&\dots&0\\ 0&g(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(\lambda_n) \end{bmatrix} P^{-1} );

のように、任意の行列の多項式を、対角化を用いて固有値の多項式に関連づけることができる。

行列の超関数†

指数関数のテイラー展開は、

であるから、

&math(ae^{bA}=a\sum_{k=0} \frac{1}{k!}(bA)^k= aP \begin{bmatrix} g(b\lambda_1)&0&\dots&0\\ 0&g(b\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(b\lambda_n) \end{bmatrix} P^{-1});

などとして、「行列の指数関数」を定義できる。

このような関数が量子力学他で利用される。

ケーリーハミルトンの定理†

上記のとして、の固有多項式を取れば、

&math(f_A(A)= P \begin{bmatrix} f_A(\lambda_1)&0&\dots&0\\ 0&f_A(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&f_A(\lambda_n) \end{bmatrix} P^{-1} );

ところが、は固有方程式の解であるから、はすべてゼロになって、

&math(f_A(A)= P \begin{bmatrix} 0&0&\dots&0\\ 0&0&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&0 \end{bmatrix} P^{-1} =POP^{-1}=O );

となる。

例：

&math( A=\begin{bmatrix} 0&-1\\ 1&1\\ \end{bmatrix} );

とすれば、

&math( f_A(\lambda)=|A-\lambda I|=\begin{vmatrix} 0-\lambda&-1\\ 1&1-\lambda\\ \end{vmatrix}=

\lambda(1-\lambda)+1=\lambda^2-\lambda+1 );

したがって、ケーリー・ハミルトンの定理より、固有値や固有ベクトルを求めることなく、

が成立することが分かる。

これを用いると、

したがって、整数を６で割ったあまりをとすると、（ただし）

&math( A^n=A^{6k+l}=(A^6)^kA^l=I^6A^l=A^l= \begin{cases} I&(l=0)\\ A-I&(l=1)\\

A&(l=2)\\
I&(l=3)\\
A+I&(l=4)\\ A&(l=5)\\ \end{cases} );

と表せることが分かる。

注†

上記はが対角化可能な時のみの証明になっているが、ケーリーハミルトンの定理は対角化不能なでも成立する。

より、

&math(&P^{-1}f_A(A)P=f_A(P^{-1}AP)= (\lambda_1 I-P^{-1}AP)(\lambda_2 I-P^{-1}AP)\dots (\lambda_n I-P^{-1}AP)=\\ &\begin{bmatrix} 0&*&\dots&*\\ 0&\lambda_1-\lambda_2&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_1-\lambda_n \end{bmatrix} \begin{bmatrix} \lambda_2-\lambda_1&*&\dots&*\\ 0&0&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_2-\lambda_n \end{bmatrix} \dots \begin{bmatrix} \lambda_n-\lambda_1&*&\dots&*\\ 0&\lambda_n-\lambda_2&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&0 \end{bmatrix} =O\\ );

したがって、左から右からを掛ければ

となる。

注２†

上記でやり残した「固有値が重複度を持つ時、固有関数の自由度は以下である」を証明しよう。

行列の階数は正則行列のかけ算で変化しないから、

をを三角化するように取れば、

&math(P^{-1}AP-\lambda_k= \begin{bmatrix} \lambda_1-\lambda_k&*&\dots&*\\ 0&\lambda_2-\lambda_k&&\vdots\\ \vdots&&\ddots&*\\ 0&\dots&0&\lambda_n-\lambda_k \end{bmatrix} );

個の対角成分のうち個がゼロとなり、個は非ゼロである。

完全にゼロとなる行を上に詰めれば、この行列は階段行列となるが、その際の

[Math Conversion Error]

Counter: 513140 (from 2010/06/03), today: 83, yesterday: 215