固有値と固有ベクトル のバックアップ(No.4)

更新


線形代数I

固有値問題

Ax と x との関係

正方行列 A を考える。

通常、 A\bm x は元のベクトル \bm x と必ずしも平行にならない。

A\bm x \ne k\bm x

例:

&math( A=\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} );

\bm x_1=\begin{bmatrix} 2 \\ 1 \end{bmatrix} であれば A\bm x_1=\begin{bmatrix} 7 \\ 5 \end{bmatrix}\ne k\bm x_1

しかし、 \bm x をうまく選ぶと A\bm x\parallel\bm x となる場合がある。

\bm x_2=\begin{bmatrix} 1 \\ 1 \end{bmatrix} であれば A\bm x_2=\begin{bmatrix} 4 \\ 4 \end{bmatrix}=4\begin{bmatrix} 1 \\ 1 \end{bmatrix}=4\bm x_2

\bm x_3=\begin{bmatrix} 1 \\ -1 \end{bmatrix} であれば A\bm x_3=\begin{bmatrix} 2 \\ -2 \end{bmatrix}=2\begin{bmatrix} 1 \\ -1 \end{bmatrix}=2\bm x_3

これらのベクトルについては、 A\bm x が元のベクトル \bm x と平行になっている。

固有値問題

与えられた正方行列 A に対して、 \lambda \bm x

A\bm x=\lambda\bm x

を満たすとき、

  • \lambda A 固有値
    (ギリシャ文字の "ラムダ" で書くのが慣例)
  • \bm x A の固有値 \lambda に属する 固有ベクトル

と呼ぶ。

固有値問題 とは、
与えられた正方行列 A に対して、 固有値と固有ベクトルを(すべて)求める問題である。

どんな役にたつ?

この授業でもやるように、「行列の対角化」の基礎となる。
→ 行列の対角化は広い範囲の応用がある

特に量子力学では固有値、固有ベクトルが主要な役割を担う。

注意

\bm x=\bm o とすると、

A\bm o=\lambda \bm o=\bm o

は任意の \lambda に対して成り立ってしまう。

この 自明な解 \bm x=\bm o は固有ベクトルに含めない。

固有値問題の解法

まずは固有値を求めよう。

A\bm x=\lambda \bm x

が成り立つとすれば、これに単位行列 I を掛けて、

A\bm x=\lambda I \bm x

と書ける。すると、

A\bm x-\lambda I \bm x=(A-\lambda I)\bm x=\bm o

が成立しなければならない。

行列 (A-\lambda I) が正則である場合(逆行列を持つ場合)、 上式の左から逆行列を掛けると、

  • (左辺) =(A-\lambda I)^{-1}(A-\lambda I)\bm x=\bm x
  • (右辺) =(A-\lambda I)^{-1}\bm o=\bm o

となり、 \bm x=\bm o が導かれてしまう。

すなわち、ある \lambda について行列 (A-\lambda I) が正則になる時、 固有ベクトルは存在しない

したがって、正則でなくなるための条件

|A-\lambda I|=0

固有ベクトルが存在するための \lambda に対する必要条件 であることが分かる。

固有値 \lambda が満たすこの方程式は 「行列 A の固有方程式」 と呼ばれる。

得られた \lambda に対して、 A\bm x=\lambda\bm x を変形した

(A-\lambda I)\bm x=\bm o

\bm x について解けば固有ベクトルが求まる。

下に見るように、固有方程式を満たす \lambda に対しては必ず \bm x を求められる。

→ 固有方程式は \lambda が固有値となるための必要十分条件である

手順をまとめると

固有値問題を解くための手順は次の通り:

  • 固有方程式 |A-\lambda I|=0 から \lambda を(いくつか)求める
  • (個々の \lambda について)  (A-\lambda I)\bm x=\bm o を解いて \bm x を求める

したがって、

  • 一般には1つの行列 A が複数の固有値 \lambda_1,\lambda_2,\lambda_3,\dots を持つ(1つのこともある)
  • それぞれの固有値には、その固有値に属する固有ベクトルが(場合によっては複数)存在する
    • \lambda_1 \bm x_{\lambda_1}^{(1)}, \bm x_{\lambda_1}^{(2)}, \dots
    • \lambda_2 \bm x_{\lambda_2}^{(1)}, \bm x_{\lambda_2}^{(2)}, \dots
    •  :
    •  :

具体例

&math( A=\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} );

のとき、

&math(A-\lambda I&= \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix}

  • \lambda \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} \\&= \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} \begin{bmatrix} \lambda & 0 \\ 0 & \lambda \end{bmatrix} \\&= \begin{bmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{bmatrix} );

&math( |A-\lambda I| &= \begin{vmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{vmatrix} \\&= (3-\lambda)^2-1^2 \\&= (3-\lambda+1)(3-\lambda-1) \\&= (4-\lambda)(2-\lambda) );

&math( \therefore \lambda=2,4 );

固有ベクトルは \lambda のそれぞれの値に対して個別に求める。

\lambda=2 の時

&math( (A-\lambda I)\bm x &= \begin{bmatrix} 3-2 & 1 \\ 1 & 3-2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \bm o = \begin{bmatrix} 0 \\ 0 \end{bmatrix} );

\bm x を求める手順は (A-\lambda I) を係数行列とする 連立方程式を解くことに帰着する。

拡大係数行列を行に対する基本変形を用いて階段化すると、

&math( \begin{bmatrix} 1 & 1 & 0\\ 1 & 1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & 1 & 0\\ 0 & 0 & 0 \end{bmatrix} );

\therefore x+y=0

掃き出せなかった列に対応する y をパラメータに置き、 y=s とすれば、

x=-s

\therefore \bm x=s\begin{bmatrix}-1\\1\end{bmatrix}

同様に、

\lambda=4 の時

&math( (A-\lambda I)\bm x &= \begin{bmatrix}

  • 1 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \bm o );

&math( \begin{bmatrix}

  • 1 & 1 & 0\\ 1 & -1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & -1 & 0\\ 1 & -1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & -1 & 0\\ 0 & 0 & 0 \end{bmatrix} );

\therefore x-y=0 そこで y=t と置けば、

x=t

\therefore \bm x=t\begin{bmatrix}1\\1\end{bmatrix}

まとめると、 A は、
固有値 \lambda=2 とそれに属する固有ベクトル \bm x=s\begin{bmatrix}-1\\1\end{bmatrix}
固有値 \lambda=4 とそれに属する固有ベクトル \bm x=t\begin{bmatrix}1\\1\end{bmatrix}
を持つ。ただし、 s,t は任意の数を表すパラメータである。

注意

固有方程式より (A-\lambda I) が正則でない、すなわち \mathrm{rank}\,(A-\lambda I)<n が保証されている。

固有ベクトルを求める連立方程式は斉次であるため、 係数行列の rank は拡大係数行列の rank と一致することになり、 最後に得られる階段行列の最終行は必ず 0=0 の形になる。

すなわち n 列のうち掃き出せない列が必ず1列以上存在し、 解 \bm x はパラメータを含む形となる。 言い換えれば、無数の解が得られることになる。

これは、固有方程式が固有値の満たすべき必要条件であるだけでなく、 十分条件になっていることを表している(固有方程式を満たす \lambda は必ず固有値となる)。

注)固有方程式の解を用いたにもかかわらず、連立方程式が 無数の解を持つ形にならない場合には、 どこかで計算を間違えているため見直すべきである。

固有方程式が解を持たない場合

固有方程式が解を持たない場合があるだろうか?

例:  A=\begin{bmatrix}\cos \theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}

\theta\ne n\pi の時、 A は回転を表すため、 任意のベクトルが元とは異なる方向へ向くことになる
→ すなわち、元のベクトルと平行にならない。
→ すると、固有ベクトルは1つも存在しないはず!
→ 固有値も存在しないはず!

&math(|A-\lambda I|= \begin{vmatrix}

\cos \theta-\lambda & -\sin\theta \\
\sin\theta & \cos\theta -\lambda

\end{vmatrix} =0 );

(\cos \theta-\lambda)^2+\underbrace{(\sin\theta)^2}_{>\,0}=0

\sin\theta\ne 0 では、左辺第2項が正となるから、 この方程式を満たす \lambda は確かに存在しない・・・
→ 本当?

いや、複素数の範囲 でなら存在する!

(\cos \theta-\lambda)^2=-(\sin\theta)^2

\cos \theta-\lambda=\pm i\sin\theta

\lambda=\cos \theta \pm i\sin\theta

2つの解が得られたので場合分けをして:

\lambda=\cos \theta + i\sin\theta の時

&math((A-\lambda I)\bm x&= \begin{bmatrix}

\cos \theta-\lambda & -\sin\theta \\
\sin\theta & \cos\theta -\lambda

\end{bmatrix} \bm x = \begin{bmatrix}

-i\sin\theta & -\sin\theta \\
\sin\theta & -i\sin\theta

\end{bmatrix} \bm x\\ &= \sin\theta \begin{bmatrix}

-i & -1 \\
1 & -i

\end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0 );

&math( \begin{bmatrix}

-i & -1 & 0 \\
1 & -i & 0

\end{bmatrix} ); 一行目に i を掛けてみる

&math( = \begin{bmatrix}

1 & -i & 0 \\
1 & -i & 0

\end{bmatrix} );

&math( = \begin{bmatrix}

1 & -i & 0 \\
0 & 0 & 0

\end{bmatrix} );

x-iy=0 より y=s と置けば、

x=is

\therefore \bm x=s\begin{bmatrix} i \\ 1 \end{bmatrix}

\lambda=\cos \theta - i\sin\theta の時

&math((A-\lambda I)\bm x&= \begin{bmatrix}

i\sin\theta & -\sin\theta \\
\sin\theta & i\sin\theta

\end{bmatrix} \bm x\\ &= \sin\theta \begin{bmatrix}

i & -1 \\
1 & i

\end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0 );

&math( \begin{bmatrix}

i & -1 & 0 \\
1 & i & 0

\end{bmatrix} ); 一行目に i を掛けて

&math( = \begin{bmatrix}

-1 & -i & 0 \\
1 & i & 0

\end{bmatrix} );

&math( = \begin{bmatrix}

1 & i & 0 \\
0 & 0 & 0

\end{bmatrix} );

x+iy=0 より y=t と置けば、

x=-it

\therefore \bm x=t\begin{bmatrix} -i \\ 1 \end{bmatrix}

確認してみる:

&math(A\bm x= \begin{bmatrix}

\cos \theta & -\sin\theta \\
\sin\theta & \cos\theta

\end{bmatrix} \begin{bmatrix}

is \\  s

\end{bmatrix} = \begin{bmatrix}

is\cos \theta - s\sin\theta \\
is\sin\theta + s\cos\theta

\end{bmatrix} = s(\cos \theta + i\sin\theta) \begin{bmatrix}

i \\ 1

\end{bmatrix} );

&math(A\bm x= \begin{bmatrix}

\cos \theta & -\sin\theta \\
\sin\theta & \cos\theta

\end{bmatrix} \begin{bmatrix}

-it \\  t

\end{bmatrix} = \begin{bmatrix}

-it\cos \theta - t\sin\theta \\
-it\sin\theta + t\cos\theta

\end{bmatrix} = t(\cos \theta - i\sin\theta) \begin{bmatrix}

-i \\ 1

\end{bmatrix} );

(騙されたみたい、に感じるけれど)ちゃんとうまく行く。

固有方程式の解

固有方程式の次数

固有方程式 |A-\lambda I|=0 は必ず \lambda n 次方程式となる。

なぜなら・・・

&math( |A-\lambda I| = \begin{vmatrix} a_{11} - \lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & & \vdots \\ \vdots & & \ddots & \\ a_{n1} & \cdots & & a_{nn}-\lambda \\ \end{vmatrix} = 0 );

一般に「行列式」は各行、各列から重複の無いように n 個の要素を抜き出して積を作り、 そのような積を可能な限り集めて和にした物であった。

行列式 = \sum_{(i_1,i_2,\dots,i_n)}\varepsilon (i_1,i_2,\dots,i_n) a_{1i_1}a_{2i_2}\dots a_{ni_n} = Σ (符号) × ( n 個の要素の積 )

したがって、行列式は対角要素を全て掛け合わせた項

(a_{11}-\lambda)(a_{22}-\lambda)\dots(a_{nn}-\lambda)

を含んでいる。この項は明らかに \lambda n 乗を含む。

また他の項( n 個の要素を掛け合わした物)が、 \lambda n より大きな次数の項を含むことはあり得ない。

&math(\therefore |A-\lambda I|= (a_{11}-\lambda)(a_{22}-\lambda)\dots(a_{nn}-\lambda)+);( \lambda n 次以下の項)

これは \lambda n 次方程式である。

代数学の基本定理

n 次方程式は複素数の範囲に必ず n 個の解を持つ。

というのが「代数学の基本定理」であった。

この定理から、それらの解を \lambda_1,\lambda_2,\dots,\lambda_n とすれば、

|A-\lambda I|=(\lambda_1-\lambda)(\lambda_2-\lambda)\dots(\lambda_n-\lambda)

と因数分解できる。

すなわち、これらすべての解が異なれば n 個の固有値が得られることになる。

重複解

実際には n 個のうちいくつかが等しい場合があり、 それらは「重複解」あるいは「重解」と呼ばれる。

上で n 個の解、と言っているのは重複解を個別に数えているので、 重複解がある場合には、

|A-\lambda I|=(\lambda_1-\lambda)^3(\lambda_2-\lambda)(\lambda_2-\lambda)^2\dots(\lambda_m-\lambda)

などとなって、独立な固有値の個数 m m\le n となる。

固有値の個数

重複度を含めて必ず n 個の固有値が存在する。

独立な固有値の個数 m 1 \le m\le n となる。

n=4 次行列

&math( A=\begin{bmatrix} 3 & 4 & -5 & 3 \\ 0 & 1 & 8 & 0 \\ 0 & 0 & 2 & -1 \\ 0 & 0 & 0 & 1 \end{bmatrix} );

について、

|A-\lambda I| = (3-\lambda)(2-\lambda)(1-\lambda)^2

したがって、

\lambda = 3, 2, 1

の3つの異なる固有値が見つかる。

ただし、1 は2重解であるため重複度を含めると行列の次数と等しい「4つ」の固有値が存在する。

固有ベクトルの自由度

行列 A に対して、ある固有値 \lambda が求まったとき、 \lambda に属する固有ベクトル \bm x を求める方程式は、 n n 連立の一次方程式となる。

すなわち、

&math( (A-\lambda I)\bm x= \begin{bmatrix} a_{11}-\lambda & a_{12} & \dots & a_{1n} \\ a_{21} & a_{11}-\lambda & & \vdots \\ \vdots & & \ddots & \vdots \\ a_{n1} & \dots & & a_{nn} - \lambda \end{bmatrix} \begin{bmatrix} x_1\\x_2\\\vdots\\x_n \end{bmatrix} = \begin{bmatrix} 0\\0\\\vdots\\0 \end{bmatrix} =\bm o );

のことである。

階数の定義より、上記連立方程式の拡大係数行列を行に対する基本変形で階段行列化した際には 非ゼロの行が \rank (A-\lambda I) 行、ゼロの行が n-\rank (A-\lambda I) 行現われる。

&math( \begin{bmatrix} a_{11}-\lambda & a_{12} & \dots & a_{1n} & 0 \\ a_{21} & a_{11}-\lambda & & \vdots & \vdots \\ \vdots & & \ddots & \vdots & \vdots \\ a_{n1} & \dots & \dots & a_{nn} - \lambda & 0 \end{bmatrix} \sim \begin{bmatrix}

* & * & \dots & * & 0 \\ 

\vdots & \vdots & & \vdots & \vdots \\

* & * & \dots & * & 0 \\

0 & 0 & \dots & 0 & 0 \\ \vdots & \vdots & & \vdots & \vdots \\

0 & 0 & \dots & 0 & 0 \\

\end{bmatrix} \begin{array}{ll} \Bigg\} \ \rank (A-\lambda I)\\ \\ \Bigg\} \ n- \rank (A-\lambda I)\\ \end{array} );

ここで係数行列 A-\lambda I は正則ではないため、 \rank (A-\lambda I) < n であり、 ゼロの行が必ず1行以上現われることになる。

このように、 n 個の変数 \bm x_1,\bm x_2,\dots,\bm x_n に対して独立な式の数が \rank (A-\lambda I) 個しかないため、 これを解いた解には n-\rank (A-\lambda I) 個の未定係数(パラメータ)が現われることになる。

&math( \bm x = c^{(1)}\begin{bmatrix} x_1^{(1)}\\x_2^{(1)}\\ \vdots \\x_n^{(1)}\\ \end{bmatrix}

  1. c^{(2)}\begin{bmatrix} x_1^{(2)}\\x_2^{(2)}\\ \vdots \\x_n^{(2)}\\ \end{bmatrix}
  2. \dots + c^{(m)}\begin{bmatrix} x_1^{(m)}\\x_2^{(m)}\\ \vdots \\x_n^{(m)}\\ \end{bmatrix} );

ただし、 c^{(1)},c^{(2)},\dots,c^{(m)} は任意係数であり、

m=n-\rank (A-\lambda I)

である。

\bm x に含まれる任意パラメータの数 m が、 「固有ベクトルの自由度」である。

すなわち、固有ベクトルの自由度は、対応する \lambda に対して n-\rank (A-\lambda I) となることが言えたことになる。

繰り返しになるが、 \rank (A-\lambda I)<n であるため、 すべての固有値に対する固有ベクトルは最低1以上の自由度を持つ。

以上は、「行列の階数」のところでやった「連立一次方程式の解の自由度」の部分を ほぼそのままなぞる形の議論であるため、関連して復習せよ。

注意

教科書では同じ量を「固有空間の次元」と呼んでいる。 「次元」は線形代数Iの授業の範囲外であるため、 ここではあくまで「自由度」あるいは「パラメータの数」として理解していれば良い。

固有ベクトルの一次独立性

A の異なる固有値に属する固有ベクトルは1次独立である」

この意味は、

「行列 A の固有値の中から、 r 個の異なる固有値 \lambda_1,\lambda_2,\dots,\lambda_r を選び出し、これらに対応する固有ベクトルをそれぞれ1つ選んで \bm x_1,\bm x_2,\dots,\bm x_r とすれば、 この r 個のベクトルは一次独立である」

ということである。

まず確認:

\bm x_1,\bm x_2,\dots,\bm x_r が一次独立」の意味は、 「 c_1\bm x_1+c_2\bm x_2+\dots+c_r\bm x_r=0 が成り立つと仮定すれば c_1=c_2=\dots=c_n を導けること」であった。

以下は数学的帰納法を用いた証明:

r=1 の時には、固有ベクトル \bm x_1 \bm x_1\ne \bm o を満たすため、 c_1\bm x_1=\bm o から明らかに c_1=0 が導かれ、 \bm x_1 は一次独立である。

ベクトルが r-1 個の時は一次独立になると仮定して、 r 個でも一次独立になることを導く。
(線形結合がゼロになることからすべての係数がゼロであることを導く)

c_1\bm x_1+c_2\bm x_2+\dots+c_r\bm x_r=0 ・・・(*)

に左から A を掛ければ

&math( &c_1A\bm x_1+c_2A\bm x_2+\dots+c_rA\bm x_r=\\ &c_1\lambda_1\bm x_1+c_2\lambda_2\bm x_2+\dots+c_r\lambda_r\bm x_r=0);

一方、(*)に \lambda_r を掛ければ、

&math( c_1\lambda_r\bm x_1+c_2\lambda_r\bm x_2+\dots+c_r\lambda_r\bm x_r=0);

2つの式を引き算すると、

&math( &c_1(\lambda_1-\lambda_r)\bm x_1+c_2(\lambda_2-\lambda_r)\bm x_2+\dots+c_{r-1}(\lambda_{r-1}-\lambda_r)\bm x_{r-1}+c_r(\lambda_r-\lambda_r)\bm x_r=\\ &c_1(\lambda_1-\lambda_r)\bm x_1+c_2(\lambda_2-\lambda_r)\bm x_2+\dots+c_{r-1}(\lambda_{r-1}-\lambda_r)\bm x_{r-1}=0);

仮定より、異なる固有値に属する r-1 個の固有ベクトル \bm x_1,\bm x_2,\dots,\bm x_{r-1} は一次独立であるため、

c_1(\lambda_1-\lambda_r)=c_2(\lambda_2-\lambda_r)=\dots=c_{r-1}(\lambda_{r-1}-\lambda_r)=0

であり、すべての固有値が異なるという仮定から、

c_1=c_2=\dots=c_{r-1}=0

が導かれる。

さらにこれらを(*)に代入すれば、明らかに c_r=0 である。

すなわち、(*)から c_1=c_2=\dots=c_{r-1}=c_r=0 が導かれたことになり、 \bm x_1,\bm x_2,\dots,\bm x_r は一次独立であることが言えた。

r=1 で成り立つことと、
r-1 で成り立てば r で成り立つことから、
与えられた命題は全ての r に対して成り立つことが証明された。

相似な行列・相似変換

n 次正方行列 A に対して、 ある n 次正方行列 P を使って

A\rightarrow P^{-1}AP

とする変換を、「相似変換」と呼ぶ。

また、行列 B をある行列 P を使って B=P^{-1}AP と表せる時、 行列 B A と「相似である」という。

注記

このように定義した「相似」という概念は1つの「同値関係」を定義する。

すなわち、相似関係は以下の「同値関係の公理」を満たす。

  1. A A は相似である(反射率)
  2. A B が相似であれば、 B A も相似である(対称律)
  3. A B B C が相似ならば A) と &math(C も相似である(推移律)

固有値は相似変換に対して保存する

「相似変換に対して固有方程式は変化しない」

すなわち、 A と &math(P^{-1}AP) とは全く同じ固有方程式を持つ。

なぜなら、

&math( &|P^{-1}AP-\lambda I|=\\ &|P^{-1}AP-\lambda P^{-1}P|=\\ &|P^{-1}(A-\lambda I)P|=\\ &|P^{-1}|\,|(A-\lambda I)|\,|P|=\\ &|P|^{-1}\,|(A-\lambda I)|\,|P|=\\ &|A-\lambda I|=0\\ );

ここで、

  1. 行列の積の行列式は行列式の積である |AB|=|A||B|
  2. 単位行列の行列式は1である |I|=1
  3. 逆行列の行列式は元の行列の行列式の逆数である |P^{-1}|=|P|^{-1}
    \because |P^{-1}P|=|P^{-1}||P|=|I|=1

を使った。

この結果から、

P^{-1}AP A の固有値は重複度も含めて等しい」

ことが分かる。

行列の対角化・三角化

固有値と固有ベクトルを用いると、相似変換により行列の対角化ができる場合がある。


Counter: 382766 (from 2010/06/03), today: 9, yesterday: 0