固有値と固有ベクトル

更新


線形代数I

培風館「教養の線形代数(五訂版)」に沿って行っていた授業の授業ノート(の一部)です。

固有値問題

$A\bm x$と$\bm x$との関係

正方行列 A を考える。

A\bm x は元のベクトル \bm x と同じ次元を持つが、必ずしも平行にはならない。

A\bm x \ne k\bm x

例:

  A=\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix}

  \bm x_1=\begin{bmatrix} 2 \\ 1 \end{bmatrix} であれば   A\bm x_1=\begin{bmatrix} 7 \\ 5 \end{bmatrix}\ne k\bm x_1

しかし、 \bm x をうまく選ぶと A\bm x\parallel\bm x となる場合がある。

  \bm x_2=\begin{bmatrix} 1 \\ 1 \end{bmatrix} であれば   A\bm x_2=\begin{bmatrix} 4 \\ 4 \end{bmatrix}=4\begin{bmatrix} 1 \\ 1 \end{bmatrix}=4\bm x_2

  \bm x_3=\begin{bmatrix} 1 \\ -1 \end{bmatrix} であれば   A\bm x_3=\begin{bmatrix} 2 \\ -2 \end{bmatrix}=2\begin{bmatrix} 1 \\ -1 \end{bmatrix}=2\bm x_3

固有値問題

与えられた正方行列 A に対して、 \lambda \bm x

A\bm x=\lambda\bm x

を満たすとき、

  • \lambda A 固有値
    (ギリシャ文字の "ラムダ" で書くのが慣例)
  • \bm x A の固有値 \lambda に属する 固有ベクトル

と呼ぶ。

固有値問題 とは、
与えられた正方行列 A に対して、 固有値と固有ベクトルを(すべて)求める問題である。

どんな役にたつ?

「固有値」は名前が示すとおり、行列の性質を表す重要な指標となる。

同じ固有値を持つ行列同士の間には深い関係がある。
→ 行列の相似、行列式、トレースとの関係、基底変換との関係

この授業でもやるように、「行列の対角化」の基礎となる。
→ 行列の対角化は幅広い応用がある

特に量子力学では固有値、固有ベクトルが主要な役割を担う。

注意

\bm x=\bm o とすると、

A\bm o=\lambda \bm o=\bm o

は任意の \lambda に対して成り立ってしまう。

この 自明な解 \bm x=\bm o は固有ベクトルに含めない。

固有値問題の解法

まずは固有値を求めよう。

A\bm x=\lambda \bm x

が成り立つとすれば、これに単位行列 I を掛けて、

A\bm x=\lambda I \bm x

と書ける。すると、

A\bm x-\lambda I \bm x=(A-\lambda I)\bm x=\bm o

が成立しなければならない。

行列 (A-\lambda I) が正則である場合(逆行列を持つ場合)、 上式の左から逆行列を掛けると、

  • (左辺) =(A-\lambda I)^{-1}(A-\lambda I)\bm x=\bm x
  • (右辺) =(A-\lambda I)^{-1}\bm o=\bm o

となり、 \bm x=\bm o が導かれてしまう。

すなわち、ある \lambda について行列 (A-\lambda I) が正則になったなら、 その \lambda に対して 固有ベクトルは存在しない

つまり、正則でなくなるための条件

|A-\lambda I|=0

固有ベクトルが存在するための \lambda に対する必要条件 であることが分かる。

固有値 \lambda が満たすこの方程式は 「行列 A の固有方程式」 と呼ばれる。

固有方程式を解いて得られた \lambda に対して、

A\bm x=\lambda\bm x \bm x について解く、

あるいはこれを変形した、

(A-\lambda I)\bm x=\bm o \bm x について解けば、

\lambda に対応する固有ベクトルが求まる。

下に見るように、固有方程式を満たす \lambda に対して、

\bm x\ne \bm 0 となる解が必ず存在する。

→ 固有方程式は \lambda が固有値となるための十分条件でもある

手順をまとめると

固有値問題を解く手順:

  • 固有方程式 |A-\lambda I|=0 から \lambda を(いくつか)求める
  • (それぞれの \lambda について)  (A-\lambda I)\bm x=\bm o を解いて \bm x を求める

したがって、

  • 一般に、1つの行列 A が複数の固有値 \lambda_1,\lambda_2,\lambda_3,\dots を持つ(もちろん1つのこともある)
  • それぞれの固有値には、その固有値に属する固有ベクトルが(場合によっては複数)存在する
    • \lambda_1 \bm x_{\lambda_1}^{(1)}, \bm x_{\lambda_1}^{(2)}, \dots
    • \lambda_2 \bm x_{\lambda_2}^{(1)}, \bm x_{\lambda_2}^{(2)}, \dots
    •  :
    •  :

具体例

A=\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix}

のとき、

A-\lambda I&= \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} - \lambda \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} \\&= \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} - \begin{bmatrix} \lambda & 0 \\ 0 & \lambda \end{bmatrix} \\&= \begin{bmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{bmatrix}

|A-\lambda I| &= \begin{vmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{vmatrix} \\&= (3-\lambda)^2-1^2 \\&= (3-\lambda+1)(3-\lambda-1) \\&= (4-\lambda)(2-\lambda)

\therefore \lambda=2,4

固有ベクトルは \lambda のそれぞれの値に対して個別に求める。

\lambda=2 の時

(A-\lambda I)\bm x &= \begin{bmatrix} 3-2 & 1 \\ 1 & 3-2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \bm o = \begin{bmatrix} 0 \\ 0 \end{bmatrix}

\bm x を求める手順は (A-\lambda I) を係数行列とする 連立方程式を解くことに帰着する。

拡大係数行列を行に対する基本変形を用いて階段化すると、

\begin{bmatrix} 1 & 1 & 0\\ 1 & 1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & 1 & 0\\ 0 & 0 & 0 \end{bmatrix}

\therefore x+y=0

掃き出せなかった列に対応する y をパラメータに置き、 y=s とすれば、

x=-s

\therefore \bm x=s\begin{bmatrix}-1\\1\end{bmatrix}

同様に、

\lambda=4 の時

(A-\lambda I)\bm x &= \begin{bmatrix} -1 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \bm o

\begin{bmatrix} -1 & 1 & 0\\ 1 & -1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & -1 & 0\\ 1 & -1 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & -1 & 0\\ 0 & 0 & 0 \end{bmatrix}

\therefore x-y=0 そこで y=t と置けば、

x=t

\therefore \bm x=t\begin{bmatrix}1\\1\end{bmatrix}

まとめると、 A は、
固有値 \lambda=2 とそれに属する固有ベクトル \bm x=s\begin{bmatrix}-1\\1\end{bmatrix}
固有値 \lambda=4 とそれに属する固有ベクトル \bm x=t\begin{bmatrix}1\\1\end{bmatrix}
を持つ。ただし、 s,t は任意の(正確を期すなら非ゼロの)数を表すパラメータである。

固有方程式が解を持たない場合

固有方程式が解を持たない場合があるだろうか?

例:  A=\begin{bmatrix}\cos \theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}

\theta\ne n\pi の時、 A は回転を表すため、 任意のベクトルが元とは異なる方向を向く
→ すなわち、元のベクトルと平行にならない。
→ すると、固有ベクトルは1つも存在しないはず!
→ 固有値も存在しないはず!

|A-\lambda I|= \begin{vmatrix} \cos \theta-\lambda & -\sin\theta \\ \sin\theta & \cos\theta -\lambda \end{vmatrix} =0

(\cos \theta-\lambda)^2+\underbrace{(\sin\theta)^2}_{>\,0}=0

\sin\theta\ne 0 では、左辺第2項が正となるから、 この方程式を満たす \lambda は確かに存在しない・・・
→ 本当?

いや、複素数の範囲 でなら存在する!

(\cos \theta-\lambda)^2=-(\sin\theta)^2

\cos \theta-\lambda=\pm i\sin\theta

\lambda=\cos \theta \pm i\sin\theta

2つの解が得られたので場合分けをして:

\lambda=\cos \theta + i\sin\theta の時

(A-\lambda I)\bm x&= \begin{bmatrix} \cos \theta-\lambda & -\sin\theta \\ \sin\theta & \cos\theta -\lambda \end{bmatrix} \bm x = \begin{bmatrix} -i\sin\theta & -\sin\theta \\ \sin\theta & -i\sin\theta \end{bmatrix} \bm x\\ &= \sin\theta \begin{bmatrix} -i & -1 \\ 1 & -i \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0

\begin{bmatrix} -i & -1 & 0 \\ 1 & -i & 0 \end{bmatrix} 一行目に i を掛けてみる

\sim \begin{bmatrix} 1 & -i & 0 \\ 1 & -i & 0 \end{bmatrix}

\sim \begin{bmatrix} 1 & -i & 0 \\ 0 & 0 & 0 \end{bmatrix}

x-iy=0 より y=s と置けば、

x=is

\therefore \bm x=s\begin{bmatrix} i \\ 1 \end{bmatrix}

\lambda=\cos \theta - i\sin\theta の時

(A-\lambda I)\bm x&= \begin{bmatrix} i\sin\theta & -\sin\theta \\ \sin\theta & i\sin\theta \end{bmatrix} \bm x\\ &= \sin\theta \begin{bmatrix} i & -1 \\ 1 & i \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0

\begin{bmatrix} i & -1 & 0 \\ 1 & i & 0 \end{bmatrix} 一行目に i を掛けて

\sim \begin{bmatrix} -1 & -i & 0 \\ 1 & i & 0 \end{bmatrix}

\sim \begin{bmatrix} 1 & i & 0 \\ 0 & 0 & 0 \end{bmatrix}

x+iy=0 より y=t と置けば、

x=-it

\therefore \bm x=t\begin{bmatrix} -i \\ 1 \end{bmatrix}

確認してみる:

A\bm x= \begin{bmatrix} \cos \theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix} \begin{bmatrix} is \\ s \end{bmatrix} = \begin{bmatrix} is\cos \theta - s\sin\theta \\ is\sin\theta + s\cos\theta \end{bmatrix} = s(\cos \theta + i\sin\theta) \begin{bmatrix} is \\ s \end{bmatrix}=(\cos \theta + i\sin\theta)\bm x

A\bm x= \begin{bmatrix} \cos \theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix} \begin{bmatrix} -it \\ t \end{bmatrix} = \begin{bmatrix} -it\cos \theta - t\sin\theta \\ -it\sin\theta + t\cos\theta \end{bmatrix} = (\cos \theta - i\sin\theta) \begin{bmatrix} -it \\ t \end{bmatrix} = (\cos \theta - i\sin\theta)\bm x

(騙されたみたい、に感じるけれど)ちゃんとうまく行く。

このように、複素数の範囲で考える限り固有値は必ず存在する

この点について、以下に詳しく見よう。

固有方程式の解

固有方程式の次数

固有方程式 |A-\lambda I|=0 は必ず \lambda n 次方程式となる。

なぜなら・・・

|A-\lambda I| = \begin{vmatrix} a_{11} - \lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & & \vdots \\ \vdots & & \ddots & \\ a_{n1} & \cdots & & a_{nn}-\lambda \\ \end{vmatrix} = 0

一般に「行列式」は各行、各列から重複のないように n 個の要素を抜き出して積を作り、 そのような積を可能な限り集めて和にした物であった。

|A| = \sum_{(i_1,i_2,\dots,i_n)}\varepsilon (i_1,i_2,\dots,i_n) a_{1i_1}a_{2i_2}\dots a_{ni_n}= \sum(符号)\times(n 個の要素の積)

したがって、行列式は対角要素を全て掛け合わせた項

(a_{11}-\lambda)(a_{22}-\lambda)\dots(a_{nn}-\lambda)

を含んでいる。この項は明らかに \lambda n 乗を含む。

また他の項( n 個の要素を掛け合わせた物)は、 \lambda n-2 次以下の項になる。

\therefore |A-\lambda I|= (a_{11}-\lambda)(a_{22}-\lambda)\dots(a_{nn}-\lambda)+ ( \lambda n-2 次以下の項)

これは \lambda n 次方程式である。

代数学の基本定理

n 次方程式は複素数の範囲に(重複度を含めて)必ず n 個の解を持つ。

というのが「代数学の基本定理」であった。

それら n 個の解を \lambda_1,\lambda_2,\dots,\lambda_n とすれば、 A の固有多項式は、

|A-\lambda I|=(\lambda_1-\lambda)(\lambda_2-\lambda)\dots(\lambda_n-\lambda)=0

と因数分解できる。

これらすべての解が異なれば n 個の固有値が得られる。

重複解

実際には n 個のうちいくつかが等しい場合があり、 それらは「重複解」あるいは「重解」と呼ばれる。

上で n 個の解、と言っているのは重複解を個別に数えているので、 重複解がある場合には、

|A-\lambda I|=(\lambda_1-\lambda)^3(\lambda_2-\lambda)(\lambda_3-\lambda)^4\dots(\lambda_m-\lambda)

などとなって、独立な固有値の個数 m m\le n となる。

固有値の個数のまとめ

重複度を含めて必ず n 個の固有値が存在する。

独立な固有値の個数 m 1 \le m\le n となる。

n=4 次行列

A=\begin{bmatrix} 3 & 4 & -5 & 3 \\ 0 & 1 & 8 & 0 \\ 0 & 0 & 2 & -1 \\ 0 & 0 & 0 & 1 \end{bmatrix}

について、

|A-\lambda I| = (3-\lambda)(2-\lambda)(1-\lambda)^2

したがって、

\lambda = 3, 2, 1

の3つの異なる固有値が見つかる。

ただし、1 は2重解であるため重複度を含めると行列の次数と等しい「4つ」の固有値が存在する。

固有ベクトルの自由度

例えば \bm x_0 A の固有値 \lambda_0 に属する固有ベクトル( A\bm x_0=\lambda_0 \bm x_0 ) であれば、 任意の実数 k に対して k\bm x_0 \lambda_0 に属する固有ベクトルである。 (厳密には k=0 を除外しなければならないが、自明なので以下明記しない)

なぜなら、 A (k\bm x_0)=kA\bm x_0=k\lambda_0 \bm x_0=\lambda_0(k\bm x_0)

このように、固有ベクトルは必ず任意パラメータを含む形で求まる。

ある固有値 \lambda に属する固有ベクトルに含まれるパラメータの数=自由度について考えよう。

\lambda から固有ベクトル \bm x を求める方程式は、 n n 連立の一次方程式となる。

すなわち、

(A-\lambda I)\bm x= \begin{bmatrix} a_{11}-\lambda & a_{12} & \dots & a_{1n} \\ a_{21} & a_{11}-\lambda & & \vdots \\ \vdots & & \ddots & \vdots \\ a_{n1} & \dots & & a_{nn} - \lambda \end{bmatrix} \begin{bmatrix} x_1\\x_2\\\vdots\\x_n \end{bmatrix} = \begin{bmatrix} 0\\0\\\vdots\\0 \end{bmatrix} =\bm o

階数の定義より、上記連立方程式の拡大係数行列を行に対する基本変形で階段行列化した際には 非ゼロの行が \rank (A-\lambda I) 行、ゼロの行が n-\rank (A-\lambda I) 行現われる。

\begin{bmatrix} a_{11}-\lambda & a_{12} & \dots & a_{1n} & 0 \\ a_{21} & a_{11}-\lambda & & \vdots & \vdots \\ \vdots & & \ddots & \vdots & \vdots \\ a_{n1} & \dots & \dots & a_{nn} - \lambda & 0 \end{bmatrix} \sim \begin{bmatrix} * & * & \dots & * & 0 \\ \vdots & \vdots & & \vdots & \vdots \\ * & * & \dots & * & 0 \\ 0 & 0 & \dots & 0 & 0 \\ \vdots & \vdots & & \vdots & \vdots \\ 0 & 0 & \dots & 0 & 0 \\ \end{bmatrix} \begin{array}{ll} \Bigg\} \ \rank (A-\lambda I)\\ \\ \Bigg\} \ n- \rank (A-\lambda I)\\ \end{array}

ここで、係数行列 A-\lambda I は正則ではないため、 \rank (A-\lambda I) < n である。 したがって、掃き出し後の階段行列にはゼロの行が必ず1行以上現われることになる。

すなわちはき出せない列が n-\rank (A-\lambda I) 列現れて、 解には同数の未定係数(パラメータ)が現われることになる。

\bm x = c^{(1)}\begin{bmatrix} x_1^{(1)}\\x_2^{(1)}\\ \vdots \\x_n^{(1)}\\ \end{bmatrix} + c^{(2)}\begin{bmatrix} x_1^{(2)}\\x_2^{(2)}\\ \vdots \\x_n^{(2)}\\ \end{bmatrix} +\dots + c^{(m)}\begin{bmatrix} x_1^{(m)}\\x_2^{(m)}\\ \vdots \\x_n^{(m)}\\ \end{bmatrix}

ただし、 c^{(1)},c^{(2)},\dots,c^{(m)} は任意係数であり、

m=n-\rank (A-\lambda I)

である。

すなわち、固有ベクトルの自由度は n-\rank (A-\lambda I) である。

繰り返しになるが、 \rank (A-\lambda I)<n であるため、 すべての固有値に対する固有ベクトルは最低1以上の自由度を持つ。

(蛇足:求めた固有値に対して固有ベクトルを求める際にパラメータを 含まない形になってしまった場合には、途中の計算を間違えている ことになる。)

以上は、「行列の階数」のところでやった「連立一次方程式の解の自由度」 の部分をほぼそのままなぞる形の議論であるため、関連して復習せよ。

注意

教科書では「固有ベクトルの自由度」のことを「固有空間の次元」と呼んでいる。 「次元」は線形代数Iの授業の範囲外であるため、 ここではあくまで「自由度」あるいは「パラメータの数」として理解していれば良い。

固有ベクトルの一次独立性

A の異なる固有値に属する固有ベクトルは1次独立である」

この意味は、

「行列 A の固有値の中から、 r 個の異なる固有値 \lambda_1,\lambda_2,\dots,\lambda_r を選び出し、これらに対応する固有ベクトルをそれぞれ1つ選んで \bm x_1,\bm x_2,\dots,\bm x_r とすれば、 この r 個のベクトルは一次独立である」

ということ。

まず確認:

\bm x_1,\bm x_2,\dots,\bm x_r が一次独立」の意味は、 「 c_1\bm x_1+c_2\bm x_2+\dots+c_r\bm x_r=0 が成り立つと仮定すれば c_1=c_2=\dots=c_n=0 を導けること」であった。

以下は数学的帰納法を用いた証明:

(1)
r=1 の時には、固有ベクトル \bm x_1 \bm x_1\ne \bm o を満たすため、 c_1\bm x_1=\bm o から c_1=0 が導かれ、 \bm x_1 は一次独立である。

(2)
ベクトルが r-1 個の時に一次独立になると仮定して、 r 個でも一次独立になることを導く。

r 個でも一次独立になること」は、 「 c_1\bm x_1+c_2\bm x_2+\dots+c_r\bm x_r=0 から c_1=c_2=\dots=c_n=0 が導けること」なので、加えて

c_1\bm x_1+c_2\bm x_2+\dots+c_r\bm x_r=0 ・・・(*)

が成り立つことも仮定する。この式に左から A を掛ければ

&c_1A\bm x_1+c_2A\bm x_2+\dots+c_rA\bm x_r=\\ &c_1\lambda_1\bm x_1+c_2\lambda_2\bm x_2+\dots+c_r\lambda_r\bm x_r=0

一方、(*)に \lambda_r を掛ければ、

c_1\lambda_r\bm x_1+c_2\lambda_r\bm x_2+\dots+c_r\lambda_r\bm x_r=0

2つの式を引き算すると、

&c_1(\lambda_1-\lambda_r)\bm x_1+c_2(\lambda_2-\lambda_r)\bm x_2+\dots+c_{r-1}(\lambda_{r-1}-\lambda_r)\bm x_{r-1}+c_r(\lambda_r-\lambda_r)\bm x_r=\\ &c_1(\lambda_1-\lambda_r)\bm x_1+c_2(\lambda_2-\lambda_r)\bm x_2+\dots+c_{r-1}(\lambda_{r-1}-\lambda_r)\bm x_{r-1}=0

仮定より、異なる固有値に属する r-1 個の固有ベクトル \bm x_1,\bm x_2,\dots,\bm x_{r-1} は一次独立であるため、 係数はすべてゼロでなくてはならず、

c_1(\lambda_1-\lambda_r)=c_2(\lambda_2-\lambda_r)=\dots=c_{r-1}(\lambda_{r-1}-\lambda_r)=0

であり、すべての固有値が異なるという仮定から、

c_1=c_2=\dots=c_{r-1}=0

が導かれる。

さらにこれらを(*)に代入すれば、 c_r=0 を得る。

すなわち、(*)から c_1=c_2=\dots=c_{r-1}=c_r=0 が導かれたことになり、 \bm x_1,\bm x_2,\dots,\bm x_r は一次独立であることが言えた。

r=1 で成り立つことと、
r-1 で成り立てば r で成り立つことから、
与えられた命題は全ての r \ge 1 に対して成り立つことが証明された。

質問・コメント




連立漸化式との関係

こずこず ()

x(n+1)=ax(n)+by(n)
y(n+1)=cx(n)+dy(n)
からyを消去してxの3項漸化式にすると、固有方程式っぽくなります。線形代数の範囲でキレイな説明ができるものなのでしょうか。

1次正方行列の固有値・固有ベクトルについて

みみみ ()

1次正方行列の固有値・固有ベクトルについてはどのように求めれば良いか分かりません。ご教授願います。

無題

()

テスト前、風邪をひき入門線形代数なるテキストの抽象的すぎるとばしとばしな説明が全く頭に入ってこないという危機に陥っていましたが、ここを読ませていただき飲み込めそうです。
全く同じ内容なのに、行間の一行が足されているだけでなんとありがたいことでしょう。
本当に助かりました、ありがとうございます。

重複解

筒井 ()

 お世話様です
重複解がある場合にはの式にλ2-λの項の記述がミスタイプのようですが、よろしくお願いします。

固有ベクトルの一次独立性

[イシカワ] (2013-03-13 (水) 01:03:18)


こんにちは.
地方公立の学部1年の者です.

幸か不幸か,(前期の話ですが)講義内でテキストが上手く進まず,「直交変換」の手前で終了してしまい,残りは自分で学ばざるを得なくなりました(線形代数はしっかり勉強した方が良いと耳にしたので).
固有ベクトルの一次独立性を”rに関する”帰納法を用いて証明が可能だとテキストに書いてあり,悩んだ挙句,拝見させて頂きました.
非常にわかりやすかったです.
ありがとうございました.

  • 役に立ったようで良かったです。「ここはこう書いた方が分かりやすい」なんていう指摘も大歓迎ですので、もしあればよろしくお願いします。 -- [武内(管理人)]
  • 固有値と固有ベクトルの定義、用途、計算方法、こう書いた方が分かりやすい、ありがとうございました。 -- イワザキ

Counter: 433810 (from 2010/06/03), today: 180, yesterday: 227