線形代数II/行列の関数 のバックアップ(No.13)

更新


前の単元 <<<                線形代数II                >>> 次の単元

行列の多項式

行列を対角化できるとき、行列の多項式の値を容易に計算できる。

対角行列の累乗

対角行列 $D$ を

$$D=\begin{pmatrix}a&0\\0&d\end{pmatrix}$$

とすれば、

$$D^2=\begin{pmatrix}a&0\\0&d\end{pmatrix}\begin{pmatrix}a&0\\0&d\end{pmatrix}=\begin{pmatrix}a^2&0\\0&d^2\end{pmatrix}$$

であり、同様に、

$$D^m=\begin{pmatrix}a^m&0\\0&d^m\end{pmatrix}$$

対角行列の多項式

例えば整数 $l,m\ge 1$ に対して、

$$\alpha D^l+\beta D^m=\alpha \begin{pmatrix}a^l&0\\0&d^l\end{pmatrix}+\beta \begin{pmatrix}a^m&0\\0&d^m\end{pmatrix} =\begin{pmatrix}\alpha a^l+\beta a^m&0\\0&\alpha d^l+\beta d^m\end{pmatrix}$$

元の式 $\alpha D^l+\beta D^m$ と、結果の対角要素

$$\alpha a^l+\beta a^m, \alpha d^l+\beta d^m$$

の類似性に注目せよ。

対角化可能な行列の累乗

$A$ を $n$ 次の行列として、$P$ により対角化可能とする。

$$ P^{-1}AP=D= \begin{pmatrix} \lambda_1&0&\dots&0\\ 0&\lambda_2&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n \end{pmatrix} $$

すると、

$$A=PDP^{-1}$$

より、

$$ \begin{aligned} A^m &= (PDP^{-1})^m =PD\,\overbrace{P^{-1}\!P}^{I}\,D\cdots D\,\overbrace{P^{-1}\!P}^{I}\,DP^{-1}\\ &= PD^mP^{-1} =P \begin{pmatrix} \lambda_1^m&0&\dots&0\\ 0&\lambda_2^m&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&\lambda_n^m \end{pmatrix} P^{-1} \end{aligned} $$

と表せる。

左辺を普通に計算しようとすれば行列のかけ算が $m-1$ 回必要になるが、 右辺は数値の $m$ 乗が $n$ 回と、行列のかけ算2回で済むため計算量が少なく、 また理論的にも見通しがよい。

対角化可能な行列の多項式

$g(x)$ を任意の多項式とするとき、

$$g(x)=a_0+a_1x+a_2x^2+a_3x^3+\dots=\sum_{k=0}a_kx^k$$

$g(A)$ を次のように定義する。

$$g(A)=a_0{\red I}+a_1A+a_2A^2+a_3A^3+\dots=\sum_{k=0}a_kA^k$$

(ゼロ次項に単位行列が掛かっていることに注意せよ)

すると、

$$ \begin{aligned} g(A)&=\sum_{k=0}a_kPD^kP^{-1}\\ &=P\Big(\sum_{k=0}a_kD^k\Big)P^{-1}\\ &= P\begin{pmatrix} g(\lambda_1)&0&\dots&0\\ 0&g(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(\lambda_n) \end{pmatrix} P^{-1} \end{aligned} $$

のように、任意の行列の多項式を、対角化を用いて固有値の多項式に関連づけることができる。

行列の指数関数

多項式以外はどうかというと、例えば指数関数をマクローリン展開すると、

$$ e^x=1+x+\frac{1}{2!}x^2+\frac{1}{3!}x^3+\dots=\sum_{k=0}^\infty \frac{1}{k!}x^k $$

であるから、

$$e^{A}=\sum_{k=0}^\infty \frac{1}{k!}A^k$$

として、「行列の指数関数」を定義できる。

また、$A$ が対角化可能な場合にはこの値を

$$ e^{A}=\sum_{k=0}^\infty \frac{1}{k!}A^k=g(A)= P \begin{pmatrix} g(\lambda_1)&0&\dots&0\\ 0&g(\lambda_2)&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&g(\lambda_n) \end{pmatrix} P^{-1}= P \begin{pmatrix} e^{\lambda_1}&0&\dots&0\\ 0&e^{\lambda_2}&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&e^{\lambda_n} \end{pmatrix} P^{-1} $$

などとして、行列の指数関数の値を固有値の指数関数の値から求められる。

これは物理学では、

$$ e^{At}= P \begin{pmatrix} e^{\lambda_1t}&0&\dots&0\\ 0&e^{\lambda_2t}&&\vdots\\ \vdots&&\ddots&0\\ 0&\dots&0&e^{\lambda_nt} \end{pmatrix} P^{-1} $$

のような形で表れることも多い。

一般の関数

一般の関数 $f(x)$ が $x=0$ でマクローリン展開可能であれば、 収束半径内において

$$f(x)=\sum_{k=0}^\infty \frac{1}{k!}\frac{d^kf(0)}{dx^k}x^k$$

と書けるから、上記と同様に $f(A)$ を定義できて、 対角化が可能な場合には固有値に $f$ を適用することでその値を求められる。

フロベニウスの定理

上記より、対角化可能な $A$ に対して

$$ P^{-1}g(A)P=\begin{pmatrix} g(\lambda_1)\\ &g(\lambda_2)\\ &&\ddots\\ &&&g(\lambda_n)\\ \end{pmatrix} $$

すなわち、$g(A)$ の固有値が $g(\lambda_1),g(\lambda_2),\dots,g(\lambda_n)$ となることが分かるが、実は $A$ が対角化不可能であってもこれは成り立つ。

この定理はフロベニウスの定理と呼ばれる。

この定理は、$A$ が対角化不可能な場合にも三角化は可能であることと、 三角行列の多項式の値を計算すればその対角要素に固有値の多項式が表れることから 容易に証明される。

すなわち、任意の行列に対して以下を満たす $P$ が存在するのである。

$$ P^{-1}g(A)P=\begin{pmatrix} g(\lambda_1)&&&\text{\huge*}\\ &g(\lambda_2)\\ &&\ddots\\ \text{\huge0}&&&g(\lambda_n)\\ \end{pmatrix} $$

数値関数との類似性

$$ \begin{aligned} e^Ae^{-A} &=\Big(\sum_{k=0}^\infty \frac{A^k}{k!}\Big)\Big(\sum_{l=0}^\infty \frac{(-A)^{l}}{l!}\Big)\\ &=\sum_{k=0}^\infty \sum_{l=0}^\infty \frac{A^k}{k!}\frac{(-A)^{l}}{l!}\\ &=\sum_{m=0}^\infty \sum_{n=0}^m \frac{A^{m-n}(-A)^{n}}{(m-n)!n!}\hspace{2cm}(m=k+l\ の等しい項をまとめた)\\ &=\sum_{m=0}^\infty \frac{1}{m!} \sum_{n=0}^m \frac{m!}{(m-n)!n!}A^{m-n}(-A)^{n}\\ &=\underbrace{\sum_{m=0}^\infty \frac{1}{m!} (A-A)^m}_{e^O}\\ &=I+O+O+\cdots\\ &=I\\ \end{aligned} $$

$$ \begin{aligned} \frac{d}{dt}e^{tA}&=\frac{d}{dt}\Big(I+tA+\frac{t^2}{2}A^2+\frac{t^3}{6}A^3+\cdots\Big)\\ &=\hspace{16.8mm}A+\ t\;A^2+\frac{t^2}{2}A^3+\cdots\\ &=\hspace{11mm}A\Big(I+\ t\;A\ +\frac{t^2}{2}A^2+\cdots\Big)\\ &=Ae^{tA} \end{aligned} $$

一方で、一般の $A,B$ に対しては、

$$e^Ae^B\ne e^{A+B}$$

である。これは、数値に対して必ず $ab=ba$ が成り立つのに対して、一般に行列では $AB\ne BA$ であるためだ。

$AB=BA$ あるいは同じことであるが $AB-BA=O$ が成り立つ $A,B$ (可換な $A,B$)に対しては上式も成り立つ。

まとめ

このように、行列の関数は多くの点で数値の関数と似た性質を持つ。

そして、行列が対角化可能な場合にはその値を固有値に関数を適用することで 行列の関数の値を求められる。

対角化可能ではない行列の関数(累乗)の性質を明らかにするには行列の「準」対角化形である ジョルダン標準形 が役に立つのであるが、講義時間の都合上この授業では扱わない。

前の単元 <<<                線形代数II                >>> 次の単元

質問・コメント




常微分方程式の範囲における問題がわかりません

山本? ()

(2)$n$次正方行列$A$が$n$個の相異なる固有値$\lambda_1,\lambda_2,\dots,\lambda_n$を持つ(すなわち重複固有値を持たない)とする.対応する固有ベクトルを$\bm v_1,\bm v_2,\dots,\bm v_n$とする。このとき、$e^{xA}\bm v_k=e^{\lambda_kx}\bm v_k$ $(k=1,2,\dots,n)$を示せという問題です。よろしくお願いします。($e^{xA}$ は行列指数関数です)

  • 落ち着いて行列の指数関数の $A$ によるべき展開と、固有値・固有ベクトルの定義を考えれば難しくないはずですので頑張ってください。 -- 武内(管理人)?

Counter: 37048 (from 2010/06/03), today: 1, yesterday: 0