ラグランジュの未定係数法

(187d) 更新

量子力学Ⅰ

解きたい問題

f(x_1,x_2,\dots,x_n) を、

m 個の拘束条件

  g_1(x_1,x_2,\dots,x_n)=0
  g_2(x_1,x_2,\dots,x_n)=0
  \ \ \ \vdots
  g_m(x_1,x_2,\dots,x_n)=0

の下で最大化・最小化したい 。
(ただし (m<n) とする。さもないと拘束条件が多すぎて、それだけで点が定まってしまう。)

実際には拘束条件の下で f 停留点 を探すことになる。

このような問題は以下に説明する ラグランジュの未定係数法 と呼ばれる手法を使うと簡単に解ける。

キモ

「拘束条件下での停留点」とは、

\bm x=(x_1,x_2,\dots,x_n) n 次元空間のベクトルにおいて 拘束条件を満たす点として、

\Delta\bm x を拘束条件を破らない方向に取る限り」

f の一次の変位量がゼロとなる:
  \Delta f=\bm\nabla f\cdot\Delta\bm x=0

という意味である。

拘束条件を破るような方向へ動かしたときに \Delta f\ne 0 となっても構わないところが 拘束条件付き停留点探しのキモである。

ラグランジュの未定係数法

未定係数 \lambda_i を用いて

  L(x_1,x_2,\dots,x_n)=f(x_1,x_2,\dots,x_n)-\sum_i \lambda_i g_i(x_1,x_2,\dots,x_n)

という関数を構成し、

  \frac{\partial L}{\partial x_1}=\frac{\partial L}{\partial x_2}=\dots=\frac{\partial L}{\partial x_n}=0

  \frac{\partial L}{\partial \lambda_1}=\frac{\partial L}{\partial \lambda_2}=\dots=\frac{\partial L}{\partial \lambda_m}=0

のすべての条件式を満たす点 \bm x およびその点における係数 \lambda_i を見つければ、 その点が停留点となる。

また逆に、全ての停留点に対して上記の条件式を満足する係数 \lambda_i が存在する。

すなわち、上の条件式はその点が停留点であるための必要十分条件になっている。

条件式の意味

\lambda_i での微分からは元の拘束条件が現れるのみである。

一方、 x_j での微分は、

  \frac{\partial L}{\partial x_j}=\frac{\partial f}{\partial x_j}-\sum_i \lambda_i\frac{\partial g}{\partial x_j}=0

となる。

そこで、 n 本の条件をすべてまとめてベクトル形式とすれば、

  \bm \nabla L=\bm \nabla f-\sum_i \lambda_i \bm \nabla g_i=\bm 0

と書ける。これを変形すると、

  \bm \nabla f=\sum_i \lambda_i \bm \nabla g_i

となり、すなわち両者を合わせれば、

 その点ですべての拘束条件が満たされており、
 なおかつ \bm \nabla f \bm \nabla g_i の一次結合で表せるような点が停留点である

と読める。

停留点の十分条件となっていること

ラグランジュの未定係数法の条件式を満たす点 \bm x が必ず停留点となることは、 以下のように簡単に理解できる。

\bm x は拘束条件を満たすから、 \Delta \bm x を「すべての g_i の値を変化させない方向」に取った時のみ、変位後の点も拘束条件を満たすことになる。

そのような \Delta \bm x に対しては、すべての i に対して \Delta g_i=\bm\nabla g_i\cdot \Delta\bm x=0 が成り立つ。

このことと条件式より、

\Delta f=\bm\nabla f\cdot\Delta\bm x=\sum_i \lambda_i\underbrace{\bm\nabla g_i\cdot\Delta\bm x}_{=\,0}=0

となり、条件を満たす点が必ず停留点となることを確認できる。

停留点の必要条件となっていること

逆に、すべての停留点に対して条件式を満たす \lambda_i が存在するだろうか?

ある点 x が拘束条件下での停留点であるとすれば、

  1. x は拘束条件を満たす
  2. x を拘束条件を満たす方向へ動かしたときに f が変化しない

が成り立つが、この 2. は、

  • \Delta \bm x がすべての \bm\nabla g_i に垂直なら、 \bm\nabla f にも垂直である

と読み替えられる。この条件と、

  • \bm\nabla f \bm\nabla g_i の線形結合で表せる

が同値であることを言えば良いのだが・・・

直交補空間の概念に通じているなら

2. を
 ・ すべての \bm\nabla g_i が張る空間を V_\mathrm{break} とし、
 ・ その直交補空間を V_\mathrm{meet} とすれば、
 ・ 任意の \Delta\bm x\in V_\mathrm{meet} \bm\nabla f に垂直である

と言い換えることができて、これは \bm\nabla f V_\mathrm{break} の直交補空間の元であることを示すから、 \bm\nabla f V_\mathrm{break} を張る \bm\nabla g_i の線形結合で表せて、その係数が \lambda_i である。

ということで証明が終わるのであるが、、、前提知識の少なくて済む説明をするなら:

すべての \bm\nabla g_i が張る空間を V_\mathrm{break} とし、 そこに正規直交基底 \set{\bm e_j} を取る。

\bm\nabla f V_\mathrm{break} の元ではない可能性を考えて、

  \bm\nabla f=\sum_j c_j\bm e_j + \bm\delta

と書く。ただし、 \bm\delta\notin V_\mathrm{break} すなわち任意の j に対して \bm\delta\cdot\bm e_j=0 とする。

すると \bm\delta はすべての \bm\nabla g_i に垂直であるから、 \Delta\bm x=\bm\delta と取れば、

  \bm\nabla f\cdot\bm\delta=\|\bm\delta\|^2

となって、 \bm\delta=\bm 0 でない限り仮定に反する。

すなわち \bm\delta=\bm 0 であり、これは \bm\nabla f V_\mathrm{break} の元であり、 \bm\nabla g_i の線形結合で表せることを意味する。

コメント・質問





Counter: 370 (from 2010/06/03), today: 2, yesterday: 1