ラグランジュの未定係数法 のバックアップ(No.3)

更新


量子力学Ⅰ

解きたい問題

f(x_1,x_2,\dots,x_n) を、

m 個の拘束条件

  g_1(x_1,x_2,\dots,x_n)=0
  g_2(x_1,x_2,\dots,x_n)=0
  \ \ \ \vdots
  g_m(x_1,x_2,\dots,x_n)=0

の下で最大化・最小化したい (ただし (m<n) )。

実際には拘束条件の下で f 停留点 を探すことになる。

このような問題は ラグランジュの未定係数法 と呼ばれる手法を使うと簡単に解ける。

キモ

「拘束条件下での停留点」とは、

\bm x=(x_1,x_2,\dots,x_n) n 次元空間のベクトルにおいて 拘束条件を満たす点として、

\Delta\bm x を拘束条件を破らない方向に取る限り」

f の一次の変位量がゼロとなる:
  \Delta f=\bm\nabla f\cdot\Delta\bm x=0

という意味である。

拘束条件を破るような方向へ動かしたときに \Delta f\ne 0 となっても構わないところが 拘束条件付き停留点探しのキモである。

ラグランジュの未定係数法

未定係数 \lambda_i を用いて

  L(x_1,x_2,\dots,x_n)=f(x_1,x_2,\dots,x_n)-\sum_i \lambda_i g_i(x_1,x_2,\dots,x_n)

という関数を構成し、

  \frac{\partial L}{\partial x_1}=\frac{\partial L}{\partial x_2}=\dots=\frac{\partial L}{\partial x_n}=0

  \frac{\partial L}{\partial \lambda_1}=\frac{\partial L}{\partial \lambda_2}=\dots=\frac{\partial L}{\partial \lambda_m}=0

のすべての条件式を満たす点 \bm x およびその点における係数 \lambda_i を見つければ、 その点が停留点となる。

また逆に、全ての停留点に対して上記の条件式を満足する係数 \lambda_i が存在する。

すなわち、上の条件式は停留点であるための必要十分条件になっている。

条件式の意味

\lambda_i での微分からは元の拘束条件が現れるのみであるのに対して、

x_j での微分は、

  \frac{\partial L}{\partial x_j}=\frac{\partial f}{\partial x_j}-\sum_i \lambda_i\frac{\partial g}{\partial x_j}=0

となるから、 n 本の条件をすべてまとめてベクトル形式とすれば、

  \bm \nabla L=\bm \nabla f-\sum_i \lambda_i \bm \nabla g_i=\bm 0

と書ける。これを変形すると、

  \bm \nabla f=\sum_i \lambda_i \bm \nabla g_i

となり、すなわち

  \bm \nabla f \bm \nabla g_i の一次結合で表せるような点が停留点である

と読める。

停留点の十分条件となっていること

ベクトル \bm x \Delta \bm x だけ動かしたときの L の変化は、

&math( \Delta L=\bm \nabla L\cdot\Delta \bm x &=\bm \nabla f\cdot \Delta \bm x+\sum_i \lambda_i \bm \nabla g_i\cdot \Delta \bm x\\ &=\Delta f+\sum_i\lambda_i\Delta g_i\\ );

であるが、条件式を満たす点においては \bm \nabla L=0 であるからこの値は常にゼロとなる。

\Delta \bm x をすべての g_i の値を変化させない方向に取った時のみ、 変位後の点も拘束条件を満たすことになる。

そのような \Delta \bm x に対しては \Delta g_1=\Delta g_2=\dots=\Delta g_m=0 であるから、 \Delta L=0 の条件はそのまま \Delta f=0 の条件と一致する。

すなわち、ラグランジュの未定係数法により見つかった点は必ず停留点となることが分かる。

停留点の必要条件となっていること

逆に、停留点であれば必ずラグランジュの未定係数法の条件式を満たす \lambda_i が存在するだろうか?

条件式を書き換えて

\bm\nabla f=-\sum_i\lambda_i\bm\nabla g_i

とするとこれは、停留点において \bm\nabla f \bm\nabla g_i の張る空間の元となっていることを主張している。

以下にこの意味を考えよう。

拘束条件の下での停留点を考え、そこからの変位を \Delta\bm x とする。

何も考えなければ \Delta\bm x n 次元ベクトル空間 K^n から任意のベクトルを選ぶことができる。

ここに m 本のベクトル \{\bm\nabla g_i\} が張る部分空間 V_\mathrm{break} を考え、また、すべての \bm\nabla g_i と直交するようなベクトルの集合 V_\mathrm{meet} を考えればこれも線形空間となる。

これら2つの空間は互いに直交補空間となっている。

すなわち、 K^n V_\mathrm{break} V_\mathrm{meet} との直交直和である。

K^n=V_\mathrm{break}\oplus V_\mathrm{meet}  

任意の \Delta\bm x\in V_\mathrm{meet} はすべての \bm\nabla g_i と直交するから、すなわちすべての i に対して \Delta g_i=0 となり、 V_\mathrm{meet} は「制約条件を満たす変位」が作る線形空間となる。

今考えている点は拘束条件の下で停留点であると仮定したから、 制約条件を満たす任意の \Delta\bm x に対して \Delta f=\bm\nabla f\cdot\Delta\bm x=0 が成り立つ。

これは、 \bm\nabla f V_\mathrm{meet} の任意の元に直交することを意味しており、 すなわち \bm\nabla f V_\mathrm{meet} の直交補空間 V_\mathrm{break} の元であることを示している。

上の仮定から \{\bm\nabla g_i\} V_\mathrm{break} を張るから、 \bm\nabla f \{\bm\nabla g_i\} の一次結合で表すことが可能。

その係数が \lambda_i なわけである。


Counter: 14828 (from 2010/06/03), today: 2, yesterday: 0