ラグランジュの未定係数法 のバックアップソース(No.3)

更新

[[量子力学Ⅰ]]

* 解きたい問題 [#f4d9cac4]

&math(f(x_1,x_2,\dots,x_n)); を、

&math(m); 個の拘束条件

 &math(g_1(x_1,x_2,\dots,x_n)=0); ~
 &math(g_2(x_1,x_2,\dots,x_n)=0); ~
 &math(\ \ \ \vdots); ~
 &math(g_m(x_1,x_2,\dots,x_n)=0); 

の下で最大化・最小化したい (ただし &math((m<n));)。

実際には拘束条件の下で &math(f); の ___停留点___ を探すことになる。


このような問題は ___ラグランジュの未定係数法___ と呼ばれる手法を使うと簡単に解ける。

** キモ [#x9a84277]

「拘束条件下での停留点」とは、

&math(\bm x=(x_1,x_2,\dots,x_n)); を &math(n); 次元空間のベクトルにおいて
拘束条件を満たす点として、

「&math(\Delta\bm x); を拘束条件を破らない方向に取る限り」 

&math(f); の一次の変位量がゼロとなる: ~
 &math(\Delta f=\bm\nabla f\cdot\Delta\bm x=0); 

という意味である。

拘束条件を破るような方向へ動かしたときに &math(\Delta f\ne 0); となっても構わないところが
拘束条件付き停留点探しのキモである。

* ラグランジュの未定係数法 [#v1fe15da]

未定係数 &math(\lambda_i); を用いて

 &math(L(x_1,x_2,\dots,x_n)=f(x_1,x_2,\dots,x_n)-\sum_i \lambda_i g_i(x_1,x_2,\dots,x_n));

という関数を構成し、

 &math(\frac{\partial L}{\partial x_1}=\frac{\partial L}{\partial x_2}=\dots=\frac{\partial L}{\partial x_n}=0);

 &math(\frac{\partial L}{\partial \lambda_1}=\frac{\partial L}{\partial \lambda_2}=\dots=\frac{\partial L}{\partial \lambda_m}=0);

のすべての条件式を満たす点 &math(\bm x); およびその点における係数 &math(\lambda_i); を見つければ、
その点が停留点となる。

また逆に、全ての停留点に対して上記の条件式を満足する係数 &math(\lambda_i); が存在する。

すなわち、上の条件式は停留点であるための必要十分条件になっている。
** 条件式の意味 [#h726f0a8]

&math(\lambda_i); での微分からは元の拘束条件が現れるのみであるのに対して、

&math(x_j); での微分は、

 &math(\frac{\partial L}{\partial x_j}=\frac{\partial f}{\partial x_j}-\sum_i \lambda_i\frac{\partial g}{\partial x_j}=0);

となるから、&math(n); 本の条件をすべてまとめてベクトル形式とすれば、

 &math(\bm \nabla L=\bm \nabla f-\sum_i \lambda_i \bm \nabla g_i=\bm 0);

と書ける。これを変形すると、

 &math(\bm \nabla f=\sum_i \lambda_i \bm \nabla g_i);

となり、すなわち 

 &math(\bm \nabla f); が &math(\bm \nabla g_i); の一次結合で表せるような点が停留点である

と読める。

* 停留点の十分条件となっていること [#j4fbf759]

ベクトル &math(\bm x); を &math(\Delta \bm x); だけ動かしたときの &math(L); の変化は、

&math(
\Delta L=\bm \nabla L\cdot\Delta \bm x
&=\bm \nabla f\cdot \Delta \bm x+\sum_i \lambda_i \bm \nabla g_i\cdot \Delta \bm x\\
&=\Delta f+\sum_i\lambda_i\Delta g_i\\
);

であるが、条件式を満たす点においては &math(\bm \nabla L=0); であるからこの値は常にゼロとなる。

&math(\Delta \bm x); をすべての &math(g_i); の値を変化させない方向に取った時のみ、
変位後の点も拘束条件を満たすことになる。

そのような &math(\Delta \bm x); に対しては
&math(\Delta g_1=\Delta g_2=\dots=\Delta g_m=0); であるから、&math(\Delta L=0); 
の条件はそのまま &math(\Delta f=0); の条件と一致する。

すなわち、ラグランジュの未定係数法により見つかった点は必ず停留点となることが分かる。

* 停留点の必要条件となっていること [#e0c73b69]

逆に、停留点であれば必ずラグランジュの未定係数法の条件式を満たす &math(\lambda_i); 
が存在するだろうか?

条件式を書き換えて

&math(\bm\nabla f=-\sum_i\lambda_i\bm\nabla g_i);

とするとこれは、停留点において &math(\bm\nabla f); が &math(\bm\nabla g_i);
の張る空間の元となっていることを主張している。

以下にこの意味を考えよう。

拘束条件の下での停留点を考え、そこからの変位を &math(\Delta\bm x); とする。

何も考えなければ &math(\Delta\bm x); は &math(n); 次元ベクトル空間 &math(K^n); 
から任意のベクトルを選ぶことができる。

ここに &math(m); 本のベクトル &math(\{\bm\nabla g_i\}); が張る部分空間 
&math(V_\mathrm{break}); を考え、また、すべての &math(\bm\nabla g_i); 
と直交するようなベクトルの集合 &math(V_\mathrm{meet}); 
を考えればこれも線形空間となる。

これら2つの空間は互いに直交補空間となっている。

すなわち、&math(K^n); は &math(V_\mathrm{break}); と &math(V_\mathrm{meet}); との直交直和である。

&math(K^n=V_\mathrm{break}\oplus V_\mathrm{meet}); ~

任意の &math(\Delta\bm x\in V_\mathrm{meet}); はすべての &math(\bm\nabla g_i); 
と直交するから、すなわちすべての &math(i); に対して &math(\Delta g_i=0); となり、
&math(V_\mathrm{meet}); は「制約条件を満たす変位」が作る線形空間となる。

今考えている点は拘束条件の下で停留点であると仮定したから、
制約条件を満たす任意の &math(\Delta\bm x); に対して
&math(\Delta f=\bm\nabla f\cdot\Delta\bm x=0); が成り立つ。

これは、&math(\bm\nabla f); が &math(V_\mathrm{meet}); の任意の元に直交することを意味しており、
すなわち &math(\bm\nabla f); が &math(V_\mathrm{meet}); の直交補空間 &math(V_\mathrm{break}); 
の元であることを示している。

上の仮定から &math(\{\bm\nabla g_i\}); は &math(V_\mathrm{break}); 
を張るから、&math(\bm\nabla f); を &math(\{\bm\nabla g_i\}); の一次結合で表すことが可能。

その係数が &math(\lambda_i); なわけである。

Counter: 14624 (from 2010/06/03), today: 4, yesterday: 0