ラグランジュの未定係数法の履歴差分(No.3)

更新
追加された行はこの色です。
削除された行はこの色です。
[[量子力学Ⅰ]]

* 概要 [#f4d9cac4]
* 解きたい問題 [#f4d9cac4]

&math(f(x_1,x_2,\dots,x_n)); について、
&math(f(x_1,x_2,\dots,x_n)); を、

拘束条件 &math(g_i(x_1,x_2,\dots,x_n)=0\ \ \ (i=1\dots m)); ただし &math((m<n))); の下での停留点を探したい。
&math(m); 個の拘束条件

　&math(g_1(x_1,x_2,\dots,x_n)=0); ~
　&math(g_2(x_1,x_2,\dots,x_n)=0); ~
　&math(\ \ \ \vdots); ~
　&math(g_m(x_1,x_2,\dots,x_n)=0); 

の下で最大化・最小化したい (ただし &math((m<n));)。

実際には拘束条件の下で &math(f); の ___停留点___ を探すことになる。


このような問題は ___ラグランジュの未定係数法___ と呼ばれる手法を使うと簡単に解ける。

** キモ [#x9a84277]

&math(\bm x=(x_1,x_2,\dots,x_n)); を &math(n); 次元空間のベクトルと考えると、
&math(\bm x); は拘束条件を満たす方向にしか動かせないので、
そのような方向へ動かした際に &math(\Delta f=0); となることが
「拘束条件下での停留点」の意味するところである。
「拘束条件下での停留点」とは、

拘束条件を満たさない方向へ動かしたときに &math(\Delta f\ne 0); となっても構わないということ。
&math(\bm x=(x_1,x_2,\dots,x_n)); を &math(n); 次元空間のベクトルにおいて
拘束条件を満たす点として、

「&math(\Delta\bm x); を拘束条件を破らない方向に取る限り」 

&math(f); の一次の変位量がゼロとなる： ~
　&math(\Delta f=\bm\nabla f\cdot\Delta\bm x=0); 

という意味である。

拘束条件を破るような方向へ動かしたときに &math(\Delta f\ne 0); となっても構わないところが
拘束条件付き停留点探しのキモである。

* ラグランジュの未定係数法 [#v1fe15da]

未定係数 &math(\lambda_i); を用いて

&math(L(x_1,x_2,\dots,x_n)=f(x_1,x_2,\dots,x_n)+\sum_i \lambda_i g_i(x_1,x_2,\dots,x_n));
　&math(L(x_1,x_2,\dots,x_n)=f(x_1,x_2,\dots,x_n)-\sum_i \lambda_i g_i(x_1,x_2,\dots,x_n));

を構成し、
という関数を構成し、

&math(\frac{\partial L}{\partial x_1}=\frac{\partial L}{\partial x_2}=\dots=\frac{\partial L}{\partial x_n}=0);
　&math(\frac{\partial L}{\partial x_1}=\frac{\partial L}{\partial x_2}=\dots=\frac{\partial L}{\partial x_n}=0);

&math(\frac{\partial L}{\partial \lambda_1}=\frac{\partial L}{\partial \lambda_2}=\dots=\frac{\partial L}{\partial \lambda_m}=0);
　&math(\frac{\partial L}{\partial \lambda_1}=\frac{\partial L}{\partial \lambda_2}=\dots=\frac{\partial L}{\partial \lambda_m}=0);

を満たす点 &math(\bm x); およびその点における係数 &math(\lambda_i); を見つければ、
のすべての条件式を満たす点 &math(\bm x); およびその点における係数 &math(\lambda_i); を見つければ、
その点が停留点となる。

また逆に、全ての停留点に対して上記の条件式を満足する係数 &math(\lambda_i); が存在する。

すなわち、上の条件式は停留点であるための必要十分条件になっている。
** 条件式の意味 [#h726f0a8]

&math(\lambda_i); での微分からは元の拘束条件が現れるのみであるのに対して、

&math(x_j); での微分は、

&math(\frac{\partial L}{\partial x_j}=\frac{\partial f}{\partial x_j}+\sum_i \lambda_i\frac{\partial g}{\partial x_j}=0);
　&math(\frac{\partial L}{\partial x_j}=\frac{\partial f}{\partial x_j}-\sum_i \lambda_i\frac{\partial g}{\partial x_j}=0);

などとなるから、ベクトル表記を使えば &math(n); 本の条件をまとめて、
となるから、&math(n); 本の条件をすべてまとめてベクトル形式とすれば、

&math(\bm \nabla L=\bm \nabla f+\sum_i \lambda_i \bm \nabla g_i=\bm 0);
　&math(\bm \nabla L=\bm \nabla f-\sum_i \lambda_i \bm \nabla g_i=\bm 0);

と書ける。
と書ける。これを変形すると、

&math(\lambda_i); での微分からは元の拘束条件が現れるのみである。
　&math(\bm \nabla f=\sum_i \lambda_i \bm \nabla g_i);

となり、すなわち 

　&math(\bm \nabla f); が &math(\bm \nabla g_i); の一次結合で表せるような点が停留点である

と読める。

* 停留点の十分条件となっていること [#j4fbf759]

ベクトル &math(\bm x); を &math(\Delta \bm x); だけ動かしたときの &math(L); の変化は、

&math(
\Delta L=\bm \nabla L\cdot\Delta \bm x
&=\bm \nabla f\cdot \Delta \bm x+\sum_i \lambda_i \bm \nabla g_i\cdot \Delta \bm x\\
&=\Delta f+\sum_i\lambda_i\Delta g_i\\
&=\bm 0);
);

と書ける。
であるが、条件式を満たす点においては &math(\bm \nabla L=0); であるからこの値は常にゼロとなる。

&math(\Delta \bm x); がすべての &math(g_i); の値を変化させない方向であった場合、
&math(\Delta \bm x); をすべての &math(g_i); の値を変化させない方向に取った時のみ、
変位後の点も拘束条件を満たすことになる。

そのような &math(\Delta \bm x); に対しては
&math(\Delta g_1=\Delta g_2=\dots=\Delta g_m=0); であるから、&math(\Delta L=0); 
の条件はそのまま &math(\Delta f=0); の条件と一致する。

すなわち、ラグランジュの未定係数法により見つかった点は必ず停留点となることが分かる。

* 停留点の必要条件となっていること [#e0c73b69]

逆に、停留点であれば必ずラグランジュの未定係数法の条件式を満たす &math(\lambda_i); 
が存在するだろうか？

流れ：
条件式を書き換えて

+ 重複する条件を取り除く &math((m\to m'));
+ &math(n-m'); 次元の &math(\Delta f=0); となる空間が存在する
+ １つの &math(\Delta g_i); のみが変化する方向に動かして &math(\lambda_i); を決めると、
その方向を加えた空間で &math(\Delta L=0); にできる
+ &math(m'); 個全てについて行えば、全 &math(n); 次元空間で &math(\Delta L=0); にできる
&math(\bm\nabla f=-\sum_i\lambda_i\bm\nabla g_i);

制約条件を満たすある停留点からの変位 &math(\Delta\bm x); を &math(n); 次元ベクトル空間 &math(K^n); 
から選ぶことを考える。
とするとこれは、停留点において &math(\bm\nabla f); が &math(\bm\nabla g_i);
の張る空間の元となっていることを主張している。

移動先で制約条件が満たされている条件は &math(\bm\nabla g_i\cdot\Delta\bm x=0); だから、
１つの制約条件を与えると、制約条件を満たす変位の作る空間 &math(V_\mathrm{meet}); 
の次元は１つ減る。
以下にこの意味を考えよう。

&math(m); 個すべての &math(\bm\nabla g_i); が線形独立であれば、
すべての制約条件を満たす変位の作る空間は &math(n-m); 次元となるが、
いくつかが線形従属である場合にはそれらを取り除いて独立な条件を &math(m'); 個残す。
拘束条件の下での停留点を考え、そこからの変位を &math(\Delta\bm x); とする。

すると、&math(\dim V_\mathrm{meet}=n-m'); となる。
何も考えなければ &math(\Delta\bm x); は &math(n); 次元ベクトル空間 &math(K^n); 
から任意のベクトルを選ぶことができる。

&math(\Delta\bm x\in V_\mathrm{meet}); に対しては &math(\Delta L=\Delta f); であるから、
停留点の条件 &math(\Delta f=0); によりラグランジュの未定係数法の条件式は成立する。
ここに &math(m); 本のベクトル &math(\{\bm\nabla g_i\}); が張る部分空間 
&math(V_\mathrm{break}); を考え、また、すべての &math(\bm\nabla g_i); 
と直交するようなベクトルの集合 &math(V_\mathrm{meet}); 
を考えればこれも線形空間となる。

これら２つの空間は互いに直交補空間となっている。

すなわち、&math(K^n); は &math(V_\mathrm{break}); と &math(V_\mathrm{meet}); との直交直和である。

&math(K^n=V_\mathrm{break}\oplus V_\mathrm{meet});　~

任意の &math(\Delta\bm x\in V_\mathrm{meet}); はすべての &math(\bm\nabla g_i); 
と直交するから、すなわちすべての &math(i); に対して &math(\Delta g_i=0); となり、
&math(V_\mathrm{meet}); は「制約条件を満たす変位」が作る線形空間となる。

今考えている点は拘束条件の下で停留点であると仮定したから、
制約条件を満たす任意の &math(\Delta\bm x); に対して
&math(\Delta f=\bm\nabla f\cdot\Delta\bm x=0); が成り立つ。

これは、&math(\bm\nabla f); が &math(V_\mathrm{meet}); の任意の元に直交することを意味しており、
すなわち &math(\bm\nabla f); が &math(V_\mathrm{meet}); の直交補空間 &math(V_\mathrm{break}); 
の元であることを示している。

上の仮定から &math(\{\bm\nabla g_i\}); は &math(V_\mathrm{break}); 
を張るから、&math(\bm\nabla f); を &math(\{\bm\nabla g_i\}); の一次結合で表すことが可能。

その係数が &math(\lambda_i); なわけである。
Counter: 25904 (from 2010/06/03), today: 3, yesterday: 32