解析力学/ハミルトニアン の履歴(No.15)
更新>>> 解析力学 へ戻る
目次†
ハミルトン力学†
ラグランジアンによる力学 では、座標 $q_i$ と速度 $\dot q_i$ を独立変数とするラグランジアンを使って運動を記述した。
同じ運動を、座標 $q_i$ と運動量 $p_i$ を独立変数とするハミルトニアンを使って記述しようというのがハミルトン力学である。
ここでいう「独立変数」の意味は、ラグラジアン力学では $q_i$ での偏微分は $\dot q_i$ およびすべての $j\ne i$ に対する $q_j,\dot q_j$ を固定して行うのに対して、ハミルトン力学では $q_i$ での偏微分は $p_i$ およびすべての $j\ne i$ に対する $q_j,p_j$ を固定して行う、というようなことを言っている。つまり、
$$ L(q_1,q_2,\dots,q_n,\dot q_1,\dot q_2,\dots,\dot q_n,t) $$
に対して、
$$ H(q_1,q_2,\dots,q_n,p_1,p_2,\dots,p_n,t) $$
であり、$L$ は $p_i$ を含まず、$H$ は $\dot q_i$ を含まない形で書き表した上で偏微分を行う。
ハミルトン力学はラグランジュ力学よりもさらに多様な変数変換に対して共変となるため有用である。
ルジャンドル変換†
$x,y$ を独立変数とする関数 $f(x,y)$ の全微分を
$$ \tag{1} df(x,y)=\tilde x\, dx+\tilde y\, dy\hspace{5mm}\left(\frac{\partial f}{\partial x}=\tilde x,\ \ \frac{\partial f}{\partial y}=\tilde y\right) $$
と書く($\tilde x,\tilde y$ は $f$ の $x,y$ に対する偏微分係数)。
「$f(x,y)$ を $x$ に対してルジャンドル変換する」とは $x,y$ の代わりに $\tilde x,y$ を独立変数とする関数 $\tilde f(\tilde x,y)$ を
$$ \tag{2} \tilde f(\tilde x,y)=\tilde x x-f(x,y) $$
として作ることをいう。「$\tilde f(\tilde x,y)$ は $f(x,y)$ を $x$ に対してルジャンドル変換したものである」 *1この項の内容は前野昌弘先生の琉球大学理学部講義「熱力学」令和2年4月8日版 2.4章 Legendre 変換とその物理的意味(http://www.phys.u-ryukyu.ac.jp...) および ルジャンドル変換 - EMAN の解析力学(https://eman-physics.net/analy...) で勉強しなおして大幅に書き換えました 2023-11-13
$q$ と $\dot q$ の関数であるラグランジアン $L(q,\dot q)$ を $\dot q$ に対してルジャンドル変換したものがハミルトニアン $H(q,p)=qp-L(q,\dot q)$ であり、ハミルトニアンは $q$ と $p=\partial L/\partial \dot q$ の関数である。
他にも熱力学などでルジャンドル変換は大活躍をする。
このとき以下で見るように
$$ \tag{3} d\tilde f(\tilde x,y)=x\,d\tilde x-\tilde y\,dy\hspace{5mm}\left(\frac{\partial \tilde f}{\partial \tilde x}=x,\ \ \frac{\partial \tilde f}{\partial y}=-\tilde y\right) $$
が成り立つ。(1) 式と比べてみよう。
$$ \tag{再掲)(1} df(x,y)=\tilde x\, dx+\tilde y\, dy\hspace{5mm}\left(\frac{\partial f}{\partial x}=\tilde x,\ \ \frac{\partial f}{\partial y}=\tilde y\right) $$
第1項同士を比べれば、ルジャンドル変換前後で $x$ と $\tilde x$ とがきれいに役割を入れ替え、$\tilde f$ に対しては $x$ が $\tilde x$ による偏微分係数となっていることを見て取れる。
これを反映して後述の通り $\tilde f(\tilde x,y)$ を $\tilde x$ に対してもう一度ルジャンドル変換すると $f(x,y)$ に戻ることになる。
第2項同士を比べれば「変換されなかった変数による偏微分」は符号のみ入れ替わることを見て取れる。
$$ \tag{4} \frac{\partial \tilde f}{\partial y}=-\frac{\partial f}{\partial y} $$
ただしここで、両辺に現れる2つの $\partial/\partial y$ の意味の違いに注意が必要である。左辺の $\tilde f$ は $\tilde x,y$ の関数であるから左辺の $\partial/\partial y$ は $\tilde x$ を固定した偏微分であり、右辺の $f$ は $x,y$ の関数であるから右辺の $\partial/\partial y$ は $x$ を固定した偏微分である。
$$ \tag{$4'$} \frac{\partial \tilde f(\tilde x,y)}{\partial y}=-\frac{\partial f(x,y)}{\partial y} $$
(2) 式に $\tilde x\,x$ の項が含まれるおかげで、両辺で異なる意味合いを持つ「$y$ による偏微分」が符号を除いて等しい値を持つのである。
偏微分を使った導出†
偏微分を用いて (3) 式を導く際には独立変数が $\tilde x,y$ であることを明示して $x$ を $x(\tilde x,y)$ と書くと分かりやすい。
$$ \tag{$2'$}\tilde f(\tilde x,y)=\tilde x\,x(\tilde x,y)-f\big(x(\tilde x,y),y\big) $$
これらを $\tilde x,y$ で偏微分すれば、
$$ \begin{aligned} \frac{\partial\tilde f(\tilde x,y)}{\partial \tilde x} &=\cancel{\frac{\partial\tilde x}{\partial \tilde x}}x(\tilde x,y)+\tilde x\frac{\partial x(\tilde x,y)}{\partial \tilde x}-\frac{\partial}{\partial \tilde x}f\big(x(\tilde x,y),y\big)\\ &=x(\tilde x,y)+\tilde x\frac{\partial x(\tilde x,y)}{\partial \tilde x}-\underbrace{\frac{\partial f(x,y)}{\partial x}}_{\tilde x}\frac{\partial x(\tilde x,y)}{\partial \tilde x}\\ &=x(\tilde x,y)+\cancel{\tilde x\frac{\partial x(\tilde x,y)}{\partial \tilde x}}-\cancel{\tilde x\frac{\partial x(\tilde x,y)}{\partial \tilde x}}\\ &=x \end{aligned} $$
$$ \begin{aligned} \frac{\partial\tilde f(\tilde x,y)}{\partial y} &=\tilde x\frac{\partial x(\tilde x,y)}{\partial y}-\frac{\partial}{\partial y}f\big(x(\tilde x,y),y\big)\\ &=\tilde x\frac{\partial x(\tilde x,y)}{\partial y}-\underbrace{\frac{\partial f(x,y)}{\partial x}}_{\tilde x}\frac{\partial x(\tilde x,y)}{\partial y}-\frac{\partial f(x,y)}{\partial y}\\ &=\cancel{\tilde x\frac{\partial x(\tilde x,y)}{\partial y}}-\cancel{\tilde x\frac{\partial x(\tilde x,y)}{\partial y}}-\frac{\partial f(x,y)}{\partial y}\\ &=-\frac{\partial f(x,y)}{\partial y}\\ &=\tilde y \end{aligned} $$
$$ \begin{aligned} \therefore d\tilde f &=x\,d\tilde x-\tilde y\,dy \end{aligned} $$
途中で行った変形、例えば
$$ \frac{\partial}{\partial y}f\big(x(\tilde x,y),y\big)= \frac{\partial f(x,y)}{\partial x}\frac{\partial x(\tilde x,y)}{\partial y}+\frac{\partial f(x,y)}{\partial y} $$
は $x$ が $y$ の関数であるため $y\to y+dy$ の変化に対して $x\to x+dx=x+\frac{\partial x}{\partial y}dy$ と変化することを考慮した
$$ \begin{aligned} f(x(\tilde z,y+dy),y+dy)&=f(x+dx,y+dy)\\ &=\frac{\partial f(x,y)}{\partial x}dx+\frac{\partial f(x,y)}{\partial y}dy\\ &=\frac{\partial f(x,y)}{\partial x}\frac{\partial x(\tilde x,y)}{\partial y}dy+\frac{\partial f(x,y)}{\partial y}dy\\ \end{aligned} $$
を偏微分で表したものであるが、このように偏微分では「どの変数で微分するか」と同じくらい「どの変数を固定するか」に注意を払う必要があり、計算が煩雑になりがちである。
全微分を使った導出†
(2) 式を全微分に直し (1) 式を代入すれば、
$$ \begin{aligned} d\tilde f(\tilde x,y)&=d(\tilde x x)-df(x,y)\\ &=d\tilde x\, x+\cancel{\tilde x\, dx}-\big(\cancel{\tilde x\, dx}+\tilde y\,dy\big)\\ &=x\,d\tilde x-\tilde y\,dy \end{aligned} $$
のように簡単に (3) 式が得られる。
実際これで正しい計算になっているし、この方がずっと楽に計算できるのであるが、その意味するところや得られた結果に対する理解を深めるため上ではあえて偏微分を使って解いたのであった。
2回のルジャンドル変換で元に戻る†
$\tilde f(\tilde x,y)$ を $\tilde x$ に対してルジャンドル変換すれば、(3) 式より
$$ \tag{5} \widetilde{\tilde x}=\frac{\partial\tilde f(\tilde x,y)}{\partial\tilde x}=x $$
であり、(2) 式より
$$ \tag{6} \widetilde{\tilde f}(\widetilde{\tilde x},y)=\widetilde{\tilde x}\,\tilde x-\tilde f(\tilde x,y) =\cancel{x\,\tilde x}-\big(\cancel{\tilde x\, x}-f(x,y)\big)=f(x,y) $$
となり $f(x,y)$ に戻る。
このようにルジャンドル変換はとても対称性の良い変換である。
またこれはルジャンドル変換が可逆的な変換であるということでもある。
このことから(少なくとも $x$ と $\tilde x$ が1対1に対応する限り)$\tilde x,\tilde f(\tilde x,y)$ の情報さえあれば (5), (6) 式により $x,f(x,y)$ の情報を完全に復元可能であることが分かる。言い換えれば $f(x,y)$ で記述できる物理系は $\tilde f(\tilde x,y)$ で記述しても情報が失われることはない。
注1:$x$ と $\tilde x$ との1対1対応†
上で述べたルジャンドル変換が有効なのは $f(x,y)$ が $x$ で偏微分可能であり、なおかつ偏微分係数である $\tilde x$ と $x$ との間に1対1対応がある場合に限る。これは $\tilde x(x,y)$ が $x$ に対して単調増加あるいは単調減少すること($x$ の全域にわたり $\partial^2\tilde x/\partial x^2>0$ または $\partial^2\tilde x/\partial x^2<0$)と同義であり、$f(x,y)$ が定義域全域にわたり $x$ に対して上に凸あるいは下に凸であることと同義である。
一方、熱力学などでは相転移に伴って特性関数に微分不可能な点が現れ、$x$ と $\tilde x$ との対応が一対一にならないような場合なども扱えるよう議論が拡張される。興味があれば 谷村省吾“ルジャンドル変換、物質情報学 1(解析力学)講義ノート 6 や 東京大学出版会「熱力学の基礎」清水明 著 などを参考にするとよい。この場合にも $f(x,y)$ が定義域全域にわたり $x$ に対して上に凸あるいは下に凸であることは仮定される。
注2:もう1つのルジャンドル変換†
上記 (2) 式の符号を変えて、
$$ \tag{2*} \tilde f(\tilde x,y)=f(x,y)-\tilde x x $$
とする変換もルジャンドル変換と呼ばれる。
この場合 (3) 式の符号が変わり
$$ \tag{3*} d\tilde f(\tilde x,y)=-x\,d\tilde x+\tilde y\,dy\hspace{5mm}\left(-x =\frac{\partial \tilde f}{\partial \tilde x},\ \ \tilde y =\frac{\partial \tilde f}{\partial y}\right) $$
となる。
すなわちこのとき $\tilde x$ による偏微分は $x$ ではなく $-x$ である。一方、変換されなかった変数に対する偏微分は符号を含めて変化しない。
これを反映して、2度目のルジャンドル変換では $x$ ではなく $-x$ が独立変数となる。
$$ \tag{5*} \widetilde{\tilde x}=-x $$ $$ \tag{6*} \widetilde{\tilde f}(\widetilde{\tilde x},y)=f(-\widetilde{\tilde x},y) $$
注3:複数の変数に対するルジャンドル変換†
複数の変数に対して一度に変換を行っても構わない。
$f(x,y,z)$ ただし $df=\tilde x\,dx+\tilde y\,dy+\tilde z\,dz$ を $x,y$ に対してルジャンドル変換すれば
$$ \tilde f(\tilde x,\tilde y,z)=\tilde x\,x+\tilde y\,y-f(x,y,z) $$
が得られ、
$$ d\tilde f=x\,d\tilde x+y\,d\tilde y-\tilde z\,dz $$
を満たす、といった具合である。
この結果は、$f(x,y,z)$ を $x$ に対してルジャンドル変換し、続けて $y$ に対してルジャンドル変換した場合とは異なることに注意せよ。
ハミルトニアン†
ラグランジアンに対して $\dot q_i$ から $p_i$ へのルジャンドル変換を施した、
$$ H(q_1,q_2,\dots,q_n,p_1,p_2,\dots,p_n)=\sum_{i=1}^n p_i\dot q_i-L(q_1,q_2,\dots,q_n,\dot q_1,\dot q_2,\dots,\dot q_n) $$
をハミルトニアンと呼ぶ。 ラグランジアンが $q_i,\dot q_i$ の関数であるのに対して、 ハミルトニアンが $q_i,p_i$ の関数となっていることに注目せよ。
先に見たように $L=T-U$ と表されるときハミルトニアンは系のエネルギーに相当するため、 「系のエネルギーを座標と運動量で表したものがハミルトニアンである」と言って良い。 ただしここでの「座標」、「運動量」は「一般座標」、「一般運動量」である。
正準方程式†
ハミルトニアンの全微分は
$$ \begin{aligned} dH &=\sum_{i=1}^n\big(\dot q_i\,dp_i+\cancel{p_i\,d\dot q_i}\big)-\underbrace{\sum_{i=1}^n\big(\cancel{p_i\,d\dot q_i}+\dot p_i\,d q_i\big)}_{=\,dL}\\ &=\sum_{i=1}^n\big(\dot q_i\,dp_i-\dot p_i\,d q_i\big)\\ \end{aligned} $$
となり、
$$ \dot q_i=\frac{\partial H}{\partial p_i} $$
$$ \dot p_i=-\frac{\partial H}{\partial q_i} $$
が成り立つことが分かる。この方程式はハミルトンの正準方程式と呼ばれる。
ラグランジュの運動方程式に現れた $\partial/\partial q_i$ が $\dot q_i$ を固定した偏微分だったのに対して、ハミルトンの運動方程式(正準方程式)に現れる $\partial/\partial q_i$ が $p_i$ を固定した偏微分になっていることに注意せよ。偏微分を扱う際には、何で微分するかと同じくらい、何を固定した微分であるかに注意を払わなければならない。
上記の計算を逆にたどればラグランジアンの運動方程式 $\dot p_i=\partial L/\partial \dot q_i$ が得られるため、この正準方程式はラグランジアンの運動方程式と同値であり、やはり系の運動方程式を与える。
例†
実際に上の振り子の例で試すと、
$$L=\frac12 mr^2\dot\theta^2-mgr(1-\cos\theta)$$
$$ p_\theta=\frac{\partial L}{\partial \dot \theta}=mr^2\dot\theta $$
より、
$$ \begin{aligned} H &=p_\theta\dot\theta-L\\ &=p_\theta\dot\theta-\big[\frac12 mr^2\dot\theta^2-mgr(1-\cos\theta)\big]\\ &=p_\theta\dot\theta-\big[\frac12 p_\theta\dot\theta-mgr(1-\cos\theta)\big]\\ &=\frac12p_\theta\dot\theta+mgr(1-\cos\theta)\\ &=T+U\\ &=\frac1{2mr^2}p_\theta^2+mgr(1-\cos\theta)\\ \end{aligned} $$
となり、ハミルトニアンが運動エネルギーとポテンシャルエネルギーの和、すなわち系のエネルギーそのものを表すこと、そして、$p_\theta$ が $\dot\theta$ を含むため、これで $\dot\theta$ を消去して $\theta,p_\theta$ のみの関数として表せること、を確かめられる。(一旦ラグランジアンを求めないと、変数 $\theta$ に対応する一般化運動量 $p_\theta$ が何になるかが分からないという点も理解できる)
そしてハミルトンの正準方程式は、
$$ \dot \theta=\frac{\partial H}{\partial p_\theta}=\frac1{mr^2}p_\theta\ \ \ \to\ \ \ p_\theta=mr^2\dot\theta $$
$$ \dot p_\theta=-\frac{\partial H}{\partial \theta}=-mgr\sin\theta $$
となり、第1式から運動量の定義が、第2式から運動量の時間変化すなわち運動方程式が出る。
ハミルトニアンと最小作用の法則†
ラグランジアンによる最小作用の法則では作用を $q_i(t)$ の汎関数とみなして最小値を探した。 $\dot q_i(t)$ はそれに伴い従属的に変化した。
これに対して、
ハミルトニアンによる最小作用の法則は関数 $q_i(t), p_i(t)$ を独立関数とみなし、$q_i(t), p_i(t)$ の両方を自由に動かして最小値を探す問題として定式化される。
このことを以下に見よう。$\delta p_i(t_1)=\delta p_i(t_2)=0$ を固定した上で $\delta p_i(t),\delta q_i(t)$ を自由に選べるとすれば、
$$ \begin{aligned} \delta S&=S[q_i+\delta q_i, p_i+\delta p_i]-S[q_i, p_i]\\ &=\delta\int_{t_1}^{t_2}\Big[\sum_{i=1}^np_i\dot q_i-H\Big]dt\\ &=\sum_{i=1}^n\int_{t_1}^{t_2} \Big[\delta p_i\dot q_i+p_i \delta\dot q_i-\frac{\partial H}{\partial q_i}\delta q_i-\frac{\partial H}{\partial p_i}\delta p_i\bigg]dt\\ &=\cancel{\sum_{i=1}^n\big[p_i\delta q_i\big]_{t_1}^{t_2}}+\sum_{i=1}^n\int_{t_1}^{t_2} \Big[\delta p_i\dot q_i-\dot p_i \delta q_i-\frac{\partial H}{\partial q_i}\delta q_i-\frac{\partial H}{\partial p_i}\delta p_i\bigg]dt\\ &=\sum_{i=1}^n\int_{t_1}^{t_2} \Big[\underbrace{\Big(\dot q_i-\frac{\partial H}{\partial p_i}\Big)}_{\delta S/\delta p_i}\delta p_i\underbrace{-\Big(\dot p_i +\frac{\partial H}{\partial q_i}\Big)}_{\delta S/\delta q_i}\delta q_i\bigg]dt\\ \end{aligned} $$
となる。したがって、作用が極小値を取る条件 $\delta S/\delta q_i=0, \delta S/\delta p_i=0$ は、
$$ \dot q_i=\frac{\partial H}{\partial p_i} $$
$$ \dot p_i =-\frac{\partial H}{\partial q_i} $$
を与え、これはハミルトンの正準方程式に他ならない。
>>> 解析力学 へ戻る
質問・コメント†
ハミルトニアンが保存することを示す†
淺井朗人 ()
上の振り子の条件と同じ場合にハミルトニアンが保存されることを説明するにはどうすればいいでしょうか?
- ハミルトニアンの定義とエネルギーの保存 こちらの説明では足りないでしょうか? -- 武内(管理人)
*1 この項の内容は前野昌弘先生の琉球大学理学部講義「熱力学」令和2年4月8日版 2.4章 Legendre 変換とその物理的意味 および ルジャンドル変換 - EMAN の解析力学 で勉強しなおして大幅に書き換えました 2023-11-13