ラグランジュの未定乗数法

拘束条件がある場合の極値を求める方法なんですが、これも探せばいくらでも詳しいサイトがあるんですがあえてトピックに取り上げます。何気に私が大学に入ってから初めて学んだ内容だったり(^^; 微妙に思い入れがあります。

さて、早速ですが問題(ぉ

とある山は、座標(x,y)にて高さがh= f(x,y) のように表せます。そして、この山に一本の道があり、その道は、g(x,y) = 0 という方程式で表せます。さて、この山道で一番標高が高いのはどの地点でしょうか?

この問題はまさにラグランジュの未定乗数法が発揮される状況。ていうかそれにあわせた問題(^^;
答えを先に書いてしまうと、
\nabla ( f(x,y) - \mu g(x,y) ) = 0
という方程式を解けばよい。もちろん、解のx,yは元のg(x,y)=0を満たす必要がある(そういう意味では連立方程式)。さて、ここでμというのが出てきたがこれが未定乗数と呼ばれるパラメータであり、この値はなんでもよい。もちろん最終的には値が求まるが・・・。
さて、方法はわかったがなぜこの方程式で解が得られるのか?それをちょっと考えてみよう。

まず、この方程式を少し変形してみよう。
\nabla f(x,y) = \mu \nabla g(x,y)
となる。fもgもスカラーな関数であることから∇を作用させればベクトルになる。つまりこの方程式はこの二つのベクトルの方向が同じになる条件を言っているのだ。大きさに関しては自由でその分を未定乗μが補っているのだ。
というわけでこの左右のベクトルの図形的意味を考えてみよう。
まずは左辺について。左辺のfは高さを表す式でこれに∇を作用させるのだから、これは傾きを表す。その地点から上る方向を表すベクトルになります。何でかというと・・・めどいので割愛します(ぉぃ 詳しくは適当な力学の教科書でも読んでください(ぉ
次に右辺。こちらはちょい簡単には直感的イメージは涌きにくいかもしれないが、これは法線ベクトルを表している。それを証明するには、まず、この線の方程式が媒介変数で表せると仮定する。実際に解析的な式で表せるかどうかは別としてとにかく表せたとする。それをx(t),y(t)とする。この場合に、元の方程式 g(x(t),y(t)) = 0 の両辺をtで微分する。
\frac{d}{dt}g(x(t),y(t)) = 0
合成関数の微分法により
\frac{dx}{dt} \frac{\partial}{\partial x}g(x,y) + \frac{dy}{dt} \frac{\partial}{\partial y}g(x,y) = 0
となる。これを内積の形に分解すると
(\dot{x},\dot{y}) \cdot \nabla g(x,y) = 0
というわけで目標の∇g(x,y)が出てきた。これに対して右辺は座標の媒介変数微分ということでこれは物理的には速度を表す(媒介変数が時間だったらの話だがとりあえずそういうことにしておいてくれ(ぉ)。ので、速度ベクトルは当然道の方向に沿っている。つまりこれは接線ベクトルを表す。その接線ベクトルと内積をとると0になるベクトルということはつまり法線ベクトルである。

というわけで以上を考えてみると、山の斜面の方向と道の法線ベクトルが同じ向き(逆でもよい)のときその地点が極値ということになる。これは考え方(ていうか見方)を90度回転してみれば、山の等高線と道の進む方向が同じ場合に極値になるという。確かにその通りですね(^^; 等高線に沿って進む。それすなわち高さが変わらない。

というわけで導出でなく証明になりましたが直感的にわかりました。ただし、そこが極大か極小かはたまた鞍点かはこれだけではわかりません(^^;