最適制御
最適制御(さいてきせいぎょ、英: optimal control)は、特定の時間区間における評価関数の値を最小化(あるいは最大化)するように制御入力を決定する、動的システムに対する制御手法のひとつである。 形式的には、制御対象である動的システムの動特性を記述する状態方程式を拘束条件のひとつとして持つ汎関数の最適化問題として定式化される。 しばしばこの問題には、各時刻における状態ベクトルや制御入力に対する制約条件が含まれる。 最適制御理論は変分法の拡張であり、制御工学のみでなく応用数学(特に数理最適化)や数理物理学とも強い関わりを持つ。
歴史
最大原理と動的計画法は、1950年代の半ば頃にほぼ同時かつ独立に開発された。その基礎となる考え方は非常に古く、それらは先史から深く結びついている。
最大原理は、変分法におけるワイエルシュトラスの強い極値に関する必要条件を一般化したものであり、ハミルトニアンを"疑似"ハミルトニアン (英: pseudo-Hamiltonian)に置き換えることで得られる。この原理はコンスタンティン・カラテオドリによって1935年には既に垣間見えており、1950年にはマグナス・ヘステネスによって、より精緻なものとなった。しかし、今日我々が知る形の最大原理はレフ・ポントリャーギンの洞察が基礎にある。彼は最初に最短時間問題に対しこの問題を定式化し、その後ウラジミール・ボルチャンスキー レバス・ガムクレリゼおよび レフ・ロゾノエルらによって 1955 年から 1959 年に一般的なケースへと拡張された。ここで用いられた「針状の変分 (英: needle variations)」による手法はエドワード・マクシェーンによって 1939 年には既に用いられていたが、ボルチャンスキーはこれに加えて最大原理が最適性の必要条件にすぎないことを示した。彼は最大原理を、ポントリャーギンと共同研究者によって書かれたその有名な書籍において現在の形式で与えた[1][2][3]。この本では、四番目の著者であるイェ・エフ・ミシチェンコによって確率的な最適制御問題が解かれている。
その後の研究によって、理論の根本的な修正を行うことなくアプローチを一般化することが可能になった。ひとつはフランシス・クラークによって始められた「非平滑解析 (英: nonsmooth analysis)」によるものであり、これは彼によって導入された一般化勾配 (英: generalized gradient) または一般化微分 (英: generalized derivative) を用いることで微分可能性の条件を弱めることにフォーカスする[4][5][6]。これにより、ポントリャーギンらによる結果で得られていた区分的な連続関数よりも広いクラス(特にルベーグ可測な関数)を制御入力に用いることが可能になった。その他の拡張の方向性としては、時間遅れをもつシステム[7]や無限次元システム[8]などがある。
ボルチャンスキーは、離散時間システムに対する最大原理の「弱い」バージョンを(このために必要となる数学的手法を開発した後で)示した[9]。今日において、この結果はカルーシュ・クーン・タッカー条件を用いることで容易に示すことが出来るが、適当な凸性の仮定のもとで「真の」最大原理である十分条件を得ることが出来る[10]。
一般的な定式化
最適制御問題は、対象となる動的システムの状態方程式を拘束条件としてもつ汎関数の制約付き最小化問題として定式化される。
いま、システムの状態ベクトルと制御入力ベクトルを カテゴリ
- Optimal Controlのページへのリンク