自由エネルギー原理
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/03/27 04:29 UTC 版)
![]() | この項目「自由エネルギー原理」は翻訳されたばかりのものです。不自然あるいは曖昧な表現などが含まれる可能性があり、このままでは読みづらいかもしれません。(原文:英文記事 Free energy principle (07:18, 9 February 2025) 版) 修正、加筆に協力し、現在の表現をより自然な表現にして下さる方を求めています。ノートページや履歴も参照してください。(2025年3月) |
自由エネルギー原理(じゆうエネルギーげんり、英:Free energy principle)は、脳の働きに関する理論的枠組みであり、脳が 内部モデルに基づいて予測を行い、感覚入力を用いてそのモデルを更新することで、驚き(シャノンサプライズのこと)や不確実性を低減する と示唆する。この原理で強調される脳の目的は、内部モデルと外界との整合性を高めて予測の正確性を向上させることである。この原理はベイズ推定と能動的推論を統合しており、予測によって行動が導かれ、その行動がもたらす感覚フィードバックによって予測が精緻化されるとする。この原理は、脳機能、知覚、および行動の理解に広範な影響を与える。[1]
概要
生物物理学および認知科学において、自由エネルギー原理は一つの数学的原理であり、物理システムの表象能力についての形式的な記述を提供する。つまりこれは、存在するものが、あたかもそれと結びつけられたシステムの特性の跡をたどっているように見える理由を説明するものである。[2]この原理により規定されているのは、物理システムはその動態としてシャノンサプライズとして表わされる驚きの度合い(ある結果の負の対数確率)を最小化すること、言い換えればその変分上界である自由エネルギーを最小化するということ である。この原理は特に脳機能へのベイズ的取組みで用いられ、人工知能への取組みにも用いられる。また、変分ベイズ法と密接に関連しており、もともとはカール・フリストンによって、神経科学における身体的知覚-行動ループの説明として導入された。[3]
自由エネルギー原理は、あるシステムが他のシステム(例えば、システムが埋め込まれた環境)と分けられてはいるが離れがたく結びついているような場合に、そのシステムの振る舞いをモデル化する。このとき、システムと外界をつなぐ界面を十分に表現できる自由度を持った変数の集合をマルコフ・ブランケットと呼ぶ。より形式的に言うと、自由エネルギー原理が示しているのは、システム全体が「固有の分割」(いいかえれば、マルコフブランケットによる粒子への分割)を持つ場合、システムの部分集合が他の部分集合の統計的な構造の跡をたどる という事である。この統計的な構造は、内部と外部の状態、またはシステムの経路として知られている。
自由エネルギー原理は、脳が推論エンジンであるとするベイズ的な考え方に基づいている。この原理の下では、システムは驚きが最小になる経路を追い求める。表現を変えると、システムは自身の世界モデルに基づく予測と、感覚および関連する知覚との差を最小にしている。この差は変分自由エネルギーとして定量化され、システムの世界モデルの継続的な修正、または世界をシステムの予測に近づけることで最小化される。つまり、システムが自由エネルギーを最小化するには、世界モデルを変えるのでは無く、世界そのものを能動的に変え、期待される状態に近づけるという方法もあるということである。
フリストンはこのことを、すべての生体反応の原理とみなす。[4]また、フリストンは彼の原理が精神疾患や人工知能にも当てはまると信じている。能動的推論原理に基づく人工知能の実装は、他の方法に対して優位性を示している。[4]
自由エネルギー原理は情報物理学の数学的原理であり、最大エントロピー原理や最小作用の原理に似て、数学的な観点から真である。自由エネルギー原理を否定しようとするのはカテゴリー誤認であり、経験的観測により微積分を否定しようとするのと同類である。(こういうやり方では数学的理論の間違いを示すことはできない;必要なのは理論から形式的矛盾を導くことである。)2018年のインタビューで、フリストンは 自由エネルギー原理が反証の対象ではないということを以下のように説明した:[5]
私はここで基本的な区別をしておくことが有用だと思います。この区別は、言明と過程の理論との違いなのです;つまり、物事が従うかもしれない規範的な原理と、その原理がどのように実現されるかについての過程の理論すなわち仮説との違いなのです。
この区別の下では、自由エネルギー原理は予測符号化やベイズ脳仮説などとは全く別のものです。なぜなら自由エネルギー原理は原理だからです。ハミルトンの最小作用の原理のように、この原理も反証できず、否定できません。
実際、それに対してできることはあまりなく、測定可能なシステムがこの原理に従うかどうか問う以外にはありません。一方で、脳がベイズ推定や予測符号化のような形で行動するという仮説は、まさに仮説であり、経験的証拠で支持されることもあれば、されないこともあります。
経験的な証拠に支持された、このような仮説の例は多い。[6]
背景
細胞や脳のような自己組織化する生体システムは、変分自由エネルギーを最小化するものとして理解できる という考え方は、ヘルムホルツの無意識的推論に関する研究[7]や、その後の 心理学[8]および 機械学習[9]における研究に基づいている。変分自由エネルギーは、観測値群と、それらの隠れた原因に対する確率密度の 関数である。この変分確率密度は、仮定された原因から観測結果を予測して生成する確率モデルに関連して定義される。この文脈において、自由エネルギーは周辺尤度(ベイズ的証拠)の近似を提供する。[10] したがって、その最小化はベイズ推論プロセスと見なすことができる。システムが自由エネルギーを最小化するために能動的に観測を行うとき、それは暗に能動的推論を実行し、自身の世界モデルの証拠を最大化する。
しかしながら、自由エネルギーは結果の自己情報量の上界でもあり、驚き[訳注 1]の長期的平均はエントロピーである。これは、自由エネルギーの最小化を行うとき、システムは、サンプリングした結果(または感覚状態)のエントロピーの上界を(暗に)置くことになることを意味している。[11][12]
他の理論との関係
能動的推論は、良いレギュレーター定理[13]や、自己組織化に関する報告[14][15]と密接に関連している。自己組織化に関する報告には、自己集合、パターン形成、オートポイエーシス[16]、およびプラクトポイエーシス[17]が含まれる。能動的推論は、サイバネティックス、シナジェティクス(物理)[18]、および身体化された認知で検討されたテーマを扱っている。
自由エネルギーは、ある変分確率密度の下で観測が期待されるエネルギーから、そのエントロピーを引いた形で表せるので、最大エントロピー原理とも関連がある。[19]さらに、エネルギーの時間平均[訳注 2]は作用になるため、最小変分自由エネルギー原理は 結局のところ、最小作用の原理である。
スケール不変性を可能にする能動的推論は、他の理論や分野にも応用されている。例えば、社会学[20][21][22][23]、言語学およびコミュニケーション[24][25][26]、記号学[27][28]、疫学[29]など、多様な領域で適用されている。
また、負の自由エネルギーは、エビデンス下限と数学的に等価である。これは、機械学習において変分オートエンコーダなどの生成モデルを教育する際に広く使用される。
行動と知覚


注意に関するトップダウン vs. ボトムアップ論争は、主要な未解決問題として取り上げられてきた。この課題に対し、ある計算モデルが、トップダウンとボトムアップのメカニズムが相互作用する 循環的な性質 を示すことに成功した。注意の創発モデル(emergent model of attention)として確立された SAIM というモデルを用いて、著者らはPE-SAIM というモデルを提案した。これは標準版とは対照的に、選択的注意 にトップダウン的な視点からアプローチする。このモデルは、予測誤差を同じレベルまたは上位レベルへ伝達することを考慮に入れている。これは、データ と その原因(または、生成モデル と 事後確率)との間の差を示すエネルギー関数を最小化するためである。モデルの妥当性を高めるために、著者らは刺激間の神経競合(neural competition)も組み込んだ。このモデルの顕著な特徴は、課題実行中において、自由エネルギー関数を予測誤差のみを用いて再定式化した点である。:
この項目は、生物学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています(プロジェクト:生命科学/Portal:生物学)。
- 自由エネルギー原理のページへのリンク