自動微分とは？わかりやすく解説

自動微分（じどうびぶん、英: automatic differentiation, autodiff, AD）やアルゴリズム微分（英: algorithmic differentiation）とは、プログラムで定義された関数を解析し、関数の値と同時に偏導関数の値を計算するアルゴリズムである。

自動微分は複雑なプログラムであっても加減乗除などの基本的な算術演算や基本的な関数（指数関数・対数関数・三角関数など）のような基本的な演算の組み合わせで構成されていることを利用し、これらの演算に対して合成関数の偏微分の連鎖律を繰り返し適用することによって実現される。自動微分を用いることで偏導関数値を少ない計算量で自動的に求めることができる。

他の微分方式との違い

自動微分は以下のどちらとも異なる。

記号微分・数式微分（symbolic differentiation） - 原関数を表す数式から数式処理により導関数を導出する。数式処理システムで実装されている。
数値微分（numerical differentiation） - 原関数の値から数値的に微分係数を算出する

記号微分は効率が悪くなりやすく、プログラムで定義された関数から微分表現を導くのは困難であるという問題がある。一方、数値微分では離散化の際の丸め誤差や桁落ちによる精度の低下が問題である。さらに、どちらの手法も計算量や誤差の関係で高次の微分係数を求めることが難しい。また、勾配を用いた最適化で必要となる、多くの入力変数を持つ関数に対する偏微分値の計算を行うには速度が遅い。自動微分はこれらの古典的手法の問題を解決する。^[1]

また、自動微分は計算フローを追いかけることで計算できるので、分岐（if文）やループや再帰を含むようなアルゴリズムでも偏微分できる^[1]。

合成関数の偏微分の連鎖律

自動微分の基本原理は、合成関数の偏微分の連鎖律を用いた偏微分の分解である。

合成関数の偏微分の連鎖律とは $y=f(w_{1},w_{2}),w_{1}=g(x_{1},x_{2}),w_{2}=h(x_{1},x_{2})$

図2: ボトムアップ型自動微分の計算グラフの例

例として次の関数を考える。

{\begin{aligned}y&=f(x_{1},x_{2})\\&=x_{1}x_{2}+\sin x_{1}\\&=w_{1}w_{2}+\sin w_{1}\\&=w_{3}+w_{4}\\&=w_{5}\end{aligned}}

[jmlr17-468-1] Automatic Differentiation in Machine Learning: a Survey

[2] 連鎖律（多変数関数の合成関数の微分） | 高校数学の美しい物語

[3] 合成関数の偏微分における連鎖律(チェインルール)とその証明 | 数学の景色

[wengert1964-4] R.E. Wengert (1964). “A simple automatic derivative evaluation program”. Comm. ACM 7: 463–464. doi:10.1145/355586.364791.

[5] Andreas Griewank (2012). “Who Invented the Reverse Mode of Differentiation”. Optimization Stories, Documenta Matematica Extra Volume ISMP: 389–400.

[6] Bartholomew-Biggs, Michael; Brown, Steven; Christianson, Bruce; Dixon, Laurence (2000). “Automatic differentiation of algorithms”. Journal of Computational and Applied Mathematics 124 (1-2): 171-190. doi:10.1016/S0377-0427(00)00422-2.

[7] utograd/tutorial.md at master · HIPS/autograd

[8] Derivatives in Theano — Theano 1.1.2+29.g8b2825658.dirty documentation

[9] 2104.00219 Fast Jacobian-Vector Product for Deep Networks

[10] Pearlmutter, Barak A. (1994-01-01). “Fast Exact Multiplication by the Hessian”. Neural Computation 6 (1): 147-160. doi:10.1162/neco.1994.6.1.147.

[11] HIPS/autograd: Efficiently computes derivatives of numpy code.

[12] “Conv2d — PyTorch 2.3 documentation”. pytorch.org. 2024年7月2日閲覧。

[13] “MaxPool2d — PyTorch 2.3 documentation”. pytorch.org. 2024年7月6日閲覧。

[1]

自動微分とは？わかりやすく解説

自動微分

他の微分方式との違い

合成関数の偏微分の連鎖律

オペレータオーバーローディング

ソフトウェア

脚注

参考文献

外部リンク

「自動微分」の関連用語

自動微分とは？ わかりやすく解説

自動微分

他の微分方式との違い

合成関数の偏微分の連鎖律

オペレータオーバーローディング

ソフトウェア

脚注

参考文献

外部リンク

急上昇のことば

「自動微分」の関連用語

自動微分とは？わかりやすく解説