活性化関数とは？わかりやすく解説

ニューラルネットワーク > 活性化関数

活性化関数（かっせいかかんすう、英: activation function）もしくは伝達関数（でんたつかんすう、英: transfer function）とは、ニューラルネットワークのニューロンにおける、入力のなんらかの合計（しばしば、線形な重み付け総和）から、出力を決定するための関数で、非線形な関数とすることが多い。

概要

よく使われているモデルでは、人工ニューロンは1つ以上の入力を受け取り（1つ以上の樹状突起に相当）、それらの重み付け総和から、活性化関数を通して、出力を生成する。

数式では、以下の $\varphi$

ς型の関数の比較

1990年代になり、活性化関数は原点を通すべきと言う考えから、標準シグモイド関数よりもそれを線形変換した tanh の方が良いと提案された^[2]^[3]。

\varphi (x)=\tanh(x)

[nature201505-1] Yann LeCun; Yoshua Bengio; Geoffrey Hinton (2015-05-28). “Deep learning”. Nature 521 (7553): 436-444. doi:10.1038/nature14539.

[2] Yann LeCun; Leon Bottou; Genevieve B. Orr; Klaus-Robert Muller (1998). Efficient BackProp.

[Glorot2010-3] Xavier Glorot; Yoshua Bengio (2010). Understanding the difficulty of training deep feedforward neural networks.

[4] Xavier Glorot; Antoine Bordes; Yoshua Bengio. “Deep Sparse Rectifier Neural Networks”. Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics (AISTATS-11) 15: 315-323.

[5] Andrew L. Maas; Awni Y. Hannun; Andrew Y. Ng (2013). Rectifier Nonlinearities Improve Neural Network Acoustic Models.

[6] Ramachandran, Prajit; Zoph, Barret; Le, Quoc V. (2017-10-27). “Searching for Activation Functions”. arXiv:1710.05941 [cs]. http://arxiv.org/abs/1710.05941.

[7] Youngmin Cho; Lawrence K. Saul (2009). “Kernel Methods for Deep Learning”. Advances in Neural Information Processing Systems 22: 342-350.

[8] Ziyin, Liu; Hartwig, Tilman; Ueda, Masahito (2020-10-24). “Neural Networks Fail to Learn Periodic Functions and How to Fix It”. arXiv:2006.08195 [cs, stat]. http://arxiv.org/abs/2006.08195.

[#1-9] Sitzmann, Vincent; Martel, Julien N. P.; Bergman, Alexander W.; Lindell, David B.; Wetzstein, Gordon (2020-06-17). “Implicit Neural Representations with Periodic Activation Functions”. arXiv:2006.09661 [cs, eess]. http://arxiv.org/abs/2006.09661.

[10] Broomhead, David S.; Lowe, David (1988). Radial basis functions, multi-variable functional interpolation and adaptive networks.

[11] Qinghua Zhang; Albert Benveniste (1992). “Wavelet networks”. IEEE Trans. Neural Networks 3: 889-898.

[12] Ian J. Goodfellow; David Warde-Farley; Mehdi Mirza; Aaron Courville; Yoshua Bengio (2013). “Maxout Networks”. 30th International Conference on Machine Learning. http://arxiv.org/abs/1302.4389.

[2]

[3]

[4]

[1]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

論理演算	ステップ関数	ランプ関数（ReLU）
NOT	$H(-x_{1}+0.5)$	$\varphi (-x_{1})-0.5$
AND	$H(x_{1}+x_{2}-1.5)$	$\varphi (x_{1}+x_{2})-1$
OR	$H(x_{1}+x_{2}-0.5)$	$\varphi (x_{1}+x_{2}+2)-1$
XOR	$H(x_{1}+x_{2}-2H(x_{1}+x_{2}-1.5)-0.5)$	$-\varphi (x_{1}+x_{2})-\varphi (-x_{1}-x_{2})+1$

活性化関数とは？わかりやすく解説

活性化関数

概要

ReLU（ランプ関数）

切断冪関数

多項式

絶対値

Snake

三角関数

動径基底関数

ウェーブレット

maxout

出力層の活性化関数と誤差関数

回帰

二値分類

多クラス分類

論理演算

関数近似

出典

「活性化関数」の関連用語

活性化関数とは？ わかりやすく解説

活性化関数

概要

ReLU（ランプ関数）

切断冪関数

多項式

絶対値

Snake

三角関数

動径基底関数

ウェーブレット

maxout

出力層の活性化関数と誤差関数

回帰

二値分類

多クラス分類

論理演算

関数近似

出典

急上昇のことば

「活性化関数」の関連用語

活性化関数とは？わかりやすく解説