バイアスと分散のトレードオフとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > バイアスと分散のトレードオフの意味・解説 

バイアスと分散のトレードオフ

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/15 15:33 UTC 版)

機械学習」の記事における「バイアスと分散のトレードオフ」の解説

詳細は「偏りと分散」を参照 回帰では、入力xに対応するyの予測値 y ^ = F ^ D ( x ) {\displaystyle {\hat {\mathbf {y} }}={\hat {F}}_{D}(\mathbf {x} )} を出力する事を求められ、 y ^ {\displaystyle {\hat {\mathbf {y} }}} はyの期待値に近いことが望ましく、しかも y ^ {\displaystyle {\hat {\mathbf {y} }}} のばらつき小さい方が望ましい。しかし下記に示すようにこの2つ要件トレードオフの関係にある: 定理 (バイアスと分散のトレードオフ) ― p(x,y)を R ℓ × R k {\displaystyle \mathbb {R} ^{\ell }\times \mathbb {R} ^{k}} 上の確率分布とし、Dを R ℓ × R k {\displaystyle \mathbb {R} ^{\ell }\times \mathbb {R} ^{k}} 上の何らかの確率分布に従って選ばれ訓練データ集合とし、 F ^ {\displaystyle {\hat {F}}} を回帰アルゴリズムとし、Dによってこの回帰アルゴリズム訓練して得られ関数を y ^ = F ^ D ( x ) {\displaystyle {\hat {\mathbf {y} }}={\hat {F}}_{D}(\mathbf {x} )} とし、誤差関数自乗誤差 L ( y ^ , y ) = | | y ^ − y | | 2 {\displaystyle L({\hat {\mathbf {y} }},\mathbf {y} )=||{\hat {\mathbf {y} }}-\mathbf {y} ||^{2}} により定義し、さらに ( x , y ) ∼ p {\displaystyle (\mathbf {x} ,\mathbf {y} )\sim p} をDとは独立選び、 y ¯ ( x ) = E y ∼ p | x [ y | x ] {\displaystyle {\bar {\mathbf {y} }}(\mathbf {x} )=E_{\mathbf {y} \sim p|_{\mathbf {x} }}[\mathbf {y} |\mathbf {x} ]} F ¯ ( x ) = E D [ F ^ D ( x ) ] {\displaystyle {\bar {F}}(\mathbf {x} )=E_{D}[{\hat {F}}_{D}(\mathbf {x} )]} とする。 このとき、予測誤差訓練データ集合Dに関する期待値期待予測誤差E D [ E ( x , y ) ∼ p [ L ( F ^ D ( x ) , y ) ] = E ( x , y ) ∼ p , D [ | | F ^ D ( x ) − y | | 2 ] {\displaystyle E_{D}[E_{(\mathbf {x} ,\mathbf {y} )\sim p}[L({\hat {F}}_{D}(\mathbf {x} ),\mathbf {y} )]=E_{(\mathbf {x} ,\mathbf {y} )\sim p,D}[||{\hat {F}}_{D}(\mathbf {x} )-\mathbf {y} ||^{2}]} は以下を満たす: E ( x , y ) ∼ p , D [ | | F ^ D ( x ) − y | | 2 ] = V a r ( F ^ ) + B i a s 2 ( F ^ ) + N o i s e ( p ) {\displaystyle E_{(\mathbf {x} ,\mathbf {y} )\sim p,D}[||{\hat {F}}_{D}(\mathbf {x} )-\mathbf {y} ||^{2}]={\mathsf {Var}}({\hat {F}})+{\mathsf {Bias}}^{2}({\hat {F}})+{\mathsf {Noise}}(p)} ここで、 V a r ( F ^ ) = E x ∼ p | x , D ( | | F ^ D ( x ) − F ¯ ( x ) | | 2 ) {\displaystyle {\mathsf {Var}}({\hat {F}})=E_{\mathbf {x} \sim p|_{\mathbf {x} },D}(||{\hat {F}}_{D}(\mathbf {x} )-{\bar {F}}(\mathbf {x} )||^{2})} B i a s 2 ( F ^ ) = E x ∼ p | x ( | | F ¯ ( x ) − y ¯ ( x ) | | 2 ) {\displaystyle {\mathsf {Bias}}^{2}({\hat {F}})=E_{\mathbf {x} \sim p|_{\mathbf {x} }}(||{\bar {F}}(\mathbf {x} )-{\bar {\mathbf {y} }}(\mathbf {x} )||^{2})} N o i s e ( F ^ ) = E ( x , y ) ∼ p ( | | y ¯ ( x ) − y | | 2 ) {\displaystyle {\mathsf {Noise}}({\hat {F}})=E_{(\mathbf {x} ,\mathbf {y} )\sim p}(||{\bar {\mathbf {y} }}(\mathbf {x} )-\mathbf {y} ||^{2})} 証明 1 2 ( E ( x , y ) ∼ p , D [ | | F ^ D ( x ) − y | | 2 ] − V a r ( F ^ ) − B i a s 2 ( F ^ ) − N o i s e ( p ) ) = 1 2 E ( x , y ) ∼ p , D [ | | F ^ D ( x ) − y | | 2 − | | F ^ D ( x ) − F ¯ ( x ) | | 2 − | | F ¯ ( x ) − y ¯ ( x ) | | 2 − | | y ¯ ( x ) − y | | 2 ] = E ( x , y ) ∼ p , D [ − F ^ D ( x ) ⋅ y + F ^ D ( x ) ⋅ F ¯ ( x ) + F ¯ ( x ) ⋅ y ¯ ( x ) + y ¯ ( x ) ⋅ y − | | F ¯ ( x ) | | 2 − | | y ¯ ( x ) | | 2 ] = ( 1 ) {\displaystyle {\begin{aligned}&{1 \over 2}(E_{(\mathbf {x} ,\mathbf {y} )\sim p,D}[||{\hat {F}}_{D}(\mathbf {x} )-\mathbf {y} ||^{2}]-{\mathsf {Var}}({\hat {F}})-{\mathsf {Bias}}^{2}({\hat {F}})-{\mathsf {Noise}}(p))\\&={1 \over 2}E_{(\mathbf {x} ,\mathbf {y} )\sim p,D}[||{\hat {F}}_{D}(\mathbf {x} )-\mathbf {y} ||^{2}-||{\hat {F}}_{D}(\mathbf {x} )-{\bar {F}}(\mathbf {x} )||^{2}-||{\bar {F}}(\mathbf {x} )-{\bar {\mathbf {y} }}(\mathbf {x} )||^{2}-||{\bar {\mathbf {y} }}(\mathbf {x} )-\mathbf {y} ||^{2}]\\&=E_{(\mathbf {x} ,\mathbf {y} )\sim p,D}[-{\hat {F}}_{D}(\mathbf {x} )\cdot \mathbf {y} +{\hat {F}}_{D}(\mathbf {x} )\cdot {\bar {F}}(\mathbf {x} )+{\bar {F}}(\mathbf {x} )\cdot {\bar {\mathbf {y} }}(\mathbf {x} )+{\bar {\mathbf {y} }}(\mathbf {x} )\cdot \mathbf {y} -||{\bar {F}}(\mathbf {x} )||^{2}-||{\bar {\mathbf {y} }}(\mathbf {x} )||^{2}]=(1)\end{aligned}}} ここで E ( x , y ) ∼ p , D [ − F ^ D ( x ) ⋅ y + F ^ D ( x ) ⋅ F ¯ ( x ) ] = − E ( x , y ) ∼ p [ E D [ F ^ D ( x ) ] ⋅ y + E D [ F ^ D ( x ) ] ⋅ F ¯ ( x ) = E ( x , y ) ∼ p [ − F ¯ ( x ) ⋅ y + | | F ¯ ( x ) | | 2 ] {\displaystyle {\begin{aligned}&E_{(\mathbf {x} ,\mathbf {y} )\sim p,D}[-{\hat {F}}_{D}(\mathbf {x} )\cdot \mathbf {y} +{\hat {F}}_{D}(\mathbf {x} )\cdot {\bar {F}}(\mathbf {x} )]\\&=-E_{(\mathbf {x} ,\mathbf {y} )\sim p}[E_{D}[{\hat {F}}_{D}(\mathbf {x} )]\cdot \mathbf {y} +E_{D}[{\hat {F}}_{D}(\mathbf {x} )]\cdot {\bar {F}}(\mathbf {x} )\\&=E_{(\mathbf {x} ,\mathbf {y} )\sim p}[-{\bar {F}}(\mathbf {x} )\cdot \mathbf {y} +||{\bar {F}}(\mathbf {x} )||^{2}]\end{aligned}}} なので、 ( 1 ) = E ( x , y ) ∼ p [ − F ¯ ( x ) ⋅ y + F ¯ ( x ) ⋅ y ¯ ( x ) + y ¯ ( x ) ⋅ y − | | y ¯ ( x ) | | 2 ] = E ( x , y ) ∼ p [ ( F ¯ ( x ) − y ¯ ( x ) ) ( y ¯ ( x ) − y ) ] = E x [ ( F ¯ ( x ) − y ¯ ( x ) ) ( y ¯ ( x ) − E y ∼ p | x [ y ] ) ] = 0 {\displaystyle {\begin{aligned}(1)&=E_{(\mathbf {x} ,\mathbf {y} )\sim p}[-{\bar {F}}(\mathbf {x} )\cdot \mathbf {y} +{\bar {F}}(\mathbf {x} )\cdot {\bar {\mathbf {y} }}(\mathbf {x} )+{\bar {\mathbf {y} }}(\mathbf {x} )\cdot \mathbf {y} -||{\bar {\mathbf {y} }}(\mathbf {x} )||^{2}]\\&=E_{(\mathbf {x} ,\mathbf {y} )\sim p}[({\bar {F}}(\mathbf {x} )-{\bar {\mathbf {y} }}(\mathbf {x} ))({\bar {\mathbf {y} }}(\mathbf {x} )-\mathbf {y} )]\\&=E_{\mathbf {x} }[({\bar {F}}(\mathbf {x} )-{\bar {\mathbf {y} }}(\mathbf {x} ))({\bar {\mathbf {y} }}(\mathbf {x} )-E_{\mathbf {y} \sim p|_{\mathbf {x} }}[\mathbf {y} ])]\\&=0\end{aligned}}} 上で回帰場合について述べたが、確信度出力する分類でも同様である。

※この「バイアスと分散のトレードオフ」の解説は、「機械学習」の解説の一部です。
「バイアスと分散のトレードオフ」を含む「機械学習」の記事については、「機械学習」の概要を参照ください。

ウィキペディア小見出し辞書の「バイアスと分散のトレードオフ」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「バイアスと分散のトレードオフ」の関連用語

バイアスと分散のトレードオフのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



バイアスと分散のトレードオフのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの機械学習 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS