統計的機械翻訳とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > デジタル大辞泉 > 統計的機械翻訳の意味・解説 

とうけいてき‐きかいほんやく【統計的機械翻訳】


統計的機械翻訳

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/07 08:19 UTC 版)

機械翻訳」の記事における「統計的機械翻訳」の解説

詳細は「en:Statistical machine translation」を参照 計算機発達によって1990年代以降研究盛んになっているのは、統計的な手法用いた機械翻訳である。 ルールベース翻訳では、ルール作成した人間想定しなかった入力文には対応できない問題がある。また、翻訳ルール記述見直しには膨大な手間がかかるため、効率が悪い。そこで統計的機械翻訳では、パラレルコーパスと呼ばれる複数言語文同士の対応が付いたコーパス利用し翻訳ルール自動的に獲得し、各ルール重要度統計的に推定する。パラレルコーパスには自前データ利用することもあるが、最近では各言語翻訳され特許や、Webページのクローリングデータなどを利用することもある。 統計的機械翻訳は、従来音声認識分野用いられていた雑音チャネルモデルを応用したもので、原言語翻訳元言語) f {\displaystyle f} は目的言語翻訳後の言語) e {\displaystyle e} が雑音のある通信路を通る間に変化してしまったものである捉え翻訳作業を元言語から目的言語への復号であると考える。雑音チャネルモデルでは、復号誤りが最も小さくなる翻訳結果 e ^ {\displaystyle {\hat {e}}} は以下の式を満たす。 e ^ = a r g m a x e ⁡ P ( e | f ) = a r g m a x e ⁡ P ( e ) P ( f | e ) P ( f ) = a r g m a x e ⁡ P ( e ) P ( f | e ) {\displaystyle {\begin{aligned}{\hat {e}}&=\operatorname {arg\,max} _{e}P(e|f)\\&=\operatorname {arg\,max} _{e}{\frac {P(e)P(f|e)}{P(f)}}\\&=\operatorname {arg\,max} _{e}P(e)P(f|e)\end{aligned}}} 2番目の変形ベイズの定理よる。ここで P ( e ) {\displaystyle P(e)} をモデル化したもの言語モデル、 P ( f | e ) {\displaystyle P(f|e)} をモデル化したもの翻訳モデル呼び言語モデル翻訳結果言語としての流暢さを、翻訳モデル翻訳確からしさモデル化していると言える翻訳モデルのみでは目的言語として正しくないとなってしまうため、言語モデルによって目的言語として正しくない文を取り除ける考えられるまた、言語モデルについての研究音声認識などの分野において既に研究が行われており、その知見生かすともできる。 統計的機械翻訳の処理系はこれらのモデル組み合わせが高い値を与え翻訳結果探索することになる。このような処理系暗号理論からの類推デコーダ復号器)と呼ばれる2000年代から盛んに研究されている句に基づく統計的機械翻訳を始め近年では直接雑音チャネルモデルを用いるのではなく最大エントロピー法対数線形モデル)に基づく下記最適化問題として考えることが多い。 a r g m a x e ⁡ P ( e | f ) = a r g m a x e ⁡ exp( w T h ( e , ϕ , f ) ) ∑ e ′ , ϕ ′ exp( w T h ( e ′ , ϕ ′ , f ) ) {\displaystyle \operatorname {arg\,max} _{e}P(e|f)=\operatorname {arg\,max} _{e}{\frac {\exp({\boldsymbol {w}}^{T}{\boldsymbol {h}}(e,{\boldsymbol {\phi }},f))}{\sum _{e',{\boldsymbol {\phi }}'}\exp({\boldsymbol {w}}^{T}{\boldsymbol {h}}(e',{\boldsymbol {\phi }}',f))}}} 統計翻訳においても、翻訳精度高めるために、人手により追加されルール利用する場合がある。また、近年ではパラレルでないコーパスから翻訳ルール獲得する研究為されている。

※この「統計的機械翻訳」の解説は、「機械翻訳」の解説の一部です。
「統計的機械翻訳」を含む「機械翻訳」の記事については、「機械翻訳」の概要を参照ください。

ウィキペディア小見出し辞書の「統計的機械翻訳」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「統計的機械翻訳」の関連用語

統計的機械翻訳のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



統計的機械翻訳のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの機械翻訳 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS