統計的機械翻訳とは？わかりやすく解説

辞書 類語・対義語辞典 英和・和英辞典 日中中日辞典 日韓韓日辞典 古語辞典

その他の辞書▼
- フランス語辞典
- インドネシア語辞典
- タイ語辞典
- ベトナム語辞典

Weblio 辞書ヘルプ

556の専門辞書や国語辞典百科事典から一度に検索!

無料の翻訳ならWeblio翻訳！

初めての方へ参加元一覧

Weblio 辞書 > 辞書・百科事典 > デジタル大辞泉 > 統計的機械翻訳の意味・解説

デジタル大辞泉

索引トップ用語の索引ランキング凡例

とうけいてき‐きかいほんやく【統計的機械翻訳】

読み方：とうけいてききかいほんやく

《statistical machine translation》言語間の統計的な対訳データを利用した機械翻訳。文章をいくつかに区切り、前後の単語の結びつきから統計的にもっとも確からしい対訳をあて、文法的に正しい順序に並べ替えて翻訳文を完成させる。統計翻訳。

ウィキペディア小見出し辞書

索引トップ用語の索引ランキング

統計的機械翻訳

出典: フリー百科事典『ウィキペディア（Wikipedia）』 (2022/04/07 08:19 UTC 版)

「機械翻訳」の記事における「統計的機械翻訳」の解説

詳細は「en:Statistical machine translation」を参照計算機の発達によって1990年代以降研究が盛んになっているのは、統計的な手法を用いた機械翻訳である。ルールベースの翻訳では、ルールを作成した人間が想定しなかった入力文には対応できない問題がある。また、翻訳ルールの記述や見直しには膨大な手間がかかるため、効率が悪い。そこで統計的機械翻訳では、パラレルコーパスと呼ばれる複数の言語で文同士の対応が付いたコーパスを利用し、翻訳のルールを自動的に獲得し、各ルールの重要度を統計的に推定する。パラレルコーパスには自前のデータを利用することもあるが、最近では各言語に翻訳された特許や、Webページのクローリングデータなどを利用することもある。統計的機械翻訳は、従来音声認識の分野で用いられていた雑音チャネルモデルを応用したもので、原言語（翻訳元の言語） f {\displaystyle f} は目的言語（翻訳後の言語） e {\displaystyle e} が雑音のある通信路を通る間に変化してしまったものであると捉え、翻訳作業を元言語から目的言語への復号であると考える。雑音チャネルモデルでは、復号誤りが最も小さくなる翻訳結果 e ^ {\displaystyle {\hat {e}}} は以下の式を満たす。 e ^ = a r g m a x e ⁡ P ( e | f ) = a r g m a x e ⁡ P ( e ) P ( f | e ) P ( f ) = a r g m a x e ⁡ P ( e ) P ( f | e ) {\displaystyle {\begin{aligned}{\hat {e}}&=\operatorname {arg\,max} _{e}P(e|f)\\&=\operatorname {arg\,max} _{e}{\frac {P(e)P(f|e)}{P(f)}}\\&=\operatorname {arg\,max} _{e}P(e)P(f|e)\end{aligned}}} 2番目の変形はベイズの定理による。ここで P ( e ) {\displaystyle P(e)} をモデル化したものを言語モデル、 P ( f | e ) {\displaystyle P(f|e)} をモデル化したものを翻訳モデルと呼び、言語モデルは翻訳結果の言語としての流暢さを、翻訳モデルは翻訳の確からしさをモデル化していると言える。翻訳モデルのみでは目的言語として正しくない文となってしまうため、言語モデルによって目的言語として正しくない文を取り除けると考えられる。また、言語モデルについての研究は音声認識などの分野において既に研究が行われており、その知見を生かすこともできる。統計的機械翻訳の処理系はこれらのモデルの組み合わせが高い値を与える翻訳結果を探索することになる。このような処理系は暗号理論からの類推でデコーダ（復号器）と呼ばれる。 2000年代から盛んに研究されている句に基づく統計的機械翻訳を始め、近年では直接雑音チャネルモデルを用いるのではなく、最大エントロピー法（対数線形モデル）に基づく下記の最適化問題として考えることが多い。 a r g m a x e ⁡ P ( e | f ) = a r g m a x e ⁡ exp ⁡ ( w T h ( e , ϕ , f ) ) ∑ e ′ , ϕ ′ exp ⁡ ( w T h ( e ′ , ϕ ′ , f ) ) {\displaystyle \operatorname {arg\,max} _{e}P(e|f)=\operatorname {arg\,max} _{e}{\frac {\exp({\boldsymbol {w}}^{T}{\boldsymbol {h}}(e,{\boldsymbol {\phi }},f))}{\sum _{e',{\boldsymbol {\phi }}'}\exp({\boldsymbol {w}}^{T}{\boldsymbol {h}}(e',{\boldsymbol {\phi }}',f))}}} 統計翻訳においても、翻訳の精度を高めるために、人手により追加されたルールを利用する場合がある。また、近年ではパラレルでないコーパスから翻訳ルールを獲得する研究も為されている。

※この「統計的機械翻訳」の解説は、「機械翻訳」の解説の一部です。
「統計的機械翻訳」を含む「機械翻訳」の記事については、「機械翻訳」の概要を参照ください。

ウィキペディア小見出し辞書の「統計的機械翻訳」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。お問い合わせ。

>> 「統計的機械翻訳」を含む用語の索引
統計的機械翻訳のページへのリンク

辞書ショートカット

1 デジタル大辞泉
2 ウィキペディア小見出し辞書

カテゴリ一覧

＋ビジネス

＋業界用語

＋コンピュータ

＋自動車・バイク

＋船

＋建築・不動産

＋ヘルスケア

＋スポーツ

＋辞書・百科事典

すべての辞書の索引

Weblioのサービス

「統計的機械翻訳」の関連用語

1

統計翻訳 デジタル大辞泉

100% |||||

2

ニューラル機械翻訳 デジタル大辞泉

92% |||||

3

ウィキペディア小見出し辞書

52% |||||

4

百科事典

32% |||||

5

ヤンデックス翻訳

百科事典

18% |||||

6

百科事典

18% |||||

7

百科事典

4% |||||

統計的機械翻訳のお隣キーワード

統計的推論・最適化

統計的有意性

統計的検出力

統計的検定

統計的概要

統計的機械学習

統計的機械翻訳

統計的決定理論

統計的自然言語処理

統計的調査の方法

統計的識別不能

統計的資料

統計的過誤

検索ランキング

統計的機械翻訳のページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。


	(C)Shogakukan Inc. 株式会社小学館
	Text is available under GNU Free Documentation License (GFDL). Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの機械翻訳 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

ビジネス｜業界用語｜コンピュータ｜電車｜自動車・バイク｜船｜工学｜建築・不動産｜学問
 文化｜生活｜ヘルスケア｜趣味｜スポーツ｜生物｜食品｜人名｜方言｜辞書・百科事典

ご利用にあたって

・Weblio辞書とは

・検索の仕方

・利用規約

・プライバシーポリシー

・サイトマップ

便利な機能

・ウェブリオのアプリ

・画像から探す

お問合せ・ご要望

・お問い合わせ

会社概要

・公式企業ページ

・会社情報

・採用情報

ウェブリオのサービス

・Weblio 辞書

・類語・対義語辞典

・英和辞典・和英辞典

・Weblio翻訳

・日中中日辞典

・日韓韓日辞典

・フランス語辞典

・インドネシア語辞典

・タイ語辞典

・ベトナム語辞典

・古語辞典

©2025 GRAS Group, Inc.RSS