機械翻訳 歴史

機械翻訳

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/07 08:19 UTC 版)

歴史

機械翻訳の着想は17世紀まで遡って由来を調べられるかもしれない。1629年に、ルネ・デカルトは、単一の記号をもって異なった言葉での同一の概念を割り当てる普遍言語を提案した[2]。機械翻訳という発想が生まれた起原のひとつは、暗号学である。ウォーレン・ウィーバーシャノンによる、情報理論の記念碑的業績である論文『通信の数学的理論』の書籍版[注釈 1]の共著者)が1947年3月にノーバート・ウィーナーサイバネティックスが著名)に送った手紙によると、ロシア語で書かれた文章について、それを「暗号化された英語の文章」とみなせば暗号解読の要領で機械的に翻訳できるのではないか、と提案している。しかし同年4月のウィーナーの返信によれば、(自然)言語は曖昧な表現が多いために、暗号解読のようにはうまくできないのでは、と懐疑的であった。

米国およびソ連の場合、機械翻訳はこの暗号絡みのエピソードにも示されているように冷戦を背景とした需要があった。一方欧州の場合は、多国間交渉や条約などで多国語間の翻訳という課題を抱えていたという動機があり、2言語間ではなく多言語間の翻訳という比較的難しい問題に挑む一方、ある程度近い言語間の翻訳ではあった。日本の場合は、とにかく英日・日英の翻訳が望まれた。

上位の学術分野としては自然言語処理あるいは計算言語学であるが、いずれもコンピュータの発達により自然言語を扱えるようになったことで発展した分野であり、また自然言語の統計的性質を研究する点など、暗号学に起源の一部を辿れる点も似ている。機械翻訳はこれらの分野で主要な応用の位置にある。

大学や研究機関による成果の最も早いものは、1954年にジョージタウン大学などの研究グループにより発表された。これを皮切りに、形態素解析係り受け解析などの機械翻訳に必要な技術の研究が始まった。日本では1950年代に九州大学の栗原俊彦らが研究を開始し、1950年代末に実験機「KT-1」を[3]、またそれとは独立に電気試験所(後の電子技術総合研究所)の研究チームが実験機「やまと」を[4]作成している。その後も研究が続いたが、当時のコンピュータの性能による限界が厳しく、米国では1964年に発表された「ALPACレポート」で機械翻訳の様々な問題点が指摘され実用レベルには程遠いとされたことにより、米国では(同時期に似たような経過を辿った他の人工知能分野と同様に)研究にしばらく予算がつかず約10年にわたって研究が停滞した。しかしそんな中でも研究する研究者はおり、研究は緩やかに進んだ。1980年代になると、ルールベースの機械翻訳システムが一定の成果を上げるようになった。

一方、IBMは1990年代に異なる言語間の単語対応を統計的に獲得する「IBMモデル」という手法を提案した。これが統計的機械翻訳の始まりである。初期の統計的機械翻訳は単語の並べ替えに基づくものであったが、2000年代に句構造を利用した翻訳手法が発表され、語族が異なる言語間でも翻訳の精度が飛躍的に向上することとなった。

2010年代に入り、文章翻訳への応用はできないとされていたニューラルネットワークによるディープラーニングを使ったニューラル機械翻訳(NMT)が登場したことで品質が向上した[5]。(BERTなど)

情報通信研究機構によると、現状の人工知能は、音声認識能力においては人間を上回っているものの、その精度やスピードには大きな課題がある。課題解決にむけて重点的に開発されている機能は「チャンク」「補正」「翻訳精度そのものの向上」である。現状のAIによる同時通訳は10秒程度のタイムラグがあり(人間による同時通訳は2~3秒)テンポのいい会話などの通訳は難しい。これは現状の機械翻訳が文ごとにしか訳せない為であり、意味ごとに訳す「チャンク」という機能の開発が現在行われている。また、日本語などの言語においては「動詞・否定など重要な情報が末尾にくる」「主語が省略される」などの特徴がある為AIが誤訳しやすく、その解決策として「修正機能」が開発されている。翻訳機能の基幹となる「精度」においては「GPT-3」機能の応用などが研究されている。しかし、いずれにおいても「横一直線で、現状成果は出ていない」[6]

2021年4月、NVIDIAではリアルタイムで多言語の音声認識と翻訳が可能な人工知能フレームワーク「Jarvis」を公開した[7]。技術デモにおいては、ジェン・スン・ファンが英語で九州じゃんがらへの道順を声で尋ねると、リアルタイムでテキスト化され、1~2秒程度で違和感の無い日本語テキストに変換されるレベルとなっている[7]


注釈

  1. ^ 日本語には、初出版と書籍版は同題に訳されるのだが、原題では A Mathematical Theory of Communication The Mathematical Theory of Communication という僅かだが深遠な違いがある。

訳注

  1. ^ または作者

出典

  1. ^ たとえばCuuturat; Leau. Histoire de la langue universelle ; Guérard. A Short History ; Cohen. On the Project of a Universal Character を参照。
  2. ^ 浜口, 稔 (1993-4-30). 英仏普遍言語計画. 工作舎. p. 70-71. ISBN 4-87502-214-X. "普遍的文字の構築という初期の試みに言及するときは、1629年11月デカルトがメルセンヌに宛てた手紙から始まる、というのが通り相場となっている。[1]しかし、この問題への関心を最初に誘発した多くの要因を吟味してみると、ある種の共通の書字という着想は明らかに、ずっと以前から比較的なじみ深いものになっていたようである。…フランシス・ベイコンは、1605年出版の学問の進歩についてのなかで、そのような真正の文字の体系は便利であると述べていた" , Knowlson, James. UNIVERSAL LANGUAGE SCHEMES IN ENGLAND AND FRANCE 1600-1800 より翻訳。
  3. ^ http://museum.ipsj.or.jp/heritage/KT-1.html
  4. ^ http://museum.ipsj.or.jp/computer/dawn/0027.html
  5. ^ a b c 中澤敏明、「機械翻訳の新しいパラダイム:ニューラル機械翻訳の原理」『情報管理』 2017-2018年 60巻 5号 p.299-306, doi:10.1241/johokanri.60.299, 科学技術振興機構
  6. ^ 日本経済新聞 2021.1.11朝刊9面
  7. ^ a b 株式会社インプレス (2021年4月14日). “NVIDIA ジェンスン・フアンCEO、対話型AIサービス「Jarvis」で「じゃんがらラーメン」を探すデモ” (日本語). Car Watch. 2021年4月15日閲覧。
  8. ^ https://gendai.ismedia.jp/articles/-/55237
  9. ^ https://www.nri.com/jp/news/2015/151202_1.aspx
  10. ^ https://gendai.ismedia.jp/articles/-/55237?page=2
  11. ^ 3-F ニューラル機械翻訳は翻訳プロセスをどう変えていくか-最近の機械翻訳技術と利用に関する動向- | JTFジャーナルWeb版 | 一般社団法人日本翻訳連盟 機関誌
  12. ^ S. Ravi and K. Knight (2011). “Deciphering Foreign Language”. Proc. ACL. 
  13. ^ 著作権審議会第9小委員会(コンピュータ創作物関係)報告書 | 著作権審議会/文化審議会分科会報告 | 著作権データベース | 公益社団法人著作権情報センター CRIC”. www.cric.or.jp. 2020年7月28日閲覧。 “機械翻訳とは、人間の援助の下で、コンピュータが行う翻訳である。なお、電子辞書をコンピュータに備え、辞書引きをコンピュータに行わせつつ、人間が行う翻訳は、コンピュータ支援翻訳といわれ、機械翻訳とは区別される。”
  14. ^ 成田一『パソコン翻訳の世界』
  15. ^ SDL Machine Translation”. 2020年9月26日閲覧。
  16. ^ a b Nino,Ana. "Machine Translation in Foreign Language Learning: Language Learners's and Tutor's Perceptions of Its Advantages and Disadvantages" ReCALL: the Journal of EUROCALL 21.2 (May 2009) 241-258.
  17. ^ 著作権審議会第9小委員会(コンピュータ創作物関係)報告書 | 著作権審議会/文化審議会分科会報告 | 著作権データベース | 公益社団法人著作権情報センター CRIC”. www.cric.or.jp. 公益社団法人著作権情報センター. 2020年7月28日閲覧。 “現在の機械翻訳システムにおいては、二次的著作物と評価されるに足る翻訳物を作成するためには、前編集や後編集などの形で一般に何らかの人の創作的寄与が必要であり、特に文芸的な著作物については、コンピュータ・グラフィックスと同様、最終的には人の感性に訴えかけるものであるため、少なくとも近い将来においてこの状況が変わることはないと考えられる。 なお、学術的な分野などでは、例えば外国語の技術的な文章の大意を大ざっぱに把握するために、原文を機械的に入力し得られた結果を、多少の誤りや読みにくさはあってもそのまま利用するといった利用法が考えられる。現在のところ、このような翻訳物は一般に二次的著作物と評価することはできないと考えるが、今後の技術の動向等によっては将来の検討課題となると考えられる。”
  18. ^ Machine Translation: No Copyright On The Result?”. SEO Translator, citing Zimbabwe Independent. 2012年11月24日閲覧。





英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

機械翻訳のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



機械翻訳のページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。

  
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの機械翻訳 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2022 GRAS Group, Inc.RSS