生成文法との比較
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/12/22 08:37 UTC 版)
「確率文脈自由文法」の記事における「生成文法との比較」の解説
ゴールドの定理(1967年)によれば、自然言語の文法を決定的な規則だけで説明すると、正しい例だけでは学習できないとされた。これは1980年に発表された「刺激の貧困」という主張の一部ともなり、ノーム・チョムスキーは1950年代ごろからそのような主張を行っていた。この考え方は心理学的生得主義につながり、自然言語の文法は生まれたときから植えつけられているという考え方につながっていく。この考え方は、主として統率・束縛理論 (GB) やミニマリスト・プログラム (MP) の理論に制限される。 文法とは、言語の構文の説明である。理論的モデルは、精神言語や生成文法に集中している。それとは対照的に、言語の用法を説明する文法を構築すべく構文を研究する立場もある。 形式文法全般に関わる問題として、1つの文章構造に複数の生成規則が対応可能である点が挙げられる。多くの構文を説明しようとすると、衝突が発生しやすくなるため、文法学者は規則の優先順位付けに多大な労力を費やすようになり、最終的にそれが無駄であったことが判明する。別の問題として、言語として意味を成さない文章まで生成できてしまうという問題がある。確率文法は、これらの問題への対処として生成規則の使用頻度でそれらを順位付けし、結果として最もそれらしい解釈ができるが、定義上、その解釈も追加データによって無効化される。構文の使用パターンは時と共に変化するので、確率的生成規則も再学習が必要であり、それによって文法が更新される。 伝統的な形式文法の全非終端記号に実例データから推定した確率値を付与することで確率文法を構築することもできる。一般に、一から精密に構築した文法よりも、データから確率を調整した確率文法の方がすぐれている(もっとも、規則に基づいた文法でもSCFGの正確さに近いものが出現している)。 最近では、確率文法はある程度の認識的尤もらしさを得たように見える。異なる文法構造にアクセスするのが難しいことはよく知られている(例えば、関係節の接近度階層)。ミニマリスト文法の確率バージョンは、わかりやすさと生成の困難さについて言語心理学的データとよく相関するような情報理論的エントロピーを計算するのに使われている。
※この「生成文法との比較」の解説は、「確率文脈自由文法」の解説の一部です。
「生成文法との比較」を含む「確率文脈自由文法」の記事については、「確率文脈自由文法」の概要を参照ください。
- 生成文法との比較のページへのリンク