生成文法
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/08/01 01:59 UTC 版)
多層的アプローチと単層的アプローチ
生成文法には、基底となる構造に対して変換を用いて表層的な構造を得るという多層的アプローチ(multi-stratal approach)と、変換を用いず同一の構造内での計算によって構造を得るという単層的アプローチ(mono-stratal approach)という2つのタイプがある。チョムスキーのアプローチは前者に相当する。
工学で用いられる生成文法
多層的アプローチで変換規則を用いる文法は少なく見積もってチョムスキー階層においてタイプ-2文法(文脈自由文法)より強力である。現実のコンピュータに対応するのは制限されたチューリングマシンである線状有界オートマトンであり、これが扱いうるのはタイプ-1文法(文脈依存文法)までである。実際に現在のコンピュータに変換規則を実装しようとすると、可能な組み合わせが指数関数的に増加し、組み合わせ的爆発(計算論的爆発)を起こす場合がある。そこで、1980年代前後より、コンピュータへの実装という観点でより現実的な、タイプ-2文法よりやや強力であるところに押さえた単層的アプローチとしての非変換論的生成文法が提案されている。中でも一般化句構造文法(GPSG)とその発展である主辞駆動句構造文法(HPSG)、TAG(Tree-Adjoining Grammar)などがコンピュータ科学においては変換論的生成文法よりも集中的に研究されている。
HPSG
HPSG(主辞駆動句構造文法)はカール・ポラードとアイヴァン・サグが唱える生成文法の一種である。この理論は一般化句構造文法の直接の継承である。コンピュータ科学(データ型理論と知識表現)のような生成文法外の分野やフェルディナン・ド・ソシュールの記号の概念も採用している。並列処理を配慮した文法構成をしているため、自然言語処理の分野によく用いられる。HPSGの理論は原理群、文法規則群と通常は文法に属するとはみなされていないレクシコンから構成されている。形式化は語彙主義に基づいて行われる。このことはレクシコンが単なる語彙項目の羅列である、ということ以上のことを意味しており、レクシコン内部が豊かな構成を持っている。各語彙項目に階層構造を成す「タイプ」を立て記号を基本的なタイプとする。「語」はPHON (音声情報)とSYNSEM(統語情報と意味情報)という二つの素性を持ち、これらはさらに下位素性から構成される。記号と規則はタイプ付けされた素性構造として形式化される。HPSGの形式化に基づくさまざまな構文解析器(パーザ)が設計され、その最適化が最近研究されている。ドイツ語の文を解析するシステムの一例がブレーメン大学から公開されている[1]。
TAG
木接合文法(Tree-adjoining grammar、TAG) は計算言語学や自然言語処理でよく用いられているアラヴィンド・ジョーシの案出した形式言語である。文脈自由文法に類似しているが、書き換えの基本単位は記号ではなく樹である。文脈自由文法はある記号を他の記号列に書き換える規則を持つが、TAGは樹の節点を他の樹に書き換える規則を立てる。(木 (数学)及びツリーデータ構造を参照)。TAGにおける規則(「補助樹; auxiliary trees」として知られる)は「脚節点; foot node」という特殊な節点を葉とする樹状図で表される。根の節点と脚節点は同じ記号でなければならない。「始発樹」(文脈自由文法の始発記号と同じ)から始まる。書き換え操作は補助樹を(典型的には葉ではない)節点に付加(接合)することによって実行される。補助樹の根/脚のラベルは付加する節点のラベルと一致し、この操作で付加対象となる節点を上下に分割する。上方では付加している樹の根と結合し、下方では付加している脚と結合する。これがTAGのもっとも基本となるものである;もっとも一般的なTAGの変異形ではさらに「代入」と呼ばれる書き換え操作が加えられるし、また他の変異形では樹に複数の脚節点を持つ部分樹やさらなる拡張を許している。TAGは、弱生成能力に関してそれ自体を文脈自由文法よりやや強力にするような一定の特徴を備えているが、チョムスキー階層に定義されている文脈依存文法よりは弱いために、よく「やや文脈依存的な」文法であると特徴付けられる。やや文脈依存的な文法は、一般的な場合においてパーザを効率的に保ったまま自然言語のモデル構築としては十分強力である、という予想が提示されている。
生成文法への批判
言語機能の自律性と生得性に対する批判
認知言語学の分野から、比喩を含む語用論的な現象や他の様々な要因が、統語現象に大きな影響を及ぼしているとして、言語の自律性の仮説に批判がなされている。言語現象を、人間のあらゆる知的活動との関係の中で捉えるべきである、としている。また認知言語学は、生成文法の合理論についても、経験基盤主義的立場から批判している。
扱う言語データへの批判
個別言語を記述する立場からは、生成文法が英語圏で理論化を始めた後、その理論に都合の良い(顕在主語不可欠の英語中心に)言語や言語データを恣意的に選択していると批判される。また、生成文法の扱う構文が極めて限定的で、個別言語の体系的記述にたどり着かないという批判がある。さらに、データとして扱われる文の許容度に対する内省判断が恣意的であるとする批判もある。ただし、これは研究者の立場がやや記述寄りであるか理論寄りであるかによっても若干傾向が異なる。前者の場合は文の許容度を根拠にある程度帰納的に理論を展開するが、後者は理論から演繹的に文の許容度を示す場合もあり、計算上は矛盾が無くとも一般的な言語直観からはかけ離れたデータが示される場合がある。
- 1 生成文法とは
- 2 生成文法の概要
- 3 概論
- 4 生成文法の基本的考え方
- 5 変形生成文法の展開
- 6 多層的アプローチと単層的アプローチ
- 7 関連項目
生成文法と同じ種類の言葉
- 生成文法のページへのリンク