日本語処理
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/03/05 08:01 UTC 版)
日本語処理(にほんごしょり)は、自然言語処理の下位分類のひとつで、自然言語のひとつである日本語をコンピュータに処理させる技術のこと。
注釈
- ^ 実際に インプット メソッド エディタでローマ字入力を行なっているときは、システム内部ではこれに近いことを行なっている。
- ^ 橋田浩一によれば、「かな漢字変換はブラックアートである」という。
- ^ ネットワーク型のデータの扱いに熟達していて、同時に国文法に対するプログラマというのは、かなりのレアケースであり、そうした人員が日本語処理系の開発プロジェクトに携わるというのは、さらに稀である。「盲亀の浮木」「うどんげ」などを参照のこと。
- ^ もっとも、初期のかな漢字変換においては「接続テーブル法」という手法が使われており、「どの品詞のあとに、どの品詞がくるか」という二次元のテーブルを使用していたのだが、品詞分類が増えると品詞の数の自乗に比例してテーブルが大きくなり、しかもテーブルがスパース(「スカスカ」)だったために扱いきれなくなった。そのため、島内式ローマ字かな変換を元に文法定義を中間言語によって記述するという発想が生まれたという経緯がある。
出典
- ^ 石田信一「コンピューターによる新聞紙面製作」『テレビジョン』第29巻第5号、映像情報メディア学会、1975年、379-388頁、CRID 1390282680373642368、doi:10.3169/itej1954.29.379、ISSN 03743470。
- ^ 漢字・日本語処理技術の発展:日本語ワードプロセッサの誕生とその歴史
- 1 日本語処理とは
- 2 日本語処理の概要
- 3 歴史
- 4 課題
- 日本語処理のページへのリンク