形態素解析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/08 10:23 UTC 版)
中国語、日本語、タイ語といった言語は単語のわかち書きをしない。そのため、単語の区切りを特定するのにテキストの解析が必要となり、それは非常に複雑な作業となる。
※この「形態素解析」の解説は、「自然言語処理」の解説の一部です。
「形態素解析」を含む「自然言語処理」の記事については、「自然言語処理」の概要を参照ください。
形態素解析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/11 00:42 UTC 版)
英文の場合は単語と単語の間にスペースが入るため、自然、スペースで区切られた文字列を抽出していけば、索引データの作成は容易となる。しかし日本語の場合は、単語をスペースで区切る「わかち書き」の習慣がないため、形態素解析技術を用いて、文脈の解析、単語分解を行い、それをもとにインデックスを作成する必要がある。形態素解析を行うためには解析用の辞書が必須であり、検索結果は辞書の品質に少なからず影響を受ける。また、辞書に登録されていないひらがな単語の抽出に難があるなど、技術的障壁も多く、検索漏れが生じることが欠点とされる。
※この「形態素解析」の解説は、「全文検索」の解説の一部です。
「形態素解析」を含む「全文検索」の記事については、「全文検索」の概要を参照ください。
形態素解析と同じ種類の言葉
Weblioに収録されているすべての辞書から形態素解析を検索する場合は、下記のリンクをクリックしてください。

- 形態素解析のページへのリンク