形態素解析とは? わかりやすく解説

Weblio 辞書 > 同じ種類の言葉 > 学問 > 学術 > 解析 > 形態素解析の意味・解説 

けいたいそ‐かいせき【形態素解析】


形態素解析

読み方けいたいそかいせき
【英】Morphological analysis

形態素解析とは、言語学においてある言葉変化活用しない部分最小単位の「素」と捉え、その素ごとに言葉分解してゆく手法のことである。言語学者チョムスキーによって考案されたもので、かな漢字変換初めとする自然言語処理機能など応用されている。

言語処理においては体言活用する言葉活用語幹を語幹として、また、助詞助動詞など付属語として抽出される語幹のうち表記ゆれのあるものに関しては、語幹標準形としてある1つ表記標準化される。

日本語には 単語品詞品詞とのつながりが明確・厳密であるため、他の自然言語処理比べて解析が容易であるとされる例えば、「来られないようだ」をという一文形態素によって解析するならば、以下のように分析される

動詞自立カ行変格活用未然形
られラレられる動詞・接尾辞未然形
ないナイない助動詞基本形
ようヨウよう自立名詞-
接続助詞基本形

例えば「うらにわにはにわにわにはにわにわとりがいる」という構文では、多く場合は「裏庭には二羽、庭には二羽がいる」という漢字変換考えられるが、「裏庭埴輪、庭に埴輪がいる」という変換でも間違いではないし、さらに「裏にワニワニ、環に埴輪がいる」としても誤りではない。

変換生じ揺れのうちどれが妥当であるかは、その文の意味によって、もしくは文脈相手意図によって変動する。それらのすべてが考慮入れられなければ正しい意味を把握する事はできない正解となるかもしれない複数解答があり、そのどちらとも決定できないといった状況は、言語処理においては曖昧である」「曖昧性がある」などと呼ばれる曖昧性存在構文解析でも同様であるといえる

情報と社会のほかの用語一覧
教育:  Webラーニング
自然言語処理:  bigram  隠れマルコフモデル  形態素解析  言語モデル  機械翻訳  機械学習

形態素解析

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/03/10 16:06 UTC 版)

形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ()から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。


  1. ^ 長尾真(1979年)「計算機による日本語文章の解析に関する研究」、昭和53年度文部省科学研究費特定研究(1)研究報告書
  2. ^ 長尾真・辻井潤一(1978年)「国語辞書の記憶と日本語の自動分割」、情報処理 Vol.19 No.6
  3. ^ 首藤公昭・楢原登志子・吉田将(1979年)「日本語の機械処理のための文節構造モデル」、電子通信学会誌 Vol.62-D No.12
  4. ^ 首藤公昭(1980年)「文節構造モデルによる日本語の機械処理に関する研究」福岡大学研究所報 No.45
  5. ^ Teramura, Hideo (2011). Nihongo no shintakusu to imi. dai 1 kan (dai 18 satsu [18. Druck] ed.). Tōkyō: Kuroshio Shuppan. ISBN 978-4-87424-002-1 
  6. ^ How to build kegome v2 on web?” (英語). github.com. 2021年12月22日閲覧。
  7. ^ IBM Knowledge Center”. www.ibm.com. 2019年6月20日閲覧。



形態素解析

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/08 10:23 UTC 版)

自然言語処理」の記事における「形態素解析」の解説

中国語日本語タイ語といった言語単語わかち書きをしない。そのため、単語区切り特定するのにテキスト解析が必要となり、それは非常に複雑な作業となる。

※この「形態素解析」の解説は、「自然言語処理」の解説の一部です。
「形態素解析」を含む「自然言語処理」の記事については、「自然言語処理」の概要を参照ください。


形態素解析

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/11 00:42 UTC 版)

全文検索」の記事における「形態素解析」の解説

英文場合単語単語の間にスペースが入るため、自然、スペース区切られ文字列抽出していけば、索引データ作成は容易となる。しかし日本語の場合は、単語スペース区切るわかち書き」の習慣がないため、形態素解析技術用いて文脈解析単語分解行い、それをもとにインデックス作成する必要がある。形態素解析を行うためには解析用の辞書必須であり、検索結果辞書品質少なからず影響を受ける。また、辞書登録されていないひらがな単語抽出難があるなど、技術的障壁多く検索漏れ生じることが欠点とされる

※この「形態素解析」の解説は、「全文検索」の解説の一部です。
「形態素解析」を含む「全文検索」の記事については、「全文検索」の概要を参照ください。

ウィキペディア小見出し辞書の「形態素解析」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



形態素解析と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「形態素解析」の関連用語

形態素解析のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



形態素解析のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2024 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリ形態素解析の記事を利用しております。
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの形態素解析 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの自然言語処理 (改訂履歴)、全文検索 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS