非構造化データの取り扱い
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/11/18 09:06 UTC 版)
「非構造化データ」の記事における「非構造化データの取り扱い」の解説
各種インターネット検索エンジンの台頭がしのぎを削っていたころから様々なビジネスアプリケーションへの活用が本格化し、現在、一般的に知られる文書を構造化する方法としては、テキスト分析してメタデータをタグ付けしたり、画像、音声、動画からテキスト抽出して同じ方法を用いたり、特有のメタデータのタグ付けなどがある。このような非構造化データの取り扱いを実現する技術には、データマイニング、テキストマイニング、自然言語処理、機械学習、パターン認識、さらには人工知能の分野に含まれるものなどがあげられる。また、構造化データも含んで、非構造化データを処理する情報アクセス基盤(Information access infrastructure)としてエンタープライズサーチも活用されている。ビジネスアプリケーションのために非構造化データを分析して理解するソフトウェアは、SAS InstituteやIBM、SAP (企業)、HP オートノミー、オープンテキストなど様々な企業から提供されている。ソーシャルメディアの非構造化データの分析に焦点を当てたインターネットサービス企業も多数存在する。
※この「非構造化データの取り扱い」の解説は、「非構造化データ」の解説の一部です。
「非構造化データの取り扱い」を含む「非構造化データ」の記事については、「非構造化データ」の概要を参照ください。
- 非構造化データの取り扱いのページへのリンク