Data Miningとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > デジタル大辞泉 > Data Miningの意味・解説 

データ‐マイニング【data mining】


データマイニング

【英】data mining

日々企業活動から発生した膨大多様なデータの中から有効な法則傾向パターン導き出す手法マイニングとは、鉱山発掘採掘という意味。文字通りデータ山からマーケティング有効な金脈発見するための分析手法の意味基礎技術をもとにデータ・マイニング・テクニックが準備され、そのテックニックを活用してソリューション課題解決)を実現する課題販促効果分析であったり、優良顧客プロファイル(「カスタマー・プロファイル」参照)の把握だったり、不正パターン発見だったりする。

データ・マイニング data mining

膨大なデータベースからビジネス有益なパターンルール発見する手法多量データ鉱山見立て、その中から価値ある情報採掘mining)するのでこう呼ばれる特定のモデル仮定した多変量解析異なり特定のビジネス上の知識ルール獲得するために行われることなどから、使われる手法は様々である。データ・マイニングの専用ツールには、決定木l(CHAID,C5,CART)、ニューラル・ネットワーク自己組織化マップ(コホネン・ネットワーク)、リンク分析、K-meansクラスター分析、アソシエーション・ルール、記憶ベース推論などの手法が、データビジュアルツール複数結果の評価ツールとともに実装されているという。

データマイニング

【英】data mining

データマイニングとは、データベース蓄積されている大量データから、統計決定木などを駆使してマーケティング必要な傾向パターンなどの隠され規則性関係性仮説導き出す手法のことである。マイニングmining)とは「採鉱」を意味するもので、いわば眠っている金脈探り当てることになぞらえられている。

一見無秩序無関係に見えデータの山も、着眼点次第では各事項の間に有益な連関見えてくることが少なくない例えば、ある商店ではサングラスを買う人の多く一緒にガム買っているという事実が見つかるかも知れない。あるいは他の店舗では、曇りがちの日には生魚売り上げ伸びているかもしれないこうした連関実績として見出すことによって、サングラス陳列棚近くガム配置する、とか、の多い日に鮮魚セール実施するとか、効果的なマーケティングを行うことができる。

データマイニングは、データベース発展中心とした情報技術の向上によって盛んに行われるようになった手法であるといえる。元となるデータ多ければ多いほど、処理作業膨大なものになるが、実証性は高くなる既存データ専用データベース取り込んで意思決定活用するシステムデータウェアハウス呼ばれるが、データウェアハウス一個のデータマイニングツールであるといえる


データマイニング

読み方でーたまいにんぐ
【英】:data mining

概要

データベース蓄えられ多量データから, 機械学習machine learning)や統計的手法statistical method)を用いて データ中に含まれる知識発掘する手法をいう. 知識発見プロセスとしてのデータ獲得選択前処理変換知識発見アルゴリズム適用解釈評価といった 一連のサイクルを指す. 獲得した知識に基づく意思決定目的であり, データ収集発掘評価といった人間計算機共同作業を伴う知識マネジメントとして捉えられる

詳説

 データマイニング (data mining)は, データベース (data base) [5] に蓄えられ大量生データに対して, 機械学習 (machine learning)に関連する複数の手順を用い戦略により, データ内在する規則性 (regularity), 制約 (constraint), ルール (rule)などを効率よく求め研究である. なお, データベースからの知識発見 (KDD: knowledge discovery in databases)とも呼ばれ, 知識発見 (knowledge discovery)に関わる多数学習アルゴリズムが, 人工知能だけでなくデータベース統計学側面含めて研究されている. まず, ノイズ例外含み疎な構造をもつことも多い生データ対象としたデー タマイニングに共通する知識発見の手順を(1)(6)簡単に示す [1].

 【手順

(1)対象となるデータ対す既知性質(背景知識)を利用してデータ収集行い, データベースデータウェアハウス (data warehouse)に格納する. (2)データ対す選択操作前処理として行う. この段階はデータクリーニング呼ばれる. (3)実装前提とする制約のもとでデータ次元低減などによる変形操作を行う. (4)データマイニングを行うアルゴリズム実行する. (5)導出された記述解釈, ならびに, 記述妥当性検証後処理として行う. (6)最終的な記述評価され, 知識となる.

 手順(4)アルゴリズム求まる知識表現法によって, データの統計的解析 (statistical analysis of data)とデータの論理的解析 (logical analysis of data)の二種類大きく分類される.

 データの論理的解析一種である決定木 (decision tree)を図1に示す. なお, 決定木求めアルゴリズムとしてID3 [4] などが知られており, エントロピーMDL(minimum description length)基準記述選択する際に用いられる.


属性1 属性2 属性3 クラス
例1 10
例2 3
例3 6
例4 2
例5 9
例6 7
例7 5
例8 4
図1: 決定木を用いた概念学習の一例

図1: 決定木用いた概念学習一例


 関係データベース問合せ言語SQLのGroupBy操作拡張として位置付けられる結合ルール (association rule)を求めアルゴリズム研究数多い. 結合ルール求めるために, 最小サポート(support)値と最小確信度(confidence)を定めヒューリスティック閾値用いられる. なお, 最小閾値により多数ルール導出制限するだけではなく, 新規性興味深さの弱いルール最大閾値抑制することもある. また, 頻度の高い購買パターン結合ルールが表すため, データベースマーケティング(database marketing)などをターゲットに, 計算機アーキテクチャ含めた効率良い実装進んでいる.

 その他, 多変量解析の手法を用いクラスター分析 (cluster analysis)や, 因果関係表現するベイズネットワーク (Baysian network)や, 論理的表現対す帰納推論プログラミング(ILP: inductive logicprogramminge)などもアプローチ一つである. また, ルール理解可能性高め上で, ルール視覚化 (visualization)も欠かせない.

 なお, ラフ集合(rough sets), ファジー理論(fuzzy theory), ニューラルネットワーク(neural network), 遺伝アルゴリズム(genetic algorithm)などの研究とも密接に関係している.

 ところで, データマイニングの対象となるデータは, 航空会社, 銀行, クレジットカード会社, 電話, 保険などでのトランザクションだけではなく, WWWデータ医療データなどの異な性質をもつデータ含まれる [2]. 特に, 学習データ種類限定される場合, 地理データに対して空間データマイニング(spatial data mining), 文書データに対してテキストマイニング(text mining)などと呼ぶ. また, データマイニングに関連したシフトウェア(siftware)と呼ばれるソフトウェアの開発も盛んである.

 なお, 良質な知識発見するには, 複数アルゴリズム適用するだけではなく, データ前処理ルール後処理が重要となる. したがって, 実用化に向けて, 例えば, 各種情報システム効果的に運用することを考えたデータ収集戦略決定しなければならない.



参考文献

[1] U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth and R. Uthurusamy, Advances in Knowledge Discovery and Data Mining, AAAI/MIT Press, 1996.

[2] R. Michalski, I. Bratko and M. Kubat, Machine Learning and Data Mining, Methods and Applications, John Wiley & Sons Ltd., 1998.

[3] J. Pearl, Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Morgan-Kaufmann, 1988.

[4] J. R. Quinlan, C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers, Inc., 1993. 古川康一監訳, 『AIによるデータ解析』, トッパン, 1995.

[5] J. D. Ullman, Principles of Database and Knowledge-Base Systems, Vol.I, Vol.II, Computer Science Press, 1988.


データマイニング

(Data Mining から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/07/03 06:49 UTC 版)

データマイニング英語: data mining)とは、統計学パターン認識人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、ヒューリスティク(heuristic、発見的)な知識獲得が可能であるという期待を含意していることが多い。とくにテキストを対象とするものをテキストマイニング、そのなかでもウェブページを対象にしたものをウェブマイニングと呼ぶ。英語では"data mining"の語の直接の起源となった研究分野であるknowledge-discovery in databases(データベースからの知識発見)の頭文字をとってKDDとも呼ばれる。


注釈

  1. ^ "IJCAI'89 Workshop on Knowledge Discovery in Databases"は、"Expert Database Systems, Scientific Discovery, Fuzzy Rules, Using Domain Knowledge, Learning from Relational (Structured) Data, Dealing with Text and other Complex Data, Discovery Tools, Better Presentation Methods, Integrated Systems, Privacy"の9分野の研究成果が発表された大規模なワークショップである。
  2. ^ この当時のIoTは、様々な物体にRFIDタグを貼り付け、RFIDに対応したセンサーを用いて物体からの情報収集を行い、収集した情報を活用することを指していた。
  3. ^ 後にコグニティブ・コンピューティング・システムとして初の商用の実用化を達成する。

出典

  1. ^ W. Frawley and G. Piatetsky-Shapiro and C. Matheus, Knowledge Discovery in Databases: An Overview. AI Magazine, Fall 1992, pp. 213-228.
  2. ^ D. Hand, H. Mannila, P. Smyth: Principles of Data Mining. MIT Press, Cambridge, MA, 2001. ISBN 0-262-08290-X (各データマイニング手法の理論背景などが中心)
  3. ^ Hiura, Satoko; Koseki, Shige; Koyama, Kento (2021-12). “Prediction of population behavior of Listeria monocytogenes in food using machine learning and a microbial growth and survival database” (英語). Scientific Reports 11 (1): 10613. doi:10.1038/s41598-021-90164-z. ISSN 2045-2322. PMC 8134468. PMID 34012066. http://www.nature.com/articles/s41598-021-90164-z. 


「データマイニング」の続きの解説一覧


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「Data Mining」の関連用語

Data Miningのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



Data Miningのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
JERICHO CONSULTINGJERICHO CONSULTING
Copyright (C) 2024by Jericho Consulting Co.,Ltd. All Rights Reserved.
広告転職.com広告転職.com
Copyright(C) 2024 Total Brain co., ltd. All Rights Reserved.
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2024 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリデータマイニングの記事を利用しております。
日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会
Copyright (C) 2024 (社)日本オペレーションズ・リサーチ学会 All rights reserved.
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのデータマイニング (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2024 GRAS Group, Inc.RSS