データマイニングとは?

Weblio 辞書 > 固有名詞の種類 > 方式・規則 > 主義・方式 > 学問 > 学問 > データマイニングの意味・解説 

データ‐マイニング【data mining】


データマイニング

大量販売データなどを様々な統計手法により分析することで、消費者購買傾向商品間の関連性を見つけ出す手法またはプロセスのこと。
データマイニングには様々な分析手法存在しますが、マーケティング観点から最も重要視するポイントは、顧客特性傾向分析と併買傾向分析があげられます。近年市販様々なツールが提供されるようになりましたが、分析して得られた仮説元にどのようなプロモーション戦略構築するかが重要な課題となります。

データマイニング

【英】data mining

日々企業活動から発生した膨大多様なデータの中から有効な法則傾向パターン導き出す手法マイニングとは、鉱山発掘採掘という意味。文字通りデータ山からマーケティングに有効な金脈発見するための分析手法の意味。基礎技術をもとにデータ・マイニング・テクニックが準備され、そのテックニックを活用してソリューション課題解決)を実現する。課題販促効果分析であったり、優良顧客プロファイル(「カスタマー・プロファイル」参照)の把握だったり、不正パターン発見だったりする。

データマイニング

・データマイニングとは統計的手法用いて企業蓄積される顧客データ従業員データの中から各情報相関法則性といった情報探し出すための分析手法である。
・例としては顧客データにおいては購買履歴から商品併売傾向探しだす、従業員データでは研修等の育成履歴から退職者再雇用する際に求め人材のみを見つけるといったことが挙げられる。データ精度はデータマイニングを行う者のスキル依存するという側面がある反面確度の高い情報探し出すことができれば施策に無駄な情報を省いたり、潜在的ニーズ掘り起こすことが可能になる。


マイニング鉱山採掘


データ・マイニング data mining

膨大なデータベースからビジネス有益なパターンルール発見する手法多量データ鉱山見立て、その中から価値ある情報採掘mining)するのでこう呼ばれる特定のモデル仮定した多変量解析異なり特定のビジネス上の知識ルール獲得するために行われることなどから、使われる手法は様々である。データ・マイニングの専用ツールには、決定木l(CHAID,C5,CART)、ニューラル・ネットワーク自己組織化マップ(コホネン・ネットワーク)、リンク分析、K-meansクラスター分析、アソシエーション・ルール、記憶ベース推論などの手法が、データビジュアルツール複数結果評価ツールとともに実装されているという。

データマイニング

【英】data mining

データマイニングとは、データベース蓄積されている大量データから、統計決定木などを駆使して、マーケティングに必要な傾向パターンなどの隠された規則性関係性仮説導き出す手法のことである。マイニングmining)とは「採鉱」を意味するもので、いわば眠っている金脈探り当てることになぞらえられている。

一見無秩序無関係見えデータの山も、着眼点次第では各事項の間に有益な連関見えてくることが少なくない例えば、ある商店ではサングラスを買う人の多く一緒にガムを買っているという事実が見つかるかも知れない。あるいは他の店舗では、曇りがちの日には生魚売り上げ伸びているかもしれない。こうした連関実績として見出すことによって、サングラス陳列近くガム配置する、とか、の多い日に鮮魚セール実施するとか、効果的マーケティングを行うことができる。

データマイニングは、データベース発展中心とした情報技術の向上によって盛んに行われるようになった手法であるといえる。元となるデータが多ければ多いほど、処理作業膨大なものになるが、実証性は高くなる。既存データ専用データベース取り込んで意思決定活用するシステムデータウェアハウス呼ばれるが、データウェアハウス一個のデータマイニングツールであるといえる


データマイニング

読み方でーたまいにんぐ
【英】:data mining

概要

データベース蓄えられた多量データから, 機械学習machine learning)や統計的手法(statistical method)を用いて データ中に含まれる知識発掘する手法をいう. 知識発見プロセスとしての, データ獲得選択,前処理,変換知識発見アルゴリズム適用解釈評価といった 一連のサイクルを指す. 獲得した知識に基づく意思決定目的であり, データ収集発掘評価といった人間計算機共同作業を伴う知識マネジメントとして捉えられる.

詳説

 データマイニング (data mining)は, データベース (data base) [5] に蓄えられた大量生データに対して, 機械学習 (machine learning)に関連する複数の手順を用いる戦略により, データ内在する規則性 (regularity), 制約 (constraint), ルール (rule)などを効率よく求め研究である. なお, データベースからの知識発見 (KDD: knowledge discovery in databases)とも呼ばれ, 知識発見 (knowledge discovery)に関わる多数学習アルゴリズムが, 人工知能だけでなくデータベース統計学側面含めて研究されている. まず, ノイズ例外含み疎な構造をもつことも多い生データ対象としたデー タマイニングに共通する知識発見の手順を(1)~(6)に簡単に示す [1].

 【手順

(1)対象となるデータ対す既知性質(背景知識)を利用してデータ収集行い, データベースデータウェアハウス (data warehouse)に格納する. (2)データ対す選択操作を前処理として行う. この段階はデータクリーニングと呼ばれる. (3)実装前提とする制約のもとでデータ次元低減などによる変形操作を行う. (4)データマイニングを行うアルゴリズム実行する. (5)導出された記述解釈, ならびに, 記述妥当性検証後処理として行う. (6)最終的記述評価され, 知識となる.

 手順(4)のアルゴリズム求まる知識表現法によって, データの統計的解析 (statistical analysis of data)とデータの論理的解析 (logical analysis of data)の二種類大きく分類される.

 データの論理的解析一種である決定木 (decision tree)を図1に示す. なお, 決定木求めアルゴリズムとしてID3 [4] などが知られており, エントロピーMDL(minimum description length)基準記述選択する際に用いられる.


属性1 属性2 属性3 クラス
例1 10
例2 3
例3 6
例4 2
例5 9
例6 7
例7 5
例8 4
図1: 決定木を用いた概念学習の一例

図1: 決定木を用いた概念学習一例


 関係データベース問合せ言語SQLのGroupBy操作拡張として位置付けられる結合ルール (association rule)を求めアルゴリズム研究数多い. 結合ルール求めるために, 最小サポート(support)値と最小確信度(confidence)を定めヒューリスティック閾値が用いられる. なお, 最小閾値により多数ルール導出制限するだけではなく, 新規性興味深さの弱いルール最大閾値抑制することもある. また, 頻度の高い購買パターン結合ルールが表すため, データベースマーケティング(database marketing)などをターゲットに, 計算機アーキテクチャを含めた効率良い実装進んでいる.

 その他, 多変量解析の手法を用いるクラスター分析 (cluster analysis)や, 因果関係表現するベイズネットワーク (Baysian network)や, 論理的表現対す帰納推論プログラミング(ILP: inductive logicprogramminge)などもアプローチ一つである. また, ルール理解可能性高め上で, ルール視覚化 (visualization)も欠かせない.

 なお, ラフ集合(rough sets), ファジー理論(fuzzy theory), ニューラルネットワーク(neural network), 遺伝アルゴリズム(genetic algorithm)などの研究とも密接に関係している.

 ところで, データマイニングの対象となるデータは, 航空会社, 銀行, クレジットカード会社, 電話, 保険などでのトランザクションだけではなく, WWWデータ医療データなどの異な性質をもつデータ含まれる [2]. 特に, 学習データ種類限定される場合, 地理データに対して空間データマイニング(spatial data mining), 文書データに対してテキストマイニング(text mining)などと呼ぶ. また, データマイニングに関連したシフトウェア(siftware)と呼ばれるソフトウェア開発も盛んである.

 なお, 良質知識発見するには, 複数アルゴリズム適用するだけではなく, データの前処理・ルール後処理が重要となる. したがって, 実用化向けて, 例えば, 各種情報システム効果的運用することを考えデータ収集戦略決定なければならない.



参考文献

[1] U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth and R. Uthurusamy, Advances in Knowledge Discovery and Data Mining, AAAI/MIT Press, 1996.

[2] R. Michalski, I. Bratko and M. Kubat, Machine Learning and Data Mining, Methods and Applications, John Wiley & Sons Ltd., 1998.

[3] J. Pearl, Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Morgan-Kaufmann, 1988.

[4] J. R. Quinlan, C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers, Inc., 1993. 古川康一監訳, 『AIによるデータ解析』, トッパン, 1995.

[5] J. D. Ullman, Principles of Database and Knowledge-Base Systems, Vol.I, Vol.II, Computer Science Press, 1988.


データマイニング

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/04/26 02:52 UTC 版)

データマイニング英語: Data mining)とは、統計学パターン認識人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、ヒューリスティク(heuristic、発見的)な知識獲得が可能であるという期待を含意していることが多い。とくにテキストを対象とするものをテキストマイニング、そのなかでもウェブページを対象にしたものをウェブマイニングと呼ぶ。英語では"Data mining"の語の直接の起源となった研究分野であるknowledge-discovery in databases(データベースからの知識発見)の頭文字をとってKDDとも呼ばれる。


  1. ^ W. Frawley and G. Piatetsky-Shapiro and C. Matheus, Knowledge Discovery in Databases: An Overview. AI Magazine, Fall 1992, pp. 213-228.
  2. ^ D. Hand, H. Mannila, P. Smyth: Principles of Data Mining. MIT Press, Cambridge, MA, 2001. ISBN 0-262-08290-X (各データマイニング手法の理論背景などが中心)


「データマイニング」の続きの解説一覧



固有名詞の分類


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「データマイニング」の関連用語

データマイニングのお隣キーワード

   

英語⇒日本語
日本語⇒英語
   
検索ランキング



データマイニングのページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。

  
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
マインズマインズ
COPYRIGHT © MINDS CO., LTD. ALL RIGHT RESERVED.
JERICHO CONSULTINGJERICHO CONSULTING
Copyright (C) 2020by Jericho Consulting Co.,Ltd. All Rights Reserved.
人事コンサルティングのアクティブ アンド カンパニー人事コンサルティングのアクティブ アンド カンパニー
Copyright© 2020 Active and Company Ltd. All rights reserved.
広告転職.com広告転職.com
Copyright(C) 2020 Total Brain co., ltd. All Rights Reserved.
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2020 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリデータマイニングの記事を利用しております。
日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会
Copyright (C) 2020 (社)日本オペレーションズ・リサーチ学会 All rights reserved.
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのデータマイニング (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2020 Weblio RSS