でーたまいにんぐとは?

辞典・百科事典の検索サービス - Weblio辞書

初めての方へ

参加元一覧


用語解説|動画|全文検索
Weblio 辞書 > ビジネス > マーケティング用語 > でーたまいにんぐの意味・解説 

マーケティング用語集

マインズマインズ

データマイニング

大量販売データなどを様々な統計手法により分析することで、消費者購買傾向商品間の関連性を見つけ出す手法またはプロセスのこと。
データマイニングには様々な分析手法存在しますが、マーケティング観点から最も重要視するポイントは、顧客特性傾向分析と併買傾向分析があげられます。近年市販様々なツールが提供されるようになりましたが、分析して得られた仮説元にどのようなプロモーション戦略構築するかが重要な課題となります。


OR事典

日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会

データマイニング

読み方:でーたまいにんぐ
【英】:data mining

概要

データベース蓄えられた多量データから,機械学習machine learning)や統計的手法(statistical method)を用いてデータ中に含まれる知識発掘する手法をいう.知識発見プロセスとしての,データ獲得選択,前処理,変換知識発見アルゴリズム適用解釈評価といった一連のサイクルを指す.獲得した知識に基づく意思決定目的であり,データ収集発掘評価といった人間計算機共同作業を伴う知識マネジメントとして捉えられる.

詳説

データマイニング (data mining)は, データベース (data base) [5] に蓄えられた大量生データに対して, 機械学習 (machine learning)に関連する複数の手順を用いる戦略により, データ内在する規則性 (regularity), 制約 (constraint), ルール (rule)などを効率よく求め研究である. なお, データベースからの知識発見 (KDD: knowledge discovery in databases)とも呼ばれ, 知識発見 (knowledge discovery)に関わる多数学習アルゴリズムが, 人工知能だけでなくデータベース統計学側面含めて研究されている. まず, ノイズ例外含み疎な構造をもつことも多い生データ対象としたデータマイニングに共通する知識発見の手順を(1)~(6)に簡単に示す[1].

手順

(1)対象となるデータ対す既知性質(背景知識)を利用してデータ収集行い, データベースデータウェアハウス (data warehouse)に格納する. (2)データ対す選択操作を前処理として行う. この段階はデータクリーニングと呼ばれる. (3)実装前提とする制約のもとでデータ次元低減などによる変形操作を行う. (4)データマイニングを行うアルゴリズム実行する. (5)導出された記述解釈, ならびに, 記述妥当性検証後処理として行う. (6)最終的記述評価され, 知識となる.

手順(4)のアルゴリズム求まる知識表現法によって, データの統計的解析 (statistical analysis of data)とデータの論理的解析 (logical analysis of data)の二種類大きく分類される.

データの論理的解析一種である決定木 (decision tree)を図1に示す. なお, 決定木求めアルゴリズムとしてID3 [4] などが知られており, エントロピーMDL(minimum description length)基準記述選択する際に用いられる.


属性1属性2属性3クラス
例110
例23
例36
例42
例59
例67
例75
例84
図1: 決定木を用いた概念学習の一例

図1: 決定木を用いた概念学習一例


関係データベース問合せ言語SQLのGroupBy操作拡張として位置付けられる結合ルール (association rule)を求めアルゴリズム研究数多い. 結合ルール求めるために, 最小サポート(support)値と最小確信度(confidence)を定めヒューリスティック閾値が用いられる. なお, 最小閾値により多数ルール導出制限するだけではなく, 新規性興味深さの弱いルール最大閾値抑制することもある. また, 頻度の高い購買パターン結合ルールが表すため, データベースマーケティング(database marketing)などをターゲットに, 計算機アーキテクチャを含めた効率良い実装進んでいる.

その他, 多変量解析の手法を用いるクラスター分析 (cluster analysis)や, 因果関係表現するベイズネットワーク (Baysian network)や, 論理的表現対す帰納推論プログラミング(ILP: inductive logicprogramminge)などもアプローチ一つである. また, ルール理解可能性高め上で, ルール視覚化 (visualization)も欠かせない.

なお, ラフ集合(rough sets), ファジー理論(fuzzy theory), ニューラルネットワーク(neural network), 遺伝アルゴリズム(genetic algorithm)などの研究とも密接に関係している.

ところで, データマイニングの対象となるデータは, 航空会社, 銀行, クレジットカード会社, 電話, 保険などでのトランザクションだけではなく, WWWデータ医療データなどの異な性質をもつデータ含まれる [2]. 特に, 学習データ種類限定される場合, 地理データに対して空間データマイニング(spatial data mining), 文書データに対してテキストマイニング(text mining)などと呼ぶ. また, データマイニングに関連したシフトウェア(siftware)と呼ばれるソフトウェア開発も盛んである.

なお, 良質知識発見するには, 複数アルゴリズム適用するだけではなく, データの前処理・ルール後処理が重要となる. したがって, 実用化向けて, 例えば, 各種情報システム効果的運用することを考えデータ収集戦略決定なければならない.



参考文献

[1] U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth and R. Uthurusamy, Advances in Knowledge Discovery and Data Mining, AAAI/MIT Press, 1996.

[2] R. Michalski, I. Bratko and M. Kubat, Machine Learning and Data Mining, Methods and Applications, John Wiley & Sons Ltd., 1998.

[3] J. Pearl, Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference,Morgan-Kaufmann, 1988.

[4] J. R. Quinlan, C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers, Inc., 1993.古川康一監訳, 『AIによるデータ解析』, トッパン, 1995.

[5] J. D. Ullman, Principles of Database and Knowledge-Base Systems, Vol.I, Vol.II, Computer Science Press, 1988.







でーたまいにんぐのページへのリンク

[PR] おすすめ情報

「でーたまいにんぐ」の関連用語
でーたまいにんぐのお隣キーワード
モバイル
モバイル版のWeblioは、下記のURLからアクセスしてください。
http://m.weblio.jp/
» モバイルで「でーたまいにんぐ」を見る
_ _   


でーたまいにんぐのページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。

  
マインズマインズ
COPYRIGHT © MINDS CO., LTD. ALL RIGHT RESERVED.
日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会
Copyright (C) 2012 (社)日本オペレーションズ・リサーチ学会 All rights reserved.

©2012 Weblio RSS