データマイニングとは? わかりやすく解説

Weblio 辞書 > 固有名詞の種類 > 方式・規則 > 主義・方式 > 学問 > 学問 > データマイニングの意味・解説 

データ‐マイニング【data mining】


データマイニング

【英】data mining

日々企業活動から発生した膨大多様なデータの中から有効な法則傾向パターン導き出す手法マイニングとは、鉱山発掘採掘という意味。文字通りデータ山からマーケティング有効な金脈発見するための分析手法の意味基礎技術をもとにデータ・マイニング・テクニックが準備され、そのテックニックを活用してソリューション課題解決)を実現する課題販促効果分析であったり、優良顧客プロファイル(「カスタマー・プロファイル」参照)の把握だったり、不正パターン発見だったりする。

データマイニング

・データマイニングとは統計的手法用いて企業蓄積される顧客データ従業員データの中から各情報相関法則性といった情報探し出すための分析手法である。
・例としては顧客データにおいては購買履歴から商品併売傾向探しだす、従業員データでは研修等の育成履歴から退職者再雇用する際に求め人材のみを見つけるといったことが挙げられるデータ精度はデータマイニングを行う者のスキル依存するという側面がある反面確度の高い情報探し出すことができれば施策無駄な情報省いたり、潜在的なニーズ掘り起こすことが可能になる


マイニング鉱山採掘


データ・マイニング data mining

膨大なデータベースからビジネス有益なパターンルール発見する手法多量データ鉱山見立て、その中から価値ある情報採掘mining)するのでこう呼ばれる特定のモデル仮定した多変量解析異なり特定のビジネス上の知識ルール獲得するために行われることなどから、使われる手法は様々である。データ・マイニングの専用ツールには、決定木l(CHAID,C5,CART)、ニューラル・ネットワーク自己組織化マップ(コホネン・ネットワーク)、リンク分析、K-meansクラスター分析、アソシエーション・ルール、記憶ベース推論などの手法が、データビジュアルツール複数結果の評価ツールとともに実装されているという。

データマイニング

【英】data mining

データマイニングとは、データベース蓄積されている大量データから、統計決定木などを駆使してマーケティング必要な傾向パターンなどの隠され規則性関係性仮説導き出す手法のことである。マイニングmining)とは「採鉱」を意味するもので、いわば眠っている金脈探り当てることになぞらえられている。

一見無秩序無関係に見えデータの山も、着眼点次第では各事項の間に有益な連関見えてくることが少なくない例えば、ある商店ではサングラスを買う人の多く一緒にガム買っているという事実が見つかるかも知れない。あるいは他の店舗では、曇りがちの日には生魚売り上げ伸びているかもしれないこうした連関実績として見出すことによって、サングラス陳列棚近くガム配置する、とか、の多い日に鮮魚セール実施するとか、効果的なマーケティングを行うことができる。

データマイニングは、データベース発展中心とした情報技術の向上によって盛んに行われるようになった手法であるといえる。元となるデータ多ければ多いほど、処理作業膨大なものになるが、実証性は高くなる既存データ専用データベース取り込んで意思決定活用するシステムデータウェアハウス呼ばれるが、データウェアハウス一個のデータマイニングツールであるといえる


データマイニング

読み方でーたまいにんぐ
【英】:data mining

概要

データベース蓄えられ多量データから, 機械学習machine learning)や統計的手法statistical method)を用いて データ中に含まれる知識発掘する手法をいう. 知識発見プロセスとしてのデータ獲得選択前処理変換知識発見アルゴリズム適用解釈評価といった 一連のサイクルを指す. 獲得した知識に基づく意思決定目的であり, データ収集発掘評価といった人間計算機共同作業を伴う知識マネジメントとして捉えられる

詳説

 データマイニング (data mining)は, データベース (data base) [5] に蓄えられ大量生データに対して, 機械学習 (machine learning)に関連する複数の手順を用い戦略により, データ内在する規則性 (regularity), 制約 (constraint), ルール (rule)などを効率よく求め研究である. なお, データベースからの知識発見 (KDD: knowledge discovery in databases)とも呼ばれ, 知識発見 (knowledge discovery)に関わる多数学習アルゴリズムが, 人工知能だけでなくデータベース統計学側面含めて研究されている. まず, ノイズ例外含み疎な構造をもつことも多い生データ対象としたデー タマイニングに共通する知識発見の手順を(1)(6)簡単に示す [1].

 【手順

(1)対象となるデータ対す既知性質(背景知識)を利用してデータ収集行い, データベースデータウェアハウス (data warehouse)に格納する. (2)データ対す選択操作前処理として行う. この段階はデータクリーニング呼ばれる. (3)実装前提とする制約のもとでデータ次元低減などによる変形操作を行う. (4)データマイニングを行うアルゴリズム実行する. (5)導出された記述解釈, ならびに, 記述妥当性検証後処理として行う. (6)最終的な記述評価され, 知識となる.

 手順(4)アルゴリズム求まる知識表現法によって, データの統計的解析 (statistical analysis of data)とデータの論理的解析 (logical analysis of data)の二種類大きく分類される.

 データの論理的解析一種である決定木 (decision tree)を図1に示す. なお, 決定木求めアルゴリズムとしてID3 [4] などが知られており, エントロピーMDL(minimum description length)基準記述選択する際に用いられる.


属性1 属性2 属性3 クラス
例1 10
例2 3
例3 6
例4 2
例5 9
例6 7
例7 5
例8 4
図1: 決定木を用いた概念学習の一例

図1: 決定木用いた概念学習一例


 関係データベース問合せ言語SQLのGroupBy操作拡張として位置付けられる結合ルール (association rule)を求めアルゴリズム研究数多い. 結合ルール求めるために, 最小サポート(support)値と最小確信度(confidence)を定めヒューリスティック閾値用いられる. なお, 最小閾値により多数ルール導出制限するだけではなく, 新規性興味深さの弱いルール最大閾値抑制することもある. また, 頻度の高い購買パターン結合ルールが表すため, データベースマーケティング(database marketing)などをターゲットに, 計算機アーキテクチャ含めた効率良い実装進んでいる.

 その他, 多変量解析の手法を用いクラスター分析 (cluster analysis)や, 因果関係表現するベイズネットワーク (Baysian network)や, 論理的表現対す帰納推論プログラミング(ILP: inductive logicprogramminge)などもアプローチ一つである. また, ルール理解可能性高め上で, ルール視覚化 (visualization)も欠かせない.

 なお, ラフ集合(rough sets), ファジー理論(fuzzy theory), ニューラルネットワーク(neural network), 遺伝アルゴリズム(genetic algorithm)などの研究とも密接に関係している.

 ところで, データマイニングの対象となるデータは, 航空会社, 銀行, クレジットカード会社, 電話, 保険などでのトランザクションだけではなく, WWWデータ医療データなどの異な性質をもつデータ含まれる [2]. 特に, 学習データ種類限定される場合, 地理データに対して空間データマイニング(spatial data mining), 文書データに対してテキストマイニング(text mining)などと呼ぶ. また, データマイニングに関連したシフトウェア(siftware)と呼ばれるソフトウェアの開発も盛んである.

 なお, 良質な知識発見するには, 複数アルゴリズム適用するだけではなく, データ前処理ルール後処理が重要となる. したがって, 実用化に向けて, 例えば, 各種情報システム効果的に運用することを考えたデータ収集戦略決定しなければならない.



参考文献

[1] U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth and R. Uthurusamy, Advances in Knowledge Discovery and Data Mining, AAAI/MIT Press, 1996.

[2] R. Michalski, I. Bratko and M. Kubat, Machine Learning and Data Mining, Methods and Applications, John Wiley & Sons Ltd., 1998.

[3] J. Pearl, Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Morgan-Kaufmann, 1988.

[4] J. R. Quinlan, C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers, Inc., 1993. 古川康一監訳, 『AIによるデータ解析』, トッパン, 1995.

[5] J. D. Ullman, Principles of Database and Knowledge-Base Systems, Vol.I, Vol.II, Computer Science Press, 1988.


データマイニング

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/07/03 06:49 UTC 版)

データマイニング英語: data mining)とは、統計学パターン認識人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、ヒューリスティク(heuristic、発見的)な知識獲得が可能であるという期待を含意していることが多い。とくにテキストを対象とするものをテキストマイニング、そのなかでもウェブページを対象にしたものをウェブマイニングと呼ぶ。英語では"data mining"の語の直接の起源となった研究分野であるknowledge-discovery in databases(データベースからの知識発見)の頭文字をとってKDDとも呼ばれる。


注釈

  1. ^ "IJCAI'89 Workshop on Knowledge Discovery in Databases"は、"Expert Database Systems, Scientific Discovery, Fuzzy Rules, Using Domain Knowledge, Learning from Relational (Structured) Data, Dealing with Text and other Complex Data, Discovery Tools, Better Presentation Methods, Integrated Systems, Privacy"の9分野の研究成果が発表された大規模なワークショップである。
  2. ^ この当時のIoTは、様々な物体にRFIDタグを貼り付け、RFIDに対応したセンサーを用いて物体からの情報収集を行い、収集した情報を活用することを指していた。
  3. ^ 後にコグニティブ・コンピューティング・システムとして初の商用の実用化を達成する。

出典

  1. ^ W. Frawley and G. Piatetsky-Shapiro and C. Matheus, Knowledge Discovery in Databases: An Overview. AI Magazine, Fall 1992, pp. 213-228.
  2. ^ D. Hand, H. Mannila, P. Smyth: Principles of Data Mining. MIT Press, Cambridge, MA, 2001. ISBN 0-262-08290-X (各データマイニング手法の理論背景などが中心)
  3. ^ Hiura, Satoko; Koseki, Shige; Koyama, Kento (2021-12). “Prediction of population behavior of Listeria monocytogenes in food using machine learning and a microbial growth and survival database” (英語). Scientific Reports 11 (1): 10613. doi:10.1038/s41598-021-90164-z. ISSN 2045-2322. PMC 8134468. PMID 34012066. http://www.nature.com/articles/s41598-021-90164-z. 


「データマイニング」の続きの解説一覧

データマイニング

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/08/07 03:58 UTC 版)

ナレッジマネジメント」の記事における「データマイニング」の解説

データマイニング(data mining)とは、人工知能統計学利用してデータから知識取り出そうとする試み。主に共起現象探りセールスに結びつけようとしている。 例1スーパービデオガムが共に売れる → 両者を同じ場所に置く。 例2:本Aを買う人は、後に本Bを買うことが多い → 購入者に本Bを薦めるダイレクトメールを送る。 従来統計学大差ないが、POSオンラインショッピングによる大量のITデータの中から法則性見つけ出すことに主眼置かれている。

※この「データマイニング」の解説は、「ナレッジマネジメント」の解説の一部です。
「データマイニング」を含む「ナレッジマネジメント」の記事については、「ナレッジマネジメント」の概要を参照ください。


データマイニング

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/16 00:18 UTC 版)

Facebookへの批判」の記事における「データマイニング」の解説

en:FacebookCambridge Analytica data scandal」も参照 調査およびデータマイニングの手段として、Facebook利用に関して懸念の声上がっている。Facebookプライバシーポリシーにはかつてこう記されていた。「当社では他の情報源から利用者に関する情報収集する可能性あります例えば、新聞ブログインスタント・メッセージング、他利用者Facebook情報等などのインターネット情報源を含むがそれだけ限りません」 しかしながらプライバシーポリシーは現在では更新されてこうなっている。「弊社は、他のFacebook利用者から収集した情報使用して利用者プロフィール補足することがあります(写真タグ付けされた場合や、近況アップデート取り上げられ場合など)。その場合は通常、そのコンテンツ削除できるか(写真タグ削除するなど)、プロフィール公開範囲制限できるようになってます。 新聞ブログ、インスタントメッセージングサービスなどの他の情報源利用して情報収集する項は、削除された。 Facebook無関係な個人によるデータ・マイニングは懸念されていた。それは2人マサチューセッツ工科大学学生自動化スクリプト利用して、7名のFacebookプロフィール4つ学校マサチューセッツ工科大学ニューヨーク州立大学オクラホマ大学ハーバード大学)からダウンロードすることができたことで証明された。これは、Facebookプライバシー研究プロジェクト一部として 2005年12月4日発表された。 その後Facebook利用者セキュリティ強化しこう答えた。「弊社フィッシングマルウェア対す多く防御策講じた。(短時間多くの短いメッセージ、悪いと知られているリンクを含むメッセージ送出する異常な活動に基づき認証破られたと考えられるアカウント検出する背後で動く複雑な自動的なシステム含まれる。」 「弊社提携する責任ある企業を含む、第三者情報共有する可能性あります」という2番目の項は、Facebook利用者データ私企業に売ることを許すとして、利用者からの非難浴びた。この懸念について、広報担当者クリス・ヒューズは「簡単に言えば弊社サードパーティ企業利用者情報提供したともないし、将来する予定もない」と述べたFacebook最終的には、プライバシーポリシーからこの項を削除した以前は、サードパーティ製のアプリケーションは、ほぼすべての利用者情報アクセスできていた。Facebookプライバシーポリシーは、以前このように述べていた。「Facebookプラットフォーム開発選別承認しないし、プラットフォーム開発者個人情報どのように使用するかをコントロールできない。」 しかし、その文言その後削除された。サードパーティ製のアプリケーションについては、プライバシーポリシーの「事前に承認されサードパーティウェブサイトおよびアプリケーション 」節で現在述べられている。 「 弊社は、フェイスブック有益なソーシャル体験お届けするために、事前に承認され外部プラットフォームアプリケーション及びウェブサイト利用した利用者一般情報提供することがありますフェイスブックログインしている場合)。同様に友達事前承認済みウェブサイトアプリケーション利用する場合も、友達とそのウェブサイトアプリケーションつながりになることができるよう、利用者一般情報提供することがあります(そのウェブサイトまたはアプリケーションアカウント持っている場合)。その場合、フェイスブックはこれらのウェブサイトアプリケーションに対して承認プロセス実行し利用者プライバシー保護のための合意別途締結することを要求します。この同意には、利用者一般情報へのアクセス削除に関する条項や、利用者当該サービス利用しないよう選択できる機能含まれます。事前承認済みウェブサイトおよびアプリケーションでの即時パーソナライゼーションは、アプリケーションウェブサイトプライバシー設定利用停止することができますまた、特定の事前承認済みウェブサイトまたはアプリケーションアクセスしたときに青色バーの[キャンセル]をクリックすると、そのウェブサイトアプリケーションブロックすることができます。さらに、利用者事前承認済みアプリケーションまたはウェブサイトアクセスする前にフェイスブックからログアウトした場合情報アクセスすることはできません。 」 英国では労働組合会議 (TUC) は、注意深く先へ進むという条件で、従業員Facebookや他のソーシャルネットワーキングサイトへのアクセス許可した2007年9月からの数か月FacebookGoogleのような検索エンジンを含む非会員が、限定された「公開プロフィール」を検索することを可能にしたため新たな一連の批判浴びようになった。しかし、Facebookプライバシー設定において、利用者プロフィール検索エンジンからブロックすることができる。 BBCの「ウォッチドッグ」 という番組2007年10月Facebook他人になりすますため、個人情報収集するのに容易であることの懸念示された。しかし、利用者がプライバシーコントロールをデフォルトにした場合友人以外に公開される情報殆どない友人以外の利用者公開される情報は、利用者氏名性別プロフィール写真ネットワーク利用者IDである。 さらに2008年2月ニューヨーク・タイムズ誌の記事によると、Facebook利用者アカウント削除する機能持っていないことが明らかとなった。これにより、プライベートな利用者データFacebookサーバー無期限放置されるという懸念高まった。 しかし、Facebookは現在、Facebookプライバシーポリシー従い利用者自分アカウント無効化または削除する選択肢提供している。「利用者アカウント無効にすると、見ることはできなくなりますが、削除はされません。利用者後でアカウント再開する場合備え弊社は、利用者プロフィール情報コネクション写真など)を保存します」。「アカウント削除すると、それは永久にFacebookから削除されます」。 サードパーティサイト「ユーソーシャル」 はファン友人を売ることで物議かもしていた。ユーソーシャル排除の手紙をFacebookから受け取り友人を売ることを止めた

※この「データマイニング」の解説は、「Facebookへの批判」の解説の一部です。
「データマイニング」を含む「Facebookへの批判」の記事については、「Facebookへの批判」の概要を参照ください。

ウィキペディア小見出し辞書の「データマイニング」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



固有名詞の分類


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「データマイニング」の関連用語

データマイニングのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



データマイニングのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
マインズマインズ
COPYRIGHT © MINDS CO., LTD. ALL RIGHT RESERVED.
JERICHO CONSULTINGJERICHO CONSULTING
Copyright (C) 2024by Jericho Consulting Co.,Ltd. All Rights Reserved.
人事コンサルティングのアクティブ アンド カンパニー人事コンサルティングのアクティブ アンド カンパニー
Copyright© 2024 Active and Company Ltd. All rights reserved.
広告転職.com広告転職.com
Copyright(C) 2024 Total Brain co., ltd. All Rights Reserved.
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2024 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリデータマイニングの記事を利用しております。
日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会
Copyright (C) 2024 (社)日本オペレーションズ・リサーチ学会 All rights reserved.
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのデータマイニング (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのナレッジマネジメント (改訂履歴)、Facebookへの批判 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS