データ管理
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/11/01 05:24 UTC 版)
データ管理(データかんり、英語: data management、データマネジメント)とは、データを管理する活動のことを指す。データをビジネスに活かすことができる状態で継続的に維持、さらに進化させていくための組織的な営み[1]、データを「経営戦略を決定する上での重要な資産」と捉え、意思決定のために常時利用可能な状態に改善・維持すること[2]である。
概要
データマネジメント協会(DAMA)が編纂したデータマネジメントに関する知識体系DMBOK(データマネジメントの知識体系)によると、データマネジメントは次の10の要素で構成されている。
- データガバナンス:データの管理および利用にまつわる計画、監視、統制
- データアーキテクチャ管理:データ資産管理のための青写真作成
- データ開発:分析、設計、実装、テスト、配備、維持
- データオペレーション管理:データ収集から廃棄までのサポート提供
- データセキュリティ管理:プライバシー、機密性、適切なアクセスの保証
- データクオリティ管理:データクオリティの定義、監視、改善
- リファレンスデータとマスタデータ管理:ゴールドバージョンと複製バージョンの管理
- データウェアハウジングとビジネスインテリジェンス管理:報告と分析を可能にする
- ドキュメントとコンテンツ管理:データベースの外部にあるデータの管理
- メタデータ管理:メタデータの統合、統制、供給
また、データを管理するためのシステムをデータ管理システムと呼ぶ。
概念
データ管理の概念は、計算機技術の進化と歩調を合わせて成立した。1950年代、コンピュータの普及に伴い、組織はデータを効率的に整理・保存する課題に直面した。初期の方法はパンチカードと手作業による分類に依拠しており、労力を要し、誤りが生じやすかった。1970年代にデータベース管理システムが導入され、構造化されたデータの蓄積と検索が可能となったことは画期的であった[3]。
1980年代には、関係データベースモデルがデータ管理を刷新し、データを資産とみなす発想と、ビジネスにおけるデータ中心の思考を促した。この時期には、データの品質とコンプライアンスの確保を目的とするデータガバナンスの実践も広がった。以後、クラウドコンピューティングやビッグデータ分析などの技術進歩により、データマネジメントはさらに洗練され、現代の事業運営の中核をなすに至っている[4][5]。
2025年現在、データマネジメントは、データの保管やデータセキュリティから分析および意思決定に至るまでの広範な実践を包含し、産業横断的にイノベーションと効率を牽引する重要な役割を担っている[6][7]。
論点
データマネジメント協会が策定した『データマネジメント知識体系(DMBoK)』は、現代のデータ管理を支える主要な知識領域を提示し、組織がデータを戦略的資産として管理するための枠組みを示す。
データガバナンス
データガバナンスは、組織全体でデータを一貫かつ責任をもって管理するための方針・手順・標準を指す。企業文脈では、事業部門横断のステークホルダー調整、データ所有権の定義、データ品質向上の便益の定量化などを含む。効果的なガバナンス枠組みには、データスチュワードの役割、エスカレーション手順、部門横断の監督委員会などが含まれ、データ利用における信頼と説明責任を維持する。
データアーキテクチャ
データアーキテクチャは、どのデータを収集し、どのように保存・配置・統合し、システムおよび組織内で活用するかを規定するモデル、方針、規則、標準から成る。データは通常、エンタープライズアーキテクチャまたはソリューションアーキテクチャを構成する複数のアーキテクチャ領域の一つである。データアーキテクチャは、効率的なデータフローを実現し、システムが柔軟に拡大可能で適応的かつ事業要件に整合するよう設計することに重点を置く。
データモデリングと設計
当該領域は、データ間の関係を論理的に表現するモデルの作成を中心とする。これはデータベースの設計に不可欠であり、分析やレポーティングを容易にする構造化を支える。
データ保管と運用
データの物理的な保管と日々の運用管理を扱う。この補完とデータベース管理は伝統的なデータセンターからクラウド型ストレージまでを含み、効率的なデータ処理を確保する。
データ統合と相互運用性
異なるソースからのデータが、複数のシステム間でシームレスに共有・データ統合されることを保証する。これは包括的な分析と意思決定に不可欠である。
文書およびコンテンツ管理
文書、マルチメディア、その他のコンテンツなどの非構造化データの管理に焦点を当て、適切な保存・分類・検索容易性を確保する。
データウェアハウジング、ビジネスインテリジェンスおよびデータ分析
分析・レポート・ビジネス洞察を支援するリポジトリへデータを集約する取り組みを含む。
データウェアハウス
コンピューティングにおけるデータウェアハウス(DW、DWH)は、レポーティングとデータ分析に用いられるシステムであり、ビジネスインテリジェンスの中核的構成要素である。データウェアハウスは異種ソースから統合されたデータの中央リポジトリであり、現在および履歴のデータを、データ分析・レポート作成・統合データからの洞察生成に最適化された形で格納する。主として分析者や管理者が組織的な意思決定を支援するために利用することを意図する。
ビジネスインテリジェンス
ビジネスインテリジェンス(BI)は、企業がデータ分析と業務情報の管理を通じて事業戦略および業務運営に資するための戦略・方法論・技術の総称である。一般的な機能には、レポーティング、オンライン分析処理(OLAP)、分析、デジタルダッシュボード開発、データマイニング、プロセスマイニング、複合イベント処理、ビジネス業績管理、ベンチマーキング、テキストマイニング、予測分析、処方的分析が含まれる。
データマート
データマートは、データウェアハウス環境に特有の構造パターン・アクセスパターンである。データウェアハウスの部分集合であり、特定の事業ライン、部門、主題領域、またはチームに焦点を当てる。データウェアハウスが企業全体を対象とするのに対し、データマートの情報は単一の部門に属する。導入形態によっては、各部門または事業単位がそのデータマート(ハードウェア、ソフトウェア、データを含む)の所有者とみなされ、当該データの利用・操作・開発を部門ごとに分離できる。一方、整合ディメンションを用いる展開では、顧客・製品などの共有ディメンションについて上記の所有関係は成立しない。
データ分析
データ分析とは、有用な情報を見いだし、結論を導き、意思決定を支援する目的で、データを検査・整形・変換・モデル化する過程である。データ分析は複数の側面とアプローチを有し、多様な名称のもとにさまざまな技法を包含し、ビジネス・科学・社会科学の各領域で用いられる。現代のビジネスにおいては、意思決定をより科学的なものにし、企業活動の効率化に寄与する役割を担う。
データマイニング
データマイニングは、機械学習・統計学・データベースシステムの交差領域からなる手法を用いて、大規模データセットからパターンを抽出・発見する過程である。データマイニングは計算機科学と統計学にまたがる学際的サブフィールドであり、データ集合から情報を抽出し、それを以後の利用に供する理解可能な構造に変換することを目標とする。データマイニングは「データベースにおける知識発見(KDD)」(知識抽出)プロセスの分析段階であり、生の分析に加えて、データベースおよびデータ管理、データ前処理、モデル化と推論、興味度指標、複雑性の考慮、発見された構造の後処理、可視化、オンライン更新などを含む。
データサイエンス
データサイエンスは学際的学問分野であり、統計学、科学計算、科学的方法、情報処理、科学可視化、アルゴリズムおよびシステムを用いて、ノイズを含む可能性のある構造化データ・非構造化データから知識を抽出または外挿する。
メタデータ管理
定義、ソース、利用状況を含む「データに関するデータ(メタデータ)」を管理し、組織のデータ資産に対する理解と可用性を高める。
データ品質管理
データ品質は単なる技術的課題ではなく、信頼、企業コンプライアンス、意思決定を下支えする戦略的な推進要因である。高品質のデータは、一貫したレポーティング、法令遵守、顧客の信頼を支援する。企業のデータ管理計画では、精度、粒度、適時性といった品質指標を定義し、それらを事業成果に結び付けることが多い。
リファレンスデータおよびマスターデータ管理
リファレンスデータは、システム間で一貫した解釈を可能にする標準化されたコードや値の集合を指す。マスターデータ管理(MDM)は、組織の重要データを統制・集中化し、効果的な意思決定と業務効率を支える統一的で信頼できる情報源を確保する。
データセキュリティ
データセキュリティとは、デジタル情報およびシステムを不正アクセス、利用、開示、改ざん、破壊から保護するために設計された、包括的な実践と技術の総称である。完全性、機密性、可用性を維持するため、暗号化、アクセス制御、監視、リスク評価などを含む。
データプライバシー
データプライバシーは、個人情報の収集・保存・利用が同意、法的基準、守秘の原則に適合するよう保護する営みを指す。機微なデータの乱用や不正アクセスからの保護を重視し、利用者の権利を尊重する。
情報管理の基盤としてのデータ管理
データとデータの価値の区別は、「情報のはしご」モデルまたはDIKARモデルによって説明される。
「DIKAR」モデルは、データ・情報・知識・実行・結果の英語の頭文字を取ったものであり、生データから実行可能な成果へと橋渡しするための枠組みである。このモデルは、データが情報へと変換され、さらに解釈されて知識となり、その知識が行動を導いて測定可能な結果に至るという流れを強調する。組織戦略に広く応用され、データ管理のプロセスを意思決定およびパフォーマンス目標に整合させるのに役立つ。各段階に着目することで、データが十分に活用され、根拠ある意思決定と所期の成果の実現が促される。特に技術駆動型の環境で有用とされる[8]。
「情報のはしご」は、生データ(事実)から情報(処理済みデータ)、知識(解釈された情報)、最終的には知恵(適用された知識)へと至る段階的な進展を図示する。各段階で価値と文脈が付加され、より良い意思決定が可能になる。非構造的な情報を実務的に意味のある洞察へと変換する過程を強調する[9]。
研究におけるデータ管理
研究におけるデータ管理は、データライフサイクル全体でデータを取り扱う体系的なプロセスを指す。これには、正確性、アクセシビリティ、セキュリティを確保するための収集、整理、保存、分析、共有といった活動が含まれる。ラボ情報管理システムが用いられることもある。
有効なデータ管理には、倫理的配慮、法令遵守、長期保存などの課題に対処するデータ管理計画(DMP)の策定も含まれる。適切な管理は、研究の透明性、再現可能性、資源の効率的利用を高め、研究成果の信頼性と影響力に寄与する。これは、研究プロジェクトの実施中および終了後の双方でデータの完全性と有用性を確保するための、分野横断的に不可欠な実践である[10]。
ビッグデータ
ビッグデータは、巨大なデータセットの収集と分析を指す。ビッグデータそのものは比較的新しい現象であるが、意思決定を支援するためのデータ活用の要請は、1970年代初頭の意思決定支援システム(DSS)の登場に遡ることができる。意思決定支援システムは、意思決定支援におけるデータ管理の初期形態とみなされる[11]。(データの急増も参照。)
関連項目
脚注
- ^ “リアライズ「データマネジメントとは」”. 2019年7月22日閲覧。
- ^ “デロイトトーマツ「第4回解決策(3):データマネジメントの体制整備」”. 2019年7月22日閲覧。
- ^ Foote, Keith D. (2022年2月19日). “A Brief History of Data Management”. DATAVERSITY. 2025年9月21日閲覧。
- ^ Redman, Thomas C. (2008). Data Driven: Profiting from Your Most Important Business Asset. Harvard Business Press. ISBN 9781422119129
- ^ Pearce, Guy (30 August 2023). “Three Lessons from 100 Years of Data Management”. ISACA Journal 4 2025年9月21日閲覧。.
- ^ Kramer, Robert (2025年3月20日). “The State Of Enterprise Data Management In Early 2025”. Forbes 2025年4月8日閲覧。
- ^ DAMA International (2024). DAMA-DMBOK: Data Management Body of Knowledge (2nd Revised ed.). Technics Publications. ISBN 9781634622349
- ^ ologbosere, oluwatosin; Akeem, Amodu (2021). “Critical Overview of Information Management, DIKAR Model and Technology in The 21st Century”. International Journal of Business Management and Technology 5 (1): 35–39. doi:10.1108/eum0000000007150.
- ^ Savoie, Michael J (2016). “2 The Information Ladder”. Building Successful Information Systems : Five Best Practices to Ensure Organizational Effectiveness and Profitability (2 ed.). New York: Business Expert Press. ISBN 9781631574658. OCLC 960738491
- ^ Coates, Heather (2014). Coble, Zach; Ho, Adrian. eds. “Ensuring research integrity: The role of data management in current crises”. College and Research Libraries News (Association of College and Research Libraries) 75 (11): 598–601. doi:10.5860/crln.75.11.9224. hdl:1805/5521.
- ^ Watson, Hugh J.; Marjanovic, Olivera (2013). “Big Data: The Fourth Data Management Generation”. Business Intelligence Journal; Seattle 18 (3): 4–8.
データ管理
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/08 09:06 UTC 版)
「ケプラー (探査機)」の記事における「データ管理」の解説
LASPでミッション運用中に収集された科学データテレメトリーは、処理のために、ボルチモアのジョンズ・ホプキンズ大学のキャンパスにある宇宙望遠鏡科学研究所にあるKepler Data Management Center(DMC)に送信される。科学データテレメトリーは、DMCによってデコードされ、未校正のFITS形式の科学データに処理される。DMCは、NASAのエイムズ研究センター(ARC)のSOCに渡され、校正と最終処理が行われる。ARCのSOCは、ケプラーScience Office(SO)が使用する科学データを処理するために必要なツールを開発および運用している。したがって、SOCは、SOとSOCが共同で開発した科学的アルゴリズムに基づいてパイプラインデータ処理ソフトウェアを開発している。運用中のSOC: DMCから未校正のピクセルデータを受信する。 分析アルゴリズムを適用して、各恒星の校正されたピクセルと光度曲線を生成する。 太陽系外惑星を検出するためのトランジット観測を実行する(しきい値超過イベント、またはTCE)。 誤検出を排除する方法として、様々なデータの一貫性を評価することにより、候補惑星のデータ検証を実行する。 SOCはまた、継続的に測光性能を評価し、SOおよびミッション管理のオフィスに性能指標を提供する。最後に、SOCは、カタログや処理済みデータなど、プロジェクトの科学データベースを開発および保守する。SOCは最終的に、校正されたデータと科学的結果をDMCに返し、長期アーカイブを行い、STScI(MAST)のMultimission Archiveを通じて世界中の天文学者に配布する。
※この「データ管理」の解説は、「ケプラー (探査機)」の解説の一部です。
「データ管理」を含む「ケプラー (探査機)」の記事については、「ケプラー (探査機)」の概要を参照ください。
「データ管理」の例文・使い方・用例・文例
データ管理と同じ種類の言葉
- データ管理のページへのリンク
