データレイクとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > データレイクの意味・解説 

データレイク

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/09/10 04:06 UTC 版)

ナビゲーションに移動 検索に移動

データレイク (Data lake) は構造化/非構造化データやバイナリ等のファイル含めたデータを一元的に格納するデータリポジトリ。一般的に、データレイクはレポート、可視化、分析、機械学習に利用されるエンタープライズのデータのコピーや返還後のデータを一カ所に集約する。データレイクはリレーショナルデータベースの構造化データ(列と行)や、半構造化データ(CSV、ログ、XMLJSON)、非構造化データ(Eメール、ドキュメント、PDF)、バイナリデータ(画像、音声、映像)を含めることができる。

適切に管理されておらず、ユーザが意図するデータへのアクセシビリティが低く、小さな価値しか提供できない低品質のデータレイクはデータの沼と表現される[1]

背景

Pentaho のCTOであるJames Dixonが、データマートと対比してこの概念を提唱したと主張している[2]。彼はデータマートにおけるデータのサイロ化などの問題点を指摘し、データレイクの必要性を説いている。PWCコンサルティングは"データレイクはデータのサイロ化の対策となりえる"と発言している[3]

脚注

  1. ^ Olavsrud, Thor. “3 keys to keep your data lake from becoming a data swamp” (英語). CIO. http://www.cio.com/article/3199994/big-data/3-keys-to-keep-your-data-lake-from-becoming-a-data-swamp.html 2017年7月5日閲覧。 
  2. ^ Woods, Dan (2011年7月21日). “Big data requires a big architecture”. Forbes. https://www.forbes.com/sites/ciocentral/2011/07/21/big-data-requires-a-big-new-architecture/ 
  3. ^ Stein, Brian; Morrison, Alan (2014) (pdf). Data lakes and the promise of unsiloed data (Report). Technology Forecast: Rethinking integration. PricewaterhouseCooper. http://www.pwc.com/en_US/us/technology-forecast/2014/cloud-computing/assets/pdf/pwc-technology-forecast-data-lakes.pdf. 

関連項目



このページでは「ウィキペディア」からデータレイクを検索した結果を表示しています。
Weblioに収録されているすべての辞書からデータレイクを検索する場合は、下記のリンクをクリックしてください。
 全ての辞書からデータレイク を検索

英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「データレイク」の関連用語

データレイクのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



データレイクのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのデータレイク (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS