データ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/06/10 15:48 UTC 版)
概要
「データ」と「情報」は同じ意味で使われることがあるが、これらの用語には明確な意味がある。一般の出版物では、データは文脈内において表示または分析するときに情報に変換される、と言われることがある[3]。しかし、学術的な扱いでは、主題のデータは単なる情報の一群とされる。データの用途は、科学研究、経営管理(例: 販売、収益、利益、株価)、金融、統治(例: 犯罪率、失業率、識字率)、および事実上あらゆる形態の人間の組織活動(例: NPOによるホームレスの数の調査)におよぶ。
一般に、データは意思決定の要素である。推論、議論、計算の基礎として使用できる事実情報の最小単位である。データは、抽象的なアイデアから具体的な測定値、さらには統計に至るまで多岐にわたる。データは測定・収集・報告・分析され、グラフ・表・画像などのデータ視覚化のために使われる。一般的な概念としてのデータは、既存の情報や知識が、より適切な用途や処理に適した形で表現・コード化されていることを指す。生データ(未処理データ)とは、研究者によって洗浄・修正される前の数値や文字の集まりのことである。外れ値や明らかな機器またはデータ入力のエラー(例えば、北極圏の屋外に置かれた温度計が、熱帯の気温を記録している)を除去するためには、生データを修正する必要がある。データ処理は一般に、段階的に行われ、ある段階の「加工データ」は次の段階の「生データ」と見なされることがある。実地データは、制御されていない現場の(in situ)環境で収集された生データである。実験データ~とは、科学的調査の活動内で、観察と記録によって生成されるデータである。
データは「デジタル経済の新しい石油」と呼ばれている[4][5]。
意味

データ、情報、知識、知恵は密接に関連した概念であるが、それぞれに役割があり、それぞれの用語には意味がある。一般的な見方では、データは収集され、分析される。データは何らかの形で分析されて初めて意思決定を行うのに適した情報となる[6]。つまり、あるデータ集合が誰かにとって有益であるかどうかは、その人がどの程度予期していたかによる。データストリームに含まれる情報量は、そのシャノンエントロピーによって特徴付けられることがある。
知識とは、ある主題に関する情報を扱った、豊富な経験に基づく理解のことである。たとえば、エベレストの高さは、一般にデータとみなされる。その高さは高度計で正確に測定し、データベースに入力することができる。このデータを、エベレストに関する他のデータと一緒に本に掲載することで、エベレストに登るための最適な方法を決めたい人に役立つように、山を説明することができる。エベレスト山頂に到達するための方法をアドバイスできるような登山経験に基づいた理解も「知識」と見なせるかもしれない。そして、この知識に基づいたエベレスト山頂への実際の登山は「知恵」と見ることができる。言い換えれば、知恵とは、人が持っている知識を、良い結果が得られるような状況で実践することである。このように知恵は、「データ」「情報」「知識」という抽象化された一連の概念を補完し、完結させるものである。
データは最も抽象度が低い概念で、情報はその次に抽象度が高く、知識は最も抽象的な概念とされることが多い[7]。この見方では、データは解釈を加えることによって情報に変わる。たとえば、エベレストの高さは一般に「データ」とされ、エベレストの地質学的特徴に関する書籍は「情報」とされ、エベレスト山頂に到達するための最適な方法に関する実用的な情報を含む登山ガイドブックは「知識」と見なされる。「情報」とは、日常的な使用から専門的な使用まで、さまざまな意味を持っている。しかし、こうした見方は、「データ」が「情報」が作られ、「情報」から「知識」が作られることを逆手に取った主張とも言える[8]。一般的に言えば、情報という概念は、制約、コミュニケーション、制御、データ、形式、指示、知識、意味、精神的刺激、パターン、知覚、および表現の概念と密接に関係している。バイノン・デイヴィスはデータと情報を区別するために記号の概念を用いている。データは一連の記号であるが、情報はその記号が何かを参照するために使われたときに生まれる[9][10]。
計算装置や機械が開発される以前は、人々は手作業でデータを収集し、それにパターンを当てはめる必要があった。しかし、計算装置や機械が発達し、これらのデバイスがデータを収集できるようになった。2010年代には、マーケティングや市民による社会福祉の利用状況の分析、科学研究に至るまで、さまざまな分野でデータを収集し、分類や加工するためにコンピュータが広く使われている。データ上におけるこうしたパターンは、知識を高めるための情報と見なされている。これらのパターンは「真理」として解釈されることもあり(ただし「真理」は主観的な概念となることもある)、一部の分野や文化では美的および倫理的基準として承認されることもある。知覚可能な物理的または仮想的な標識を残す出来事は、データを通して遡ることができる。標識と観察との間の関係が切れると、標識はもはやデータとはみなされなくなる[11]。
アナログ計算機は、データを電圧、距離、位置、または他の物理量として表現する。デジタルコンピュータは、固定されたアルファベットから取った記号の並びとしてデータを表現する。最も一般的なデジタルコンピュータは、二進数アルファベット、つまり、通常「0」と「1」で表される2文字のアルファベットを使用する。次に、数字や文字などの身近な表現は、この二進数アルファベットから構築される。データの中には特殊な形式もあって区別される。コンピュータプログラムはデータの集まりであり、命令として解釈することができる。ほとんどのコンピュータ言語では、プログラムと、プログラムが操作する他のデータとを区別しているが、Lispやそれに類する言語では、プログラムは他のデータと本質的に区別できない。また、メタデータ、すなわち他のデータの説明も区別することも有用である。メタデータに類似した、以前の用語は、補助データ(ancillary data)である。メタデータの原型の例は、書籍の内容の説明である図書館目録である。
データドキュメント
データを登録する必要がある場合は必ず、データドキュメント(data documents)という形式のデータが存在する。データドキュメントには次のような種類がある。
これらのデータドキュメントの一部(データリポジトリ、データスタディ、データセット、ソフトウェア)はデータ・サイテーション・インデックスに、データペーパーは従来の書誌データベース、たとえばサイエンス・サイテーション・インデックスに索引付けされている[12]。
- ^ a b 『OECD Glossary of Statistical Terms』OECD、2008年、119頁。ISBN 978-92-64-025561 。
- ^ “Statistical Language - What are Data?”. Australian Bureau of Statistics (2013年7月13日). 2019年4月19日時点のオリジナルよりアーカイブ。2020年3月9日閲覧。
- ^ “Data vs Information - Difference and Comparison | Diffen” (英語). www.diffen.com. 2018年12月11日閲覧。
- ^ Yonego, Joris Toonders (July 23, 2014). “Data Is the New Oil of the Digital Economy”. Wired .
- ^ “Data is the new oil” (2018年7月16日). 2021年10月27日時点のオリジナルよりアーカイブ。2022年4月3日閲覧。
- ^ “Joint Publication 2-0, Joint Intelligence”. Joint Chiefs of Staff, Joint Doctrine Publications. Department of Defense. pp. I-1 (2013年10月23日). 2018年7月17日閲覧。
- ^ Akash Mitra (2011年). “Classifying data for successful modeling”. 2017年11月7日時点のオリジナルよりアーカイブ。2017年11月5日閲覧。
- ^ Tuomi, Ilkka (2000). “Data is more than knowledge”. Journal of Management Information Systems 6 (3): 103–117. doi:10.1080/07421222.1999.11518258.
- ^ P. Beynon-Davies (2002). Information Systems: An introduction to informatics in organisations. Basingstoke, UK: Palgrave Macmillan. ISBN 0-333-96390-3
- ^ P. Beynon-Davies (2009). Business information systems. Basingstoke, UK: Palgrave. ISBN 978-0-230-20368-6
- ^ Sharon Daniel. The Database: An Aesthetics of Dignity
- ^ Schöpfel et al. 2020. "Data Documents". ISKO Encyclopedia of Knowledge Organization https://www.isko.org/cyclo/data_documents
- ^ Mesly, Olivier (2015). Creating Models in Psychological Research. États-Unis : Springer Psychology : 126 pages. ISBN 978-3-319-15752-8
- ^ Stallings, William (2016). Foundations of modern networking : SDN, NFV, QoE, IoT, and Cloud. Florence Agboma, Sofiene Jelassi. Indianapolis, Indiana. ISBN 978-0-13-417547-8. OCLC 927715441
- ^ P. Checkland and S. Holwell (1998). Information, Systems, and Information Systems: Making Sense of the Field.. Chichester, West Sussex: John Wiley & Sons. pp. 86–89. ISBN 0-471-95820-4
- ^ Johanna Drucker (2011). “Humanities Approaches to Graphical Display”. Digital Humanities Quarterly 005 (1) .
- ^ a b “data | Origin and meaning of data by Online Etymology Dictionary”. www.etymonline.com. 2022年4月3日閲覧。
- ^ American Psychological Association (2020). “6.11”. Publication Manual of the American Psychological Association: the official guide to APA style. American Psychological Association. ISBN 9781433832161
- 1 データとは
- 2 データの概要
- 3 データの収集と分析
- 4 語源と用語
データと同じ種類の言葉
「データ」に関係したコラム
-
MT4(Meta Trader 4)でチャートを表示した時に、異常データがあるためにチャートが正しく表示されない場合があります。例えば次のようなチャートは異常データによるものです。日経平均株価(日経2...
-
株価の時系列データとは、ある一定期間での始値、高値、安値、終値、出来高の数値のことです。期間は日足、週足、月足で分ける場合が多く、FX(外国為替証拠金取引)で用いる1時間足、1分足といった短時間の時系...
-
FX(外国為替証拠金取引)のチャート分析ソフトMT4(Meta Trader 4)から過去データを取得することができます。過去データはCSV形式のファイルで保存できるため、他のチャート分析ソフト用のデ...
-
CFDの銘柄の時系列データを取得するにはいくつかの方法がありますが、比較的簡単に取得できるのは、GCIフィナンシャルが取引ツールとして使用しているMT4(Meta Trader 4)からダウンロードす...
MT4でFXやCFDのテクニカル指標を同じエリアに複数表示するには
MT4でFXやCFDのテクニカル指標を複数表示すると、次の図のようになります。上の図では、EUR/USDのチャート画面にMACD、RSI、ストキャスティクスを描画したものです。画面が4つに分割されて、...
株式分析のゴールデンクロス、デッドクロスをエクセルで表示するには
株式分析のゴールデンクロス、デッドクロスをエクセルで表示する方法を紹介します。ゴールデンクロスとは、短期の株価移動平均線が、長期の株価移動平均線を下から上に突き抜けることです。また、デッドクロスとは、...
- データのページへのリンク