データセットとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 日本語表現辞典 >  データセットの意味・解説 

dataset

別表記:データセット

「dataset」の意味・「dataset」とは

「dataset」は、一連のデータ集まりを指す英語の単語である。これらのデータは、一般的には同じ種類情報含み、同じ形式整理されている。例えば、人口統計データ気象データ販売データなどが「dataset」の一例である。これらは、分析研究機械学習訓練など、さまざまな目的使用される

「dataset」の発音・読み方

「dataset」の発音は、IPA表記では /ˈdeɪtəsɛt/ となる。IPAカタカナ読みでは「デイタセット」と表現され日本人発音するカタカナ英語読み方では「データセット」となる。この単語発音によって意味や品詞が変わる単語ではない。

「dataset」の定義を英語で解説

A "dataset" is a collection of related sets of information that is composed of separate elements but can be manipulated as a unit by a computer. It typically contains information that share the same kind of data and are organized in the same format. For instance, a dataset could be a collection of people's ages, incomes, or education level.

「dataset」の類語

「dataset」の類語としては、「data set」、「data collection」、「data pool」、「data array」などがある。これらの語も同様に一連のデータ集まりを指す。

「dataset」に関連する用語・表現

「dataset」に関連する用語としては、「data」、「database」、「big data」、「data analysis」、「data mining」などがある。これらはすべて、データの収集管理分析関連する用語である。

「dataset」の例文

1.語例文(日本語訳): This dataset contains information about the population of each city.(このデータセットには、各都市人口情報含まれている。) 2.英語例文(日本語訳): We used a large dataset to train our machine learning model.(私たち大量のデータセットを使って機械学習モデル訓練した。) 3.英語例文(日本語訳): The dataset is updated every month.(データセットは毎月更新される。) 4.英語例文(日本語訳): The dataset includes both qualitative and quantitative data.(データセットには定性データ定量データ両方含まれている。) 5.英語例文(日本語訳): The accuracy of the dataset is crucial for the research.(研究においては、データセットの正確性が重要である。) 6.英語例文(日本語訳): The dataset was collected from various sources.(データセットはさまざまなソースから収集された。) 7.英語例文(日本語訳): The dataset is available for public use.(データセットは公開されており、誰でも利用することができる。) 8.英語例文(日本語訳): The dataset was cleaned before analysis.(分析前にデータセットはクリーニングされた。) 9.英語例文(日本語訳): The dataset is divided into training set and test set.(データセットは訓練セットテストセット分けられる。) 10.英語例文(日本語訳): The dataset consists of 1000 samples.(データセットは1000サンプル構成されている。)

データ‐セット【data set】

読み方:でーたせっと

コンピューター処理されるデータまとまり。ふつう、属性によって分類されたり、ある目的集められたりしたデータ記録されファイル群を指す。


データセット

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/02/25 05:20 UTC 版)

データセット(英: data set, dataset)は、データの集合のこと。表形式のデータの場合、テーブルの各列が特定の変数を表し、各行が特定のレコードに対応するような1つ以上のデータベーステーブルをデータセットという。データセットには、各オブジェクトの高さや重量といった変数の値が並べられている。データセットは、ドキュメントやファイルの集合で構成することもできる[1]


出典

  1. ^ Snijders, C.; Matzat, U.; Reips, U.-D. (2012). “'Big Data': Big gaps of knowledge in the field of Internet”. International Journal of Internet Science 7: 1–5. http://www.ijis.net/ijis7_1/ijis7_1_editorial.html. 
  2. ^ European open data portal”. European open data portal. European Commission. 2016年9月23日閲覧。
  3. ^ Dataset definition – MELODA”. www.meloda.org. 2016年8月17日閲覧。[リンク切れ]
  4. ^ Atz, U (2014). “The tau of data: A new metric to assess the timeliness of data in catalogues”. CEDEM 2014 Proceedings. https://project.opendatamonitor.eu/wp-content/uploads/dissemination/OpenDataMonitor_Publication_The-Tau-of-Data.pdf 2021年2月24日閲覧。. 
  5. ^ Jan M. Żytkow, Jan Rauch (1999). Principles of data mining and knowledge discovery. ISBN 978-3-540-66490-1. https://books.google.com/books?id=uTzeRZFmaBgC&pg=PA100 
  6. ^ 平山 淳一 (2016). “データ分析効率化のための尺度水準判定方式”. 人工知能学会全国大会論文集 JSAI2016: 2P114in1-2P114in1. doi:10.11517/pjsai.JSAI2016.0_2P114in1. 
  7. ^ 株式会社 野村総合研究所 2013, p. 23.
  8. ^ United Nations Statistical Commission; United Nations Economic Commission for Europe (2007) (pdf). Statistical Data Editing: Impact on Data Quality: Volume 3 of Statistical Data Editing, Conference of European Statisticians Statistical standards and studies. United Nations Publications. p. 20. ISBN 978-9211169522. https://unece.org/fileadmin/DAM/stats/publications/editing/SDE3.pdf 2015年7月19日閲覧。 
  9. ^ Fisher, R.A. (1936). “The Use of Multiple Measurements in Taxonomic Problems”. Annals of Eugenics 7 (2): 179-188. doi:10.1111/j.1469-1809.1936.tb02137.x. 

注釈

  1. ^ もちろん、便宜上数字を割り当てることはできる。例えばゲルマン民族を1、漢民族を2といった具合だが、その場合でも身長とは異なり、数の大小や比率に意味はない。


「データセット」の続きの解説一覧

データセット (IBMメインフレーム)

( データセット から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/09/07 13:23 UTC 版)

データセット (data set, dataset) という言葉は、IBMメインフレームコンピュータで扱うファイルについて言及するときに使われる言葉である。




「データセット (IBMメインフレーム)」の続きの解説一覧

データセット

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/06/05 18:33 UTC 版)

DBペディア」の記事における「データセット」の解説

2011年9月 (2011-09)現在[update]、DBペディアのデータセットは364件以上の事物扱い、うち183件が一貫したオントロジー分類されている。そこには人物416,000件、地理526,000件、音楽アルバム106,000件、映画60,000件、ビデオ・ゲーム17,500件, 組織団体169,000件、生物種183,000件、そして病気.5,400件が含まれている。DBペディア・データセットは、これら364件の事物の名前と概要最大97言語提供するほか、2,724,000件の画像へのリンクと6,300,000件の外部ウェブ・ページへのリンク、6,200,000件の別のRDFデータセットへの外部リンク740,000件のウィキペディアカテゴリ、そして2,900,000件のYAGO2のカテゴリ提供する。このデータセットから、複数ページ分散する情報抽出することができる。例えば、ある著作者作品に関するページやその著作者自身に関するページまとめ上げることができる。 DBペディア・プロジェクトは、RDF (Resource Description Framework) を使用して情報抽出する2011年9月 (2011-09)現在[update]、DBペディア・データセットは10億件以上の情報RDFトリプル)から構成され、うち3億8500件は英語版ウィキペディアから、6億6500件は他の言語版からそれぞれ抽出されたものであるウィキペディアから情報抽出する際の問題1つは、例えば「出身地」と「出生地」のように、同一概念複数テンプレート異なプロパティとして表現され得る、ということである。このため、ある人が生誕した場所を問い合わせる場合、より完全な結果を得るためには、それら両方プロパティ検索する必要があるこのため、これらのプロパティオントロジーとのマッピング行い同義語の数を減らすために、DBペディア・マッピング言語 (DBpedia Mapping Language) が開発された。ウィキペディア使用されているインフォボックスやプロパティは非常に多様であるため、誰でも参加できるように開発マッピング改善プロセス公開されている。

※この「データセット」の解説は、「DBペディア」の解説の一部です。
「データセット」を含む「DBペディア」の記事については、「DBペディア」の概要を参照ください。


データセット

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/09 16:20 UTC 版)

中国家庭追跡調査」の記事における「データセット」の解説

データセットは、中国家庭追跡調査Webサイトから入手可能である。

※この「データセット」の解説は、「中国家庭追跡調査」の解説の一部です。
「データセット」を含む「中国家庭追跡調査」の記事については、「中国家庭追跡調査」の概要を参照ください。


データセット

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/17 07:31 UTC 版)

物体検出」の記事における「データセット」の解説

機械学習においては主にモデル学習その評価について、データセット(英語版)を用いる。一般に提案手法公平に評価するため、一定の難易度があるデータセットをベンチマークとして用いることは重要である。また深層学習大量学習データを必要とするが、一般に物体検出のためのラベル付け画像分類ラベル付け比べると、画像含まれる物体種別選択するだけでなく、その位置まで特定して描画する必要があり難易度がより高い。また、バウンディングボックス付与はより物体領域正確に囲うほど良いため、品質コスト釣り合いを取ることが難しい。機械学習全体課題として大規模なデータセットを単独構築することが難しということもあり、ラベル付けが行われた大量データオンラインアクセスできる環境が整うことで研究・開発が進むという側面もある。例え2017年発表され顔検出のためのデータセットであるUMD Facesというデータセットは、従来大規模なデータセットの中には公表されていないものもあり、特に研究機関自由にアクセスできる動画を含むデータセットを作成することを一つ目的として発表したとしている。また特に研究盛んな特定の分野では、その分野に特有の物体詳細にラベル付けしたデータセットが作成されることもある。以下では一般物体検出のためのデータセットに加え分野別のデータセットについても述べる。

※この「データセット」の解説は、「物体検出」の解説の一部です。
「データセット」を含む「物体検出」の記事については、「物体検出」の概要を参照ください。


データセット

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/24 16:39 UTC 版)

MNISTデータベース」の記事における「データセット」の解説

MNISTデータベースには、NIST2つデータベースSpecial Database 1とSpecial Database 3)の組み合わせからなる画像群が含まれている。2つデータベースそれぞれ高校生米国国勢調査局従業員が手で書いた数字画像構成されている。

※この「データセット」の解説は、「MNISTデータベース」の解説の一部です。
「データセット」を含む「MNISTデータベース」の記事については、「MNISTデータベース」の概要を参照ください。

ウィキペディア小見出し辞書の「 データセット」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ

「 データセット」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「 データセット」の関連用語

 データセットのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



 データセットのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
実用日本語表現辞典実用日本語表現辞典
Copyright © 2024実用日本語表現辞典 All Rights Reserved.
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのデータセット (改訂履歴)、データセット (IBMメインフレーム) (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのDBペディア (改訂履歴)、中国家庭追跡調査 (改訂履歴)、物体検出 (改訂履歴)、MNISTデータベース (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。
Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います:
 Creative Commons Attribution (CC-BY) 2.0 France.
この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
浜島書店 Catch a Wave
Copyright © 1995-2024 Hamajima Shoten, Publishers. All rights reserved.
株式会社ベネッセコーポレーション株式会社ベネッセコーポレーション
Copyright © Benesse Holdings, Inc. All rights reserved.
研究社研究社
Copyright (c) 1995-2024 Kenkyusha Co., Ltd. All rights reserved.
日本語WordNet日本語WordNet
日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved.
WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
日外アソシエーツ株式会社日外アソシエーツ株式会社
Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved.
「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
EDRDGEDRDG
This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

©2024 GRAS Group, Inc.RSS