テストデータとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > テストデータの意味・解説 

テストデータ

(Test data から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/03/12 04:37 UTC 版)

テストデータは、テスト・評価・検証の際に用いられるデータのことである。統計学機械学習分野、また、システム開発回路設計分野で用いられる用語である。

統計学や機械学習におけるテストデータ

統計学、特にパターン認識や機械学習において、テストデータとは、統計手法や、学習されたモデル等の評価・検証を行うためのデータのことである。評価データとも呼ばれる。対義語に、トレーニングデータ、訓練データ、学習データ等がある。

統計学や機械学習において何らかの推定を行う際に、トレーニングデータだけでは学習されたモデルを十分に評価できないという問題がある。この問題は過剰適合や過学習と呼ばれる。この問題を解決するために、学習に用いないデータを用意し、いくつかの学習モデルの評価を行うことがある。この、評価を行うためのデータがテストデータと呼ばれる。交差検証においては、標本データをあらかじめトレーニングデータとテストデータに分割し、トレーニングデータで学習し、テストデータに学習モデルを適用させることで性能の評価を行う。

様々な学習モデルがそれぞれ別々のデータで学習している状況では、モデル同士の性能の優劣を正しく評価できない。そのため、共通のテストデータに対して性能の評価を行うことで、モデル同士の性能を比較することが行われている[1]

システム開発や回路の設計におけるテストデータ

システム開発や回路の設計において、テストデータは開発・設計されたシステムの正常な動作を検証するために用いられる。疑似個人情報、疑似データ、ダミーデータなどと呼ばれることもある。

サブシステム単体テスト・モジュールの結合テスト・全体のシステムテストなどの各テストにおいて、システムが正常に稼動するかどうかをテストするために用いられることが多い。 特に最後のシステムテスト(システム全体を対象に行われるテスト)におけるテストデータは実際の業務やサービスを想定して準備されることが多い。 テストデータの質が悪かったり、十分な量のテストデータが用意できないとシステムテスト不足になってしまい、バグやシステムダウンの原因となることもある。 業務に携わる人が作成することをテストデータ生成やテストデータ作成などと呼び、既存のデータベースにあるデータを一部利用することをデータマスキングなどと呼ぶことが多い。 テストデータに個人情報が含まれる場合は、個人情報漏洩のリスクも考慮した上でテストデータを準備・利用・破棄する必要がある。

脚注

  1. ^ DataSet - 機械学習の「朱鷺の杜Wiki」 様々な分野における、比較検証に利用できるテスト用データがまとめられている




このページでは「ウィキペディア」からテストデータを検索した結果を表示しています。
Weblioに収録されているすべての辞書からテストデータを検索する場合は、下記のリンクをクリックしてください。
 全ての辞書からテストデータ を検索

英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「テストデータ」の関連用語

テストデータのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



テストデータのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのテストデータ (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS