tab separated valuesとは? わかりやすく解説

Weblio 辞書 > コンピュータ > IT用語辞典 > tab separated valuesの意味・解説 

TSV

フルスペル:Tab Separated Values
読み方ティーエスブイ
別名:タブ区切り

TSVとは、文字文字列の間にタブ記号挿入して区切り設けること、あるいは、そのようにして各データ区切って管理するファイル形式のことである。

TSVは、表計算データベースデータテキストファイル保存する場合などに利用されるカンマによってテキストデータ区切るCSV形式と共に、よく利用されるファイル形式であるといえる

TSVもCSVも共にテキストファイルとして扱うことができるため、テキストエディタなどで手軽に編集することができ、大容量ファイル比較開きやすいといった利点がある。表計算ソフト開けばセルピンポイント修正したり、行や列を随意に挿入した削除したり、といった操作も容易である。

ExcelOpenOfficeCalcなどでは、文書新たに保存する場合ファイル種類としてCSV選択可能であるがTSVは直接指定できない格好になっているCSV区切りカンマからタブ変更することで、TSVとして出力することはできる。こうした背景もあってか、タブ区切られたTSVファイルCSV呼ばれるケースままある


Tab-Separated Values

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/11/20 15:05 UTC 版)

Tab-separated values
拡張子.tsv, .tab
MIMEタイプtext/tab-separated-values
種別マルチプラットフォーム、シリアルデータストリーム
包含物フィールドが分離されたリストとして構成されたデータベース情報
国際標準IANA MIME type

Tab-Separated Values (TSV) は、データベースにおける表表計算データなど、表形式でデータを格納するためのシンプルなテキスト形式のデータ形式であり[1]データベース間で情報を交換する方法の1つである[2]

TSV形式における各レコードは、テキストファイルの1行である。レコードの各フィールド値は、タブ文字で区切られる。すなわち、TSV形式はDelimiter-Separated Values英語版(区切り文字区切り形式)の一種である。タブ区切り形式ともいう。

TSVフォーマットはシンプルなファイルフォーマットであり、多くのコンピュータプログラムが対応しているため、異なるコンピュータプログラム間で表形式のデータ交換英語版するためによく使用される。TSVは、一般的に使用されているComma-Separated Values(CSV形式、タブ区切り形式)に代わるものである。CSV形式ではコンマ区切り文字としているため、フィールドにコンマが含まれる場合には、これをエスケープしないと問題が生じる。コンマはテキストデータでは頻出する文字であるが、タブは一般的なテキストの中に出現することは稀である。TSVのIANA標準[2]では、フィールドにタブ文字の使用を禁止している。

アイリス・データセット英語版[注釈 1]の先頭をTSV形式にすると、以下のようになる。

Sepal length	Sepal width	Petal length	Petal width	Species
5.1	3.5	1.4	0.2	I. setosa
4.9	3.0	1.4	0.2	I. setosa
4.7	3.2	1.3	0.2	I. setosa
4.6	3.1	1.5	0.2	I. setosa
5.0	3.6	1.4	0.2	I. setosa

上記のTSVプレーンテキストは、以下の表データに対応している。

Sepal length Sepal width Petal length Petal width Species
5.1 3.5 1.4 0.2 I. setosa
4.9 3.0 1.4 0.2 I. setosa
4.7 3.2 1.3 0.2 I. setosa
4.6 3.1 1.5 0.2 I. setosa
5.0 3.6 1.4 0.2 I. setosa

利点

カンマ区切り形式と比較した場合下記のような利点がある

  • UNIX系ソフトウェアやMicrosoft Excelなど標準形式として扱っているソフトウェアが多く、読み込みや書き出しの手間がひと手間すくないことが多い。
    • 例:
      • cut 何も指定しなければ入力をタブ区切りとして受け付ける。[3]
      • mysql 何も指定しなければファイルに出力するときの形式がタブ区切りとなる。またmysqlimportで取り込む場合も何も指定しなければタブ区切りとなる。
      • Microsoft Excel コピー&貼り付けの形式がタブ区切りとなっている。
  • タブは入力フォームに入力できないことが一般的で、解析の際、区切り文字がフィールドに混在することを想定した処理を省略できる。 例えばHTMLフォームの入力だけを格納しているmysqlのテーブルをファイルに出力するとタブが使われているのは区切り文字だけであると想定できる。 なお、HTMLのフォームを使わずHTMLのリクエストから迂回してタブを入力することもできるが、本来の経路ではタブを入力できないはずなのでタブが入力された場合は不正としてエラーにできる点も利点となる。

関連項目

脚注

注釈

  1. ^ テキスト処理のテストデータとしてよく使われる、アヤメ属の品種データ

出典

  1. ^ How To Use Tab Separated Value (TSV) Files Published by the International Monetary Fund
  2. ^ a b Definition of tab-separated-values (tsv)”. Internet Assigned Numbers Authority (IANA). 2020年5月4日閲覧。
  3. ^ cut(1) - Linux manual page”. man7.org. 2023年11月20日閲覧。

参考文献

外部リンク



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「tab separated values」の関連用語

tab separated valuesのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



tab separated valuesのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2025 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリの【TSV】の記事を利用しております。
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのTab-Separated Values (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS