ファイルの区分
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/07/16 11:36 UTC 版)
「ファイル (コンピュータ)」の記事における「ファイルの区分」の解説
ファイルの区分のひとつに、バイナリファイルとテキストファイルに大別する考え方がある。この2大区分の考え方の基礎には、データをすべてバイナリファイルとして取り扱うUNIXにおいて、文字情報だけのテキスト情報を識別する意味があり、UNIXの考え方を引き継いだ個人利用用コンピュータオペレーティングシステムのDOSやWindows、Macintoshなどでもこの考え方が適用されている。 バイナリファイルとは、コンピュータ内部でプログラムが直接処理するデータ(ビット列)をそのまま格納するものでそのビット列の意味するものは、各アプリケーションソフト毎に異なる。一方、テキストファイルとは、そのビット列がある基準で制定された文字コードに従ったビット列が格納されているものである。テキストファイルとはある基準の文字コード(ビット列)のみで構成されたバイナリファイルと同じもので、バイナリファイルの一種を特別扱いしている。テキストファイルはそのデータビット列定義が文字情報という広く使われる情報であるため、いいかえれば、バイナリファイルは、データビット列定義が各アプリケーション固有、一方、テキストファイルは標準化されたビット列定義を持っているファイル、となる。 文字情報だけを取り扱うテキストエディタ等(Windowsでは「メモ帳」等)バイナリファイルはいわゆる「文字化け」を起こすのに対して、テキストファイルは(当然ながら)一定の文字列となって表示される。今日、広く利用されているワープロソフトで作成された文章ファイルは、文字情報だけでなく、文字の大きさ、色、列情報、ページ情報、などさまざまな固有データをとりあつかうもので、そのファイル形式はバイナリファイルの一種となる。 ここでのテキストデータとは、あいうえおの「あ」や「い」そのものしかあらわさない。「あ」の文字の大きさ、フォント、字形、「い」の色などは含まない。しかし、「改行」や「空白」などは含まれる。タイプライターの時代の文字の概念がコンピュータ化されたもの。 バイナリファイルは、アプリケーションが固有に定義したデータ列であるが、業界で標準化されたデータ形式を含んだものもある。また、アプリケーションが稼動するオペレーティングシステムで標準化された構造となっていることもある。 たとえば、ファイルの先頭部分(あるいは末尾部分)など、それぞれに定義された場所に定義されたデータを含む。これらの情報を参照し、データ種別や、データのフォーマット、そのバージョンなどを判断する。データが自分が作ったものでない場合、パソコンに既に導入されているソフトウェアで開けるかどうか確認する場合など。 バイナリファイルをビット列として扱うソフトウェアとしてビット列を直接編集する(これを「低レベル」と表現する)ソフトウェアがある。これはバイナリエディタと呼ばれる。(「絵を描く」など人間の動作に近いことを行うアプリケーションを「高レベル」、「ビットをオンオフする」などコンピュータよりの仕事を行うアプリケーションを「低レベル」と呼ぶ。これは、アプリケーションプログラム作成のレベルを表すこともあるが、その仕事がすばらしいかどうかということを常に高低付けし価値付けしているというものでもなく、「単に習慣的にそう呼ぶ」場合も多い。) バイナリファイルもテキストファイルも一般的には使用時にその全体がアプリケーションに読み込まれ使用されるものであるが、データが大量になれば、一度に全体を読み込むことはプログラムにとってもハードウェアにとっても大きな損失となる。そのため、必要なときに必要なデータだけをダイナミックに提供できるようなファイルシステムとしてファイルをより構造化したデータベースが作られるようになった。
※この「ファイルの区分」の解説は、「ファイル (コンピュータ)」の解説の一部です。
「ファイルの区分」を含む「ファイル (コンピュータ)」の記事については、「ファイル (コンピュータ)」の概要を参照ください。
- ファイルの区分のページへのリンク