制御コード・制御情報
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/03/16 08:52 UTC 版)
「プレーンテキスト」の記事における「制御コード・制御情報」の解説
先ほど、プレーンテキストはテキストデータのみで構成されると述べたが、正確には画面に表示される通常の文字のほか、文字としては表示されないが文字表示の制御などを行なう制御コードが含まれる。制御コードの例としては、文字の開始位置を揃える水平タブ (0x09)、垂直タブ (0x0B)、改行、改ページ (0x0C)、EOF(End Of File、ファイル終端マーク:0x1A)およびBOM(Byte Order Mark:Unicodeのように2バイト以上で1文字を構成する文字コードにおいてエンディアンを判別するための複数バイトからなる情報)などがある。このほか、各種文字コードの制御情報も含まれる。 これら制御コードに関し、OS間では互換性の問題が生じる。MS-DOS・Windows、UNIXおよびMac OSのプレーンテキストでは、それぞれ異なる改行コードを用いており、これが問題となることがありうる。 以下に、各OSの改行コードを挙げる(CRおよびLFはそれぞれASCIIの制御コードであり、CRは「復帰」を、LFは「改行」を表す)。 MS-DOS, Windows CRとLFの2つの制御コードを用いて1つの改行を表す。タイプライタで紙を1行分送り出して(改行)からパンチヘッドを行頭に戻す(復帰)のと似たようなものだと考えれば、わかりやすい。 UNIX LF Macintosh CR(macOSではLFも主流である) Unicodeでは改行をU+2028で、改段落をU+2029で表している。このほか、Unicodeでは垂直タブおよび改ページも改行として扱う。
※この「制御コード・制御情報」の解説は、「プレーンテキスト」の解説の一部です。
「制御コード・制御情報」を含む「プレーンテキスト」の記事については、「プレーンテキスト」の概要を参照ください。
- 制御コード・制御情報のページへのリンク