アスキー【ASCII】
アスキー ASCII
アスキー
アスキーとは、ANSI(アメリカ規格協会)の前身であるASAによって1963年に定められた、英語のアルファベットや数字などを中心とする文字コード体系である。現在の規格は「ANSI INCITS 4-1986」と呼ばれている。
アスキーは7ビットの情報で表現されており、128種類の文字が含まれている。このうち33の文字は、表示には使用されない制御文字である。アスキーの規格は米国で策定され、後に国際標準化機構(ISO)によって「ISO 646」として国際標準化された。後に日本でも、「ISO 646」に基づく日本工業規格(JIS)として「JIS X 0201」が策定されている。なお、「JIS X 0201」では、7ビットで表現されたアスキーの体系に加えて半角カナ文字を追加した8ビットの文字体系となっている。
参照リンク
Birth of ASCII - (cppreference.com)
ASCII
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/04/03 21:05 UTC 版)
![]() ASCII コード表 英:MIL-STD-188-100 (1972) |
ASCII(アスキー、英: American Standard Code for Information Interchange)は、1963年に制定された、アメリカ合衆国における情報通信用の文字コードである。日本語訳は「情報交換用米国標準コード[1]」となるが、一般には日本国内でもASCIIと表記する。なおInternet Assigned Numbers Authority (IANA) はこれをASCIIではなくUS-ASCIIと表記するのが望ましいとしている[2]。
概要
1963年6月17日に、米国規格協会(American Standards Association: ASA、後のANSI)によって制定された。当時の規格番号は「ASA X3.4」であったが、情報技術規格国際委員会 (INCITS) の発足に伴い規格番号が2002年に改訂され、現在の規格番号は「ANSI INCITS 4」である。
0番から127番までの番号(数値)がどの文字や記号を意味するかという対応関係を定めている[3]。
ASCIIは、あくまで1960年代のアメリカにおいて英語での通信や当時のアメリカのコンピュータに必要な文字や記号などが含まれるように定めた文字コードである。そのため、含まれているのは次のような文字や記号や制御文字だけであり、それ以外は含まれていない。
これらの文字や記号をすべて通し番号で表現できるように、7ビットを使っている。つまり2進数で7桁、具体的には0000000から1111111まで、10進数でいえば0番から127番までの番号を使い、それぞれの数値(番号)に対応する文字や約物や数字や制御文字を決め、その対応の規則(コード)を制定したものである。
ASCIIの構成は次のようになっている:
コード範囲(16進) | 内容 |
---|---|
00–1F | 制御文字 |
20 | 空白 |
21–7E | 図形文字 |
7F | 制御文字(DEL) |
派生規格
ASCIIはISO標準7ビット文字コードISO/IEC 646の元となった。しかし7ビットでは英語以外の言語に対応するには不十分であり、後に他のヨーロッパ言語で使われるラテン文字への対応を追加した8ビット文字コードであるISO/IEC 8859が策定された。その後、世界中で使用されている様々な文字を表現できるようにするため、ASCIIで使用されていない128番以降の部分に、その他の文字を割り当てたり、複数バイトを使用して1つの文字を表現したりするように独自拡張した文字符号化方式が使われるようになっていった。
ASCII制定当時、最小のデータ処理単位(メモリアドレッシングの最小単位)つまりバイトが6ビットであるコンピュータも多かった(DECのPDPシリーズなど)。そのようなコンピュータでは6ビットの文字符号化方式を採用しており、そのためISO/IEC 646の策定にあたっては、7ビット符号化案の他に6ビット符号化案もあった。のちに1バイトを8ビットとみなす、つまりオクテットを採用するコンピュータが人気となり、主流となっていった[4]。オクテットを採用したコンピュータでASCIIを扱う場合、1ビットの余りがあるので、その8ビット目は通信におけるエラーチェック用のパリティビットとして用いられていた[3]。21世紀初頭においても、互換性を維持する目的で、7ビットコードが正式で、8ビット目は使用できない規格がいくつか存在する。
ASCIIから派生した独自拡張の文字符号化方式は1バイトコードおよび複数バイトコードを含め多数存在するが、各方式の間に互換性はほとんどなく、国際的なデータ交換性に問題があった。また、異なる言語間に限らず、例えば日本語の文字セットであっても複数の符号化方式が存在し、異なるコンピュータ間で互換性および可搬性のない機種依存文字が発生することになった。そのため、世界の文字を単一のコード体系のもとに収録する国際的な文字コード標準として、ISO/IEC 10646およびUnicodeの策定が進められることになった[5]。Unicode方式で符号化された文字データのうち、0番から127番まではASCIIをベースにしており、互換性がある。特に8ビット単位で符号化するUTF-8は、128番以降の文字を使用しないデータの場合はASCIIと同一のバイト列となる[6]。従来の文字符号化方式では1バイトや2バイトで表現可能だった文字が、UTF-8では2バイトや3バイト以上必要となってしまうケースもあるが、そのデメリットを補ってなお余りある交換性の高さから国際的にもUTF-8の普及が進んでいる[7]。これは従来の文字符号化方式が開発された当時と比べると、コンピュータのメモリやストレージの容量が飛躍的に増大しているためでもある。HTML5ではUTF-8の使用が推奨されており[8]、後継のHTML Living StandardでもデフォルトでUTF-8が使用されることを想定している[9]。
ASCII制御文字
初めの32文字(10進数で0–31)はASCIIでは制御文字として予約されている。基本的にはこれらの制御文字は表示するための文字ではなく、モニタやプリンタなどの機器を制御するために用いられる。例えば、ASCII 10(10進)は line feed(改行)を表しプリンタの紙送りなどに用いる、ASCII 27 はエスケープを表す。
ASCII 127(全てのビットがオン、つまり、2進数で1111111)は、delete(削除文字)として知られる制御文字である。この記号が現れた場合、その部分のデータが消去されていることを示す。この制御文字だけ先頭部分になく最後にある理由は、パンチテープへの記録は上書きが出来ないため、削除する際には全てに穴を空けることで対応できるというところからきている(1111111は全てに穴の開いた状態を示す)。また、ASCII 0(全てのビットがオフ、つまり2進数で0000000)は Null あるいはヌル文字と呼ばれ、delete と同様に多くのコンピュータシステムでは無視される。これは、仮にパンチテープと反対に1を0に変えることでデータを記録し、かつ上書きが不可能な媒体が存在する場合でも対応できるようにしているのである。
コードの多くは、データ転送プロトコルで用いられる。(例:ヘッディング開始、テキスト開始、テキスト終了など)
セパレータは磁気テープへの保存のために設計された。
XON や XOFF は、プリンタのような処理の遅いデバイスにおいて、データを失うことがないように情報の流れを制御するために用いることがある。
2進 | 8進 | 10進 | 16進 | 略語 | 図形表現 | CS | エスケープシーケンス | 名前/意味 |
---|---|---|---|---|---|---|---|---|
000 0000 | 000 | 0 | 00 | NUL | ␀ | ^@ | \0 | ヌル文字 |
000 0001 | 001 | 1 | 01 | SOH | ␁ | ^A | ヘッディング開始 | |
000 0010 | 002 | 2 | 02 | STX | ␂ | ^B | テキスト開始 | |
000 0011 | 003 | 3 | 03 | ETX | ␃ | ^C | テキスト終了 | |
000 0100 | 004 | 4 | 04 | EOT | ␄ | ^D | 伝送終了 | |
000 0101 | 005 | 5 | 05 | ENQ | ␅ | ^E | 問い合わせ | |
000 0110 | 006 | 6 | 06 | ACK | ␆ | ^F | 肯定応答 | |
000 0111 | 007 | 7 | 07 | BEL | ␇ | ^G | \a | ベル |
000 1000 | 010 | 8 | 08 | BS | ␈ | ^H | \b | 後退 |
000 1001 | 011 | 9 | 09 | HT | ␉ | ^I | \t | 水平タブ |
000 1010 | 012 | 10 | 0A | LF | ␊ | ^J | \n | 改行 |
000 1011 | 013 | 11 | 0B | VT | ␋ | ^K | \v | 垂直タブ |
000 1100 | 014 | 12 | 0C | FF | ␌ | ^L | \f | 書式送り |
000 1101 | 015 | 13 | 0D | CR | ␍ | ^M | \r | 復帰 |
000 1110 | 016 | 14 | 0E | SO | ␎ | ^N | シフトアウト | |
000 1111 | 017 | 15 | 0F | SI | ␏ | ^O | シフトイン | |
001 0000 | 020 | 16 | 10 | DLE | ␐ | ^P | 伝送制御拡張 | |
001 0001 | 021 | 17 | 11 | DC1 | ␑ | ^Q | 装置制御1、XON | |
001 0010 | 022 | 18 | 12 | DC2 | ␒ | ^R | 装置制御2 | |
001 0011 | 023 | 19 | 13 | DC3 | ␓ | ^S | 装置制御3、XOFF | |
001 0100 | 024 | 20 | 14 | DC4 | ␔ | ^T | 装置制御4 | |
001 0101 | 025 | 21 | 15 | NAK | ␕ | ^U | 否定応答 | |
001 0110 | 026 | 22 | 16 | SYN | ␖ | ^V | 同期信号 | |
001 0111 | 027 | 23 | 17 | ETB | ␗ | ^W | 伝送ブロック終結 | |
001 1000 | 030 | 24 | 18 | CAN | ␘ | ^X | 取消 | |
001 1001 | 031 | 25 | 19 | EM | ␙ | ^Y | 媒体終端 | |
001 1010 | 032 | 26 | 1A | SUB | ␚ | ^Z | 置換 | |
001 1011 | 033 | 27 | 1B | ESC | ␛ | ^[ | \e | エスケープ |
001 1100 | 034 | 28 | 1C | FS | ␜ | ^\ | ファイル分離標識 | |
001 1101 | 035 | 29 | 1D | GS | ␝ | ^] | グループ分離標識 | |
001 1110 | 036 | 30 | 1E | RS | ␞ | ^^ | レコード分離標識 | |
001 1111 | 037 | 31 | 1F | US | ␟ | ^_ | ユニット分離標識 | |
111 1111 | 177 | 127 | 7F | DEL | ␡ | ^? | 抹消 |
ASCII印字可能文字
ASCII 32は、空白文字である。キーボードのスペースキーから入力でき、語と語の間に空白を表示する。 ASCII 33–126は印刷可能な文字 (printable characters) であり、半角英数の数字、句読点や記号を表す。若い順からエクスクラメーションマーク、ダブルクオーテーション、…と続き、ラテン文字大文字の前に数字と大半の半角約物、大文字と小文字の間、ラテン文字小文字の後にも数種類の半角約物が割り当てられている。
下の図では、16進数・10進数・8進数の順でASCIIコードの値を示す。
凡例:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
_ | 2 SP 20(16) 32(10) 40(8) |
! 21(16) 33(10) 41(8) |
" 22(16) 34(10) 42(8) |
# 23(16) 35(10) 43(8) |
$ 24(16) 36(10) 44(8) |
% 25(16) 37(10) 45(8) |
& 26(16) 38(10) 46(8) |
' 27(16) 39(10) 47(8) |
( 28(16) 40(10) 50(8) |
) 29(16) 41(10) 51(8) |
* 2a(16) 42(10) 52(8) |
+ 2b(16) 43(10) 53(8) |
, 2c(16) 44(10) 54(8) |
- 2d(16) 45(10) 55(8) |
. 2e(16) 46(10) 56(8) |
/ 2f(16) 47(10) 57(8) |
_ | 30 30(16) 48(10) 60(8) |
1 31(16) 49(10) 61(8) |
2 32(16) 50(10) 62(8) |
3 33(16) 51(10) 63(8) |
4 34(16) 52(10) 64(8) |
5 35(16) 53(10) 65(8) |
6 36(16) 54(10) 66(8) |
7 37(16) 55(10) 67(8) |
8 38(16) 56(10) 70(8) |
9 39(16) 57(10) 71(8) |
: 3a(16) 58(10) 72(8) |
; 3b(16) 59(10) 73(8) |
< 3c(16) 60(10) 74(8) |
= 3d(16) 61(10) 75(8) |
> 3e(16) 62(10) 76(8) |
? 3f(16) 63(10) 77(8) |
_ | 4@ 40(16) 64(10) 100(8) |
A 41(16) 65(10) 101(8) |
B 42(16) 66(10) 102(8) |
C 43(16) 67(10) 103(8) |
D 44(16) 68(10) 104(8) |
E 45(16) 69(10) 105(8) |
F 46(16) 70(10) 106(8) |
G 47(16) 71(10) 107(8) |
H 48(16) 72(10) 110(8) |
I 49(16) 73(10) 111(8) |
J 4a(16) 74(10) 112(8) |
K 4b(16) 75(10) 113(8) |
L 4c(16) 76(10) 114(8) |
M 4d(16) 77(10) 115(8) |
N 4e(16) 78(10) 116(8) |
O 4f(16) 79(10) 117(8) |
_ | 5P 50(16) 80(10) 120(8) |
Q 51(16) 81(10) 121(8) |
R 52(16) 82(10) 122(8) |
S 53(16) 83(10) 123(8) |
T 54(16) 84(10) 124(8) |
U 55(16) 85(10) 125(8) |
V 56(16) 86(10) 126(8) |
W 57(16) 87(10) 127(8) |
X 58(16) 88(10) 130(8) |
Y 59(16) 89(10) 131(8) |
Z 5a(16) 90(10) 132(8) |
[ 5b(16) 91(10) 133(8) |
\ 5c(16) 92(10) 134(8) |
] 5d(16) 93(10) 135(8) |
^ 5e(16) 94(10) 136(8) |
_ 5f(16) 95(10) 137(8) |
_ | 6` 60(16) 96(10) 140(8) |
a 61(16) 97(10) 141(8) |
b 62(16) 98(10) 142(8) |
c 63(16) 99(10) 143(8) |
d 64(16) 100(10) 144(8) |
e 65(16) 101(10) 145(8) |
f 66(16) 102(10) 146(8) |
g 67(16) 103(10) 147(8) |
h 68(16) 104(10) 150(8) |
i 69(16) 105(10) 151(8) |
j 6a(16) 106(10) 152(8) |
k 6b(16) 107(10) 153(8) |
l 6c(16) 108(10) 154(8) |
m 6d(16) 109(10) 155(8) |
n 6e(16) 110(10) 156(8) |
o 6f(16) 111(10) 157(8) |
_ | 7p 70(16) 112(10) 160(8) |
q 71(16) 113(10) 161(8) |
r 72(16) 114(10) 162(8) |
s 73(16) 115(10) 163(8) |
t 74(16) 116(10) 164(8) |
u 75(16) 117(10) 165(8) |
v 76(16) 118(10) 166(8) |
w 77(16) 119(10) 167(8) |
x 78(16) 120(10) 170(8) |
y 79(16) 121(10) 171(8) |
z 7a(16) 122(10) 172(8) |
{ 7b(16) 123(10) 173(8) |
| 7c(16) 124(10) 174(8) |
} 7d(16) 125(10) 175(8) |
~ 7e(16) 126(10) 176(8) |
|
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
大文字のASCII値に32を加えると小文字に変換することができる。この変換は、2進法では、6ビット目に1をセットするだけでよい。また、数字から48を減じれば、対応する値が得られる。この変換は、5ビット目及び6ビット目に0をセットするか、あるいは単純に上位4ビットを無視するだけでもよい。なお、印字可能文字のうち「@」から始まる32文字については、ASCII値を64減じて対応する制御文字を求め、この制御文字を「コントロール+」(英: control+)という前置表現を付けた印字可能文字で表記する慣習がある。
例:BELコード(07) →「コントロール+G」(受信した側の機器で注意喚起音が鳴る)
この制御文字の表記方法は、キーボード上の印字可能文字キーを制御文字の送出に用いていた機器の名残りであると考えられる(7ビット目を0にセットする専用キー(Ctrlキー)を、印字可能文字キーと同時に押して制御文字を送出)。
また、Unix 端末では Ctrl+数字 によって、人間工学的に押下しづらい制御文字を送出できる。キャレット記法を用いると、具体的には以下であることが多い。[要出典]
- Ctrl+2 が
^@
- Ctrl+3 が
^[
- Ctrl+4 が
^\
- Ctrl+5 が
^]
- Ctrl+6 が
^^
- Ctrl+7 が
^_
- Ctrl+8 が
^?
欠点など
上述されているようにASCIIは米国の規格であり、ラテン文字を用いる言語であってもアメリカ英語以外を表記するには不十分である。
当初サーカムフレックス、チルダ、グレイヴ・アクセントおよび(本来の目的と兼用で)アポストロフィー、コーテーションマーク、コンマは他の文字に追加するダイアクリティカルマークとして電動タイプライターで重ね打ちすることを想定していたが[10]、間にバックスペースを入力しなければならず、ビデオ表示端末では重ね打ちが事実上不可能であるなどの理由で普及しなかった。
早期に互換性のない変種が各国で出現したため、ISO/IEC 646では置き換え可能な文字を定義することで対応を図ったが、置き換えられた文字を利用するプログラム言語や異なる文字集合の間では文字化けが発生することとなった。(日本語ではJIS X 0201に起因するバックスラッシュの円記号への文字化けがある。)
1970年代以降、8ビットがコンピュータで主流のバイトサイズになると、追加の1ビットの領域を利用したいわゆる拡張ASCIIが言語・機種ごとに乱立した。ISO/IEC 8859ではこれらの追加領域を標準化し、スペイン語、ポルトガル語、フランス語、ドイツ語等で用いられるラテン文字のほとんどがISO/IEC 8859-1に統合された。
ISO/IEC 2022では日本語(ISO-2022-JP)を含む複数の文字集合を符号表の切り替えによって統一したが、表の切り替えを用いた方法は制御が複雑であるなどの欠点もあり、2023年現在では全ての文字を統一された符号で扱えるUnicodeが主流となっている。
脚注
出典
- ^ “情報交換用米国標準コード”. www.ibm.com (2014年2月20日). 2022年6月29日閲覧。
- ^ “Character Sets”. Internet Assigned Numbers Authority (IANA) (2022年7月14日). 2023年2月19日閲覧。
- ^ a b ASCII(アスキー / US-ASCII)とは - 意味をわかりやすく - IT用語辞典 e-Words
- ^ 「オクテット」と「バイト」は何が違う? | 日経クロステック(xTECH)
- ^ Unicode(ユニコード)とは - 意味をわかりやすく - IT用語辞典 e-Words
- ^ UTF-8とは - 意味をわかりやすく - IT用語辞典 e-Words
- ^ Webサイトの文字コーディング、90%がUTF-8利用 - Shift JISは0.9% | TECH+(テックプラス)
- ^ HTMLで文字エンコーディングを指定する
- ^ HTML Standard - §4.2.5.4 Specifying the document's character encoding
- ^ "Character histories: notes on some ASCII code positions"
参考文献
- 「ANSI INCITS 4-1986 (formerly ANSI X3.4-1986) American National Standard for Information Systems ― Coded Character Sets ― 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII)」American National Standards Institute(1963年6月17日制定、1986年3月26日最終改正、2002年1月15日規格番号変更)
関連項目
ASCII
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/12/06 23:14 UTC 版)
ASCIIの制御文字には以下のものを含む。 CS10進16進略号記号名称C言語説明^@ 00 00 NUL ␀ 空白 Null \0 元々は、紙テープの末端のデータが書き込まれていない箇所をコンピュータが読み飛ばすために、「何もしない」コードとして定められたものだった。後に、テレタイプ端末がキャリッジ・リターンや行送りを物理的にするための時間を稼ぐために入れられるようにもなった。現在では、C言語などで文字列の終端を表すのに用いられる。 ^A 01 01 SOH ␁ ヘッディング開始Start of Heading 通信伝文中のヘッダ開始を表す。 ^B 02 02 STX ␂ テキスト開始Start of Text 通信伝文中のテキスト部分の開始を表す。 ^C 03 03 ETX ␃ テキスト終結End of Text 通信伝文中のテキスト部分の終了を表す。また、Control-Cはプログラムやプロセスに割り込むためにも用いられる。 ^D 04 04 EOT ␄ 伝送終了End of Transmission データ送信側がデータ送信終了時にデータ受信先にEOTを送る。 ^E 05 05 ENQ ␅ 問い合わせEnquiry データ送信側がデータ送信しようというときに、データ受信側にデータに先立ってENQを送る。データ受信先は、データ受信できる状態であればデータ送信側にACKを送り、データ受信できない状態であればNAKを送る。データ送信側はACKを受信した場合にデータを送り、NAKを受信した場合はデータ送信を断念したり時間を置いて再度ENQ送信するなどの処理を行なう。 ^F 06 06 ACK ␆ 肯定応答Acknowledge 受信したデータにCRCなどの異常がない場合や、ENQを受信後にデータ受信ができる状態であれば、送信側にACKを送る。 ^G 07 07 BEL ␇ ベルBell \a 元々は通信相手の端末のベルを鳴らすのに使われていた。現在では物理的な鐘ではなくビープ音を鳴らす。端末エミュレータでは音を鳴らさずにウィンドウを点滅させるものもある。 ^H 08 08 BS ␈ 後退Backspace \b 元々はカーソルを手前(左)に移動させ、重ね打ちをしてアクセント符号つきの文字を打ち出すために使用されていた。現在では、カーソルを手前(左)に移動させてそこの文字を削除するために用いられる。 ^I 09 09 HT ␉ 水平タブHorizontal Tabulation \t 水平方向のタブ。テキストデータのデータの区切りに使うこともある。 ^J 10 0A LF ␊ 改行Line Feed \n Line Feedは「行送り」の意味。タイプライターでは、カーソルを桁(水平方向)はそのままで1行下へ移動させる。UNIXでは、LF単独で改行コードとして扱われ、行送りと桁の復帰を行う。MS-DOSやWindowsでは、CRとLFを併用する。 ^K 11 0B VT ␋ 垂直タブVertical Tabulation \v 垂直方向のタブ。 ^L 12 0C FF ␌ 書式送りForm Feed \f プリンタでは、次のページを給紙する。多くのプログラミング言語では空白として扱われ、コードの論理的区分の分け目として使用される。いくつかの端末エミュレータでは、画面をクリアする。プレーンテキストで記述されるRFCでは、ページ分割(英語版)文字として使用される。 ^M 13 0D CR ␍ 復帰Carriage Return \r 元はカーソルを同じ行の先頭の桁(左端)へ移動させるのに使われた。macOSよりも前のClassic Mac OSでは、CR単独で改行コードとして扱われ、行送りと桁の移動を行う。MS-DOSやWindowsでは、CRとLFを併用する。 ^N 14 0E SO ␎ シフトアウトShift Out 別の文字コードセットに遷移する。 ^O 15 0F SI ␏ シフトインShift In 通常の文字コードセットに遷移する。 ^P 16 10 DLE ␐ 伝送制御拡張Data Link Escape バイナリ通信(データそのものに制御文字を含むような通信)であることを表すために使う。DLE自体をバイナリデータに含める場合はDLEを2つ重ねて送信する。データ受信側はDLEが2つ重ねられている場合は、DLEというバイナリデータ(制御文字でなく)を受信したと解釈する。こうしたことは、通常のアプリケーションでは意識しなくてもいいことが多い。しかし、プロトコルアナライザなどで通信データを表示した場合、DLEが2つ重ねられていることを知らないと、おかしな通信データと誤解しかねない。 ^Q 17 11 DC1 ␑ 装置制御1Device Control 1 この4つのコードは装置制御のために予約されている。コードの解釈は接続している装置に依存する。主として、DC1とDC2は装置を作動させる目的で、DC3とDC4は装置を休止または停止させる目的で使用される。実際の用法としてはDC1とDC3をソフトウェアフロー制御(英語版)のために用いるのがデファクト・スタンダードとなっており、その場合、DC1はXON、DC3はXOFFと呼ばれる。テキストデータ受信側はテキスト送信側に、テキスト送信の一時停止を求めるためXOFF (DC3) を送信し、一時停止を解除するためXON (DC1) を送信する。XOFFを受信したテキストデータ送信側は、XONを受信するまでテキストデータの送信を一時停止する。なお、バイナリ通信ではDC1、DC3によるフロー制御は行なわない。バイナリ通信ではDC1、DC3は単なるバイナリデータであり、制御文字と解釈しないからである。 ^R 18 12 DC2 ␒ 装置制御2Device Control 2 ^S 19 13 DC3 ␓ 装置制御3Device Control 3 ^T 20 14 DC4 ␔ 装置制御4Device Control 4 ^U 21 15 NAK ␕ 否定応答Negative Acknowledge 受信したデータにCRCなどの異常があった場合や、ENQを受信後にデータ受信ができる状態でないなら送信側にNAKを送る。 ^V 22 16 SYN ␖ 同期信号Synchronous Idle キャラクタ同期方式の通信で、同期を取るために使う。 ^W 23 17 ETB ␗ 伝送ブロック終結End of Transmission Block 通信電文の1ブロック(一連のまとまりのある複数の伝文)が終了したことを表す。 ^X 24 18 CAN ␘ 取り消しCancel 先行するデータにエラーがある、または、無視してほしいことを示す。 ^Y 25 19 EM ␙ 媒体終結End of Medium 受信データを記録する媒体(紙や磁気テープなど)が、記録できる範囲の末端まで到達したことを表す。 ^Z 26 1A SUB ␚ 置換Substitute Character 本来は、伝送制御文字として、不明瞭な、または、無効な文字を受信したことを表す。しかし、下位レイヤで誤り検出訂正が行われるため、この用途で用いる必要はほぼなく、他の用途で用いられる。テキストファイルのファイル終端 (EOF) を表すのによく使われる。 ^[ 27 1B ESC ␛ 拡張Escape キーボードのEscキーを押すとこの文字がシステムに送られる。ソフトウェアのユーザインターフェースでは、画面・メニュー・モードから出るのに用いられる。プリンタや端末などの装置制御プロトコルでは、後に続く文字を特別な解釈をする(エスケープシーケンス)ことを指示するために用いられる。 ^\ 28 1C FS ␜ ファイル分離File Separator データ構造のフィールドを記録する区切り文字として使われる。階層的な構造の場合、USが最も低いレベル(プレーンテキストのデータアイテム)を分割し、 RS, GS, FSはそれぞれ下のレベルのアイテムからなるグループを分ける。 ^] 29 1D GS ␝ グループ分離Group Separator ^^ 30 1E RS ␞ レコード分離Record Separator ^_ 31 1F US ␟ ユニット分離Unit Separator ^? 127 7F DEL ␡ 抹消Delete 元々は紙テープで誤って穿孔した箇所の全部のビットの穴をあけて、データを抹消するのに用いられた。現代のコンピュータでは、カーソルのすぐ右の文字を削除するのに使われる。
※この「ASCII」の解説は、「制御文字」の解説の一部です。
「ASCII」を含む「制御文字」の記事については、「制御文字」の概要を参照ください。
「ASCII」の例文・使い方・用例・文例
asciiと同じ種類の言葉
- asciiのページへのリンク