ASCII
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/02/25 10:05 UTC 版)
欠点など
上述されているようにASCIIは米国の規格であり、ラテン文字を用いる言語であっても英語以外を表記するには不十分である。
当初サーカムフレックス、チルダ、グレイヴ・アクセントおよび(本来の目的と兼用で)アポストロフィー、コーテーションマーク、コンマは他の文字に追加するダイアクリティカルマークとして電動タイプライターで重ね打ちすることを想定していたが[10]、間にバックスペースを入力しなければならず、ビデオ表示端末では重ね打ちが事実上不可能であるなどの理由で普及しなかった。
早期に互換性のない変種が各国で出現したため、ISO/IEC 646では置き換え可能な文字を定義することで対応を図ったが、置き換えられた文字を利用するプログラム言語や異なる文字集合の間では文字化けが発生することとなった。(日本語ではJIS X 0201に起因するバックスラッシュの円記号への文字化けがある。)
1970年代以降、8ビットがコンピュータで主流のバイトサイズになると、追加の1ビットの領域を利用したいわゆる拡張ASCIIが言語・機種ごとに乱立した。ISO/IEC 8859ではこれらの追加領域を標準化し、スペイン語、ポルトガル語、フランス語、ドイツ語等で用いられるラテン文字のほとんどがISO/IEC 8859-1に統合された。
ISO/IEC 2022では日本語(ISO-2022-JP)を含む複数の文字集合を符号表の切り替えによって統一したが、表の切り替えを用いた方法は制御が複雑であるなどの欠点もあり、2023年現在では全ての文字を統一された符号で扱えるUnicodeが主流となっている。
- ^ “情報交換用米国標準コード”. www.ibm.com (2014年2月20日). 2022年6月29日閲覧。
- ^ “Character Sets”. Internet Assigned Numbers Authority (IANA) (2022年7月14日). 2023年2月19日閲覧。
- ^ a b ASCII(アスキー / US-ASCII)とは - 意味をわかりやすく - IT用語辞典 e-Words
- ^ 「オクテット」と「バイト」は何が違う? | 日経クロステック(xTECH)
- ^ Unicode(ユニコード)とは - 意味をわかりやすく - IT用語辞典 e-Words
- ^ UTF-8とは - 意味をわかりやすく - IT用語辞典 e-Words
- ^ Webサイトの文字コーディング、90%がUTF-8利用 - Shift JISは0.9% | TECH+(テックプラス)
- ^ HTMLで文字エンコーディングを指定する
- ^ HTML Standard - §4.2.5.4 Specifying the document's character encoding
- ^ "Character histories: notes on some ASCII code positions"
ASCIIと同じ種類の言葉
- ASCIIのページへのリンク