文字コードの符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2018/01/08 03:29 UTC 版)
詳細は「文字符号化方式」を参照 日本語の 文字コード を符号化するときに問題となるのが文字の種類の多さである。1文字に対して1バイトを使うと256種類の文字までしか表現できない。英語であれば文字の種類は数十種類と少ないため、古くは 1文字 = 1バイトの形式が主流であった。しかし漢字はこの範囲におさまらないため、いくつかの符号化方式が提案された。現在は複数の方式が混在する状態になってしまっている。 日本語を表記するための符号化方式として代表的なものは ISO-2022-JPやShift_JIS、EUC-JPなどであるが、最近徐々に UTF-8 などの符号化方式も利用されるようになってきている。
※この「文字コードの符号化」の解説は、「符号化方式」の解説の一部です。
「文字コードの符号化」を含む「符号化方式」の記事については、「符号化方式」の概要を参照ください。
- 文字コードの符号化のページへのリンク