UCS
読み方:ユーシーエス
UCSとは、Unicodeが採用する文字コードセットのひとつで、世界の主要な言語に使用される文字のほとんどを収録する多バイト文字体系のことである。ISO/IEC 10646として規定されている。
UCSには、1文字を16ビット(2バイト)で表すUCS-2コードと、もしくは31ビット(4バイト)で表すUCS-4とが用意されている。ただしこれらは、もっぱら文字をどのようなビット列で表現するかを規定するものであり、これらをコンピューター上でどのような方式で符号化(エンコード)するかについて規定するものではない。ものため、エンコードの方式としてはUTFと呼ばれる方式がUTF-8やUTF-16などとして別途に規定されている。なお、Unicodeの主要となる大半のコードはUCS-2に収められており、現在はいまだUCS-4がほとんど用いられていない状況にある。
- Universal Multiple-Octet Coded Character Setのページへのリンク