拡張領域
拡張領域
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/26 09:09 UTC 版)
1980年代の当初の構想では、Unicodeは16ビット固定長で、216 = 6万5536 個の符号位置に必要な全ての文字を収録する、というもくろみであった。しかし、Unicode 1.0公表後、拡張可能な空き領域2万字分を巡り、各国から文字追加要求が起こった。その内容は中国、日本、台湾、ベトナム、シンガポールの追加漢字約1万5千字、古ハングル約5千字、未登録言語の文字などである。このようにしてUnicodeの、16ビットの枠内に全世界の文字を収録するという計画は早々に破綻し、1996年のUnicode 2.0の時点で既に、文字集合の空間を16ビットから広げることが決まった。この時、それまでの16ビットを前提としてすでに設計されていたシステム(たとえばJavaのchar型や、Windows NT・Windows 95のAPI)をなるべくそのままにしたまま、広げられた空間にある符号位置を表現する方法として、サロゲートペアが定義された。
※この「拡張領域」の解説は、「Unicode」の解説の一部です。
「拡張領域」を含む「Unicode」の記事については、「Unicode」の概要を参照ください。
- 拡張領域のページへのリンク