もじ‐しゅうごう〔‐シフガフ〕【文字集合】
文字集合
文字集合
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/03/10 17:45 UTC 版)
「PostScriptフォント」の記事における「文字集合」の解説
PostScriptフォントはあらゆる文字集合を符号化できるが、アドビが開発したフォントで使うために、アドビが特に開発した文字集合が存在する。
※この「文字集合」の解説は、「PostScriptフォント」の解説の一部です。
「文字集合」を含む「PostScriptフォント」の記事については、「PostScriptフォント」の概要を参照ください。
文字集合
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/16 03:39 UTC 版)
iモードの絵文字には、基本絵文字セットと拡張絵文字セットがある。拡張セットに対応しているのはHTML4.0対応バージョン以後の機種(504i/212i/251i=一部除く= と、FOMA2051・2102以降)である。拡張セットの文字は古い機種では表示できない。 また、文字には色も定義されている。前出のものでは、「わーい」が紫、「電車」が緑、「バス」が赤とされている。もちろん、カラー表示のできない501iといった初期の機種では、すべて黒で表示される。
※この「文字集合」の解説は、「iモード絵文字」の解説の一部です。
「文字集合」を含む「iモード絵文字」の記事については、「iモード絵文字」の概要を参照ください。
文字集合
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/26 09:09 UTC 版)
Unicodeの文字集合の符号空間は0 - 10FFFF16で111万4112符号位置がある。Unicode 12.1(2019年5月7日公表)では13万7929個(12%)の文字が割り当てられ、65個を制御文字に使い、13万7468符号位置(12%)を私用文字として確保している。また、2048文字分をUTF-16のための代用符号位置に使用しており、加えて66の特別な符号位置は使われない。残りの83万6536符号位置(75%)は未使用である。 文字を特定する場合にはUnicode符号位置や一意につけられた名前が使われる。例えば「a」はU+0061 (LATIN SMALL LETTER A)、「♪」はU+266A (EIGHTH NOTE)である。Unicode符号位置を文章中などに記す場合は "U+" の後に十六進法で符号位置を4桁から6桁続けることで表す。また、符号空間のうち代用符号位置を除く符号位置をUnicodeスカラ値という。 収録されている文字は、各国で標準として規定されている文字集合や実際に使用されている文字を持ち寄り、委員会により取捨選択されている。日本の文字については当初より JIS X 0201、JIS X 0208、JIS X 0212を、Unicode 3.1 からは JIS X 0213 の内容も収録している。 また収録において、元の各文字集合内で分離されている文字は尊重するが、異なる文字集合に同一の文字が収録されているとみなされるものは、同じ符号位置に割り当てる方針を取っている。この際に集合が膨大であるという理由で、漢字について、中国、日本、韓国の各規格の漢字を統合しCJK統合漢字としたことは大きな議論となった。 現在では独自創作の絵文字の追加等、当初の目的である「各国・各社の文字コードの統合」から外れた動きも進んでいる。 Unicodeに収録されている文字については、「ブロックの一覧」を参照。
※この「文字集合」の解説は、「Unicode」の解説の一部です。
「文字集合」を含む「Unicode」の記事については、「Unicode」の概要を参照ください。
- 文字集合のページへのリンク