Unicodeとは? わかりやすく解説

Unicode

読み方ユニコード

Unicodeとは、プラットフォームプログラム言語など依存しないように、世界中文字一意数値与え文字コードである。

Unicodeは、大手のコンピュータメーカーが参加して設立され非営利団体Unicodeコンソーシアムによって策定された。

現在では、XMLJavaのような技術標準として採用されている。また、より洗練されISO/IEC 10646標準化された。

Unicodeでは、それぞれの文字コードポイント呼ばれる値で定義する。この値は、当初16ビット納めることを目標開発されていたが、それでは足りないことがはっきりしたために、現在では、サロゲートと言われる手法導入し16進数値で10FFFFまでが使用可能になっている。


参照リンク
Unicode Home Page - (英文
情報処理のほかの用語一覧
文字コード:  2バイト文字  デリミター  UCS  Unicode  UTF  UTF-7  UTF-16

Unicode 関数

導入

Unicode をサポートします。

警告
この拡張モジュールは現在開発中のものであり、まだ一般には公開されていません。

要件

» ICU 3.4 あるいはそれ以降のバージョンが必要です。

インストール手順

まずはじめに ICU をダウンロードしてインストールします。 例 2382. Unix での ICU のインストール

./configure --disable-threads --enable-extras --enable-icuio --enable-layout
make && make install

   


それから、最新の PHP をチェックアウトして、 --with-icu-dir=<dir> オプション付きで configure します。<dir> には ICU をインストールしたディレクトリを指定します。 ICU を標準的な場所にインストールした場合は、 ディレクトリを明示的に指定する必要はありません。

実行時設定

php.ini の設定により動作が変化します。
表 314. Unicode 設定オプション
名前デフォルト変更の可否変更履歴
unicode.fallback_encodingNULLPHP_INI_ALLPHP 6.0.0 以降で使用可能です。
unicode.from_error_mode"2"PHP_INI_ALLPHP 6.0.0 以降で使用可能です。
unicode.from_error_subst_char"3f"PHP_INI_ALLPHP 6.0.0 以降で使用可能です。
unicode.http_input_encodingNULLPHP_INI_ALLPHP 6.0.0 以降で使用可能です。
unicode.output_encodingNULLPHP_INI_ALLPHP 6.0.0 以降で使用可能です。
unicode.runtime_encodingNULLPHP_INI_ALLPHP 6.0.0 以降で使用可能です。
unicode.script_encodingNULLPHP_INI_ALLPHP 6.0.0 以降で使用可能です。
unicode.semanticsoffPHP_INI_PERDIRPHP 6.0.0 以降で使用可能です。

PHP_INI_* 定数の詳細および定義については 付録 G. php.ini ディレクティブ を参照してください。
以下に設定ディレクティブに関する 簡単な説明を示します。
unicode.output_encoding string
出力用のデフォルトエンコーディング。

定義済み定数

以下の定数が定義されています。 この関数の拡張モジュールが PHP 組み込みでコンパイルされているか、 実行時に動的にロードされている場合のみ使用可能です。
表 315.
定数説明
U_INVALID_STOP0無効な文字が現れた時点で停止します。
U_INVALID_SKIP1無効な文字は読み飛ばします。
U_INVALID_SUBSTITUTE2無効な文字を置き換えます。
U_INVALID_ESCAPE3無効な文字をエスケープします。


目次

i18n_loc_get_default — デフォルトのロケールを取得する
i18n_loc_set_default — デフォルトのロケールを設定する
unicode_encode — unicode 文字列のエンコーディングを設定する
unicode_semantics — unicode 機能が使用可能かどうかを調べる

Unicode

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/09/11 02:30 UTC 版)

Unicode(ユニコード)は、符号化文字集合文字符号化方式などを定めた、文字コードの業界標準規格文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。




「Unicode」の続きの解説一覧

Unicode (ユニコード)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/08/01 16:13 UTC 版)

ジャワ文字」の記事における「Unicode (ユニコード)」の解説

2010年のUnicodeバージョン5.2で、基本多言語面U+A980-A9DFに追加された。文字並び順はhanacarakaではなくインド伝統的な順序になっているJavanese 0 1 2 3 4 5 6 7 8 9 A B C D E F U+A98x ꦀ ꦁ ꦂ ꦃ ꦄ ꦅ ꦆ ꦇ ꦈ ꦉ ꦊ ꦋ ꦌ ꦍ ꦎ ꦏ U+A99x ꦐ ꦑ ꦒ ꦓ ꦔ ꦕ ꦖ ꦗ ꦘ ꦙ ꦚ ꦛ ꦜ ꦝ ꦞ ꦟ U+A9Ax ꦠ ꦡ ꦢ ꦣ ꦤ ꦥ ꦦ ꦧ ꦨ ꦩ ꦪ ꦫ ꦬ ꦭ ꦮ ꦯ U+A9Bx ꦰ ꦱ ꦲ ꦳ ꦴ ꦵ ꦶ ꦷ ꦸ ꦹ ꦺ ꦻ ꦼ ꦽ ꦾ ꦿ U+A9Cx ꧀ ꧁ ꧂ ꧃ ꧄ ꧅ ꧆ ꧇ ꧈ ꧉ ꧊ ꧋ ꧌ ꧍ ꧏ U+A9Dx ꧐ ꧑ ꧒ ꧓ ꧔ ꧕ ꧖ ꧗ ꧘ ꧙ ꧞ ꧟

※この「Unicode (ユニコード)」の解説は、「ジャワ文字」の解説の一部です。
「Unicode (ユニコード)」を含む「ジャワ文字」の記事については、「ジャワ文字」の概要を参照ください。

ウィキペディア小見出し辞書の「Unicode」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「Unicode」の関連用語

Unicodeのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



Unicodeのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2024 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリUnicodeの記事を利用しております。
PHP Documentation GroupPHP Documentation Group
Copyright © 1997 - 2024 by the PHP Documentation Group.
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのUnicode (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのジャワ文字 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS