非ASCII文字の挿入をコード番号としてエンコードとは何？わかりやすく解説 Weblio辞書

索引トップ用語の索引ランキング

非ASCII文字の挿入をコード番号としてエンコード

出典: フリー百科事典『ウィキペディア（Wikipedia）』 (2022/03/19 04:49 UTC 版)

「Punycode」の記事における「非ASCII文字の挿入をコード番号としてエンコード」の解説

次のエンコーディング手順を理解するために、先にデコーダの動作を理解する必要がある。デコーダは、2つの状態変数 i と n を持つオートマトンである。 i は分離した後のASCII文字列への挿入位置を表し、その範囲は0 (文字列の先頭への挿入を表す) からASCII文字列の長さ (文字列の末尾への挿入を表す) である。従って、この例では0–5となる。nは挿入する文字のコードポイントである。分離後文字列 b c h e r 挿入位置i0 1 2 3 4 5 i は0から始まり、n は128 (非ASCII文字の最初のコードポイント) から始まる。状態遷移は単調であり、遷移すると i が1だけ増加する。ただし i がすでに最大値の場合は n が1増加し、i は0に戻る。つまり、挿入するべき箇所がなくなると、挿入すべき文字が1つ後の物となる。要するに、各状態遷移の際、nで表されるコードポイントを文字列に挿入するか、挿入をスキップするか、という動きとなる。コード番号は、エンコーダによって生成される数値であり、デコーダが文字を挿入する前にスキップすべき挿入可能位置がいくつあるかを数値化したものである。"ü" のUnicode コードポイントはU+00FC, 10進数で表すと252である。よって、ü の字を文字列の1文字目の後ろに挿入するには、ü より前にある124 (251 - 127 = 124) 種類の非ASCII文字が、"bcher" の中に6か所ある挿入ポイントに挿入されるのをスキップし、さらに0文字目 (つまり文字列の先頭) にüが挿入されるのをスキップする必要がある。したがって、デコーダには必要な 1文字を挿入するために、(124 × 6) + 1 = 745回の非ASCII文字挿入をスキップするようデコーダに伝える必要がある。

※この「非ASCII文字の挿入をコード番号としてエンコード」の解説は、「Punycode」の解説の一部です。
「非ASCII文字の挿入をコード番号としてエンコード」を含む「Punycode」の記事については、「Punycode」の概要を参照ください。

ウィキペディア小見出し辞書の「非ASCII文字の挿入をコード番号としてエンコード」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。お問い合わせ。

>> 「非ASCII文字の挿入をコード番号としてエンコード」を含む用語の索引
非ASCII文字の挿入をコード番号としてエンコードのページへのリンク

非ASCII文字の挿入をコード番号としてエンコードとは？わかりやすく解説

非ASCII文字の挿入をコード番号としてエンコード

「非ASCII文字の挿入をコード番号としてエンコード」の関連用語


	Text is available under GNU Free Documentation License (GFDL). Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのPunycode (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

非ASCII文字の挿入をコード番号としてエンコードとは？ わかりやすく解説

非ASCII文字の挿入をコード番号としてエンコード

急上昇のことば

「非ASCII文字の挿入をコード番号としてエンコード」の関連用語

非ASCII文字の挿入をコード番号としてエンコードとは？わかりやすく解説