非ASCII文字の挿入をコード番号としてエンコードとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 非ASCII文字の挿入をコード番号としてエンコードの意味・解説 

非ASCII文字の挿入をコード番号としてエンコード

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/19 04:49 UTC 版)

Punycode」の記事における「非ASCII文字の挿入をコード番号としてエンコード」の解説

次のエンコーディング手順理解するために、先にデコーダ動作理解する必要があるデコーダは、2つ状態変数 i と n を持つオートマトンである。 i は分離した後のASCII文字列への挿入位置表しその範囲は0 (文字列先頭への挿入を表す) からASCII文字列の長さ (文字列末尾への挿入を表す) である。従って、この例では0–5となる。nは挿入する文字コードポイントである。 分離後文字列 b c h e r 挿入位置i0 1 2 3 4 5 i は0から始まり、n は128 (非ASCII文字最初コードポイント) から始まる。状態遷移単調であり、遷移すると i が1だけ増加する。ただし i がすでに最大値場合は n が1増加し、i は0に戻る。つまり、挿入するべき箇所がなくなると、挿入すべき文字1つ後の物となる。要するに、各状態遷移の際、nで表されるコードポイント文字列挿入するか、挿入スキップするか、という動きとなる。 コード番号は、エンコーダによって生成される数値であり、デコーダ文字挿入する前にスキップすべき挿入可能位置がいくつあるかを数値化したものである。"ü" のUnicodeコードポイントU+00FC, 10進数で表すと252である。よって、ü の字を文字列の1文字目の後ろ挿入するには、ü より前にある124 (251 - 127 = 124) 種類の非ASCII文字が、"bcher" の中に6か所ある挿入ポイント挿入されるのをスキップし、さらに0文字目 (つまり文字列先頭) にüが挿入されるのをスキップする必要がある。したがってデコーダには必要な1文字挿入するために、(124 × 6) + 1 = 745回の非ASCII文字挿入スキップするようデコーダ伝え必要がある

※この「非ASCII文字の挿入をコード番号としてエンコード」の解説は、「Punycode」の解説の一部です。
「非ASCII文字の挿入をコード番号としてエンコード」を含む「Punycode」の記事については、「Punycode」の概要を参照ください。

ウィキペディア小見出し辞書の「非ASCII文字の挿入をコード番号としてエンコード」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「非ASCII文字の挿入をコード番号としてエンコード」の関連用語

1
38% |||||

非ASCII文字の挿入をコード番号としてエンコードのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



非ASCII文字の挿入をコード番号としてエンコードのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのPunycode (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS