符号化方式
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2018/01/08 03:29 UTC 版)
符号化方式(ふごうかほうしき)は、デジタル処理・伝送・記録のための、情報のデジタルデータへの変換方式のことである。変換されたデータを符号と呼び、符号から元の情報へ戻すことを復号と呼ぶ。
- 1 符号化方式とは
- 2 符号化方式の概要
- 3 暗号符号化
符号化方式
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/20 16:21 UTC 版)
国際モールス符号は短点(・)と長点(-)を組み合わせて、アルファベット・数字・記号を表現する。長点1つは短点3つ分の長さに相当し、各点の間は短点1つ分の間隔をあける。また、文字間隔は短点3つ分、語間隔は短点7つ分あけて区別する。 策定については、標準的な英文におけるアルファベットの出現頻度に応じて符号化されており、よく出現する文字ほど短い符号で表示される。例を挙げると、Eは(・)、Tは(-)とそれぞれ1符号と最短である。逆に使用頻度が少ないと思われるQは(--・-)、Jは(・---)と長い符号が制定されている。 これに対して、和文のモールス符号では出現頻度がまったく考慮されておらず、通信効率に劣ったものとなっている。和文モールス符号で(・)と(-)が意味するのはそれぞれ「ヘ」と「ム」である。国際モールス符号ではなく、DÖTVのモールス符号(1854年4月版)を基にイロハを当てはめている。 通信速度の表記には、字/分のほか、短点50個分(1ワード)の1分間当たりの出現回数WPM(words per minute)が用いられる。短点50個の基準として「PARIS」の符号を用いることからPARIS速度とも呼ばれる。例えば10WPMは50字/分に相当する。符号の速度が同じであっても、英語の平文では出現頻度の多い文字ほど符号が短いため、実際の文字数は多くなることがある。
※この「符号化方式」の解説は、「モールス符号」の解説の一部です。
「符号化方式」を含む「モールス符号」の記事については、「モールス符号」の概要を参照ください。
符号化方式
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/08/06 20:44 UTC 版)
「Densely packed decimal」の記事における「符号化方式」の解説
Chen-Ho符号と同様、DPD符号は、各桁の数字を最上位ビットに応じて2種類に分類する。0から7(2進0000-0111)の「小さい」数字と、8および9(2進1000, 1001)の「大きい」数字である。ある数字が小さいことがわかっていれば、追加の3ビットでその数字を指定できる。ある数字が大きければ、追加のビットは1ビットのみで済む。符号化において、対象の3つの数字それぞれの最上位ビットにより、残りのビットをエンコードするパターンが8つのうちから選択される。下表にそのパターンを示す。 Densely packed decimal 符号化規約DPD符号 10進数字b9b8b7b6b5b4b3b2b1b0d2d1d0符号化元の値説明a b c d e f 0 g h i 0abc 0def 0ghi (0–7) (0–7) (0–7) 全て小さい数字 a b c d e f 1 0 0 i 0abc 0def 100i (0–7) (0–7) (8–9) 小2つ、大1つ a b c g h f 1 0 1 i 0abc 100f 0ghi (0–7) (8–9) (0–7) g h c d e f 1 1 0 i 100c 0def 0ghi (8–9) (0–7) (0–7) a b c 1 0 f 1 1 1 i 0abc 100f 100i (0–7) (8–9) (8–9) 小1つ、大2つ d e c 0 1 f 1 1 1 i 100c 0def 100i (8–9) (0–7) (8–9) g h c 0 0 f 1 1 1 i 100c 100f 0ghi (8–9) (8–9) (0–7) x x c 1 1 f 1 1 1 i 100c 100f 100i (8–9) (8–9) (8–9) 全て大きい数字 b3が0ならば、全ての数字が小さいパターンである。(1行目) 残りの9ビットを使って3つの小さい数字をエンコードする。 b3が1かつb2,b1がともに1でないならば、小さい数字2つと大きい数字1つのパターンである。(2-4行目) b2,b1で数字の大小の組み合わせを示し、残りの7ビットを使って小さい数字2つと大きい数字1つをエンコードする。 b3-b1が1かつb6,b5がともに1でないならば、小さい数字1つと大きい数字2つのパターンである。(5-7行目) b6,b5で数字の大小の組み合わせを示し、残りの4ビットを使って小さい数字1つと大きい数字2つをエンコードする。 b6-b5,b3-b1が1ならば、全ての数字が大きいパターンである。(8行目) 残りのビットのうち3ビットを使って3つの大きい数字をエンコードする。b9,b8は使用しない(エンコード時は0で埋められる)。
※この「符号化方式」の解説は、「Densely packed decimal」の解説の一部です。
「符号化方式」を含む「Densely packed decimal」の記事については、「Densely packed decimal」の概要を参照ください。
符号化方式
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/08/10 23:05 UTC 版)
文字は1バイトか2バイトで符号化される。00–7Fの範囲にあるバイトは1バイトで、ASCII にあるものと同じ意味を持つ。厳密に言うと、96 の文字と32の制御符号がこの範囲にある。 上位ビットが立てられたバイトは2バイト文字の第1バイトであることを示す。おおざっぱに言うと、第1バイトの範囲は81–FEであり(すなわち、80とFFは含まず)、第2バイトは一部の領域は40–FEに、他の領域が80–FEにある。 より具体的には、以下の範囲のバイトが定義されている: GBKの文字符号化範囲範囲第1バイト第2バイトコードポイント文字水準 GBK/1 A1–A9 A1–FE 846 717 水準 GBK/2 B0–F7 A1–FE 6,768 6,763 水準 GBK/3 81–A0 40–FE (7Fを除く) 6,080 6,080 水準 GBK/4 AA–FE 40–A0 (7Fを除く) 8,160 8,160 水準 GBK/5 A8–A9 40–A0 (7Fを除く) 192 166 利用者定義 AA–AF A1–FE 564 利用者定義 F8–FE A1–FE 658 利用者定義 A1–A7 40–A0 (7Fを除く) 672 合計:23,94021,8862バイト符号で表現可能な64K空間すべてを以下の図に示す。緑と黄色の領域がGBKに割り当てられたコードポイントであり、赤が利用者定義文字用である。色付きでない領域は不正なバイトの組み合わせである。
※この「符号化方式」の解説は、「GBK」の解説の一部です。
「符号化方式」を含む「GBK」の記事については、「GBK」の概要を参照ください。
- 符号化方式のページへのリンク