符号化の原理とは? わかりやすく解説

符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/01/31 04:39 UTC 版)

シャノン・ファノ符号化」の記事における「符号化の原理」の解説

記号出現確率の高い物から低い物の順に並べ替えるそれぞれの集合確率合計できるだけ等しくなるようなところで二分割する。 分割した片方集合に"0"、もう片方集合に"1"を割り当て符号の1目とする。 分割して出来た2つ集合それぞれ更に二分割し、同様に0と1を割り当てる。 この操作を、各集合含まれる記号1つになるまで行うと、それぞれの記号符号得られる。 このアルゴリズムは、かなり効率良い可変長符号生成する分割によって作られ2つの集号は、実際にほぼ等しい出現確率がある。それらを識別するのに用いられる1ビット情報は、最も効率的に使われる残念なことに、シャノン・ファノ符号化は常に最短符号を表すとは限らない。{0.35, 0.17, 0.17, 0.16, 0.15}という出現確率集合からは、シャノン・ファノ符号化では最適化されていない符号生成される。 この理由から、シャノン・ファノ符号化用いられることは少ない。多く場合ハフマン符号、あるいは算術符号Range Coder用いられる

※この「符号化の原理」の解説は、「シャノン・ファノ符号化」の解説の一部です。
「符号化の原理」を含む「シャノン・ファノ符号化」の記事については、「シャノン・ファノ符号化」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/08/09 01:48 UTC 版)

ハフマン符号」の記事における「符号化の原理」の解説

例として DAEBCBACBBBC という12文字からなるメッセージ考える。 このメッセージ中には5種類文字使われているので、もしそれぞれの文字固定長ビット列で表すとすれば、1文字につき最低3ビット必要となる。 文字ビット列の対応表として、 A B C D E 000 001 010 011 100使いそれぞれの文字ビット列に置き換えたとすると、メッセージ全体次のビット列で表されるD A E B C B A C B B B C 011 000 100 001 010 001 000 010 001 001 001 010 12文字 x 3ビット全体ビット数は36ビットとなる。 もし、よく出現する文字には短いビット列を、あまり出現しい文字には長いビット列を割り当てることができればメッセージ全体符号化必要なビット数を抑えることが期待できる。そこで、文字ビット列の対応表として、 A B C D E 110 0 10 1110 1111使ったとすると、メッセージ全体D A E B C B A C B B B C 1110 110 1111 0 10 0 110 10 0 0 0 10 となり、全体ビット数は25ビットとなる。固定長方式比べる70% ほどのデータ量抑えられている。

※この「符号化の原理」の解説は、「ハフマン符号」の解説の一部です。
「符号化の原理」を含む「ハフマン符号」の記事については、「ハフマン符号」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/03 22:32 UTC 版)

LZ77」の記事における「符号化の原理」の解説

データ先頭から順番符号化していく方式である。現在注目している位置から始まる記号列が、それ以前出現していたかを探す。もし出現していたならば、記号列をその出現位置長さポインタ置き換える記号列を探す範囲スライド窓と呼び、これを辞書として使用するので、辞書圧縮法英語版)と呼ばれる。 もともとのLZ77では、記号列を(一致位置一致長、次の不一致記号)という3つの値に置き換えるが、さまざまな亜種存在する中でもLZSSは、単純で性能もよく、いろいろな応用使用されている。

※この「符号化の原理」の解説は、「LZ77」の解説の一部です。
「符号化の原理」を含む「LZ77」の記事については、「LZ77」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2010/05/24 16:16 UTC 版)

BPE」の記事における「符号化の原理」の解説

出現頻度が高い2バイト使われていない1バイト置き換えていくことを繰り返して圧縮する。 ABCDCDABCDCDE 出現頻度の高い CDペア使われていない Z に、次に頻度の高い AB のペアを Y に置き換える YZZYZZE 出現頻度の高い YZZZ でも構わない)のペア使われていない X に置き換える XZXZE 出現頻度の高い XZペア使われていない W に置き換える WWE WWペアはひとつしか出てこないのでここで終わり 実際には、これに符号対応表付加してからファイル出力する。 表・話・編・歴 データ圧縮方法 可逆 理論 情報量 · 複雑性 · 冗長性 · 非可逆 エントロピー符号 シャノン符号 · シャノン・ファノ・イライアス · ハフマン · 適応ハフマン · 算術 · Range · ゴロム · ユニバーサル符号 (ガンマ · 指数ゴロム · フィボナッチ · レーベンシュタイン) 辞書RLE · BPE · Deflate · Lempel–Ziv (LZ77 · LZ78 · LZSS · LZW · LZWL · LZO · LZMA · LZX · LZRW · LZJB · LZT · ROLZ) その他 CTW · BWT · PPM · DMC · Delta 音声 理論 コンパンディング · 畳み込み · ダイナミックレンジ · レイテンシ · 標本化 · 標本化定理 · 音声品質 音声コーデック LPC (LAR · LSP) · WLPC · CELP · ACELP · A-law · μ-law · ADPCM · DPCM · MDCT · フーリエ変換 · 音響心理学 その他 ビットレート (CBR · ABR · VBR) · 音声符号化 · サブバンド符号化 画像 用語 色空間 · ピクセル · クロマサブサンプリング · ブロックノイズ · 解像度 手法 RLE · フラクタル · ウェーブレット · EZW · SPIHT · LP · DCT · チェインコード · KLT その他 テストイメージ · PSNRクオリティ測定 · 量子化 映像 用フレーム · フレームレート · インターレース · フレーム種類 · 映像品質 · 解像度 映像コーデック フレーム間予測 · DCT · 量子化 その他 映像コーデック · レート理論 · ビットレート (CBR · ABR · VBR) 情報理論データ圧縮誤り検出訂正年表 圧縮フォーマット圧縮ソフトウェア参照

※この「符号化の原理」の解説は、「BPE」の解説の一部です。
「符号化の原理」を含む「BPE」の記事については、「BPE」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/09/22 16:48 UTC 版)

アルファ符号」の記事における「符号化の原理」の解説

対象となる整数Xの数-1の0を出力し、1を出力するだけである。 アルファ符号出力(10まで)対象となる数出力1 1 2 01 3 001 4 0001 5 00001 6 000001 7 0000001 8 00000001 9 000000001 10 0000000001

※この「符号化の原理」の解説は、「アルファ符号」の解説の一部です。
「符号化の原理」を含む「アルファ符号」の記事については、「アルファ符号」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/13 20:51 UTC 版)

連長圧縮」の記事における「符号化の原理」の解説

連長圧縮では、ある連続したデータを、そのデータ一つ分と連続した長さ表現することで圧縮している。 例えば、「A A A A A B B B B B B B B B A A A」は「A 5 B 9 A 3」と表せる。これは、Aが5回続きそのあとにBが9回、そしてAが3回続いていることを表している(連続回数を、元のデータを表す符号前に記録することもある。その場合、符号化した後は「5 A 9 B 3 A」と表される)。 さらに、データがこの2種類(AとB)だけで、最初にAが来ることにしておけば、「5 9 3」だけで表せる。このルール従ったときにBが最初に見つかった場合は、最初にAが0回連続していることにすれば良い例えば、「B B B A A A A A B B B B B A A A」は「0 3 5 5 3」で表せることになる。 こういったことから、白と黒以外にほとんど情報がないモノクロファクシミリでよく使われている。 「ファクシミリ#データ圧縮」を参照

※この「符号化の原理」の解説は、「連長圧縮」の解説の一部です。
「符号化の原理」を含む「連長圧縮」の記事については、「連長圧縮」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/07/05 02:35 UTC 版)

Move To Front」の記事における「符号化の原理」の解説

まず初期化として、符号化対象とするデータ列をリスト状に並べる。対象a b a b a c a c a 次に符号化対象とするデータ列から記号1つ読み込む。この読み込んだ記号以前出現していなければそのまま出力する同時に出現した記号テーブル登録する出力:a テーブル:a 一度出力したことのある記号まで1と2を繰り返す出現した記号は常にテーブル先頭登録する出力:a b テーブルb a a一度出力したことがあるので、以前のaがテーブルの何番目に位置するかを、整数出力する。そして、この記号テーブル先頭位置移動する出力a b 2 テーブル:a b データ列のすべての記号符号化するまでこの操作繰り返す出力a b 2 2 テーブルb a 出力a b 2 2 2 テーブル:a b 出力a b 2 2 2 c テーブルc a b 出力a b 2 2 2 c 2 テーブルa c b 出力a b 2 2 2 c 2 2 テーブルc a b 出力a b 2 2 2 c 2 2 2 テーブルa c b このようにMTFを施すとデータ偏るうになる。これを圧縮すると高い圧縮率期待できる

※この「符号化の原理」の解説は、「Move To Front」の解説の一部です。
「符号化の原理」を含む「Move To Front」の記事については、「Move To Front」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/07/26 08:55 UTC 版)

デルタ符号」の記事における「符号化の原理」の解説

対象となる正の整数2進数表現をXとする。まず、Xの桁数ガンマ符号出力する次に最上位ビット除いたXを出力するその結果デルタ符号である。 デルタ符号出力(1〜103135)対象となる数2進数表現桁数ガンマ符号出力ガンマ符号出力(比較)1 1 1 1 1 2 10 010 0100 010 3 11 010 0101 011 4 100 011 01100 00100 5 101 011 01101 00101 6 110 011 01110 00110 7 111 011 01111 00111 8 1000 00100 00100000 0001000 9 1001 00100 00100001 0001001 10 1010 00100 00100010 0001010 ⋮ 31 11111 00101 001011111 000011111 32 100000 00110 0011000000 00000100000 33 100001 00110 0011000001 00000100001 34 100010 00110 0011000010 00000100010 35 100011 00110 0011000011 00000100011 大きな整数効率よく符号化できるようになっているが、小さな値ではガンマ符号のほうが良い性能をみせる。

※この「符号化の原理」の解説は、「デルタ符号」の解説の一部です。
「符号化の原理」を含む「デルタ符号」の記事については、「デルタ符号」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/07/30 06:41 UTC 版)

バイト対符号化」の記事における「符号化の原理」の解説

出現頻度が高い2バイト使われていない1バイト置き換えていくことを繰り返して圧縮する。 ABCDCDABCDCDE 出現頻度の高い CDペア使われていない Z に、次に頻度の高い AB のペアを Y に置き換える YZZYZZE 出現頻度の高い YZZZ でも構わない)のペア使われていない X に置き換える XZXZE 出現頻度の高い XZペア使われていない W に置き換える WWE WWペアはひとつしか出てこないのでここで終わり 実際には、これに符号対応表付加してからファイル出力する。 表 話 編 歴 データ圧縮方式可逆 エントロピー符号 一進法 算術 ゴロム ハフマン適応型(英語版) 正準(英語版) MH Range シャノン シャノン・ファノ シャノン・ファノ・イライアス(英語版タンストール英語版ユニバーサル英語版指数ゴロム(英語版フィボナッチ英語版ガンマ レーベンシュタイン(英語版辞書式(英語版BPE Deflate Lempel-ZivLZ77 LZ78 LZH LZJB(英語版LZMA LZO LZRW(英語版) LZS(英語版LZSS LZW LZWL(英語版LZX LZ4 ROLZ(英語版統計型(英語版) その他 BWT CTW英語版Delta DMC英語版MTF PAQ PPM RLE 音声 理論 ビットレート英語版平均(ABR) 固定(CBR) 可変(VBR) コンパンディング 畳み込み ダイナミックレンジ レイテンシ英語版標本化定理 標本化 音質 音声符号化 サブバンド符号化 変換符号化 知覚符号化 コーデック英語版A-law μ-law ACELP ADPCM CELP DPCM フーリエ変換 LPCLAR LSP MDCT 音響心理学 WLPC 画像 理論 クロマサブサンプリング英語版符号化ツリーユニット(英語版色空間 ブロックノイズ 解像度 マクロブロック英語版ピクセル PSNR 量子化英語版標準テストイメージ(英語版手法 チェインコード(英語版DCT EZW(英語版フラクタル KLT英語版ピラミッド英語版RLE SPIHT(英語版ウェーブレット 映像 理論 ビットレート英語版平均(ABR) 固定(CBR) 可変(VBR) 画面解像度 フレーム フレームレート インターレース 映像品質英語版コーデック英語版重複変換英語版DCT デブロッキングフィルタ英語版フレーム間予測 理論 情報量 複雑性 非可逆 量子化 レート歪み英語版冗長性 情報理論年表英語版圧縮フォーマット 圧縮ソフトウェア

※この「符号化の原理」の解説は、「バイト対符号化」の解説の一部です。
「符号化の原理」を含む「バイト対符号化」の記事については、「バイト対符号化」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/12/18 04:37 UTC 版)

ガンマ符号」の記事における「符号化の原理」の解説

対象となる正の整数2進数表現をXとする。まず、Xの桁数より1つ少ない数だけ「0」出力する次に、Xをそのまま出力するその結果ガンマ符号である。 ガンマ符号出力(10まで)対象となる数2進数表現出力1 1 1 2 10 010 3 11 011 4 100 00100 5 101 00101 6 110 00110 7 111 00111 8 1000 0001000 9 1001 0001001 10 1010 0001010 Xが大きな値(6ビット以上)であればデルタ符号のほうが短い符号語出力することができる。

※この「符号化の原理」の解説は、「ガンマ符号」の解説の一部です。
「符号化の原理」を含む「ガンマ符号」の記事については、「ガンマ符号」の概要を参照ください。


符号化の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2018/07/29 02:32 UTC 版)

Lempel–Ziv–Storer–Szymanski」の記事における「符号化の原理」の解説

LZ77では、記号列を(一致位置一致長、次の不一致記号)という3つの値に置き換えていた。しかし、この方法では一致がなかった場合には(0,0,不一致記号)と一致位置一致長のぶんだけ冗長になってしまう。 そこでLZSSでは、 一致があった場合:1、一致位置一致一致がなかった場合:0、不一致記号 とすることで圧縮率の向上を図っている。つまり、まず最初に一致したかどうか1ビット使う。一致位置は、圧縮しようとしている位置より前の位置で、最も長く一致する部分探索する一致位置一致長、不一致記号固定ビット数で表現するLZSSLZ77とさほど変わらないアルゴリズムであるにもかかわらず大幅な性能向上が期待でき、多く圧縮ソフトウェア用いられている。

※この「符号化の原理」の解説は、「Lempel–Ziv–Storer–Szymanski」の解説の一部です。
「符号化の原理」を含む「Lempel–Ziv–Storer–Szymanski」の記事については、「Lempel–Ziv–Storer–Szymanski」の概要を参照ください。

ウィキペディア小見出し辞書の「符号化の原理」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「符号化の原理」の関連用語

符号化の原理のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



符号化の原理のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのシャノン・ファノ符号化 (改訂履歴)、ハフマン符号 (改訂履歴)、LZ77 (改訂履歴)、BPE (改訂履歴)、アルファ符号 (改訂履歴)、連長圧縮 (改訂履歴)、Move To Front (改訂履歴)、デルタ符号 (改訂履歴)、バイト対符号化 (改訂履歴)、ガンマ符号 (改訂履歴)、Lempel–Ziv–Storer–Szymanski (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS