ハフマン符号化
【英】Huffman encoding
ハフマン符号化とは、ハフマン(David Huffman)によって1952年に考案された、データ圧縮のために固定長符号を可変長符号に変換する符号化方法のことである。
ハフマン符号化は、一意に復号が可能で、符号長を整数とする条件のもとでは平均符号長が最小となるという特徴を持っている。
ハフマン符号化は、出現頻度が小さい固定符号には長い符号を、出現頻度が高い固定符号には短い符号を割り当てるという発想を元にした技術である。最初に、対象データを走査して文字(固定符号)の出現頻度を取得する。ハフマン木と呼ばれる木を作成し、頻繁に現れる文字は少ないビット数、あまり現れない文字は多くのビット数で符号化していく。
- Huffman encodingのページへのリンク