簡潔符号化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/29 13:54 UTC 版)
簡潔データ構造は情報理論で求められる最小の領域のみを消費するデータ構造である。 n {\displaystyle n} 個のノードを持つ異なった二分木の個数は C n {\displaystyle \mathrm {C} _{n}} 、即ち n {\displaystyle n} 番目のカタラン数である(構造が同じ木は同一のものと見なす)。 n {\displaystyle n} が十分大きくなると、これは 4 n {\displaystyle 4^{n}} 程度になる。従って、それらを符号化するには少なくとも log 2 4 n = 2 n {\displaystyle \log _{2}4^{n}=2n} bit 程度が必要となる。よって、簡潔二分木はノードあたり 2bit だけを消費するものでなければならない。 この条件を満たす簡単な表現法は、行きがけ順にノードを舐め、内部ノードなら1、葉なら0を出力する方法である(ここで「葉」はデータを含まないものを指す)。木にデータが含まれるなら(例えば前記のPascalの例で、dataフィールドの中身が空でないなら)、それらを次々に配列の中に格納していけばいい。 次のような関数を用いる: function EncodeSuccinct(node n, bitstring structure, array data) { if (n = nil) then structure の最後に 0 を追加する else structure の最後に 1 を追加する data の最後に n.data を追加する EncodeSuccinct(n.left, structure, data) EncodeSuccinct(n.right, structure, data)} string型データ structure は最終的に 2 n + 1 {\displaystyle 2n+1} bit になるにすぎない。ここで n {\displaystyle n} は内部ノードの数である。structure型データの長さすら記録する必要がない。次の関数を実行すれば、情報が全く失われていないことがわかるだろう。これはstring型データから二分木を再構築する: function DecodeSuccinct(bitstring structure, array data) { structure の最初のビットを取り除き、そのビットを b に入れる if ( b = 1 ) then 新しいノード n を作る dataの最初の要素を取り除き、その要素を n.data に入れる n.left = DecodeSuccinct(structure, data) n.right = DecodeSuccinct(structure, data) n を返す else nil を返す} 更に洗練された簡潔表現を用いると、木構造をより小さく表現できるだけでなく、簡潔さを保ったまま、より便利な操作もできるようになる。
※この「簡潔符号化」の解説は、「二分木」の解説の一部です。
「簡潔符号化」を含む「二分木」の記事については、「二分木」の概要を参照ください。
- 簡潔符号化のページへのリンク