ブロックソートとは? わかりやすく解説

Weblio 辞書 > 同じ種類の言葉 > 情報 > コンピュータ > ソート > ブロックソートの意味・解説 

ブロックソート

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/02/20 07:45 UTC 版)

ブロックソートブロックソーティングBurrows-Wheeler変換 (Burrows-Wheeler Transform; BWT) は、1994年にマイケル・バローズ (Michael Burrows) とデビッド・ホイーラー (David Wheeler) が開発した可逆変換の方式で、データ圧縮の前処理に応用される。

ブロックソート自体はデータの大きさを変えない。しかし、データを整列することでデータ中に出現するパターンを、いくつかのよく知られている手法で圧縮し易いものにできる。後処理としてMove To Front (MTF)・連長圧縮 (RLE)・エントロピー符号と組み合わせて、データを圧縮する。

実装はbzip2等。

Python言語による実装例が文献[1]に出ている。

原理

長さ nデータを巡回シフトし、得られるすべての文字列を辞書順ソートする。このようにしてできた n×n 行列の第 n 列を取り出したものが、BWT系列である。このBWT系列と、元の文字列がソートされた時行列の第何番目になったかを記憶しておくと、これから元の文字列を復号する事ができる。

符号化の手順

元の文字列:

cacao

生成された巡回行列:

A B C D E
1 c a c a o
2 o c a c a
3 a o c a c
4 c a o c a
5 a c a o c


辞書式順序で行同士を比較して、昇順となるように行を並べ替えて得られた行列


ブロックソート

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/08/19 15:57 UTC 版)

接尾辞配列」の記事における「ブロックソート」の解説

接尾辞配列のソートアルゴリズムを利用して ブロックソート (Burrows-Wheeler 変換, BWT) を行うこともできる技術的に、ブロックソートには接尾辞ではなく巡回シフトし文字列辞書順ソート要求されるこのためすべての文字列番人としての文字"$"などを加えて巡回シフトを行うことで、接尾辞配列同等結果得られる

※この「ブロックソート」の解説は、「接尾辞配列」の解説の一部です。
「ブロックソート」を含む「接尾辞配列」の記事については、「接尾辞配列」の概要を参照ください。

ウィキペディア小見出し辞書の「ブロックソート」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



ブロックソートと同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「ブロックソート」の関連用語

ブロックソートのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



ブロックソートのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのブロックソート (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの接尾辞配列 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS