文字の除去に対応した検索とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 文字の除去に対応した検索の意味・解説 

文字の除去に対応した検索

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/09/12 03:39 UTC 版)

Bitapアルゴリズム」の記事における「文字の除去に対応した検索」の解説

この図は、文字除去のみに対応したshift-and型Bitapアルゴリズムにおいて、state新しい値 state' に更新する時のデータフローである。 state[0] は完全一致マッチングなので、#アルゴリズムの表と変わりは無い。一方state[1] では、まず state[0] と同じ処理を行いその後 state[0] の更新後の値を1ビットシフトして1をORした値をORしている。これは、n文字目まで完全一致進行した場合、n文字目までをn + 1文字最後の1文字除去されたものとみなし、n + 1文字目まで一致認める処理と言える。これにより、次に現れ文字パターンのn + 2文字目と一致する文字だった場合も、アルゴリズムの表と同じ処理で一致判定される除去2文字目が現れ場合state[0](更新後)のn文字目のビットはすでに0になっているので state[1] のn + 1文字目のビットは1にならない。つまり、state[1] は1文字除去まで許容した検索となる。 文字の挿入置換の時と同様にstate[2] では同様の処理を state[1] を参照して行い、これは2文字除去まで許容した検索となる。以下、state[3], state[4], ... を実装することで、許容する除去文字数増やした検索可能になる。#実装例コードハイライト部分をこのフローに従って修正すると以下のようになる。 # 実際にtext照合させる distance = 2 # 許容する除去文字数 state = Array.new(distance + 1) {|i| (1 << i) - 1} # 状態遷移保持 ret = Array.new # マッチし位置をまとめるための配列 text.chars.each_with_index do |tc, i| rstr_mask = 0 # ビットを1にする位置を示すマスク state.each_index do |j| state[j] = (state[j] << 1 | 1) & mask[tc] state[j] |= rstr_mask next_rstr = state[j] << 1 | 1 # state[j + 1]のビットを1にする位置 rstr_mask = next_rstr end if (state[distance] & finish) == finish # 最上位ビットが1である ret.push(i) # マッチし位置iを配列追加 end end state初期値完全一致挿入置換場合とは異なっている。これは、検索対象文字列先頭にすでに除去され文字がある場合対応したのであるstate[n] なら先頭n文字以内除去可能性考慮して初期値下位nビット分を1にしておく。これによって、例えパターン "acbaca" に対して検索対象文字列 "cbacaccc" なら、state[1], state[2], ... では対象文字列先頭で "a" が除去されていると判定しパターンとのマッチ検出される

※この「文字の除去に対応した検索」の解説は、「Bitapアルゴリズム」の解説の一部です。
「文字の除去に対応した検索」を含む「Bitapアルゴリズム」の記事については、「Bitapアルゴリズム」の概要を参照ください。

ウィキペディア小見出し辞書の「文字の除去に対応した検索」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「文字の除去に対応した検索」の関連用語

文字の除去に対応した検索のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



文字の除去に対応した検索のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのBitapアルゴリズム (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS