ダメラウ・レーベンシュタイン距離とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > ダメラウ・レーベンシュタイン距離の意味・解説 

ダメラウ・レーベンシュタイン距離

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/03/26 01:20 UTC 版)

ダメラウ・レーベンシュタイン距離(ダメラウ・レーベンシュタインきょり、: Damerau–Levenshtein distance)は、2つの配列の間の編集距離を測定するために情報理論計算機科学で使われる文字列計量である。2つの単語間のダメラウ・レーベンシュタイン距離は、一方の単語を他方の単語に変換するのに必要な最小の操作回数である。ここで1回の「操作」とは1文字の挿入、削除、置換、あるいは2つの隣り合う文字の交換である。ダメラウ・レーベンシュタイン距離はフレデリック J. ダメラウ英語版ウラジミール I. レーベンシュタインにちなんで名付けられた[1] [2] [3]


  1. ^ Brill, Eric; Moore, Robert C. (2000). “An Improved Error Model for Noisy Channel Spelling Correction”. Proceedings of the 38th Annual Meeting on Association for Computational Linguistics. pp. 286–293. doi:10.3115/1075218.1075255. オリジナルの2012-12-21時点におけるアーカイブ。. https://web.archive.org/web/20121221172057/http://acl.ldc.upenn.edu/P/P00/P00-1037.pdf 
  2. ^ a b Bard, Gregory V. (2007), “Spelling-error tolerant, order-independent pass-phrases via the Damerau–Levenshtein string-edit distance metric”, Proceedings of the Fifth Australasian Symposium on ACSW Frontiers : 2007, Ballarat, Australia, January 30 - February 2, 2007, Conferences in Research and Practice in Information Technology, 68, Darlinghurst, Australia: Australian Computer Society, Inc., pp. 117–124, ISBN 978-1-920682-49-1, http://dl.acm.org/citation.cfm?id=1274531.1274545 .
  3. ^ Li (2006). “Exploring distributional similarity based models for query spelling correction”. Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics. pp. 1025–1032. doi:10.3115/1220175.1220304. オリジナルの2010-04-01時点におけるアーカイブ。. https://web.archive.org/web/20100401081500/http://acl.ldc.upenn.edu/P/P06/P06-1129.pdf 
  4. ^ Levenshtein, Vladimir I. (February 1966), “Binary codes capable of correcting deletions, insertions, and reversals”, Soviet Physics Doklady 10 (8): 707–710 
  5. ^ Damerau, Fred J. (March 1964), “A technique for computer detection and correction of spelling errors”, Communications of the ACM 7 (3): 171–176, doi:10.1145/363958.363994 
  6. ^ The method used in: Majorek, Karolina A.; Dunin-Horkawicz, Stanisław et al. (2013), “The RNase H-like superfamily: new members, comparative structural analysis and evolutionary classification”, Nucleic Acids Research 42 (7): 4160–4179, doi:10.1093/nar/gkt1414, PMC 3985635, PMID 24464998, http://nar.oxfordjournals.org/content/42/7/4160.full 
  7. ^ a b c Boytsov, Leonid (May 2011). “Indexing methods for approximate dictionary searching”. Journal of Experimental Algorithmics 16: 1. doi:10.1145/1963190.1963191. 
  8. ^ a b Oommen, B. J.; Loke, R. K. S. (1997). “Pattern recognition of strings with substitutions, insertions, deletions and generalized transpositions”. Pattern Recognition 30 (5): 789–800. doi:10.1016/S0031-3203(96)00101-X. 
  9. ^ a b c Lowrance, Roy; Wagner, Robert A. (April 1975), “An Extension of the String-to-String Correction Problem”, J ACM 22 (2): 177–183, doi:10.1145/321879.321880 
  10. ^ http://developer.trade.gov/consolidated-screening-list.html


「ダメラウ・レーベンシュタイン距離」の続きの解説一覧

ダメラウ・レーベンシュタイン距離

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/11/25 09:06 UTC 版)

「ダメラウ・レーベンシュタイン距離」の記事における「ダメラウ・レーベンシュタイン距離」の解説

次は、真のダメラウ・レーベンシュタイン距離を求めアルゴリズムである。このアルゴリズムでは、アルファベット含まれる全文字 Σ の個数 | Σ | {\displaystyle |\Sigma |} が必要になる成分が [0, |Σ|) に含まれる配列を使うからである:A:93擬似コードは: algorithm DL-distance is input: strings a[1..length(a)], b[1..length(b)] output: distance, integer da := |Σ|個の整数からなる配列 for i := 1 to |Σ| inclusive do da[i] := 0 let d[−1..length(a), −1..length(b)] // d は次元length(a)+2, length(b)+2 の二次元整数配列 // d の添字は -1 から始まり、a, b, および da添字は 1 から始まることに注意 maxdist := length(a) + length(b) d[−1, −1] := maxdist for i := 0 to length(a) inclusive do d[i, −1] := maxdist d[i, 0] := i for j := 0 to length(b) inclusive do d[−1, j] := maxdist d[0, j] := j for i := 1 to length(a) inclusive do db := 0 for j := 1 to length(b) inclusive do k := da[b[j]] ℓ := db if a[i] = b[j] then cost := 0 db := j else cost := 1 d[i, j] := minimum(d[i−1, j−1] + cost, //置換 d[i, j−1] + 1, //挿入 d[i−1, j ] + 1, //削除 d[k−1, ℓ−1] + (i−k−1) + 1 + (j-ℓ−1)) //交換 da[a[i]] := i return d[length(a), length(b)] 非制限ダメラウ・レーベンシュタイン距離求め正しアルゴリズム作るには次のことに注意する1度交換され文字そのあと2度編集されないよう編集操作最適配列存在する交換コスト W T {\displaystyle W_{T}} が挿入コスト W I {\displaystyle W_{I}} と削除コスト W D {\displaystyle W_{D}} の平均以上つまり 2 W T ≥ W I + W D {\displaystyle 2W_{T}\geq W_{I}+W_{D}} の場合成立する)。したがって1つ部分文字列を2回以上編集する2つ対称方法隣接文字交換して任意の個数文字その間挿入する 文字列削除し、その削除によって新たに隣り合うことになった隣接文字交換するいずれかだけを考えればよい。このアイディア素直に実行するアルゴリズムは、文字列長さ M {\displaystyle M} および N {\displaystyle N} に対して O ( M Nmax ( M , N ) ) {\displaystyle O(MN\cdot \max(M,N))} の計算複雑性を持つ。ローランスとワグナーアイディア使ったアルゴリズムでは、最悪場合でも O ( M N ) {\displaystyle O(MN)} に改善されるBitapアルゴリズムを、隣接交換処理するように変更できる。この例について参考文献情報収集の節を見よ

※この「ダメラウ・レーベンシュタイン距離」の解説は、「ダメラウ・レーベンシュタイン距離」の解説の一部です。
「ダメラウ・レーベンシュタイン距離」を含む「ダメラウ・レーベンシュタイン距離」の記事については、「ダメラウ・レーベンシュタイン距離」の概要を参照ください。

ウィキペディア小見出し辞書の「ダメラウ・レーベンシュタイン距離」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「ダメラウ・レーベンシュタイン距離」の関連用語

ダメラウ・レーベンシュタイン距離のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



ダメラウ・レーベンシュタイン距離のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのダメラウ・レーベンシュタイン距離 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのダメラウ・レーベンシュタイン距離 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS