カノン化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/11 02:59 UTC 版)
あらゆる種類のホモグリフは、「二重カノン化」(dual canonicalization)と呼ばれるプロセスによって検出することができる。このプロセスの最初のステップは、ホモグリフの集合、すなわち、同じように見える文字を識別することである。ここから、ホモグリフの集合を表現するための単一のトークンが指定される。このトークンをカノン(canon)と呼ぶ。次のステップでは、カノン化と呼ばれるプロセスで、テキストの各文字を対応するカノンに変換する。2つのテキストのカノンが同じでも、元のテキストが異なる場合、テキストにはホモグリフが存在する。
※この「カノン化」の解説は、「ホモグリフ」の解説の一部です。
「カノン化」を含む「ホモグリフ」の記事については、「ホモグリフ」の概要を参照ください。
- カノン化のページへのリンク