Unicodeにおけるホモグリフ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/11 02:59 UTC 版)
「ホモグリフ」の記事における「Unicodeにおけるホモグリフ」の解説
Unicodeの文字セットには、多くのホモグリフが含まれている。これらは、様々な状況においてセキュリティ上のリスクをもたらすが、最近では国際化ドメイン名(IDN)に関して特に注意が払われている。ある文字をそのホモグリフに置き換えることでドメイン名を意図的に詐称し、本来のドメイン名と容易に区別できない別のドメイン名を作成して、フィッシングに悪用される可能性がある(ホモグラフ攻撃を参照)。多くのフォントでは、ギリシャ文字の"Α"・キリル文字の"А"・ラテン文字の"A"、および、ラテン文字の"a"・キリル文字の"а"は視覚的に同じである(ラテン文字の"aBeHKopcTxy"とキリル文字の"аВеНКТорсху"にも同じことが言える)。ドメイン名は、別に登録された名前の中で、これらの文字のいずれかを別の文字に置き換えるだけで、なりすましが可能である。また、"i"と"í"(アキュートアクセントつき)、"É"(アキュート)と"Ė"(ドット)と"È"(グラーブ)、"Í"(アキュートつきの大文字のアイ)と"ĺ"(アキュートつきの小文字のエル)など、同じ用字の中でもホモグリフが多数存在する。このセキュリティ上の問題を議論する際には、類似した文字が2つ並んでいても、「ホモグリフのペア」(homoglyph pair)とみなされる可能性があるか、あるいは明らかに単語であるように見える場合には「擬似ホモグラフ」(pseudo-homograph)とみなされる可能性があるという観点から評価することができる(この用語自体が他の文脈で混乱を招く可能性があることに注意)。中国語では、多くの簡体字は対応する繁体字のホモグリフである。 ホモグリフの混同のリスクを最小限に抑えるために、ドメイン名のレジストリやウェブブラウザの設計における努力が行われている。一般的に、これは複数の言語の文字セットを混ぜた名前を禁止することで達成されている(これにより、キリル文字のЯを使った"toys-Я-us.org"は無効になっているが、"wikipedia.org"とは別の"wíkipedia.org"(2文字目のアイがアキュートつき。ポルトガル語版アンサイクロペディアに転送される)は、同じ用字であることから無効になっていない)。カナダの.caのレジストリはさらに一歩進んだ形で、ダイアクリティカルマークが異なるだけのドメイン名は、同じ所有者が同じレジストラに登録することが義務づけられている。漢字における簡体字と繁体字の扱いは様々である。.orgと.infoでは、片方を登録するともう片方は誰も利用できなくなるが、.bizでは簡体字と繁体字の2種類のドメインがドメインバンドルとして扱われ、両方とも同じDNSサーバを指すようになっている。 関連するドキュメントは、開発者のウェブサイトやICANNが提供するIDNフォーラムに掲載されている。
※この「Unicodeにおけるホモグリフ」の解説は、「ホモグリフ」の解説の一部です。
「Unicodeにおけるホモグリフ」を含む「ホモグリフ」の記事については、「ホモグリフ」の概要を参照ください。
- Unicodeにおけるホモグリフのページへのリンク