意味マークアップ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/08 01:17 UTC 版)
「マークアップ言語」の記事における「意味マークアップ」の解説
手続きマークアップは特定の視覚表現を実現する処理上の命令を付与するものであるが、意味マークアップはテキストの断片に印を付けていくものである。例えば、ウェブサイトの更新情報を記述するための Atom という言語には updated タイムスタンプを印すマークアップがあり、情報項目が最後にいつ更新されたのかを発行者が表明するのに使われる。Atom の規格では updated の意味するものについて論じており、そのマークアップ形式についても規定されているが、それがユーザに対してどのように表示されるのか、またそもそも表示されるべきなのかについては何の規定もない。このマークアップは処理系ごとに様々な用途に使われ、その中には Atom 言語の設計者たちが予想もしなかったものが多く含まれるだろう。SGMLとXMLは意味マークアップ言語の設計を支援するために設計された仕様(メタ言語)である。 以上は概念的な分類であって、実際にはどのシステムでも別種のマークアップが共存している。例えばHTMLでは、純粋な手続きマークアップ(ボールドのための B など)と純粋な意味マークアップ(BLOCKQUOTE や href 属性など)が共存している。HTMLにはさらに PRE 要素があり、視覚マークアップの領域を囲んで、テキストをタイプしたとおりに表示させることもできる。 マークアップ要素とその使用に関する規則は通例、特定の企業やコミュニティごとの様々な種類の文書に対応するため、標準化団体によって開発される。最初期の例としては CALS があり、アメリカ軍で技術マニュアルに利用されていた。すぐに大規模文書を管理する必要のある企業がこれに続きだし、航空機、電気通信、自動車、コンピュータハードウェアのマニュアル用のタグ群が開発された。これはこの種のマニュアルの多くが電子的に配布されるきっかけとなり、企業は1つの(意味マークアップによる)オリジナルから印刷物、オンライン、CD版などを作り出すことができた。特筆すべき例は、サン・マイクロシステムズであり、ジョン・ボサック(英語版)がSGMLを複数媒体向けの文書配布に採用し、大幅なコスト削減を達成したことである。 現在では多くのマークアップ言語が存在する。よく知られたものでも DocBook・MathML・SVG・Open eBook・TEI・XBRLなどがある。多くはテキストのためのものだが、その他の用途で使われる専門化された言語もある。 汎用マークアップとは意味マークアップの別名である。現在のほとんどの意味マークアップシステムは文書を木構造に構造化する。また同時に、文書の一部分を文書内の他の箇所から参照する(クロス・リファレンス)手段を提供している。構造化によって、ソフトウェアが文書構造を(BLOBではないものとして)把握することができ、文書はデータベースとして扱うことが可能になる。関係データベースが持っているような厳格なスキーマを持たないので、「半構造化データベース」と呼ばれる。 2000年を過ぎたころから、木構造以外の文書構造に関する大きな関心が現れてきた。例えば、古代の宗教文学では文献構造(本・章・節・文)以外にも、修辞構造や散文構造が広く用いられる(ストーリー・引用章句・段落など)。これらの文書単位は文中でたびたび交差するので、簡単には木構造のマークアップシステムでデータ化することはできない。このような構造をサポートする文書モデリングシステムにはMECS、TEI Guidelines の一部やLMNL・CLIXなどがある。 意味マークアップの第一の長所はその自由度だとみなされている。テキストの断片が「どのように表示されるべきか」ではなく「何であるか」と印されていたなら、その言語の設計者が予想もしていなかった便利な用途でその断片を処理する処理系が作られるかもしれない。例を挙げると、HTMLのハイパーリンクは、元々、リンクをたどる人の手で利用されるために設計されたが、検索エンジンによって、インデックスするべき新しいリソースを発見するため、またウェブ上のリソースの人気を測るためにも利用されている。 意味マークアップはまた、文書の視覚表現の変更を効率化する。例えば、イタリック(斜体)の表現を「強調」あるいは「外国語」の意図を示すために使うとする。両方とも単に表示方法の命令でイタリックとマークアップすると、両者の意図の違いが記録されず、区別が困難になる。後に外国語をイタリックにしない視覚表現に変更しようとすると、全てのイタリック部分をひとつずつ人間が判断して選り分ける作業が必要になる。しかし意味マークアップでは両者を区別してマークアップするので、視覚表現の変更が容易になる。
※この「意味マークアップ」の解説は、「マークアップ言語」の解説の一部です。
「意味マークアップ」を含む「マークアップ言語」の記事については、「マークアップ言語」の概要を参照ください。
- 意味マークアップのページへのリンク