XML, XML情報集合とSXML
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/10/03 01:23 UTC 版)
「SXML」の記事における「XML, XML情報集合とSXML」の解説
XML文書は、本質的に、ツリー構造である。ルート要素(英語版)の開始と終了タグは、文書の全ての内容を囲っていて、各内容は他の要素や任意の文字データを含む。角ブラケットの文字列は、XML文書の外部表現である。アプリケーションは、内部の形式で扱う: XML Information Set、もしくは、特別なものとして(例えば、DOM)として扱うべきである。この内部形式を持ちいると、アプリケーションは、特別なデータ、もしくは、XMLツリーを別のツリーに変換したデータと位置づける事になる。 W3 Consortiumは、XML情報集合を抽象データセットとして定義した。情報集合は、整形式XML文書で利用可能な情報を記述する。 XML文書の情報集合は、多くの「情報項目 (information item)」から構成され、情報項目が表すのは、要素、属性、文字情報、処理命令、と、その他の文書の項目である。各情報項目は、多くの関連付けられた属性を持つ。例えば、名前、名前空間URIである。いくつかの属性 -- 例えば、子要素と属性 -- は、他の情報項目のコレクション(英語版)である。しかし、技術的には、情報集合はXMLに特化したものであり、他の半構造化データ(英語版)の書式、特にHTMLに大部分が適用される。 XML文書の構文解析は、XML情報集合のインスタンスを生成する一つの方法でしかない。 注意すべき事に、XML情報集合の勧告は、包括的なものをもたらすのではなく、最低限の情報と属性のセットを構築することである。勧告の目的は、一貫性のある定義のセットを提供し、整形式のXML文書の中の情報を参照するのに必要な他の仕様でも使えるようにすることである。 XML情報集合勧告で定義される抽象データモデルは、W3コンソーシアムの全てのXML関連の仕様に適用可能である。すなわち、ドキュメント・オブジェクト・モデルは、情報項目を扱うためのAPIと解釈できる; XPath data model(英語版)は、情報項目から派生するノードの概念を利用している、等。DOMとXPathデータモデルは、それゆえ、2つのXML情報集合のインスタンスである。 XML情報集合勧告は、それ自体ではデータ構造や、情報項目へのアクセスのインタフェース (情報技術)に制限を設けていない。それゆえ、XML情報集合から抽象データモデルへの別の変換方法が可能である。例えば、XML情報集合を、ツリー構造と解釈し、"情報集合"と"情報項目"は、それぞれ一般的な用語である、"ツリー" と "ノード(英語版)"と同じであると解釈するのは、役に立つ。 情報項目は、項目自身の属性のコンテナと解釈でき、そして、テキストの文字列(例えば、名前、名前空間URI)や、項目自身(例えば、XMLの子要素)も同様であるかもしれない。 情報集合は、それゆえ、ネストしたコンテナの階層である。このようなコンテナの階層、つまりテキストの文字列と他のコンテナから構成されるコンテナの階層は、一般的にS式によって記述できる。なぜなら、S式は、リストのメンバーはアトムの値かS式自身であると、再帰的に定義されるからである。S式は、簡単に、トラバースに適した内部表現にパースできる; S式には、簡潔な外部表記法があり、S式は、比較的容易に、手作業ででも、構築する事ができる。 SXMLは、XML情報集合の、S式による完全なインスタンスである。情報集合のゴールは、全ての関連するデータの書式と、データの抽象化、データ同士の関連のコンテナ・スロットを提示することである。SXMLは、S式で完全に具象化した、ネストしたコンテナを与え、情報項目と属性へのアクセス手段を供給する。SXMLは、XPathとDOM(これらは、XML情報集合の2つの別のデータモデルでもある)の親戚である。SXMLは、とりわけSchemeベースの XML/HTMLの記述、XPathクエリ、ツリーの変換に向いている。 XMLとSXMLは、それゆえに、XML情報集合についての、2つの文法的に異なった表現と考える事ができる。
※この「XML, XML情報集合とSXML」の解説は、「SXML」の解説の一部です。
「XML, XML情報集合とSXML」を含む「SXML」の記事については、「SXML」の概要を参照ください。
- XML, XML情報集合とSXMLのページへのリンク