|
|
XML(eXtensible Markup Language,可扩展标记语言)实际上是Web上表示结构化信息的一种标准文本格式,同HTML一样,都来自SGML(Standard Generalized Markup Language,标准通用标记语言)。
|
|
|
|
|
(1)XML是元标记语言。HTML定义了一套固定的标签,有其特定的含义。XML则允许用户自己定义所需的标签。
|
|
|
(2)XML描述的是结构和语义。XML标签描述的是文档的结构和意义,而不是页面元素的格式。
|
|
|
(3)XML文档的显示使用特有技术支持,如通过样式单为文档增加格式化信息。
|
|
|
|
一个正规的XML文档由3个部分组成,即一个可选的序言、文档的主体和可选的尾声。一个XML文档通常以一个XML声明开始,后面通过XML元素来组织数据。XML元素包括标签和字符数据。
|
|
|
|
|
可以看出,XML文档序言部分从文档的第一行开始,它可以包括XML声明、文档类型声明、处理指令等。文档的主体则是文档根元素所包含的那一部分。XML尾声部分在文档的末尾,它可以包含注释、处理指令或空白等。
|
|
|
|
XML文档本身是一个文本文件,在需要访问文档中的内容时,需要XML解析器进行语法验证和提取内容。两个著名的XML解析器的标准规范分别是W3C标准组织制定的文档对象模型(Document Object Model, DOM)和XML_DEV邮件列表成员定义的简单应用程序接口(Simple APIs for XML, SAX)。
|
|
|
|
|
|
从上图中可以看出,应用程序不是直接对XML文档进行操作,而是首先由XML解析器对XML文档进行分析,然后应用程序通过XML解析器所提供的DOM接口或SAX接口对分析结果进行操作,从而实现对XML文档的访问。
|
|
|
|
在应用程序中,基于DOM的XML解析器将一个XML文档转换成一棵DOM树,应用程序通过DOM树来实现对XML文档数据的操作。DOM API提供给用户的是一种随机访问机制。通过它,应用程序不仅可以在任意时刻访问XML文档中的任何数据,而且可以任意地插入、删除、修改和存储XML文档的内容。
|
|
|