文档库 最新最全的文档下载
当前位置:文档库 › XML与关系数据库之间的转换

XML与关系数据库之间的转换

XML与关系数据库之间的转换
XML与关系数据库之间的转换

摘要:

随着XML数据的日益增多,XML已经成为了互联网上数据表示和数据交换的标准格式。同时也涌现出大量的XML数据存储方法,比较有代表性的有XML专用数据库存储、面向对象数据库存储、关系数据库存储等。由于关系数据库的大力发展、广泛应用和其成熟的技术,在存储管理XML的各种可能的方式中,基于关系数据库的XML数据存储成为一种可行而有前景的方式,受到了广泛的关注。

由于关系数据库的二维平面关系表结构与XML的层次结构有很大差异,怎样在关系数据库中有效地存储XML文档,同时又能保持其结构信息和文档信息成为一个难题。为了解决这一难题,使得XML模式与关系模式之间的映射问题,成为XML 文档的关系化存储技术的核心问题。

本文主要探讨了XML与数据库映射的方法。

目录

第一章前言 (1)

第二章XML技术 (3)

.2.1XML的特点 (3)

.2.2XML的应用分析 (4)

2.3.1DTD (5)

2.3.2XML Schema (6)

2.4XML解析技术 (7)

2.4.1 SAX (8)

2.4.2.DOM (8)

2.4.3.DOM与SAX比较 (9)

第三章XML与数据库技术 (10)

3.1 XML是数据库吗? (10)

3.2 数据和文档的对比 (10)

3.2.1 以数据为中心的文件 (11)

3.2.2 以文档为中心的文件 (11)

3.2.3 数据、文档和数据库 (11)

第四章XML与关系数据库的转换 (13)

4.1边模型映射法 (13)

4.2结点模型映射法 (16)

第五章结束语 (19)

第六章致谢 (20)

第一章前言

近年来,互联网得到了迅猛发展,它提供了全球范围的网络互联与通信功能,其丰富的信息资源给人们的学习和生活带来了极大的便利。作为互联网最主要应用的Web实际上已成为最大的信息资源库。电子商务、电子出版、远程教育等基于Web 的新兴领域的全面兴起使得传统的Web资源更加复杂化和多样化。人们对Web服务功能的需求也达到更高的标准,如用户需要对Web进行智能化的语义搜索和对数据按照不同的需求进行多样化显示等个性化服务;公司和企业要为客户创建和分发大量有价值的文档信息,以及对不同平台、不同格式的数据源进行有效的数据交换和集成等等。在这种大环境下,以简单易学、灵活通用著称的HTML,随着网络应用的日益广泛,局限性逐渐明显,越来越不能适应作为Intemet上信息交换和表示的工具了。

XML(eXtensible Markup Language)作为SGML(Standard Generalized MarkupLanguage)的一个优化子集,它不像HTML那样事先定义好一组标签,而是提供了一个标准,只要遵循这个标准,你可以灵活的定义自己的标记。XML不仅能够存储数据,而且能够存储结构和语义信息,具有通用的数据表示能力,能表示结构化、半结构化及元结构化数据,可以描述不同种类应用软件中的数据,这使其在数据交互和信息共享方面拥有天然的优势,成为Web上数据表示与交换的通用标准。

XML与HTML相比主要有以下几点优势:

(1)XML简单,具有自我描述能力。通过语义标记来说明数据的语义,容易理解且易于解析。这使得XML具有机器可读性,具体应用可以按照各种方式解析、过滤及重构XML文档。

(2)XML具有灵活性。HTML的标记是预定义的,具有固定的名称及语义,不能扩展,而XML的标记可由用户定义,可以被任意的扩展。XML的嵌套结构可以表示各种复杂的数据结构,各种格式的数据都可以较容易的转换为XML数据,这使得XML非常适合于Web信息的发布和集成。

(3)XML具有平台独立性。XML可用于不同类型、系统间的交换格式的传送,从而简化了从一个应用程序到另一个应用程序之间传递信息的工作。

(4)XML实现了结构、内容和显示相分离。文档类型定义(DTD)或XML模式(XMLschema)描述了XML文档的结构,即元素间的嵌套关系。XML文档实例只描述数据,使得数据具有独立性,而XML文档的显示具有多样性,XML文档的显示是由XML文档配合XSL(eXtensible Style Language)来完成的,对同一个XML文档可以

根据应用的需要以不同的风格显示。由于XML的诸多优势,出现大量的XML数据,并且保持着快速增长,使得对XML有效存储和操作方面的研究日益受到重视。同时由于关系数据库技术的大力发展、成熟的技术和广泛的应用,使得XML文档的关系化存储成为研究的一大热点。

本文所研究的就是XML与关系数据库之间的转换方法。

第二章XML技术

XML(eXtensible Markup Language,可扩展标记语言)是由W3C[”】于1998年2月发布的一种标准,是SGML的一个简化集。它继承了SGML的强大功能,去除了繁琐的定义,弥补了HTML作为网络标准语言的不足。它将SGML的丰富功能和HTML的易用性结合到了万维网的应用中,深受软件开发商的支持和程序开发人员的厚爱。目前XML在很多方面都有应用,具有如下特点:

·2.1XML的特点

XML作为一种标记语言,具有严格、规范的语法,创建XML文档必须满足一定的规范,依据XML 1.0规格,所有的XML文档都必须是格式良好的(well.formed),一个格式正确的XML文档必须符合以下几点要求:

(1)声明语句。XML声明必须以小写xml声明,并设置version属性,必须出现在第一行,其格式如下:,声明的作用是告诉浏览器或者其它处理程序:这个文档是XML文档。声明语句中的version表示文档遵守的XML规范的版本;standalone表示文档是否附带DTD文件,如果有,参数为no;encoding表示文档所用的语言编码,默认是UTF.8。

(2)元素。元素组成了XML文档中的大部分内容,XML文档有且只有一个根元素,所有元素(Elemem)构成一个层次树,元素之间必须正确嵌套。元素由一对标记组成,结束标记匹配相应的起始标记。格式为:<标记名>内容叫标记名>。

(3)属性。元素可以用属性来注释,属性通常用来给元素提供所显示内容的额外信息,出现位置为元素的起始标记中,对于一个元素来说,不能存在多个相同名称的属性,元素大小写敏感。格式为:属性名=属性值。

(4)处理指令。处理指令通常用来为处理XML文档的应用程序提供信息,这些信息包括如何处理文档,如何显示文档等。处理指令的出现位置可以为元素的后裔,也可以为根元素的前面或者后面。格式为:

(5)注释。XML注释出现位置可以为元素的后裔,也可以为根元素的前面或者后面。格式为:

(6)命名空间。XML允许设计者定义自己的标记名,命名空间的出现解决了重名的情况。格式为:xmlns:prefix=’URI’。

下图给出了一个良构的XML文档例子,如下:

图表 1

·2.2XML的应用分析

作为互联网的新技术,XML的应用非常广泛,渗透到了互联网的各个角落。借用Gartner公司的报告中的一句话:“商业公司不能再做局外人了,不能对XML置之不理’’。可见,XdvlL的重要性,以下是XML的主要应用场合:

(1)数据交换。电子商务通过互联网传输和交换商务数据,并对商务数据进行人工或自动处理,这也是XML的主要应用领域之一。XML的可扩展性和自相容性等特点,使之成为数据交换的有力工具。

(2)内容管理。XML只用元素和属性来描述数据,而不提供数据的显示方法,它提供了一个独立于平台和语言的内容,使用象XSLT这样的语言能够轻易地将XML 文件转换成各种格式文件,比如HTML,WML,PDF,flat file,EDI,等等。

(3)WEB集成。现在有越来越多的设备也支持XML了,为了利用互联网技术和标准为移动设备连接互联网建立全球性的同一规范,Phone.com联合了Motorola等通讯公司建立了WAP论坛,推出了WAP规范,同时W3C也定义了基于XML的手持设备置标语言HDML。

(4)配置管理。许多应用都将配制数据存储在各种文件里,将配制数据标记为XML

格式,能使其更具可读性,并能方便地集成到应用系统中去。使用XML配制文件的应用程序能够方便地处理所需数据,不用象其他应用那样要经过重新编译才能修改和维护应用系统。

·2.3XML模式语言

XML模式语言负责定义和描述XML文档的结构和内容模式。它可以定义XML 文档中存在哪些元素和元素之间的关系,并且可以定义元素和属性的数据类型。XML 模式语言主要有两种:DTD和XML Schema,现分别介绍如下:

2.3.1DTD

DTD是Document Type Definition(文档类型定义)的简称。它是一套关于标记的语法规则,详细描述一组XML文档的结构。DTD列出了可用在文档中的元素、属性、实体和符号表示法,说明在文档中可以使用哪些标一记,哪些标记可以出现在其它标记中,哪些标记具有属性,使用的标记应按什么顺序出现等。例如,图表2是一个XMLDTD的例子,图表1中的XML文档就是符合这

个DTD的描述的:

图表 2

在DTD文档中,可以利用操作符号(0次或多次)、+(至少1次)、?(0次或1次)、l(或选)来定义子元素的出现次数。其中ELEMENT表示元素,ATTLIST表示属性,#PCDATA表示数据,DTD假设所有取值都只能是字符串值。

XML文档中DTD的使用方法分两种:内部DTD,即在XML文档的序言部分中直接加入DTD的描述;外部DTD,即DTD可作为一个完全独立的文件,将DTD存储在一个后缀为.dtd的文件中,在XML文件中调用它。可以看出,内部DTD相当繁琐,通用性低,而同一个外部DTD文件,可以被多个XML文档引用;外部DTD 文件的可移植性很好,当需要修改的时候,只修改外部DTD文件,而不需逐一修改

使用了该DTD的所有XML文档。使用了DTD的XML文档必须符合该模板的要求,在分析阶段必须通过DTD的有效性验证。

随着XML技术的广泛使用,DTD逐渐暴露了自身存在的不足:

(1)DTD是基于正则表达式的,描述能力有限;

(2)DTD没有数据类型的支持,在大多数应用环境下能力不足;

(3)DTD的约束定义能力不足,无法对XML实例文档做出更细致的语义限制:

(4)DTD的结构不够结构化,重用的代价相对较高;

(5)DTD并非使用XML作为描述手段,而DTD的构建和访问并没有标准的编程接口,无法使

用标准的编程方式进行DTD维护。

2.3.2XML Schema

同DTD一样,Schema也是一种XML文档模式定义语言。但与DTD不同的是,Schema克服了DTD的几个局限,XML Schema与DTD相比,有如下几个优点:

(1)XML Schema使用标准XML语法,本身就是一个XML文档,可以直接用成

熟的XML文档解析器读取;

(2)XML提供了丰富的数据类型,包括数字型、布尔型、日期型等等,并且可

以定义新的数据类型,允许对数据进行更严格的合法性检查;

(3)XML Schema支持继承性,即可利用一个已有的XML Schema产生一个新

的)(ML Schema;

(4)XML支持命名空间,保证了标记的唯一性;

XML Schema的扩展性好,它的内容模型是开放的,可以随意扩充、更新等。

下面是一个XML Schema的例子,一般,这样的模式文件保存在一个后缀为xsd 的文件中,与图表2中dtd是等价模式,同样可以描述图表1的XML文档。

图表 3

2.4XML解析技术

XML文档实际上就是纯文本数据,使用XML数据格式的应用程序首先必须能对XML数据进行读取、分析,进而进行处理。SAX(SimpleAPIs forXML)与

DOM(Document Object Model)是两种常用的XML应用程序接口标准。它们在应用程序开发过程的作用如下图:

图表 4

下面分别给予详细的介绍。

2.4.1 SAX

SAX(The Simple API for XML)即简单编程接口,第一个被广泛采用的用Java编写的XMLAPI,是一个事实上的标准【181。SAX是一个通用的,基于事件的XML 解析的标准编程接口。SAX是事件驱动的“推”模型,是一种基于回调(callback)机制的程序运行方法,即它不需要一次读入整个文档,是边读文档边对文档进行解析,文档的读入过程就是SAX的解析过程。从这一点来说,SAX是一种轻量型的解析方法。

图表 5

2.4.2.DOM

DOM(Document Object Model)即文档对象模型,一个来自W3C的成熟标准。DOM将XML文档看作是一个分层的对象模型,是一棵节点树,称为DOM树。在DOM树中,有一个根节点,即根元素,其它节点都是这个根节点的后代节点,节点用来表示XML文档中的元素,属性、文本、注释、处理指令以及类似的信息。

DOM是文档驱动的,即它一次把整个XML文档读入内存,然后向应用程序提供对整个文档可操作的DOM树,可以通过这棵树来访问所需信息。DOM解析器需要一次把XML文档读入内存,从这一点来讲j它是一种重量型的解析方法。

图表 6

2.4.3.DOM与SAX比较

SAX和DOM是两类不同的XML文档解析方法,两种技术各有利弊。主要

区别在于:

应用程序的目的:如果必须对数据进行更改,并且作为XML将它输出,则在大多数情况下,使用DOM。与使用XSL转换来完成的简单结构更改不一样,如果是对数据本身进行更改,则尤其应该使用DOM。

(1)数据的数量:对于大文件,SAX是更好的选择。

(2)将如何使用数据:如果实际上只使用一小部分数据,则使用SAX将数据抽

取到应用程序中,这种方法更好些。另一方面,如果知道将需要向后引用已

经处理过的信息,则SAX可能不是正确的选择。

(3)需要速度:通常SAX实现比DOM实现快。

(4)值得说明的是,SAX和DOM并不是互斥的,这一点很重要。可以使用DOM

来创建事件的SAX流,可以使用SAX来创建DOM树。事实上,大多数解

析器常常使用SAX来创建DOM树。

第三章XML与数据库技术

3.1 XML是数据库吗?

"XML是数据库吗?"在严格意义上将,如果"XML"是指XML文档时,答案是"否"。尽管XML文档包含了数据,但是如果没有其他的软件来处理这些数据,它对于数据库的意义和其他文本文件没有什么区别。

如果在更为宽泛一些的意义上将,当"XML是指XML文档以及所有相关的XML 的工具和技术时,答案则是"是"。之所以肯定是由于XML提供了许多数据库中所需要的部分:存储(XML文档),结构(DTD, XML schema语言),查询语言(XQL, XML-QL, QUILT等), 编程接口(SAX, DOM),等等。不过...XML还缺少很多在真实的数据库中所必备的内容: 有效的存储、索引、安全、交易、数据完备性、多用户访问、触发、多文档查询等。

因此如果在数据量一般、用户较少、性能要求不高的环境下可以把XML当作数据库来使用;而在大多产品的环境中,要求有许多的用户使用、需要严格的数据完整性并且对性能有很高的要求,XML就不能胜任了。而且,考虑到象dBase和Access 等数据库既便宜又十分易用,因此甚至在第一种情况下XML都很少有理由充当数据库的角色。

3.2 数据和文档的对比

在选择数据库时,最重要的判断因素可能是你是利用数据库来保存数据还是保存文档。如果你想保存数据,你需要的数据库主要是面向数据存储(例如关系型数据库或者面向对象型数据库)以及在数据库和XML文档之间相互转换。从另一个角度来将,如果你想存储文档,你需要一个专门设计用来存储文件的内容管理系统。

虽然你可以自己把文件保存在关系数据库或面向对象数据库中,可是你常会发现你的工作是在重复内容管理系统的功能。类似的,虽然一个内容管理系统通常是建立在面向对象数据库或关系数据库之上,但要是把一个内容管理系统当做数据库来使用就可能非常的令人困绕。

你需要存储数据还是文档,答案常常取决于你的XML文档。原因是XML文件分为两大类:以数据为中心和以文档为中心

3.2.1 以数据为中心的文件

以数据为中心的文件的特点是结构相当规范、数据颗粒度好(也就是说,数据中最小的独立单元是PCDATA元素或者是属性)、很少或者没有混合内容。其中同层次元素和PCDATA的出现顺序并不重要。典型的例子是,XML文档包含了销售定单、飞行安排、餐馆菜单等等。数据为中心的文档常被用于机器的使用,这时XML可能是多余的---它仅仅是数据传输的手段而已。

在XML的世界中,许多内容丰富的文档实际上都是数据为中心的。我们以显示图书信息的https://www.wendangku.net/doc/e815397884.html,网站为例。虽然这个页面是相当巨大的文本,但是这个文本的结构是高度规范的,其中许多的部分对任何的书本描述页面都是相同的,并且特点页面中的各部分的大小都是有限的。也就是说,该页面可以通过一个简单的、数据为中心的XML文档来建立,其中包含了从数据库中检索得到的文本信息以及一个XSL 样式表。通常,目前任何通过在模板中填充数据库数据而动态构造HTML页面的网站都可以被上面介绍的用以数据为中心的XML文档和一个或者多个的XSL样式表方式替代。

3.2.2 以文档为中心的文件

以文档为中心的文档的特点是:结构不规范、数据颗粒度更大(即,最小的独立数据单元是包含有混合内容的元素或者就是整个XML文档)以及含有大量的混合内容。其中相同层次的元素和PCDATA出现顺序是非常重要的。典型的例子是书、电子邮件、广告以及大多数XHTML文档。以文档为中心的文档是用于人的使用。

3.2.3 数据、文档和数据库

在现实情况中,以数据为中心的文件和文档为中心的文件之间的区别并不是很严格。例如,一个以数据为中心的文件(如一张发票),也有可能包含粗颗粒度、不规则的数据(如发票的描述部分)。而一个以文档为中心文件(如用户手册)也可能包含有良好颗粒度、规则的结构化数据(通常是元数据),例如作者和修订日期。除此之外,让你的文档具有以数据为中心或者以文档为中心的特点有助于你判断是关心数据还是文档,这也将决定你需要采用什么样的系统。

要存储或检索数据,你可以使用一个数据库(通常是关系型、面向对象型或者是

层次型)和中间件(字带或者是采用第三方),你也可以使用XML服务器(即创建分布式应用的平台,例如利用XML进行数据传输的电子商务应用)。要保存文档,你将需要一个内容管理系统或者是一致性的DOM实现系统。

第四章XML与关系数据库的转换

当前XML文档数据映射的研究,主要是XML与关系数据库的映射。将XML 文档映射为关系模式进行存储,有两大类映射方法:模型映射(model mapping)和结构映射(structure mapping),其中基于结构的映射方法又可以分为两类,分别是:基于DTD的结构映射方法和基于XML Schema的结构映射方法。

对于模型映射,需要将XML文档模型(即文档树结构)映射为关系模式,关系模式表示XML文档模型的构造,对于所有XML文档都有固定的关系模式,因此,它是XML Schema(或DTD)无关的。

而对于结构映射,需要将XML Schema(或而对于结构映射,需要将XML Schema(或DTD)映射为关系模式,关系模式用来表示目标XML文档的逻辑结构(即XML Schema或DTD),它是XML Schema (或DTD)相关的。在进行关系数据库映射时,从XML文档的DTD或Schema推断XML元素应该怎样映射到关系表,然后再根据生成的关系模式,对XML文档进行解析分解,并将数据存入关系数据库,这样的映射策略属于结构映射方法。

在本文中只考虑模型映射。

模型映射方法

模型映射法又分为:边模型映射方法和结点模型映射方法。将一个XML文档看成是一个有序有向边标记图,称为XML图,设计一个(或若干个)关系存储XML图的边信息和结点值,该策略是属于基于边的模型映射方法,称为边模型映射方法。设计若干个关系来存储XML文档树的结点信息、结点值和结构信息(通过区间编码来译码结构信息,或直接存储双亲/孩子结点对或祖先/后裔结点对),该策略是属于基于结点的模型映射方法,称为结点模型映射方法。

4.1边模型映射法

一个XML文档能够用一个有序有向边标记图来表示在这种图中,每一个XML 元素用一个结点表示,结点被标上XML对象的oid:元素与子元素(或属性)之间的关系用图中的边来表示,并在边上标上子元素(或属性)名:为了表示XML元素中各子元素的顺序,可以对图中从某结点引出的边进行排序:XML文档中的值作为图中叶结点(即属性或最底层子元素结点)表示。例如图7即为图1的XML文档对应XML

文档图。

图表7

有了XML图之后,就可以分别设计关系表存储XML文档的边信息和值。对于用来存储边信息的边表有三种设计方案:

第一种是所有具有相同名称的边存放在一个边表中,这种方法称为Binary方法。因此,图2—7所示的文档图所对应的Binary方法的book和ISBN边表,其它依次类推:

图表8

图表9

第二种是用一个表来存储图的所有边信息,这种方法称为Edge方法。系模式为:Edge(source,ordinal,label,flag,target)。其中source域和target域表示引出结点和引入结点的oid,ordinal域表示该边在兄弟边中的位置序号,label与用来存储边标记(即改边所指向结点的标记名),flag属性用来反映边所指向的结点类型(叶结点类型为integer、string等,非叶结点类型为ref)。可以看出,Binary边表与Edge边表原理相

同,只是Binary边表将所有具有相同边标记的边存放在一个表中,可以说,Binary 边表是Edge边表的水平分割。因此,图表7所示的文档图所对应的Edge边表为:

图表10

第三种是采用一个边表来存储图中所有路径的边信息,该方法称为Universal方法。

对于用来存储XML文档值的值表有两种设计方案:

第一种是不单独设计值表,将值和边存储在同一个表中,在边表中直接增加一个属性value,用于存储叶结点的值,这种方法称为内联方法。其关系模式为:

Inner_Edge(source,ordinal,label,flag,target,value)。

第二种是为每一种可能的取值类型设计一个值表,该方法称为分离值表。其关系模式为Valuetypc(vid,value),其中vid存储叶结点的oid,value属性用来存储叶结点的值。

从上面的映射模式可以看出,XML文档图的生成是基于XML文档本身,与XML Schema和DTD没有关系,并且映射的过程中记录了结点的位置信息,因此反过来,也可以从关系数据库复原XML文档。

综上所述,三种边表设计方案连同两种值表设计方案,合在一起一共有六种存储模式。D.Florescu和D.Kossmann对这六种基本的存储模式的结果占关系数据库大小、执行不同类型的X/VlL查询的执行时间、从关系数据重构XML文档的时间等

三个性能参数进行了量化分析,结论是:Binary边表方法优于Edge边表方法,Edge 边表方法又优于Universal边表方法;内联值表方法优于分离值表方法;Binary边表带内联值表的存储模式能获得最好的综合性能。Binary方法和Universal方法查询性能不好的主要原因是由于边表太大,因此执行连接操作非常费时。事实上,对于一个给定查询来说,边表中存放的数据大部分是不相关的。换句话说,在Binary方法中仅仅相关的数据被处理,即使卷入大量的连接和回路操作,由于现代关系查询引擎有非常强的查询处理能力,也能获得很好的查询性能。内联值表方法优于分离值表方法的主要原因是内联方法无须进行边表与值表之间的连接操作。对于许多不同的数据类型,由于在关系数据库系统中,空值通常以一种紧缩方式进行存储,因此空间就节省了,解决了大量冗余的问题。

4.2结点模型映射法

(1)XRel模式

M.Yoshikawa,T-Amagara等基于结点模型映射方法提出了一个XML数据的关系存储模式,称为XRel[341。XRel是通过区间编码[start,end]来反映(译码)XML文档的模型结构,并根据内容来划分,分为元素边、属性边和文本边,同时将所有路径进行存储,因此,XRel模式由四个关系表组成:

Element(pathlD,doclD,start,end,ordinal)

Attribute(patMD,doclD,start,end,value)

TextCoathID,doclD,start,end,value)

Path(pathlD pathexp)

其中,在Path表中,pathlD为标记路径(1abel—path)的标识,pathexp域存储标记路径,为了实现路径表达式的字符串匹配操作,将标记路径中的“/,,替换为“彤"进行存储。对于Element,Attribute和Text表,主键是(doclD,start),pathlD是外键。

每一个不同的标记路径作为Path表的一个元组,因此它能够有效地处理带“*”操作的正则路径表达式查询。第一步,利用字符串中的匹配操作,能够快速地查找出与给定正则路径表达式相匹配的所有标记路径的标识:第二步,利用这些路径标识,能够快速地查找出隶属于这些路径终端的值(元素结点、文本结点或属性结点)。

XRel的最大优点在于它与XPath标准的紧密结合,从而能够对基于XPath的查询给予相当好的性能支持,但同时它也存在很大的不足之处,尤其是它的PATH信息具有很大的冗余信息,一个简单的修改节点名字的操作,都会需要相当复杂的操作。

(2)XParent模式

香港科技大学Jiang Haifeng,Lu Hongjun和WangWei等基于结点模型映射方法提出了另一个XML数据的关系存储模式,称为XParent。XParent是通过一个单独的Parent(Parent.ID,child.ID)表来反映XML文档的模型结构,并根据内容和“结构与非结构”来划分边,同时将所有路径进行存储,因此,XParent模式也由四个关系表组成:

LabelPath(pathlD,length,pathexp)

Parent(pid,cid)

Element(pathlD,did,ordinal)

Data(pathlD,did,ordinal,value)

其中length为标记路径的长度,即标记路径中边标记的个数:pathexp域存储标记路径,与XRel类似,这里将标记路径中的“/”替换为“./”进行存储:did 为XML文档中元素结点的标识,它也可以作为以该结点为终端点的数据路径的标识:pid,cid分别为XML文档的数据路径中的双亲结点、孩子结点的标识。这里,没有考虑文档标识doclD。

Parent表存储的是双亲/孩子关系,因此,为了检查数据路径需要进行连接操作。为了加速这种处理,可以不用Parent表,而改用Ancestor表来存储祖先/后裔关系:Ancestor(did,ancestor,level)例如,利用元组(&9,&1,3)表示&9结点的曾祖父是&1结点。Ancestor表能够快速地检测结点之间的祖先/后裔关系,但是它比Parent表需要更多的空间,而且由于存在冗余信息,修改起来代价也更高。

XParent模式分别通过LabelPath表和Parent表来支持标记路径和数据路径,因此,XParent模式既具有基于结点的模型映射的特点,又具有基于边的模型映射的特点。

Parent,表基于双亲/孩子关系来反映XML文档的核心结构,它也能够被进一步物化为Ancestor表来支持祖先/后裔关系。由于XML文档中的结点标识也可以用来标识以该结点为终端点的数据路径,因此,元素和数据(文本或属性)隶属于数据路径。

结点模型映射方法需要维护的是XML文档树的结点信息,而不是边信息。XRel 模式通过区间编码来译码XML文档的模型结构(即包含关系),它的优点是通过口连接(非等值连接),能够容易判别两个结点之间的包含关系。但是,秒连接的代价比等值连接要高得多,这是因为在关系数据库中并没有特殊的索引机制来支持它。

XParent模式在结构上类似于XRel模式,只是用did替代了[start,end]。然而,这种变化使得XParent模式仅需要等值连接,而XRel模式却需要0连接,因此,

XParent模式能够基于传统的索引机制(如B树索引),从而得到有效的实现。

Xparent方法的最大优点也在于它与XPath标准的紧密结合,从而能够对基于XPath的查询给予相当好的性能支持,但同时它也存在路径冗余的缺点。

XML技术及其应用概述

XML技术及其应用概述* 吕腾黄琼湘闫萍 新疆大学数学与系统科学学院 830046 关键词: XML 电子商务网络安全数据集成 1 XML的发展历史 可扩展标记语言XML(eXtensible Markup Language)[1]是一种简单灵活的文本格式的可扩展标记语言,起源于SGML(Standard Generalized Markup Language),是SGML的一个子集合,也就是SGML的一个简化版本,非常适合于在Web上或者其它多种数据源间进行数据的交换。 1969年,IBM公司开发了一种文档描述语言GML(Generalized Markup Language),用来解决不同系统中文档格式不同的问题,并在1986年成为了一个国际标准〔ISO8879〕,这就是SGML。SGML是很多大型组织的文档标准,它是一种与语言无关的、结构化的、可扩展的语言,这些特点使它在很多公司受到欢迎,被用来创建、处理和发布大量的文本信息。 1989年,在CERN欧洲粒子物理研究中心的研究人员开发了基于SGML的超文本版本,称为HTML( HyperText Markup Language)。HTML继承了SGML的许多重要的特点,比如结构化、实现独立和可描述性,但是它也存在很多缺陷,比如它只能使用固定的有限的标记,而且它只侧重于对内容的显示方面。 随着Web上数据的增多,HTML存在的这些缺点越来越突出。W3C的成员认识到,必须有一种方法能够把数据本身和数据的显示分离开来,这样W3C在1996年提出了XML的概念。XML不仅保留了SGML的很多优点,而且更加容易操作以及在World Wide Web环境下实现。1998年,XML成了W3C的推荐标准。 2 XML的特点 (1)自描述。XML是一种标记语言,其内容由相应的标记来标识,具有自描述的特点。 (2)可扩展性。XML是一种可扩展的标记语言,用户可以定义自己的标记来表达自己的数据,具有强大的可扩展性。 (3)内容和显示分离。XML文档只描述数据本身,而与数据相关的显示则由另外的处理程序来完成,具有内容和显示相分离的特点。 (4)本地计算。XML解析器读取数据,并将它递交给本地应用程序(例如浏览器)进一步查看或处理,也可以由使用XML对象模型的脚本或其他编程语言来处理。 (5)个性化数据视图。传递到桌面的数据可以根据用户的喜好和配置等因素,以特定的形式在视图中动态表现给用户。 (6)数据集成。使用XML,可以描述和集成来自多种应用程序的不同格式的数据,使其能够传递给其它应用程序,做进一步的处理。 3 XML的技术规范 XML并不仅仅包括XML标记语言,它同时还包括了很多相关的规范,比如文档模式技术、文档样式技术、文档查询技术、文档解析技术、文档链接技术以及*新疆大学博士基金资助。

基于XML技术标准的主题图构建及应用

基于XML技术标准的主题图构建及应用 【摘要】文章主要讨论了xml技术在信息组织领域的某一个方面应用,即xml用于主题图的实现,或称为xtm技术。它是使用xml语法来处理主题图中数据的一种方法。围绕该主题,文章介绍了xtm标准、使用xtm代码或使用集成开发工具这两种方法构建基于xml技术主题图,并列举了国内外使用基于xml技术实现主题图的应用案例。 【关键词】xml;主题图;xtm;信息组织 【abstract 】xml being applied to topic maps, a way of information organization, is generally called xtm. in the content, we introduce xtm standard, two ways of using xtm to construct topic maps and some examples of using topic maps based on xml to organize information. 【keywords 】xml; topic maps; xtm; information organization 1 引言 21世纪是信息时代,人们对信息的需求越来越多。但是,信息的量大质杂,与人们有限的时间精力、特定的信息需求存在极大的矛盾冲突。因此,对信息进行合理的组织,以方便用户获取信息的需求越来越迫切。数据是信息的载体,对信息的组织实质上是对数据的组织。主题图结构清晰并能够有效地反映数据间关联,因此主题图常被认为是信息组织的理想方法。如今有多种实现主题图的技术方法,如hytm等。但是,上述实现主题图的方法有一个难题:利用主题图组织的数据如何实现跨平台的数据交换?xml是现在流行

XML技术特点

XML技术及其应用概述* 吕腾黄琼湘闫萍新疆大学数学与系统科学学院830046 关键词:XML 电子商务网络安全数据集成 1 XML的发展历史可扩展标记语言XML(eXtensible Markup Language)[1]是一种简单灵活的文本格式的可扩展标记语言,起源于SGML(Standard Generalized Markup Language),是SGML的一个子集合,也就是SGML的一个简化版本,非常适合于在Web上或者其它多种数据源间进行数据的交换。1969年,IBM公司开发了一种文档描述语言GML(Generalized Markup Language),用来解决不同系统中文档格式不同的问题,并在1986年成为了一个国际标准〔ISO8879〕,这就是SGML。SGML是很多大型组织的文档标准,它是一种与语言无关的、结构化的、可扩展的语言,这些特点使它在很多公司受到欢迎,被用来创建、处理和发布大量的文本信息。1989年,在CERN欧洲粒子物理研究中心的研究人员开发了基于SGML的超文本版本,称为HTML( HyperText Markup Language)。HTML继承了SGML的许多重要的特点,比如结构化、实现独立和可描述性,但是它也存在很多缺陷,比如它只能使用固定的有限的标记,而且它只侧重于对内容的显示方面。随着Web上数据的增多,HTML存在的这些缺点越来越突出。W3C的成员认识到,必须有一种方法能够把数据本身和数据的显示分离开来,这样W3C在1996年提出了XML的概念。XML不仅保留了SGML的很多优点,而且更加容易操作以及在World Wide Web环境下实现。1998年,XML成了W3C的推荐标准。 2 XML的特点(1)自描述。XML是一种标记语言,其内容由相应的标记来标识,具有自描述的特点。(2)可扩展性。XML是一种可扩展的标记语言,用户可以定义自己的标记来表达自己的数据,具有强大的可扩展性。(3)内容和显示分离。XML文档只描述数据本身,而与数据相关的显示则由另外的处理程序来完成,具有内容和显示相分离的特点。(4)本地计算。XML 解析器读取数据,并将它递交给本地应用程序(例如浏览器)进一步查看或处理,也可以由使用XML对象模型的脚本或其他编程语言来处理。(5)个性化数据视图。传递到桌面的数据可以根据用户的喜好和配置等因素,以特定的形式在视图中动态表现给用户。(6)数据集成。使用XML,可以描述和集成来自多种应用程序的不同格式的数据,使其能够传递给其它应用程序,做进一步的处理。3 XML的技术规范XML并不仅仅包括XML标记语言,它同时还包括了很多相关的规范,比如文档模式技术、文档样式技术、文档查询技术、文档解析技术、文档链接技术以及* 新疆大学博士基金资助。XML技术及其应用概述·2·文档定位技术等。基于XML 的这些规范,还有很多高层的应用协议,比如SOAP(Simple Object Access Protocol)和BizTalk 等。(1)文档模式技术:DTD(Document Type Definition)[2]和XML Schema[3]是XML文档的模式,用来对XML文档的逻辑结构进行定义。XML文档的模式规定了XML文档中的元素、属性、元素和元素以及元素和属性之间的关系。其中,DTD来自SGML,XML Schema 是专门为定义XML文档的模式而设计的,采用的是XML的语法。(2)文档样式技术:XML是内容(数据)和显示格式分离的语言,CSS (Cascading Style Sheets)[4]和XSL(Extensible Stylesheet Language)[5]就是定义XML文档的显示样式的。其中,CSS是随着HTML的出现而产生的,控制XML文档的显示,但不会改变源文档的结构。而XSL是专门为XML设计的,不仅用来显示XML文档,而且可以把一个XML文档转化为另一个XML文档。(3)文档查询技术:W3C推荐的XML文档的查询语言是XQuery1.0[6]。XQuery起源于一种叫Quilt的XML查询语言,借鉴了XPath 1.0、XQL、XML-QL、SQL和OQL等语言的优点。(4)文档解析技术:文档解析是指对XML文档的内容和结构进行访问和分析。文档解析技术包括文档对象模型DOM(Document Object Model)[7]和SAX(Simple API for XML)[8]。DOM是一种对平台和语言中立的接口,它是基于XML文档在内存中的树状结构,它的一个主要不足在于将整个XML文档装入内存所引起的巨大开销。而SAX使用事件驱动的XML解析,并不要求将整个XML文档一起装入内存。(5)文档链接技术:XML的链接功能比HTML

XML应用与前景

XML基础 题目:XML应用及前景班级: 学号: 姓名:

时间:

XML基础 目录 1.XML简介 (1) 2.XML一般应用 (1) 2.1 XML把数据从HTML 分离 (1) 2.2 XML简化数据共享 (1) 2.3 XML 简化数据传输 (2) 2.4 XML 简化平台的变更 (2) 2.5 XML 使您的数据更有用 (2) 2.6 XML 用于创建新的 Internet 语言 (2) 2.7 XML在分布式技术的映射作用 (3) 3.XML应用前景 (3) 3.1电子商务领域 (3) 3.2网络服务领域 (4) 3.3 移动通信领域 (4) 3.4数据库领域 (5) 4.XML前景展望 (6)

XML应用及前景 1.XML简介 通过一学期的学习,我对XML有了一定的认识,其应用非常广泛,可以说是无处不在。在现如今的软件开发过程中,对于它的应用也体现在各个方面。它在未来软件开发中,应用空间会随着它的飞速发展不断地扩大,下面就其应用和发展前景作简要介绍。 作为互联网的新技术,XML的应用非常广泛,可以说XML已经渗透到了互联网的各个角落。 虽然人们对XML的某些技术标准尚有争议,但是人们已经普遍认识到XML的作用和巨大潜力,并将XML应用到互联网的各个方面。考察现在的XML应用,可以大致将它们分为:设计置标语言、数据交换、替代传统的EDI 、智能代理和精确搜索、Web应用、集成不同数据源、本地计算、数据的多种显示和网络出版、支持Web应用的互操作和集成、文件保值等。 2.XML一般应用 2.1 XML把数据从HTML 分离 如果你需要在HTML 文档中显示动态数据,那么每当数据改变时将花费大量的时间来编辑HTML。通过XML,数据能够存储在独立的XML 文件中。这样你就可以专注于使用HTML 进行布局和显示,并确保修改底层数据不再需要对HTML 进行任何的改变。通过使用几行 JavaScript,你就可以读取一个外部 XML 文件,然后更新HTML 中的数据内容。 2.2 XML简化数据共享 在真实的世界中,计算机系统和数据使用不兼容的格式来存储数据。XML 数据以纯文本格式进行存储,因此提供了一种独立于软

XML技术概述

XML技术概述 Internet技术发展至今,已渗透到社会生活的每个角落。近年来,随着电子商务、电子图书、远程教育等全新领域异军突起,迅速发展并逐渐成为Internet中不可缺少且愈发重要的组成部分,随之而来的是Web文件的智能化、多样化、复杂化,于是高信息量、高容量和高效率便成为网络信息传输技术发展的要求。而XML技术以具有高复杂性与灵活性,能应付复杂多变的具体应用而深受人们的喜爱。例如,XML可以方便的让同样的数据根据不同用户、不同需求而以不同的效果、形式表达再显示出来。 1.XML的定义 XML是互联网联盟W3C(World Wide Web Consortium)创建的一组规范,以便于软件开发人员和用户在网页上组织信息,其目的不仅在于满足不断增长的网络应用需要,同时还希望借此确保在通过网络进行交互作用时,具有良好的可靠性和互操作性。 与HTML一样,XML也源于SGML,它保留了SGML的大部分特性。尽管如此,XML却有着HTML语言所欠缺的丰富的可伸缩性与灵活性。XML不再像HTML 一样有着一成不变的固定标记。XML实际上是一种定义语言,即我们可以定义无限的标记来描述文件中的任何数据元素,从而突破了HTML固定标记集合的结束,使文件的内容更丰富、更复杂并组成一个信息结构。 XML语言可以让使用者根据需要自定义标记及属性名,也可以包含描述法,从而使XML文件结构可以复杂到任意程度。 XML主要有3个要素:Schema(模式)、XSL(eXtensible Stylesheet Language,可扩展样式语言)和XLL(eXtensible Link Language,可扩展链接语言)。Schema 定义了XML文件的逻辑结构,定义了XML文件中的元素、元素的属性以及元素和元素的属性之间的关系,它可以帮助XML分析程序检验XML文件标记的合法性;XSL是用于规定XML文档样式的语言,它能在客户端使浏览器改变文档的显示方式,从而不需要再与服务器进行交互通信;XLL则进一步扩展了目前Web上已有的简单链接。 2.与HTML的区别 XML是一种元素描述语言,并不像HTML一样使用一种固定的标记集合来描述固定的元素内容。在HTML语言中,如果用户所要的标记不在目前所使用标记语言的标记集合内,则只能期待在下一个版本中包含它。这通常使得文件的发展受限于标记语言提供能力。XML所提供的并不是一组已定义好的标记供我们使用,而是一种用来制定标记的规则。也就是说,使用XML可以创建自己所需的标记,而创建标记所要遵循的规范就是XML。由自己创建的标记也可以保存为一种文件,称为DTD(Document Type Definition),DTD记录的就是所定义文件的方法。

XML技术与应用模拟题

《XML技术与应用》模拟题 一、选择题 1、下面关于XML、HTML和XHTML说法不正确的是() (A)HTML、XHTML和XML均是SGML的子集,均是为了克服SGML的复杂性而产生的元语言; (B)HTML、XHTML大小写不敏感;XML大小写敏感; (C)HTML可以不严格遵守语法规则,但XML必须严格遵守,它们的作用均是实现对元素的结构定义; (D)XHTML是对HTML的扩展,在大小写、标记的封闭性等方面更严格。 2、以下不是HTML的优点的是() (A)跨平台(B)强大的信息显示能力 (C)表达内容的真正含义,并且用预先定义的标记 (D)文档的编写简单 3、关于SGML的说法错误的是() (A)是一种通用的文档结构描述标记语言; (B)SGML功能非常强大,但不具有较好的扩展性,在数据分类和索引中非常有用;(C)SGML复杂度太高,开发成本高,不被主流浏览器所支持; (D)SGML是XML的父类。 4、下面关于CDATA节的说法不对是() (A)CDATA节的字符“”结束; (B)在节中可以输入包括<或&的任意字符; (C)CDATA节中的所有字符都会被当作元素中字符数据的常量部分,而不是XML标记;(D)CDATA段中可以再包含CDATA段,即可以嵌套。 5、下面关于属性的说法错误的是() (A)在一个元素的起始标签中,可以包含一个或多个属性; (B)属性由属性名、等号以及属性值组成。属性名可以由用户任意定义; (C)给元素添加属性是为元素提供信息的唯一方法; (D)属性值可以用单撇号或双撇号括起来。 6、XML中五个特殊符号为() (A)“<”、“&”、“>”、“’”、““”(B)“<”、“?”、“>”、“’”、““” (C)“<”、“&”、“>”、“’”、“”(D)“<”、“&”、“>”、“_”、““” 7、下面对DTD元素声明不正确的是() (A) (B) (C) (D)

昆明理工大学-XML技术与应用-XML DTD 与XML Schema的使用(实验二)

昆明理工大学信息工程与自动化学院学生实验报告 (2014 —2015 学年第 2 学期) 课程名称:XML技术与应用开课实验室:信自楼234 年级、专业、班计科学号姓名成绩实验项目名称XML DTD 与XML Schema的使用指导教师卫守林 教师评语 该同学是否了解实验原理: A.了解□ B.基本了解□ C.不了解□ 该同学的实验能力: A.强□ B.中等□ C.差□ 该同学的实验是否达到要求: A.达到□ B.基本达到□ C.未达到□ 实验报告是否规范: A.规范□ B.基本规范□ C.不规范□ 实验过程是否详细记录: A.详细□ B.一般□ C.没有□ 教师签名: 年月日 一、实验目的 1、掌握DTD的定义、引用 2、掌握DTD的验证 3、掌握XML Schema的定义、引用 4、掌握XML Schema的验证 5、了解XML Schema中名称空间的使用 二、实验内容、源码及其结果记录 1、如图所示,为其系统设计标记语言及其对应的DTD,分别命名为code2_1.xml、code2_1.dtd。 博物馆 雕塑 油画 质 量 作 者 成 画 时 间 尺 寸 作 者 使 用 年 代 币 值 古币

"code2_1.dtd"> c0500069 20050517 001 10 c500701 20050712 2、在一个XML文档中,需要用到一个article的结点,这个结点结构如下:

Main headline goes here A subheadline goes here John Doe Reporter April 30, 2005 Content of story goes here… 2005-03-02 1523
(1)请在分别定义HeadLine、ByLine、DateLine、stats结点的数据类型基础上,再定义article 的复杂数据类型。 (2)若以上程序段多篇文章(articles),请为其建立完整的XML Schema文件,保存文件名为code3_1.xsd。 code3_1.xsd

实验指导书xml技术与应用

《XML技术与应用》实验指导书 教师:朱泽民 班级:计科2007,2006级 学期:2009-2010(一) 版本:2009-08-22 黄冈师范学院计算机科学与技术学院 2009年8月22日

实验一XML基础与XML SPY的使用 一.实验目的 1、掌握XML1.0的标准及内容 2、掌握XML的基本格式 3、掌握XML SPY的基本使用方法 二.实验内容 1、使用XML Spy或记事本等文本编辑器编辑如下XML文档,并保存文件名为code1_1.xml,然后在IE中浏览。 c0500069 pending 001 10 pending c500701 pending 002 30 pending 003 20 pending 2、下面是一个网上购物订单,将它写成XML格式,并用XML SPY编辑,保存为code1_2.xml。 顾客编号:X00349827,订单号:DD934809,订货时间:2004-05-17;

XML技术与应用实验指导书

《XML程序设计》实验指导书 编写:周跃文 专业:软件工程 计算机科学与技术 网络工程 东华理工大学 信息工程学院

前言 《XML编程与应用》课程是计算机科学与技术专业、软件工程、网络工程等相关专业的重要专业课程之一。World Wide Web Consortium (W3C)对XML进行了如下描述:“Extensible Markup Language,缩写为 XML,描述了一类被称为XML文档的数据对象,并部分描述了处理它们的计算机程序的行为。XML 是SGML (Standard Generalized Markup Language [ISO 8879])的一个应用实例或一种受限形式。从结构上说,XML文档顺从SGML文档标准”。Microsoft 对 XML 的定义是:Standard Generalized Markup Language (SGML) 的简化子集,专门为 Web 应用程序而设计。XML 提供描述不同类型数据的标准格式——例如,约会记录、购买定单、数据库记录——从而可一致而正确地解码、管理和显示信息。XML 提供表示数据的文件格式、描述数据结构的计划、以及用语义信息扩展和注释HTML的机制。总而言之,XML是一种元标注语言,该语言提供一种描述结构数据的格式。这有助于更精确地声明内容,方便跨越多种平台的更有意义的搜索结果。此外,XML越来越广泛用于新一代的基于 Web 的数据查询和处理应用程序之中。 希望同学们在使用本实验指导书及进行实验的过程中,能够帮助我们不断地发现问题,并提出建议,使《XML编程与应用》教学内容日益完善。

XML考试题库大全_XML技术及应用

XML考试题库大全 1. 为定义一个XML文档的结构,开发者可以使用的XML技术有。(选择二项)(bd) a) UML b) DTD c) Namespace d) XML Schema e) XSL 2. 下面是XML标准提供的编程接口,用于开发人员访问XML文档。(选择两项)(bd) a) Xpath b) Dom c) XSLT d) SAX e) Xlink 3.下面是一个XML文档的序言部分: ]> 下面的片段中可以作为该XML文档的合法的文档元素部分的是。(选择一项)(B) a) 八阵图 功盖三分国,名成八阵图,江流石不转,遗恨失吞吴。 八阵图1 功盖三分国,名成八阵图1,江流石不转,遗恨失吞吴1. b) 八阵图 功盖三分国,名成八阵图,江流石不转,遗恨失吞吴。 八阵图1

基于XML Web技术及其在电子出版之应用

基于XML Web技术及其在电子出版之应用 (计算机08-2 08032232 张雪) 【摘要】:一般预料,XML将继HTML之后,成为新一代Web的整合 技术,为网路带来第二波革命性的改变,促使网路从资讯处理阶段跨越到知识管理阶段,并将在电子出版、电子商务、电子图书馆、电子资料交换、远距教学等领域展现其强大的应用潜能。本文旨在探讨XML 如何有效的表达网路上各种知识,为资料的交换和处理提供新的机制;并试图从电子出版的角度着眼,说明电子文件组成要素,分析目前Web 出版的现况,从而深入了解现今Web所遭遇的困境与瓶颈;接着基于文件存取、整合、传递、操纵、显示等议题,提出一个整合式XML文件管理系统架构,并探讨XML相关技术,诸如DTD、XML Schema、XML Namespaces、RDF、XLink、DOM、CCS、XSL等,在此一架构中所扮演的角色及功能,进而描绘出Web未来发展之趋势与轮廓。 关键词:XML;HTML;XHTML;Web出版;电子文件;电子出版 绪论 随着网路的发展,图书与出版技术逐渐由传统印刷形式,朝向全面电子化的方向迈进,藉由网路,人类的文化得以采用数位化型态即时传播;透过网路,全球的使用者皆可共享资讯、共用资源。如今,经由Web产生的电子文件,已经如同蜘蛛网一样,密密麻麻的组成了一个全球性的系统(Distributed Hypertext System)。在此一系统中,HTML(HyperText Markup Language,超文件标示语言)

无疑是扮演了一个关键性的角色。但是随着资讯科技的发展,Web应用愈来愈广泛,HTML的弱点也愈来愈明显。其中最严重的,便是HTML 擅长版面编排而欠缺内容语意,所以虽然适合人类阅览但却不利于电脑理解;其次,HTML的标签集是固定的、不可扩展的,无法应付多样化的应用。这些缺点在电子出版、电子商务、远距教学、电子图书馆等全新领域急速发展,并期望Web朝向自动化、智慧化目标迈进的同时,遂成了Web发展的一大隐忧。 有鉴于此,人们开始着手研究改进HTML的方法,XML (eXtensible Markup Language,可扩展标注语言)便是在这样的背景下产生的。XML具有可扩展性、高度结构化和良好的资料组织能力,能够有效的表达网路上各种知识,为资料的交换和处理提供新的机制,一般预料,XML将成为新一代Web的整合技术。若将HTML比拟为网路的第一波革命,则XML极可能继HTML之后为网路带来第二波革命性的改变,促使网路从资讯处理阶段跨越到知识管理阶段,并将在电子出版、电子商务、电子图书馆、电子资料交换、远距教学等领域展现其强大的应用潜能。众多的特点使得XML成为一个强势语言,并迅速获得各界的支持及响应。 本文从电子出版的角度着眼,说明电子文件组成要素,分析目前Web出版的现况,从而深入了解HTML所遭遇的困境与瓶颈,接着基于文件存取、整合、传递、操纵、显示等议题,规画一个整合式XML文件管理系统架构,并探讨XML相关技术在此一架构中所扮演的角色及功能,进而描绘出Web未来发展之趋势与轮廓。

相关文档