文档库 最新最全的文档下载
当前位置:文档库 › 高级数据库技术试卷

高级数据库技术试卷

高级数据库技术试卷
高级数据库技术试卷

《高级数据库技术与应用》期末试题(2013)

1.数据库技术发展阶段如何划分,简述当前数据库技术热点和发展趋势。

(1)数据库技术发展阶段

数据库技术的发展,已经成为先进信息技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心。数据库技术最初产生于20世纪60年代中期数根据数据模型的发展,可以划分为三个阶段:第一代的网状、层次数据库系统;第二代的关系数据库系统;第三代的以面向对象模型为主要特征的数据库系统。

第一代数据库的代表是1969年IBM公司研制的层次模型的数据库管理系统IMS和70年代美国数据库系统语言协商CODASYL下属数据库任务组DBTG提议的网状模型。层次数据库的数据模型是有根的定向有序树,网状模型对应的是有向图。这两种数据库奠定了现代数据库发展的基础。这两种数据库具有如下共同点:1.支持三级模式(外模式、模式、内模式)。保证数据库系统具有数据与程序的物理独立性和一定的逻辑独立性;2.用存取路径来表示数据之间的联系;3.有独立的数据定义语言;4.导航式的数据操纵语言。

第二代数据库的主要特征是支持关系数据模型(数据结构、关系操作、数据完整性)。关系模型具有以下特点:1.关系模型的概念单一,实体和实体之间的连系用关系来表示;2.以关系数学为基础;3.数据的物理存储和存取路径对用户不透明;4.关系数据库语言是非过程化的。

第三代数据库产生于80年代,随着科学技术的不断进步,各个行业领域对数据库技术提出了更多的需求,关系型数据库已经不能完全满足需求,于是产生了第三代数据库。主要有以下特征:1.支持数据管理、对象管理和知识管理;2.保持和继承了第二代数据库系统的技术;3.对其它系统开放,支持数据库语言标准,支持标准网络协议,有良好的可移植性、可连接性、可扩展性和互操作性等。第三代数据库支持多种数据模型(比如关系模型和面向对象的模型),并和诸多新技术相结合(比如分布处理技术、并行计算技术、人工智能技术、

多媒体技术、模糊技术),广泛应用于多个领域(商业管理、GIS、计划统计等),由此也衍生出多种新的数据库技术。

分布式数据库允许用户开发的应用程序把多个物理分开的、通过网络互联的数据库当作一个完整的数据库看待。并行数据库通过cluster 技术把一个大的事务分散到cluster中的多个节点去执行,提高了数据库的吞吐和容错性。多媒体数据库提供了一系列用来存储图像、音频和视频对象类型,更好地对多媒体数据进行存储、管理、查询。模糊数据库是存储、组织、管理和操纵模糊数据库的数据库,可以用于模糊知识处理。一、摇篮和萌芽阶段:首先使用"DataBase"一词的是美国系统发展公司在为美国海军基地在60年代研制数据中引用。

(2)数据库技术的热点以及发展的主要趋势:

a.下一代数据库技术的发展主流

针对关系数据库技术现有的局限性,理论界如今主要有三种观点:

面向对象的数据库技术将成为下一代数据库技术发展的主流部分学者认为现有的关系型数据库无法描述现实世界的实体,而面向对象的数据模型由于吸收了已经成熟的面向对象程序设计方法学的核心概念和基本思想,使得它符合人类认识世界的一般方法,更适合描述现实世界。甚至有人预言,数据库的未来将是面向对象的时代。

面向对象的关系数据库技术关系数据库几乎是当前数据库系统的标准,关系语言与常规语言一起几乎可完成任意的数据库操作,但其简洁的建模能力、有限的数据类型、程序设计中数据结构的制约等却成为关系型数据库发挥作用的瓶颈。面向对象方法起源于程序设计语言,它本身就是以现实世界的实体对象为基本元素来描述复杂的客观世界,但功能不如数据库灵活。因此部分学者认为将面向对象的建模能力和关系数据库的功能进行有机结合而进行研究是数据库技术的一个发展方向。

面向对象数据库技术面向对象数据库的优点是能够表示复杂的数据模型,但由于没有统一的数据模式和形式化理论,因此缺少严格的数据逻辑基础。而演绎数据库虽有坚强的数学逻辑基础,但只能处理平面数据类型。因此,部分学者将两者结合,提出了一种新的数据库技术——演绎面向对象数据库,并指出这一技术有可能成为下一代数据库技术发展的主流。

b.数据库技术发展的新方向

非结构化数据库是部分研究者针对关系数据库模型过于简单,不便表达复杂的嵌套需要以及支持数据类型有限等局限,从数据模型入手而提出的全面基于因特网应用的新型数据库理论。支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理,在处理连续信息(包括全文信息)和非结构信息(重复数据和变长数

据)中有着传统关系型数据库所无法比拟的优势。但研究者认为此种数据库技术并不会完全取代如今流行的关系数据库,而是它们的有益的补充。

c.数据库技术发展的又一趋势

有学者指出:数据库与学科技术的结合将会建立一系列新数据库,如分布式数据库、并行数据库、知识库、多媒体数据库等,这将是数据库技术重要的发展方向。其中,许多研究者都对多媒体数据库作为研究的重点,并认为多媒体技术和可视化技术引入多媒体数据库将是未来数据库技术发展的热点和难点。

d.未来数据库技术及市场发展的两大方向

数据仓库电子商务部分学者在对各个数据库厂商的发展方向和应用需求的不断扩展的现状进行分析的基础上,提出数据库技术及市场在向数据仓库和电子商务两个方向不断发展的观点。他们指出:从上一年开始,许多行业如电信、金融、税务等逐步认识到数据仓库技术对于企业宏观发展所带来的巨大经济效益,纷纷建立起数据仓库系统。在中国提供大型数据仓库解决方案的厂商主要有Oracle、IBM、Sybase、CA及Informix等厂商,已经建设成功并已收回投资的项目主要有招商银行系统和国信证券系统等。当前,国内外学者对数据仓库的研究正在继续深入。与此同时,一些学者将数据库技术及市场发展的视角瞄准电子商务领域,他们认为:如今的信息系统逐渐要求按照以客户为中心的方式建立应用框架,因此势必要求数据库应用更加广泛地接触客户,而Internet给了我们一个非常便捷的连接途径,通过Internet我们可以实现所谓的One One Marketing和One One business,进而实现E business。因此,电子商务将成为未来数据库技术发展的另一方向。

e.面向专门应用领域的数据库技术

许多研究者从实践的角度对数据库技术进行研究,提出了适合应用领域的数据库技术如工程数据库、统计数据库、科学数据库、空间数据库、地理数据库等。这类数据库在原理上也没有多大的变化,但是它们却与一定的应用相结合,从而加强了系统对有关应用的支撑能力,尤其表如今数据模型、语言、查询方面。部分研究者认为,随着研究工作的继续深和数据库技术在实践工作中的应用,数据库技术将会更多朝着专门应用领域发展。

2.简述关系数据库三级模式两级映射体系结构及其意义。

(1)关系数据库三级模式两级映射体系结构

为了有效地组织、管理数据,提高数据库的逻辑独立性和物理独立性,人们为数据库设计了一个严谨的体系结构,数据库领域公认的标准结构是三级模式结构,它包括外模式、模式和内模式。内模式/模式确定它的物理独立性,模式/外模式确定它的逻辑独立性,也就是二级映射体系结构。

1.模式

模式又称概念模式或逻辑模式,对应于概念级。它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的公共数据视图(全局视图)。它是由数据库管理系统提供的数据模式描述语言(Data Description Language,DDL)来描述、定义的,体现、反映了数据库系统的整体观。

2.外模式

外模式又称子模式,对应于用户级。它是某个或某几个用户所看到的数据库的数据视图,是与某一应用有关的数据的逻辑表示。外模式是从模式导出的一个子集,包含模式中允许特定用户使用的那部分数据。用户可以通过外模式描述语言来描述、定义对应于用户的数据记录(外模式),也可以利用数据操纵语言(Data Manipulation Lang uage,DML)对这些数据记录进行。外模反映了数据库的用户观。

3.内模式

内模式又称存储模式,对应于物理级,它是数据库中全体数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式翱物理结构,对应着实际存储在外存储介质上的数据库。内模式由内模式描述语言来描述、定义,它是数据库的存储观。

4. 两级映射:

模式/内模式映像、外模式/模式映像。正因为这两级映射保证了数据库中的数据具有较高的逻辑独立性和物理独立性。

(1)模式/内模式的映像:

该映像存在于概念级和内部级之间,实现了概念模式到内模式之间的相互转换。

(2)外模式/模式的映像:

该映像存在于外部级和概念级之间,实现了外模式到概念模式之间的相互转换。

(2)关系数据库三级模式两级映射意义

数据按外模式的描述提供给用户,按内模式的描述存储在磁盘上,而概念模式提供了连接这两级模式的相对稳定的中间观点,并使得这两级的任意一级的改变都不另一级的牵制在一个数据库系统中,只有唯一的数据库,因而作为定义、描述数据库存储结构的内模式

和定义、描述数据库逻辑结构的模式,也是惟一的,但建立在数据库系统之上的应用则是非常广泛、多样的,所以对应的外模式不是惟一的,也不可能是惟一的。

三级模式间的映射数据库的三级模式是数据库在三个级别(层次)上的抽象,使用户能够逻辑地、抽象地处理数据而不必关心数据在计算机中的物理表示和存储。实际上,对于一个数据库系统而言一有物理级数据库是客观存在的,它是进行数据库操作的基础,概念级数据库中不过是物理数据库的一种逻辑的、抽象的描述(即模式),用户级数据库则是用户与数据库的接口,它是概念级数据库的一个子集(外模式)。

用户应用程序根据外模式进行数据操作,通过外模式一模式映射,定义和建立某个外模式与模式间的对应关系,将外模式与模式联系起来,当模式发生改变时,只要改变其映射,就可以使外模式保持不变,对应的应用程序也可保持不变;另一方面,通过模式一内模式映射,定义建立数据的逻辑结构(模式)与存储结构(内模式)间的对应关系,当数据的存储结构发生变化时,只需改变模式一内模式映射,就能保持模式不变,因此应用程序也可以保持不变。

数据的独立性是由DBMS的两级映像功能来保证的。数据的独立性包括数据的物理独立性和数据的逻辑独立性。

(1)数据的物理独立性:

是指当数据库的内模式发生改变时,数据的逻辑结构不变。由于应用程序处理的只是数据的逻辑结构,这样物理独立性可以保证,当数据的物理结构改变了,应用程序不用改变。但是为了保证应用程序可以正确执行,我们需要修改概念模式/内模式之间的映射。

(2)数据的逻辑独立性:

是指用户的应用程序与数据库的逻辑结构是相互独立。数据的逻辑结构发生改变后,用户程序也可以不修改。但是为了保证应用程序的正常执行我们要修改外模式/概念模式之间的映射。

3.关系数据库有那些优势和不足,简述对象关系数据模型及其与关系数据数据模型的联系与区别。

(1) 关系数据库的优势:

a.灵活性和建库的简单性:从软件开发的前景来看,用户与关系数据库编程之间的接口是灵活与友好的。目前在多数RDDMS产品中使用标准查询语言SQL,允许用户几乎毫无差别地从一个产品到另一个产品存取信息。与关系数据库接口的应用软件具有相似的程序访问机制,提供大量标准的数据存取方法。

b.结构简单:从数据建模的前景看,关系数据库具有相当简单的结构(元组),可为用户或程序提供多个复杂的视图。数据库设计和规范化过程也简单易行和易于理解。由于关系数据库的强有力的、多方面的功能,已经有效地支持许多数据库纳应用。

(2) 关系数据库的不足:

a. 数据类型表达能力差:从下一代应用软件的发展角度来看,关系数据库的根本缺陷在于缺乏直接构造与这些应用有关的信息的类型表达能力,缺乏这种能力将产生以下有害的影响,例如:大多数RDBMS产品所采用的简单类型在重构复杂数据的过程中将会出现性能问题;数据库设计过程中的额外复杂性;RDBMS产品和编程语言在数据类型方面的不协调。大多数现代的RDBMS产品已成熟地用于商务和财政方面,而这些领域不要求很高和很复杂的数据模型。虽然这些产品多多少少克服了一些以上所述的缺点,但从理论上看关系数据模型不直接支持复杂的数据类型,这是由于第一范式的要求,所有的数据必须转换为简单的类型,如整数、实数、双精度数和字符串。对于工程应用来说,这种不能支持复杂数据类型的典型结果就是需要额外地分解数据结构工作,这些被分解的结构不能直接表示应用数据,且从基本成分重构时也非常繁琐和费时间。

b.复杂查询功能差:关系数据库系统的某些优点也同时是它的不足之处。虽然SQL语言为数据查询提供了很好的定义方法,但当用于复杂信息的查询时可能是非常繁琐的。此外,在工程应用时规范化的过程通常会产生大量的简单表。在这种环境下由存取信息产生的查询必须处理大量的表和复杂的码联系以及连接运算。

除非这些查询以固定的例行程序方式提供,否则用户就必须对SQL非常熟悉,以便适当地浏览数据库,查出所需的信息。然而,一旦查询方式按固定例行程序方式进行,用户最终就进行应用软件的常规维护。但应用或人机接口软件的变化又可能要求经常修改例行的查询,数据库结构的变化也可能导致例行查询程序以及应用或人机接口软件的失效。由于这

些原因,关系数据库系统的维护开销可能是很大的。

由于关系数据库不能提供足够的构造能力及性能方面的原因,在进行较复杂的数据库设计过程中,不可能将许多工程问题直接分解成一些简单的部分。由于缺乏直接指针存取方法,所以查询有关的信息需要花费时间。

c.支持长事务能力差;由于RDBMS记录锁机制的颗粒度限制,对于支持多种记录类型的大段数据的登记和检查来说,简单的记录级的锁机制是不够的,但基于键值关系的较复杂的锁机制来说却很难推广也难以实现。

d.环境应变能力差:在要求系统频繁改变的环境下,关系系统的成本高且修改困难。在工程应用中支持"模式演变"(schema evolution)的功能是很重要的,而RDBMS不容易支持这种功能。另外,关系数据库和编程语言所提供的数据类型的不一致,使得从一个环境转换到另一个环境时需要多至30%的附加代码

(3)对象关系数据模型与关系数据模型的联系与区别:

a.关系数据模型具有较高的抽象层次,因此数据结构相当简洁,只有一个核心概念即关系表,非常适合于一些常规的数据事务处理例如银行业务、票务办理、酒店预订、工资和人事管理系统等。随着计算机技术的发展,数据库进入到一个更为广阔的应用领域,例如多媒体数据、网络数据和移动对象数据管理。此时传统关系数据库的局限性就日渐显露。

b.关系模型不支持复杂数据类型,而复杂数据类型正是新型数据库应用中基本对象。复杂数据的处理需要高级程序设计语言的参与,关系数据模型的限制使得像C++或Java等编写的程序难以有效访问数据库数据

c.由于提供了更好的程序组织形式和提高了程序的可靠性,面向对象方法和思想已为人们广泛接受,从20世纪90年代开始,人们就沿着两条途径探讨基于对象的数据库系统:

⑴将面向对象的思想和方法引入关系数据库,对其进行基于对象的扩展,这就是对象关系数据库,其着眼点是将复杂类型数据引入到数据管理过程当中。⑵将面向对象程序语言例如C++持久化,建立全新的数据库系统,这就是面向对象数据库系统,其着眼点是将应用操作引入到数据管理过程当中。

d.对象关系数据库作为关系数据库的面向对象扩展,其本质上还是基于关系数据模型;其特征是通过引入复杂数据类型突破了1NF限制,同时通过引入“继承”和“引用”等技

术增添了面向对象过程部分功能;其数据操纵语句是SQL(SQL3和SQL 2003)。

e.对象关系数据库系统采用对象关系数据模型,而对象关系数据模型是经典关系数据模型的扩充。传统关系模型中数据类型主要有整数、实数、字符串、时间型等简单(原子)数据类型,对现实中较为复杂的实体缺少必要模拟和表现能力。因此,对象关系数据模型就以数据类型扩充为主线而实现关系数据模型的面向对象扩充。

3.时态数据库分为哪几种类型,简述各类时态数据库的基本特征。

传统数据库例如关系数据库描述数据进入数据库时所反映现实世界当前状态。当这种状态发生改变时需要通过合适的更新(插入、删除和修改)再反映到数据库当中,这种更新通常发生后,原先的状态就“自然”消失。对于许多应用系统来说,只保存当前状态是不够的。例如银行系统、人事系统和医疗系统等等,它们都需要着力维护相关的历史数据信息。需要显式表示和管理与时间相关的数据就是时态信息。时态数据的形式特征是其由不显含时间的数据和相应的时间标签组成,而本质是需要将数据本身与特定的时间例如数据的生命周期等紧密结合,时间的处理和数据的管理相融相合,是数据与其相关时间的整合体,因此,常规数据库就不能有效进行时态数据的管理。时态数据库分为以下几种类型:

快照数据库

快照数据库(Snapshot Database)以在特定时刻瞬间快照建立模型。现实世界是变化的,快照数据库可以反映其某一个瞬间的情况。快照数据库无法表示属性与时间的关系,没有维护状态变迁的能力,只进行当前数据库状态的查询和更新,不能进行以往历史数据的查询,而且随着时间演进,其更改的历史数据将会丢失。它也不能进行含有时间因素的推理。快照数据库实际上是一种非时态数据库,它反映数据的当前状态,时间推移将导致数据库状态不断改变,新状态将覆盖旧的状态。快照数据库由静态的二维关系表组成,分别是属性维和元组维。数据库状态变迁由事务实现,一旦事务提交,其状态变迁就立即生效,原来数据库状态也就完全丢失。

下图表示了快照数据库的特性。

快照数据库中无法表示属性与时间的关系,没有维护状态变迁的能力,不能够进行与时间相关的任何工作,

快照数据库状态之间转变的确切时刻是发生在Commit的时刻。这种数据库称为“快照数据库”,意思是它只把握数据库的当前的一个快照状态,“快照”状态是随着时间在不断改变的。这里所说的“快照”和关系数据库中的“快照”的概念不同:关系数据库中快照是为了处理的需要(比如年底结帐的需要)对某个时刻(12月31日23时59分59秒)数据库中的数据进行独立的数据备份。而这里使用的“快照”

只是指数据库只保留一个数据库状态(通常是当前状态)的性质。从时态数据库的观点来看,快照数据库不区分事务时间和有效时间。快照数据库中的基本假定是:存储在系统中的元组一定是现实世界中的有效事实。

回滚数据库

回滚数据库(Rollback Database)支持事务时间,它按事务时间进行编址,保存过去每次事务提交,状态演变之前的状态。回滚数据库由三维的回滚关系组成,在属性维和元组维的基础上增加了事务时间维,因此可看作一个按时间编址的瞬象序列。每一个时间点都对应于一个二维快照数据库。

历史数据库

快照数据库考察特定时刻下现实世界的一个状态,反应了某一个瞬间的情况。例如图1是一个快照数据库的例子。从表2可以知道Peter的一些基本信息。但是,对于“Peter5年前是否为讲师?” 这样的问题,除非对数据表的结构进行特殊处理,否则将难以得到所需结果。为了解决此类问题,就需引入历史数据库。

表2 快照数据库

No N Birth Tit

历史数据库与快照数据库的主要区别是支持有效时间。在数据库中添加对有效时间的支持后,就可以把上表改造成新的表如表3所示。

表3 添加有效时间的数据库

0195 04479

W

hite

5

000

Assiant

-Prof.

20

02-06

20

07-09

0195 04479

W

hite

6

500

Prof.

20

07-10

N

OW

对于上述问题——“Jhon 5年前是不是讲师?”。假如现在是2003年,那么可知5年前,即1998年Jhon已经不是讲师,而是副教授。从这个例子可以看到,加入了有效时间的历史数据库可以大大增加系统包含的信息量,方便人们对信息的处理。

双时态数据库

回滚数据库和历史数据库各具优点,因此,可以设计一种数据库,使它既支持事务时间又支持有效时间,这就是双时态数据库(Bitemporal Database)。双时态数据库集成了前三种类型数据库的基本功能特性,储存了数据库和现实世界两者发展的历史。双时态数据库由时态关系组成,其时态关系是一个四维结构。其中两维是属性和元组,另外两维是事务时间和有效时间,一个时态关系可以看成是一个历史关系的序列。对时态关系的一个回滚操作则是选取了一个特定的历史关系,可对该历史关系进行查询。而每一个事务则引起一个新的历史关系的建立。双时态数据库如图2所示。

图2 双时态数据库

双时态关系的一种实现方法就是组合回滚数据库和历史数据库成为新的数据库。图3是一个元组的四个历史数据库中的有效时间片断组合。我们只是在原来的三维结构的基础之上加了第四维有效时间维,使得数据库变为四个维结构,元组维和属性维与原来无异,故不在此给出。

图3 双时态数据库的两个时间维

只要在事务维中任意截取事务时间点就可以找到相应的元组的有效时间段,不同的事务时间点对应不同的有效时间段(一般是这样的,当然也有有效时间段是一样的不同事务时间点,如事务时间点T1 和T2 的有效时间段是一样的)。可以看出,在事务时间轴上,取不同的时间点,就产生不同的历史数据库,我们可以对上图中的对应于四个事务时间点T1,T2,T3,T4的历史数据库进行查询操作。当然图中所示的只是一个元组的四个历史数据库中的有效时间片断组合,对于其他元组的情况可以类似的进行推理,而后,这些元组组合到一起即形成了四个不同的历史数据库。所以,这四个历史数据库也可以成为是快照历史数据库,说是快照,是因为这四个数据库是分别是四个事务时间的快照;说是历史数据库,是因为每个数据库里面的纪录是历史数据库属性的,记载的是现实元组的真实变化的时间,而非数据库状态变化的时间,我们可以在这四个数据库里面进行增加、改正、删除及查询的工作。在双时态数据库中,我们可以在当前时间对以前的事务时间T1时的该元组属性或有效时间进行改动。例如,可以在T4时间对T1时的历史快照数据库进行修改,通过改变有效时间区间t1,t2和t3为t1和t3。可使得在T1时的快照历史数据库中的元组属性(时间属性)得到了改变。但原先事务时间不能改动,只是增加了一个新的纪录,该记录的事务时间是T4,记录内容是把原来的有效时间进行了改变。由此可见,双时态数据库具有回滚数据库和历史数据库的特性,在保存数据库变迁历史的同时,也保存了现实世界的真实的数据属性,真正体现了对数据时态属性的全面支持。当然,时态数据库是以牺牲大容量的储存空间为代价的,对双时态数据库的储存进行优化是时态数据库研究的一个重要工作。

5.试述数据、信息和知识之间联系与区别,知识分为哪几种类型?

(1)数据、信息和知识之间联系与区别:

数据,知识和信息是三个相关的概念,平常使用中经常不加区别,但从语义范畴上考虑

三者并不具有相同语义,特别表现在其表达的侧重面有所不同,信息是加工后的数据,信息也是数据,知识是一种可以进行推理的信息,知识仍然是数据,

a.数据是对客观事物记录下来的、可以鉴别的符号,这些符号不仅指数字,而且

包括字符、文字、图形等等;数据经过处理仍然是数据。处理数据是为了便于更好地解释,只有经过解释,数据才有意义,才成为信息;可以说信息是经过加工以后、并对客观世界产生影响的数据。

b.信息(1nformation) 是对客观世界各种事物的特征的反映,是关于客观事实的

可通讯的知识。

c.所谓知识,就是反映各种事物的信息进入人们大脑,对神经细胞产生作用后留

下的痕迹。知识是由信息形成的。

d.在管理过程中,同一数据,每个人的解释可能不同,其对决策的影响可能不同。

结果,决策者利用经过处理的数据做出决策,可能取得成功,也可能失败,这里的关键在于对数据的解释是否正确,即:是否正确地运用知识对数据做出解释,以得到准确的信息。

(2)知识的类型:

世界经合组织(OECD)1996年年度报告(以知识为基础的经济)将知识分为四种类型:

1.知道是什么的知识(Know-what)主要是叙述事实方面的知识。

2.知道为什么的知识(Know-why),主要是自然原理和规律方面的知识。

3.知道怎么做的知识(Know-how),主要是指对某些事物的技能和能力。

4.知道是谁的知识(Know-who),涉及谁知道和谁知道如何做某些事的知识。

一般分类

1事实性知识:用于描述领域内的有关概念、事实、事物的属性及状态。如:中国航母在进行远洋航行,太阳从东方升起等。

2过程性知识:与领域相关的、用于指出如何处理与问题相关的信息以及求得问题的解。例如,当信道畅通时,请发绿色信号等。

3控制性知识:又称为深层知识及元知识,是关于如何运用已有的知识进行问题求解的知识,也称为关于知识的知识

按知识作用范围

常识性知识:通用性知识,适用于所有领域;如一年有四个季节。

领域性知识:面向某个具体领域的知识,是专业性知识,如疾病诊断的知识。

按知识的确定性

确定性知识:指其逻辑值为真或假的知识,是精确性知识。例如,他是男性公民。

不确定性知识:不精确、不完全、模糊性知识的总称。例如,今天阴天,可能要下雨。

知识的获取方式

显性知识:指可通过文字、语言、图形、声音等形式编码记录和传播的知识。例如,教材、音视频光盘。

隐性知识:指人们长期实践中积累获得的知识,不易用显性知识表达的知识。例如:每个人都有不同的审美观。

8.简述XML数据库的三种类型及其各自特点。

XML数据库是一种支持对XML格式文档进行存储和查询等操作的数据管理系统。在系统中,开发人员可以对数据库中的XML文档进行查询、导出和指定格式的序列化。

目前XML数据库有三种类型:

(1)XMLEnabledDatabase(XEDB),即能处理XML的数据库。其特点是在原有的数据库系统上扩充对XML数据的处理功能,使之能适应XML数据存储和查询的需要。一般的做法是在数据库系统之上增加XML映射层,这可以由数据库供应商提供,也可以由第三方厂商提供。映射层管理XML数据的存储和检索,但原始的XML元数据和结构可能会丢失,而且数据检索的结果不能保证是原始的XML形式。XEDB的基本存储单位与具体的实现紧密相关。

(2)NativeXMLDatabase(NXD),即纯XML数据库。其特点是以自然的方式处理XML数据,以XML文档作为基本的逻辑存储单位,针对XML的数据存储和查询特点专门设计适用的数据模型和处理方法。

(3)HybridXMLDatabase(HXD),即混合XML数据库。根据应用的需求,可以视其为XEDB 或NXD的数据库,典型的例子是Ozone。

XML数据库是一个能够在应用中管理XML数据和文档的集合的数据库系统。XML数据库是XML文档及其部件的集合,并通过一个具有能力管理和控制这个文档集合本身及其所表示信息的系统来维护。XML数据库不仅是结构化数据和半结构化数据的存储库,像管理

其它数据一样,持久的XML数据管理包括数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。这些文档是持久的并且是可以操作的。

当前着重于页面显示格式的HTML标记语言和基于它的关键词检索等技术已经不能满足用户日益增长的信息需求。近年来的研究致力于将数据库技术应用于网上数据的管理和查询,使查询可以在更细的粒度上进行,并集成多个数据源的数据。但困难在于网上数据缺乏统一的、固定的模式,数据往往是不规则且经常变动的。因此,XML数据作为一种自描述的半结构化数据为Web的数据管理提供了新的数据模型,如果将XML标记数据放入一定的结构中,对数据的检索、分析、更新和输出就能够在更加容易管理的、系统的和较为熟悉的环境下进行,因而我们将数据库技术应用于XML数据处理领域,通过XML数据模型与数据库模型的映射来存储、提取、综合和分析XML文档的内容。这为数据库研究开拓了一个新的方向,将数据库技术的研究扩展到对Web数据的管理。

相关文档