文档库 最新最全的文档下载
当前位置:文档库 › 版本数据库中基于目标匹配的变化信息提取与数据更新1

版本数据库中基于目标匹配的变化信息提取与数据更新1

版本数据库中基于目标匹配的变化信息提取与数据更新1

应申1,李霖1,刘万增2,王红1

(1.武汉大学资源与环境科学学院,武汉珞喻路129号,430079;2.国家基础地理信息中心,

北京市海淀区紫竹院百胜村1 号, 100044)

摘要:采用基于变化信息的增量更新方法为地理信息的更新提供了一种全新的方法,增量式更新是指在主数据库更新过程中或之后,只记录或提取发生变化的特征及其信息,然后将这些信息以增量(Delta)文件的方式提供给用户,并集成到原来客户数据库中的过程。本文结合我国基础地理数据库情况,提出基于版本数据库的变化信息提取和更新发布的技术路线,以道路要素为例,分析其具体实体变化情况,论述变化信息提取中的匹配方法,给出了变化信息的内容定义,并提出变化信息更新的思路。

关键字:版本,数据库,变化信息,匹配,数据更新

1 前言

随着国民经济和社会的快速发展,自然景观和地表形态发生着巨大变化。地理信息不仅具有空间分布特性,还具有很强的时态特性。它一方面要准确记录自然景观和地表形态,另一方面应该反映地理要素的现势性和变化特征。这使得空间数据库的更新和维护的任务也异常艰巨。由于地理数据的加工处理、更新等需要较大的投资和详细复杂的规范来实现,因此形成了专门的地理数据部门来提供基础地理空间数据,如国家测绘系统,专业地理数据公司,如Teleatlas。目前我国的基础地理数据库建设已初具规模,多级别、多尺度、多类型的空间数据和产品体系已经形成。目前这些基础地理数据库的现势性问题以及持续更新问题已成为一个世界性的难题和热门话题[1]。

在数据共享环境中,可将为其他组织机构提供空间参考的源数据称为主数据库,而将根据不同需要对源数据进行加工、完善后派生出的数据库称为客户数据库。使用基础地理数据的用户只需向供应商购买数据,然后根据自身情况来发展自己特有的系统。但是,为了保证空间数据的现势性,用户必须不断的从供应商那获取更新,就要面临如何利用主数据库的更新信息及时更新客户数据库的问题。现在大多数的用户都是批量式更新的方法,这种方法周期长、代价高,并且真正发生变化的空间数据量很小。同时批量式更新的方法具有较大的危险性,可能造成客户数据库信息丢失、数据不一致等问题。采用基于变化信息的增量更新方法为地理信息的更新提供了一种全新的方法,增量式更新是指在主数据库更新过程中或之后,只记录或提取发生变化的特征及其信息,然后将这些信息以增量(Delta)文件的方式提供给用户,并集成到原来客户数据库中的过程,这种方法同时给多比例尺的地图更新提供新的方法[2]。该方法以其快速、高效、数据量小等优点成为研究热点。

本文根据我国已建立的基础地理信息不同时刻的版本数据库,建立基于版本数据库的地理信息变化提取及更新的技术框架,来有效地提取、存储和发布变化信息,并满足用户的更新和集成。由于对地理实体的表达是通过空间数据表达,而实体变化在计算机数字环境中就表现为地理信息的变化,所以这种变化信息的提取是基于不同版本空间数据库中地理目标的匹配技术,而变化情况则可根据地理实体的情况来进行分类。本文以道路要素为例,详细讨论了基于版本数据库的实体变化分类和地理信息变化提取,并论述了对变化信息的建模表达和更新集成。

1“十一五”国家科技支撑计划(2006BAB10B00)、863专题项目(2007AA12Z219,2007AA12Z241)、国家自然基金(40871178)资助。

2 系统路线

基础地理信息数据库为空间数据库,空间数据库增量更新一般包括基础地理信息数据变化信息的发现与提取、增量信息存储和发布、用户数据库更新三个基本环节。增量更新由于其方式灵活而且能够最好地保证空间数据的现势性,是未来空间数据库更新的主要趋势。增量信息采集是空间数据库增量更新的首要环节,根据国家现有空间数据库情况,目前基础地理信息数据的增量信息采集主要是通过与变化前快照数据的叠加比较提取增量信息的方式。本文的研究针对我国已建立不同时刻版本的数据库,即已具有时间快照或者状态。定义数据库时间较新的数据为新版本数据,过去某时刻版本的数据为旧版本数据。

具体实施技术方案为:选定被处理的空间数据库,对版本数据进行规格化处理,通过版本匹配获取基础地理数据集;在基础地理数据集中,通过空间及属性、语义分析,确定实体目标的各种关系和变化类型;根据有关适合基础地理数据变化检测的算法进行变化检测和增量提取,建立增量信息的数据模型和数据库;增量信息库作为内容,以增量更新标准模块为操作,将增量数据进行发布。图1给出了系统技术路线。

12

图1、基于版本数据库的变化信息提取及发布路线

Fig.1 Framework of detection and distribution of change-only information 其中的主要技术难点包括:1)基于新旧版本地形数据的快速定位和匹配。因此必须建立有关索引和查找机制,快速定位和匹配实体,才能将增量信息提取应用到大数据量去。2)增量信息提取算法。根据新旧要素之间在几何特征、社会特征和空间特征的区别和联系,采用高效的检测方法并发现增量信息。基础地形数据的变化有量和质的分别,仅靠几何坐标的识别远不够,还要结合语义的变化和空间邻域的情况来确定目标的质变和形式。3)增量变化信息的建模和表达,解决新旧要素差异表达问题,支持对增量信息的提取、存储。4)增

量信息的发布和与用户数据的融合。必须确保用户对增量信息的可识别和解析,才能将变化

信息呈现给用户,同时有效将变化信息与用户数据有机的融合才真正完成增量信息的更新和

应用。

3 实体变化描述

为了进行提取更新信息,必须理清现实世界实体变化的各种对应关系。这种对应关系是

基于数据库中两种不同时刻版本的数据集表达。空间数据更新在面向用户时表现为地理实体

变化的概念层次描述,或者说要确定地理实体变化的语义关系。Claramunt 等提出基本变化、

变换和运动三种类型的分析方法,基本变化包括出现、消失和稳定不变,而变换包括扩张、

收缩、变形,运动指位移和选择[3]。该时空分析对单目标是可行的,却无法分析多目标和群

的时空变化。本文借用其分类,同时考虑到多目标情况,结合实体变化情况,以道路要素为

例,将目标的变化类型分为以:出现、消失、分割、合并、几何变形、语义转义及修改、稳

定不变等。该分类既考虑到单目标及多目标,也考虑到几何和语义变化。表1列出来道路

要素的实体变化情况。

表1 道路变化分析

Tab.1 Change anlysis of road features

目标数 变化类型 描述

示例 道路延长

道路缩短

几何形变 道路改道

道路等级变化如:二级公路变为一级公路 道路名称变化如:“东环路”改为“清和街” 道路路宽变化

如:道路原来宽35米,现在宽50米 车道数变化

如:道路由双向4车道改为了双向6车道 语义转义、

属性变化 路面状况变化

如:由碎石路变为沥青路,路面状况变好 出现

新修一条道路 单个

对象 消失

拆除一条道路 合并

道路合并 多个 对象

分割 道路分割 4 数据匹配过程

基于变化信息的空间数据更新中,变化信息的提取是前提和基础,目前的变化信息提取

方法主要是基于现有数据的目标匹配,从中发现区别。空间数据匹配技术是类似与地图融合

及合并技术[4][5]。空间目标在匹配时可采用根据地理信息表达中语义、几何、属性、

拓扑等关系进行。Badard 提出了自下而上的方法[6],该方法中先进行目标的几何结点匹配,

然后进行几何的线面匹配,最后进行语义匹配,该方法存在的问题是侯选集过大,造成变化

信息提取的时间较长,对海量空间数据处理不适用。由于我国已经建立了具有相同或相似的

基础地理空间数据库,并且在数据库模式、地理存储上具有一定的规范和定义,本文提出自上而下的匹配方法。

图2、自上而下的目标匹配

Fig.2 Up-to-down object match

首先进行有关版本匹配和要素类语义匹配和过滤,确保后面进行的匹配是在最合适的候

选集中进行。版本匹配是地理空间目标匹配的前提。版本匹配依赖数据库的元数据,它包括时间和空间两个方面的匹配。数据更新的前提是用于更新的数据与被更新数据位于同一坐标系,使之能够可叠加分析,因此空间匹配(坐标匹配)是数据更新不可缺少的环节。考虑到地形图是分幅生产和更新的,则空间匹配主要体现在比例尺、图幅号以及所在图层必须一致。时间匹配指主数据库中用来变化信息提取时要具有时间跨度,才能使差异存在。同时,在客户数据库更新时,其数据的现势性要比主数据库要差,有必要更新,否则客户端无需进行更新操作。

目标匹配的基础首先是其在地理要素类上要具有一致性。要素级语义匹配体现在两个待匹配的区域表示统一专题内容。由于地形图按照要素分层的方法进行组织,如基本比例尺地形图可以分为一般居民地、交通、水系、植被、高程、注记等图层,在整个数据库中,同

一层的数据为一个数据文件。很显然地理实体变化不可能在这几类要素之间进行(语义)变化,因此进行匹配的要素集应在同种要素类,而同种要素类的地理实体才可能会语义变化,表现为重分级,如道路由次干道改造成主干道。同时在同大类内的这种语义变化出现在单目标上,还可能体现在目标间的变化。

在变化信息提取过程中,不同数据集之间的目标匹配是关键。对目标的匹配最普通的是几何匹配方法,利用几何或拓扑的关系,判断目标在空间位置上重复或重叠性。一旦待匹配的目标集(要素类)确定,目标的匹配与变化信息提取就可以自动提取。

单独从几何匹配角度来说,几何匹配是独立于地理实体或空间数据库的。根据几何目标的类型,可以分为点线面目标匹配及其对应的群匹配6类。对点(群)目标匹配,首先从其几何位置出发,以参考目标为基准,通过简单的缓冲区或距离分析来确定待匹配目标,其中关键的是阈值的选择。对线目标的匹配,从几何上采用建立缓冲区、交叉面、hausdorff距离、概率统计等方法,其中hausdorff距离不仅体现位置的差异,而且更能表现图形整体的差异。面目标的匹配一定程度上可以通过几何线的匹配来实现,但是面体差异在线上差异表现被加强,此方法可行性较差。较好的方法是采用面积占有率来进行匹配[7]。另外,在目标之间的匹配算法中,还有基于模糊隶属度的面实体匹配方法[8],基于概率统计的地图线实体匹配方法[9][10],这类概论方法需要预先的样本实验,而不同特征的地形图或不同的要素其实验环境区别较大,同时实验结果对匹配的结果产生直接的影响。

本文在实验中以道路目标匹配为例,采用对线性目标建立缓冲区,利用面积占有方法进

行目标对之间的匹配。变化检测的主要思想是:对目标以一定宽度width做缓冲区A,以该缓冲区为范围查询另一时态版本数据中与该缓冲区范围相交(包括包含)的目标,然后分别对查询得到的目标同样以宽度width做缓冲区Bi,计算A与Bi相交的面积Area(A∩Bi),分别计算相交面积与各目标的面积占有率Sim(A,Bi)=Area(A∩Bi)/Area(A)与Sim(Bi,A)=Area(A∩Bi)/Area(Bi),如果Sim(A,Bi)或Sim(Bi,A)有一个大于给定阈值,则说明两目标关联。然后再根据与之关联的要素个数及Sim(A,Bi)、Sim(Bi,A)值的情况具体确定其变化类型,提取变化信息。图3给出了针对道路目标匹配中,从旧斑数据开始到新版数据匹配的过程。

图3 旧层与新层匹配及变化检测流程

Fig.3 Workflow of change detection from old dataset to new dataset 确定了匹配的目标后,再进行目标的属性比较,确定目标属性的变化,提取几何和属性变化信息。

根据新旧版本中匹配目标的数量,目标匹配时的关系表达为多对多N-M,1-1,1-N,N-1四种。要实现这几种匹配结果,需要对数据库进行双向匹配,可依据时间轴称之为正向匹配和负向匹配,如1-N的匹配在正向匹配中获取,N-1的匹配结构则在负向匹配中获得,产生相应的实体变化情况。多目标匹配可以有效的避免数据更新时不一致性,同时能完整的描述目标的变化情况。根据匹配结构,其相应的变化事件描述可容易获得: 在新层中未匹配的目标为新创建的目标;

在旧层中未匹配的目标为删除的目标;

新层和旧层目标各未匹配一个的为1-1匹配;

旧层1个目标匹配新层M个目标的为1-M匹配,对应着目标的分割;

旧层M个目标匹配新层1个目标的为M-1匹配,对应着目标的合并、聚合或融合;

旧层M个目标匹配新层N个目标的为M-N匹配,对应目标群的重组;

其他为未发生改变保持不变的目标。

5 变化信息表达和更新实施

获取实体的变化信息仅是更新系统的基础,增量变化信息必须提供面向用户的查询,特别是地理实体要素的变化信息;同时由于变化信息是用来更新用户数据库,所以变化信息必须具有相应的数据库操作。因此,本文定义增量信息包括5部分:ΔI={ID,Δsemantics,Δ

graphics, ∪n

i Attribute

1=?

,events}。由于ID的特殊性,把它列在其中。Δsemantics表示两空间目

标间的语义差别,主要体现在分类分级或地理编码上,有关的属性语义差别也在此体现。Δgraphics表达两目标的几何图形的差别。事件不仅包括实体的变化信息,还包括将来数据库更新时的操作。

图4是系统运行的界面,其中突出给出了道路新旧数据变化的对比。

A B C

D E F

图4 系统实例(道路要素):A)旧版数据;B)新版数据;C)删除的路段;D)增加的路

段;E)合并的路段;F)改线的路段

Fig.4 Change-only information about road features:A)old dataset,B)new dataset,C)deleted road features,D) added road features,E)combined road featurs,f)reshaped road features 在实施增量更新时将把地理数据集的更新操作组织成一系列的事务处理。每个事务都包含一个能唯一识别该事务的标识,并且为了完成每个事务,需要对地理数据集进行n个操作。一个更新事务可以理解为对空间实体以什么顺序进行何种更新操作,这种顺序是通过“操作集”来体现的(图5)。我们需要成功实现事务处理中的每个操作,否则整个事务不会成功实现。

增量更新技术有三个基本的特点:1)采用面向对象的技术表示地理实体,而不是面向层或集合,这样变化信息就是针对每个目标,而不是图层,避免麻烦的时间点;2)该方法将质量控制和数据整合融合到一个步骤中,仅仅操作在变化目标上,这可以提高空间数据库维护的效率和保证数据完整性;3)增量更新可以根据不同的需求、不同的数据库形式,采用一定数据转化格式很方便地传播。

图5、空间数据变化、更新结构图

Fig.5 Structure of relationships among changes,events, operators and object levels

6 总结

文章讨论了两种不同时刻版本数据集中通过目标匹配进行变化信息提取以进行更新的具体过程和实现方法,描述了具体的匹配方法和匹配结果类型。该方法获取的增量变化信息是数据库中仅发生变化的信息,在有效的时间间隔下,其数据量是较小的,用户不需要改变全库,为快速、简便空间数据更新提供了新的方式。同时该方法不需要建立统一一致的目标标识,这对客户更新时是至关重要的,因为大多情况用户的标识体系和数据服务者是不一致的。本文重在探讨整理路线和各个关键技术,而对具体细节还有待逐一深化研究。

参考文献

1.陈军,李志林,蒋捷,基础地理数据库的持续更新问题[A],中国地理信息系统协会第

三次代表大会暨第七届年会论文集[C],北京,2003.11,pp11-16

2.陈军,胡云岗,赵仁亮,李志林. 道路数据缩编更新的自动综合方法研究[J]. 武汉大学

学报·信息科学版. 2007.32(11):1022-1027

3.Claramunt C, Theriault M. Managing Time in GIS: an Events-oriented Approach[A]. Recent

Advances in Temporal Databases: Proceedings of the International Workshop on Temporal Databases[C],Berlin: Springer-Verlag,1995.23-42

4.Saalfeld, A. Conflation – Automated Map Compilation. International Journal of

Geographical Information Systems, 1988.2(3), 217-228.

5.李德仁,龚建雅,张桥平.论地图数据库合并技术,测绘科学,2004.29(1):1-5

6. Badard T. On the automatic retrieval of updates in geographic databases based on geographic

data matching tools [A]. Proceedings of ICA[C]. 1999 - Ottawa

7.Vauglin F, Bel Hadj Ali A. Geometric Matching of Polygonal Surfaces in GIS[A]. In the

proceedings of the ASPRS-RTI[C], Annual Conference. Tampa, Floride, USA, 1998.

1511-1516.

8.张桥平,李德仁,龚建雅,城市地图数据库面实体匹配技术[J],遥感学报,2004,8

(2):107-113

9.童小华,邓愫愫,史文中,基于概率的地图实体匹配方法[J],测绘学报,2007,36(2):

210-217

10.Volker Walter and Dieter Fritsch, Matching Spatial Datasets: a Statistical Approach[J], IJGIS,

1999, 13(5): 445-473

Change-only updating based on object match in version databases

YING Shen1, LI Lin1 , LIU Wanzeng2, WANG Hong1

(1.School of Resource and Environment Science,Wuhan University, Wuhan, 430079,China;2. National Geomatics Center of China , Beijing 100044 , China)

Abstract: Incremental updates based on change-only information provide a novel approach for geographic data updating. Incremental updates only record the change-only information and characteristics in master database between different version datasets, and deliver these delta information to client users and integrate them into client database. The paper develops the technique workflow of extraction and implementation of change-only information based on version database. We take road features as example to analyze the change types of realistic entities and discuss the object match method in the process of extraction of change-only information. Also we give the definition of change-only information and the idea about updating mechanism of user’s database based on change-only information.

Key words: version, database, change-only information, match, data updating.

第一作者简介:应申,博士,主要从事地图数据融合和更新,空间分析研究与教学。

E-mail:shy@https://www.wendangku.net/doc/186546543.html,

版本数据库中基于目标匹配的变化信息提取与数据更新1

作者:应申, 李霖, 刘万增, 王红

作者单位:应申,李霖,王红(武汉大学资源与环境科学学院,武汉珞喻路129号,430079), 刘万增(国家基础地理信息中心,北京市海淀区紫竹院百胜村1 号, 100044)

相似文献(10条)

1.学位论文杜胜利基于多版本数据库技术的CSCW工作模型2002

该文描述了一个多版本数据库模型-DBV方法.DBV方法的主要概念是一个数据库版本包含该数据库中所有多版本对象的一个版本.在DBV方法中,数据库版本具有一致性和版本性,并和其他数据库版本逻辑分离.对数据库版本进行操作,使用数据库版本事务,对对象进行操作,使用对象事务.为了实现数据库版本,避免数据冗余,我们用版本树结构来表示版本的派生过程,并用版本戳加以标示.多版本对象用对象标志符和一个数据结构-映射表来表示,映射表的-行包括一个对象版本值(指向某一个物理对象的指针)和一个或几个与此对应的数据库版本,有些版本以显式的方式出现在映射表中,有些则以隐式的方式表示.修改一个共享的数据库版本d的算法如下:首先在映射表中增加一个新行,填入版本值和版本戳d,然后原行中版本戳d被所有版本d的最近的没有显式的出现在映射表中的后代所代替.显式的方式出现在映射表中,有些则以隐式的方式表示.修改一个共享的数据库版本d的算法如下:首先在映射表中增加一个新行,填入版本值和版本戳d,然后原行中版本戳d被所有版本d的最近的没有显式的出现在映射表中的后代所代替.该文主要探讨CSCW系统中的应用共享技术,我们把CSCW系统中所有应用共享对象对应于某一个(组)协作者在某一时刻的值的集合称为CSCW系统的一个版本.CSCW系统初始化时所有应用共享对象的值的集合构成公共的基础版本0,协作者从版本0派生出属于自己的私有版本并在此版本上工作(Check-in),并且能够将属于自己的版本提交给系统(Check-out),系统自动合并各个协作者提交的版本,生成新的公共基础版本(Merge),重复上述过程直到新的公共基础版本符合系统结束条件,由此构成了一个CSCW系统的执行过程.该文将CSCW应用分为组长级应用(group leaderapplication)和组员级应用(group member application).组长应用用于控制CSCW系统的总体发展,而组员应用主要用于控制各个协作者的操作.

2.期刊论文杜胜利.徐力利用多版本数据库实现对考生历史试卷的存储-山东电子2002(1)

这篇文章首先提出了一个多版本数据库模型(DBV方法).DBV方法将多版本数据库分为逻辑层和物理层,并使用版本戳的方法来进行管理.DBV为所有对象建立一个映射表,并定义一个规则,使子版本可以隐式地和父版本共享同一物理对象.为了在计算机自动化考试系统中应用DBV方法,我们对DBV作了一些限制,然后描述了它的具体实施.

3.学位论文曹科DBS多版本并发的移动数据库的设计与实现2005

嵌入式系统和无线通讯技术的结合,产生了一种全新的计算模式——移动计算模式。在移动计算模式下,用户使用手持计算设备,通过无线网络实现对信息的访问,不受时间和地点的限制,也不受运动方式的限制。在移动计算技术中,有一个很重要的分支,就是移动数据库技术。由于移动计算环境的特点,移动数据库必须支持计算平台的移动、网络条件的多样、无线通讯的频繁断接和有限的资源,这些都是传统数据库技术无法解决的,因此需要针对移动计算的特点研究新的方法。

为了更好的讨论移动数据库技术,本文首先对移动计算环境的特点进行了分析。然后对移动数据库中一些重要的概念作了简单的介绍。紧接着回顾了移动数据库发展过程中的一些重要技术。

在成熟技术的基础上,本文对冲突的产生、检测与处理进行了深入地讨论。先是针对读写操作造成的冲突的产生机制和可能的检测方式进行了讨论。随后根据冲突的不同类型

,就冲突的分类方式提出了一些见解,并对每种可能方式提出了比较常用的冲突处理方案。

本文的核心是提高移动数据库系统的并发性能。首先分析了使用快照一级隔离级别的多版本数据库作为移动数据库系统的中央数据库的优势,并针对移动数据库系统对中央数据库的要求和多版本数据库的并发特点,提出了一种解决多版本中央数据库并发问题的方案,并对这个方案的有效性进行了分析。

此外,本文针对移动计算环境安全性、可靠性差的特点,特别提出了数据安全和故障处理策略,以提高移动数据库系统的应用性。

在最后,本文提出了一个完整的移动数据库系统的设计方案,在这个方案中,应用了前面提出的安全策略、故障处理策略和多版本中央数据库的并发策略。方案中给出了一个实用的移动数据库系统的所有实现细节和数据同步中每一步的细化流程图。根据本文中的移动数据库设计方案,本人所在的项目小组已经实现了一个实用的移动数据库同步系统,并成功进行了系统初始化和多用户并发的数据同步。

4.期刊论文杜胜利.连莉利用多版本数据库支持CSCW应用-计算机工程与设计2003,24(1)

介绍了CSCW的概念,随后提出了-个多版本数据库模型(DBV方法).DBV方法将多版本数据库分为逻辑层和物理层,并使用版本戳的方法来进行管理.描述了如何应用DBV方法实现CSCw应用(主要包括check-in、check-out、merge等功能的实现,同时介绍了一个临时版本的概念).最后,简单介绍了一个具体CSCW应用实例.

5.学位论文陈爱蓉工作流管理技术在S-1240交换机数据版本管理系统中的应用2002

随着企业信息化建设和先进制造战略思想的推行,工作流技术已成为进入九十年代以后计算机应用领域的一个新的研究热点。工作流技术是实现企业业务过程建模、业务过程仿真分析、业务过程优化、业务过程管理与集成,从而最终实现业务过程的自动化的核心技术。发展并推广工作流技术对于促进企业管理规范化和信息化有重要的现实意义。

本文首先就工作流管理技术的基本概念和理论作一介绍,在此基础上对基于数据库应用技术的工作流管理系统的实现展开讨论,提出了自己的见解。然后着重讨论了一个实际的工作流管理系统——S-1240程控交换机数据版本维护系统的设计和实现,籍此探讨工作流管理系统的一种实现技术——数据库应用流程化及其解决方案。

S-1240程控交换机数据版本维护系统实现了S-1240程控交换机数据版本维护这一业务过程的自动化及版本信息的计算机管理。更具有意义的是,工作流管理系统在工作流模型的基础上进行版本维护、管理的过程运行,这就意味着版本维护的系统运行已经从过去没有一个具体的可量化指标发展到了一个建立在工作流模型上,按照预先定义好的规则进行执行,并且对于执行的结果随时进行监控和评价的规范化阶段。这正符合了当今企业发展的先进制造战略。论文的设计基本遵从Rational公司的项目开发统一流程,开发进程经历五个阶段:系统建模、需求分析、分析和设计、系统实施、集成测试。系统设计包括数据库模型设计、工作流机设计和用户界面设计三部分,在本文中均有详细描述。

在论文中,作者针对基于数据库应用技术的工作流管理系统作了较为细致的调研和分析,并在总结本课题开发经验的基础上提出了此类工作流管理系统的设计思路和实现方案。

6.期刊论文曹科.钟锡昌.张倪.CAO Ke.ZHONG Xi-chang.ZHANG Ni多版本中央数据库的移动数据库系统并发控制方案-计算机应用研究

2006,23(2)

首先介绍多版本中央数据库在移动数据库中的优势,然后分析由多版本中央数据库带来的同步并发控制问题产生的原因和由此造成的后果.就此问题提出了一个并发方案,并分析这个方案如何解决了并发问题,最后对这种并发方案的实质进行了简要的说明.

7.学位论文朱紫焱MAPGIS7.0离线编辑工具的研究与开发2006

MAPGIs 7.0的空间数据模型是真正的面向地理实体的空间数据模型。它将现实世界中的各种现象抽象为对象、关系和规则,各种行为基于对象、关系和规则,模型更接近人类面向实体的思维方式。它支持对象、类、子类、子类型、关系、有效性规则、数据集、地理数据库等概念,其要素可以描述任意几何复杂度的实体。

MAPGIS7.0在这种空间数据模型的基础上完成了高效稳定的空间存储和完善的版本管理机制。任何用户对数据的操作都可以在生成的一个反映数据库状态的版本上进行,版本之下还可以生成新的版本。这些版本并非空间数据的完整拷贝,而是一些反映版本间数据变化的增量信息。版本模式下的数据编辑允许产生冲突,当提交编辑好的版本到上一级版本时,系统检测冲突,并协调解决冲突。

版本管理的思想,不但为解决多用户并发操作和长事务处理中存在的问题提供了切实有效的途径,对离线编辑也提供了很好的技术保障。用户应用离线编辑功能时,可以将检出的空间对象置于独立的特定版本中,并在客户端对检出的数据完成离线编辑修改后,检入这些空间对象时自动对版本的一致性进行检查,确保数据的完整正确。

本文共分五章,内容如下:

第一章:绪论。介绍了课题背景、研究现状以及本课题的研究内容。

第二章:MAPGIS7.0空间数据库。详细介绍了MAPGIS7.0面向实体的空间数据模型和空间数据库引擎MAPGlS-SDE。

第三章:版本与长事务处理。版本是实现离线编辑的基础,要完成离线编辑的设计首先应了解版本的工作原理。本章首先介绍了长事务模型,然后指出了目前支持GlS长事务处理的最有效的技术,即是在空间数据库引擎中引入版本管理。接着详细介绍了版本,包括:

(1)版本的定义及其相关概念。

(2)版本的实现原理。重点介绍版本相关的数据字典表及其相互联系。

(3)版本的功能设计。

第四章:离线编辑工具的设计与实现。本章从以下儿个方面阐述了离线编辑工具的设计思想:

(1)GIS日益增长的数据需求对离线编辑技术的要求,即离线编辑的产生背景。

(2)离线编辑机制相关的地理数据库,包括主地理数据库、检出地理数据库和增量地 理数据库,以及这些地理数据库之间的关系。

(3)实现离线编辑功能的两个机制:检出数据和检入数据。详细介绍了检出/检入数据的模式、过程、限制等。本节还介绍了检出/检入数据涉及的版本,包括主地理数据库中的主检出版本,和MAPGIS—SDE检出数据库中的同步版本和检出版本等。

(4)离线编辑机制相关的数据字典以及各数据字典间的关系。这是离线编辑功能得以实现的关键所在。 (5)最后,介绍了离线编辑的功能设计。

第五章:结论与展望。总结全文,分析了离线编辑工具的特点,并指山了该工具存在的一些问题以及进一步研究的方向。

8.期刊论文周波.秦玉龙中医图书版本馆藏数据库结构设计-医学信息学杂志2006,27(2)

参照《全国中医图书联合目录》设计"中医图书版本馆藏数据库结构",提出5个关系模式,为建立"中医图书版本馆藏数据库"提供依据,以利于根据不同需要直观、快速、准确、方便、即时的输入与查询中医古籍图书版本馆藏信息.

地理信息系统(GIS)中的时态问题已经成为地理信息系统研究的热点和难点之一。利用时态信息,通过版本化方法,对地理空间数据库的管理等问题提出新的思路。本文主要针对以下几个方面进行了研究和探讨:

(1)利用空间拓扑关系和时态拓扑关系的描述方法,提出时空拓扑关系的复合表达。

(2)利用面向对象思想列出空间数据(结点、弧段、线状地物、面状地物和复杂实体及其拓扑关系)和属性数据的版本变化过程表,为时空数据模型的设计实现提供理论依据。

(3)提出了一种基于时态的数据库系统的基本结构,减少数据冗余。

(4)提出多用户、多版本、多时态的数据库管理模式,并将这种模式应用到数据库更新方面,为空间数据库管理和更新提出了新的思路。

10.学位论文陆爱军中药化学数据库的新版本、数据挖掘及GABA<,A>受体的分子模型化2004

本文将数据挖掘技术引入中药及化学领域,对中药化学数据库进行了新版本的研制及数据挖掘研究,并对咪唑苯并二氮杂卓类化合物对五种重组GABA<,A>受体亚型

α<,x>β<,3>γ<,2>(x=1,2,3,5,6)的亲和力进行了分子模型化的研究.主要研究内容和结果如下:进行了数据库新版本的研制,其中包括规范集、结构框架、结构信息、中药命名系统、合法性检验等方面,给出了很多数据库的检索实例,探讨了中药化学数据库的功能和用途.统计了中药化学数据库的"类药性"性质,结果表明数据库中化合物的分子量和LogP值大部分都满足的Lipinski原则.建立了中药化学数据库的数据仓库和数据集市,对源数据进行了数据清理和概念分层工作,并在此基础上进行了关联规则的挖掘,包括单维关联规则的挖掘和多维关联规则的挖掘.结果表明建立在共有成分基础上的科的单维规则在Takhtaja系统中的解释度不如在Cronquist系统中的解释度.同时还挖掘出很多有趣的可以利用的关联规则比如降血糖(糖尿病)→抗菌、如毛莨科→抗高血压药、抗高血压药→毛莨科、茄科→M胆碱受体拮抗剂、M胆碱受体拮抗剂→茄科、安胎→唇形科.对中药化学数据库进行了包括主成分分析、因子分析、聚类分析以及判别分析等在内的数据挖掘工作.通过因子提取,获得了5个因子,得到一组分布更加密集,更有代表性的化合物集合,对因子进行了命名.考察了变量的选择和标准化对于聚类结果的影响.对一个5个活性的化合物集进行了判别分析,取得了较好的结果.对一系列的咪唑苯并二氮杂卓类化合物与五种重组GABA<,A>受体亚型

α<,x>β<,3>γ<,2>(x=1,2,3,5,6)的亲和力进行了分子模型化的研究,得到了比较理想的模型,并对预报集中化合物的活性进行了预报,结果令人满意.比较分子场的研究表明:对于咪唑苯并二氮杂卓类化合物,C8位正电荷的小体积的取代基、C3位大体积的取代基有利于活性的提高.在FLARM方法中,同时建立了五个模型并得到了五个虚拟受体,并将虚拟受体和统一药效团/受体模型进行了比较发现模型具有一致性,同时说明C8位的取代对于α<,5>的选择性起到很重要的作用.验证了CoMFA中C3位大体积的取代基有利于活性提高的结论,并对CoMFA和FLARM方法进行了比较.

本文链接:https://www.wendangku.net/doc/186546543.html,/Conference_7278040.aspx

授权使用:东北林业大学(dblydx),授权号:d7607a42-55a0-4e76-826c-9e9d009be46e

下载时间:2011年3月5日

相关文档
相关文档 最新文档