文档库 最新最全的文档下载
当前位置:文档库 › 时空数据模型的研究现状与展望

时空数据模型的研究现状与展望

时空数据模型的研究现状与展望
时空数据模型的研究现状与展望

第26卷 第1期2010年1月地理与地理信息科学

G eography and G eo -Information Science Vol.26 No.1January 2010

收稿日期:2009-10-23; 修订日期:2009-12-22

基金项目:国家自然科学基金项目(40901194、40801162);国家重点基础研究发展计划项目(2009CB723903) 作者简介:薛存金(1979-),男,博士,助研,从事时空数据模型与海洋GIS 研究,已发表论文10余篇。E -mail :cjxue @https://www.wendangku.net/doc/ff17049055.html,

时空数据模型的研究现状与展望

薛存金1,谢 炯2

(1.中国科学院对地观测与数字地球科学中心数字地球科学重点实验室,北京100191;2.中国科学院地理科学与资源研究所资源环境信息国家重点实验室,北京100101)

摘要:分析了时空表达与建模理论的5个发展阶段:基于静态数据模型扩展、面向对象表达、基于对象变化(事件序列)、时空集成和以过程为核心的时空数据模型;阐述了时空数据模型在时空动态语义、地理时空认知表达和地球信息科学解决的基本问题方面的研究现状,并指出由于现有时空数据模型主要以地理实体存在状态的“对象视图”

或“事件视图”(而不是演变特性的“过程视图”

)作为表达载体,割裂了其内在联系,无法实现复杂地理实体的时空语义描述和动态过程分析。最后,提出以地理实体演变为核心的时空语义描述方法和融入地理对象、变化机制、对象变化的时空动态表达将是时空表达与建模理论的发展趋势。关键词:时空数据模型;动态语义;表达框架;变化机制

中图分类号:P208 文献标识码:A 文章编号:1672-0504(2010)01-0001-06

地理实体的动态表达与建模是地球信息科学的核心内容,也是时空分析、地理深层知识获取和挖掘的基础[1,2],对进一步的时空信息模拟、预测及决策分析具有重要意义及应用价值[2-5]。因而,时空数据模型和时态GIS 已成为国内外研究热点。近20多年从不同的认知角度发展了大量时空表达与建模理论,经历了基于传统的静态数据模型扩展[6,7]、面向对象表达[8-11]、基于对象变化(事件序列)[12-15]、时空集成[5,16,17]和以过程为核心[3,18-21]5个发展阶段。

由于地理实体的复杂性和多样性,现有的时空表达与建模理论多基于特定的应用领域、针对特定的科学问题设计,致使时空动态语义出现重叠或空白,表达框架体系不完整。因而,有必要对时空数据模型的时空动态语义和表达框架体系进行梳理,力求为开展时空表达与建模理论提供新的研究思路。

地理实体是时空数据模型的表达载体,解决地球信息科学的基本问题是开展时空表达与建模理论研究的最终目的。本文从时空动态语义、地理实体类型和地球信息科学的基本问题3个角度,阐述现有时空数据模型的研究成果、存在的问题及其根源,并给出时空表达与建模理论发展趋势及其进一步的研究内容。

1 研究现状

1.1 时空动态语义

完整的时空动态语义应包括地理实体、实体变化和引起变化的原因(变化机制)。如此,才能实现

地理实体和实体变化的表达和地理时空信息的深层知识挖掘。因而,定义时空动态语义描述框架为:

S =f (E,EC,CM )

(1)

其中:S 为时空语义,f 为描述框架体系,E 为地理实体,EC 为地理实体变化,CM 为地理实体的变化机制。1.2 地理实体的基本类型

地理实体类型的划分是进行时空表达与建模的前提,从不同的角度研究,其基本类型存在差异[17,22],本文从地理时空认知理论和人的行为习惯出发,根据地理实体的属性、功能、关系在时空域上的变化特性,将地理实体归纳为7种基本类型(图1),语义如表1。其中,X O Y 代表二维地理空间,T 代表时间轴,椭圆的形状和尺寸代表地理实体的空间信息,灰度代表属性信息。

表1 地理实体基本类型的语义描述

T able 1 Sem antics description of the geographical entities

类型

描述语义

I

空间位置相对不变,属性信息也相对不变

空间位置相对不变,属性信息在某一时刻发生变化Ⅲ空间位置相对不变,属性信息在某时段内连续发生变化Ⅳ属性信息相对不变,空间位置信息在某一时刻发生变化Ⅴ空间位置信息在某时刻发生变化,属性信息也发生相应变化Ⅵ属性信息相对不变,空间位置信息在某时段内连续发生变化Ⅶ

空间位置信息在某时段内连续发生变化,属性信息也连续发生变化

1.3 地球信息科学解决的基本问题

能否解决地球信息科学的基本问题及解决的程度如何,是检验时空数据模型科学性的标准。吴立新等把地球信息科学需要解决的基本问题概括为

“4W 2HR ”[22]

,而Paul 等则将其概括为“全球状态”

和“状态变化”两类问题[4]。本文从地理实体的空间、时间、属性的功能关系上进行细化,把地球信息科学需要解决的基本问题归纳为9类:Ⅰ:在给定时刻,地理实体的属性信息和空间信息分布状态问题;Ⅱ:在给定时刻,地理实体间空间拓扑关系问题;Ⅲ:在给定的时间范围内,地理实体的属性信息和空间信息哪些发生了变化、哪些没有发生变化的问题;Ⅳ:在给定的时间范围内,地理实体的属性信息和空间信息发生变化的速度问题;Ⅴ:在未来的给定时刻或给定的时间范围内,地理实体的属性信息和空间信息变化的趋势问题;Ⅵ:在给定位置,地理实体的属性信息在某时刻的状态问题;Ⅶ:在给定位置,地

理实体的属性信息在时间范围内的变化问题;Ⅷ:地理实体在整个生命周期内存在的状态、变化过程问题;Ⅸ:地理实体在整个生命周期内的变化趋势、变化动力问题。其中,基本问题Ⅰ、Ⅱ和Ⅵ是地理实体在给定时刻的状态问题,分别对应“4W2HR”的“What”、

“S2Relationship”、

“What”,并与Paul的“全球状态”基本问题吻合;基本问题Ⅲ、Ⅳ、Ⅶ和Ⅷ是地理实体在给定的时间范围内空间信息和属性信息的功能关系的动态变化问题,对应于“4W2HR”的“What changed how”和Paul的“状态变化”问题;而基本问题Ⅴ和Ⅸ是地理实体在未来给定时间范围内功能关系如何变化及变化趋势问题。

图1 地理实体的基本类型Fig.1 T ypes of the geographical entities

2 研究成果与存在的问题

地学实体及其时空关系的复杂性注定了大多数时空数据模型是针对特定应用领域和科学问题提出的[23,24],其核心思想、表达的地理实体类型和解决的科学问题都存在差异,表2给出了不同发展阶段时空数据模型在核心思想、表达的地理实体类型和解决的基本问题方面的对比分析。从表2可知,随着对地理时空认知程度的深化,时空数据模型的发展在时空语义上更趋完备,表达的地理实体类型和解决的地球信息科学问题也趋于全面。在不同阶段发展起来的时空表达与建模理论能表达特定的地理实体类型、解决某些类型的地球信息科学问题,但同时也存在不足。本文阐述不同发展阶段时空数据模型的研究成果及其不足之处。

2.1 静态数据模型的扩展

早期的时空数据模型具代表性的有时空立方体模型和时空快照模型,该类模型首次在语义上实现了“静态→动态”的扩展,丰富了地理实体的动态语义。通过把时态信息离散地标示在矢量或栅格数据的状态上,利用不同时刻状态的变化检测操作,实现矢量或栅格数据变化信息的表达。该类数据模型在动态语义上的突破,为后续时空建模的时态信息表达奠定了理论基础。

从表达的地理实体类型上分析,由于时态信息离散地标示在矢量或栅格数据的状态上,该数据模型只能表达某时刻状态发生变化的地理实体,无法实现时间范围内连续变化的地理实体的描述与表达。例如,该类数据模型能表达海岸线的变迁、土地的利用变更,却无法实现台风、火势蔓延等现象动态变化的描述与表达。

由于在时空语义下缺少变化信息和变化机制,该类数据模型能够回答某时刻地理实体的状态问题(问题Ⅰ),而对于地理实体某时段内的变化问题(问题Ⅵ),则需要通过模型外部或内部的操作算子实现,问题的复杂性与操作算子的复杂度呈线性比例关系;而对于引起变化的原因、变化的程度及趋势等问题却无能为力。

2

第地理与地理信息科学 第26卷

表2 时空数据模型对比分析

T able2 Comp arative analysis of the sp atio2temporal d ata models

时空数据模型核心思想地理实体类型基本问题类型

传统数据模型

的扩展

面向对象表达

基于对象变化(事件序列)

时空集成以过程为核心1)记录时刻状态(矢量或栅格);类型Ⅰ问题Ⅰ

2)离散时间间隔地标示在状态上,隐式地表达状态变化;类型Ⅱ问题Ⅵ

3)语义描述框架:S=f(E)。类型Ⅳ

1)记录时刻状态对象;类型Ⅰ问题Ⅰ

2)离散时间间隔地标示在对象上,隐式地表达对象变化;类型Ⅱ问题Ⅱ

3)同时记录对象的具有时态信息的空间、属性和关系;类型Ⅳ问题Ⅵ

4)语义描述框架:S=f(E)。类型Ⅴ

1)同时记录初始状态(矢量、栅格、对象)和对象变化(事件);类型Ⅱ问题Ⅰ、Ⅱ

2)离散时间标示在对象(事件)序列上,显式地表达对象变化;类型Ⅳ问题Ⅲ

3)采用对象ID或双向链表实现状态变化的完整视图;类型Ⅴ问题Ⅳ

4)语义描述框架:S=f(E,EC)。问题Ⅵ、Ⅶ

1)等同的记录地理对象的空间信息、时态信息和属性信息;问题Ⅰ~Ⅳ

2)利用外部函数或指针实现空间、时态和属性信息综合集成,并进行动态变化表达;全部实体类型问题Ⅵ

3)语义描述框架:S=f(E,EC),模型的内部函数或指针隐式的地理实体的表达变化机制。问题Ⅶ

1)把时空过程对象作为表达的基本单元,同时记录地理实体、实体变化和变化机制;类型Ⅱ、Ⅲ问题Ⅰ~Ⅳ

2)采用分级的思想,实现不同时态尺度的地理实体表达(状态→过程);类型Ⅳ问题Ⅵ~Ⅸ

3)把变化机制引入时空动态语义和建模框架体系下;类型Ⅴ

4)语义描述框架:S=f(E,EC,CM)。类型Ⅵ、Ⅶ

该类数据模型表达地理实体类型和解决地球信息科学问题的能力有限,不足之处主要包括:1)数据冗余问题:不同时刻状态信息的重复存储;2)地理实体的变化尺度与表达的时态尺度一致性问题:如何解决两者的同步性,尽可能减少信息丢失;3)时刻状态间的信息丢失问题:地理实体的变化尺度与表达的时态尺度不一致和表达连续变化的地理实体时,都会存在信息的丢失问题。

2.2 面向对象的时空数据模型

面向对象的时空数据模型的核心内容是在静态对象数据模型的基础上扩展时态信息的表达。从时空语义上分析,时态信息离散地标示在变化地理对象上,等同地记录对象的空间信息、属性信息和空间关系,而信息的变化需通过不同时刻状态对象的变化操作获取。与基于传统数据模型扩展不同的是,该类数据模型能隐式地表达空间关系的动态变化。

该类数据模型以地理对象作为表达载体,能表达空间信息、属性信息和空间关系同时发生变化的地理实体类型(问题Ⅰ、Ⅱ、Ⅳ、Ⅴ);从解决的地球信息科学问题上分析,不仅能解决空间和属性信息的状态变化问题(问题Ⅰ、Ⅵ),也能回答空间关系的变化问题(问题Ⅱ)。例如,龚健雅利用面向对象技术把时态信息分别标示在属性信息、空间信息、空间关系和对象版本上,实现地理实体的属性信息、空间信息及关系和地理对象的动态变化[9]。

与基于静态数据模型的扩展类似,该类数据模型无法直接表达对象的变化信息,需要通过模型内部和外部的操作算子实现,且同样无法回答对象变化原因、变化程度、变化趋势等问题。其不足之处与基于静态数据模型的扩展类似,主要存在数据冗余和信息丢失,在此不再赘述。

2.3 基于对象变化(事件序列)的时空数据模型

Peuquet等基于事件的时空数据模型是模拟事件序列的时空数据模型的代表[12],通过把地理实体的变化抽象为地理事件,首次把变化的信息纳入时空语义描述与表达框架下,丰富了地理实体的时空语义,实现了地理实体变化信息的显式表达。该类模型同时记录地理实体的初始状态(矢量数据或栅格数据)和变化信息,采用双向链表的形式表达地理实体完整的变化视图,包括任意时刻地理实体的回溯复原和地理实体变化信息的提取。

基于对象变化与模拟事件序列模型的重要区别是初始状态的矢量数据或栅格数据向地理对象的转变,实现地理实体空间、属性和时态信息的等同表达,利用对象ID连接对象的空间、属性和时态信息,构建地理实体的完整动态变化视图结构:时态信息标示在空间信息上,构建空间信息的动态变化视图;时态信息标示在属性信息上,构建属性信息的动态变化视图;而空间和属性信息的时态变化,则表达地理实体的变化历史。因而,基于对象变化和事件序列的数据模型在时空语义上并没有本质的差异,为在时空表达与建模框架中纳入地理实体变化奠定了理论基础。

由于在时空语义中纳入变化信息,该类数据模型能够表达空间位置信息、属性信息和两者同时离散变化的地理实体类型(类型Ⅱ、Ⅳ、Ⅴ)。对于时变性较快或连续变化的地理实体类型,尽管该类数据模型也能表达,但需要解决连续变化→离散表达的

3

第1期 薛存金等:时空数据模型的研究现状与展望

时态尺度问题,尺度过大,事件间的信息丢失越多,很难实现地理实体信息的回溯复原;尺度过小,双向链表之间的关联变得非常复杂,很难实现时态关系的查询。无论时态尺度小到何种程度,由于缺乏事件之间的内在联系性(引起变化的原因),事件与事件之间的信息都会丢失。

从解决地球信息科学的问题上分析,由于记录了变化信息,该类模型能直接回答某时刻地理实体状态和状态变化的问题(问题Ⅰ、Ⅱ、Ⅲ、Ⅵ),并能通过模型内部或外部的操作算子,间接回答地理实体的空间和属性信息的变化速度和变化程度(问题Ⅳ、Ⅶ)。由于缺乏事件与事件间内在联系,该类模型很难回答诸如变化过程、变化趋势和变化动力问题。

尽管该类数据模型首次把变化信息纳入时空语义描述框架中,进一步丰富了时空建模与表达理论,但其不足之处也显而易见,主要包括:1)空间关系的动态表达能力较弱:由于以初始状态和变化关系作为表达载体,而空间关系的表达需要完整地理实体的空间信息,而时刻状态的空间信息需要逐步地回溯复原;2)对于时变性较快和连续变化的实体类型的表达能力较弱:对于时变性较快的实体类型,需要解决双向链表关联的高效性,对于连续渐变的实体类型,需要解决“连续变化→离散表达”最佳转换的时态尺度;3)深层知识挖掘能力较弱:模型中事件间的关系只是简单的时态顺序关系,而现实世界中可能是线性、非线性、动力模型驱动等。

2.4 时空集成的时空数据模型

时空集成的时空数据模型把空间、属性和时态放在独立的框架体系,三者之间利用对象ID、指针、环境设置或函数等关联,实现地理实体的完整表达。例如,Yuan利用空间域、属性域、时态域及三者之间的指针和数学函数实现地理实体的动态表达[17];而Worboys则利用地理对象、地理事件、地理设置及三者之间的对象操作实现地理实体的动态表达[3]。

由于在统一的时空框架下集成了相对独立且紧密关联的空间、时态和属性信息,利用三者之间的关联操作或函数,实现空间、属性信息和空间关系的动态变化或地理实体的历史演变。因而,该类数据模型表达的地理实体较为全面。

从解决的地球信息科学的基本问题上分析,该类模型能直接回答地理实体的“状态问题”和“变化问题”(问题Ⅰ、Ⅱ、Ⅲ、Ⅵ、Ⅶ);通过模型内部或外部的操作函数,能间接回答地理实体的部分变化速度(问题Ⅳ)和变化趋势问题(问题Ⅷ),而在变化的动力和变化范围内的演变过程方面则相对薄弱。

通过集成空间、时间和属性信息,在表达地理实体类型和解决地球信息科学问题的能力方面大大增强,但也存在明显的不足。空间、时态和属性信息是地理实体的3个密切联系的基本要素,在语义上是不可分割的。然而,该类模型却人为地把其隔离开进行描述,在表达地理实体的演变时,再通过内部指针或函数进行关联。随着时空数据的增加,三者之间的关联操作变得更加复杂。

2.5 以过程为核心的时空数据模型

以过程为核心的时空数据模型,尝试在时空语义和表达框架体系中纳入地理实体变化机制,把过程对象———实体演变序列[3,18]、过程序列、时间序列[25]、事件序列[1,26-28]、地理时空单位[19]、区域动态现象[2,20]作为完整的载体进行表达、存储,并采用分级的思想进行“过程→状态”的提取和“状态→过程”的回溯复原,从而实现地理实体的动态变化表达。例如,Yuan等提出“事件-过程-状态”[26]和“事件-过程-序列-区域”[1]地理动态的时空分级表达结构,在火势蔓延、降雨过程模拟等方面具有很好的应用;谢炯等提出“时空过程-演变序列-演变-变元”梯形描述框架[20]和“事件-过程”的逻辑形式化表达结构[21],进行土地利用变化和地籍变更等方面的研究。

由于把过程对象作为完整的表达载体,该类数据模型提供了更丰富的时空语义和更完备的动态表达框架。利用分级表达与存储的思想,在分级的底层设计空间和属性信息的表达结构,在级别内部设计时态信息的表达结构,利用级别与级别间的变化机制实现动态实体的过程化描述、表达与存储。

从表达的地理实体类型上分析,该类数据能表达所有动态变化的地理实体,对于静态实体(类型I),该类数据模型的数据结构却过于复杂。由于在时空语义和表达框架体系中纳入变化机制,该类数据模型能更全面地解决地球信息科学的基本问题,不仅能解决状态变化的问题,也能回答变化的速度及为何发生变化的问题(变化动力)。

尽管如此,该类数据模型在具体实施过程中还存在许多问题需要完善:1)分级表达中,级别内部之间并不只是时态顺序关系,时态顺序关系仅仅表达了地理实体发生的先后,而地理实体的变化可能是线性关系、非线性关系或动力模型的驱动;2)对于连续渐变的地理实体的表达与建模,利用离散事件驱动实体的变化,不仅要解决连续变化实体离散化的

4

第地理与地理信息科学 第26卷

最佳时间尺度问题,也要解决信息的丢失问题;3)过程间、过程内部之间的各种关系、过程操作和过程变化类型及各种地理事件都有可能是实体发生变化的原因(变化机制),由于其类型不一,在模型内部的集成接口、内部参数、返回类型等方面都存在差异,需探讨如何在模型内部实现变化机制的归一化集成。

3 结论与展望

近20多年时空数据模型的发展经历了5个发展阶段,本文从时空动态语义、能表达的地理实体类型和解决的地球信息科学问题3方面对各阶段典型的数据模型进行了归纳分析,指出了各阶段时空数据模型的研究成果和不足之处。另外,时空数据模型的发展历程表明,时空动态语义愈来愈完备,能表达的地理实体类型和解决的地球信息科学问题愈来愈全面。因而,以过程(地理实体演变)为核心的时空数据模型已成为时空表达与建模理论的热点问题[23,24,29,30],也是时空数据模型的发展趋势。

目前,以过程为核心的时空数据模型处于萌芽阶段,不同的学者对时空过程的理解存在差异[1-3,18,25-28],时空表达体系结构不尽相同。随着对变化动力与变化规律探索以及深层地理信息挖掘和地理知识获取的需求,以过程为核心的时空数据模型应从以下方面开展研究:

(1)连续变化和离散变化地理实体的时空过程语义的统一描述框架。融入变化机制是时空过程语义的核心内容,但地理实体的两种变化类型的变化机制存在本质差异。连续变化的地理实体主要依靠实体内部的信息能量的变化驱动,如火势蔓延、台风过程、海洋涡旋过程等;离散变化主要依靠实体外部因素驱动,在地籍变更或土地利用变化的应用中,主要是人为因素(土地划拨、合并、拆迁、所有权变更等)驱动实体变化。连续变化机制无法融入离散的时空过程语义中,反之亦然,因而,如何统一表达两者的时空过程语义是关键性问题。

(2)过程信息∴时刻状态信息的相互表达框架。过程对象作为一个完整的载体进行表达与存储,而数据获取和计算机存储均以时刻状态信息为载体,即“连续过程”与“离散状态”间存在不可调和的矛盾,如何解决这对矛盾,是以过程为核心的时空数据模型的核心内容。基于分级的思想[1,20,21,26],尝试解决了纵向时间上的连续性,而忽略了横向时间上的关联性。

(3)变化机制在模型内部的集成。地理实体的变化机制可以是过程对象间、过程对象内部的各种顺序关系、包含关系、递推关系和关联关系,也可以是过程操作类型和过程变化类型,甚至是各种地理事件。这些变化机制在时空过程语义中进行归纳分析,在时空过程表达框架中进行归一化抽象、实施,从而保证“连续∴离散”“过程∴状态”相互转换。由于变化类型的差异,其操作接口、内部参数类型、返回接口等不相同,如何在模型内部实现统一集成是以过程为核心时空数据模型的关键技术问题。

参考文献:

[1] YUAN M,MCIN TOSH J.GIS representation for visualizing and

mining geographic dynamics[J].Transactions in GIS,2003,3

(2):3-10.

[2] 苏奋振,周成虎.过程地理信息系统框架基础与原型构建[J].

地理研究,2006,25(3):477-484.

[3] CLARAMUN T C,PAREN T C,T H ERAUL T M.Design pat2

terns for spatio2temporal processes[A].SPACCAPIETRA S, MAR YANSKI F.Searching for Semantics:Data Mining,Re2 verse Engineering[C].Chapman&Hall,1997.415-428. [4] PAUL A L,G OODCHILD M F,MA GUIRE D J,et al.G eograph2

ical Information Systems and Sciences:Principles and T echnical Is2 sues(Volume1,Second Edition)[M].New Y ork:Wiley,2005. [5] WORBO YS M F.Event2oriented approaches to geographic phe2

nomena[J].International Journal of Geographical Information Science,2005,19(1):1-28.

[6] LAN GRAN G,CHRISMAN N R.A framework for temporal ge2

ographic information[J].Cartographica,1988,25(3):1-14. [7] LAN GRAN G.Time in Geographic Information System[M].

London:Taylor&Francis,1992.

[8] WORBO YS M F.Unifying t he spatial and temporal component s

of geographical information[A].Advances in Geographic Infor2 mation Systems:Proceedings of t he International Symposium on Spatial Data Handling Information Symposium on Spatial da2 ta Handling[C].Edinburgh,1994.505-517.

[9] 龚健雅.GIS中面向对象时空数据模型[J].测绘学报,1997,26

(4):289-298.

[10] 曹志月,刘岳.一种面向对象的时空数据模型[J].测绘学报,

2002,31(1):72-87.

[11] 崔伟宏,史文中,李小娟.基于特征的时空数据模型研究及在

土地利用变化动态监测中的应用[J].测绘学报,2004,33(2):

138-145.

[12] PEUQU ET D J,DUAN N.An event2based spatiotemporal da2

ta model(ESTDM)for temporal analysis of geographical data

[J].International Journal of Geographical Information Sys2

tems,1995,9:7-24.

[13] HORNS B Y K,EGEN HOFER M.Identity2based change:A foun2

dation for spatio2temporal knowledge representation[J].Interna2

tional Journal of G eographical Information Science,2000,3:207-

224.

5

第1期 薛存金等:时空数据模型的研究现状与展望

[14] 孟令奎,赵春宇,林志勇,等.基于地理事件时变序列的时空数据模型研究与实现[J ].武汉大学学报(信息科学版),2003,28

(2):202-207.

[15] 李勇,陈少沛,谭建军,等.事件驱动的城市公共交通时空数据

模型研究[J ].测绘学报,2007,36(2):203-209.

[16] PEUQU ET D J.It ′s about time :A conceptual framework for

t he representation of temporal dynamics in geographic infor 2mation systems[J ].Annals of t he Association of American Ge 2ographers ,1994,84(3):441-446.

[17] YUAN https://www.wendangku.net/doc/ff17049055.html,e of a t hree 2domain representation to enhance

GIS support for complex spatiotemporal queries [J ].Transac 2tion in GIS ,1999,3(2):137-159

[18] CLARAMUN T C ,THERAUL T M.T oward semantics for model 2

ling spatio 2temporal processes wit hin GIS[A ].KRAA K M J ,MOL ENAAR M.Advances in GIS II [C].Taylor and Francis ,Delft ,t he Net herlands ,1996.47-64.

[19] REITSMA F ,ALBRECH T J.Implementing a new data model

for simulating processes [J ].International Journal of Geo 2graphical Information Science ,2005,10(19):1073-1090.

[20] 谢炯,刘仁义,刘南,等.一种时空过程的梯形分级描述框架及

其建模实例[J ].测绘学报,2007,36(3):321-328.

[21] 吴长彬,闾国年.一种改进的基于事件—过程的时态模型研究

[J ].武汉大学学报(信息科学版),2008,33(12):1250-1254.

[22] 吴立新,龚健雅,徐磊,等.关于空间数据与空间数据模型的思

考———中国协会理论与方法研讨会(北京,2004)总结与分析

[J ].地理信息世界,2005,3(2):42-48.

[23] 王家耀,魏海平,成毅,等.时空GIS 的研究与进展[J ].海洋测

绘,2004,24(5):1-4.

[24] 姜晓轶,周云轩.从空间到时间———时空数据模型研究[J ].吉

林大学学报(地球科学版),2006,36(3):480-485.

[25] GOODCHILD M F.GIScience ,geography ,form ,and process

[J ].Annals of t he Association of American Geographers ,2004,94(4):709-714.

[26] YUAN M.Representing complex geographic phenomena in GIS

[J ].Cartography and Geographic Information Science ,2001,28(2):83-96.

[27] DIAS T L ,CAMARA G ,FONSECA F ,et al.Bottom 2up devel 2

opment of process 2based ontologies [A ].GIScience 2004[C ].Regent s of t he University of California ,2004.64-67.

[28] 张丰,刘仁义,刘南,等.一种基于过程的动态时空数据模型

[J ].中山大学学报(自然科学版),2008,47(2):123-126.

[29] MCIN TOSH J ,YUAN M.Assessing similarity of geographic

processes and event s[J ].Transaction in GIS ,2005,9(2):223-245.

[30] 舒红.整体地理时空语义[J ].黑龙江工程学院学报(自然科学

版),2006,20(4):10-13.

A R eview on Current and Future Studies on Spatio 2T emporal Data Models

XU E Cun -jin 1,XIE Jiong 2

(1.Key L ab of Di gital Earth S cience ,Center f or Earth Observation and Di gital Earth ,Chinese A cadem y of S cience ,

B ei j ing 100191;2.S tate Key L ab of Resource and Envi ronment I nf ormation S ystem ,I nstitute of Geog ra phical

Science and N atural Resources ,CA S ,B ei j ing 100101,China )

Abstract :Theories of spatio 2temporal representation and modeling are systematically analyzed and reviewed ,which developed five stages with expansion based on static data models ,object 2oriented ones ,based on object changes or event sequences ones ,space 2time integrated ones ,and process 2cored ones.Research status on spatio 2temporal dynamic semantics ,representation types of geographical entities ,and scientific issues in geoinformatic domains are discussed ,then the shortcomings are pointed out.Since the "view 2objected"or "view 2evented"with the snapshot ,instead of the "view 2processed"with the properties of evolution ,is taken as representation ,the intrinsic characteristics of dynamic entities are split.Therefore ,it is not easy to carry out the spatio 2temporal dynamic semantics description and dynamic f unctions operations of complex geographical entities.In the end ,the de 2scribing methods of dynamic semantics which take the geographical evolution as a core ,and the dynamic representing f ramework which brings into geographical objects ,change mechanisms ,and object changes ,are presented ,which are f uture studies of the spatio 2temporal representation and modeling.Then the main researches on dynamic semantics ,representation f ramework and in 2tegration mechanisms are discussed.

K ey w ords :spatio 2temporal data model ;dynamic semantics ;representation f ramework ;change mechanisms

6第地理与地理信息科学 第26卷

伦敦大学学院时空分析和大数据挖掘授课型研究生申请要求

伦敦大学学院 时空分析和大数据挖掘授课型研究生申请要求

伦敦大学学院简介 学校名称伦敦大学学院 学校英文名称University College London 学校位置英国 | 英格兰 | 伦敦 2020 QS 世界排名8 伦敦大学学院概述 伦敦大学学院(University College London),英文简称UCL,建校于1826年,位于英国伦敦,世界著名的顶尖高等学府,为享有顶级声誉的综合研究型大学,其排名稳居世界各类权威榜单英国前五。 伦敦大学学院位居2020QS世界大学排名世界第8 ,2020泰晤士高等教育世界大学排名世界第15,2020USNews世界大学排名世界第21 , 2019软科世界大学学术排名(ARWU)世界第15 ,在REF 2014 英国大学官方排名中科研实力以及影响力均位列全英第1 。同时位列2018ARWU学科排名医疗技术世界第2,心理学、人体生命科学世界第3;2019QS学科排名中教育学、建筑学世界第1,人类学、考古学、解剖生理学世界前5 , 时空分析和大数据挖掘专业简介 时空分析和大数据挖掘 时空分析和大数据挖掘专业相关信息 专业名称时空分析和大数据挖掘 专业英文名称Spatio-temporal Analytics and Big Data Mining MSc 隶属学院工程科学学院 学制1年 语言要求雅思6.5(6)托福92(读写24听说20) GMAT/GRE 要求不需要

2020 Fall 申请时间11月 学费(当地货币)28,530 时空分析和大数据挖掘课程内容 序号课程中文名称课程英文名称 1 * 伦敦大学学院时空分析和大数据挖掘研究生申请要求由 Mastermate 收集并整理,如果发现疏漏,请以学校官网为准

大数据的应用现状与展望

自然辩证法小论文 大数据的应用现状与展 望 指导老师:张立 组长、主讲:刘开耀21428164 PPT制作:刘玉婷21428171 论文撰写:雷颖颖陈瞳 资料收集:毕晨光黄一锋 邵炳姜灵轩 董丽华周晴 黄河羚婕JX14014 2015/4/18

大数据的应用现状与展望 摘要:大数据具有规模大、种类多、生成速度快、价值巨大但密度低的特点。大数据应用就是利用数据分析的方法,从大数据中挖掘有效信息,为用户提供辅助决策,实现大数据价值的过程。本文主要介绍了大数据的分析方法、分析模式以及常用的分析工具,将大数据应用归纳为6个关键领域:结构化数据分析、文本分析、Web分析、多媒体分析、社交网络分析和移动分析,并列举了若干大数据的典型应用。最后从基础理论、关键技术、应用实践以及数据安全等4个方面总结了大数据的研究现状,并对大数据应用未来的研究进行展望。关键词:大数据数据分析数据存储4V 在过去的20年中,各个领域都出现了大规模的数据增长,包括医疗保健和科学传感器用户生成数据、互联网和金融公司、供应链系统等。国际数据公司IDC报告[1]称,2011年全球被创建和复制的数据总量为1.8ZB(1ZB≈1021ZB),在短短5年间增长了近9倍,而且预计这一数字将每两年至少翻一番。大数据这一术语正是产生在全球数据爆炸增长的背景下用来形容庞大的数据集合。与传统的数据集合相比,大数据通常包含大量的非结构化数据,且大数据需要更多的实时分析。此外,大数据还为挖掘隐藏的价值带来了新的机遇,同时给我们带来了新的挑战,即如何有效地组织管理这些数据。 1 大数据的定义 目前,虽然大数据的重要性得到了大家的一致认同,但是关于大数据的定义却众说纷纭。大数据是一个抽象的概念,除去数据量庞大,大数据还有一些其他的特征,这些特征决定了大数据与“海量数据”和“非常大的数据”这些概念之间的不同。一般意义上,大数据是指无法在有限时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。科技企业、研究学者、数据分析师和技术顾问们,由于各自的关注点不同,对于大数据有着不同的定义。通过以下定义,或许可以帮助我们更好地理解大数据在社会、经济和技术等方而的深刻内涵。 2010年Apache Hadoop组织将大数据定义为,“普通的计算机软件无法在可接受的时间范围内捕捉、管理、处理的规模庞大的数据集”。在此定义的基础上,2011年5月,全球著名咨询机构麦肯锡公司发布了名为“大数据:下一个创新、竞争和生产力的前沿”的报

数据挖掘研究现状综述

数据挖掘 引言 数据挖掘是一门交叉学科,涉及到了机器学习、模式识别、归纳推理、统计学、数据库、高性能计算等多个领域。 所谓的数据挖掘(Data Mining)指的就是从大量的、模糊的、不完全的、随机的数据集合中提取人们感兴趣的知识和信息,提取的对象一般都是人们无法直观的从数据中得出但又有潜在作用的信息。从本质上来说,数据挖掘是在对数据全面了解认识的基础之上进行的一次升华,是对数据的抽象和概括。如果把数据比作矿产资源,那么数据挖掘就是从矿产中提取矿石的过程。与经过数据挖掘之后的数据信息相比,原始的数据信息可以是结构化的,数据库中的数据,也可以是半结构化的,如文本、图像数据。从原始数据中发现知识的方法可以是数学方法也可以是演绎、归纳法。被发现的知识可以用来进行信息管理、查询优化、决策支持等。而数据挖掘是对这一过程的一个综合性应用。

目录 引言 (1) 第一章绪论 (3) 1.1 数据挖掘技术的任务 (3) 1.2 数据挖掘技术的研究现状及发展方向 (3) 第二章数据挖掘理论与相关技术 (5) 2.1数据挖掘的基本流程 (5) 2.2.1 关联规则挖掘 (6) 2.2.2 .Apriori算法:使用候选项集找频繁项集 (7) 2.2.3 .FP-树频集算法 (7) 2.2.4.基于划分的算法 (7) 2.3 聚类分析 (7) 2.3.1 聚类算法的任务 (7) 2.3.3 COBWEB算法 (9) 2.3.4模糊聚类算法 (9) 2.3.5 聚类分析的应用 (10) 第三章数据分析 (11) 第四章结论与心得 (14) 4.1 结果分析 (14) 4.2 问题分析 (14) 4.2.1数据挖掘面临的问题 (14) 4.2.2 实验心得及实验过程中遇到的问题分析 (14) 参考文献 (14)

时空关联性分析方法研究与应用

时空关联性分析方法研究与应用 摘要:随着信息技术、通讯技术、数字存储技术和高速数据获取技术的迅猛发展,在交通、电力、物流、环境监控、工业生产等领域积累了大量与时间和地理空间相关的数据资源,可这些随时随地获取的、呈爆炸性增长的数据资源在给我们带来丰富信息的同时,“数据越丰富,知识越贫乏”的问题则日益突出。近年来,越来越多的学者认识到,通过研究空间对象随时间的变化规律,发现数据的时空关联规则,分析数据的时空变化趋势并预测未来的时空状态,对于规划建设、指挥调度、应急管理、信息服务等具有重要的应用价值。本文研究的目的是面向智能交通领域,在时空关联性分析基础上,利用时空关联规则挖掘方法获取含时空约束的关联规则,从而进行交通拥堵趋势分析,为道路导航、趋势查询、交通控制等提供辅助决策信息。时空关联性分析是研究空间对象随时间的变化规律,反映时空数据在时间和空间上的关联性,时空关联规则挖掘作为时空关联性分析的主要方法之一,目前已有不少学者对其进行了研究或应用。本文详细介绍了时空关联规则挖掘的研究现状,通过分析现有时空关联规则算法在同时考虑时间和空间约束方面的不足,实现了一种新的时空关联规则挖掘方法。文中首先对时空数据进行空间关联性分析和时间段划分形成事务表,然后对空间关联的项集进行连接并产生时空关联规则。在算法执行过程中,对关联规则挖掘相关的阈值进行了分析,使挖掘所得的结果能更好的满足用户的需求。算法分析和实验对比表明,同时考虑时间和空间约束,能够在分析过程中及时过滤不相关的数据,提高时空关联规则的获取效率,能够有效地发现时空关联规则。在理论研究的基础上,本文设计并实现了一个基于时空关联规则分析交通拥堵趋势的原型系统,可有效地实现时空关联性分析和结果的可视化。 关键词:时空关联性分析,时空关联规则,可视化,阈值分析,交通拥堵 时空关联性分析绪论 当前像气象预报、环境监测和交通控制等领域,在问题的求解过程中越来越需要同时考虑时间和空间因素,而时空关联性分析的目标就是明确时空数据的时间有效性和空间可达性,从而在时间和空间上进行有效的趋势分析和预测。时空关联规则挖掘作为时空关联性分析的主要方法之一,将作为本文研究的重点,用时空关联规则挖掘方法来分析含时间和空间约束的时空关联性,从而进行趋势分析与预测。本章首先阐述了时空关联规则的研究背景,并介绍了国内外学者和研究人员在时空关

海洋时空数据模型分析研究现状

学年论文:海洋时空数据模型研究现状 学院:海洋学院 专业:海洋技术 姓名:钱为 学号:10053212

海洋时空数据模型研究现状 钱为 <天津科技大学海洋学院海洋技术专业天津 300457 ) 【摘要】21世纪是海洋的世纪,海洋的开发与利用促进了海洋科学研究的蓬勃 发展并对海洋时空信息服务提出了更高的要求.本文主要对已有的时空数据模型、进行了评述,指出了各种模型的优点以及存在的问题。在此基础上,说明了海洋时空数据模型研究进展与现状。说明了海洋时空数据模型在实际中的应用, 以及其在海洋领域的不可或缺的地位。 关键词:海洋,时空数据模型,海洋时空数据模型 【 abstract 】 21 century is the century of sea, Marine development and use of promoting the vigorous development of the Marine scientific research and information service on ocean space and time put forward higher request. This paper focuses on the existing space time data model, are reviewed in this paper, and points out the various advantages of the model and the existing problems。 Based on this, that the Marine space time data model research progress and status. That the Marine space time data model in real application, and the important of it. Keywords: Marine, space time data model, Marine space time data model 1:引言 时态地理信息系统( TGIS> 是一种采集、存储、管理、分析与显示地学对象随时间变化信息的计算机系统。建立合理、完善、高效的时空数据模型是实现时态GIS 的基础和关键,以便有效地组织、管理和完善时态地理数据、属性、空间和时间语义,实现重建历史状态,跟踪变化,预测未来。目前,关于时空数据模型的研究大多都是基于陆地应用的,海洋数据由于其测量方式以及自身因素等方面的原因,使其具有不同于陆地上数据的独特之处。因此,现有的各种时空数据模型都不能很好地符合海洋领域的需要,必须根据海洋数据独有的特点建立起合适海洋时空数据模型。海洋时空数据模型建模理论为海洋地理信息系统发展提供理论基础,同时也为“数字海洋”的建设提供的科学依据。本文评析了现有各种基于陆地应用的时空模型不足之处,并对海洋时空数据模型的研究进展进行了综述,着重对ArcGIS 海洋数据模型进行介绍,在此基础上,对其时空数据组织方法进行了改进,并通过在“数字海洋”原型系统工程中进行应用对其进行验证,解决了一定的实际问题。 2:时空数据模型与海洋时空数据模型

浅谈大数据发展现状及未来展望

浅谈大数据发展现状及未来展望 中国特色社会主义进入新时代,实现中华民族伟大复兴的中国梦开启新征程。党中央决定实施国家大数据战略,吹响了加快发展数字经济、建设数字中国的号角。国家领导人在十九届中共中央政治局第二次集体学习时的重要讲话中指出:“大数据是信息化发展的新阶段”,并做出了“推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切实保障国家数据安全”的战略部署,为我国构筑大数据时代国家综合竞争新优势指明了方向! 今天,我拟回顾大数据的发端、发展和现状,研判大数据的未来趋势,简述我国大数据发展的态势,并汇报我对信息化新阶段和数字经济的认识,以及对我国发展大数据的若干思考和建议。 一、大数据的发端与发展 从文明之初的“结绳记事”,到文字发明后的“文以载道”,再到近现代科学的“数据建模”,数据一直伴随着人类社会的发展变迁,承载了人类基于数据和信息认识世界的努力和取得的巨大进步。然而,直到以电子计算机为代表的现代信息技术出现后,为数据处理提供了自动的方法和手段,人类掌握数据、处理数据的能力才实现了质的跃升。信息技术及其在经济社会发展方方面面的应用(即信息化),推动数据(信息)成为继物质、能源之后的又一种重要战略资源。 “大数据”作为一种概念和思潮由计算领域发端,之后逐渐延伸到科学和商业领域。大多数学者认为,“大数据”这一概念最早公开出现于1998年,美国高性能计算公司SGI的首席科学家约翰·马西(John Mashey)在一个国际会议报告中指出:随着数据量的快速增长,必将出现数据难理解、难获取、难处理和难组织等四个难题,并用“Big Data(大数据)”来描述这一挑战,在计算领域引发思考。2007年,数据库领域的先驱人物吉姆·格

数据挖掘研究现状及发展趋势

数据挖掘研究现状及发展趋势摘要:从数据挖掘的定义出发,介绍了数据挖掘的神经网络法、决策树法、遗传算法、粗糙集法、模糊集法和关联规则法等概念及其各自的优缺点;详细总结了国内外数据挖掘的研究现状及研究热点,指出了数据挖掘的发展趋势。 关键词:数据挖掘;挖掘算法;神经网络;决策树;粗糙集;模糊集;研究现状;发展趋势 Abstract:From the definition of data mining,the paper introduced concepts and advantages and disadvantages of neural network algorithm,decision tree algorithm,genetic algorithm,rough set method,fuzzy set method and association rule method of data mining,summarized domestic and international research situation and focus of data mining in details,and pointed out the development trend of data mining. Key words:data mining,algorithm of data mining,neural network,decision tree,rough set,fuzzy set,research situation,development tendency 1引言 随着信息技术的迅猛发展,许多行业如商业、企业、科研机构和政府部门等都积累了海量的、不同形式存储的数据资料[1]。这些海量数据中往往隐含着各种各样有用的信息,仅仅依靠数据库的查询检索机制和统计学方法很难获得这些信息,迫切需要能自动地、智能地将待处理的数据转化为有价值的信息,从而达到为决策服务的目的。在这种情况下,一个新的技术———数据挖掘(Data Mining,DM)技术应运而生[2]。 数据挖掘是一个多学科领域,它融合了数据库技术、人工智能、机器学习、统计学、知识工程、信息检索等最新技术的研究成果,其应用非常广泛。只要是有分析价值的数据库,都可以利用数据挖掘工具来挖掘有用的信息。数据挖掘典型的应用领域包括市场、工业生产、金融、医学、科学研究、工程诊断等。本文主要介绍数据挖掘的主要算法及其各自的优缺点,并对国内外的研究现状及研究热点进行了详细的总结,最后指出其发展趋势及问题所在。 江西理工大学

大数据的应用现状及展望

大数据的应用现状及展望 摘要:互联网时代下,大数据为管理带来的新的发展方向,对人员改革、决策 质量提升、服务效率改善等产生显著的影响。然而大数据在当前技术发展中存在 诸多问题,因此笔者在明晰大数据技术现状基础上,结合问题对其展开分析,旨 在有效提升大数据技术的应用水平。 关键词:大数据;应用现状;展望 Status and Prospect of big data applications Shan Li-lin (Information Center of Fushun Financial Bureau , Fushun 113006,China) Abstract:In the Internet era, big data has become a new development direction brought by management, which has a significant impact on personnel reform, decision-making quality improvement and service efficiency improvement. However, there are many problems in the current technology development of big data. Therefore, based on the clarity of the current situation of big data technology, the author conducts an analysis of big data technology in combination with problems, aiming to effectively improve the application level of big data technology. Keywords: big data; application status; prospect 引言 大数据战略已经成为当前我国的发展战略,对我国经济发展及科技进步将产 生深远的影响。尤其是近些年来,随着信息化高速发展及社会转型的不断提升, 大数据与企事业单位、政府行政机关的管理不断融合,将成为互联网时代下分析 的核心支撑! 1 大数据内涵 大数据,又称为海量数据,是指在数据的数量体积达到一种特别庞大状态, 此时,一般的数据管理工具难以在规定时间内对其提取有效信息、整合类似资料、分析类比问题并且把它转化成对企业有用的信息。这些难以在规定的有效时间内 进行识别、保存和应用的大量数据的集合,需要一种全新的解决方法才可以将其 转化为企业所需要的决策领导力、发现问题和提前预知问题的能力、具有更加清 晰且有条理处理问题的能力。 大数据分为三种类型,包括结构化数据、半结构化数据和非结构化数据,其 中非结构化数据越来越成为大数据的主要组成部分。大数据需要特殊的技术,以 有效地处理海量且结构复杂的数据。与之相关的核心技术主要包括数据挖掘、云 计算平台、MPP数据库、分布式数据库、可扩展的存储系统、分布式文件系统等。 对大数据进行分析往往需要大量的计算机所提供的计算能力,数量少则数十台,多则数千台。随着云时代的来临,将大数据与云计算相结合,利用云计算技 术可以用低廉的成本获得强大的运算能力,使大数据分析的门槛降低。在大数据、云计算与数据挖掘等技术不断发展的背景下,很多过去无法收集或者收集后无法 分析的数据被充分地利用起来,帮助各行各业进行改革与创新,为人类的进步与 发展发挥着巨大的作用[1]。 大数据是一种规模大到在获取、存储、管理、分析方面均远远超过了传统类 型的数据库软件工具能力范围的数据集合,它具有海量的数据规模、快速的数据 流转、多样的数据类型以及价值密度低四大特征,而且实时性强、数据所蕴藏的

基于过程的面向对象时空数据模型数据组织方法

基于过程的面向对象时空数据模型数据组织方法 李景文1a,1b, 邹文娟1a,1b, 田丽亚 2 ,农佳捷3,苏浩3 (1a.桂林理工大学土木与建筑工程学院,桂林541004;1b.广西空间信息与测绘重点实验室,桂林541004;2.湛江市规划勘测设计院,湛江524000;3.广西科技信息网络中心,南宁530012)摘要:在分析现有时空数据模型和面向对象方法的基础上,提出了基于过程的面向对象时空数据模型,该模型能反映时空对象的演变过程,以及在这个过程中产生的事件因果联系,并且通过过程语义和面向对象思想两者的结合较好地解决了时空动态数据的组织、存储和查询问题。 关键词:时空数据模型;过程;面向对象;数据组织 中图分类号:文献标识码:文章编号: 0 引言 随着时态GIS应用的不断推广,时空数据模型已成为国内外众多学者的研究热点。Peuquet和Duan提出了基于事件的时空数据模型[1],该模型能较好地反映地理现象状态改变的因果关系,有利于时空分析,但难以表达事件的历史回溯和动态反演;舒红等提出了基于对象的时空数据模型[2],该模型能隐式地表达对象的几何与拓扑关系的动态变化,但是也难以解决诸如引起对象变化的原因、发展程度、变化趋势等问题;张丰等提出了基于过程的时空数据模型[3],该模型重点表达了参与变化的时空对象和时空过程以及变化的因果联系、演变和约束关系,但在表达与分析突发事件或离散过程的地理实体或现象时具有一定的应用局限性。本文从时空语义建模的角度出发,以过程语义和面向对象为基础,构建了基于过程的面向对象时空数据模型,研究和探讨了基于该模型的时空数据组织和时空查询,表达了时空语义并实现了在语义层面上的数据共享[4],同时实现了时空对象在时间特征、空间特征和属性特征上的统一表达和管理以及在时间轴上的无缝描述。 1空间对象变化的过程语义描述 基于过程语义的时空数据模型[5],将过程对象作为完整的表达载体,该类模型采用分级的思想对“过程→状态”进行提取,然后回溯复原“状态→过程”,从而提供给对象变化更丰富的时空语义和更完整的动态表达。 1.1状态、事件、过程的相互关系 状态是在特定的时间里,空间实体客观存在的形式,表达对象相对恒定的过程。空间对象的存在是指在其生命周期内从出生时态到死亡时态之间的相对稳定的一个过程,空间对象的产生和死亡是一个瞬间状态,空间对象的存在是一个相对稳定的状态[6]。 事件是空间对象在时间维上从一个状态到另一个状态的质变过程,每个事件代表一个状态变化。一个事件的发生一定有唯一的开始时间和结束时间,而一个时间段或时间点可对应多个事件。因此事件在时间维上的顺序表达了空间对象变化的时空过程。 过程是基于分类或抽象所得到的逻辑上相连的事件序列。过程实质上是时间轴上相邻两个状态间的时空对象细化而成的多个具有特殊意义的操作,这些操作导致对象从量的变化到质的变化。 状态(S-State)、事件(E-Event)及过程(P-Process)之间的关系如图1和图2所示: 收稿日期:2010-9- 基金项目:广西自然科学基金重点项目(桂科自2011GXNSFD018003);广西科学研究与技术开发计划项目(桂科能0992030-1、10100018-2);. 作者简介:李景文(1971-),男,博士,教授,从事GIS理论和应用方面的研究。E-mail:lijw2008@https://www.wendangku.net/doc/ff17049055.html,

基于时空数据挖掘的案事件时空分析研究开题报告

如文档对您有帮助,欢迎下载支持,谢谢! 福州大学硕士研究生论文开题报告

一、论文选题依据(包括本课题国内外研究现状述评,研究的理论与实际意义,对科技、经济和社会发展的作用等) 1. 选题依据 1.1研究背景 上世纪90年代以来,为适应全球信息高速公路建设的潮流,我国先后启动了面向政府办公业务的十二个重点信息应用系统工程,简称“十二金工程”[1]。公安信息化工程(即“金盾工程”)就是其中重要的业务系统之一。经过十几年的发展,基本实现了以全国犯罪信息中心(CCIC)为核心,以各项公安业务应用为基础的信息共享和综合利用,为各项公安工作提供强有力的信息支持。与此同时,公安信息系统中也积累了海量的业务信息,其中案事件信息达数百万条,且以每年100至120万条的速度递增[2]。 然而,面对日益庞大的案事件信息和日趋复杂的犯罪形势,以传统的查询、统计等方法和技术很难发现其中隐藏的关联、规律和发展趋势,数据丰富而知识贫乏在相当程度上制约了打击预防犯罪工作的开展。近年来,大数据成为新的创新、竞争和生产力的前沿领域,基于案事件全量大数据的获取、组织、管理和利用为解决上述问题提供了机遇,提出了挑战。因此,利用案事件大数据,分析、挖掘犯罪在空间和时间上的分布规律和变化趋势,获得其隐含的知识和洞察力,为制定犯罪控制策略、识别犯罪模式、优化警力部署和警区规划等提供科学依据,从而增强公安部门打击预防犯罪的能力,提高警务决策水平,具有重要的意义。 1.2 研究意义 案事件的发生与所处的社会、经济、人口和环境之间构成一个复杂系统[3-4]。犯罪问题也是一个复杂的社会问题,受社会环境、经济、人口、文化、心理等多种因素的共同影响,所以可以认为案事件在微观上的技术、手段和宏观上的时空分布规律的变化存在着所处社会环境的表征。以边沁(Jeremy Bentham)为代表的古典犯罪学派和犯罪学之父龙勃罗梭(Cesare Lombroso)开创的实证学派都对犯罪成因做了相关研究。菲利(Enrico Ferri)还系统提出了犯罪原因三元论:人类学因素、自然因素和社会因素[5],李斯特(Frantz von Liszt)认为自然因素只是社会因素的一种,主张二元论,即社会因素和个人因素[6]。这些理论只能定性地说明和解释犯罪行为产生的原因,包括现代犯罪成因研究采用多元回归等统计方法建立的各种犯罪学模型也只能在一定意义上验证已有理论,定量解释和预测较大时间、空间跨度下犯罪行为的变化趋势[7],且具有一定的滞后性,而对于小范围、中短期警务决策所起的作用微乎其微。 以往对案事件的分布研究主要集中于对犯罪空间集聚情况的识别与探测,对时间信息没有充分利用和深度挖掘[8-9],越来越多的研究者发现,案事件从大时间尺度到小时间尺度都表现出一些季节性、周期性甚至是昼夜更替的时间分布特征,犯罪时空分布研究领域也越来越受到关注[10]。时空数据挖掘作为一个新兴的研究领域,正致力于开发和应用新兴的计算技术来分析海量、高维的时空数据,揭示时空数据中的有价

大数据发展现状与未来发展趋势研究

大数据发展现状与未来发展趋势研究 朱孔村 (江苏省科学技术情报研究所,江苏南京210042) 【摘要】数据是信息化时代的“新石油”资源,如何利用好这种“新石油”资源需要大数据技术的支持。文章介绍了大数据技术及其发展历程,概括了当前国内外大数据的发展现状并展望了大数据技术和产业方面的未来发展趋势。 【关键词】大数据;现状;趋势 【中图分类号】TP391【文献标识码】A【文章编号】1008-1151(2019)01-0115-04 Research on the Current Situation and Future Development Trend of Big Data Abstract: Data is the “new petroleum” resource of the information age and how to make good use of this “new petroleum” resource needs the support of big data technology. This paper first introduces the big data technology and its development process and summarizes the current development of big data at home and abroad. Finally, the future development trend of big data technology and industry is prospected. Key words: big data; current situation; trend 1 大数据技术概述 1.1大数据技术 随着物联网、云计算、移动互联网等技术的成熟,以及智能移动终端的普及,全社会的数据量呈指数型增长,全球已经进入以数据为核心的大数据时代。大数据并不是一个新的概念,信息技术发展的每一个阶段都会遇到数据处理的问题,人类需要不停的面对来自数据的挑战。为满足商业结构化数据存储的需求而产生了关系型数据库,为满足互联网时代非结构化数据存储需求而产生了NoSQL技术,而大数据技术的产生是为了解决大型数据集分析的问题。 大数据技术目前还没有一个确切的定义,各行各业有着自己的见解,但总体而言,其关键在于从数量庞大、种类繁多的数据中提取出有用的信息。维基百科从数据处理的角度将大数据定义为一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集。国际数据公司(IDC)给出的报告指出,大数据技术描述了一种新一代技术和构架,以很经济的方式、以高速的捕获、发现和分析技术,从各种超大规模的数据中提取价值[1]。 少量的数据看似杂乱无章,但是当数据累积到一定程度时,就会呈现出一种规律和秩序。大数据的价值就在于数据分析,利用大数据分析技术,从海量数据中总结经验、发现规律、预测趋势,最终为辅助决策服务。《大数据时代》的作者克托·迈尔-舍恩伯格认为:“大数据开启了一次重大的时代转型”,他指出大数据将带来巨大的变革,改变人们的生活、工作和思维方式,改变人们的商业模式,影响人们的经济、政治、科技和社会等各个层面。 1.2大数据发展历程 1.2.1萌芽阶段 20世纪90年代,“大数据”这个术语开始出现。1998年SGI首席科学家John Masey在USENIX大会上提出大数据的概念,他当时发表了一篇名为Big Data and the Next Wave of Infrastress的论文,使用了大数据来描述数据爆炸的现象。但是那时的大数据只表示“大量的数据或数据集”这样的字面含义,还没有涵盖到相关的采集、存储、分析挖掘、应用等技术方法与特征内涵 1.2.2发展阶段 从20世纪末到21世纪初期是大数据的发展期,在这一阶段中大数据逐渐为学术界的研究者所关注,相关的定义、内涵、特性也得到了进一步的丰富。2003至2006年,Google 发布的GFS、MapReduce和BigTable三篇论文对大数据的发展起到重要作用。2006至2009年,大数据技术形成并行运算与分布式系统。2009年,Jeff Dean在BigTable基础上开发了Spanner数据库。随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识管理技术如数据仓库、专家系统、知识管理系统等开始被应用。 1.2.3成熟阶段 2011年至今,是大数据发展的成熟阶段,越来越多的研究者对大数据的认识从技术概念丰富到了信息资产与思维变革等多个维度,一些国家、社会组织、企业开始将大数据上升为 总第21卷233期大众科技Vol.21 No.1 2019年1月Popular Science & Technology January 2019 【收稿日期】2018-11-06 【作者简介】朱孔村(1985-),男,山东临沂人,江苏省科学技术情报研究所实习研究员,从事电子政务相关工作。 - 115 -

浅谈大数据发展现状及未来展望

中国特色社会主义进入新时代,实现中华民族伟大复兴的中国梦开启新征程。党中央决定实施国家大数据战略,吹响了加快发展数字经济、建设数字中国的号角。国家领导人在十九届中共中央政治局第二次集体学习时的重要讲话中指出:“大数据是信息化发展的新阶段”,并做出了“推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切实保障国家数据安全”的战略部署,为我国构筑大数据时代国家综合竞争新优势指明了方向! 今天,我拟回顾大数据的发端、发展和现状,研判大数据的未来趋势,简述我国大数据发展的态势,并汇报我对信息化新阶段和数字经济的认识,以及对我国发展大数据的若干思考和建议。 一、大数据的发端与发展 从文明之初的“结绳记事”,到文字发明后的“文以载道”,再到近现代科学的“数据建模”,数据一直伴随着人类社会的发展变迁,承载了人类基于数据和信息认识世界的努力和取得的巨大进步。然而,直到以电子计算机为代表的现代信息技术出现后,为数据处理提供了自动的方法和手段,人类掌握数据、处理数据的能力才实现了质的跃升。信息技术及其在经济社会发展方方面面的应用(即信息化),推动数据(信息)成为继物质、能源之后的又一种重要战略资源。 “大数据”作为一种概念和思潮由计算领域发端,之后逐渐延伸到科学和商业领域。大多数学者认为,“大数据”这一概念最早公开出现于1998年,美国高性能计算公司SGI的首席科学家约翰·马西(John Mashey)在一个国际会议报告中指出:随着数据量的快速增长,必将出现数据难理解、难获取、难处理和难组织等四个难题,并用“Big Data(大数据)”来描述这一挑战,在计算领域引发思考。2007年,数据库领域的先驱人物吉姆·格雷(Jim Gray)指出大数据将成为人类触摸、理解和逼近现实复杂系统的

讲堂郑宇:多源数据融合与时空数据挖掘(上)

讲堂郑宇:多源数据融合与时空数据挖掘(上) 本文根据郑宇博士在中国人工智能学会AIDL第二期人工智能前沿讲习班所作报告《多源数据融合与时空数据》编辑整理而来,在未改变原意的基础上略作了删减。本文转载自“AI科技评论”,转载已获得授权。谢谢介绍,谢谢邀请!大家经常听到的机器学习、人工智能这些概念,大部分应用案例都是在图形图像以及自然语言处理方面,在城市里跟我们生活比较接近的,特别是应用在时空数据的例子比较少。现在我就用城市大数据为例子,来说明一下机器学习如何应用于时空数据领域。 大家都知道我们现在生活越来越现代化,但是问题越来越多:交通拥堵、环境恶化、能耗增加。要解决这些问题在很多年前看似几乎不可能,因为城市设置非常复杂,环环相扣,牵一发而动全身,现在由于有了各种传感器技术的成熟和云计算单元的成熟,使得我们有各种各样的大数据,从社交媒体到交通流量,从气象条件到地理信息,如果使用得当的话,我们就能够用这些数据来发现城市面临的问题,并进一步通过组合这些数据来解决我们面临的挑战。基于这样的机遇和挑战,我们在2008年就提出了城市计算这样一个愿景,包括以下四个层面:从下往上(下图)有城市感知数据获取,城市数据的管理,城市数据的分析和挖掘到最后服务的提

供。虽然我们今天主题是叫机器学习,但是我想你们肯定想,机器学习到底能解决什么城市问题。在机器学习真正落地的过程中,可能还要依托于其他的平台甚至于其他的学科,包括数据管理。我就成体系地讲讲到底机器学习算法怎么改变我们生活中的方方面面。 从最下面的层面来看,城市数据感知这部分,其实每个层面都发现我们都需要用机器学习的方法来做一些事情,这个层面是概念上划分的,实际说是互相有交集的。 城市数据获取 我们看城市数据的获取,获取方式主要有两种: ●第一种,以传统传感器为感知的方法●第二种,以人为中心的感知方法 第一个,以传统传感器的感知方法进一步可以分成两个子类,要么把传感器放在一些固定的地方,要么把传感器装在一些移动的物体上面,比如说在公交车、出租车上装传感器,但是不管哪一种,一旦装完之后人就不参与了,这个数据自动传到我们后台。 另外一个,以人为中心的感知,这是比较新的概念,也叫群体感知,这里面也分成两个方面,一个叫做被动式群体感知,一个叫主动式群体感知。被动式群体感知,每天每个人都在参与,我们并不知道我们打电话的时候,我们的数据可以拿去改进通话网络的质量;我们并不知道我们公交车上下车刷

大数据时代企业管理中信息安全研究的现状与展望

大数据时代企业管理中信息安全研究的现状与展望 二十一世纪以来,随着物联网及云计算的飞速发展,大数据时代应运而生,同时慢慢成为企业管理的核心技术。但是,因为大数据所处阶段为初始发展阶段,加之管理机制不完善,相应的法律法规也不完善,所以使企业信息安全面临着严峻的挑战。大数据不仅是挑战还是机遇。企业需要树立信息安全意识,全面掌握信息安全的理论知识,更新安全技术,有效提升实践能力。与大数据时代相关的企业管理问题,国内外都非常重视。 标签:大数据时代;企业管理;信息安全;现状与展望 引言:科技的飞速发展,促使整个世界都步入了信息化迅速发展的时代,在此种背景下,社会各界最关注的话题就是信息安全。基于此,文章将对大数据时代企业管理中信息安全保障策略进行详细分析,对大数据时代企业管理信息安全研究进行展望,进而为企业提供更加可靠的外部环境,促进企业的健康发展。 1大数据时代企业管理中信息安全保障策略 1.1企业系统终端 作为一个完整的系统终端,企业包含的终端设备多种多样,因为终端设备不同,所以通信方式也不同,显然信息安全保障措施也不同,企业进行信息安全维护和保障时,必须根据国家有关信息安全保障标准,依据不同层次的终端系统来进行,对企业系统终端的不同类型及多种选择进行最大限度的满足,提出与要求相符的信息安全保障措施,实现信息安全漏洞的科学处理,进一步减少未知风险,为企业系统终端的完善性、可靠性、安全性提供保障。 1.2企业网络边界 作为企业必不可少的构成部分,企業网络在企业发展期间发挥着不容小觑的作用。据相关研究表明,因为企业网络具有分区分层的特征,所以无形中增加了信息安全风险。其中,网络边界问题会产生于企业网络中,而依据网络边界漏洞,不法人员极可能攻击企业网络。所以企业必须采取信息安全保障措施,保障企业内部网络的不同区、不同层,提升企业网络的安全性,以进一步防止企业网络边界的安全漏洞,避免恶意攻击现象发生。为此,必须以不同区、不同层的实际情况,来设定企业网络边界的信息安全保障措施,尽最大限度满足可靠性、科学性及安全性的需求,进而保障企业网络边界。 1.3企业网络安全 企业网络是利用专用网络及公共网络相融合的模式实施生产经营的,是企业物理设备、数据及应用平台的连接体,影响着企业的运行。专用网络主要管理企业的核心业务,其主要的内容有:生产环节、资源供给及应用设备等内容,管理

数据挖掘研究及发展现状

数据挖掘技术的研究现状及发展方向 摘要:数据挖掘技术是当前数据库和人工智能领域研究的热点。从数据挖掘的定义出发,介绍了数据挖掘的神经网络法、决策树法、遗传算法、粗糙集法、模糊集法和关联规则法等概念及其各自的优缺点;详细总结了国内外数据挖掘的研究现状及研究热点,指出了数据挖掘的发展方向。 关键词:数据挖掘;神经网络;决策树;粗糙集;模糊集;研究现状;发展方向 The present situation and future direction of the data mining technology research Abstract: Data mining technology is hot spot in the field of current database and artificial intelligence. From the definition of data mining, the paper introduced concepts and advantages and disadvantages of neural network algorithm, decision tree algorithm, genetic algorithm, rough set method, fuzzy set method and association rule method of data mining, summarized domestic and international research situation and focus of data mining in details, and pointed out the development trend of data mining. Key words: data mining, neural network, decision tree, rough set, fuzzy set, research situation, development direction 0 引言 随着信息技术的迅猛发展,许多行业如商业、企业、科研机构和政府部门等都积累了海量的、不同形式存储的数据资料[1]。这些海量数据中往往隐含着各种各样有用的信息,仅仅依靠数据库的查询检索机制和统计学方法很难获得这些信息,数据和信息之间的鸿沟要求系统地开发数据挖掘工具,将数据坟墓转换成知识金砖,从而达到为决策服务的目的。在这种情况下,一个新的技术——数据挖掘(Data Mining,DM)技术应运而生[2]。数据挖掘正是为了迎合这种需要而产生并迅速发展起来的、用于开发信息资源的、一种新的数据处理技术。 数据挖掘通常又称数据库中的知识发现(Knowledge Discovery in Databases),是一个多学科领域,它融合了数据库技术、人工智能、机器学习、统计学、知识工程、信息检索等最新技术的研究成果,其应用非常广泛。只要是有分析价值的数据库,都可以利用数据挖掘工具来挖掘有用的信息。数据挖掘典型的应用领域包括市场、工业生产、金融、医学、科学研究、工程诊断等。本文主要介绍数据挖掘的主要算法及其各自的优缺点,并对国内外的研究现状及研究热点进行了详细的总结,最后指出其发展趋势及问题所在。 1 数据挖掘算法 数据挖掘就是从大量的、有噪声的、不完全的、模糊的、随机的实际应用数据中提取有效的、新颖的、潜在有用的知识的非平凡过程[3]。所得到的信息应具有先前未知、有效和实用三个特征。数据挖掘过程如图1所示。这些数据的类型可以是结构化的、半结构化的、甚至是异构型的。发现知识的方法可以是数学的、非数学的、也可以是归纳的。最终被发现了的知识可以用于信息管理、查询优化、决策支持及数据自身的维护等[4]。 数据选择:确定发现任务的操作对象,即目标对象; 预处理:包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换等; 转换:消减数据维数或降维; 数据开采:确定开采的任务,如数据总结、分类、聚类、关联规则发现或序列模式发现等,并确定使用什么样的开采算法; 解释和评价:数据挖掘阶段发现的模式,经过用户和机器的评价,可能存在冗余或无关的模式,这时需要剔除,使用户更容易理解和应用。十大经典算法如图2: 目前,数据挖掘的算法主要包括神经网络法、决策树法、遗传算法、粗糙集法、模糊集法、关联规则法等。

时空数据分析算法及其应用研究

时空数据分析算法及其应用研究 空间和时间是现实世界最基本、最重要的属性,许多空间应用系统都需要表 达地学对象的时空属性,例如在地理位置变更、环境监测、城市演化等领域都需 是 术 对象的技 要管理历史变化数据,以便重建历史、跟踪变化、预测未来。面向 实体 用在软件设计中的一种方法,它用在时空数据[1]表达中主要是为了克服给定 题[2] 。下面从 的空间或非空间属性在不同时间不同频率变化而出现的复杂问 KNN、RNN、SkyLine三种时空数据分析算法出发,论述时空数据分析算法的应用。 1、KNN分析算法的基本概述及应用分析 KNN算法是非参数回归模型的基本算法之一,通过在状态空间中搜索与待测 点X相近的k个样本(X i ,Y i ) 估计g n(x) ,因此又称为k最近邻非参数回归,其预测函数[3]可表示为 k k Y=g(X)= W i (X;X k1,?,X k k)Y i = k i Y i (1) i 1 i 1 其中X k1.表示与x距离最近的点,并赋予权值k1;X k2则被赋予权值k2;以此 k个权函数k1,k2,?,k k,满足 类推,得到 k k1≥k2≥?≥k k≥0,k =1 (2) i i 1 KNN算法通过计算样本个体之间的距离或者相似度来寻找与每个样本个体最 相近的K个个体,在这个过程中需要完成一次样本个体的两两比较,所以算法的 。 时间复杂度,跟样本的个数直接相关 K最近邻算法通常情况下是用于分类的,这只是对K近邻算法用途的本质说明[4]。从实际来看,K近邻算法可以应用的地方还有很多,比如系统推荐等等。简 单的讲 ,就是挖掘出客户喜欢的相同商品,来进行相似物品的推荐。另外区分客 户群体,从而使我们更好的为客户服务。 下面是KNN分类器构建实例。KNN的实现分训练和识别两步。训练时,把每类样本降维后的结果作 为KNN的输入。如图1所示,圆圈表示待识别数据所处的位置, 表的类;选择 K 圆中的3个数据,识别结果为三角形代 为3时,选中实线 选择 K值 圆中的5个数据,识别结果为正方形代表的类。 值 为5时,选中虚线 - 1 -

相关文档
相关文档 最新文档