文档库 最新最全的文档下载
当前位置:文档库 › GIS的数据获取与处理

GIS的数据获取与处理

GIS的数据获取与处理
GIS的数据获取与处理

第四章GIS的数据获取

地理数据的基本特征

地理数据的三个基本特征是空间,时间和专题属性。

时间和专题属性特征为非空间特征。

1、空间特征:空间特征是地理信息系统或空间信息系统所独有的。空间特征是指空间地物的位置,形状,大小的几何特征,以及与相邻地物的空间关系。

2、专题特征:专题特征指空间现象和空间目标的属性特征,它是指除了时间和空间特征以外的空间现象的其它特征。

3、时间特征:空间数据总是在某一特定的时间或时间段内采集得到或计算得到的。

一、空间数据集及数据源的种类

1、数据源。是指建立GIS的地理数据库所需的各种数据的来源,主要包括地图、遥感图像、文本资料、统计资料、实测数据、多媒体数据、已有系统的数据等。可归纳为原始采集数据、再生数据和交换数据三种来源。

(1)、地图数据

地图是GIS的主要数据源,因为地图包含着丰富的内容,不仅含有实体的类别和属性,而且含有实体间的空间关系。地图数据主要通过对地图的跟踪数字化和扫描数字化获取。地图数据不仅可以作宏观的分析(用小比例尺地图数据),而且可以作微观的分析(用大比例尺地图数据)。在使用地图数据时,应考虑到地图投影所引起的变形,在需要时进行投影变换,或转换成地理坐标。

地图数据通常用点、线、面及注记来表示地理实体及实体间的关系,如:

点——居民点、采样点、高程点、控制点等。

线——河流、道路、构造线等。

面——湖泊、海洋、植被等。

注记——地名注记、高程注记等。

地图数据主要用于生成DLG、DRG数据或DEM数据。

(2)、遥感数据(影象数据)

遥感数据是GIS的重要数据源。遥感数据含有丰富的资源与环境信息,在GIS 支持下,可以与地质、地球物理、地球化学、地球生物、军事应用等方面的信息进行信息复合和综合分析。遥感数据是一种大面积的、动态的、近实时的数据源,遥感技术是GIS数据更新的重要手段。

遥感数据(影象数据)用于提取线划数据和生成数字正射影象数据、DEM数据。

2

(3)、文本资料

文本资料是指各行业、各部门的有关法律文档、行业规范、技术标准、条文条例等,

如边界条约等。这些也属于GIS的数据。

(4)、统计资料

国家和军队的许多部门和机构都拥有不同领域(如人口、基础设施建设、兵要地志等)的大量统计资料,这些都是GIS的数据源,尤其是GIS属性数据的重要来源。

(5)、实测数据

野外试验、实地测量等获取的数据可以通过转换直接进入GIS的地理数据库,以便于进行实时的分析和进一步的应用。GPS(全球定位系统)所获取的数据也是GIS的重要数据源。

4

(6)、多媒体数据

多媒体数据(包括声音、录像等)通常可通过通讯口传入GIS的地理数据库中,目前其主要功能是辅助GIS的分析和查询。

(7)、已有系统的数据

GIS还可以从其它已建成的信息系统和数据库中获取相应的数据。由于规范化、标准化的推广,不同系统间的数据共享和可交换性越来越强。这样就拓展了数据的可用性,增加了数据的潜在价值。

2、数据集。一个结构化的相关数据的集合体,包括数据本身和数据间的联系。数据集独立于应用程序而存在,是数据库的核心和管理对象。

GIS 的主要数据集。数字线划数据(DLG)、数字扫描数据(DRG)、影像数据(DOM)、数字高程数据(DEM)和属性数据(包括社会经济数据)、专业数据。

二、空间数据采集的任务

空间数据采集的任务是将现有的地图、外业观测成果、航空像片、遥感图像、文本资料等转换成GIS可以处理与接收的数字形式,通常要经过验证、修改、编辑等处理。

不同数据输入需要用到不同的设备。例如,对于文本数据通常用交互的方式通过键盘录入,也可用扫描仪扫描后用字符识别软件自动录入;对于矢量地图数据,可用平板数字化仪,采用手扶跟踪的方法输入,也可用扫描仪扫描成图像后,用栅格数据矢量化的方法自动追踪输入;等等。

GIS软件的这一部分还应具有数据转换装载的功能,即能把其它GIS或专题数据库中的数据通过转换装载到当前的GIS系统中。

这一部分GIS软件的数据处理工作主要是几何纠正、图形和文本数据的编辑、图幅的拼接、拓扑关系的生成等,即完成GIS的空间数据在装入GIS的地理数据库前的各种工作。

三、空间数据主要采集技术

在GIS的几何数据采集中,如果几何数据已存在于其它的GIS或专题数据库中,那

么只要经过转换装载即可;对于由测量仪器获取的几何数据,只要把测量仪器的数据传输进入数据库即可,测量仪器如何获取数据的方法和过程通常是与GIS无关的。

对于栅格数据的获取,GIS主要涉及使用扫描仪等设备对图件的扫描数字化,这部分的功能也较简单。因为通过扫描获取的数据是标准格式的图像文件,大多可直接进入GIS的地理数据库。

从遥感影像上直接提取专题信息,需要使用几何纠正、光谱纠正、影像增强、图像变换、结构信息提取、影像分类等技术,主要属于遥感图像处理的内容。

因此,以下主要介绍GIS中矢量数据的采集。GIS中矢量数据的采集主要包括地图跟踪数字化与地图扫描数字化。

6

1、地图跟踪数字化

跟踪数字化是目前应用最广泛的一种地图数字化方式,是通过记录数字化板上点的平面坐标来获取矢量数据的。其基本过程是:将需数字化的图件(地图、航片等)固定在数字化板上,然后设定数字化范围、输入有关参数、设置特征码清单、选择数字化方式(点方式和流方式等),就可以按地图要素的类别分别实施图形数字化了。

由于跟踪数字化本身几乎不需要GIS的其它计算功能,所以跟踪数字化软件往往可以与整个GIS系统脱离开,因而可单独使用。

地图跟踪数字化时数据的可靠性主要取决于操作员的技术熟练程度,操作员的情绪会严重影响数据的质量。操作员的经验和技能主要表现在能选择最佳点位来数字化地图上的点、线、面要素,判断十字丝与目标重合的程度等能力。为了保持一致的精度,每天的数字化工作时间最好不要超过6小时。

GIS中的地图跟踪数字化软件为了获取矢量数据应具有下列基本功能:

1°、图幅信息录入和管理功能

即对所需数字化的地图的比例尺、图幅号、成图时间、坐标系统、投影等信息进行录入和管理。这是所采集的矢量数据的数据质量的基本依据。

2°、特征码清单设置

特征码清单是指安放在数字化仪台面或屏幕上的由图例符号构成的格网状清单,每种类型的符号占居清单中的一格。在数字化时只要点中特征码清单区的符号所在的网格,就可知道所数字化要素的编码,以方便属性码的输入。地图跟踪数字化软件应能使用户方便地按自己的意愿设置和定义特征码清单。

3°、数字化键值设置

即设置数字化标识器上各按键的功能,以符合用户的习惯。

4°、数字化参数定义

主要是指系统应能选定不同类型的数字化仪,并确定数字化仪与主机的通讯接口。5°、数字化方式的选择

主要是指选择点方式还是流方式等进行数字化。

6°、控制点输入功能

应能提示用户输入控制点坐标,以便于进行随后的几何纠正。

2、地图扫描数字化

扫描数字化是目前较为先进的地图数字化方式,也是今后的发展方向,但要实现完全自动化还要做大量艰巨的努力,目前所能提供的扫描数字化软件是半自动化的,还需做相当的人机交互工作。地图扫描数字化的基本思想是:首先通过扫描将地图转换为栅格数据,然后采用栅格数据矢量化的技术追踪出线和面,采用模式识别技术识别出点和注记,并根据地图内容和地图符号的关系,自动给矢量数据赋属性值。

根据目前的技术水平,首先要对所扫描的彩色地图进行分版处理,通常分为黑版要素、水系版要素、植被要素和地貌要素,也可以直接对分版图进行扫描,然后由软件进行二值化,去噪音等处理,经常需要进行一些编辑,以保证自动跟踪和识别

8

的进行;在软件自动进行跟踪和识别时,仍需要进行部分的人机交互,如处理断线、确定属性值等,有时甚至要人工在屏幕上进行数字化。

与地图跟踪数字化相比,地图扫描数字化具有速度快、精度高、自动化程度高等优点,正在成为GIS中最主要的地图数字化方式。

地图扫描数字化的自动化程度高,但必须具有一些对扫描后的地图数据的预处理能力,同时,由于其最后结果同地图跟踪数字化的结果是相同的,因而还必须具有地图跟踪数字化所具有的一些功能。因此,其基本功能可描述为:

1°、地图扫描输入功能

即能使用各种扫描仪把地图扫描数字化为栅格数据。

2°、图像格式转换和图像编辑功能

能接受不同格式的栅格数据,并具有基本的图像编辑功能。

3°、彩色地图图像数据的分版功能

能够将所扫描的彩色地图图像分成不同要素版的图像数据,以便于跟踪和识别。4°、线状要素的矢量化功能

能够对线状要素进行细化、断线修复、跟踪,也即具有自动提取线状要素中心线的功能。由于目前的自动化程度还不够高,经常需要进行人机交互,诸如在多条线的交叉点找到粘连及断开处,原实体连续担图形中断处(桥下河,桥中路……),需人机交互指明继续追踪的方向。

5°、点状符号和注记的自动识别功能

应该能对点状符号和注记字进行自动识别,但完全自动化目前仍有困难,因此,有时需要人工在屏幕上进行数字化。

6°、属性编码的自动赋值

应能对已数字化的要素自动根据其符号特征赋以相应的编码(包括等高线的高程)。这方面目前还需要较多的人机交互。

7°、图幅信息录入与管理功能

同地图跟踪数字化一样,地图扫描数字化也需要录入图幅信息,以便于管理和质量控制。

8°、要素编码设置功能

为了能进行属性编码的自动赋值,以及人机交互地进行属性编码赋值,都必须针对

不同的要求进行地图要素的编码设置。

9°、控制点输入功能

为了进行数字化后的数据纠正,必须具有控制点输入功能。

3、属性数据的采集

属性数据在GIS中是空间数据的组成部分。例如,道路可以数字化为一组连续的象素或矢量表示的线实体,并可用一定的颜色、符号把GIS的空间数据表示出来,这样,道路的类型就可用相应的符号来表示。而道路的属性数据则是指用户还希望知道的道路宽度、表面类型、建筑方法、建筑日期、入口覆盖、水管、电线、特殊交通规则、每小时的车流量等。这些数据都与道路这一空间实体相关。这些属性数据可以通过给予一个公共标识符与空间实体联系起来。

10

属性数据的录入主要采用键盘输入的方法,有时也可以辅助于字符识别软件。

当属性数据的数据量较小时,可以在输入几何数据的同时,用键盘输入;但当数据量较大时,一般与几何数据分别输入,并检查无误后转入到数据库中。

为了把空间实体的几何数据与属性数据联系起来,必须在几何数据与属性数据之间有一公共标识符,标识符可以在输入几何数据或属性数据时手工输入,也可以由系统自动生成(如用顺序号代表标识符)。只有当几何数据与属性数据有一共同的数据项时,才能将几何数据与属性数据自动地连接起来;当几何数据或属性数据没有公共标识码时,只有通过人机交互的方法,如选取一个空间实体,再指定其对应的属性数据表来确定两者之间的关系,同时自动生成公共标识码。

当空间实体的几何数据与属性数据连接起来之后,就可进行各种GIS的操作与运算了。当然,不论是在几何数据与属性数据连接之前或之后,GIS都应提供灵活而方便的手段以对属性数据进行增加、删除、修改等操作。

4、数据格式转换

因GIS软件的原因,不同的GIS软件对空间数据定义和存储结构的差别,GIS数据库中的数据格式之间存在不兼容的问题。即不同的GIS软件所支持的数据存储格式不能直接相互利用。需经过格式转换才能相互被对方使用。

数据格式转换的内容

数据格式转换的内容包括三个方面的内容:

空间定位信息,即几何信息,主要是实体的坐标。

空间关系信息,几何实体之间的拓扑或几何关系数据。

属性信息,几何实体的属性说明数据。

数据格式转换的方式

A、通过外部数据交换文件进行。大部分GIS工具软件都定义了外部交换文件格式,如:

ARCINFO E00;

MapInfo MID;

AutoCAD DXF;

MGE ASCII Loader 等。

系统文件格式的转换需经过三次转换才能完成。

B、通过标准空间数据文件转换。实现二次转换。

12

C、通过标准的API函数进行转换。实现一次转换。

5、空间数据质量、评价、精度及控制

《1》、什么是GIS的数据质量

GIS的数据质量是指数据适用于不同应用的能力。指GIS中空间数据(几何数据和属性数据)在表达空间位置、专题属性和时间特征时所能达到的准确性、一致性、完整性以及三者统一性的程度。

《2》、GIS数据质量研究的目的

GIS数据质量研究的目的是建立一套空间数据的分析和处理的体系,包括

误差源的确定、误差的鉴别和度量方法、误差传播的模型、控制和削弱误差的方法等,使未来的GIS在提供产品的同时,附带提供产品的质量指标,即建立GIS产品的合格证制度。

《3》、研究GIS数据质量的意义

研究GIS数据质量对于评定GIS的算法、减少GIS设计与开发的盲目性都具有重要意义。如果不考虑GIS的数据质量,那么当用户发现GIS的结论与实际的地理状况相差较大时,GIS会失去信誉。

14

《4》、GIS的数据质量的基本特点

1)准确度:即测量值与真值之间的接近程度,可用误差来衡量。

2)精度:即对空间数据描述的详细程度,数据的紧密程度。

精度低的数据,不一定准确度低。

3)不确定度:指空间数据不能精确测得,当真值不可测或无法知道时,就无法确定误差,因而用不确定性取代误差。

1°统计上,用标准差反映可能的误差,因此可以用标准差反映测量值的不确定性。2°大比例尺地图上获得的数据的不确定性比小比例尺的小

3°高空间分辨率遥感图像上得到数据的不确定性比低分辨率数据的小。

4)相容性:指两个不同来源的数据在同一个应用中使用的难易程度。

1°两个相邻地区的土地利用进行拼接,若两图边缘处不仅边界衔接良好,而且类型也一致,则称两图相容性好,反之,数据不相容。这种不相容可以通过统一分类和统一标准来减轻。

2°不同比例尺的地图数据不相容。

3°如果两种不同方法制作的林业图中的一个图的分类体系可以转化成另一个图的分类体系,那么前一个图与后一个图是相容的。

5)一致性:指对同一现象或同类现象的表达的一致程度。同一条河流,在地形图上和土壤利用图上形状就不同。

6)完整性:是指具有同一准确度和精度的数据,在特定空间范围内是否完整的程度。

一般来说,空间范围越大,数据完整性的可能性就要差。

7)可得性:指获取或使用数据得容易程度。

8)现势性:指数据反映客观现象目前状况的程度。

《5》、空间数据误差

1)定义:测量值与真值之间的接近程度用误差来表示,当真值不可测或无法知道时,误差就不能确定,因而用不确定性取代误差。数据误差的大小即数据的不确定程度是一个积累的量。

误差分为系统误差和随即误差

统误差易纠正,随机误差只能逐一纠正,或采取不同处理手段来避免随机误差的产生。

16

2)主要误差的来源(p63)

①数据搜集阶段:

野外测量误差:仪器误差,记录误差

辐射和几何纠正误差

遥感数据误差:

信息提取误差

原始数据误差

地图数据误差:坐标转换误差

制图综合误差

印刷误差

②数据输入阶段:

数字化误差:仪器误差,操作误差

不同系统格式转换误差:栅格-矢量,三角网-等值线

③数据存储阶段:

数值精度不够:数据存储有效位不能满足要求

格网或图像太大

空间精度不够:

地图最小制图单元太小

④数据处理阶段

分类间隔不合理

插值误差

多层数据叠加引起的误差传播

多源数据综合分析误差

比例尺太小引起的误差

⑤数据输出阶段:

输出设备不精确引起的误差

输出的媒介不稳定造成的误差

⑥数据使用阶段:

对数据包含的信息的误解

18

对数据信息使用不当

3)数据的误差类型(p63-64)

几何误差,属性误差,时间误差,逻辑误差

①逻辑误差:河流和道路不能穿过房屋

森林和湖泊不能重合等

对数据进行质量控制和质量保证或质量评价,一般先从数据逻辑性入手,检查逻辑误差,有助于发现不完整的数据和其他三类误差。

②属性误差的例子:多边形边界两旁的属性类型应该不同。

③时间误差的例子:早发生林火的植被长势比晚发生林火的区域应该差。

④几何误差:点误差

线误差

A、点误差:关于某点A的误差,即为测量位置(x,y)与其真实位置(x0,y0)的差异。点误差可以通过计算坐标差和距离的方法得到。

Δx=x-x0

1

Δy=y-y0 或ΔD=(Δx2+Δy2)2

B、线误差:

·如道路,河流,市政或行政边界线等在真实世界中容易找到的,这一类的线性特征的误差主要产生于测量和对数据的后续处理。

·如按数学投影定义的经纬线,按高程绘制的等高线,或气候区划线于土壤类型界线。这一类线性特征的线误差及在确定线的界限时的误差,被称为解译误差。

·解译误差与属性误差直接相关,若没有属性误差,则可以认为那些类型界线是准确的,因而解译误差为零。

另一个角度:线误差为:(p67)

·直线―――骨头型误差分布带模式

·折线―――车链型

·曲线―――串肠型

·直线混和的线

·直线的误差分布一般以线的起点和终点处最大而中点误差最小。

·而折线表达的曲线误差,一般在线段中点处大,而在折线线段端点处小

·曲率大的曲线段容易引起大的误差。

⑤属性误差

20

相关文档