文档库 最新最全的文档下载
当前位置:文档库 › 多边形统计数据空间分析的不确定性研究

多边形统计数据空间分析的不确定性研究

多边形统计数据空间分析的不确定性研究
多边形统计数据空间分析的不确定性研究

不确定性数据管理的要求与挑战

专题 6无所不在 近几十年来,数据管理技术发展迅猛,在 国民经济建设中起到了突出作用。以Oracle、 DB2、SQL Server等为代表的大型关系数据 库管理系统(Relational Database Management System,RDBMS)更是诸多大型信息管理系 统、客户关系管理软件不可或缺的核心部分。 同时,以可扩展标记语言(Extensible Mar k up Language,XML)为代表的半结构化数据管理 技术也在数据交换和缺乏严格结构的数据管理 方面占据一席之地。上述技术均对数据质量、 待处理数据的准确性要求非常高。当原始数据 的质量不高时,需要先经过预处理过程提升数 据质量。以部门人事管理系统为例,员工的个 人资料、薪酬待遇和日常考核等信息必须准 确。但在诸如经济、军事和电信等领域,数据 的不确定性普遍存在,其存在性未知而且各属 性值存在误差。尽管数据预处理能够提升原始 数据集合的质量,但也可能会丧失原始数据集 合的部分性质,导致无法返回高质量的查询结 果[1]。典型的应用背景如下。 传感器网络与射频识别电子标签 传感器网络(Sensor Networ k)[2]与无线 射频识别(Radio Frequency Identification, RFID)[3]是两类新兴的数据收集和传输技术, 在工业、军事等领域中有着重要应用。传感器 网络中分布着众多低成本的传感器节点,相 互之间以无线网络方式通讯,可用来分析处理 数据;无线射频识别利用它的阅读器以非接 触方式读取附近的无线射频识别标签(RFID tag),改变了传统的基于条形码的识别方式。 困扰这两类应用的难题就是数据质量问题。传 感器节点体积小、功耗低、主要使用低成本电 子元器件,因而采集到的数据精度不高;在实 用应用中,无线射频识别阅读器的误读率高达 30%~40%[4]。另外,复杂多变的工作环境也 会降低原始数据的质量。在无线网络环境中, 数据传输的准确性受带宽、传输延时、能量等 因素影响,并不稳定。当查询任务需同时考虑 来自多个传感器或无线射频识别阅读器的数据 时,数据可能不一致,从而增加了数据处理的 难度。 互联网数据 互联网上的信息资源极为丰富,而且这些 信息一直在不断地膨胀,乃至于有人将互联网 称为史上最大规模的数据库。根据2009年1月 中国互联网信息中心(China Internet Networ k Information Center,CNNIC)的调查报告,截 至2008年底,中国网站总数为287.8万个,全 国网页总数约为160.9亿,较2007年增长90%, 网页字数为460,217,386,099KB。但是互联网数 据的质量却不尽如人意。作为一个典型的分散 管理系统,互联网中并不存在一个统一的信息不确定性数据管理的 要求与挑战 李建中1于戈2周傲英3 1哈尔滨工业大学 2东北大学 3华东师范大学 关键词:不确定性数据可能世界模型

空间不确定性研究综述

空间不确定性研究综述 摘要:介绍了空间不确定性的概念,对空间不确定性的研究内容进行阐述说明并归纳总结其研究方法,对不确定性研究的发展趋势进行分析。 关键词:空间数据;不确定性;GIS;研究 1 空间不确定性问题概述 空间数据质量的不确定性研究伴随着GIS 的问世而开始,由于人类测量与表达能力的局限性,描述数据的模型只能是对客观实体的一种近似,此外各种空间操作、处理等又会引入新的误差和不确定性,可以说误差的存在是各类观测与分析数据的基本特征。这往往导致空间特征和空间过程很难被准确确定,从而直接关系到对GIS产品的质量控制,影响了空间数据的反演、多尺度和多角度数据分析和应用建模的效果,影响决策结果的质量。因此,在GIS初步形成和产品化时,就提出了空间数据的不确定性问题,且被国际上列为地理信息科学界重大基础理论研究课题之一。 在不确定性理论提出的早期,不确定性与误差是近义词,二者在多数情况下可以相互通用。误差指统计意义下的偏差或错误,而数据不确定性主要指数据“真实值”不能被肯定的程度。从这个意义看,数据不确定性可以看作是一种更广义与抽象的误差,它既包含随机误差,也包含系统误差和粗差;既包含可度量的误差,又包含不可度量的误差以及数值上和概念上的误差。 不确定性可划分为四类,分别是随机性、模糊性、未确定性和灰色性。随机性的特点是可重复观察,在观察之前知道所有可能的结果,但不知道到底哪一种结果会出现。模糊性是指事物的概念本身是模糊的,即一个对象是否符合这个概念难以确定。就像“一粒”和“一堆”是有区别的两个概念,它们的区别是渐变的,两者之间并不存在明确的界限,这种不确定性就是模糊性。未确定性是指纯主观上的、认识上的不确定性。灰色性是指由于事物的复杂性和噪声干扰,人们只能把握部分信息或信息的大致范围,而不知其全部信息或确切的信息量。 2 不确定性的研究内容 空间数据不确定性的产生来源十分复杂,空间对象本身可能具有不稳定性,在空间数据的获取、存储、传输、分析等过程中会引入更多复杂的不确定性。如在数据获取过程中,仪器精度限制、测量方案完善程度、环境的复杂性、观测员的能力水平、空间分析方法与模型表达的多样性等均会造成空间数据的不确定性。 根据实际应用中的需要,对地理空间数据不确定性的研究又可细分为:位置不确定性、属性不确定性、时域不确定性、逻辑一致性、数据完整性、数据不确定性的传播以及不确定性的可视化表示等[1]。地理空间数据不确定性研究的核心就是建立一套不确定性分析和处理的理论体系和方法体系。 2.1位置不确定性 位置不确定性指表示空间实体的真实位置与实际位置之间的差别,空间实体的位置通常以二维或三维坐标表示,相应的,位置不确定性常用坐标的精度来表示。近年来,空间数据位置不确定性成了研究热点,主要集中在数据源不确定性

第三章 空间数据采集与处理练习资料

一、单选题 1、对于离散空间最佳的内插方法 是: A.整体内插法 B.局部内插法 C.移动拟合法 D.邻近元法 2、下列能进行地图数字化的设备 是: A.打印机 B.手扶跟踪数字化仪 C.主 机 D.硬盘 3、有关数据处理的叙述错误的 是: A.数据处理是实现空间数据有序化的必要过程 B.数据处理是检验数据质量的关键环节 C.数据处理是实现数据共享的关键步骤 D.数据处理是对地图数字化前的预处理 4、邻近元法 是: A.离散空间数据内插的方法 B.连续空间内插的方法 C.生成DEM的一种方法 D.生成DTM的一种方法 5、一般用于模拟大范围内变化的内插技术是: A.邻近元法 B.整体拟合技术 C.局部拟合技术 D.移动拟合法 6、在地理数据采集中,手工方式主要是用于录入: A.属性数据 B.地图数据 C.影象数 据 D.DTM数据

7、要保证GIS中数据的现势性必须实时进行: A.数据编辑 B.数据变换 C.数据更 新 D.数据匹配 8、下列属于地图投影变换方法的 是: A.正解变换 B.平移变换 C.空间变 换 D.旋转变换 9、以信息损失为代价换取空间数据容量的压缩方法是: A.压缩软件 B.消冗处理 C.特征点筛选 法 D.压缩编码技术 10、表达现实世界空间变化的三个基本要素是。 A. 空间位置、专题特征、时间 B. 空间位置、专题特征、属性 C. 空间特点、变化趋势、属性 D. 空间特点、变化趋势、时间 11、以下哪种不属于数据采集的方式: A. 手工方式 B.扫描方式 C.投影方 式 D.数据通讯方式 12、以下不属于地图投影变换方法的是: A. 正解变换 B.平移变换 C.数值变 换 D.反解变换 13、以下不属于按照空间数据元数据描述对象分类的是: A. 实体元数据 B.属性元数据 C.数据层元数据 D. 应用层元数据 14、以下按照空间数据元数据的作用分类的是: A. 实体元数据 B.属性元数据 C. 说明元数据 D. 分类元数据 15、以下不属于遥感数据误差的是: A. 数字化误差 B.数据预处理误差 C. 数据转换误差 D. 人工判读误差

不确定性分析常用的不确定性分析方法有盈亏平衡分析

【基本知识点五】不确定性分析 常用的不确定性分析方法有盈亏平衡分析、敏感性分析、概率分析。 一、盈亏平衡分析 盈亏平衡分析是在一定市场、生产能力及经营管理条件下,通过产品产量、成本、利润相互关系的分析,判断企业对市场需求变化适应能力的一种不确定性分析方法,亦称量本利分析。 在工程经济评价中,这种方法的作用是找出投资项目的盈亏临界点,以判断不确定因素对方案经济效果的影响程度,说明方案实施的风险大小及投资承担风险的能力。 00:0 (一)基本的损益方程式 利润=销售收入-总成本-销售税金及附加 假设产量等于销售量,并且项目的销售收入与总成本均是产量的线性函数,则式中: 销售收入=单位售价×销量 总成本=变动成本+固定成本=单位变动成本×产量+固定成本 销售税金及附加=销售收入×销售税金及附加费率 则:B=PQ-C V Q-C F-tQ 式中: B——利润 P——单位产品售价 Q——销售量或生产量 t ——单位产品营业税金及附加 C V——单位产品变动成本 C F——固定成本 00:0 (二)盈亏平衡分析 1、线性盈亏平衡分析的前提条件: (1)生产量等于销售量; (2)生产量变化,单位可变成本不变,从而使总生产成本成为生产量的线性函数; (3)生产量变化,销售单价不变,从而使销售收入成为销售量的线性函数; (4)只生产单一产品;或者生产多种产品,但可以换算为单一产品计算。 00:0 2、项目盈亏平衡点(BEP)的表达形式 (1)用产销量表示的盈亏平衡点BEP(Q) 产量盈亏平衡点= (2)用生产能力利用率表示的盈亏平衡点BEP(%) 生产能力利用率表示的盈亏平衡点,是指盈亏平衡点产销量占企业正常产销量的比重。所谓正常产销量,是指达到设计生产能力的产销数量,也可以用销售金额来表示。 BEP(%)=(盈亏平衡点销售量/正常产销量)*100% 换算关系为: BEP(Q)=BEP(%)×设计生产能力 盈亏平衡点应按项目的正常年份计算,不能按计算期内的平均值计算。 00:0 (3)用销售额表示的盈亏平衡点BEP(S) BEP(S)=单位产品销售价格*年固定总成本/(单位产品销售价格-单位产品可变成本-单位产品销售税金及附加–单位产品增值税)

空间计量经济学研究综述

第23卷第110期湖南财经高等专科学校学报 V ol 123N o 1110 2007年12月 Journal of Hunan F inancial and Econo m ic College Dec 12007 空间计量经济学研究综述 王立平1  任志安 2 (11合肥工业大学人文经济学院,安徽合肥 230009;21安徽财经大学经济与金融学院,安徽蚌埠 233041) 【摘 要】空间计量经济学是一门新兴的边缘学科,近年来在应用经济领域的运用呈现出爆炸的态势,成 为西方经济计量学理论中一个亮点。目前国内对于空间计量经济学的认识不够,其相关研究更是少见。通过系统介绍空间计量经济学理论方法与应用,包括空间计量经济学的基本理论、模型设定、参数估计与模型检验,并对空间计量经济学的最新进展进行评述。 【关 键 词】空间计量经济学;空间权重;空间自回归模型;空间误差构成模型 【中图分类号】F22410 【文献标识码】A 【文章编号】1009-4148(2007)06-0025-04 ?收稿日期:2007-10-10 基金项目:安徽省社科规划项目“安徽省地区经济差异的空间计量分析与协调发展研究”(项目号:AHSKF03-04D16)的阶段成果之一 作者简介:王立平(1968- ),男,安徽合肥人,合肥工业大学人文经济学院副教授,管理学博士,硕士生导师, 主要研究方向:计量经济分析、区域经济学;任志安(1965- ),男,安徽合肥人,安徽财经大学经济与金融学院副教授,管理学博士,硕士生导师,主要研究方向:微观经济学、区域经济理论与实践 空间计量经济学是新兴的一门边缘学科,近十几年空 间计量模型在国外社会科学很多领域,尤其在应用经济领域的运用呈现出爆炸的态势,成为计量经济学理论中一个亮点。从文献检索看,目前国内关于该学科的研究几乎是空白,国外有学者曾用空间计量模型研究过中国问题,如 Lesage [1] 运用空间计量经济模型对中国区域经济增长问题所做的研究;Coughlin and Segev [2]对中国F D I 区域分布的影响因素的空间经济分析。 一、空间计量经济学的产生与发展 空间计量经济学是计量经济学的一个子集,主要应用于截面数据和平行面数据(panel data )回归模型中复杂的空间相互作用与空间依存性结构分析[3]。 空间计量经济学发端于空间相互作用理论及其进展。尽管空间相互作用关系一直是人们研究中所关注的问题,但空间关系理论分析框架直到20世纪末才逐渐提出。例如,Paelinck [4]论文中强调空间相互依存的重要性、空间关系的渐进性和位于其他空间适当因素的作用。Akerl of [5]提出了相互作用粒子系统模型(interacting particle sys 2 te m s )、Durlauf [6] 阐述了随机域(random field models )模型、Aoki [7]提出均值域相互作用宏观模型、Durlauf [8]提出相邻溢出效应模型和Fujita [9]等提出报酬递增、路径依赖和不完全竞争等新经济地理模型,等等。正是这些理论创新使空间相互作用研究的可能性成为现实。 空间计量经济学产生的另一股动力来自解决实际“问题”数据的驱动。空间计量经济学最初起源于在区域科学和分析地理学有广泛应用的空间统计学,人们在空间相互作用研究中,遇到了各种实际“问题”数据。例如,解释变量的构造经常依据被解释变量的范围进行空间插值估计,导致空间预测呈现出系统空间变异的预测误差,此类问题在研究环境和资源分配的经济效果时常常遇到。再如,在空间数据汇总时,往往会出现数据与经济变量不匹配的问题,这些空间数据的共同特征是普通回归模型的误差序列是空间相关的,这些“问题”数据所引起普通模型设定的偏倚,推动了空间计量经济模型的产生。 最近二、三十年,随着计算技术和计算机模拟技术的发展以及一大批专家学者如Anselin 、B ruecckner 、Kele 2jian 、Haining 和Case 等人的不懈努力,空间计量经济学取得了突飞猛进的发展。 二、空间计量经济学的基本理论 空间计量经济学是一个比较复杂的系统理论体系。在这个理论体系中,有几个核心的理论范畴,如空间反应函数、空间异质性和空间依存性、空间权数和空间过滤程序等。 1、空间反应函数

空间数据基本理论

1.空间地理数据的基本特征 要完整地描述空间实体或现象的状态,一般需要同时有空间数据和属性数据。如果要描述空间实体或的变化,则还需记录空间实体或现象在某一个时间的状态。所以,一般认为空间数据具有三个基本特征: ⑴空间特征表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示。 ⑵属性特征表示现象的特征,例如变量、分类、数量特征和名称等等。 ⑶时间特征指现象或物体随时间的变化。 位置数据和属性数据相对于时间来说,常常呈相互独立的变化,即在不同的时间,空间位置不变,但是属性类型可能已经发生变化,或者相反。因此,空间数据的管理是十分复杂的。 有效的空间数据管理要求位置数据和非位置数据互相作为单独的变量存放,并分别采用不同的软件来处理这两类数据。这种数据组织方法,对于随时间而变化的数据,具有更大的灵活性。 2.如何在计算机内部用数字形式描述客观事物或现象 对地理信息进行数字化描述,就是要使计算机能够识别地理事物的形状,为此,必须精确地指出空间模式如何处理,如何显示等。在计算机内描述空间实体有两种形式:显式描述和隐式描述。在计算机中的显式表示,就是栅格中的一系列像元。隐式表示是由一系列定义了始点和终点的线及某种连接关系来描述。 计算机对地理实体的显式描述也称栅格数据结构,计算机对地理实体的隐式描述也称矢量数据结构。栅格和矢量结构是计算机描述空间实体的两种最基本的方式。 在栅格数据结构中,整个地理空间被规则地分为一个个小块(通常为正方形),地理实体的位置是由占据小块的横排与竖列的位置决定,小块的位置则由其横排竖列的数码决定,每个地理实体的形态是由栅格或网格中的一组点来构成。

水文系统不确定性分析方法综述

《水资源系统优化规划与管理》 课程论文 学院: 专业: 姓名: 学号: 任课教师: 2017年1月3日

水文系统不确定性分析方法综述 杨金孟 (山东农业大学水利土木工程学院山东泰安271018 ) 摘要:水文系统是一个复杂的系统,包含了很多不确定性因素,增加了精确模拟和预测水文过程的困难。为了提高计算结果的可靠性,水文系统的不确定性分析已成为当前研究的热点。本文对水文系统不确定性分析方法及应用研究进展进行了分类综述,介绍了它们的基本概念、原理和应用现状,并对值得进一步研究的问题进行了展望。 关键词:水文系统;不确定性分析;方法综述 A Summary on Uncertainty Analysis Methods of Hydrological System Y ANG Jinmeng (College of W ater Conservancy and Civil Engineering,Shandong Agricultural University ,Taian 271018)Abstract: Hydrological system is a complex system with many uncertain factors. These factors are not conductive to the accurate simulation and prediction of hydrological processes. Thus more and more people focus on the uncertainty analysis methods for the hydrological systems to improve the reliability of calculations. In this paper, we summarized the researches and the applications of the uncertainty analysis methods for hydrological systems. Based on the review,we introduced their basic concepts, principles and status of applications and prospected the issues worthy of further research. Keywords:hydrological system; uncertainty analysis; methods summary 1 引言 水文系统研究的基本内容为水在自然界里的运动、变化过程和分布规律,通常以流域或区域作为研究对象,涉及到降雨、蒸散发、地表径流、地下水运动变化及连接地表水和地下水的土壤水的状况等。水文系统的复杂性使得不确定性分析贯穿水循环研究过程的始终,从水文过程监测数据的获取、分析和处理,水文模型的开发、应用等,都伴随自然或人为的不确定性因素。由于水文系统数据本身固有的模糊性和变异性,加之技术和人为因素,使得数据处理具有不确定性,主要表现在正确与错误并存、信息与“噪声”并存以及正常与异常并存,使得对数据分析产生的结论不精确或不可信。 模型是水文系统研究的重要手段,由于多数模型带有明显的主观假设,且参数只能通过实测资料和参数优选得到,在模型结构的选择、参数的率定、方法的优选、目标函数的确定等方面均存在不确定性。因而,不确定性分析在水文系统研究和应用中就显得尤为重要。第23届国际地球物理和大地测量大会上,国际水文科学协会(IAHS)明确提出应减少水文预报中的不确定性,探索水文模拟的新方法,实现水文理论的重大突破。1996年9月由联合国教科文组织开了第三届国际研讨会。会议的主题是:水资源系统的风险、可靠性、不确定性和稳健性;重心是研讨风险、可靠性、不确定性等问题的新途径和未来研究应用的展望。我国1994年在武汉召开了《全国首届水文水资源与水环境科学不确定性研究新理论、新方法学术讨论会》。会后出版了会议论文专著《现代水科学不确定性研究与进展》。近年来,水文系统不确定性研究取得丰硕的成果。本文就水文系统不确定性分析方法简要综述。 2 不确定性分析方法及应用分类

不确定性数据的分类方法研究综述

第19卷第4期重庆科技学院学报(自然科学版)2017年8月不确定性数据的分类方法研究综述 沈杰许高建杨阳李绍稳 (安徽农业大学信息与计算机学院,合肥230036) 摘要:传统的数据挖掘分类方法能够成功地应用于确定性数据分类,但却无法满足绝大多数领域中复杂的不确定性数据的分类需求,由此出现了一系列针对不确定性数据的分类方法。通过大量研究,目前经典的分类算法及针对不确定数据分类的改进方法得到了很大发展,如改进后的支持向量机算法、朴素贝叶斯算法、决策树算法等日渐成熟。 关键词:不确定性数据;分类;支持向量机;朴素贝叶斯;决策树 中图分类号:TP301 文献标识码:A文章编号=1673 -1980(2017)04 -0096 -04 面临海量的、复杂的不确定性数据,针对不确定 性数据的数据挖掘成为智能分析数据并获取知识的 重要手段,分类算法成为其主要的研究方向之一。2006年,第六届ffiEE数据挖掘国际会议(I C D M)评 选了最具影响的10个数据挖掘算法,其中分类算法 占据了 6 个:k - N N、Naive Bayes、C4. 5、C A R T、S V M、AdaB〇〇s t[1]。分类的任务就是通过分析来建 立区分对象的分类模型,即分类器。传统的分类算 法通常将精确数据作为研究背景,只考虑了精准数 据的输入和分类,因而不能直接应用于不确定性数 据分类,如支持向量机(S V M)、决策树、朴素贝叶斯 算法等。针对此现象,基于这些算法的原有经典模 式加以改进,加入不确定性数据分析,可使得不确定 知识数据挖掘技术更加成熟。 1不确定性数据 1.1不确定性数据的产生 数据的不确定性源于数据本身。数据不确定性 分以下几种情况:采集数据时出现缺省值、干扰值 等;在实验时受周围环境的影响而导致数据不确定; 在数据传输过程中的失真导致不确定性。 1.2不确定性数据的表示 不确定性一般可分为存在(元组级)不确定性 和值(属性级)不确定性[2]。其中,存在(元组级)不 确定性是指一个对象即有出现的可能性,也有不出 现的可能,如某天可能会下雨或者可能不会下雨;而值(属性级)不确定性是指这个对象取值的不确定 性。在高维空间中,确定性数据对象表现为某些具 体的点,而不确定数据对象的表现形式为满足某种 分布的一个范围。 2常见的不确定性数据分类方法 2.1支持向量机算法 Vapnik等人提出的传统支持向量机是一种基 于统计学理论、以结构风险最小化为原则的判别式 分类器[>5]。其基本思想是,在《维数据空间中寻 找一个超平面,可以极大化地将空间属于不同类别 的样本点分开,对于精确的小样本数据有很好的分 类效果。孙喜晨等人对不确定数据作了预处理,在 属性均值聚类(A M C)与支持向量机(S V M)的基础 上,提出基于(属性)聚类的属性支持向量机(A M C -A S V M)算法[6]。该算法对样本进行属性均值聚 类,然后将各个聚类中心及其属性作为新的样本点 来训练,进而得到分类器[7]。但该方法本质上是将 数据的不确定性转化为确定性来处理,对不确定性 考虑得不够充分。 Jianqiang Y a n g等人在S V M中引入多维高斯分 布模型来描述不确定数据的,提出U S V C、A U S V C 及M P S V C支持向量机分类算法[8]。U S V C的原始 问题通过引入约束得到,将机会约束的规划问题转 化为二次规划问题来求解。而A U S V C以及M P S V C 是由U S V C算法改进而来,即通过调整U S V C中的 收稿日期=2017 -03 -23 基金项目:国家自然科学基金项目“农业领域(茶学)云本体建模与方法研究”(31271615)作者简介:沈杰(1990 —),女,合肥人,在读硕士研究生,研究方向为人工智能和数据挖掘? 96 ?

不确定性分析方法

基于数学的不确定理论方法 综述: 不确定性是人们认识世界的局限性导致的,它是人们根据现有知识的基础上对世界以及事物的看法、决定。由于认识的局限性,就会导致对事物的看法存在不可预知性。不确定性存在于生活的方方面面,大到人文系统,小到零件检测,如何更加准确的了解事物,不确定理论的发展起了重要的作用。不确定性理论就是为了能够在现有知识的基础上来找出其规律,以求得到更合适的方法解决问题的途径。不确定性理论用于数据融合中,有效的促进了信息融合理论的发展,相反,同样也促进了不确定性理论的发展。 自从上世纪统计力学的发展,不确定性理论随之出现并得到了学者重视。曾经较长一段时间认为概率论为处理不确定信息的唯一方法和理论,但是随着应用的加深和人们对不确定性信息处理的更高要求,概率论在很多方面表现出它的局限性和不可描述性。最近的几十年来,随着研究的深入,处理不确定信息方法也取得了较大的发展,主要有Zadeh的模糊集对经典集合论的推广,Choquet在容度理论中的单调测度论对经典测度论的推广等。研究的成果不仅涉及到数学、物理等基础性理论,还拓展到了信息学科、航天技术等高科技领域。基于不确定性智能芯片的开发是不确定性理论发展的见证,在工业领域已大量应用。 对于不确定性理论的研究,首先应该了解不确定测度(Uncertainty Measure)和不确定度(Measure of Uncertainty)的区别。不确定测度是对

事物本身不确定程度的描述,而不确定度是对不确定度的度量。比如:一杯水加糖的概率是1/2和有1/2的概率这杯水加了糖,这个性质是不一样的,它反映了不确定测度和不确定度的关系。不确定度的度量主要有熵的方法,如Information Shannon就提供了一个数量上的量度,即为一种典型的不确定度的度量。 为了能够很好地解释各种不确定性理论,对不确定性理论进行分类也是众多学者比较关注的问题。从理论基础上讲不确定性理论分两大类:一类是基于数学的,另一类是基于逻辑学的,本章只介绍基于数学的一类不确定性理论,包括Bayes概率论、可能性理论,Dempster-Shafer理论,以使更好的了解不确定性问题。 不确定性形式繁多,分类方法也多种多样。Klir认为不确定性由三种基本形式组成,即把不确定性分为模糊性(Fuzzy)和多义性(Ambiguity),而多义性又可以分为非特异性(Nonspecificity)和冲突(Conflict)。另外一些学者把多义性分成另两种类型:非特异性和随机性(Randomness),冲突和随机性是处理同一种类型的不确定性的两种解释。而多义性与模糊性的根本区别在于多义性是统计意义上的不确定性,而模糊性是针对集合的边界而言。对应这些类型的不确定性,不同的不确定性理论所能处理的不确定性的种类不一样。模糊集是处理模糊性的理论,概率论只涉及到事件之间的冲突;可能性理沦表示出事件的非特异性,而证据理论描述了非特异性和冲突。 1、Bayes概率 Bayes概率论的提出打破了原有不确定性理论的基础,从数学角

地理不确定性研究

空间不确定性研究进展 张勇 (浙江师范大学地理与环境科学学院,浙江金华321004) 摘要:GIS随着计算机技术的发展而出现,并正处于激烈的演化和发展状态。文中介绍了GIS现状及发展趋势,以及由错误导致的拓扑关系的不确定性和GIS(空间数据、空间推理、空间查询、空间查询语言)的不确定性、拓扑关系理论的发展、GIS在21世纪的发展等问题。 关键词:地理信息系统(GIS);空间数据;拓扑学关系;不确定性;不一致性Advance of study in spatial uncertainty Zhang Yong ( Zhejiang Normal University College of environment and sciences , Zhejiang Jinhua 321004) Abstract: The emergence of GIS keep pace with the development of computer technology,and be in the state of evolution and intense development. This paper describes the current situation and development of GIS trend, as well as the uncertainty caused by the error of topological relations and GIS (spatial data, spatial reasoning, spatial query, spatial query language) of uncertainty, development of topological relation theory, development and other issues of GIS in the 21 century. 1绪论 地理信息系统(GIS)是以采集、存储、管理、分析和描述整个和部分地球表面与空间和地理分布有关的空间信息系统。GIS在采集和处理、分析中出现的数据范围很广,包括位置数据、属性数据、时域数据、逻辑关系等。由于现实世界的复杂性和模糊性、人类表达能力的局限性,数据不可避免地含有误差,研究GIS的误差理论,直接关系到GIS产品的质量控制。因此在GIS初步形成和产品化时,提出了数据质量中空间数据的不确定性理论,并被国际上列为20世纪90年代的重点基础理论课题之一。 所谓不确定性是指一种广义的误差,它包含数值和概念的误差,也包含可

探索不确定性与遥感数据论文 英译汉

Exploring uncertainty in remotely sensed data with parallel coordinate plots Yong Ge , Sanping Li , V. Chris Lakhan , Arko Lucieer Abstract The existence of uncertainty in classified remotely sensed data necessitates the application of enhanced techniques for identifying and visualizing the various degrees of uncertainty. This paper, therefore, applies the multidimensional graphical data analysis technique of parallel coordinate plots (PCP) to visualize the uncertainty in Landsat Thematic Mapper (TM) data classified by the Maximum Likelihood Classifier (MLC) and Fuzzy C-Means (FCM). The Landsat TM data are from the Yellow River Delta, Shandong Province, China. Image classification with MLC and FCM provides the probability vector and fuzzy membership vector of each pixel. Based on these vectors, the Shannon’s entropy (S.E.) of each pixel is calculated. PCPs are then produced for each classification output. The PCP axes denote the posterior probability vector and fuzzy membership vector and two additional axes represent S.E. and the associated degree of uncertainty. The PCPs highlight the distribution of probability values of different land cover types for each pixel, and also reflect the status of pixels with different degrees of uncertainty. Brushing functionality is then added to PCP visualization in order to highlight selected pixels of interest. This not only reduces the visualization uncertainty, but also provides invaluable information on the positional and spectral characteristics of targeted pixels. 1. Introduction A major problem that needs to be addressed in remote sensing is the analysis, identification and visualization of the uncertainties arising from the classification of remotely sensed data with classifiers such as the Maximum Likelihood Classifier (MLC) and Fuzzy C-Means (FCM). While the estimation and mapping of uncertainty has been discussed by several authors (for example, Shi and Ehlers, 1996; van der Wel et al., 1998; Dungan et al., 2002; Foody and Atkinson, 2002; Lucieer and Kraak, 2004; Ibrahim et al., 2005; Ge and Li, 2008a), very little research has been done on identifying, targeting and visualizing pixels with different degrees of uncertainty. This paper, therefore, applies parallel coordinate plots (PCP) (Inselberg, 1985, 2009; Inselberg and Dimsdale, 1990) to visualize the uncertainty in sample data and classified data with MLC and Fuzzy C-Means. A PCP is a multivariate visualization tool that plots multiple attributes on the X-axis against their values on the Y-axis and has been widely applied to data mining and

地理空间数据不确定性与研究报告进展

地理空间数据不确定性与研究进展 王春,汤国安,赵牡丹,王雷,张婷 <西北大学城市与资源学系,陕西西安,710069) 摘要:在介绍空间数据不确定性概念、研究意义与常用的研究理论与方法的基础上,回顾了地理空间数据不确定性研究的历程,对地理空间数据不确定性研究的现状、所取得的主要成果问题进行了总结。分析了当前空间数据不确定性研究中所存在的基本问题:研究的内容与研究方法缺乏整体性与总览性,研究的对象与应用目标还不够明确。建议在今后的研究中应着重于:细化地理空间数据不确定性的内容;强化地理空间数据应用的不确定性研究;研究方法上注重多种理论和方法综合使用,以建立不确定性数据处理模型为其出发点和基础。 关键词:地理空间数据;不确定性;研究进展 中图分类号:TP391文献标识码:A文章编号:1000-274X(2004>0078-08 地理空间数据建设是国家空间数据基础设施

空间数据处理模型误差和不确定性分析_孙庆辉

文章编号:1673-6338(2007)01-0033-04 空间数据处理模型误差和不确定性分析 孙庆辉1,2,池天河1,赵军喜2,钟大伟1,邵士新2 (1.中国科学院遥感应用研究所,北京 100101;2.信息工程大学测绘学院,河南郑州 450052) 摘要:在G IS 应用中,涉及到大量的模型应用,这些模型包括了利用G IS 进行空间信息处理的大部分阶段中所用到的模型。模型处理以及分析结果往往是进行下一步应用的基础,因此模型处理结果的误差和不确定性制约了实际的GIS 应用。影响空间数据处理模型的误差和不确定性的因素主要包括:定位和特征信息,制图,空间分析,空间数据库以及空间数据处理模型等所具有的误差和不确定性。主要分析了空间数据处理模型误差和不确定性的表达、来源以及分析方法。 关 键 词:数据处理模型;不确定性;误差;灵敏度分析;蒙特卡罗方法中图分类号:P208 文献标识码:A Errors and Uncertainties Analysis of Spatial Data Processing Model SUN Qing -hui 1牞2牞CH I Tian -he 1牞ZH AO Jun -xi 2牞ZH ONG Da -w ei 1牞SH AO Shi -xin 2 牗1牣I nstitute o f Remote Sensing Ap plications 牞CAS 牞Beij ing 100101牞China 牷 2牣Institute of S urvey ing and Mapping 牞In f ormation Engineering University 牞Z hengzhou 450052牞China 牘A bstract 牶In G IS applications 牞we alw ay s use many models to handle spatial data 牞w hich are in g ene ral concept 牞 including all the spa tial da ta pro ce ssing model and mathematic methods 牣T he result o f a model is the input data of the o ther model o r is the foundatio n of spatial data analy sis of application 牞the er ro r and unce rtainty in mo del result is a key problem in G IS applications 牣T he e rro r and uncer tainty sources of spatial da ta pro cessing mo del include spa tial data po sitional info rmatio n 牞spatial at tribute info rmatio n 牞ma pping 牞spatial analy sis 牞da tabase and model itself 牣H ere w e mainly analyzed the definitio n 牞uncer tainty so urces and analy sis methods of spatial data pro ce ssing mo del 牣Key words 牶data pro cessing mo del 牷uncer tainty 牷err or 牷sensitivity analy sis 牷mo nte carlo method GIS 是将计算机硬件、软件、地理数据以及系统管理人员组织而成的对任意形式的地理空间信息进行高效获取、存储、更新、操作、分析及显示的集成系统[1,2] 。地理信息系统以及其他信息系统对表达地理信息的空间数据的利用是通过地理信息处理模型来完成。在这里,模型是一个很广泛的概念,包括了利用GIS 进行空间信息处理的大部分阶段中所用到的模型。如,在数据获取、输入过程中应用数学模型来获取好的处理结果。在地理信息科学中,空间数据处理模型主要是指对地理信息进行获取、处理、管理、分析、表达、可视化等操作所采用的模拟处理方法的全集,同时也包括在专题应用领域中利用地理信息进行分析、处理等的专业应用模型,这些模型通常与地理信息系统进行藕合,以外部模型的方式提供应用服务。 H ar tkam p 在1999年定义了3种模型和GIS 结合的方式,分别为:“Link ”即两者之间通过数据或文件方式进行信息交换;“Combine ”即两者之间可以自动交换数据信息;“Integ ra te ”两者之间实 现真正的整合形成一个整体系统。在以往GIS 应用中,应用模型主要考虑模型的模拟表达及模型的构建。对模型处理结果的不确定性和误差以及造成模型处理结果误差的因素的研究比较少。当前,在实际应用过程中,GIS 研究人员已经意识到这方面的问题。此处主要分析模型不确定性的来源,以及模型不确定性的评价方法。在应用GIS 和模型进行客观世界信息处理时,对其结果的不确定性影响比较大的几个方面主要是:定位和特征信息,制图,空间分析,空间数据库以及空间数据处理模型等所具有的误差和不确定性。 收稿日期:2006-09-01;修回日期:2006-12-28 基金项目:国家自然科学基金(40401039) 作者简介:孙庆辉(1974-),男,河南叶县人,讲师,博士生,主要从事GIS 理论与应用方法研究。 第24卷第1期2007年2月测绘科学技术学报 Journal of Zhengz hou In stitu te of Surveying and M apping Vol.24No.1Feb.2007

相关文档
相关文档 最新文档