介绍了数字水印技术的基本原理 随着信息技术和计算机网络的飞速发展,人们不但可以通过互联网和CD-ROM方便快捷地获得多媒体信息,还可以得到与原始数据完全相同的复制品,由此引发的盗版问题和版权纷争已成为日益严重的社会问题。因此,数字多媒体产品的水印处理技术已经成为近年来研究的热点领域之一。 虽然数字水印技术近几年得到长足发展,但方向主要集中于静止图像。由于包括时间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立,视频水印技术的发展滞后于静止图像水印技术。另一方面,由于针对视频水印的特殊攻击形式的出现,为视频水印提出了一些区别于静止图像水印的独特要求。 本文分析了MPEG-4视频结构的特点,提出了一种基于扩展频谱的视频数字水印改进方案,并给出了应用实例。 1视频数字水印技术简介 1.1数字水印技术介绍 数字水印技术通过一定的算法将一些标志性信息直接嵌入到多媒体内容当中,但不影响原内容的价值和使用,并且不能被人的感知系统觉察或注意到。与传统的加密技术不同,数字水印技术并不能阻止盗
版活动的发生,但可以判别对象是否受到保护,监视被保护数据的传播,鉴别真伪,解决版权纠纷并为法庭提供认证证据。为了给攻击者增加去除水印的难度,目前大多数水印制作方案都采用密码学中的加密体系来加强,在水印嵌入、提取时采用一种密钥,甚至几种密钥联合使用。水印嵌入和提取的一般方法如图1所示。 1.2视频数字水印设计应考虑的几个方面 ·水印容量:嵌入的水印信息必须足以标识多媒体内容的购买者或所有者。 ·不可察觉性:嵌入在视频数据中的数字水印应该不可见或不可察觉。·鲁棒性?押在不明显降低视频质量的条件下,水印很难除去。 ·盲检测:水印检测时不需要原始视频,因为保存所有的原始视频几乎是不可能的。 ·篡改提示:当多媒体内容发生改变时,通过水印提取算法,能够敏感地检测到原始数据是否被篡改。 1.3视频数字水印方案选择 通过分析现有的数字视频编解码系统,可以将目前MPEG-4视频水印的嵌入与提取方案分为以下几类,如图2所示。
第1章图像视觉特征的提取和表示 1.1引言 图像视觉特征的提取和表示是将图像的视觉信息转化成计算机能够识别和处理的定量形式的过程,是基于视觉内容的图像分类与检索的关键技术,因此,图像视觉特征的提取和表示一直是图像内容分析领域中一个非常活跃的课题。 图像底层视觉特征一定程度上能够反映图像的内容,可以描述图像所表达的意义,因此,研究图像底层视觉特征是实现图像分类与检索的第一步。一般来说,随着具体应用的不同,选用的底层特征也应有所不同,在特定的具体应用中,不同底层视觉特征的选取及不同的描述方式,对图像分类与检索的性能有很大的影响。通常认为,一种良好的图像视觉特征的提取和表示应满足以下几个要求: (1)提取简单,时间和空间复杂度低。 (2)区分能力强,对图像视觉内容相似的图像其特征描述之间也应相近,反之,对于视觉内容不相似的图像其特征描述之间应有一定的差别。 (3)与人的视觉感知相近,对人的视觉感觉相近的图像其特征描述之间也相近,对人的视觉感知有差别的图像其特征描述之间也有一定的差别。 (4)抗干扰能力强,鲁棒性好,对图像大小,方向不敏感,具有几何平移,旋转不变性。 本章重点讨论当前比较成熟的特征提取方法,在此基础上选取合适的特征提取方法,用于图像分类与检索系统的特征提取模块。接下来,将依次介绍颜色,纹理,形状等特征的提取和表示方法,最后对各种特征的特点加以比较。 1.2颜色特征的提取和表示 颜色是图像视觉信息的一个重要特征,是图像分类与检索中最为广泛应用的特征之一。一般来说同一类别的图像之间颜色信息具有一定的相似性,不同类别的图像,其颜色信息具有一定的差异。相对几何特征而言,颜色特征稳定性好,有对大小、方向不敏感等特点。因此,颜色特征的提取受到极大重视并得到深入研究。本章首先介绍几种常用的颜色空间模型,然后介绍各种颜色特征提取和表示方法。 1.2.1颜色空间模型 为了正确地使用颜色这一特征,需要建立颜色空间模型,通常的颜色空间模型可用三个基本量来描述,所以建立颜色空间模型就是建立一个3-D坐标系,其中每个空间点都代表某一种颜色。通常来说,对于不同的应用,应该选取不同的颜色空间模型。常用的颜色空间模型主要有:RGB、HIS、HSV、YUV、YIQ、Munsell、Lu*v*和La*b*等。颜色空间模型的选取需要符合一定的标准,下面就这一标准和最常用的颜色空间模型作一些介绍。 文献[错误!未找到引用源。]中介绍了选择颜色空间模型的标准主要有以下几个: (1)观察角度的鲁棒性
人眼视觉特性 人眼对380~780纳米内不同波长的光具有不同的敏感程度,称为人眼的视敏特性。衡量描述人眼视敏特性的物理量为视敏函数和相对视敏函数。 1)视敏函数在相同亮度感觉的条件下,不同波长上光辐射功率的倒数可以用来衡量人眼对各波长光明亮感觉的敏感程度。称为视敏函数K(λ)=1/pr(λ) 。 2)相对视敏函数实验表明,人眼对波长为555纳米的光最敏感,因此把任意波长的光的视敏函数与最大视敏函数值K(555)相比的比值称为相对视敏函数。可见光波长实验表明:视敏涵数的曲线的最大值位于555nm处当光线微弱向左偏移最大值为507nm处,两者相差近50nm,人眼就相当于带通滤波器,这就表明人眼对亮度变化比较敏感。人眼对于蓝光的视觉灵敏度要比红光和绿光低的多.三条曲线的峰值比为R:G:B=0.54:0.575:0.053(蓝光放大20倍).三条曲线有相当一部分是重叠的.正常观察条件下,人眼得到的是二者的合成的视觉,不能将他们各自的数值区分开来.大脑根据三者的比例,感知彩色的色调和饱和度,而三者的和决定了光的总亮度。
2.1对比灵敏度人眼对亮度光强变化的响应是非线性的,通常把人眼主观上刚刚可辨别亮度差别所需的最小光强 I增大时,在一定幅度内感觉不出,必须变化到一定值I+ΔI时,人眼才能感觉到亮度有变化,ΔI/I 此恢复图像的误差如果低于对比灵敏度,即不会被人眼察觉。此外,高频部分在相同的灵敏度阈值下,色差信号Y-R 空间频率只有亮度Y的一半,色差信号Y-B空间频率只有亮度Y的1/4。人眼对于运动图像的对比灵敏度与时间轴上信息的变化速度有关,随着时间轴变化频率的增加,人眼所能感受到的图像信息的误差阈值呈上升趋势,视觉上的这种动态对比灵敏度特性表现为图像序列之间相互掩盖效应。可见度阈值和掩盖效应对图像编码量化器的设计有重要作用,利用这一视觉特性,在图像的边缘可以容忍较大的量化误差,因而可使量化级减少,从而降低数字码率。 2.2分辨率 当空间平面上两个黑点相互靠拢到一定程度时,离开黑点一定距离的观察者就无法区分它们,这意味着人眼分辨景物细节的能力是有限的,这个极限值就是分辨率。研究表明人眼的分辨率有如下一些特点:①当照度太强、太弱时或当背景亮度太强时,人眼分辨率降低。②当视觉目标运动速度加快时,人眼分辨率降低。③人眼对彩色细节的分辨率比对亮度细节的分辨率要差,如果黑白分辨率为1,则黑红为0.4,
:人类智能的特性表现在 4 个方面 。 A:聪明、灵活、学习、运用。 B:能感知客观世界的信息、能对通过思维对获得的知识进行加工处理、能通过学习积累知识 增长才干和适应环境变化、能对外界的刺激作出反应传递信息。 C:感觉、适应、学习、创新。 D:能捕捉外界环境信息、能够利用利用外界的有利因素、能够传递外界信息、能够综合外界 信息进行创新思维。 2:人工智能的目的是让机器能够 ,以实现某些脑力劳动的机械化。 A:具有智能 B:和人一样工作 C:完全代替人的大脑 D:模拟、延伸和扩展人的智能 3:下列关于人工智能的叙述不正确的有: 。 A:人工智能技术它与其他科学技术相结合极大地提高了应用技术的智能化水平。 B:人工智能是科学技术发展的趋势。 C:因为人工智能的系统研究是从上世纪五十年代才开始的,非常新,所以十分重要。 D:人工智能有力地促进了社会的发展。 4:人工智能研究的一项基本内容是机器感知。以下列举中的 不属于机器感知 的领域。 A:使机器具有视觉、听觉、触觉、味觉、嗅觉等感知能力。 B:让机器具有理解文字的能力。 C:使机器具有能够获取新知识、学习新技巧的能力。 D:使机器具有听懂人类语言的能力 5:自然语言理解是人工智能的重要应用领域,下面列举中的 不是它要实现的 目标。 A:理解别人讲的话。 B:对自然语言表示的信息进行分析概括或编辑。 C:欣赏音乐。 D:机器翻译。 6:为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、悟性等,研究者找到一个 重要的信息处理的机制是: 。 A:专家系统 B:人工神经网络 C:模式识别 D:智能代理 7: 根据下列选项来判断可以用指纹来鉴定的是: ①证件 ②签字 ③照片 ④ 密码 ⑤钥 匙 ⑥印签( ) A : ① ② B : ① ② ③ C:①②③④ D:①②③④⑤⑥ 8:下列选项错误的是( ) A:研究人工智能成为当前信息化社会的迫切需求 B:智能化是自动化发展的必要趋势 C:人工智能的研究方法:结构模拟、功能模拟和行为模拟 D:人工智能的实质是人造的智能 9:机器人之父是指: ( ) A:阿兰.图灵 B:伯纳斯.李 C:莎佩克 D:英格伯格和德沃尔 10:下列哪个应用领域不属于人工智能应用?( )
1/5
视觉媒体特性 作者:佚名转贴自:本站原创点击数:64 人类信息交流中,最丰富的信息流是视觉媒体。凡是通过视觉传递信息的媒体,都属于视觉类媒体。它包括图形、图像、文字以及一切形象化的视觉信息形式。视觉类媒体特性研究,涉及光度学、色度学、图形学、数字信号处理和人类视觉生理心理特性等,认识和运用其基本特征,是视觉媒体处理的各种技术之基础。作为一名专业的图形设计员来说,了解视觉媒体特性是必不可缺的。下面我们将从几个不同的侧面来分析和说明视觉类媒体的主要特性。 一、可见光谱与光度学参量 人眼所看到的客观存在的世界,通常称之为景象。客观物体所发出的光线或是物体受光源照射后所反射、透射的光,在人的视网膜上成象,是一种自然的生理功能,它使人能借助视媒体去认识世界。近代科学的发展,特别是光电转换技术进步,使人类能够以各种方法来记录、处理、传输客观景象,如各类图片、照片、绘画、文稿、X光胶片等:不仅是获取和记录那些人眼可见的图像信息还可利用非可见光和其它手段成象,或利用适当转换装置将其变为人眼可视图像,例如红外成象、超声成象、微波成象等;科学技术使人的视觉能力逐步增强和延伸。从‘物理上讲,光线是电磁波的一种能量辐射形式。电磁波的主要参数包括:传播方向,所具能量,极化情况和波长。电磁波的频率范围很宽,根据波长不同,具有不同性质,包括无线电波、红外线、可见光谱、紫外线、X射线、’宇宙射线等。可见光谱在电磁波中仅是很窄的一段,其波长在380至780毫微米之间,波长不同呈现不同的颜色,从紫、蓝、绿、黄到橙、红,连续地变化。描述方法使用如下物理量:光源发光强度、光通量、照度、亮度,还使用视敏曲线反映人眼的感觉特性。 二、三基色原理 不同波长的单色光会引起不同的彩色感觉,然而同样的彩色感觉却可以来源于不同的光谱成分的组合,这个事实说明,光谱分布与彩色感觉之间的关系是多对一的,也说明在彩色重现过程中并不要求客观景物反射光的光谱成分,而重要的是人眼应获得原景物的相同的彩色视觉。实验证实,大自然中几乎所有颜色都可以用几种基色按不同比例混合而得到。三基色原理包括如下内容: 1.选择三种相互独立的颜色,即不能以其中两种混合而得到第三种作为基色,将这三基色按不同比例进行组合,可获得自然界各种彩色感觉。如彩色电视技术中选用红(R)、绿(G)和蓝(B)作为基色,印染技术中选用黄、品红、青作为基色。 2.任意两种非基色的彩色相混合也可以得到一种新的彩色,但它应该等于把两种彩色各自分解为三基色,然后将基色分量分别相加后再相混合而得到的颜色。 3.三基色的大小决定彩色光的亮度,混合色的亮度等于各基色分量亮度之和。
DOI:CNKI:11-4415/P.20101119.1814.020 网络出版时间:2010-11-19 18:14 网络出版地址:https://www.wendangku.net/doc/d28907872.html,/kcms/detail/11.4415.p.20101119.1814.020.html 一种多重水印嵌入的解决方案研究 李强①②,闵连权①,何宏志②,杨永强② (①信息工程大学测绘学院,郑州450052;②69027部队,乌鲁木齐830006)【摘要】由于矢量地图数据易于复制、分发等特点,同时矢量地图的制作成本高、安全性要求高 等,使得用近年来新兴的数字水印技术对矢量地图数据进行保护,成为一个新的重要的研究方向。 本文针对矢量地图数据的多重水印嵌入这一难题,提出了一种通过水印嵌入时生成附加信息的方式 来进行水印多重嵌入的解决方案,并通过使用作者提出的抗道格拉斯压缩算法进行了实验,取得了 较好的效果。 【关键词矢量地图数据;多重水印;嵌入;方案 【中图分类号】TP391.41 【文献标识码】A 【文章编号】1009-2307(2011)02- - A solution research on multiple watermark embedding Abstract:The vector map data is easy to duplicate and distribute, its production cost and the safety requirements are high, so protecting the vector map data with digital watermark technology becomes a new important research direction. This article studied the problem of multiple watermark embedding of the vector map data, proposed a multiple watermark embedding solution through the generation of additional information when watermark embedding, and carried out an experiment through anti-Douglas algorithm, and finally achieved good results. Key words:vector map data; multiple watermark; embedding; solution LI Qiang①②, MIN Lian-quan①, HE Hong-zhi②, YANG Y ong-qiang②(①Institute of Surveying and Mapping, Information Engineering University, Zhengzhou 450052, China; ②Troops 69027, Urumchi 830006, China) 1 引言 矢量地图数据在军事、旅游、导航等方面发挥了重要作用,在人类的社会、经济活动中应用越来越广泛。由于矢量地图数据易于复制、分发等特点,同时矢量地图数据的制作成本高、安全性要 求高等,使得用近年来新兴的数字水印技术对矢量地图数据进行保护,成为一个新的重要的研究方 向。当前,针对数字水印嵌入的研究主要是单重嵌入,即只能嵌入一次水印信息并进行提取,进行 多重水印嵌入时可能就提取不出水印信息,这就一定程度上限制了水印的使用范围,现在对多重水印 潜入研究极少。本文针对现实需求和实践总结,提出了一种通过水印嵌入时生成附加信息的方式实 现水印多重嵌入的解决方案。 2 矢量地图数据水印技术 2.1 矢量地图数据水印多重嵌入研究的意义和现状 矢量地图数据数字水印技术的研究意义在于标示地图数据的版权保护信息,在许多情况下,需要对嵌入水印后的地图数据再次或多次潜入水印信息,但不论是采用相同或不同的嵌入算法,经过 多重嵌入后的数据很难提取出水印信息,目前对这种水印多重嵌入的研究很少,特别是针对矢量地 图数据的水印多重嵌入研究更少。 现阶段水印嵌入的研究主要集中在单次嵌入算法的相关研究[2-4],即将水印信息单次嵌入到地图数据中,例如对于嵌入水印后的数据的下一级分发,没有一个好的解决方案,确保矢量地图数据的 安全,如果采取与上一级相同的水印嵌入方案,会引起数据精度的降低或者提取不出水印信息等问 题,如果采取与上一级不同的水印嵌入方案,一是在实践操作上存在可行性不高的问题,二是可能 也会引起数据精度的降低或者提取不出水印信息等问题。 2.2 矢量地图数据水印嵌入分析 1) 水印嵌入空间分析 矢量地图数据是通过分层存储来实现的,每层存储位置信息和属性信息等,位置信息一般用几何数据来表示,通过图元来描述目标的,基本的图元有点、线段、多边形,点是通过坐标惟一定义 的,线段是通过组成线段的一系列点定义的,多边形是由封闭的线段组成的。点的位置由平面坐标
数字水印算法列举 湖南科技大学计算机科学与工程学院 ①基于LSB 的数字水印方案(空间域、不可逆、不可见和盲检测) 嵌入步骤: (1)先把水印信息转化为二进制比特流I。 (2)根据I的长度生成密钥K,并且严格保存。密钥K是对图像载体像素位置的一个映射。 (3)把I中的每一位依次根据密钥K,置换掉原始载体图像中相应位置的像素最后一位。提取步骤: (1)根据严格保存的密钥K遍历嵌入了水印的图像中的相应像素,提取出最后一位。 (2)将提取出来的每一位重新组合成水印信息。 ②基于差分扩展的数字水印方案(变换域、可逆、不可见和盲检测) 嵌入步骤: (1)将图像M分成像素点对(x,y),将水印信息转化为二进制比特流,比特流的每一位用m 表示。 (2)根据水印信息比特流的长度随机生成信息的嵌入位置k作为密钥信息严格保存。(3)对图像M计算均值l和差值h:?????-=+=y x h y x floor l 2((floor表示向下取整) (4)将水印比特信息m以差值扩展的方法嵌入到差值h中:m h h +?='2(5)将得到的h '代入(3)中,得到新的图像像素对,形成嵌入秘密信息后的图像C。提取步骤: (1)将图像C分成像素点对(x,y),读入密钥信息K。 (2)将图像C依旧按照嵌入步骤中的(3)式计算均值l和差值h。 (3)根据密钥k找到相应位置,提取差值h的最后一位比特信息m,再将差值h进行变换得到1>>='h h 。 (4)将提取到的比特信息m进行组合可以恢复水印信息,将得到的h '代入嵌入步骤的(3)中计算新的图像像素对可以恢复原始图像载体M。 ③基于直方图修改的数字水印算法(空间域、可逆、不可见和盲检测) 嵌入步骤:(1)找到直方图的零点z和峰值点p,将z v p <<的像素值v自加1。 (2)漂移后的直方图v=p处即为嵌入水印的位置,将水印信息转化为二进制流并记为k,按顺序嵌入,即k v v +=';(3)得到的由像素值v '组成的图像就是嵌入秘密信息后的图像。同时p、z以密钥的形式保存。 提取步骤: (1)读取密钥,得到p、z的值。 (2)遍历图像的每个像素,当像素v=p时,提取信息0并保持数据不变;当v=p+1时,提取信息1并将数据减1。 (3)当v
z时,数据保持不变;当p-1 人眼的视觉特性 1、引言人眼的视觉系统是世界上最好的图像处理系统,但它远远不是完美的。人眼的视觉系统对图像的认知是非均匀的和非线性的,并不是对图像中的任何变化都能感知。例如图像系数的量化误差引起的图像变化在一定范围内是不能为人眼所觉察的。因此,如果编码方案能利用人眼视觉系统的一些特点,是可以得到高压缩比的。对人眼视觉特性的深入研究及由此而建立的各种数学模型,一直是各种图像数字压缩算法的基础。 2、人眼的视觉特性 人眼对380~780纳米内不同波长的光具有不同的敏感程度,称为人眼的视敏特性。衡量描述人眼视敏特性的物理量为视敏函数和相对视敏函数。1)视敏函数在相同亮度感觉的条件下,不同波长上光辐射功率的倒数可以用来衡量人眼对各波长光明亮感觉的敏感程度。称为视敏函数K(λ)=1/pr(λ) 。2)相对视敏函数实验表明,人眼对波长为555纳米的光最敏感,因此把任意波长的光的视敏函数与最大视敏函数值K(555)相比的比值称为相对视敏函数。 可见光波长 实验表明:视敏涵数的曲线的最大值位于555nm处当 光线微弱向左偏移最大值为507nm处,两者相差近50nm,人眼就相当于带通滤波器,这就表明人眼对亮度变化比较敏感。人眼对于蓝光的视觉灵敏度要比红光和绿光低的多.三条曲线的峰值比为R:G:B=0.54:0.575:0.053(蓝光放大20倍).三条曲线有相当一部分是重叠的.正常观察条件下,人眼得到的是二者的合成的视觉,不能将他们各自的数值区分开来.大脑根据三者的比例,感知彩色的色调和饱和度,而三者的和决定了光的总亮度。 2.1对比灵敏度人眼对亮度光强变化的响应是非线 性的,通常把人眼主观上刚刚可辨别亮度差别所需的最小光强差值称为亮度的可见度阈值。也就是说,当光强I增大时,在一定幅度内感觉不出,必须变化到一定值I+ΔI时,人眼才能感觉到亮度有变化,ΔI/I一般也称为对比灵敏度。因此恢复图像的误差如果低于对比灵敏度,即不会被人眼察觉。此外,高频部分在相同的灵敏度阈值下,色差信号Y-R空间频率只有亮度Y的一半,色差信号Y-B空间频率只有亮度Y的1/4。人眼对于运动图像的对比灵敏度与时间轴上信息的变化速度有关,随着时间轴变化频率的增加,人眼所能感受到的图像信息的误差阈值呈上升趋势,视觉上的这种动态对比灵敏度特性表现为图像序列之间相互掩盖效应。 第一节人眼的视觉特性 1、在一般情况下,如有两种光谱成分不同的光,只要三种光敏细胞对它们的感觉相同,则主观彩色感觉(包括亮度和色度)就相同。 2、格拉斯曼定律—复合光的亮度等于各光分量的亮度之和。 3、人眼的视觉范围有一定的限度,明暗感觉是相对的。 4、韦伯-费赫涅尔定律—亮度感觉与亮度L的对数成线性关系。 5、一方面,重现景物的亮度无需等于实际景物的亮度,而只需保持二者的最大亮度与最小亮度的比值不变;另一方面,人眼不能察觉的亮度差别,在重现景物时也无需精确复制出来。 6、人眼分辨景物细节有一极限值,对彩色细节的分辨能力远比对亮度细节分辨力低。 7、视觉的空间频率响应具有低通滤波器性质。 8、人眼存在视觉惰性—电影、电视放映的生理基础。 临界闪烁频率取决于亮度、亮度变化幅度、观看距离等。 一、人眼的亮度感觉 1.人眼的光亮感觉 光也是一种电磁辐射,人眼对780~380纳米之间电磁波的刺激有光亮的感觉,故波长在这个范围内的电磁波称为可见光。 2.人眼的彩色感觉 人眼对780~380纳米之间的光还有彩色感觉,具体如图1-1所示。 3.人眼的视敏特性 人眼对380~780纳米内不同波长的光具有不同的敏感程度,称为人眼的视敏特性。衡量描述人眼视敏特性的物理量为视敏函数和相对视敏函数。 1)视敏函数在相同亮度感觉的条件下,不同波长上光辐射功率的倒数可以用来衡量人眼对各波长光明亮感觉的敏感程度。称为视敏函数。 2)相对视敏函数实验表明,人眼对波长为555纳米的光最敏感,因此把任意波长的光的视敏函数与最大视敏函数值K(555)相比的比值称为相对视敏函数, 记为: 如图1-2所示,左边的曲线是暗视觉曲线,右边的是明视觉曲线。 二、人眼亮度感觉的特性(描述人眼对光亮差别的感觉特性) 1.亮度:光源或反射面的明亮程度,亮度的单位为(坎德拉/平方米)。 2.亮度视觉的范围:人眼总的感光范围极其宽广,明视觉的亮度感觉范围为到量级, 而暗视觉的感觉范围为千分之几到几个。 3.光亮感觉的特点: 1)人眼的主观亮度感觉与周围环境亮度有关。 2) 主观亮度感觉S与亮度值B的对数成比例关系:,其中和K是常数。 3) 主观亮度感觉是心理量而不是物理量,故其单位是以实验得出的变化级数(S)来表征的。实验表明,在不同的亮度B值下,人眼能觉察的最小亮度变化并非定值。B大,也大;B小,也小,但是/B的值是大致相同的。 将可觉察的最小相对亮度变化 /B称为对比度灵敏度阈,用标记,其值通常在0.005~0.05之间。 人眼的亮度感觉并非决定于绝对亮度变化,而是决定于相对亮度变化。故重现景物的亮度无须等于实际景物的亮度,而只需保持最大亮度与最小亮度之比值相同,就能给人以真实感。 4.对比度和亮度层次 1) 对比度:指光源或发光面的最大亮度与最小亮度之比值。 用下式表示:。外界景物的对比度不超过100:1,显象管图像的对比度为30:1。 比视觉灵敏度表示人类视觉分光灵敏度特性 在光强度的测量方法中有辐射测量与测光法两种不同的方法。辐射测量法指的是对于光谱范围内的整个波长,包括紫外线、可见光和红外线,全部进行测量。测光法测量的仅仅是可见光。 而要将物理辐射量转换为表示人的眼睛所感知的明暗程度的测光量时,需要引入一个比视觉灵敏度的概念。所谓比视觉灵敏度,表示的是人类眼睛的分光灵敏度特性。在图 1.7 中,用虚线补充的就是光敏二极管 BS120 的标准比视觉灵敏度特性。 例如,在测量照度的是偶,可以将照度置换为人们感觉到了许多大程度明亮的数值,因此被纳入比视觉灵敏度之中。为此,就像图 1.7 那样,用于照度测量的光敏二极管 BS120,其分光灵敏度特性就制作得尽可能地与比视觉灵敏度相吻合。 短路电流的表示方法如表 1.1 所示,与照度相对应,约为 0.16μA/100lx。 但是,用于紫外线检测的光敏二极管 G3614 可以检测出人眼看不见的光线,因此表示为无法用比视觉灵敏度表示的辐射强度。从表 1.1 可以看出,光敏二极管 G3614 的辐射强度检测灵敏度为 60mA/W。 将光敏传感器与发光器件组合时的注意点 在红外遥控器中发光器件是与感光器件配对使用的。通常,使用发光二极管(LED)作为发光器件,而且尤其重要的是其发光特性应当与作为感光器件的光敏二极管相匹配。 图 1.9 给出的是与各种发光器件的波长相对应的而检测能力。从中可以找到与光敏二极管 PH302B 相对应的发光二极管。从表 1.1 可以查到,光敏二极管 PH302B 的峰值波长位于940nm;对照图 1.9 可以了解到,适合与之配套使用的发光二极管是 GaAs 红外发光二极管。 人眼的视觉特性 人眼的视觉特性 1、引言人眼的视觉系统是世界上最好的图像处理系统,但它远远不是完美的。人眼的视觉系统对图像的认知是非均匀的和非线性的,并不是对图像中的任何变化都能感知。例如图像系数的量化误差引起的图像变化在一定范围内是不能为人眼所觉察的。因此,如果编码方案能利用人眼视觉系统的一些特点,是可以得到高压缩比的。对人眼视觉特性的深入研究及由此而建立的各种数学模型,一直是各种图像数字压缩算法的基础。 2、人眼的视觉特性人眼对380~780纳米内不同波长的光具有不同的敏感程度,称为人眼的视敏特性。衡量描述人眼视敏特性的物理量为视敏函数和相对视敏函数。1)视敏函数在相同亮度感觉的条件下,不同波长上光辐射功率的倒数可以用来衡量人眼对各波长光明亮感觉的敏感程度。称为视敏函数 K(λ)=1/pr(λ) 。2)相对视敏函数实验表明,人眼对波长为555纳米的光最敏感,因此把任意波长的光的视敏函数与最大视敏函数值K(555)相比的比值称为相对视敏函数。 可见光波长 实验表明:视敏涵数的曲线的最大值位于555nm处当光线微弱向左偏移最大值为507nm处,两者相差近50nm,人眼就相当于带通滤波器,这就表明人眼对亮度变化比较敏感。人眼对于蓝光的视觉灵敏度要比红光和绿光低的多.三条曲线的峰值比为R:G:B=0.54:0.575:0.053(蓝光放大20倍).三条曲线有相当一部分是重叠的.正常观察条件下,人眼得到的是二者的合成的视觉,不能将他们各自的数值区分开来.大脑根据三者的比例,感知彩色的色调和饱和度,而三者的和决定了光的总亮度。 2.1对比灵敏度人眼对亮度光强变化的响应是非线性的,通常把人眼主观上刚刚可辨别亮度差别所需的最小光强差值称为亮度的可见度阈值。也就是说,当光强I增大时,在一定幅度内感觉不出,必须变化到一定值I+ΔI时,人眼才能感觉到亮度有变化,ΔI/I一般也称为对比灵敏度。因此恢复图像的误差如果低于对比灵敏度,即不会被人眼察觉。此外,高频部分在相同的灵敏度阈值下,色差信号Y-R空间频率只有亮度Y的一半,色差信号Y-B空间频率只有亮度Y的1/4。人眼对于运动图像的对比灵敏度与时间轴上信息的变化速度有关,随着时间轴变化频率的增加,人眼所能感受到的图像信息的误差阈值呈上升趋势, 人类视觉系统,即Human visual system。人类视觉系统只有3种视锥细胞,因此在缤纷的世界中,即使面对似锦的繁花,我们也可能犹如色盲,常常对一些色彩“视而不见”;而鸟类独特的视觉系统,拥有4种视锥细胞,能辨别出更多色彩,看见的世界也更加绚丽多彩,远远超越了人类。 对颜色/亮度的感知 人类对光的感知是依靠视网膜(retina)细胞。cones(圆锥细胞)负责感知光度(较强光)和色彩, rods(杆状细胞)仅能感知光度,不能感知颜色,但其对光的敏感度是cones的一万倍。在微弱光环境下rods起主要作用,因此我们不能在暗环境中分辨颜色。一些数码相机的夜光拍摄模式也模拟了这一特性。 视网膜中三种圆锥细胞(cones) 有重叠的频率响应曲线,但响应强度有所不同,他们分别对红(570nm), 绿(535nm), 蓝(445nm)光有最敏感,共同决定了色彩感觉。光度(luminance) 正比于视网膜细胞接受到的光强度能量,但人类对相同强度不同波长的光具有不同的敏感度。可感知的波长范围380nm~780nm,称为可见光。其中对绿色(550nm)光产生最大的光强敏感度。 视力 眼睛的空间分辨能力,即视力,通常用可分辨视角(degree)的倒 数为单位。正常人的最少可辨视觉阀值约0.5”,最大视觉范围200度(宽)×135度(高)。 空间频率 即影像在空间中的变化速度。用亮度呈空间正弦变化的条纹做测试,亮度Y(x,y) = B(1+mcos2πfx), 给定条纹频率f为一固定值(看作是宽度),改变振幅m(看作对比度),测试分辨能力。显然m越大分辨越清楚,测试不同条件下(不同cpd)可分辨的最少m值,定义1/mmin为对比敏感度(contrast sensitivity)。定义人眼的对空间感觉的角度频率:cpd: cycle / degree ,表示眼球每转动一度扫过的黑白条纹周期数。对给定的条纹,这个值与人眼到显示屏的距离有关,对于同样大小的屏幕,离开越远,cpd越大。 通常人眼对空间的感觉相当于一个带通滤波器。最敏感在2~5个cpd ,空间截止频率为30cpd。比如我们看油画和电视机屏幕时,当距离离开一定远,cpd增大,人的眼睛就分辨不了象素点细节,便感觉不到颗粒感了。 当人观察一个静止影像时,眼球不会静止一处(精神病人除外), 通常停留在一处几百毫秒完成取像后,移到别处取像,如此持续不断。这种运动称为跳跃性运动(saccadic eye movement)。研究表明跳跃性运动可以增大对比敏感度,但敏感度峰值却减少。 对时间频率的感知 人眼视觉特性(一) 人眼类似于一个光学系统,但它不是普通意义上的光学系统,还受到神经系统的调节。人眼观察图像时可以用以下几个方面的反应及特性: (1)从空间频率域来看,人眼是一个低通型线性系统,分辨景物的能力是有限的。由于瞳孔有一定的几何尺寸和一定的光学像差,视觉细胞有一定的大小,所以人眼的分辨率不可能是无穷的,HVS对太高的频率不敏感。 (2)人眼对亮度的响应具有对数非线性性质,以达到其亮度的动态范围。由于人眼对亮度响应的这种非线性,在平均亮度大的区域,人眼对灰度误差不敏感。 (3)人眼对亮度信号的空间分辨率大于对色度信号的空间分辨率。 (4)由于人眼受神经系统的调节,从空间频率的角度来说,人眼又具有带通性线性系统的特性。由信号分析的理论可知,人眼视觉系统对信号进行加权求和运算,相当于使信号通过一个带通滤波器,结果会使人眼产生一种边缘增强感觉一一侧抑制效应。 (5)图像的边缘信息对视觉很重要,特别是边缘的位置信息。人眼容易感觉到边缘的位置变化,而对于边缘的灰度误差,人眼并不敏感。 (6)人眼的视觉掩盖效应是一种局部效应,受背景照度、纹理复杂性和信号频率的影响。具有不同局部特性的区域,在保证不被人眼察觉的前提下,允许改变的信号强度不同。 人眼的视觉特性是一个多信道(Multichannel)模型。或者说,它具有多频信道分解特性(Mutifrequency channel decompositon )。例如,对人眼给定一个较长时间的光刺激后,其刺激灵敏度对同样的刺激就降低,但对其它不同频率段的刺激灵敏变却不受影响(此实验可以让人眼去观察不同空间频率的正弦光栅来证实)。视觉模型有多种,例如神经元模型,黑白模型以及彩色视觉模型等等,分别反应了人眼视觉的不同特性。Campbell和Robosn由此假设人眼的视网膜上存在许多独立的线性带通滤波器,使图像分解成不同频率段,而且不同频率段的带宽很窄。视觉生理学的进一步研究还发现,这些滤波器的频带宽度是倍频递增的,换句话说,视网膜中的图像分解成某些频率段,它们在对数尺度上是等宽度的。视觉生理学的这些特征,也被我们对事物的观察所证实。一幅分辨率低的风景照,我们可能只能分辨出它的大体轮廓;提高分辨率的结果,使我们有可能分辨出它所包含的房屋、树木、湖泊等内容;进一步提高分辨率,使我们能分辨出树叶的形状。不同分辨率能够刻画出图像细节的不同结构。 人眼在可见光谱范围内的视觉灵敏度是不均匀的,它随波长的变化而变化。 色觉向度 光波具有三种可以量化的物理学向度,那就是波长波幅和纯度。所谓纯度是指同一束光所含 2012年第12期 吉林省教育学院学报 No.12,2012 第28卷JOURNAL OF EDUCATIONAL INSTITUTE OF JILIN PROVINCE Vol .28(总288期) Total No .296 收稿日期:2012—10—18 作者简介:陈梦泽(1984—),男,吉林长春人,长春师范学院数学学院,助教,硕士。研究方向:图像处理,视频图像水印,计算视觉等。 人类视觉注意力的发展与分析 陈梦泽 (长春师范学院数学学院,吉林长春130000) 摘要:人类视觉在面对复杂场景时,会迅速将注意力集中在显著性区域,从而发现其感兴趣的目标。由于注意力选择机制的存在,这种处理的精确性和速度会超过机器视觉。因此如何设计出能够模拟人类视觉注意力的模型是现在我们亟待解决的问题。 关键词:视觉注意;显著图;视觉特征中图分类号:TP391.41 文献标识码:A 文章编号:1671—1580(2012)12—0139—02 人类进行视觉信息的处理主要通过人类视觉注意这一重要的心理调节机制, 在信息爆炸的社会,有大量视觉信息输入的时候做有机筛选变得非常有必要,视觉注意力提供了这样的功能。人类视觉系统可以帮助我们过滤一些不相关的信息,更加关注感 兴趣的事物, 通过及时分析视频中主要的信息(颜色、亮度、轮廓、运动等),从而快速地提取关键目标对象。将这种机制引入到图像分析领域可以大大提高图像处理的效率。它主要应用在下面几个主要领域:图像和视频的压缩及编码、信息隐藏和数字水 印、 目标分割和检测识别、图像检索、场景分析等 。 一、静态图像影响视觉注意程度的主要因素 图1观察图像 最基本的视觉信息包括:颜色、亮度、轮廓、位置 等。根据人类视觉处理信息的流程, 对于静止的图像,底层视觉特征是影响视觉注意程度的首要因素:物体的亮度越高越容易被关注、物体的边缘有较高的对比度可以得到更多的注意,颜色越鲜艳则在图片中更突出。例如我们在看到图1时,我们会在第 一时间注意到鱼,两只鱼在视觉上是显著的,它们的 颜色和形状都和背景不一样, 在水中很明显。这种明确的视觉特性差异是由物理刺激形成的。同时高层信息对注意力也有较大影响:例如人们会更注意 尺寸大的或者细长条的物体, 位于区域中央25%的区域比其余部分注意度高,例如图1中鱼的位置在图片的中央,就单一物体来说在画面中最大;前景比 背景包含更多的语义信息, 则具有更高的注意程度,例如在包含有人物的图像中,人物尤其是面部及面部器官更容易吸引注意。 对于静态图像的视觉注意力的研究有很多经典的模型。最早的Treisman 提出的特征整合理论,把视觉信息处理过程分为前注意阶段和集中注意阶段,在前注意阶段提出各种视觉特征,并在注意阶段 以串行方式整合为视觉客体。在此基础上, 1990年,Wolfe 提出了指向性搜索理论,对一幅图像,通过滤波得到各个视觉特征的特征图,然后通过不同 的加权方式将其综合成一张特征图, 图像中幅度大的地方就是感兴趣的区域。1998年, Itti 等在Koch 的理论框架基础上提出了显著性的视觉注意模型,它的目标选择是基于自底向上数据驱动的,通过特征提取、显著图生成和注意焦点的转移三个过程来选取目标对象。 二、动态图像影响视觉注意程度的主要因素在视频中除了有静态图像影响视觉注意程度的因素外,最引人注意的是运动特征,高速行驶的汽车总要比静止的路标更吸引人的注意。随着时间的推 9 31 本科学生毕业论文 论文题目:基于Patchwork算法的数字水印嵌入技 术 学院:电子工程学院 年级:2008级 专业:电子信息科学与技术 姓名:贾仁旭 学号:20086600 指导教师:王晓飞 2012年4月30日 摘要 当今社会随着数字媒体信息使用的增长,使得人们可以快捷方便地获得数字信息和在线服务。但同时,盗版也变得更加容易,对数字内容的管理和保护成为迫切需要解决的问题。 本文介绍了数字水印技术的发展情况及数字水印的研究的重要性,对数字水印的应用及算法做了简单的介绍。着重介绍了数字水印Patchwork算法,并且利用Matlab编程实现了这一算法。通过实验验证了嵌入水印后的图像和原始图像几乎毫无差别,说明水印达到了很好的隐藏效果,充分证实了数字水印的不可感知性。 关键词 信息隐藏;数字水印;空域图像水印技术;Patchwork Abstract Today's society the use of digital media is growing rapidly, making it quick and easy access to digital information and online services. But at the same time, piracy has become easier, the digital content management and protection of the urgent need to address the problem. This article describes the development of digital watermarking technology and the importance of the study of digital watermarking, digital watermarking applications and algorithms to do a brief introduction. Focuses on digital watermarking Patchwork algorithm, and the use of Matlab programming algorithm. Verified by experiments almost no difference in the watermarked image and original image, a watermark to reach the hidden, fully confirmed by digital watermark imperceptibility. Key words Information hiding; digital watermark; airspace image watermarking technology; Patchwork 人类视觉与计算机视觉的比较 孔 斌 (中国科学技术大学自动化系,中国科学院合肥智能机械研究所) 关键词 知觉 视错觉 计算机视觉 从视错觉等视觉生理现象以及知觉的特性出发,对人类视觉与计算机视觉进行比较,并根据目前对人类知觉活动(特别是视知觉活动)的认识程度讨论计算机视觉目前的状况和今后的发展. 人类自古以来一直在进行着认识自然和改造自然的活动,创造和发展了各种科学技术.随着对自然(包括人本身)的认识的不断加深,人们发明和制造了许多工具和机器,用来提高自己各种活动的效率以及代替自己的部分活动.人们甚至希望能用机器来代替自己的思维活动,从简单、机械的数值运算到复杂、多变的知觉和思考、判断.公元前6 世纪中国人发明了算盘[1],20世纪40年代在美国诞生了第一台电子计算机.计算机视觉和人工智能的研究于20世纪60年代初露端倪.目前,机器人和计算机已能执行有一定复杂程度的知觉任务和推理判断.比如机器人足球赛、计算机下国际象棋等.有不少科幻小说和电影描写了在未来某个时候,计算机已经拥有了人类的全部智能,并且控制奴役着人类;而人类的精英分子则为了反抗计算机、拯救人类,进行了艰难的斗争.这里,我们不去讨论未来的计算机是否真的能拥有人类的全部知觉和思维能力从而代替人脑,本文仅从视错觉、视觉两义性等一些视觉生理现象以及知觉的特性出发,对目前计算机所能拥有的能力视觉与人类的视觉进行比较,并根据目前对人类知觉活动(特别是视知觉活动)的认识程度,讨论计算机视觉目前的状况和今后的发展. 一、视错觉现象 一般来说,在人类的五种基本感觉中, 视觉提供了人类对周围世界了解的大部分信息.常言道 :“ 眼见为实.”果真如此吗 ?有很多情况下“眼见”的并不一定都是“实”的.原因在于,通过我们的眼睛(以及其他感觉器官)而感觉到的外界事物的形象和特性,需要经过大脑的加工处理才能形成相应的知觉和判断.在一定的条件下,大脑会对所看到的形象形成不正确的知觉和判断,即产生视错觉.较为大家熟知的几种视错觉现象包括长短错觉(图1)、大小错觉(图2)、平行错觉(图3)、弯曲错觉(图4)等[1-3]. 图1 长短错觉 图2 大小错觉 图3 平行错觉 图4 弯曲错觉人眼的视觉特性
第一节_人眼的视觉特性-总结
比视觉灵敏度表示人类视觉分光灵敏度特性
人眼的视觉特性知识讲解
人类视觉系统
人眼视觉特性
人类视觉注意力的发展与分析
基于Patchwork算法的数字水印嵌入技术
人类视觉与计算机视觉的比较