当前位置：文档库 › 基于人类视觉特性的自适应水印嵌入方案

基于人类视觉特性的自适应水印嵌入方案

数字水印基本原理

介绍了数字水印技术的基本原理随着信息技术和计算机网络的飞速发展，人们不但可以通过互联网和ＣＤ－ＲＯＭ方便快捷地获得多媒体信息，还可以得到与原始数据完全相同的复制品，由此引发的盗版问题和版权纷争已成为日益严重的社会问题。因此，数字多媒体产品的水印处理技术已经成为近年来研究的热点领域之一。虽然数字水印技术近几年得到长足发展，但方向主要集中于静止图像。由于包括时间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立，视频水印技术的发展滞后于静止图像水印技术。另一方面，由于针对视频水印的特殊攻击形式的出现，为视频水印提出了一些区别于静止图像水印的独特要求。本文分析了ＭＰＥＧ－４视频结构的特点，提出了一种基于扩展频谱的视频数字水印改进方案，并给出了应用实例。１视频数字水印技术简介１．１数字水印技术介绍数字水印技术通过一定的算法将一些标志性信息直接嵌入到多媒体内容当中，但不影响原内容的价值和使用，并且不能被人的感知系统觉察或注意到。与传统的加密技术不同，数字水印技术并不能阻止盗

版活动的发生，但可以判别对象是否受到保护，监视被保护数据的传播，鉴别真伪，解决版权纠纷并为法庭提供认证证据。为了给攻击者增加去除水印的难度，目前大多数水印制作方案都采用密码学中的加密体系来加强，在水印嵌入、提取时采用一种密钥，甚至几种密钥联合使用。水印嵌入和提取的一般方法如图１所示。１．２视频数字水印设计应考虑的几个方面 ·水印容量：嵌入的水印信息必须足以标识多媒体内容的购买者或所有者。 ·不可察觉性：嵌入在视频数据中的数字水印应该不可见或不可察觉。·鲁棒性?押在不明显降低视频质量的条件下，水印很难除去。 ·盲检测：水印检测时不需要原始视频，因为保存所有的原始视频几乎是不可能的。 ·篡改提示：当多媒体内容发生改变时，通过水印提取算法，能够敏感地检测到原始数据是否被篡改。１．３视频数字水印方案选择通过分析现有的数字视频编解码系统，可以将目前ＭＰＥＧ－４视频水印的嵌入与提取方案分为以下几类，如图２所示。

图象视觉特征的提取与表示

第1章图像视觉特征的提取和表示 1.1引言图像视觉特征的提取和表示是将图像的视觉信息转化成计算机能够识别和处理的定量形式的过程，是基于视觉内容的图像分类与检索的关键技术，因此，图像视觉特征的提取和表示一直是图像内容分析领域中一个非常活跃的课题。图像底层视觉特征一定程度上能够反映图像的内容，可以描述图像所表达的意义，因此，研究图像底层视觉特征是实现图像分类与检索的第一步。一般来说，随着具体应用的不同，选用的底层特征也应有所不同，在特定的具体应用中，不同底层视觉特征的选取及不同的描述方式，对图像分类与检索的性能有很大的影响。通常认为，一种良好的图像视觉特征的提取和表示应满足以下几个要求： (1)提取简单，时间和空间复杂度低。 (2)区分能力强，对图像视觉内容相似的图像其特征描述之间也应相近，反之，对于视觉内容不相似的图像其特征描述之间应有一定的差别。 (3)与人的视觉感知相近，对人的视觉感觉相近的图像其特征描述之间也相近，对人的视觉感知有差别的图像其特征描述之间也有一定的差别。 (4)抗干扰能力强，鲁棒性好，对图像大小，方向不敏感，具有几何平移，旋转不变性。本章重点讨论当前比较成熟的特征提取方法，在此基础上选取合适的特征提取方法，用于图像分类与检索系统的特征提取模块。接下来，将依次介绍颜色，纹理，形状等特征的提取和表示方法，最后对各种特征的特点加以比较。 1.2颜色特征的提取和表示颜色是图像视觉信息的一个重要特征，是图像分类与检索中最为广泛应用的特征之一。一般来说同一类别的图像之间颜色信息具有一定的相似性，不同类别的图像，其颜色信息具有一定的差异。相对几何特征而言，颜色特征稳定性好，有对大小、方向不敏感等特点。因此，颜色特征的提取受到极大重视并得到深入研究。本章首先介绍几种常用的颜色空间模型，然后介绍各种颜色特征提取和表示方法。 1.2.1颜色空间模型为了正确地使用颜色这一特征，需要建立颜色空间模型，通常的颜色空间模型可用三个基本量来描述，所以建立颜色空间模型就是建立一个3-D坐标系，其中每个空间点都代表某一种颜色。通常来说，对于不同的应用，应该选取不同的颜色空间模型。常用的颜色空间模型主要有：RGB、HIS、HSV、YUV、YIQ、Munsell、Lu*v*和La*b*等。颜色空间模型的选取需要符合一定的标准，下面就这一标准和最常用的颜色空间模型作一些介绍。文献[错误！未找到引用源。]中介绍了选择颜色空间模型的标准主要有以下几个： (1)观察角度的鲁棒性

人眼视觉特性

人眼视觉特性人眼对380～780纳米内不同波长的光具有不同的敏感程度，称为人眼的视敏特性。衡量描述人眼视敏特性的物理量为视敏函数和相对视敏函数。 1）视敏函数在相同亮度感觉的条件下，不同波长上光辐射功率的倒数可以用来衡量人眼对各波长光明亮感觉的敏感程度。称为视敏函数K(λ)=1/pr(λ) 。 2）相对视敏函数实验表明，人眼对波长为555纳米的光最敏感，因此把任意波长的光的视敏函数与最大视敏函数值K(555)相比的比值称为相对视敏函数。可见光波长实验表明：视敏涵数的曲线的最大值位于５５５nm处当光线微弱向左偏移最大值为５０7nm处，两者相差近５０nm，人眼就相当于带通滤波器，这就表明人眼对亮度变化比较敏感。人眼对于蓝光的视觉灵敏度要比红光和绿光低的多．三条曲线的峰值比为Ｒ：Ｇ：Ｂ＝０．５４：０．５７５：０．０５３（蓝光放大２０倍）．三条曲线有相当一部分是重叠的．正常观察条件下，人眼得到的是二者的合成的视觉，不能将他们各自的数值区分开来．大脑根据三者的比例，感知彩色的色调和饱和度，而三者的和决定了光的总亮度。

2.1对比灵敏度人眼对亮度光强变化的响应是非线性的，通常把人眼主观上刚刚可辨别亮度差别所需的最小光强 I增大时，在一定幅度内感觉不出，必须变化到一定值I+ΔI时，人眼才能感觉到亮度有变化，ΔI/I 此恢复图像的误差如果低于对比灵敏度，即不会被人眼察觉。此外，高频部分在相同的灵敏度阈值下，色差信号Y-R 空间频率只有亮度Y的一半，色差信号Y-B空间频率只有亮度Y的1/4。人眼对于运动图像的对比灵敏度与时间轴上信息的变化速度有关，随着时间轴变化频率的增加，人眼所能感受到的图像信息的误差阈值呈上升趋势，视觉上的这种动态对比灵敏度特性表现为图像序列之间相互掩盖效应。可见度阈值和掩盖效应对图像编码量化器的设计有重要作用，利用这一视觉特性，在图像的边缘可以容忍较大的量化误差，因而可使量化级减少，从而降低数字码率。 2.2分辨率当空间平面上两个黑点相互靠拢到一定程度时，离开黑点一定距离的观察者就无法区分它们，这意味着人眼分辨景物细节的能力是有限的，这个极限值就是分辨率。研究表明人眼的分辨率有如下一些特点：①当照度太强、太弱时或当背景亮度太强时，人眼分辨率降低。②当视觉目标运动速度加快时，人眼分辨率降低。③人眼对彩色细节的分辨率比对亮度细节的分辨率要差，如果黑白分辨率为1，则黑红为0.4，

人类智能的特性表现在4个方面

：人类智能的特性表现在 4 个方面。 A：聪明、灵活、学习、运用。 B：能感知客观世界的信息、能对通过思维对获得的知识进行加工处理、能通过学习积累知识增长才干和适应环境变化、能对外界的刺激作出反应传递信息。 C：感觉、适应、学习、创新。 D：能捕捉外界环境信息、能够利用利用外界的有利因素、能够传递外界信息、能够综合外界信息进行创新思维。 2：人工智能的目的是让机器能够，以实现某些脑力劳动的机械化。 A：具有智能 B：和人一样工作 C：完全代替人的大脑 D：模拟、延伸和扩展人的智能 3：下列关于人工智能的叙述不正确的有：。 A：人工智能技术它与其他科学技术相结合极大地提高了应用技术的智能化水平。 B：人工智能是科学技术发展的趋势。 C：因为人工智能的系统研究是从上世纪五十年代才开始的，非常新，所以十分重要。 D：人工智能有力地促进了社会的发展。 4：人工智能研究的一项基本内容是机器感知。以下列举中的不属于机器感知的领域。 A：使机器具有视觉、听觉、触觉、味觉、嗅觉等感知能力。 B：让机器具有理解文字的能力。 C：使机器具有能够获取新知识、学习新技巧的能力。 D：使机器具有听懂人类语言的能力 5：自然语言理解是人工智能的重要应用领域，下面列举中的不是它要实现的目标。 A：理解别人讲的话。 B：对自然语言表示的信息进行分析概括或编辑。 C：欣赏音乐。 D：机器翻译。 6：为了解决如何模拟人类的感性思维，例如视觉理解、直觉思维、悟性等，研究者找到一个重要的信息处理的机制是：。 A：专家系统 B：人工神经网络 C：模式识别 D：智能代理 7: 根据下列选项来判断可以用指纹来鉴定的是： ①证件 ②签字 ③照片 ④ 密码 ⑤钥匙 ⑥印签（）Ａ： ① ② Ｂ： ① ② ③ Ｃ：①②③④ Ｄ：①②③④⑤⑥ 8：下列选项错误的是（）Ａ：研究人工智能成为当前信息化社会的迫切需求Ｂ：智能化是自动化发展的必要趋势Ｃ：人工智能的研究方法：结构模拟、功能模拟和行为模拟Ｄ：人工智能的实质是人造的智能 9：机器人之父是指：（） A：阿兰.图灵 B：伯纳斯.李 C：莎佩克 D：英格伯格和德沃尔 10：下列哪个应用领域不属于人工智能应用？（）
1/5

视觉媒体特性(精)

视觉媒体特性作者：佚名转贴自：本站原创点击数：64 人类信息交流中，最丰富的信息流是视觉媒体。凡是通过视觉传递信息的媒体，都属于视觉类媒体。它包括图形、图像、文字以及一切形象化的视觉信息形式。视觉类媒体特性研究，涉及光度学、色度学、图形学、数字信号处理和人类视觉生理心理特性等，认识和运用其基本特征，是视觉媒体处理的各种技术之基础。作为一名专业的图形设计员来说，了解视觉媒体特性是必不可缺的。下面我们将从几个不同的侧面来分析和说明视觉类媒体的主要特性。一、可见光谱与光度学参量人眼所看到的客观存在的世界，通常称之为景象。客观物体所发出的光线或是物体受光源照射后所反射、透射的光，在人的视网膜上成象，是一种自然的生理功能，它使人能借助视媒体去认识世界。近代科学的发展，特别是光电转换技术进步，使人类能够以各种方法来记录、处理、传输客观景象，如各类图片、照片、绘画、文稿、X光胶片等：不仅是获取和记录那些人眼可见的图像信息还可利用非可见光和其它手段成象，或利用适当转换装置将其变为人眼可视图像，例如红外成象、超声成象、微波成象等；科学技术使人的视觉能力逐步增强和延伸。从‘物理上讲，光线是电磁波的一种能量辐射形式。电磁波的主要参数包括：传播方向，所具能量，极化情况和波长。电磁波的频率范围很宽，根据波长不同，具有不同性质，包括无线电波、红外线、可见光谱、紫外线、X射线、’宇宙射线等。可见光谱在电磁波中仅是很窄的一段，其波长在380至780毫微米之间，波长不同呈现不同的颜色，从紫、蓝、绿、黄到橙、红，连续地变化。描述方法使用如下物理量：光源发光强度、光通量、照度、亮度，还使用视敏曲线反映人眼的感觉特性。二、三基色原理不同波长的单色光会引起不同的彩色感觉，然而同样的彩色感觉却可以来源于不同的光谱成分的组合，这个事实说明，光谱分布与彩色感觉之间的关系是多对一的，也说明在彩色重现过程中并不要求客观景物反射光的光谱成分，而重要的是人眼应获得原景物的相同的彩色视觉。实验证实，大自然中几乎所有颜色都可以用几种基色按不同比例混合而得到。三基色原理包括如下内容： 1．选择三种相互独立的颜色，即不能以其中两种混合而得到第三种作为基色，将这三基色按不同比例进行组合，可获得自然界各种彩色感觉。如彩色电视技术中选用红(R)、绿(G)和蓝(B)作为基色，印染技术中选用黄、品红、青作为基色。 2．任意两种非基色的彩色相混合也可以得到一种新的彩色，但它应该等于把两种彩色各自分解为三基色，然后将基色分量分别相加后再相混合而得到的颜色。 3．三基色的大小决定彩色光的亮度，混合色的亮度等于各基色分量亮度之和。

一种多重水印嵌入的解决方案研究

DOI：CNKI:11-4415/P.20101119.1814.020 网络出版时间：2010-11-19 18:14 网络出版地址：https://www.wendangku.net/doc/d28907872.html,/kcms/detail/11.4415.p.20101119.1814.020.html 一种多重水印嵌入的解决方案研究李强①②，闵连权①，何宏志②，杨永强② （①信息工程大学测绘学院，郑州450052；②69027部队，乌鲁木齐830006）【摘要】由于矢量地图数据易于复制、分发等特点，同时矢量地图的制作成本高、安全性要求高等，使得用近年来新兴的数字水印技术对矢量地图数据进行保护，成为一个新的重要的研究方向。本文针对矢量地图数据的多重水印嵌入这一难题，提出了一种通过水印嵌入时生成附加信息的方式来进行水印多重嵌入的解决方案，并通过使用作者提出的抗道格拉斯压缩算法进行了实验，取得了较好的效果。【关键词矢量地图数据；多重水印；嵌入；方案【中图分类号】TP391.41 【文献标识码】A 【文章编号】1009-2307（2011）02- - A solution research on multiple watermark embedding Abstract：The vector map data is easy to duplicate and distribute, its production cost and the safety requirements are high, so protecting the vector map data with digital watermark technology becomes a new important research direction. This article studied the problem of multiple watermark embedding of the vector map data, proposed a multiple watermark embedding solution through the generation of additional information when watermark embedding, and carried out an experiment through anti-Douglas algorithm, and finally achieved good results. Key words：vector map data; multiple watermark; embedding; solution LI Qiang①②, MIN Lian-quan①, HE Hong-zhi②, YANG Y ong-qiang②(①Institute of Surveying and Mapping, Information Engineering University, Zhengzhou 450052, China; ②Troops 69027, Urumchi 830006, China) 1 引言矢量地图数据在军事、旅游、导航等方面发挥了重要作用，在人类的社会、经济活动中应用越来越广泛。由于矢量地图数据易于复制、分发等特点，同时矢量地图数据的制作成本高、安全性要求高等，使得用近年来新兴的数字水印技术对矢量地图数据进行保护，成为一个新的重要的研究方向。当前，针对数字水印嵌入的研究主要是单重嵌入，即只能嵌入一次水印信息并进行提取，进行多重水印嵌入时可能就提取不出水印信息，这就一定程度上限制了水印的使用范围,现在对多重水印潜入研究极少。本文针对现实需求和实践总结，提出了一种通过水印嵌入时生成附加信息的方式实现水印多重嵌入的解决方案。 2 矢量地图数据水印技术 2.1 矢量地图数据水印多重嵌入研究的意义和现状矢量地图数据数字水印技术的研究意义在于标示地图数据的版权保护信息，在许多情况下，需要对嵌入水印后的地图数据再次或多次潜入水印信息，但不论是采用相同或不同的嵌入算法，经过多重嵌入后的数据很难提取出水印信息，目前对这种水印多重嵌入的研究很少，特别是针对矢量地图数据的水印多重嵌入研究更少。现阶段水印嵌入的研究主要集中在单次嵌入算法的相关研究[2-4]，即将水印信息单次嵌入到地图数据中，例如对于嵌入水印后的数据的下一级分发，没有一个好的解决方案，确保矢量地图数据的安全，如果采取与上一级相同的水印嵌入方案，会引起数据精度的降低或者提取不出水印信息等问题，如果采取与上一级不同的水印嵌入方案，一是在实践操作上存在可行性不高的问题，二是可能也会引起数据精度的降低或者提取不出水印信息等问题。 2.2 矢量地图数据水印嵌入分析 1) 水印嵌入空间分析矢量地图数据是通过分层存储来实现的，每层存储位置信息和属性信息等，位置信息一般用几何数据来表示，通过图元来描述目标的，基本的图元有点、线段、多边形，点是通过坐标惟一定义的，线段是通过组成线段的一系列点定义的，多边形是由封闭的线段组成的。点的位置由平面坐标

数字水印算法介绍

数字水印算法列举湖南科技大学计算机科学与工程学院 ①基于LSB 的数字水印方案（空间域、不可逆、不可见和盲检测）嵌入步骤：（1）先把水印信息转化为二进制比特流I。（2）根据I的长度生成密钥K，并且严格保存。密钥K是对图像载体像素位置的一个映射。（3）把I中的每一位依次根据密钥K，置换掉原始载体图像中相应位置的像素最后一位。提取步骤：（1）根据严格保存的密钥K遍历嵌入了水印的图像中的相应像素，提取出最后一位。（2）将提取出来的每一位重新组合成水印信息。 ②基于差分扩展的数字水印方案（变换域、可逆、不可见和盲检测）嵌入步骤：（1）将图像M分成像素点对（x，y），将水印信息转化为二进制比特流,比特流的每一位用m 表示。（2）根据水印信息比特流的长度随机生成信息的嵌入位置k作为密钥信息严格保存。（3）对图像M计算均值l和差值h：?????-=+=y x h y x floor l 2(（floor表示向下取整）（4）将水印比特信息m以差值扩展的方法嵌入到差值h中：m h h +?='2（5）将得到的h '代入（3）中，得到新的图像像素对，形成嵌入秘密信息后的图像C。提取步骤：（1）将图像C分成像素点对（x，y），读入密钥信息K。（2）将图像C依旧按照嵌入步骤中的（3）式计算均值l和差值h。（3）根据密钥k找到相应位置，提取差值h的最后一位比特信息m，再将差值h进行变换得到1>>='h h 。（4）将提取到的比特信息m进行组合可以恢复水印信息，将得到的h '代入嵌入步骤的（3）中计算新的图像像素对可以恢复原始图像载体M。 ③基于直方图修改的数字水印算法（空间域、可逆、不可见和盲检测）嵌入步骤：（1）找到直方图的零点z和峰值点p，将z v p <<的像素值v自加1。（2）漂移后的直方图v=p处即为嵌入水印的位置，将水印信息转化为二进制流并记为k，按顺序嵌入，即k v v +='；（3）得到的由像素值v '组成的图像就是嵌入秘密信息后的图像。同时p、z以密钥的形式保存。提取步骤：（1）读取密钥，得到p、z的值。（2）遍历图像的每个像素，当像素v=p时，提取信息0并保持数据不变；当v=p+1时，提取信息1并将数据减1。（3）当vz时，数据保持不变；当p-1

人类视觉与计算机视觉的比较

人类视觉与计算机视觉的比较孔　斌　(中国科学技术大学自动化系,中国科学院合肥智能机械研究所) 关键词　知觉　视错觉　计算机视觉从视错觉等视觉生理现象以及知觉的特性出发,对人类视觉与计算机视觉进行比较,并根据目前对人类知觉活动(特别是视知觉活动)的认识程度讨论计算机视觉目前的状况和今后的发展. 人类自古以来一直在进行着认识自然和改造自然的活动,创造和发展了各种科学技术.随着对自然(包括人本身)的认识的不断加深,人们发明和制造了许多工具和机器,用来提高自己各种活动的效率以及代替自己的部分活动.人们甚至希望能用机器来代替自己的思维活动,从简单、机械的数值运算到复杂、多变的知觉和思考、判断.公元前6 世纪中国人发明了算盘[1],20世纪40年代在美国诞生了第一台电子计算机.计算机视觉和人工智能的研究于20世纪60年代初露端倪.目前,机器人和计算机已能执行有一定复杂程度的知觉任务和推理判断.比如机器人足球赛、计算机下国际象棋等.有不少科幻小说和电影描写了在未来某个时候,计算机已经拥有了人类的全部智能,并且控制奴役着人类;而人类的精英分子则为了反抗计算机、拯救人类,进行了艰难的斗争.这里,我们不去讨论未来的计算机是否真的能拥有人类的全部知觉和思维能力从而代替人脑,本文仅从视错觉、视觉两义性等一些视觉生理现象以及知觉的特性出发,对目前计算机所能拥有的能力视觉与人类的视觉进行比较,并根据目前对人类知觉活动(特别是视知觉活动)的认识程度,讨论计算机视觉目前的状况和今后的发展. 一、视错觉现象一般来说,在人类的五种基本感觉中, 视觉提供了人类对周围世界了解的大部分信息.常言道 :“ 眼见为实.”果真如此吗 ?有很多情况下“眼见”的并不一定都是“实”的.原因在于,通过我们的眼睛(以及其他感觉器官)而感觉到的外界事物的形象和特性,需要经过大脑的加工处理才能形成相应的知觉和判断.在一定的条件下,大脑会对所看到的形象形成不正确的知觉和判断,即产生视错觉.较为大家熟知的几种视错觉现象包括长短错觉(图1)、大小错觉(图2)、平行错觉(图3)、弯曲错觉(图4)等[1-3]. 图1　长短错觉图2　大小错觉图3　平行错觉图4　弯曲错觉