文档库 最新最全的文档下载
当前位置:文档库 › 第3章 数字图像基础

第3章 数字图像基础

第3章 数字图像基础
随着科学技术的发展,人们对信息处理和信息交流的要求越来越高,最典型的表现是手 机及相关数码产品的更新换代速度加快。 图像信息具有直观、 形象、 易懂和信息量大等特点, 因此它是在人们日常的生活、生产中接触最多的信息种类之一,就和生活联系紧密的电视机 来说,其屏幕尺寸越来越大,画面质量越来越高。随着对图像处理的要求不断提高,应用领 域不断扩大,图像理论必须不断提高、补充和发展。图像的处理已经从可见光谱扩展到光谱 的各个阶段,从可见光谱到不可见光谱,从静止图像发展到运动图像,从物体的外部延伸到 物体的内部,以及进行人工智能化的图像处理等。 本章包括 数字图像 图像采集基本知识 图像分析和处理 数字图像技术应用 MATLAB 可读的图像及视频的格式
3.1
数字图像
我们现在生活在数字图像的世界中,每个人都满身的数字化装备,这在上下班坐车的时 候表现得最为明显,满车的人都没有闲着,MP3,MP4,PSP,PPC 手机,数码相机,笔记 本电脑,这些装备的使用需要了解数字图像的相关知识,比如手机上的照片如何处理,MP4 支持哪些视频文件,只有具备一定的数字图像方面的知识才能玩转这些装备,使我们的生活 丰富多彩。下面初步介绍一下数字图像的基本知识。
3.1.1 图像的概念
为了实现对图像信号的处理和传输,首先必须对图像进行正确的描述,即什么是图像。 图像对我们来说并不陌生,但却很难用一句话说清其含义。从广义上来说,图像是自然界景 物的客观反映,是人类认识世界和人类自身的重要源泉。照片、绘画、影视画面无疑属于图 像;照相机、显微镜或望远镜的取景器上的光学成像也是图像。此外,汉字也可以说是图像 的一种,因为汉字起源于象形文字,所以可以当作一种特殊的图像;图形可以理解为介于文 字与绘图之间的一种形式,也属于图像的范畴。由此延伸,通过某些传感器变换得到的电信 号图,如脑电图、心电图等也可以看作是一种图像。 “图”是物体反射或透射光的分布,它
51

MATLAB 图像处理与界面编程 是客观存在的,而“像”是人的视觉系统所接收的图在人脑中所形成的印象或认识。总之, 凡是人类视觉上能够感受到的信息,都可以成为图像。 图像信息不仅包含光通量分布,而且还包含人类视觉的主观感觉。随着计算机技术的发 展,人们可以人为地创造出色彩斑斓、千姿百态的各种图像。概括地讲,图像包含视频、图 形、动画、符号文字等重要内容。
3.1.1.1
视频
视频图像又称为动态图像、活动图像或者说运动图像。它是一组图像在时间轴上的有序 排列,是二维图像在一维时间域上构成的序列图像。如 NTSC 制式电视 30 帧/秒,PAL 制式 是 25 帧/秒,电影则是 24 帧/秒。现在常用的视频还应该包括网络视频和手机视频。网络视 频和手机视频与传统视频的不同在于它是一种流媒体, 所谓流媒体是指采用流式传输的方式 在 Internet 播放的媒体格式。如网上使用最多的 rmvb 流媒体格式改变了大众的观看电影和 电视剧的习惯, 由电视观看转向网络观看, 而且现在已经有了支持流媒体格式的电视和碟机。
3.1.1.2
图形
图形是图像的一种抽象,它反映为图像的几何特征,例如点、线、面等。图形不直接描 述图像中的每一点,而是描述产生这些点点过程和方法,被称为矢量图形。矢量图形有其专 有的常用处理软件,比如 Adobe 公司的 Illustrator、Macromedia 公司的 FreeHand 以及 Corel 公司 CorelDRAW。
3.1.1.3
动画
图3-1 三维动画片截图
图3-2 半条命 2 游戏截图
动画与视频的区别在于视频的采集来源于自然的真实图像, 而动画则是利用计算机产生 出来的图像或图形,是合成动态图像。动画包括二维动画、三维动画、真实感三维动画等多 种形式。专门的电脑动画片的技术水平体现了计算机图像水平的高峰。比如大家熟悉的华人 大导演吴宇森也涉足了专门的电脑动画片,比如他当制片人的日本最终幻想系列动画中的 《苹果核战记》续集,其截图如图 3-1 所示。最终幻想系列的游戏宣传电影其电脑动画制作 水平也是相当高的。现在的游戏是一种交互式的计算机动画,由于电脑游戏和很多人,特别 是青少年的娱乐生活息息相关, 导致很多人关于电脑图像技术方面的知识有很多都是从玩游 戏得知的。比如很多人最开始关注 HDR,就是 2005 年在玩 HL2(半条命 2,SOURCE 版
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章
数字图像基础
CS 的前身)获得直观画面感受后注意到的,在游戏领域称其为“高动态光照渲染特效” 。简 单的说,HDR 可以让游戏画面更漂亮,如图 3-2 为 HL2 游戏截图。在使用了 HL2 的游戏引 擎 SOURCE 后,SOURCE 版的 CS 在场景里面最明显的变化是找不到非常暗的场景了,原 来的一些利用黑暗场景打黑枪的 camp 点失效了,这种变化也源于 HDR 技术的采用。采用 了 HDR 技术后,画面的层次更加丰富,亮的部分有层次,同样暗的部分也有层次。
3.1.1.4
符号与文字
符号可以表示许多信息。符号包括各种描述量、数据、语言等。其中最重要的是数值、 文字等有结构的符号组。符号是表示某种含义的,它与使用者的知识有关,是比图形更高层 次的抽象。需具备特定的知识方能解释特定的符号和特定的文本(如语言) 。符号是用特定 值表示的,如 ASCII 码、中文国标等。文本媒体是用得很多的一种符号媒体形式,它由具有 上下文关系的字符串组成,与字符的结构有关。 一般人都知道中文是象形文字, 那么什么是象形文字呢?它是指纯粹利用图形来作文字 使用,而这些文字又与所代表的东西,在形状上很相像。一般而言,象形文字是最早产生的 文字。用文字的线条或笔画,把要表达物体的外形特征,具体地勾画出来。例如“月”字像 一弯月亮的形状, “龟”(特别是繁体的[龟])字像一只龟的侧面形状, “马”字就是一匹有马 鬣、有四腿的马, “鱼”是一尾有鱼头、鱼身、鱼尾的游鱼, “艹” (草的本字)是两束草, “门”(繁体的[门]更像)字就是左右两扇门的形状。而“日”字就像一个圆形,中间有一点, 很像人们在直视太阳时,所看到的形态。 象形字来自于图画文字,但是图画性质减弱,象征性质增强,它是一种最原始的造字方 法。它的局限性很大,因为有些实体事物和抽象事物是画不出来的。因此,以象形字为基础 后,汉字发展成表意文字,增加了其他的造字方法,例如六书中的会意、指事、形声。然而, 这些新的造字方法,仍须建基在原有的象形字上,以象形字作基础,拼合、减省或增删象征 性符号而成。
3.1.2 图像信息的重要性
如前所述,图像是一种空间信息,它展现在人们的面前,具体地表明了事物的形态、位 置和色彩等,以便人们进行观测、测量和识别。 任何时候,图像在人类接收和传递信息中都起着重要的作用。这是因为图像比起声音、 文字信息有其优点,这就是图像的直观性,它能原封不动地将客观事物的原形展现在眼前, 供不同目的、不同能力和水平的人们去观察和理解。而声音、文字信息则并反映客观事物的 原形,是通过描述来表达事物,即属于描述性的信息。既然是描述,就会受到描述者的许多 因素的影响,诸如主观、片面、专业、情绪、状态等都会使描述偏离客观事物。正是由于图 像的直观性,才有“百闻不如一见”的说法。 除了这些图像本身的特点外, 图像信息的重要性还在于人们的视觉系统有着瞬间获取图 像、分析图像、识别图像和理解图像的能力,在人们的生活、生产活动中,依赖图像信息的 状况比比皆是。从视觉接受信息的角度看,可以认为图像是空间客观景物在眼球视网膜上形
53

MATLAB 图像处理与界面编程 成的像。 人们在高处用眼睛巡视前方, 立刻能获得大自然丰富多彩的一幅幅图像的快速分析, 得到诸如高山、大海、树木、蓝天、小鸟等等的识别结果。由此可见,视觉系统和大脑具有 高超的能力,能区分图像中的物体与背景;能感知颜色、亮度、形状、方向、位置、运动等 信息的细微差别;能将有意义的信息综处理。其实,人们在生活和非自动化生产中,都离不 开用视觉获取图像和处理图像。 当然,图像也有其另一方面的特点,那就是图像的信息量大,这不仅是因为图像反映客 观事物的原形,信息本身较声音、文字丰富,还因为作为空间信息的图像,在接收和传递过 程中,必须将其看作是许多点的集合,其信息量非常可观。为此需要对图像信息进行压缩。 图像压缩技术和大家的生活联系最为紧密的地方就是视频压缩技术。从早期的 VCD,到后 来的 DVD,再到现在的高清视频,图像压缩技术不断改变我们的生活。 据统计,通过视觉获取的信息占人们获取所有信息的 75%左右,图像是人类从事活动的 重要信息源。
3.2
图像采集基本知识
这里介绍图像采集基本知识,具体讲解电视摄像机、电荷-耦合装置、分辨率的概念和 图像速率及采集的计算公式,让我们对了解基本的图像采集知识。
3.2.1 电视摄像机
最常用的图像获取装置是电视(TV)摄像机。它能获取自然景物或照片的图像。透过 照相底片(包括 X 线照相材料)的光线能投射到 TV 摄像头的表面。TV 摄像机也可安装在 显微镜上。在卫星和空中摄像时常用红外线摄像机。 长期以来,黑白 TV 摄像机是用于高质量科学定量研究摄像的惟一手段。近年来,彩色 TV 技术已高度发展,彩色摄像机能够并且正被应用于高质量的定量图像处理。彩色摄像机 输出三种信号(红、绿、蓝,通称 RGB 信号) 。对这些信号进行独立的采样和数字化就可用 数字形式表达景物中全部彩色内容。
3.2.2 电荷-耦合装置
随着数码摄像头、数码相机和手机照相机的普及,CCD 成为日常生活中不可缺少的电 子元器件,电荷-耦合装置是图像采集设备的重要组成部分,需要对其有一定的了解。 电荷-耦合装置(charge-coupled devices,CCD)被用作图像传感器。固态传感器常做成 光敏硅元件的阵列,每一硅元件产生一个电脉冲,其幅度与硅元件上入射光强度有关。固态 阵列可以做成线传感器或面传感器。 前者对景物每次扫描一行, 后者通过平行扫描获得图像。 TV 摄像机和 CCD 中的采像功能可以自动调节景物的放大倍数,TV 摄像以行扫描制式 获取,CCD 则以固定距离的硅元件阵列获取。
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章
数字图像基础
CCD 是 60 年代末期由贝尔实验室发明。开始作为一种新型的 PC 存储电路,很快 CCD 具有许多其他潜在的应用,包括信号和图像(硅的光敏性)处理。 CCD 是在薄的硅晶片上处理一系列不同的功能,在每一个硅晶片上分布几个相同的 IC 等可产生功能的元件,被选择的 IC 从硅晶片上切下包装在载体里用在系统上。总结下来, CCD 主要有以下几种类型: 面阵 CCD 允许拍摄者在任何快门速度下一次曝光拍摄移动物体。 线阵 CCD 用一排像素扫描过图片,做三次曝光——分别对应于红、绿、蓝 三色滤镜,正如名称 所表示的,线性传感器是捕捉一维图像。初期应用于广告界拍摄静态图像,线性阵列处理高 分辨率的图像时,受局限于非移动的连续光照的物体。 三线传感器 CCD 在三线传感器中,三排并行的像素分别覆盖 RGB 滤镜,当捕捉彩色图片时,完整的彩 色图片由多排的像素来组合成。三线 CCD 传感器多用于高端数码相机,以产生高的分辨率 和光谱色阶。 交织传输 CCD 这种传感器利用单独的阵列摄取图像和电量转化, 允许在拍摄下一图像时在读取当前图 像。交织传输 CCD 通常用于低端数码相机、摄像机和拍摄动画的广播拍摄机。 全幅面 CCD 此种 CCD 具有更多电量处理能力,更好动态范围,低噪音和传输光学分辨率,全幅面 CCD 允许即时拍摄全彩图片。全幅面 CCD 由并行浮点寄存器、串行浮点寄存器和信号输出 放大器组成。全幅面 CCD 曝光是由机械快门或闸门控制去保存图像,并行寄存器用于测光 和读取测光值。图像投摄到作投影幕的并行阵列上。此元件接收图像信息并把它分成离散的 由数目决定量化的元素。这些信息流就会由并行寄存器流向串行寄存器。此过程反复执行, 直到所有的信息传输完毕。接着,系统进行精确的图像重组。 在了解了 CCD 的类型之后, 接下来可以学习下 CCD 在图像采集运作中的作用, 一般来 说主要分为曝光和电量转移,具体说明如下: 曝光 通过离散的像素将光信号变为电信号。当入射光以光子的形式落在像素阵列上时,就获 得一个图像。每一个光子相对应的能量被硅吸收就发生反应产生一个(电子-孔)电量组, 每一个像素所能收集到的电子数,线性地取决于光亮的程度和曝光的时间,非线性的取决于 波长。 电量转移 在 CCD 内部进行电量转移。一旦电量被集中并保持在像素的结构中,就一定会使在物 理上与像素分离的侦测放大器得到电量,当一个像素的电量移动时,同时相对应的像素的电 量都会移动。电量对电压的转换并输出放大。
55

MATLAB 图像处理与界面编程
3.2.3 分辨率
在图像处理中一个最重要的问题是选择正确的分辨率或采样密度。 因为一幅图像实质上 是二维空间中的信号,故适用于信号处理的法则同样适用于图像处理。为了真实地表现一个 景物,图像必须以景物最高相关空间频率的 2 倍进行采样。中等分辨率传感器产生的图像含 256 像素×256 像素(pixels) 。高分辨率要求图像至少达到 2048 像素×2048 像素。
3.2.4 图像采集卡基本知识
图像采集即将视频转换成 PC 机可使用的数字格式。 常用的方法是使用图像采集卡采集, 专业图象采集卡是将视频信号经过 AD 转换后,经过 PCI 总线实时传到内存和显存。在采集 过程中,采集卡传送数据采用 PCI Master Burst 方式,可实现摄像机图像到计算机内存的可 靠实时传送,并且几乎不占用 CPU 时间,留给 CPU 更多的时间去做图像的运算与处理。 为了合理使用并评价图像采集卡的工作,有些相关参数必须了解。 帧图像大小(Image Size) :W×H(长×宽) 。首先了解需要采集多大的图像尺寸。 颜色深度∶d(比特数) 。图像颜色(8Bit 灰度图像还是 16/24/32Bit 真彩色) 。 帧速∶f。标准 PAL 制当然就是 25 帧,非标准就没准了,500-1000 帧都有可能。 数据量∶Q(MB) 。图像信号的数据量。 采样率∶A(MB) 。采集卡的采样率,通过其产品手册可知。 计算公式∶ Q=W×H×f×d/8。 判断标准∶如果 A>Q×1.2,则采集卡能够胜任采集工作。
3.3
图像处理和分析
图像处理和分析可定义为应用一系列方法获取、校正、增强、变换或压缩可视图像的技 术。其目的是提高信息的相对质量,以便提取信息。图像处理中的变换属于图像输入-图像 输出模式,而在图像分析中的操作属于图像输入-数字信息输出模式。 已有许多图像生成技术问世,但除图像恢复技术以外,图像处理技术在很大程度上与图 像形成的过程无关。当图像已被采集且已对获取过程中产生的失真进行了校正,那么所有可 用图像处理技术本质上是通用的。因此图像处理是一种超越具体应用的过程:任何为解决某 一特殊问题而开发的图像处理新技术或新方法,几乎肯定能找到其他完全不同的应用领域。
3.3.1 图像处理和图像分析问题
这里将回顾图像处理和图像分析中若干最重要的方面。 任何一种实际应用均为多种方法 的组合,每种方法针对性地处理问题的一个方面。
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章
数字图像基础
3.3.1.1
灰度量化
正如图像必须沿着空间轴数字化而得到一个数字图像一样,图像强度也必须进行数字 化。TV 摄像机或 CCD 的输出是一个与入射光强度相关的模拟电压。电压范围从零(黑色) 到最大值(最高的光强度)被分成许多相等间隔。这个间隔数越大,不同的强度细节(灰度) 在数字图像中保存得越多。通常以 256 级(按 1 字节编码)覆盖整个灰度。一幅灰度分辨率 为 8 位,空间分辨率为 512 像素×512 像素的图像需 0.25 兆字节的存贮容量。如果想要全彩 色表示,存贮空间将要增加 3 倍,达 0.75 兆字节。
3.3.1.2
图像恢复
在图像获取时,许多因素可以导致图像质量下降。例如由摄像机移动或摄像机散焦引起 图像模糊,存在 50Hz 或 60Hz 的干扰模式或透视的几何变形。这种质量退化的纠正可应用 一个退化处理模型。 图像恢复的目的是设法改进图像的质量,以提高视觉观察或进一步数字处理的效果。从 这个意义上看,图像恢复与图像增强的目的相同。差别是图像恢复后的图像可看成是原始图 像逆退化过程的结果。因此,图像恢复有时候称作客观图像增强。 恢复技术可以是整体的也可以是局部的,它们可以在某个频域或空间域中实现。例如消 除一个具有已知频率的干扰模式,最好在频域中进行,其步骤为:傅立叶变换、滤波、傅立 叶逆变换。去除几何变形一般是在空间域内完成。这里的滤波技术与信号滤波雷同。
3.3.1.3
图像增强
如上所述,图像增强的最终目的是设法改进图像的质量。不同的增强技术可以用于不同 的目的,这取决于应用的类型。如果打算直接观察图像,增强对比度是合理的选择。如果是 为了进一步对图像作数字处理,分割(一种突出各图像成分之间的边界和线状结构的运算) 是优先选择的一种运算。但这一运算并不一定产生一个更有效的图像。因为图像增强往往随 处理者不同的意愿而定,故此技术有时称为主观的图像增强。和恢复技术一样,增强技术也 可以是整体的或局部的,并且它们也可以在某个频域或空间域中进行。
3.3.1.4
边缘检测
边缘或轮廓检测技术用于检测图像中线状局部结构,通常是作为图像分割的预处理步 骤。边缘是图像中具有不同平均灰度等级的两个区域之间的边界。因而,大多数边缘检测技 术应用某种形式的梯度算子,可应用对水平方向、垂直方向或对角线方向的梯度敏感的梯度 算子,用它们的复合结果可检测任意方向的边界。在大多数实际应用中,边缘检测是当作一 个局部滤波运算完成的。边缘检测并不一定意味着要分割整幅图像:被检测的边缘可能呈不 连续形态,并且通常在一个感兴趣目标周围所检出的边缘并不构成一个封闭轮廓。反之,也 不是所有的图像分割技术都依赖于前面的边缘检测过程。 因此下面把图像分割作为一个独立 的题目进行讨论。
57

MATLAB 图像处理与界面编程
3.3.1.5
图像分割
图像分割的目的是把一个图像分解成它的构成成分,以便对每一目标进行测量。图像分 割是一个十分困难的过程。但其测量结果的质量却极大地依赖于图像分割的质量。有两类不 同的图像分割方法:一种方法是假设图像各成分的强度值是均匀的并利用这种均匀性,使用 这种方法的图像分割技术有直方图分割和区域生长分割; 另一种方法寻找图像成分之间的边 界,因而是利用图像的不均匀性,使用这种方法的图像分割技术有梯度法分割。下面具体介 绍一下这 3 种分割方法: 1. 直方图分割(利用均匀性)
进行图像分割的最简单的方法是建立在灰度值的直方图分析的基础上。 如果一个图像是 由明亮目标在一个暗的背景上组成的,其灰度直方图将显示两个最大值:一个是由目标点产 生的峰值,另一个峰值是由背景点产生。 如果目标和背景之间反差足够大,则直方图中的两个峰值相距甚远,可选一个强度阈值 T 将两个最大值隔开。图中所有大于 T 的灰度值可用数值 1 取代,而所有小于或等于 T 的灰 度值可用数值 0 取代。这样生成一个二进制图像,其中目标点由 1 表示。如果图像由两个以 上成分所组成,则直方图将显示多重峰值,分割可以取多重阈值来完成。 2. 区域生长分割(利用均匀性)
另一种同样利用区域均匀性进行分割的方法称区域生长(region growing) 。先在图像中 挑选一个或一个以上的种子点,种子点的数目等于被检测区域的数目。然后规定一个像素之 间的相似性的准则,最简单的是基于像素灰度值的准则。例如 2 个像素的灰度值之间相差的 绝对值小于给定的阈值,则称它们是相似的。区域生长法开始时先检查种子周围的全部点。 如果一个点足够类似于它的种子点,则它被划归该种子点区域。对每一个区域都重复这一过 程,即检查围绕相应区域种子点的各像素直到在这个图像中所有点都被分类划归为止。 3. 梯度法分割(利用不均匀性)
第三种图像分割法建立在图像的不连续性基础上。这一方法一般采用某种梯度运算(边 缘检测) 。正如上文所说,问题是一般边缘检测并不生成一条连续的边界,故此法往往借助 于一些边缘连接法以获得满意的连续边界。
3.3.1.6
图像测量
一旦图像已被分割,可逐个对目标进行测量。测得的特征可以分成几个不同的类型。 几何特征:描述目标面积、圆周、形状等性质。 强度特征:描述目标中灰度值的分布:均值、标准差和可能的高阶矩。 颜色特征:客观地描述目标的颜色和/或颜色在目标中的分布。显然,这些特征的 测量意味着须用多光谱图像, 然后通过各像素的各种颜色灰度值的函数来定量描述 像素的颜色特征。 纹理特征:描述图像的细微结构。这些特征定量地表示小距离内灰度值的变化。如
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章
数字图像基础
果目标有灰度值重复模式的特征,那么就可用纹理特征来描述这类模式。
3.3.1.7
图像压缩
数字图像需要很大的存储空间,由于这一原因以及为了达到有效的传送图像的目的,图 像压缩技术已备受关注。其目的是生成占用较少空间而获得与原图十分逼真的图像。应用解 压缩技术,可以将这些经过压缩的图像准确地或近似地重建原来图像。 为了达到尽可能准确重建图像这一要求, 就不能利用减少空间分辨率或强度分辨率的运 算方法,因为经过这些运算之后,原始图像是不能复原的。有一种压缩方法称作游程长度编 码(run length coding) ,它是利用许多图像含有或大或小的均质部分这个事实,逐行阅读图 像,它的内容可用序列偶(灰度和像素数)表示。这一技术减少存储空间的效果取决于平均 游程长度。因为采用逆运算有可能精确地完全重建原始图像,因而是一种无损方法(即不引 起信息损失) 。 另一种无损压缩技术是基于这样的事实: 一般说来相邻像素之间灰度之差小于它们本身 灰度,因而差值可以用较少的位存储。 如果允许解压后的图像同其原始的图像之间质量上有较小的降级,那么许多压缩技术 (包括数据损失压缩)可供使用。随着传送图像的计算机网络数量的增加,例如医院网络或 WWW,压缩技术已成为图像处理的重要方面。用于压缩放射学图像和其他图像的标准称为 医学数字图像和通信(digital imaging and communication in medicine,DICOM) 。
3.3.1.8
图像配准
在某些应用中,要对两个或更多的图像进行比较,例如对不同时间获得的同一景物的图 像需检测其可能发生的改变。为了进行有效的比较,这些图像需要对齐,这意味着需对图像 作平移、旋转、缩放和拉伸等运算,这就是图像配准(image registration) 。有时候可借助于 在图像中设置特殊标记点(基准标记)以求出上述运算参数。如果没有这样的标记点,必须 使用相关技术来求得最佳的变换。 应该尽可能使用基准标记, 因为相关技术对噪音是敏感的。
3.3.1.9
可视化
断层成像(CT、MRI、PET)的问世,使二维断层图像到三维图像重建成为可能,也促 使许多科研致力于开发可视化技术。 可视化是一种在图形显示器的二维平面上绘制三维结构 的技术。这些方法发展极快,常常可以实时地显示三维结构(例如头颅或人体的其他部位) , 并能一层一层地剥去和旋转。显然,这些高级技术需要非常快速的计算机。
3.3.1.10
图像存档
虽然严格地讲图像存档不是图像处理问题,但是它变得越来越重要,人们希望不仅能存 储大量的图像,而且还能方便、快速地检索这些图像。这意味着存档特别需要利用图像压缩 技术。
59

MATLAB 图像处理与界面编程
3.3.2 图像变换
有两种不同类型的基本图像变换:整体和局部。无论哪种情况,输出图像中任何一点的 强度值是原始图像中若干点的强度值的函数。在整体变换中是原始图像中所有点的函数;在 局部变换中仅仅是原始图像中对应像素邻近某些点的函数。
3.3.2.1
全局变换
人们熟知的全局变换是傅立叶变换。在信号处理中,傅立叶变换将信号从一个域变到另 一域: 从时域变到频域。 在图像处理中, 傅立叶变换是把图像从空间域到另一域 (也为频域) 。 傅立叶变换经常应用于频率滤波,在频域中把不需要的频率滤除,再经反变换(用逆傅立叶 变换)就得到已去除特定频率的原始空间域中的图像。这样的滤波过程有时用于去除一个已 知频率的干扰图像(如来自电源的 50~60Hz 的干扰) 。当低频被滤掉后经反变换后可得到一 个高频被增强的图像。这个图像更加适宜于随后的边缘检测运算。
3.3.2.2
局部图像变换
在局部图像变换中, 输出图像中任何一点的强度值是原始图像中对应点邻近某些点强度 值的函数。局部变换的一种特殊形式是在数学形态学(mathematical morphology)中定义的 运算。这些运算也需要定义一个核,叫做构造元素,而图像强度的运算是非线性的(包括最 大和最小运算) 。这样的变换产生腐蚀(如剥掉目标)或扩张(如扩大目标) ,当将它们结合 运用时可产生更加复杂的变换。在近代图像处理中这些变换已变得越来越重要。
3.4
数字图像技术应用
图像处理已应用于现代社会的许多领域。下面列举若干应用的例子,这也展示了数字图 像技术的广阔应用前景,典型的应用包括如下: 卫星成像: 地球或其他行星表面的图片是由宇宙飞船和人造卫星携带的摄像机拍摄 得到。拍摄其他行星的图像的目的是研究它们的表面以便探索行星的性质或历史 等。利用人造卫星对地球摄像的目的在于气象学、农业、环境保护和军事用途。 空中成像:拍摄地球部分表面的图片,用于调查庄稼的收成或用于绘制地图等。 打印和手写:识别打印的或手写的文字是图像处理的最早应用之一。自动阅读邮政 编码和银行支票即为其应用例子。 条形码:大多数超市的收银台上有一种设备,它能阅读并解释产品上的条形码。条 形码也用于识别文件、生化样本和医院中的组织标本。 放射学:在医学领域,放射学是图像处理技术的主要应用之一。不仅仅在常规 X 线检查中使用,其他如计算机断层扫描(CT) 、磁共振成像(MRI) 、正电子发射断 层摄影术(PET)和超声诊断的成像过程中获得的许多图像都需要进行解释。在这 些应用中,三维重建是特别感兴趣的主题。
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章
数字图像基础
染色体:因为染色体图像具有相对简单的结构,染色体配对和染色体核型的自动化 确定是图像处理在医学中的最早应用。 细胞学和组织学:显微镜成像的自动化或定量解释也是早期应用的例子。
3.4.1 材料科学研究中的计算机图像分析与处理
随着材料科学研究的深入和发展, 计算机图像分析系统逐渐成为辅助研究材料结构与性 能之间定量关系的一种重要的手段。在 MATLAB 的例子中就包含了关于材料分析的例子, 以金属材料来说, 计算机图像分析系统完成的工作有晶粒度测量、 夹杂物的评级、 相分析 (包 括测量含量及形状因子)以及显微硬度、孔洞率、球化率、圆度和涂层厚度的测定等。计算 机图像分析系统的引入极大提高了这类定量分析的质量。 在目前全球竞争日益激烈的环境下, 在材料的生产领域贯彻严密的质量控制标准正成为 维持一个企业健康发展的重要保证。为达到 ISO、ASTM、GB 等标准,许多企业投入大量 的人力和物力进行质量检测,实行统计过程控制(SPC)及质量控制的文件化管理。大量重 复的、高密度的检测证实图像分析系统(特别是自动分析系统)发挥重要作用的地方。实行 质量控制管理,要求文件更具可追溯性、统一性,这对质量文件提出更高的要求,图像分析 系统成为提高质量的质量控制文件(包括图像及文字数字资料)不可或缺的重要工具。据美 国 Yencharis Consulting Group 公司估计,全球图像分析系统(包括软硬件)每年约有 25 亿 美元的市场,其中仅在显微镜应用方面(包括材料金相、生命及生物科学)就约有 4 亿美元 左右的市场,市场前景十分广阔。 近几十年来, 材料科学家通过人工方法或全集成的定量分析系统对材料的机构和性能作 了许多定量分析。随着计算机技术的发展,图像分析系统也发生着巨大的变化,其中最明显 的变化是从全集成的分析系统向以通用 PC 机位基础的、可自由配置及可扩充的开放式软件 系统(Off-the-shelf)发展。这种发展趋势也体现在 MATLAB 中,MATLAB 的图像工具箱中有 很多 Demo 就直接和材料科学研究相关。
3.4.2 MATLAB 材料科学相关处理
MATLAB 对 材 料 科 学 中 材 料 表 面 图 像 分 析 提 供 了 良 好 的 支 持 。 比 如 数 学 形 态 学 (Mathematical Morphology)最开始就在铁矿核的定量岩石学分析及预测其开采价值的研究中 创立的, 并由此建立了颗粒分析方法, MATLAB 早期的 DEMO 里面有金属晶粒分割的例子, 就是基于颗粒分析的, 还有些 DEMO 和材料表面图像分析非常类似, 比如 DEMO “Correcting Nonuniform Illumination”中步骤可以直接套用在颗粒分析中。MATLAB 具有强大的图像分 析函数,可以直接用在材料表面图像分析中。材料表面图像反映了材料组织结构。由于材料 科学是以材料的成分、加工工艺、组织结构和性能的关系及其变化规律为研究对象的,所以 材料科学研究中通常都要检测直接影响性能的材料组织,评价材料缺陷,因此对材料表面图 像的分析是材料科学研究的重要内容。 为了表现 MATLAB 对材料表面图像分析的支持, 现在做个不严谨的实验。 利用 MATLAB
61

MATLAB 图像处理与界面编程 自带的图像生成材料纹理表面的三维图像,如图 3-3 所示,如果你曾经使用过材料表面图像 分析专业软件的话, 就会发现这张图像和专业的材料表面图像分析软件生成的三维表面是一 样的。这里为什么说是不严谨的实验呢?因为这张材料纹理表面的并不是由高度数据生成 的,只是由材料表面的明暗分布生成的,材料表面的明暗分布和高度分别有一定的关系,但 是不能相互替代,因此是不严谨的。当然了,结合阴影宽度、光线入射角度等因素后可以推 算出高度值。
图3-3 由图像'bag.png'生成的三维图像
实际上 MATLAB 中有使用纹理滤镜进行材料表面纹理分割的例子,纹理分割是基于区 域纹理的区域识别。其目标是使用纹理滤镜在同一张图中分割两种纹理结构。下面我们就分 析下这个处理分析的过程,具体步骤如下: 读入图像 读入图片 bag.png。
I = imread('bag.png');%读入系统自带的图片 bag.png figure, imshow(I);%创建图形窗口,在窗口中显示读入的图像,如图 3-4 所示
图3-4 图像'bag.png'
生成纹理图像
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章
数字图像基础
使用 entropyfilt 函数生成一个纹理图像。函数 entropyfilt 返回一个数组,其输出的每个 像素包含该像素对应的输入图像 I 中周围 9×9 邻域的熵值。熵是一个熵值统计测量。
E = entropyfilt(I);
使用 mat2gray 函数缩放纹理图像 E,以便其值在一个双精度图像默认数值范围。
Eim = mat2gray(E); imshow(Eim);%生成图 3-5
图3-5
纹理图 Eim
为底部纹理生成粗略遮罩 设置缩放图像 Eim 的阈值以便分割纹理。选择阈值为 0.8,因为它大概是纹理边界上像 素的灰度值。
BW1 = im2bw(Eim, .8); imshow(BW1);%生成图 3-6 figure, imshow(I);%创建新图形窗口,显示图 3-7
图3-6
底部纹理遮罩图 BW1
图3-7
原始图像 I
在二值图像 BW1 中的分割目标是白的。如果你比较 BW1 和 I,你会注意到顶部的纹 理被过分割了(多重白色目标) ,底部纹理几乎被全部分割了。你可以使用 bwareaopen 函数
63

MATLAB 图像处理与界面编程 提取底部纹理。
BWao = bwareaopen(BW1,2000);%这里可以看到 BWao 是 BW+area+open 的缩写 imshow(BWao); %生成图 3-8
图3-8 底部底纹图 Bwao
图3-9 底部纹理图 BWao 闭合运算结果图
使用 imclose 函数来平滑边缘,并封闭 BWao 中目标的开口孔。选择一个 9×9 邻域,因 为 entropyfilt 函数使用的也是这种邻域。
nhood = true(9); closeBWao = imclose(BWao,nhood);%对前面的开启运算得到的图像再进行闭合运算 imshow(closeBWao)%生成图 3-9
使用 imfill 函数填充 closeBWao 中目标的孔洞。
roughMask = imfill(closeBWao,'holes');%填充孔洞
使用粗略遮罩分割上部纹理 比较二值图像 roughMask 和原始图像 I。注意到底部纹理的遮罩不是很好,因为遮罩没 有延伸到图像的底部。可以使用 roughMask 来分割顶部的纹理,如图 3-10 和 3-11 所示。
imshow(roughMask); figure, imshow(I);
图3-10 上部纹理遮罩图 roughMask
图3-11 原始图像 I
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章 使用 roughMask 得到如图 3-12 所示的纹理的原始图。
I2 = I; I2(roughMask) = 0;%图像透过遮罩,遮罩图像黑色部分可以透过去,白色部分透不过 imshow(I2);
数字图像基础
图3-12 上部纹理的原始图
图3-13 entropyfilt 函数计算得到的纹理图像 E2im
使用 entropyfilt 函数计算纹理图像,如图 3-13 所示。
E2 = entropyfilt(I2); E2im = mat2gray(E2);% 将矩阵转换成灰度图像 imshow(E2im);
使用 graythresh 作为 E2im 的阈值,如图 3-14 和 3-15 所示。
BW2 = im2bw(E2im,graythresh(E2im)); imshow(BW2) figure, imshow(I);
图3-14 纹理图像 E2im 对应的二值图像 BW2
图3-15 原始图像 I
如果比较 BW2 和 I, 会发现在 BW2 中有两个被分割的目标。 使用 bwareaopen 函数为上 部纹理得到一个遮罩,如图 3-16 所示。
mask2 = bwareaopen(BW2,1000); 65

MATLAB 图像处理与界面编程
imshow(mask2);
图3-16 上部纹理遮罩图 mask2
显示分割结果 使用 mask2 从 I 中提取上部和下部纹理,如图 3-17 和 3-18 所示。
texture1 = I;%将图像 I 复制为 texture1 texture1(~mask2) = 0;%这里有个运算符号~,逻辑非,作用是将 mask2 黑白颠倒 texture2 = I;%将图像 I 复制为 texture2 texture2(mask2) = 0; %在 MATLAB 中,~A 代表“取逻辑非”的意思。但是实际上其意义要比通常的取逻辑非稍微广泛一点。 %假如 A = 1,那么 ~A = 0; %假如 A = [0 1] ,那么 ~A = [1 0]; %假如 A = [0 0 0],那么 ~A= [1 1 1]; %但是假如 A= [3 4 5],那么 ~A = [0,0,0]。可见~A 有那么一点“广义的逻辑非”的意思。 imshow(texture1); figure, imshow(texture2);
图3-17 上部纹理图
图3-18 下部纹理图
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章 描画出两种纹理间的边界线。
boundary = bwperim(mask2);%生成边界线
数字图像基础
%BWPERIM 函数能够起到探测灰度图象内部物体周边缘的作用,返回一幅相同尺寸的二值图象。 segmentResults = I; segmentResults(boundary) = 255;%设置边界线颜色为白色 imshow(segmentResults);%生成图 3-19
图3-19 上下纹理边界图
在分割中使用其它纹理滤镜 你可以使用 stdfilt 和 rangefilt 函数替代 entropyfilt 函数,使用其它形态学函数得到类似 的分割结果,如图 3-20 和 3-21 所示。
S = stdfilt(I,nhood); imshow(mat2gray(S));
图3-20 Stdfilt 函数的分割结果图 R = rangefilt(I,ones(5));
图3-21 Rangefilt 函数的分割结果图
% rangefilt 函数句法为 J = rangefilt(I, NHOOD),对输入图像 I 做距离滤波,由 NHOOD 指定领域 imshow(R);
67

MATLAB 图像处理与界面编程
3.4.3 医学图像
医学成像技术在很大程度上依赖于计算机的应用。它以物理原理直接获取图像,需要时 则通过计算机精细地处理测量图像。计算机在医学成像中的应用有: 根据测量数据建立图像 为提取图像的最佳特征而重建图像 显示图像 利用图像处理技术提高图像的质量 存储和检索图像 在医学成像中,有机体、器官或器官局部的图像是通过放射手段生成的。这种放射通常 具有电磁(EM)性。图像生成后,必须进行显示以供解释。显示图像的媒介可以是原始图 像载体,如已显影的图像胶片,也可以是其他载体,如普通照片或计算机显示器。
3.4.3.1
超声波
超声波是由压电晶体将电能转化为声能而生成的,也可作逆向转换。这些晶体的振动频 率为 2~10MHz,比可听声波频率(最大 20KHz)高得多。超声波的原理与雷达和声呐类似。 发出脉冲声波, 测量反射回声的能量和到达时间, 主要是测定超声波源和反射体之间的距离。 当回声被适当显示时,即可获得研究区域的解剖图像。
3.4.3.2
放射学
自从 Roentgen 在 1895 年发现 X 线以来,其在医疗诊断中的使用越来越广泛。在这里, 将讨论计算机增强 X 线系统应用能力的方法,着重介绍计算机的使用范围,从计算机已实 现的相对简单的应用支持到较复杂的情况,如计算机可以实现而通常方法却难以实现的 X 线新应用。相对简单的应用包括计算放射学和血管数字减影(DSA) ,较复杂的应用包括计 算机 X 线断层扫描(CT) 。核磁共振成像(MRI)尽管不是基于 X 线,但仍放在这里。 X 线成像 血管数字减影的原理 计算机 X 线断层扫描 核磁共振成像 这里介绍一下后面需要讲到的核磁共振图像。 核磁共振成像(Nuclear Magnetic Resonance Imaging,简称 NMRI) ,又称自旋成像(spin imaging)也称磁共振成像 , (Magnetic Resonance Imaging, 简称 MRI)是利用核磁共振 , (nuclear magnetic resonance,简称 NMR)原理,依据所释放的能量在物质内部不同结构环境中不同 的衰减,通过外加梯度磁场检测所发射出的电磁波,即可得知构成这一物体原子核的位置和 种类,据此可以绘制成物体内部的结构图像。
3.4.3.3
核医学
在核医学检查中,往往需在病人血管中注入放射性标记物。放射性标记物的选择取决于
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

第3章
数字图像基础
人们希望进行检查的类型。当检查甲状腺疾病时,可使用甲状腺能吸收的碘化物;而在血管 检查中,可使用放射性物质标记红细胞。由于选择的放射药剂(同位素载体)主要由受检器 官吸收,因此可利用它的放射性来创建图像。同位素的辐射一部分在病人体内被吸收,剩下 的部分则溢出并可用所谓的伽玛照相机检测到。伽玛照相机通常与计算机系统连接起来,这 样就可创建图像。 伽玛射线照相获得的图像仅是在三维空间中分布的放射性物质在二维平面上的投影。 通 过围绕病人旋转对伽玛射线照相,可获得大量来自不同角度的活性曲线,再通过与 CT 类似 的处理过程,可从活性曲线中获得各种器官断面中的放射性活性分布。在现代检测设备中, 使用更多的 Anger 检测器(2~4 个)来加速检测过程,称为单光子发射计算机断层摄影术 (single photon emission computed tomogtaphy,SPECT) 。SPECT 可用来处理心脏的三维重 建,也可用于脑和骨骼的研究等等。
3.4.4 MATLAB 医学图像相关处理
医学图像处理的目标有 3 个:可视化、自动化和定量化。而医学图像处理中,处理步骤 与信号处理有许多相似之处。
3.4.4.1
可视化
当图像被采集并显示时,这些图像通常需要改善以便观察者更容易解释它们。感兴趣的 目标必须突出或者图像各部位之间的对比度需要增强处理。 自从像 CT 和 MRI 等三维成像手 段问世以来,可视化,特别是三维结构的可视化受到极大的关注。
3.4.4.2
自动化
旨在使一些日常的或繁琐的工作自动化。例如,根据一个染色体分布的显微图像自动确 定染色体核型的系统,从一个血液涂片自动生成白细胞分类计数报告的系统。这些应用的特 征是要求最小的人工干预,全自动完成分析工作。关于白细胞分类计数应用,市售系统是在 1970 年开发成功的。但今天这项任务是以完全不同方式(采用流式白细胞计数技术)自动 完成。
3.4.4.3
定量化
有关定量化的图像处理的例子有: 测量动脉狭窄的程序以及用电子显微镜观察组织切片 中特殊成分的定位和定量(如血色素沉着症中的铁元素) 。在这些应用中,人工介入是允许 的,因为处理时间的长短在这些应用中并不是主要矛盾。 MATLAB 对医学图像提供了良好的支持。下面通过例子来看看 MATLAB 是如何显示 MRI 数据的,具体的步骤如下: 这里有一个作为例子的标量数据,包含磁共振图像(MRI)数据。这个典型数据包含了一 定数量切面,它们穿过一个体积物,如人体。MATLAB 自带了一个 MRI 数据,其中有 27 个人脑的切面图。这个例子说明了以下技术在 MRI 数据上的应用。
69

MATLAB 图像处理与界面编程 一系列二维图像显示了头部切面 在数据内显示任意位置的二维和三维等高线切面 一个带有等值帽的等值面显示一个内部截面 改变数据格式 MRI 数据 D, 存储在一个 128×128×1×27 的数组中。 第三个维度的数组一般用于存放 图像色彩数据。然而,因为这些图是索引图(一个色彩索引图也导入了) ,这里没有第三个 维度的信息,因此你可以使用 squeeze 命令去除掉第三个维度的信息,结果余下一个 128× 128×27 的数组。 首先是载入数据,将数据组由四维转化为三维。
load mri% 装入文件到 MATLAB 的工作空间,其命令形式为 load filename D = squeeze(D);% squeeze 函 数 去 除 掉 维 数 为 1 的 那 个 维 度 , 这 里 由 128×128×1×27 变 为 128×128×27
显示 MRI 数据图像 为了显示 MRI 图像中的一张图像,使用 image 命令,索引指向数组得到第八张图像。 然后调整轴的缩放比例,导入 MRI 色彩索引图,该图随索引图像一起导入。
image_num = 8;%对 image_num 赋值 image(D(:,:,image_num)) %第 8 张图片,图片尺寸为 128×128,如图 3-22 axis image %加上坐标 colormap(map) %色彩索引图为 map
图3-22 MRI 数据中的第 8 张图
保存 x 轴和 y 轴的数据范围,以便在例子的下个步骤中使用。
x = xlim;%函数形式为 xlim, ylim, zlim,设置或者查询坐标范围 y = ylim;
显示一个二维等高线切片 我们可以将这个 MRI 数据看成是一个体数据,因为它是一个切片集合,它是逐步从三 维目标中切出来的。使用 contourslice 函数显示一个体切片的等高线图。为了使生成的等高 线图的方位和尺寸和这个例子的第一部分的图像相同,调整 y 轴的方向,设置数据范围到
有任何建议或者意见联系: tasiya@https://www.wendangku.net/doc/6d3636215.html,

数字图像处理第二章课后习题及中文版解答

数字图像处理(冈萨雷斯版,第二版)课后习题及解答(部分) Ch 2 2.1使用2.1节提供的背景信息,并采用纯几何方法,如果纸上的打印点离眼睛0.2m 远,估计眼睛能辨别的最小打印点的直径。为了简明起见,假定当在黄斑处的像点变得远比视网膜区域的接收器(锥状体)直径小的时候,视觉系统已经不能检测到该点。进一步假定黄斑可用1.5mm × 1.5mm 的方阵模型化,并且杆状体和锥状体间的空间在该阵列上的均匀分布。 解:对应点的视网膜图像的直径x 可通过如下图题2.1所示的相似三角形几何关系得到,即 ()()220.20.014 d x = 解得x =0.07d 。根据2.1节内容,我们知道:如果把黄斑想象为一个有337000个成像单元的正方形传感器阵列,它转换成一个大小580×580成像单元的阵列。假设成像单元之间的间距相等,这表明在总长为1.5 mm 的一条线上有580个成像单元和579个成像单元间隔。则每个成像单元和成像单元间隔的大小为s =[(1.5 mm)/1159]=1.3×10-6 m 。如果在黄斑上的成像点的大小是小于一个可分辨的成像单元,在我们可以认为改点对于眼睛来说不可见。换句话说,眼睛不能检测到以下直径的点:x =0.07d<1.3×10-6m ,即d <18.6×10-6 m 。 下图附带解释:因为眼睛对近处的物体聚焦时,肌肉会使晶状体变得较厚,折射能力也相对提高,此时物体离眼睛距离0.2 m ,相对较近。而当晶状体的折射能力由最小变到最大时,晶状体的聚焦中心与视网膜的距离由17 mm 缩小到14 mm ,所以此图中选取14mm(原书图2.3选取的是17 mm)。 图 题2.1 2.2 当在白天进入一个黑暗的剧场时,在能看清并找到空座位时要用一段时间适应,2.1节(视觉感知要素)描述的视觉过程在这种情况下起什么作用? 解:根据人眼的亮度适应性,1)由于户外与剧场亮度差异很大,因此当人进入一个黑暗的剧场时,无法适应如此大的亮度差异,在剧场中什么也看不见;2)人眼不断调节亮度适应范围,逐渐的将视觉亮度中心调整到剧场的亮度范围,因此又可以看见、分清场景中的物体了。

数字图像处理基础知识总结

第一章数字图像处理概论 *图像是对客观存在对象的一种相似性的、生动性的描述或写真。 *模拟图像 空间坐标和明暗程度都是连续变化的、计算机无法直接处理的图像 *数字图像 空间坐标和灰度均不连续的、用离散的数字(一般整数)表示的图像(计算机能处理)。是图像的数字表示,像素是其最小的单位。 *数字图像处理(Digital Image Processing) 利用计算机对数字图像进行(去除噪声、增强、复原、分割、特征提取、识别等)系列操作,从而获得某种预期的结果的技术。(计算机图像处理) *数字图像处理的特点(优势) (1)处理精度高,再现性好。(2)易于控制处理效果。(3)处理的多样性。(4)图像数据量庞大。(5)图像处理技术综合性强。 *数字图像处理的目的 (1)提高图像的视感质量,以达到赏心悦目的目的 a.去除图像中的噪声; b.改变图像的亮度、颜色; c.增强图像中的某些成份、抑制某些成份; d.对图像进行几何变换等,达到艺术效果; (2)提取图像中所包含的某些特征或特殊信息。 a.模式识别、计算机视觉的预处理 (3)对图像数据进行变换、编码和压缩,以便于图像的存储和传输。 **数字图像处理的主要研究内容 (1)图像的数字化 a.如何将一幅光学图像表示成一组数字,既不失真又便于计算机分析处理 b.主要包括的是图像的采样与量化 (2*)图像的增强 a.加强图像的有用信息,消弱干扰和噪声 (3)图像的恢复 a.把退化、模糊了的图像复原。模糊的原因有许多种,最常见的有运动模糊,散焦模糊等(4*)图像的编码 a.简化图像的表示,压缩表示图像的数据,以便于存储和传输。 (5)图像的重建 a.由二维图像重建三维图像(如CT) (6)图像的分析 a.对图像中的不同对象进行分割、分类、识别和描述、解释。 (7)图像分割与特征提取 a.图像分割是指将一幅图像的区域根据分析对象进行分割。 b.图像的特征提取包括了形状特征、纹理特征、颜色特征等。 (8)图像隐藏 a.是指媒体信息的相互隐藏。 b.数字水印。 c.图像的信息伪装。 (9)图像通信

数字图像处理第三版中文答案--冈萨雷斯

第二章 2.1(第二版是0.2和1.5*1.5的矩形,第三版是0.3和1.5圆形) 对应点的视网膜图像的直径x 可通过如下图题2.1所示的相似三角形几何关系得到,即 ()()017 02302.x .d = 解得x=0.06d 。根据2.1 节内容,我们知道:如果把中央凹处想象为一个有337000 个成像单元的圆形传感器阵列,它转换成一个大小25327.?π成像单元的阵列。假设成像单元之间的间距相等,这表明在总长为1.5 mm (直径) 的一条线上有655个成像单元和654个成像单元间隔。则每个成像单元和成像单元间隔的大小为s=[(1.5 mm)/1309]=1.1×10-6 m 。 如果在中央凹处的成像点的大小是小于一个可分辨的成像单元,在我们可以认为改点对于眼睛来说不可见。换句话说, 眼睛不能检测到以下直径的点: m .d .x 61011060-?<=,即m .d 610318-?< 2.2 当我们在白天进入一家黑暗剧场时,在能看清并找到空座时要用一段时间适应。2.1节描述的视觉过程在这种情况下起什么作用? 亮度适应。 2.3 虽然图2.10中未显示,但交流电的却是电磁波谱的一部分。美国的商用交流电频率是77HZ 。问这一波谱分量的波长是多少? 光速c=300000km/s ,频率为77Hz 。 因此λ=c/v=2.998 * 108(m/s)/77(1/s) = 3.894*106m = 3894 Km. 2.5 根据图2.3得:设摄像机能看到物体的长度为x (mm),则有:500/x=35/14; 解得:x=200,所以相机的分辨率为:2048/200=10;所以能解析的线对为:10/2=5线对/mm. 2.7 假设中心在(x0,y0)的平坦区域被一个强度分布为: ] )0()0[(22),(y y x x Ke y x i -+--= 的光源照射。为简单起见,假设区域的反射 是恒定的,并等于1.0,令K=255。如果图像用k 比特的强度分辨率进行数字化,并且眼睛可检测相邻像素间8种灰度的突变,那么k 取什么值将导致可见的伪轮廓? 解:题中的图像是由: ()()()()()[]()()[]2 02 02 02 025501255y y x x y y x x e .e y ,x r y ,x i y ,x f -+---+--=?==

基于matlab数字图像处理与识别系统含程序

目录 第一章绪论 (2) 1.1 研究背景 (2) 1.2 人脸图像识别的应用前景 (3) 1.3 本文研究的问题 (4) 1.4 识别系统构成 (4) 1.5 论文的内容及组织 (5) 第二章图像处理的Matlab实现 (6) 2.1 Matlab简介 (6) 2.2 数字图像处理及过程 (6) 2.2.1图像处理的基本操作 (6) 2.2.2图像类型的转换 (7) 2.2.3图像增强 (7) 2.2.4边缘检测 (8) 2.3图像处理功能的Matlab实现实例 (8) 2.4 本章小结 (11) 第三章人脸图像识别计算机系统 (11) 3.1 引言 (11) 3.2系统基本机构 (12) 3.3 人脸检测定位算法 (13) 3.4 人脸图像的预处理 (18) 3.4.1 仿真系统中实现的人脸图像预处理方法 (19) 第四章基于直方图的人脸识别实现 (21) 4.1识别理论 (21) 4.2 人脸识别的matlab实现 (21) 4.3 本章小结 (22) 第五章总结 (22) 致谢 (23) 参考文献 (24) 附录 (25)

第一章绪论 本章提出了本文的研究背景及应用前景。首先阐述了人脸图像识别意义;然后介绍了人脸图像识别研究中存在的问题;接着介绍了自动人脸识别系统的一般框架构成;最后简要地介绍了本文的主要工作和章节结构。 1.1 研究背景 自70年代以来.随着人工智能技术的兴起.以及人类视觉研究的进展.人们逐渐对人脸图像的机器识别投入很大的热情,并形成了一个人脸图像识别研究领域,.这一领域除了它的重大理论价值外,也极具实用价值。 在进行人工智能的研究中,人们一直想做的事情就是让机器具有像人类一样的思考能力,以及识别事物、处理事物的能力,因此从解剖学、心理学、行为感知学等各个角度来探求人类的思维机制、以及感知事物、处理事物的机制,并努力将这些机制用于实践,如各种智能机器人的研制。人脸图像的机器识别研究就是在这种背景下兴起的,因为人们发现许多对于人类而言可以轻易做到的事情,而让机器来实现却很难,如人脸图像的识别,语音识别,自然语言理解等。如果能够开发出具有像人类一样的机器识别机制,就能够逐步地了解人类是如何存储信息,并进行处理的,从而最终了解人类的思维机制。 同时,进行人脸图像识别研究也具有很大的使用价依。如同人的指纹一样,人脸也具有唯一性,也可用来鉴别一个人的身份。现在己有实用的计算机自动指纹识别系统面世,并在安检等部门得到应用,但还没有通用成熟的人脸自动识别系统出现。人脸图像的自动识别系统较之指纹识别系统、DNA鉴定等更具方便性,因为它取样方便,可以不接触目标就进行识别,从而开发研究的实际意义更大。并且与指纹图像不同的是,人脸图像受很多因素的干扰:人脸表情的多样性;以及外在的成像过程中的光照,图像尺寸,旋转,姿势变化等。使得同一个人,

数字图像处理第四章作业

第四章图像增强 1.简述直方图均衡化处理的原理和目的。拍摄一幅较暗的图像,用直方图均衡化方 法处理,分析结果。 原理:直方图均衡化处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。也就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同。把给定图像的直方图分布改变成“均匀”分布直方图分布 目的:直方图均衡化是图像处理领域中利用图像直方图对对比度进行调整的方法。它通常用来增加许多图像的局部对比度,尤其是当图像的有用数据的对比度相当接近的时候。通过直方图均衡化,亮度可以更好地在直方图上分布。这样就可以用于增强局部的对比度而不影响整体的对比度,直方图均衡化通过有效地扩展常用的亮度来实现这种功能。 Matlab程序如下: clc; RGB=imread('wxf.jpg'); %输入彩色图像,得到三维数组 R=RGB(:,:,1); %分别取三维数组的一维,得到红绿蓝三个分量 G=RGB(:,:,2); %为R G B。 B=RGB(:,:,3); figure(1) imshow(RGB); %绘制各分量的图像及其直方图 title('原始真彩色图像'); figure(2) subplot(3,2,1),imshow(R); title('真彩色图像的红色分量'); subplot(3,2,2), imhist(R); title('真彩色图像的红色分量直方图'); subplot(3,2,3),imshow(G); title('真彩色图像的绿色分量'); subplot(3,2,4), imhist(G); title(' 的绿色分量直方图'); subplot(3,2,5),imshow(B); title('真彩色图像的蓝色分量'); subplot(3,2,6), imhist(B); title('真彩色图像的蓝色分量直方图'); r=histeq(R); %对个分量直方图均衡化,得到个分量均衡化图像 g=histeq(G); b=histeq(B); figure(3), subplot(3,2,1),imshow(r); title('红色分量均衡化后图像');

最新数字图像处理(基础)教案

数字图像处理(基础)教案 一、基础知识 第一节、数字图像获取 一、目的 1掌握使用扫描仪等数字化设备以及计算机获取数字图像的方法; 2修改图像的存储格式。 二、原理 用扫描仪获取图像也是图像的数字化过程的方法之一。 扫描仪按种类可以分为手持扫描仪,台式扫描仪和滚筒式扫描仪(鼓形扫描仪)。 扫描仪的主要性能指标有x、y方向的分辨率、色彩分辨率(色彩位数)、扫描幅面和接口方式等。各类扫描仪都标明了它的光学分辨率和最大分辨率。分辨率的单位是dpi,dpi是英文Dot Per Inch的缩写,意思是每英寸的像素点数。 扫描仪工作时,首先由光源将光线照在欲输入的图稿上,产生表示图像特征的反射光(反射稿)或透射光(透射稿)。光学系统采集这些光线,将其聚焦在CCD上,由CCD将光信号转换为电信号,然后由电路部分对这些信号进行A/D转换及处理,产生对应的数字信号输送给计算机。当机械传动机构在控制电路的控制下,带动装有光学系统和CCD的扫描头与图稿进行相对运动,将图稿全部扫描一遍,一幅完整的图像就输入到计算机中去了。

图1.1扫描仪的工作原理 扫描仪扫描图像的步骤是:首先将欲扫描的原稿正面朝下铺在扫描仪的玻璃板上,原稿可以是文字稿件或者图纸照片;然后启动扫描仪驱动程序后,安装在扫描仪内部的可移动光源开始扫描原稿。为了均匀照亮稿件,扫描仪光源为长条形,并沿y方向扫过整个原稿;照射到原稿上的光线经反射后穿过一个很窄的缝隙,形成沿x方向的光带,又经过一组反光镜,由光学透镜聚焦并进入分光镜,经过棱镜和红绿蓝三色滤色镜得到的RGB三条彩色光带分别照到各自的CCD上,CCD将RGB光带转变为模拟电子信号,此信号又被A/D变换器转变为数字电子信号。至此,反映原稿图像的光信号转变为计算机能够接受的二进制数字电子信号,最后通过串行或者并行等接口送至计算机。扫描仪每扫一行就得到原稿x方向一行的图像信息,随着沿y方向的移动,在计算机内部逐步形成原稿的全图。 在扫描仪的工作过程中,有两个元件起到了关键的作用。一个是CCD,它将光信号转换成为电信号;另一个是A/D变换器,它将模拟电信号变为数字电信号。CCD是Charge Couple Device的缩写,称为电荷耦合器件,它是利用微电子技术制成的表面光电器件,可以实现光电转换功能。CCD 在摄像机、数码相机和扫描仪中应用广泛,只不过摄像机中使用的是点阵CCD,即包括x、y两个方向用于摄取平面图像,而扫描仪中使用的是线性CCD,它只有x一个方向,y方向扫描由扫描仪的机械装置来完成。CCD芯片上有许多光敏单元,它们可以将不同的光线转换成不同的电荷,从而形成对应原稿光图像的电荷图像。如果我们想增加图像的分辨率,就必须增加CCD上的光敏单元数量。实际上,CCD的性能决定了扫描仪的x方向的光学分辨率。A/D变换器是将模拟量(Analog)转变为数字量(Digital)的半导体元件。从CCD获取的电信号是对应于图像明暗的模拟信号,就是说图像由暗到亮的变化可以用从低到高的不同电平来表示,它们是连续变化的,即所谓模拟量。A/D变换器的工作是将模拟量数字化,例如将0至1V的线性电压变化表示为0至9的10个等级的方法是:0至小于0.1V 的所有电压都变换为数字0、0.1至小于0.2V的所有电压都变换为数字1……0.9至小于1.0V的所有电压都变换为数字9。实际上,A/D变换器能够表示的范围远远大于10,通常是2^8=256、2^10=1024或者2^12=4096。如果扫描仪说明书上标明的灰度等级是10bit,则说明这个扫描仪能够将图像分成1024个灰度等级,如果标明色彩深度为30bit,则说明红、绿、蓝各个通道都有1024个等级。显然,该等级数越高,表现的彩色越丰富。 步骤

冈萨雷斯_数字图像处理第3版第4章的习题.doc

4.16 证明连续和离散二维傅里叶变换都是平移和旋转不变的。 首先列出平移和旋转性质: 002(//)00(,)(,)j u x M v y N f x y e F u u v v π+?-- (4.6-3) 002(//)00(,)(,)j x r M y v N f x x y y F u v e π-+--? (4.6-4) 旋转性质: cos ,sin ,cos ,sin x r y r u v θθω?ω?==== 00(,)(,)f r F θθω??+?+ (4.6-5) 证明:由式(4.5-15)得: 由式(4.5-16)得: 依次类推证明其它项。 4.17 由习题4.3可以推出1(,)u v δ?和(,)1t z δ?。使用前一个性质和表4.3中的平移性质证明连续函数00(,)cos(22)f t z A u t v z ππ=+的傅里叶变换是 0000(,)[(,)(,)]2 A F u v u u v v u u v v δδ= +++-- 证明:

000000002()2()002()2()2() 2()2()2()2((,)(,)cos(22)[]222j ut vz j ut vz j u t v z j u t v z j ut vz j u t v z j u t v z j ut vz j u F u v f t z e dtdz A u t v z e dtdz A e e e dtdz A A e e dtdz e e πππππππππππ∞∞ -+-∞-∞ ∞ ∞ -+-∞-∞ ∞∞+-+-+-∞-∞ ∞∞+-+-+--∞-∞==+= +=+? ??? ????) 00000000(,)(,)22[(,)(,)]2t vz dtdz A A u u v v u u v v A u u v v u u v v δδδδ∞∞+-∞-∞=--+++=--+++?? 4.18 证明离散函数(,)1f x y =的DFT 是 1,0 {1}(,)0,u v u v δ==??==? ?其它 证明:离散傅里叶变换 11 2(//)00(,)(,)M N j ux M vy N x y F u v f x y e π---+===∑∑ 11 2(//) 00 11 2(//) 00 {1}M N j ux M vy N x y M N j ux M vy N x y e e ππ---+==---+==?==∑∑∑∑ 如果0u v ==,{1}1?=,否则: 11 00{1}{cos[2(//)]sin[2(//)]}M N x y ux M vy N j ux M vy N ππ--==?=+-+∑∑ 考虑实部,11 00 {1}cos[2(//)]M N x y ux M vy N π--==?=+∑∑,cos[2(//)]ux M vy N π+的值介于 [-1, 1],可以想象,11 00 {1}cos[2(//)]0M N x y ux M vy N π--==?=+=∑∑,虚部相同,所以 1,0 {1}(,)0,u v u v δ==??==?? 其它 4.19 证明离散函数00cos(22)u x v y ππ+的DFT 是 00001 (,)[(,)(,)]2 F u v u Mu v Nv u Mu v Nv δδ=+++--

西南科技大学数字图像处理复习参考题

一、填空题(每空1分,共20分) 1、在计算机中,按颜色和灰度的多少可以将图像分为二值图像、灰度图像、 索引图像、真彩色RGP图像四种类型。 1024?,256个灰度级的图像,需 2、存储一幅大小为1024 要8M bit。 3、直方图均衡化适用于增强直方图呈尖峰分布的图像。 4、依据图像的保真度,图像压缩可分为有损压缩和无损压缩 5、图像压缩是建立在图像存在编码荣誉、像素间冗余、心理素质冗余三种冗 余基础上。 6、对于彩色图像,通常用以区别颜色的特性是、、。 7、对于拉普拉斯算子运算过程中图像出现负值的情况,写出一种标定方 法:。 8、图像处理技术主要包括图像的、、等技术。 9、在RGB彩色空间的原点上,三个基色均没有,即原点为色。 二、选择题(每题2分,共20分) 1、下列算法中属于点处理的是: A.梯度锐化 B.二值化 C.傅立叶变换 D.中值滤波 2、图像灰度方差说明了图像哪一个属性。() A.平均灰度 B.图像对比度 C.图像整体亮度 D.图像细节 3、计算机显示器主要采用哪一种彩色模型() A.RGB B.CMY或CMYK C.HSI D.HSV 4、采用模板[-1 1]T主要检测()方向的边缘。 A.水平 B.45? C.垂直 D.135? 5、下列算法中属于图象锐化处理的是:( ) A.低通滤波 B.加权平均法 C.高通滤波 D. 中值滤波 6、维纳滤波器通常用于() A.去噪 B.减小图像动态范围 C.复原图像 D.平滑图像 7、彩色图像增强时,处理可以采用RGB彩色模型。 A. 直方图均衡化 B. 同态滤波 C. 加权均值滤波 D. 中值滤波 8、____滤波器在对图像复原过程中需要计算噪声功率谱和图像功率谱。 A. 逆滤波 B. 维纳滤波

数字图像处理的理论基础及常用处 理方法

关于数字图像处理的理论基础及常用处理方法 数字图像处理(DigitalImageProcessing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。 摘要:本文介绍了数字信号处理的起源、发展,并简要概述了数字图像处理所研究的内容和处理数字图像的几大模块。同时,也大致介绍了常用的处理数字图像的方法。最后展望了数字图像处理的发展前景。 Abstract: This paper describes the origin of digital image processing, development, and a brief overview of digital image processing of the content and process digital images of several modules. Also a broad overview of the commonly used method of processing digital images. Finally, looking ahead the future prospects for the development of digital image processing. 关键词:数字图像处理(Digital Image Processing);理论基础;处理方法 一、数字图像处理的起源及发展 数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。 数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。但是50年代的计算机主要还是用于数值计算,满足不了处理大量数据图像的要求。 数字图像处理作为一门学科大约形成于20世纪60年代初期。伴随着第三代计算机的研制成功,以及快速傅里叶变换算法的的发现和应用使得对图像的某些计算得以实际实践。 早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。在70年代图像技术有了长足进展,80年代,硬件的发展使得人们不仅能处理2-D图像而且能处理3-D图像,许多能获取3-D图像的设备和处理分析3-D图像的系统研制成功,图像技术得到广泛应用。 二、数字图像处理的研究内容 数字图象处理,就是采用计算机对图象进行信息加工。图象处理的主要内容有:图像的采集、增强、复原、变换、编码、重建、分割、配准、嵌拼、融合、特征提取、模式识别和图象理解。 对图像进行处理(或加工、分析)的主要目的有三个方面:

数字图像处理基本操作

Matlab图像的读取和存储 图像的读取 I=imread(‘pout.tif’); imread是读取图像的函数。pout.tif是matlab内置的图像,不管在什么程序内都可以直接读取。这里我们来说几种常见的情形 注:Matlab文件夹内有test.m,1.jpg,image文件夹,同时image文件夹内有2.jpg 读取1.jpg I=imread(‘1.jpg’); 读取2.jpg I=imread(‘image\2.jpg’);%相对路径的读取 读取D:\1023\25\1.jpg I=i mread(‘D:\1023\25\1.jpg’);%绝对路径的读取 读取D:\1023\25内20个图像。 for i=1:20 I=imread([‘D:\1023\25\’,num2str(i),’.jpg’]); end 图像的显示 关于这三个函数用法的区别,主要的意思是:imshow显示按照原来的比例,而image会改变原来图像的比例。imtool,很少用到。一般用imshow就足够了。 那么什么时候用figure呢?当程序中只显示一幅图像时,直接imshow就可以。然后当图像多的时候,就需要用到figuure;imshow(I1);figure;imshow(I2);figure;imshow(I3) 如果想要在一张图片内,显示好几个图怎么办呢?title显示在图像的上方,起到提示的作用。 I=imread('pout.tif'); subplot(221);imshow(I);title('1'); subplot(222);imshow(I);title('2'); subplot(223);imshow(I);title('3'); subplot(224);imshow(I);title('4'); 其中前面的22代表是2*2的分布,也可以是2*3,3*4等。按照行来排列,从第一行开始分别为1 2 3 4。如图所示。 如果没有要求的话,直接用figure。此时希望图2来显示某个图像,那么figure(2),就指定来显示某个图像。当然了,如果仅有一个图像显示这样做,那么可能会被覆盖掉,因此,一个程序中的用法一定要统一,并且保证后面的,不要把前面的覆盖掉。 图像的存储

数字图像处理第三版 (Rafael C.Gonzalez著)第二章答案

2.1(第二版是0.2和1.5*1.5的矩形,第三版是0.3和1.5圆形,我这样做不知道对不对) 对应点的视网膜图像的直径x可通过如下图题2.1所示的相似三角形几何关系得到,即 解得x=0.06d。根据2.1 节内容,我们知道:如果把中央凹处想象为一个有337000 个成像单元的圆形传感器阵列,它转换成一个大小成像单元的阵列。假设成像单元之间的间距相等,这表明在总长为1.5 mm(直径)的一条线上有655个成像单元和654个成像单元间隔。则每个成像单元和成像单元间隔的大小为s=[(1.5 mm)/1309]=1.1×10-6 m。 如果在中央凹处的成像点的大小是小于一个可分辨的成像单元,在我们可以认为改点对于眼睛来说不可见。换句话说,眼睛不能检测到以下直径的点: ,即 2.2 亮度适应。 2.3光速c=300000km/s ,频率为77Hz。 因此λ=c/v=2.998 * 108(m/s)/77(1/s) = 3.894*106m = 3894 Km. 2.5 根据图2.3得:设摄像机能看到物体的长度为x (mm),则有:500/x=35/14; 解得:x=200,所以相机的分辨率为:2048/200=10;所以能解析的线对为:10/2=5线对/mm. 2.7 (看翻得对不对) 解:题中的图像是由: 一个截面图像见图(a)。如果图像使用k比特的强度分辨率,然后我们有情况见图(b),其中。因为眼睛可检测4种灰度突变,因此,,K= 6。也就是说,小于64的话,会出现可见的伪轮廓。

2.9 (a) 传输数据包(包括起始比特和终止比特)为:N=n+m=10bits。对于一幅2048×2048 大小的图像,其总的数据量为,故以56K 波特的速率传输所需时间为: (b) 以3000K 波特的速率传输所需时间为 2.10 解:图像宽高纵横比为16:9,且水平电视线的条数是1080条,则:竖直电视线为1080×(16/9)=1920 像素/线。 由题意可知每场用1s 的1/60,则:每帧用时2×1/60=1/30 秒。 则该系统每1/30 秒的时间形成一幅1920×1080 分辨率的红、绿、蓝每个

数字图像处理知识点总结教学提纲

数字图像处理知识点总结 第一章导论 1.图像:对客观对象的一种相似性的生动性的描述或写真。 2.图像分类:按可见性(可见图像、不可见图像),按波段数(单波段、多波段、超波段),按空间坐标和亮度的连续性(模拟和数字)。 3.图像处理:对图像进行一系列操作,以到达预期目的的技术。 4.图像处理三个层次:狭义图像处理、图像分析和图像理解。 5.图像处理五个模块:采集、显示、存储、通信、处理和分析。 第二章数字图像处理的基本概念 6.模拟图像的表示:f(x,y)=i(x,y)×r(x,y),照度分量0

数字图像基础

数字图像 定义:数字图像可以定义为与之相对应的物体的数字表示。通常用一个二维数组表示一幅图像,也可以认为一幅图像就是一个二维矩阵。二维矩阵的每个位置对应于图像上的每个像素点,而二维矩阵每个位置上存储的数值对应于图像上每个像素点所具有的信息,比如:灰度等等。 既然数字图像可以用二维矩阵来表示,那么数字图像的处理就可以认为是对对二维矩阵的操作。 图像的数字化: 将一幅图像进行数字化的过程就是在计算机上创建生成一个二维矩阵的过程。数字化过程包括三个步骤:扫描、采样、量化。 扫描:就是按照一定的先后顺序(如:行优先)对图像进行遍历的过程。像素是遍历过程中寻址的最小单位,对应于数组寻址的单位。 采样:即遍历过程中在在图像的每个最小寻址单位即像素位置上测量灰度值,采样的结果是得到每一像素的灰度值。 量化:就是将采样得到的像素灰度值经过模数转换等器件转化为离散的整数值。 数字图像处理中的基本图像类型: 二值图像:二值图像的矩阵仅有两个值构成即“0”和“1”。0 表示黑色,1表示白色。因此二值图像在计算机中的数据类型为一个二进制位。 灰度图像:灰度图像的二维矩阵每个元素的值可能都不一样,它有一个范围【0~255】,其中0表示纯黑色,255表示纯白色,中间数字表示由黑到白的过度。其数据类型一般为8位无符号数。 索引图像:索引图像可以表示彩色图像,其结构比较复杂,除了存储图像数据的二维矩阵以外,还有一个存储RGB 颜色的二维矩阵,称为颜色索引矩阵(COLORMAP )。存储数据的二维矩阵里面存储的仍然是图像各个像素的灰度值,而颜色索引矩阵是一个【256】【3】形式的二维矩阵,256对应于0~255个灰度值,而每行的三个分量表示对应于每个灰度值的像素点,它的RGB 分量的值。例如:COLORMAP[38][0~2]表示灰度值为38的像素点的RGB 各分量值。由于每个像素只有256个灰度值,而每个灰度值决定了一种颜色,所以索引图像最多有256种颜色。 RGB 图像:它与索引图像一样可以表示彩色图像,分别用R ,G,,B 三原色表示每个像素的颜色,但是他们的数据结构不同。RGB 图像的数据结构是一个三维矩阵,它的每一像素的颜色值直接存储在矩阵中。因此这个矩阵可用M*N*3来表示。M :表示矩阵每行的像素数,N :表示每列的像素数,3表示每一像素的三个颜色分量。由于每个像素的颜色值都 直接放在图像矩阵中,所以其颜色理论上多达(23 *23 *23 )种。 图像的统计特征: 1. 信息量:一幅图像如果共有q种灰度值并且出现的概率分别是p 1,p 2 ,p 3 ,… p q , 则根据香农定理,这幅图像的信息量可有下式表示: p p i q i i H log 2 1 ∑ =-= (1) ; H 通称为熵,当图像中个灰度值出现的概率彼此相等时,图像的熵最大。

数字图像处理知识点汇编

数字图像处理知识点 课程重点:图像数字化,图像变换,图像增强,图像的恢复与重建,图像的编码,图像的分割与特征提取,图像识别。 数字图像处理的基本内容: 1、图像获取。举例:摄像机+图像采集卡、数码相机等。 2、图像增强。显示图像中被模糊的细节,或是突出图像中感兴趣的特征。 3、图像复原。以图像退化的数学模型为基础,来改善图像质量。 4、图像压缩。减小图像的存储量,或者在图像传输时降低带宽。 5、图像分割。将一幅图像划分为几个组成部分或分割出目标物体。 6、图像的表达与描述。图像分割后,输出分割标记或目标特征参数。 7、目标识别。把目标进行分类的过程。 8、彩色图像处理。 9、形态学处理。 10、图像的重建。 第一章导论 图像按照描述模型可以分为:模拟图像和数字图像。 1)模拟图像,模拟图像可用连续函数来描述。其特点:光照位置和光照强度均为连续变化的。 2)数字图像,数字图像是图像的数字表示,像素是其最小的单位,用矩阵或数组来描述 图像处理:对图像进行一系列的操作,以达到预期的目的的技术。内容:研究图像信息的获取、传输、存储,变换、显示、理解与综合利用”的一门崭新学科。三个层次:狭义图像处理,图像分析,图像理解。 ?狭义图像处理主要指对图像进行各种操作以改善图像的视觉效果,或对图像进行压缩编码以减少所需存储空间或传输时间、传输通路的要求。 ?图像分析主要是对图像中感兴趣的目标进行检测和测量,从而建立对图像的描述。图像分析是一个从图像到数值或符号的过程。 ?图像理解则是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解译,从而指导和规划行动; ?图像分析主要是以观察者为中心研究客观世界,图像理解在一定程度上是以客观世界为中心,借助知识、经验等来把握整个客观世界。 图像处理的三个层次: 低级图像处理 内容:主要对图像进行各种加工以改善图像的视觉效果、或突出有用信息,并为自动识别打基础,或通过编码以减少对其所需存储空间、传输时间或传输带宽的要求。 特点:输入是图像,输出也是图像,即图像之间进行的变换。 中级图像处理 内容:主要对图像中感兴趣的目标进行检测(或分割)和测量,以获得它们的客观信息从而建立对图像的描述。 特点:输入是图像,输出是数据。 高级图像处理 内容:在中级图像处理的基础上,进一步研究图像中各目标的性质和它们之间相互的联系,并得出对图像内容含义的理解(对像识别)及对原来客观场景的解释(计算机视觉),从而指导和规划行动。 特点:以客观世界为中心,借助知识、经验等来把握整个客观世界。“输入是数据,输出是理解”。 一个图像处理和分析系统包括采集、显示、存储、通信、处理和分析五个模块。 数字图像处理特点:精度,再现性,通用性,灵活性。

数字图像处理基础阅读笔记

数字图像处理基础 一、物理图像的数字化 理论上讲,图像是一种二维的连续函数,然而在计算机上对图像进行数字处理的时候,首先必须对其在空间和亮度上进行数字化,这就是图像的采样和量化的过程。空间坐标(x ,y )的数字化称为图像采样,而幅值数字化称为灰度级量化。 1.图像采样 图像采样是对图像空间坐标的离散化,它决定了图像的空间分辨率。采样可以这样理解:用一个网格把待处理的图像覆盖,然后每一个小格上模拟图像的各点亮度取平均值,作为该小方格中点的值。 对一副图像采样时,若每行(横向)像素为M 个,每列(纵向)像素为N 个,则图像大小为M*N 个像素,f(x,y)表示点(x ,y )处的灰度值,则F(x,y)构成一个M*N 实数矩阵。 ? ??? ? ?? ?? ? ??------=)1,1() 1,1() 0,1() 1,1()1,1() 0,1() 1,0()1,0() 0,0(),(N M f M f M f N f f f N f f f y x F 2.灰度量化 把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。量化是对图像幅度坐标的离散化,它决定了图像的幅度分辨率。 量化的方法包括:分层量化、均匀量化和非均匀量化。分层量化是把每一个离散样本的连续灰度值只分成有限多的层次;均匀量化是把原图像灰度层次从最暗到最亮均匀分为有限个层次,如果采用不均匀分层就称为非均匀量化。 当图像的采样点数一定时,采用不同量化级数的图像质量不一样。量化级数越多,图像质量越好;量化级数越少,图像质量越差。量化级数最小的极端情况是二值图像,图像出现假轮廓。

二、数字图像的表示 二维图像进行均匀采样并进行灰度量化后,就可以得到一幅离散化成M*N样本的数字图像,该图像是一个整数阵列,因而用矩阵来描述数字图像是最直观、最简便的了。三、数字图像处理的主要研究内容 图像变换、图像增强、图像分割、图像恢复与重建、图像编码与压缩。 四、图像类型 索引图像、灰度图像、二值图像、rgb图像、多帧图像序列。 1.二值图像 又称为黑白图像,是指图像的每个像素只能是黑或白,没有中间的过渡。二值图像的像素值为0或1。 2.灰度图像 灰度图像是指每个像素由一个量化的灰度值来描述的图像。它不包含彩色信息。若灰度图像的像素是uint8或uint16型,则它们的整数值范围分别是[0,255]和[0,65535]。若图像是double型,则像素的取值就是双精度浮点型。 3.rgb图像 Rgb图像又称为真彩色图像,它利用r\g\b三个分量合成来表示一个像素的颜色,rgb 分别对应三原色的红、绿、蓝。因此,一幅尺寸为M*N的rgb图像需要一个三维矩阵来存储,三维矩阵的尺寸为M*N*3。如果要读取图像中(100,50)处的像素值,需要查看三元数据(100,50,1:3)。 真彩色图像可用双精度存储,亮度值范围是[0,1];比较符合习惯的存储方法是用无符号8位整数存储,亮度值范围为[0,255]。 4.索引图像

数字图像处理(基本全部答案)

数字图像处理试卷 一名词解释(共30分,每题5分) 1. 数字图像与数字图像处理 数字图像数字图像是指由被称作像素的小块区域组成的二维矩阵。将物理图像行列划分后,每个小块区域称为像素(pixel)。 数字图像处理指用数字计算机及其它有关数字技术,对图像施加某种运算和处理,从而达到某种预想目的的技术。 2.采样与量化 采样是将空域上连续的图像变换成离散采样点集合,是对空间的离散化。经过采样之后得到的二维离散信号的最小单位是像素。量化就是把采样点上表示亮暗信息的连续量离散化后,用数值表示出来,是对亮度大小的离散化。经过采样和量化后,数字图像可以用整数阵列的形式来描述。 3.中值滤波 中值滤波是指将当前像元的窗口(或领域)中所有像元灰度由小到大进行排序,中间值作为当前像元的输出值。 4.图像增强 将一幅图像中的有用信息进行增强,同时对其无用信息进行抑制,提高图像的可观察性。 5.边缘检测 边缘能勾划出目标物体轮廓,使观察者一目了然,包含了丰实的信息(如方向、阶跃性质、形状等),是图像识别中抽取的重要属性。边缘检测是大多数图像处理必不可少的一步,提供了物体形状的重要信息。 6.图像变换 通过数学映射的方法,将空域的图像信息转换到频域、时频域等空间上进行

分析。 二简答题(共50分) 1.简述数字图像处理的至少4种应用。(5分) ①遥感中,比如土地测绘、气象监测、资源调查、环境污染监测等方面。 ②在医学中,比如B超、CT机等方面。 ③在通信中,比如可视电话、会议电视、传真等方面。 ④在工业生产的质量检测中,比如对食品包装出厂前的质量检查、对机械制品 质量的监控和筛选等方面。 ⑤在安全保障、公安方面,比如出入口控制、指纹档案、交通管理等。 2.简述二值图像、灰度图像、彩色图像的区别。(5分) 二值图像是指每个像素不是黑,就是白,其灰度值没有中间过渡的图像。这种图像又称为黑白图像。二值图像的矩阵取值非常简单,每个像素的值要么是1,要么是0,具有数据量小的特点。 彩色图像是根据三原色成像原理来实现对自然界中的色彩描述的。红、绿、蓝这三种基色的的灰度分别用256级表示,三基色之间不同的灰度组合可以形成不同的颜色。 灰度图像是指每个像素的信息由一个量化后的灰度级来描述的数字图像,灰度图像中不包含彩色信息。标准灰度图像中每个像素的灰度值是0-255之间的一个值,灰度级数为256级。 3.举例说明使用均值插值法进行空穴填充的过程。(5分) 均值插值法就是将判断为空穴位置上的像素值用其上、下、左、右像素值的均值来填充。 例如对于下图中的空穴点f23进行填充时,使用相邻行的像素值来填充。即:f23=(f22+f24+f13+f33)/4. 如下图F13 F22 F23 F24 F33

数字图像处理基本知识

数字图像处理基本知识 数字图像处理基本知识 图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。 数字图像处理常用方法: 1)图像变换:由于图像阵列很大,直接在空间域中进行处理,涉及计算量很大。因此,往往采用各种图像变换的方法,如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。 2)图像编码压缩:图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。 3)图像增强和复原:图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲

应根据降质过程建立“降质模型”,再采用某种滤波方法,恢复或 重建原来的图像。 4)图像分割:图像分割是数字图像处理中的关键技术之一。图 像分割是将图像中有意义的特征部分提取出来,其有意义的特征有 图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的 基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没 有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究 还在不断深入之中,是目前图像处理中研究的热点之一。 5)图像描述:图像描述是图像识别和理解的必要前提。作为最 简单的二值图像可采用其几何特性描述物体的特性,一般图像的描 述方法采用二维形状描述,它有边界描述和区域描述两类方法。对 于特殊的纹理图像可采用二维纹理特征描述。随着图像处理研究的 深入发展,已经开始进行三维物体描述的研究,提出了体积描述、 表面描述、广义圆柱体描述等方法。 6)图像分类(识别):图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行 图像分割和特征提取,从而进行判决分类。图像分类常采用经典的 模式识别方法,有统计模式分类和句法(结构)模式分类,近年来 新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中 也越来越受到重视。 图像的基本属性 亮度:也称为灰度,它是颜色的明暗变化,常用0%~100%(由 黑到白)表示。以下三幅图是不同亮度对比。 亮度对图像色彩的影响 对比度:是画面黑与白的比值,也就是从黑到白的渐变层次。比值越大,从黑到白的渐变层次就越多,从而色彩表现越丰富。 对比度对图像色彩表现的影响 直方图:表示图像中具有每种灰度级的象素的.个数,反映图像 中每种灰度出现的频率。图像在计算机中的存储形式,就像是有很

相关文档