文档库 最新最全的文档下载
当前位置:文档库 › 图像预处理流程

图像预处理流程

图像预处理流程
图像预处理流程

图像预处理流程:

图2.2图像预处理流程图

2.2系统功能的实现方法

系统功能的实现主要依靠图像处理技术,按照上面的流程一一实现,每一部分的具体步骤如下:

1原始图像:由数码相机或其它扫描装置拍摄到的图像;

2预处理:对采集到的图像进行灰度化、图像增强,滤波、二值化等处理以克服图像干扰;

3字轮定位:用图像剪切的方法获取仪表字轮;

4字符分割:利用字符轮廓凹凸检测定位分割方法得到单个的字符;

5字符识别:利用模板匹配的方法与数据库中的字符进行匹配从而确认出字符,得到最后的仪表示数。

2.3.1 MATLA B简介

MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。

MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。

MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB 爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。

2.3.2 MATLAB的优势和特点

1、MATLAB的优势

(1)友好的工作平台和编程环境

MATLAB由一系列工具组成。这些工具方便用户使用MATLAB的函数和文件,其中许多工具采用的是图形用户界面。包括MATLAB桌面和命令窗口、历史命令窗口、编辑器和调试器、路径搜索和用于用户浏览帮助、工作空间、文件的浏览器。随着MATLAB的商业化以及软件本身的不断升级,MATLAB的用户界面也越来越精致,更加接近Windows的标准界面,人机交互性更强,操作更简单。而且新版本的MATLAB提供了完整的联机查询、帮助系统,极大的方便了用户的使用。简单的编程环境提供了比较完备的调试系统,程序不必经过编译就可以直接运行,而且能够及时地报告出现的错误及进行出错原因分析。

(2)简单易用的程序语言

MATLAB是一种高级的矩阵/阵列语言,它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。用户可以在命令窗口中将输入语句与执行命令同步,也可以先编写好一个较大的复杂的应用程序(M文件)后再一起运行。新版本的MATLAB语言是基于最为流行的C++语言基础上的,因此语法特征与C++语言极为相似,而且更加简单,更加符合科技人员对数学表达式的书写格式。使之更利于非计算机专业的科技人员使用。而且这种语言可移植性好、可拓展性极强,这也是MATLAB能够深入到科学研究及工程计算各个领域的重要原因。

(3)强大的科学计算机数据处理能力

MATLAB是一个包含大量计算算法的集合。其拥有600多个工程中要用到的数学运算函数,可以方便的实现用户所需的各种计算功能。函数中所使用的算法都是科研和工程计算中的最新研究成果,而前经过了各种优化和容错处理。在通常情况下,可以用它来代替底层编程语言,如C和C++ 。在计算要求相同的情况下,使用MATLAB的编程工作量会大大减少。MATLAB的这些函数集包括从最简单最基本的函数到诸如矩阵,特征向量、快速傅立叶变换的复杂函数。函数所能解决的问题其大致包括矩阵运算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、傅立叶变换和数据的统计分析、工程中的优化问题、稀疏矩阵运算、复数的各种运算、三角函数和其他初等数学运算、多维数组操作以及建模动态仿真等。

(4)出色的图形处理功能

图形处理功能MATLAB自产生之日起就具有方便的数据可视化功能,以将向量和矩阵用图形表现出来,并且可以对图形进行标注和打印。高层次的作图包括二维和三维的可视化、图象处理、动画和表达式作图。可用于科学计算和工程绘图。新版本的MATLAB对整个图形处理功能作了很大的改进和完善,使它不仅在一般数据可视化软件都具有的功能(例如二维曲线和三维曲面的绘制和处理等)方面更加完善,而且对于一些其他软件所没有的功能(例如图形的光照处理、色度处理以及四维数据的表现等),MATLAB同样表现了出色的处理能力。同时对一些特殊的可视化要求,例如图形对话等,MATLAB也有相应的功能函数,保证了用户不同层次的要

求。另外新版本的MATLAB还着重在图形用户界面(GUI)的制作上作了很大的改善,对这方面有特殊要求的用户也可以得到满足。

(5)应用广泛的模块集合工具箱

MATLAB对许多专门的领域都开发了功能强大的模块集和工具箱。一般来说,它们都是由特定领域的专家开发的,用户可以直接使用工具箱学习、应用和评估不同的方法而不需要自己编写代码。目前,MATLAB已经把工具箱延伸到了科学研究和工程应用的诸多领域,诸如数据采集、数据库接口、概率统计、样条拟合、优化算法、偏微分方程求解、神经网络、小波分析、信号处理、图像处理、系统辨识、控制系统设计、LMI控制、鲁棒控制、模型预测、模糊逻辑、金融分析、地图工具、非线性控制设计、实时快速原型及半物理仿真、嵌入式系统开发、定点仿真、DSP与通讯、电力系统仿真等,都在工具箱(Toolbox)家族中有了自己的一席之地。(6)实用的程序接口和发布平台

新版本的MATLAB可以利用MATLAB编译器和C/C++数学库和图形库,将自己的MATLAB程序自动转换为独立于MATLAB运行的C和C++代码。允许用户编写可以和MATLAB进行交互的C或C++语言程序。另外,MATLAB网页服务程序还容许在Web应用中使用自己的MATLAB数学和图形程序。MATLAB的一个重要特色就是具有一套程序扩展系统和一组称之为工具箱的特殊应用子程序。工具箱是MATLAB函数的子程序库,每一个工具箱都是为某一类学科专业和应用而定制的,主要包括信号处理、控制系统、神经网络、模糊逻辑、小波分析和系统仿真等方面的应用。

(7)应用软件开发(包括用户界面)

在开发环境中,使用户更方便地控制多个文件和图形窗口;在编程方面支持了函数嵌套,有条件中断等;在图形化方面,有了更强大的图形标注和处理功能,包括对性对起连接注释等;在输入输出方面,可以直接向Excel和HDF5进行连接。

2、MATLAB的特点

(1)此高级语言可用于技术计算;

(2)此开发环境可对代码、文件和数据进行管理;

(3)交互式工具可以按迭代的方式探查、设计及求解问题;

(4)数学函数可用于线性代数、统计、傅立叶分析、筛选、优化以及数值积分等;

(5)二维和三维图形函数可用于可视化数据;

(6)各种工具可用于构建自定义的图形用户界面;

(7)各种函数可将基于MATLAB的算法与外部应用程序和语言(如C、C++、

Fortran、Java、COM以及Microsoft Excel)集成。

2.3.3 MATLAB图像处理

MATLAB一开始时是一种专门用于矩阵数值计算的软件,从这一点上也可以看出,它在矩阵运算上有自己独特的特点。实际上MATLAB中的绝大多数的运算都是通过矩阵这一形式进行的。这一特点也就决定了MATLAB在处理数字图像上的独特优势。理论上讲,图像是一种二维的连续函数,然而在计算机上对图像进行数字处理的时候,首先必须对其在空间和亮度上进行数字化,这就是图像的采样和量化的过程。二维图像进行均匀采样,就可以得到一幅离散化成M×N 样本的数字图像,该数字图像是一个整数阵列,因而用矩阵来描述该数字图像是最直观最简便的了。而MATLAB的长处就是处理矩阵运算,因此用MATLAB 处理数字图像非常的方便。

MATLAB支持五种图像类型,即索引图像、灰度图像、二值图像、RGB图像和多帧图像阵列;支持BMP、GIF、HDF、JPEG、PCX、PNG、TIFF、XWD、CUR、ICO等图像文件格式的读,写和显示。MATLAB对图像的处理功能主要集中在它的图像处理工具箱(Image Processing Toolbox)中。图像处理工具箱是由一系列支持图像处理操作的函数组成,可以进行诸如几何操作、线性滤波和滤波器设计、图像变换、图像分析与图像增强、二值图像操作以及形态学处理等图像处理操作。下面进行简单说明:

(1)图像的读写与显示

MATLAB中利用函数imread来实现图像文件的读取操作。其主要格式有以下几种类型:

A=imread(filename.fmt)

[X,map]=iimread(filename.fmt)

[…]=imread(filename)

[…]=imrad(URL,…)

MATLAB中利用函数imwrite来实现图像文件的写入操作,与imread函数的作用相对,其主要调用格式有以下几种:

imwrite(A,filename.fmt)

iimwrite(X,map,filename.fmt)

imwrite(…,filename)

imwrite(…,Param1,Val1,Param2,Val2…)

在MATLAB中用于显示图像的方式有两种,一种是使用MATLAB图像浏览器(Image Viewer),通过调用imview函数来实现。另一种是使用MATLAB的通用图形图像视窗,通过调用imshow函数来实现。

(2)图像的代数操作

代数运算是指对两幅输入图像进行点对点的加、减、乘和除计算而得到输出图像的运算。对于相加和相乘的情形,可能不止有两幅图像参加运算。图像相加的一个重要应用是对同一场景的多幅图像求平均值。这点被经常用来有效地降低加性(additive)随机噪声的影响

(3)图像的空间域变换操作

简单的说,图像的空间域变换操作就是为了达到某种视觉效果,变换输入图像的像素位置,通过把输入图像的像素为止映射到一个新的位置已达到改变原图像显示效果的母的。其实也就是变换图像的坐标系统。图像的空间域变换操作包括以下几个方面:

图像差值(Interpolation)

图像缩放(Resizing)

图像旋转(Rotation)

图像剪切(Cropping)

一般变换操作(Affine,Projective,Box,Custom,etc)

(4)图像变换

在MATLAB图像处理工具箱中,提供了几种常用的图像变换函数,它们是傅里叶变换(Fourier Transform)、离散余弦变换(Discrete Cosine Transform)和Radon变换(Radon Transform)。

(5)图像增强

图像增强是一个相对的概念,增强效果的好坏,除与算法本身的优劣有一定的关系外,还与图像的数据特征有直接关系,因此增强方法只能有选择地使用。图像增强一般包括点处理、空间域滤波、频域滤波、彩色增强、代数运算等。

(6)图像分割

图像分割方法按其主要特征分为三组:第一组是有关图像或图像部分的全局知识(global knowledge),这种知识一般有图像特征的直方图来表达.第二组是基于边缘(edge-based)的分割,而第三组是基于区域(region-based)的分割

完整的数字图像处理过程可分为如下几个方面:

1、图像信息的获取;

2、图像信息的存储;

3、图像信息的传送;

4、图像信息处理;

5、图像信息的输出和显示。

图像信息处理就是我们平时所说的数字图像处理(Digital Image Processing),有时也称之为计算机图像处理(Computer Image Processing)。数字图像处理概括的说主要包括如下几项内容:

几何处理(Geometrical Processing);

算数处理(Arithmetic Processing);

图像增强(Image Enhancement);

图像复原(Image Restoration);

图像重建(Image Reconstruction);

图像编码(Image Encoding);

图像识别(Image Recognition);

图像理解(Image Understanding)。

1、几何处理

几何处理主要包括坐标变换,图像的放大、缩小、旋转、移动,多个图像配准,全景畸变校正,扭曲校正,周长、面积、体积校正等等。

2、算数处理

主要对图像进行+、-、*、/等运算,虽然该处理是主要针对像素点的处理,但非常有用。

3、图像增强

主要是突出图像中感兴趣的信息,从而是有用的信息得到加强,便于区分和解释。主要方法有直方图增强、伪彩色增强法、灰度窗口等技术。

4、图像复原

其主要目的是去除干扰和模糊,恢复图像的本来面目。去噪声和去模糊是图像复原处理的主要任务。图像噪声包括随机噪声和相干噪声。图像模糊来自镜头散焦、相对运动、大气湍流、云层遮挡等。

5、图像重建

几何处理、图像增强、图像复原都是从图像到图像的处理,即输入的原始数据是图像,处理后的结果也是图像,而重建处理则是从数据到图像的处理,该处理的典型应用是CT技术,由于它和本文的关系不大,这里不再赘述。

6、图像编码

图像编码研究属于信息论中信源编码范畴,其主要目的是研究数据压缩技术,以解决数据量大的矛盾。这里亦不细述。

7、图像识别

图像识别是有关数字图像的又一研究领域。图像识别应用模式识别的方法,大致有四种:统计模式识别法;句法结构模式识别法;模糊模式识别法;智能模式识别法。

8、图像理解

图像理解是由模式识别发展起来的方法,该处理输入的是图像,输出是一种描述。图像理解有时也叫景物理解。在这一领域还有相当多的问题需要进行深入研究。

9、图像形态学处理

图像形态学处理是数学形态学的延伸,是一门独立的研究学科。利用图像形态学处理技术,可以实现图像的腐蚀、细化和分割等效果。

3.2 图像预处理算法

03第三讲 吸声处理

噪声治理课程第三讲吸声处理 一、吸声 1.1 吸声系数与降噪系数 吸声是声波撞击到材料表面后能量损失的现象,吸声可以降低室内声压级。描述吸声的指标是吸声系数α,代表被材料吸收的声能与入射声能的比值。理论上,如果某种材料完全反射声音,那么它的α=0;如果某种材料将入射声能全部吸收,那么它的α=1。事实上,所有材料的α介于0和1之间,也就是不可能全部反射,也不可能全部吸收。 不同频率上会有不同的吸声系数。人们使用吸声系数频率特性曲线描述材料在不同频率上的吸声性能。按照ISO标准和国家标准,吸声测试报告中吸声系数的频率范围是100-5KHz。将100-5KHz的吸声系数取平均得到的数值是平均吸声系数,平均吸声系数反映了材料总体的吸声性能。在工程中常使用降噪系数NRC粗略地评价在语言频率范围内的吸声性能,这一数值是材料在250、500、1K、2K四个频率的吸声系数的算术平均值,四舍五入取整到0.05。一般认为NRC小于0.2的材料是反射材料,NRC大于等0.2的材料才被认为是吸声材料。当需要吸收大量声能降低室内混响及噪声时,常常需要使用高吸声系数的材料。如离心玻璃棉、岩棉等属于高NRC吸声材料,5cm厚的24kg/m3的离心玻璃棉的NRC可达到0.95。 测量材料吸声系数的方法有两种,一种是混响室法,一种是驻波管法。混响室法测量声音无规入射时的吸声系数,即声音由四面八方射入材料时能量损失的比例,而驻波管法测量声音正入射时的吸声系数,声音入射角度仅为90度。两种方法测量的吸声系数是不同的,工程上最常使用的是混响室法测量的吸声系数,因为建筑实际应用中声音入射都是无规的。在某些测量报告中会出现吸声系数大于1的情况,这是由于测量的实验室条件等造成的,理论上任何材料吸收的声能不可能大于入射声能,吸声系数永远小于1。任何大于1的测量吸声系数值在实际声学工程计算中都不能按大于1使用,最多按1进行计算。 在房间中,声音会很快充满各个角落,因此,将吸声材料放置在房间任何表面都有吸声效果。吸声材料吸声系数越大,吸声面积越多,吸声效果越明显。可以利用吸声天花、吸声墙板、空间吸声体等进行吸声降噪。 1.2吸声原理 纤维多孔吸声材料,如离心玻璃棉、岩棉、矿棉、植物纤维喷涂等,吸声机理是材料内部有大量微小的连通的孔隙,声波沿着这些孔隙可以深入材料内部,与材料发生摩擦作用将声能转化为热能。多孔吸声材料的吸声特性是随着频率的增高吸声系数逐渐增大,这意味着低频吸收没有高频吸收好。多孔材料吸声的必要条件是:材料有大量空隙,空隙之间互相连通,孔隙深入材料内部。错误认识之一是认为表面粗糙的材料具有吸声性能,其实不然,例如拉毛水泥、表面凸凹的石才基本不具有吸声能力。错误认识之二是认为材料内部具有大量孔洞的材料,如聚苯、聚乙烯、闭孔聚氨脂等,具有良好的吸声性能,事实上,这些材料由于内部孔洞没有连通性,声波不能深入材料内部振动摩擦,因此吸声系数很小。 与墙面或天花存在空气层的穿孔板,即使材料本身吸声性能很差,这种结构也具有吸声性能,如穿孔的石膏板、木板、金属板、甚至是狭缝吸声砖等。这类吸声被称为亥姆霍兹共振吸声,吸声原理类似于暖水瓶的声共振,材料外部空间与内部腔体通过窄的瓶颈连接,声波入射时,在共振频率上,颈部的空气和内部空间之间产生剧烈的共振作用损耗了声能。亥姆霍兹共振吸收的特点是只有在共振频率上具有较大的吸声系数。 薄膜或薄板与墙体或顶棚存在空腔时也能吸声,如木板、金属板做成的天花板或墙板等,这种结构的吸声机理是薄板共振吸声。在共振频率上,由于薄板剧烈振动而大量吸收声能。薄板共振吸收大多在低频具有较好的吸声性能。 二、吸声材料及吸声结构

影像预处理

遥感影像预处理 预处理是遥感应用的第一步,也是非常重要的一步。目前的技术也非常成熟,大多数的商业化软件都具备这方面的功能。预处理的大致流程在各个行业中有点差异,而且注重点也各有不同。 本小节包括以下内容: ? ? ●数据预处理一般流程介绍 ? ? ●预处理常见名词解释 ? ? ●ENVI中的数据预处理 1、数据预处理一般流程 数据预处理的过程包括几何精校正、配准、图像镶嵌与裁剪、去云及阴影处理和光谱归一化几个环节,具体流程图如图所示。 图1数据预处理一般流程

各个行业应用会有所不同,比如在精细农业方面,在大气校正方面要求会高点,因为它需要反演;在测绘方面,对几何校正的精度要求会很高。 2、数据预处理的各个流程介绍 (一)几何精校正与影像配准 引起影像几何变形一般分为两大类:系统性和非系统性。系统性一般有传感器本身引起的,有规律可循和可预测性,可以用传感器模型来校正;非系统性几何变形是不规律的,它可以是传感器平台本身的高度、姿态等不稳定,也可以是地球曲率及空气折射的变化以及地形的变化等。 在做几何校正前,先要知道几个概念: 地理编码:把图像矫正到一种统一标准的坐标系。 地理参照:借助一组控制点,对一幅图像进行地理坐标的校正。 图像配准:同一区域里一幅图像(基准图像)对另一幅图像校准影像几何精校正,一般步骤如下, (1)GCP(地面控制点)的选取 这是几何校正中最重要的一步。可以从地形图(DRG)为参考进行控制选点,也可以野外GPS测量获得,或者从校正好的影像中获取。选取得控制点有以下特征:

1、GCP在图像上有明显的、清晰的点位标志,如道路交叉点、河流交叉点等; 2、地面控制点上的地物不随时间而变化。 GCP均匀分布在整幅影像内,且要有一定的数量保证,不同纠正模型对控制点个数的需求不相同。卫星提供的辅助数据可建立严密的物理模型,该模型只需9个控制点即可;对于有理多项式模型,一般每景要求不少于30个控制点,困难地区适当增加点位;几何多项式模型将根据地形情况确定,它要求控制点个数多于上述几种模型,通常每景要求在30-50个左右,尤其对于山区应适当增加控制点。 (2)建立几何校正模型 地面点确定之后,要在图像与图像或地图上分别读出各个控制点在图像上的像元坐标(x,y)及其参考图像或地图上的坐标(X,Y),这叫需要选择一个合理的坐标变换函数式(即数据校正模型),然后用公式计算每个地面控制点的均方根误差(RMS) 根据公式计算出每个控制点几何校正的精度,计算出累积的总体均方差误差,也叫残余误差,一般控制在一个像元之内,即RMS<1。 (3)图像重采样

数字图像处理技术试题答案

数字图像处理技术试题库 一、单项选择题:(本大题 小题, 2分/每小题,共 分) 1.自然界中的所有颜色都可以由()组成 A.红蓝绿 B.红黄绿 C.红黄蓝绿 D.红黄蓝紫白 2. 有一个长宽各为200个象素,颜色数为16色的彩色图,每一个象素都用R(红)、G(绿)、B(蓝)三个分量表示,则需要()字节来表示 A.100 B.200 C.300 D. 400 3.颜色数为16种的彩色图,R(红)、G(绿)、B(蓝)三个分量分别由1个字节表示,则调色板需要()字节来表示 A.48 B.60 C.30 D. 40 4.下面哪一个不属于bmp 文件的组成部分 A .位图文件信息头 B. 位图文件头 C.调色板 D. 数据库标示 5.位图中,最小分辨单元是 A.像素 B.图元 C.文件头 D.厘米 6.真彩色的颜色数为 A.888?? B. 161616?? C.128128128?? D.256256256?? 7.如果图像中出现了与相邻像素点值区别很大的一个点,即噪声,则可以通过以下方式去除 A.平滑 B.锐化 C. 坐标旋转 D. 坐标平移 8.下面哪一个选项不属于图像的几何变换() A.平移 B.旋转 C. 镜像 D. 锐化 9.设平移量为x x t t (,),则平移矩阵为() A .1 0 00 1 0 1x y t t ?????????? B. 1 0 00 -1 0 1x y t t ??-???????? C.1 0 00 1 0 - 1x y t t ????????-?? D.1 0 00 1 0 - -1x y t t ?????????? 10.设旋转角度为a ,则旋转变换矩阵为() A .cos() sin() 0sin() cos() 00 0 1a a a a -?????????? B .cos() sin() 0sin() cos() 00 0 1a a a a ?????????? C .sin() cos() 0 sin() cos() 0 0 0 1a a a a -?????????? D .cos() sin() 0sin() cos() 00 0 1a a a a -????-?????? 11.下面哪一个选项是锐化模板 A .-1 -1 -1-1 9 -1-1 -1 -1??????????g B .-1 -1 -1-1 -9 -1-1 -1 -1??????????g C .-1 -1 -1-1 8 -1-1 -1 -1??????????g D .-1 -1 -1-1 6 -1-1 -1 -1?????????? g 12.真彩色所能表示的颜色数目是 A .128128? B .256256256 ?? C .256 D .6059

图像处理课后习题

第一章绪论 1. 模拟图像处理与数字图像处理主要区别表现在哪些方面? (什么是图像?什么是数字图像?什么是灰度图像?模拟图像处理与数字图像处理主要区别表现在哪些方面?) 图像:是对客观对象的一种相似性的、生动性的描述或写真。 数字图像:一种空间坐标和灰度均不连续的、用离散数字(一般用整数)表示的图像。 灰度图像:在计算机领域中,灰度数字图像是每个像素只有一个采样颜色的图像。在数字图像领域之外,“黑白图像”也表示“灰度图像”,例如灰度的照片通常叫做 “黑白照片”。 模拟图像处理与数字图像处理主要区别:模拟图像处理是利用光学、照相方法对模拟图像的处理。(优点:速度快,一般为实时处理,理论上讲可达到光的速度, 并可同时并行处理。缺点:精度较差,灵活性差,很难有判断能力和非线性处理能力) 数字图像处理(称计算机图像处理,指将图像信号转换成数字格式并利用计算机对数据进行处理的过程)是利用计算机对数字图像进行系列操作,从而达到某种预期目的的技术.(优点:精度高,内容丰富,可进行复杂的非线性处理,灵活的变通能力,一只要改变软件就可以改变处理内容) 2. 图像处理学包括哪几个层次?各层次间有何区别和联系? 数字图像处理可分为三个层次:狭义图像处理、图像分析和图像理解。狭义图像处理是对输入图像进行某种变换得到输出图像,是一种图像到图像的过程。 图像分析主要是对图像中感兴趣的目标进行检测和测量,从而建立对图像目标的描述,图像分析是一个从图像到数值或符号的过程。 图像理解则是在图像分析的基础上,基于人工智能和认知理论研究图像中各目标的性质和它们之间的相互联系,对图像内容的含义加以理解以及对原来客观场景加以解译,从而指导和规划行动。 区别和联系:狭义图像处理是低层操作,它主要在图像像素级上进行处理,处理的数据量非常大;图像分析则进入了中层,经分割和特征提取,把原来以像素构成的图像转变成比较简洁的、非图像形式的描述;图像理解是高层操作,它是对描述中抽象出来的符号进行推理,其处理过程和方法与人类的思维推理有许多类似之处。 3. 图像处理与计算机图形学的区别与联系是什么? 数字图像处理,是指有计算机及其它有关的数字技术,对图像施加某种运算和处理,从而达到某种预期的目的,而计算机图形学是研究采用计算机生成,处理和显示图形的一门科学。 二者区别:研究对象不同,计算机图形学研究的研究对象是能在人的视觉系统中产生视觉印象的事物,包括自然景物,拍摄的图片,用数学方法描述的图形等,而数字图像处理研究对象是图像;研究内容不同,计算机图像学研究内容为图像生成,透视,消阴等,而数字图像处理研究内容为图像处理,图像分割,图像透析等;过程不同,计算机图像学是由数学公式生成仿真图形或图像,而数字图像处理是由原始图像处理出分析结果,计算机图形与图像处理是逆过程。 结合每个人的本专业学科、工作应用,谈谈数字图像处理的关系或在本专业学科中的应用。 检测技术与自动化装置是把自动化、电子、计算机、控制工程、信息处理、机械等多种

图像预处理代码

function img = My_read(path) M=0;var=0; I=double(imread(path)); [m,n,p]=size(I); for x=1:m for y=1:n M=M+I(x,y); end end M1=M/(m*n); for x=1:m for y=1:n var=var+(I(x,y)-M1).^2; end end var1=var/(m*n); for x=1:m for y=1:n if I(x,y)>=M1 I(x,y)=150+sqrt(2000*(I(x,y)-M1)/var1); else I(x,y)=150-sqrt(2000*(M1-I(x,y))/var1); end end end figure, imshow(I(:,:,3)./max(max(I(:,:,3)))); title(‘归一化’) M =3; %3*3 H = m/M; L= n/M; aveg1=zeros(H,L); var1=zeros(H,L); for x=1:H; for y=1:L; aveg=0;var=0; for i=1:M; for j=1:M; aveg=I(i+(x-1)*M,j+(y-1)*M)+aveg; end end aveg1(x,y)=aveg/(M*M); for i=1:M; for j=1:M; var=(I(i+(x-1)*M,j+(y-1)*M)-aveg1(x,y)).^2+var;

end end var1(x,y)=var/(M*M); end end Gmean=0; Vmean=0; for x=1:H for y=1:L Gmean=Gmean+aveg1(x,y); Vmean=Vmean+var1(x,y); end end Gmean1=Gmean/(H*L); %所有块的平均值Vmean1=Vmean/(H*L); %所有块的方差gtemp=0; gtotle=0; vtotle=0; vtemp=0; for x=1:H for y=1:L if Gmean1>aveg1(x,y) gtemp=gtemp+1; gtotle=gtotle+aveg1(x,y); end if Vmean1

对于车牌识别图像预处理技术的研究

对车牌识别图像预处理技术的探究 摘要:随着当今汽车数量日益增加,城市交通状况也相应的受到人们的重视,如何进行有效的交通管理更是成为了人们关注的焦点。针对此问题,人们运用新的科学技术,相继研制开发出了各种交通道路监视、管理系统。这些系统通过车辆检测装置对过往的车辆实施检测,提取有关交通数据,达到监控、管理和指挥交通的目的。MATLAB是一种高效的工程计算语言,它是一个比较完整的数据库系统,在数据处理、图像处理、神经网络、小波分析等方面都有广泛的应用。本文详细阐述了运用MATLAB对车牌进行图像增强、边缘检测、二值图像化、形态学滤波等处理过程,为后面研究其定位、分割、识别做好充分的准备。 关键词:车牌图像增强中值滤波二值化形态学滤波 MATLAB 引言:通常情况下,由于外界光线、气候或其他自然、设备本身、人为因素等干扰而导致所拍摄的车牌图片成像不完美,使得对比度太小、曝光量太大、不清晰、倾斜等情况产生,这些情况都会极大的影响后期车牌号码字符的分割、识别操作,甚至导致无法进行字符分割和识别操作。因而,在做字符分割和识别操作之前,对图像做一系列的预处理很有必要。这些预处理操作包括图像增强处理(中值滤波、均值滤波、直方图均衡化)、边缘检测、二值化、形态学滤波处理。 1图像的增强处理 1.1中值滤波 中值滤波是一种非线性滤波,由于它在实际运算过程中并不需要图像的统计特性,所以比较方便。中值滤波首先是被应用在一维信号处理技术中,后来被二维图像信号处理技术所应用。在一定的条件下,可以克服线性滤波器所带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为有效。但是对一些细节多,特别是点、线、尖顶细节多的图像不宜采用中值滤波的方法。 中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替。

基于图像预处理的二维码识别技术的研究概要

基于图像预处理的二维码识别技术的研究 摘要:随着计算机科学技术的发展,自动识别技术得到了广泛的应用。在众多自动识别的技术中,条码技术已经成为当今主要的计算机自动识别技术之一。为解决条码信息容量有限的问题,九十年代以来出现一种新的条码——二维码。 二维码是指在平面二维方向上,使用某种特定的几何图形按一定规律分布的黑白相间的,用以记录信息的符号。在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理:它具有条码技术的一些共性:每种码制有其特定的字符集;每个字符占有一定的宽度;具有一定的校验功能等。同时还具有对不同行的信息自动识别功能、及处理图形旋转变化等特点。 二维码主要分为两大类:一是堆叠式是二维码,其主要代表是pdf417;二是矩阵式二维码,主要包括QR码和Data Matrix码。在现代商业活动中,二维码以其低成本、快速识读、含有大量信息而广泛应用于各个行业,如:产品防伪/溯源、广告推送、网站链接、数据下载、商品交易、定位/导航、电子凭证、车辆管理、信息传递、名片交流、wifi共享等,人们通过手机二维码的扫描软件就可以轻松获得二维码中所储藏的信息。 对QR码进行识别需要使用采集设备采集的图像,但图像的采集过程中由于受到各种因素(如光照不均匀、拍摄角度、二维码有褶皱等)的影响,可能导致二维码图像背景有各种噪声,收到的图像可能存在几何畸变或者图像有阴影,从而导致识读设备很难识读,给解码带来相当大的困难。因此,如何对收集到的图像进行适当的去噪和校正已成为二维码识别的关键问题[1]。 本文主要针对异常QR码以及Data Matrix码的识别进行描述,先表明二维码识别要解决的问题、任务和框架,并对现有方法进行阐述,最后讨论二维码识别技术仍需解决的问题,并展望看其未来研究方向。 1.二维码识别的概念框架 随着二维码的广泛使用,二维码被广泛认知,当人们遇到二维码扫描失败的时候,对其产生的影响也是巨大的,人们会怀疑是不是产品是假的,或者是有诈骗信息,但其主要问题可能是: 1)二维码的扫描不够精确; 2)不是真的二维码图形;

图像处理基本方法

图像处理的基本步骤 针对不同的目的,图像处理的方法不经相同。大体包括图像预处理和图像识别两大模块。 一、图像预处理: 结合识别复杂环境下的成熟黄瓜进行阐述,具体步骤如下: · 图像预处理阶段的流程图 对以上的图像流程进行详细的补充说明: 图像预处理的概念: 将每一个文字图像分检出来交给识别模块识别,这一过程称为图像预处理。 图像装换和图像分割以及区域形态学处理都是属于图像处理的基本内容之一。 图像转换:方法:对原图像进行灰度化处理生成灰度矩阵——降低运算速度(有具体的公式和方程),中值滤波去噪声——去除色彩和光照的影响等等。 图像分割:传统方法:基于阈值分割、基于梯度分割、基于边缘检测分割和基于区域图像割等方法。脉冲耦合神经网络 (PCNN)是针对复杂环境下 图像采集 图像采集中注意采集的方法、工具进行介绍。目的是怎样获取有代表性的样本。(包括天气、相机的位置等) 对采集的图像进行特征分析 目标的颜色和周围环境的颜色是否存在干涉的问题、平整度影响相机的拍摄效果、形状 图像转换 图像分割 区域形态学处理

的有效分割方法,分割的时候如果将一个数字图像输入PCNN,则能基于空间邻近性和亮度相似性将图像像素分组,在基于窗口的图像处理应用中具有很好的性能。 区域形态学处理:对PCNN分割结果后还存在噪声的情况下,对剩余的噪声进行分析,归类属于哪一种噪声。是孤立噪声还是黏连噪声。采用区域面积统计法可以消除孤立噪声。对于黏连噪声,可以采用先腐蚀切断黏连部分,再膨胀复原目标对象,在进行面积阙值去噪,通过前景空洞填充目标,最后通过形态学运算,二值图像形成众多独立的区域,进行各连通区域标识,利于区域几何特征的提取。 二、图像识别: 针对预处理图像提取 目标特征 建立LS SVM分类器 得到结果 图像识别流程图 提取目标特征:目标特征就是的研究对象的典型特点,可以包括几何特征和纹理特征。 对于几何特征采用的方法:采用LS-SVM支持向量机对几何特征参数进行处理,通过分析各个参数的分布区间来将目标和周围背景区分开,找出其中具有能区分功能的决定性的几何特征参数。 纹理特征方法:纹理特征中的几个参数可以作为最小二乘支持向量机的辅助特征参数,提高模型的精准度。 最小二乘支持向量机介绍:首先选择非线性映射将样本从原空间映射到特征空间,以解决原空间中线性不可分问题,在此高维空间中把最优决策问题转化为等式约束条件,构造最优决策函数,并引入拉格朗日乘子求解最优化问题,对各个变量求偏微分。 LS SVM分类器:对于p种特征选择q个图像连通区域,作为训练样本。依

图像预处理方法

预处理就是在图像分析中,对输入图像进行特征抽取等前所进行的处理。输入图像由于图像采集环境的不同,如光照明暗程度以及设备性能的优劣等,往往存在有噪声,对比度不够等缺点。另外,距离远近,焦距大小等又使得人脸在整幅图像中间的大小和位置不确定。为了保证人脸图像中人脸大小,位置以及人脸图像质量的一致性,必须对图像进行预处理。图像预处理的主要目的是消除图像中无关的信息,滤除干扰、噪声,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取的可靠性. 人脸图像的预处理主要包括人脸扶正,人脸图像的增强,以及归一化等工作。人脸扶正是为了得到人脸位置端正的人脸图像;图像增强是为了改善人脸图像的质量,不仅在视觉上更加清晰图像,而且使图像更利于计算机的处理与识别。归一化工作的目标是取得尺寸一致,灰度取值范围相同的标准化人脸图像[4]。 几何规范化 由于图像在提取过程中易受到光照、表情、姿态等扰动的影响,因此在识别之前需要对图像做归一化的预处理[4],通常以眼睛坐标为基准点,通过平移、旋转、缩放等几何仿射变换对人脸图像进行归一化。因为人脸虽然是柔性的三维曲面,同一人脸因表情变化会有差异,但相对而言人的两眼之间的距离变化不会很大,因此双眼的位置及眼距,就成为人脸图像归一化的依据。 定位眼睛到预定坐标,将图像缩放至固定大小。通过平移、旋转、缩放等几何仿射变换,可以对人脸图像做几何规范化处理,仿射变换的表达式为: ]100][1,,[]1,,[3231 22 211211 a a a a a a v u y x = (2-1) 其中(u,v)表示输入图像中像素的坐标(x,y)表示输出图像中像素的坐标。将上式展开可得 322212312111u a x a v a u a y a v a ++=++= (2-2)

进行识别前图像预处理

进行识别前图像预处理 //BP神经网络字符识别函数定义 #include "dibapi.h" #include <iostream> #include <deque> #include <math.h> using namespace std; typedef deque<CRect> CRectLink; typedef deque<HDIB> HDIBLink; //声明一些必要的全局变量 int w_sample=8; int h_sample=16; bool fileloaded; bool gyhinfoinput; bool gyhfinished; int digicount; int m_lianXuShu; CRectLink m_charRectCopy; CRectLink m_charRect; HDIBLink m_dibRect; HDIBLink m_dibRectCopy;

HDIB m_hDIB; CString strPathName; CString strPathNameSave; /********************************function declaration*************************************/ //清楚屏幕 void ClearAll(CDC* pDC); //在屏幕上显示位图 void DisplayDIB(CDC* pDC,HDIB hDIB); //对分割后的位图进行尺寸标准归一化 void StdDIBbyRect(HDIB hDIB, int tarWidth, int tarHeight); //整体斜率调整 void SlopeAdjust(HDIB hDIB); //去除离散噪声点 void RemoveScatterNoise(HDIB hDIB); //梯度锐化 void GradientSharp(HDIB hDIB); //画框 void DrawFrame(CDC* pDC,HDIB hDIB, CRectLink charRect,unsigned int linewidth,COLORREF color); //将灰度图二值化 void ConvertGrayToWhiteBlack(HDIB hDIB);

基于matlab的图像预处理技术研究文献综述

毕业设计文献综述 题目:基于matlab的图像预处理技术研究 专业:电子信息工程 1前言部分 众所周知,MATLAB在数值计算、数据处理、自动控制、图像、信号处理、神经网络、优化计算、模糊逻辑、小波分析等众多领域有着广泛的用途,特别是MATLAB的图像处理和分析工具箱支持索引图像、RGB 图像、灰度图像、二进制图像,并能操作*.bmp、*.jpg、*.tif等多种图像格式文件如。果能灵活地运用MATLAB提供的图像处理分析函数及工具箱,会大大简化具体的编程工作,充分体现在图像处理和分析中的优越性。 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。 图像处理它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在 1964 年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动

图像预处理流程

图像预处理流程: 图2.2图像预处理流程图 2.2系统功能的实现方法 系统功能的实现主要依靠图像处理技术,按照上面的流程一一实现,每一部分的具体步骤如下: 1原始图像:由数码相机或其它扫描装置拍摄到的图像; 2预处理:对采集到的图像进行灰度化、图像增强,滤波、二值化等处理以克服图像干扰; 3字轮定位:用图像剪切的方法获取仪表字轮; 4字符分割:利用字符轮廓凹凸检测定位分割方法得到单个的字符; 5字符识别:利用模板匹配的方法与数据库中的字符进行匹配从而确认出字符,得到最后的仪表示数。

2.3.1 MATLA B简介 MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。 MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB 爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。 2.3.2 MATLAB的优势和特点 1、MATLAB的优势 (1)友好的工作平台和编程环境 MATLAB由一系列工具组成。这些工具方便用户使用MATLAB的函数和文件,其中许多工具采用的是图形用户界面。包括MATLAB桌面和命令窗口、历史命令窗口、编辑器和调试器、路径搜索和用于用户浏览帮助、工作空间、文件的浏览器。随着MATLAB的商业化以及软件本身的不断升级,MATLAB的用户界面也越来越精致,更加接近Windows的标准界面,人机交互性更强,操作更简单。而且新版本的MATLAB提供了完整的联机查询、帮助系统,极大的方便了用户的使用。简单的编程环境提供了比较完备的调试系统,程序不必经过编译就可以直接运行,而且能够及时地报告出现的错误及进行出错原因分析。

基于opencv对图像的预处理

基于opencv 对图像的预处理 1.问题描述 本次设计是基于opencv 结合c++语言实现的对图像的预处理,opencv 是用于开发实时的图像处理、计算机视觉及模式识别程序;其中图像的预处理也就是利用opencv 对图像进行简单的编辑操作;例如对图像的对比度、亮度、饱和度进行调节,同时还可以对图像进行缩放和旋转,这些都是图像预处理简单的处理方法;首先通过opencv 加载一幅原型图像,显示出来;设置五个滑动控制按钮,当拖动按钮时,对比度、亮度、饱和度的大小也会随之改变,也可以通过同样的方式调节缩放的比例和旋转的角度,来控制图像,对图像进行处理,显示出符合调节要求的图像,进行对比观察他们的之间的变化。 2.模块划分 此次设计的模块分为五个模块,滑动控制模块、对比度和亮度调节模块、饱和度调节模块、缩放调节模块、旋转调节模块,他们之间的关系如下所示: 图一、各个模块关系图 调用 调用 调用 调用 滑动控制模块 对比度和亮度调节模块 饱和度调节模块 缩放调节模块 旋转调节模块

滑动控制模块处于主函数之中,是整个设计的核心部分,通过createTrackbar创建五个滑动控制按钮并且调用每个模块实现对图像相应的调节。 3.算法设计 (1)滑动控制: 滑动控制是整个设计的核心部分,通过创建滑动控制按钮调节大小来改变相应的数据,进行调用函数实现对图像的编辑,滑动控制是利用createTrackbar(),函数中包括了滑动控制的名称,滑动控制显示在什么窗口上,滑动变量的地址和它调节的最大围,以及每个控制按钮应该调用什么函数实现什么功能; (2)对比度和亮度的调节: 对比度和亮度的调节的原理是依照线性理论,它的公式如下所示:g(x)=a* f(x) +b,其中f(x)表示源图像的像素,g(x)表示输出图像的像素,参数a(需要满足a>0)被称为增益(gain),常常被用来控制图像的对比度,参数b通常被称为偏置(bias),常常被用来控制图像的亮度; (3)饱和度的调节: 饱和度调节利用cvCvtColor( src_image, dst_image, CV_BGR2HSV )将RGB 颜色空间转换为HSV颜色空间,其中“H=Hue”表示色调,“S=Saturation”表示饱和度,“V=Value ”表示纯度;所以饱和度的调节只需要调节S的大小,H 和V的值不需要做任何的改变; (4)旋转的调节: 旋转是以某参考点为圆心,将图像的个点(x,y)围绕圆心转动一个逆时针角度θ,变为新的坐标(x1,y1),x1=rcos(α+θ),y1=rsin(α+θ),其中r是图像的极径,α是图像与水平的坐标的角度的大小; (5)缩放的调节: 首先得到源图像的宽度x和高度y,变换后新的图像的宽度和高度分别为x1和y1,x1=x*f,y1=y*f,其中f是缩放因子; 4.函数功能描述 (1)主函数main()用来设置滑动控制按钮,当鼠标拖动按钮可以得到相应的数据大小,实现手动控制的功能,当鼠标拖动对比度和亮度调节是,主函数调用

图像复原处理技术

实验五图像复原处理技术 实验目的 1 了解图像降质退化的原因,并建立降质模型。 2 理解反向滤波图像复原的原理 3 理解维纳滤波图像复原的原理实验原理图像复原处理一定是建立在图像退化的数学模型基础上的,这个退化数学模型应该能够 反映图像退化的原因。图像降质过程的模型如图5-1所示,其表达式为 g(x,y)=h (x,y)*f (x,y) +n (xy) (5.1) 图5-1图像降质模型 1、 滤波图像复原 逆滤波法是最简单的图像恢复方法。对5.1式两边作二维傅立叶变换,得到 G (u , v ) =H (u ,v) F (u ,v) + N (u ,v) H (u ,v) 为成像系统的转移函数。估算得到的恢复图像的傅立叶变换F ? (u ,v) 为 ()()()()()() ,,?,,,,G u v N u v F u v F u v H u v H u v ==+ (5.2) 若知道转移函数H (),u v ,5.2式经反变换即可得到恢复图像,其退化和恢复的全过程用图5-2表示。 图5-2频域图像降质及恢复过程

逆滤波恢复法会出现病态性,若H (),u v ,而噪声N(u,v) ≠0,则()(),,N u v H u v 比F (x,y)大很多,使恢复出来()?,f x y 与(),f x y 相差很大,甚至面目全非。一种改进的方法是在H (u , v ) =0 的频谱点及其附近,人为仔细设置()1,H u v -的值,使得在这些频 谱点附近,()(),,N u v H u v 不会对()?,F u v 产生太大影响。二种方法是考虑到降质系统的转移函数(),H u v 的带宽比噪声要窄的多,其频率特性也具有低通性质,因此可令逆滤波的转移函数()1,H u v 为 ()()()()1 222 11 2220 1,,0H u v u v D H u v u v D ?+≤?=??+>? (2)维纳滤波复原 逆滤波简单,但可能带来噪声的放大,而维纳滤波对逆滤波的噪声放大有抑制作用。 维纳滤波是寻找一个滤波器,使得复原后图像()?,f x y 与原始图像(),f x y 的方差最小,即 ()(){ }2 ?min ,,E f x y f x y ??=-?? 如果图像(),f x y 和噪声(),n x y 不相关,且(),h x y 有零均值,则可导出维纳滤波器的传递函数为 ()() () () () 2 2 ,1 ,,,,,w n f H u v H u v P u v H u v H u v P u v = ? + 式中(),n P u v 和(),f P u v 分别为噪声和原始图像的功率谱。实际上(),n P u v 和(),f P u v n 往往是未知的,这时常用常数K 来近似 () () ,,n f P u v P u v 。 【实验】产生一模糊图像,采用维纳滤波图像复原的方法对图像进行处理。 clear; %清除变量 d=15 %设定长度

图像预处理流程

图像预处理流程: 系统功能的实现方法 系统功能的实现主要依靠图像处理技术,按照上面的流程一一实现,每一部分的具体步骤如下: 1原始图像:由数码相机或其它扫描装置拍摄到的图像; 2预处理:对采集到的图像进行灰度化、图像增强,滤波、二值化等处理以克服图像干扰; 3字轮定位:用图像剪切的方法获取仪表字轮; 4字符分割:利用字符轮廓凹凸检测定位分割方法得到单个的字符; 5字符识别:利用模板匹配的方法与数据库中的字符进行匹配从而确认出字符,得到最后的仪表示数。 2.3.1 MATLA B简介 MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB 和Simulink两大部分。 MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以

直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。 2.3.2 MATLAB的优势和特点 1、MATLAB的优势 (1)友好的工作平台和编程环境 MATLAB由一系列工具组成。这些工具方便用户使用MATLAB的函数和文件,其中许多工具采用的是图形用户界面。包括MATLAB桌面和命令窗口、历史命令窗口、编辑器和调试器、路径搜索和用于用户浏览帮助、工作空间、文件的浏览器。随着MATLAB的商业化以及软件本身的不断升级,MATLAB的用户界面也越来越精致,更加接近Windows的标准界面,人机交互性更强,操作更简单。而且新版本的MATLAB提供了完整的联机查询、帮助系统,极大的方便了用户的使用。简单的编程环境提供了比较完备的调试系统,程序不必经过编译就可以直接运行,而且能够及时地报告出现的错误及进行出错原因分析。 (2)简单易用的程序语言 MATLAB是一种高级的矩阵/阵列语言,它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。用户可以在命令窗口中将输入语句与执行命令同步,也可以先编写好一个较大的复杂的应用程序(M文件)后再一起运行。新版本的MATLAB语言是基于最为流行的C++语言基础上的,因此语法特征与C++语言极为相似,而且更加简单,更加符合科技人员对数学表达式的书写格式。使之更利于非计算机专业的科技人员使用。而且这种语言可移植性好、可拓展性极强,这也是MATLAB能够深入到科学研究及工程计算各个领域的重要原因。 (3)强大的科学计算机数据处理能力 MATLAB是一个包含大量计算算法的集合。其拥有600多个工程中要用到的数学运算函数,可以方便的实现用户所需的各种计算功能。函数中所使用的算法都是科研和工程计算中的最新研究成果,而前经过了各种优化和容错处理。在通常情况下,可以用它来代替底层编程语言,如C和C++ 。在计算要求相同的情况下,使用MATLAB的编程工作量会大大减少。MATLAB的这些函数集包括从最简单最基本的函数到诸如矩阵,特征向量、快速傅立叶变换的复杂函数。函数所能解决的问题其大致包括矩阵运算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、

图像预处理的一般方法

图像预处理的一般方法 (一)空域图像增强技术 1.灰度线性变换 addpath('C:\'); I = imread('C:\lzs.jpeg'); imshow(I); I = double(I); [M,N] = size(I); for i = 1:M for j = 1:N if I(i,j)<=30 I(i,j)=I(i,j); else if I(i,j)<=150 I(i,j)=(210-30)/(160-30)*(I(i,j)-30)+30; else I(i,j)=(256-210)/(256-160)*(I(i,j)-160)+210; end end end end figure(2); imshow(uint8(I)); 2.直方图均衡化 addpath('C:\'); I=imread('C:\lzs.jpeg'); figure subplot(221); imshow(I);

subplot(222); imhist(I); I1=histeq(I); figure; subplot(221); imshow(I1); subplot(222); imhist(I1) 3.均值滤波 function test1 I = imread('C:\lzs.jpeg'); [M,N]=size(I); II1=zeros(M,N); for i=1:16; II(:,:,i)=imnoise(I,'gaussian',0,0.01); II1=II1+double(II(:,:,i)); if or(or(i==1,i==4),or(i==8,i==16)); figure;imshow(uint8(II1/i)); end end 4.梯度锐化操作 addpath('C:\'); I = imread('C:\lzs.jpeg'); subplot(131); imshow(I); H=fspecial('Sobel'); H=H'; TH=filter2(H,I); subplot(132); imshow(TH,[]);

相关文档